y i=B0 + B1 x 1 i+ B2 x 2i + Bk x ki + i ;
k
y i=B0 + B j x ji + i ,
j=1
i=1,2 .12 ; k =4
y1 x 11 x 21 xk 1
y2 x 12 x 22 xk 2
y 12 x 112 x 212 x k 12
Bj
Para hallar los estimadores de mnimos cuadrados para , se deben minimizar los errores, por
tanto se despejan, se elevan al cuadrado y se suman. Esto significa que la funcin queda de la
siguiente manera:
y iB
4
2
( 0 j x ji )
j=1
12 12
2
S= i =
j =1 i=1
[] [ ] [] []
y1 1 x 11 x 21 x 41 0 1
y= y 2 X = 1 x 12 x 21 x 42 = 1 = 2
y12 1 x 1 12 x2 12 x 4 12 12 12
2
El estimador de mnimos cuadrados de
SS E = y ^ ' X ' y
H0
El rechazo de la Hiptesis Nula ( implica que por lo menos una de las variables
x1 x 2, , x 4
independientes o regresoras , contribuye significativamente a este
modelo. Si la hiptesis se acepta quiere decir que los coeficientes de estas variables son
igual a cero y ningn trmino o variable en el modelo tiene una contribucin significativa al
explicar la variables respuesta.
F0
e) D la expresin del estadstico de prueba , para la hiptesis anterior, as como
una explicacin racional de porqu funciona como estadstico de prueba, es decir, vea
cuando este estadstico tiene valores grandes o pequeos, y lo que significa en
trminos de calidad de ajuste.
S CR /k C MR
F0 = =
S C E /(nk1) C M E
C MR F0
Esto conlleva a que entre mayor sea tiende a ser grande el estadstico lo que
significa que las constantes del modelo son grandes y por ende hay una significancia de las
F0
variables. En otras palabras si tiene un valor grande, es mejor la capacidad de prediccin o
de calidad de ajuste, si es menor, se tiene una baja capacidad de predictibilidad.
f) Formule las hiptesis sobre los parmetros individuales del modelo y comente qu
significa
j
Las hiptesis para probar la significacin de los coeficientes de regresin individual , como su
mismo nombre lo indica, se calculan de manera independiente para cada uno de ellos. Estas
hiptesis corresponden a:
Ha: j 0
H 0 : j=0 xj
Si se rechaza, esto indica que la variable puede eliminarse del modelo porque
no es significante en l.
El valor de este estadstico es utilizado para contrastar la hiptesis de que el coeficiente es igual
significa que entre el valor de este estadstico sea ms grande, tiende a ser mayor que el valor
crtico obtenido en tablas de distribucin T-Student, entonces se encuentra en el rea de
aceptacin.
h) Cules son los riesgos de hacer predicciones fuera de la regin de los datos
originales?
Fuera de la regin, los aspectos fsicos o sociales que estn atrs de todo modelo de
regresin pueden empezar a actuar de otra forma, muy fuera de la regin de los datos
originales empiezan a actuar otros fenmenos no considerados en el modelo original.
Temperatur
PH Espesor
a
1.2 -8 9
1.8 -8 14
1.2 8 10
1.8 8 19
1.2 -8 8
1.8 -8 12
1.2 8 11
1.8 8 20
1.5 0 14
1.5 0 13
R/a. Las variables independientes son la temperatura y el PH de la solucin, debido a que son las
que ocasionan la variabilidad en el espesor del anodizado y por lo general estn controladas en el
proceso:
X1 X2
: PH : Temperatura Y: Espesor
Y 0 1 X 1 2 X 2
b) Ajuste un modelo del tipo y anote la ecuacin del modelo ajustado.
Y 0 1 X 1 2 X 2
R/a. Modelo:
9 1,2 - 8 1
14 1,8 - 8
2
10 1,2 8 3
0
19 1,8 8 4
8 1,2 - 8 1 5
2
12 1,8 - 8 6
11 1,2 8 11 7
22
20 1,8 8 8
14 1,5 0
9
13 1,5 0 10
0 3,875
1 11,25
2 0,265625
Y 3,875 11,25 X 1 0,265625 X 2
c) A partir del modelo ajustado, cul es el espesor estimado cuando se utiliza un PH=2 y una
temperatura de 10 grados?
X 1 2 y X 2 10
R/a. Cuando
Es decir, que cuando la solucin tiene un PH de 2 y una temperatura de 10 grados, el espesor del
anodizado ser de 21,28125.
R/a. Con el objeto de establecer si el modelo es adecuado, se procede a realizar las pruebas de
Hiptesis pertinentes.
H 0 1 2 0
; indicando que ninguna variable tiene una contribucin significativa al explicar la
variable de respuesta (Y).
H1 1 2
; indicando que por lo menos un trmino en este modelo contribuye de manera
significativa a explicar la variable de respuesta (Y).
Tomando los datos de la ANOVA generados del programa para el anlisis de varianza se tiene que:
CM E
R 2 aj 1 86,644%
CM Total
Por lo que como ambos coeficientes tienen valor superior a 0,7, se puede decir que el modelo tiene
un ajuste satisfactorio. Y teniendo en cuenta que el valor-P en la tabla ANOVA es menor que 0,05, se
dice que existe una relacin estadsticamente significativa entre las variables con un nivel de
confianza del 95,0%.
Y en ltima instancia, para determinar si el modelo es adecuado se analizan las siguientes grficas
de residuos:
Grfico Y (Observado) Vs Y(Predicho)
En la cual se puede observar que los datos calculados se encuentran muy prximos a los
observados.
Grfico de Residuos
Teniendo en cuenta la grfica anterior, se observa que de los 10 datos calculados 3 se alejan
considerablemente del valor observado, pero la mayora se encuentra dentro del margen de error
aceptado.
Por lo que tomando como base estas grficas, las pruebas de hiptesis y los coeficientes de
determinacin, se puede decir que el modelo ajustado es adecuado.
e) Cree que valdra la pena pensar en aadir otro trmino al modelo para mejorar el ajuste?
Argumente.
R 2 aj 86,644% R 2 89,6127%
R/a. Teniendo en cuenta que tiende a ser menor que , en el modelo hay
trminos que no contribuyen de manera significativa a este, y se piensa que podra ser la variable
TEMPERATURA, tomando como referencia la comparacin de los estadsticos de las dos variables
dependientes.
y x1 x2
X 1, X 2 , . , X k
Sea variables independientes o regresoras, y sea Y una variable de respuesta,
entonces el modelo de regresin lineal mltiple con k variables independientes es el polinomio de
primer orden:
Y = 0 + 1 X 1+ 2 X 2 + .+ k X k +
j
Donde los son los parmetros del modelo que se conocen como coeficientes de regresin y
es el error aleatorio, con media cero, E ( ) =0 y V ( )= 2 . Si en la ecuacin k =1
, se presenta un caso de regresin lineal simple y el modelo es una lnea recta; si k =2 , tal
ecuacin representa un plano.
Y = 0 + 1 X 1+ 2 X 2
Y =350,9941,27199 X 10,153904 X 2
Donde:
0 = 350,994
1 = - 1,27199
2 = - 0,1539
Anlisis de Varianza
240
210
observado
180
150
120
90
90 120 150 180 210 240
predicho
Grfico de Residuos
2
Rediduo Estudentizado
-1
-2
90 120 150 180 210 240
predicho Y
Puesto que el valor-P en la tabla ANOVA es mayor o igual que 0,05, no existe una relacin
estadsticamente significativa entre las variables con un nivel de confianza del 95,0%. Esto se puede
observar en el grfico Y, en donde se muestra que la mayora de los puntos se encuentran un poco
alejados de la lnea recta.
De acuerdo a las pruebas t, cada uno de los regresores del modelo no son necesarios, debido a que
el valor p para cada parmetro es mayor que 0,05, mostrando poca relacin estadsticamente
significativa entre las variables. De igual forma, en la tabla anterior se observa que el valor p para
X1
es el ms alto, comparado con el nivel de significancia de 0,05, por lo que se recomienda
eliminarlo la observacin del modelo, para que este encuentre ms ajustado.
Y = 0 + 1 X 1+ 2 X 2 + .+ k X k +
j
Donde los son los parmetros del modelo que se conocen como coeficientes de regresin y
es el error aleatorio, con media cero, E ( ) =0 y V ( )= 2 . Si en la ecuacin k =1
, se presenta un caso de regresin lineal simple y el modelo es una lnea recta; si k =2 , tal
ecuacin representa un plano.
Anlisis de Varianza
280
260
observado
240
220
200
200 220 240 260 280
predicho
Grfico de Residuos
2
Rediduo Estudentizado
-1
-2
-3
210 230 250 270 290
predicho Potencia al freno
Puesto que el valor-P en la tabla ANOVA es menor que 0,05, existe una relacin estadsticamente
significativa entre las variables con un nivel de confianza del 95,0%. Esto se puede observar en el
grfico Y, en donde se muestra que la mayora de los puntos se encuentran cercanos a la lnea
recta.
De acuerdo a las pruebas t, cada uno de los regresores del modelo son necesarios, debido a que el
valor p para cada parmetro es menor que 0,05, mostrando una relacin estadsticamente
significativa entre las variables. De igual forma, en la tabla anterior se observa que el valor p para
rpm es el ms alto, comparado con el nivel de significancia de 0,05, por lo que se recomienda