MULTIPLE
OBJETIVOS
1. Construir un modelo utilizando dos o ms
variables explicativas.
2. Probar una hiptesis para aceptar la validez de
un modelo de regresin mltiple
3. Realizar pruebas de hiptesis individuales para
descartar aquellas variables no significativas en
un modelo de regresin mltiple
4. Calcular e interpretar medidas de asociacin
mltiples.
CONTENIDO
1. El modelo de regresin mltiple
2. Deduccin de la ecuacin de regresin
mltiple.
3. La computadora y la regresin mltiple
4. Inferencias sobre parmetros de la poblacin.
5. Tcnicas de modelado
El modelo
La regresin mltiple y el anlisis de correlacin
mltiple consiste en estimar una variable
dependiente, utilizando dos o ms variables
independientes.
El modelo genrico ser
Y f (X1 , X2 , X3 ,....)
Variable
dependiente
Variables
independientes
Ejemplos
1. La dureza de las laminas de acero , depende
de la variacin del contenido de cobre(%) y de
la temperatura del recocido.
2. El ingreso en dlares de ejecutivos que
trabajan para la misma empresa dependen del
numero de aos que asistieron a una
universidad y la edad del ejecutivo, entre otros
factores.
3. La ganancia de corriente depende del tiempo
de difusin en horas y la resistencia de la hoja.
La ventaja
Permite utilizar ms informacin disponible para
estimar la variable dependiente de una manera
confiable.
Proceso
En el proceso de regresin y correlacin mltiple,
se debe:
1. Describir la ecuacin de regresin mltiple.
2. Examinar el error estndar de regresin
mltiple de la estimacin.
3. Utilizar la ecuacin de regresin para
determinar qu tan bien describe los datos
observados.
Alcance
1. Permite ajustar los datos tanto a curvas
como a rectas.
2. Se puede incluir variables cualitativas,
haciendo uso de las variables ficticias.
b
X
b
X
1
0
1
1
1 b 2 X1X 2
2
X
Y
b
X
b
X
X
b
X
2
0
2
1
1
2
2
2
Donde bo, b1 y b2 son los coeficientes de
regresin estimados.
Aplicacin
En el siguiente caso, interesa construir un
modelo para determinar los niveles de
colesterol, conociendo el peso (en Kg), el
dimetro de la cintura (en cms) y el nivel de
hemoglobina (en grs.)
(
Y
Y
)
S yx
n k 1
donde:
El coeficiente de determinacin
mltiple (r2)
Mide la tasa porcentual de los cambios de Y
que pueden ser explicados por X1, X2 y X3
simultneamente.
SCregresin
r
SCtotal
2
19950,57
r
0,95
20837,5
2
n 1
r 1 1 r
n k 1
2
a
8 1
r 1 1 0,95
0,9125
8 3 1
2
a
Coeficiente de correlacin: r
r r2
Para el caso de colesterol,
tenemos:
r 0,95 0,9746
De acuerdo al valor de r podemos afirmar
que las variables peso, permetro
abdominal y hemoglobina se encuentran
asociadas en forma directa, de una manera
muy fuerte.
1.Formulacin de hiptesis
Hp : 1 = 2 = 3 = 0
Ha : 1 2 3 0
Si se acepta la hiptesis planteada, significa que
ninguno de los factores (X1,X2 y X3) son relevantes
para explicar los cambios en Y.
2. Determinacin del nivel de significacin
= 0,10
CMeregresin
CMeresiduos
y4
/2=0,01
(1 -
0,95
F
6,59
5. Clculos
Fc
6650,19
29,99
221,73
SC
CMe
F
calculado
p-valor
Regresin
19950.57
6650.19
29.99
0.003
Residuos
886.926
221.73
Total
20837.5
6. Conclusiones
A. Se rechaza la hiptesis planteada, se acepta la
alternante a un nivel de significacin de 0,10.
La prueba result ser significativa.
B. Hay evidencia muestral suficiente para
rechazar la hiptesis planteada
C. Probablemente al menos uno de los factores
seleccionados (peso, dimetro de la cintura y
hemoglobina) explican el nivel de colesterol
en un paciente.
1) Planteo de hiptesis
Hp : 1 = 0
Ha : 1 0
2) Nivel de significacin
= 0,10
individual:
3) Prueba estadstica
donde
b1 B1
tc
S b1
4) Criterios de decisin
t con Gl = n - k - 1
=8-3-1=4
= 0,10
5) Clculos
tc
b1 B10
Sb1
Sb1
S yx
2
X
nx
0,704
Resultados en Excel
Coeficientes
Error tpico
Estadstico t
Probabilidad
Inferior 95%
Superior
95%
Inferior
95.0%
Superior
95.0%
121.704
83.00
1.466
0.216
-108.752
352.161
-108.752
352.161
PESO
2.949
0.70
4.189
0.014
0.995
4.904
0.995
4.904
CINTURA
0.276
0.49
0.558
0.607
-1.095
1.646
-1.095
1.646
HEMOGLO
BINA
-7.843
5.73
-1.37
0.24
-23.74
8.06
-23.74
8.06
Intercepcin
Reemplazando en la ecuacin:
2,949 0
tc
0,704
t c 4,189
6) Conclusiones
A. Se rechaza la hiptesis planteada. Se acepta
la hiptesis nula.
3. Criterio de decisin:
4. Prueba estadstica
tc
r n2
1 r
5. Clculos
tc
0,9746 8 2
1 0,9746
10,66
6. Conclusiones
A) Se rechaza la hiptesis nula, se acepta la
hiptesis
alternante
a
un
nivel
de
significacin de 0,10. La prueba fue
significativa.
B) La evidencia emprica permite afirmar que
existe una alta correlacin entre los factores
peso, permetro abdominal y hemoglobina.