Anda di halaman 1dari 23

Regresin lineal mltiple.

Validacin y prediccin
Juan R Gonzlez
2002

El problema de la colinealidad
De nuevo aparece (XX) en este problema, si hay
colinealidad no se puede invertir (matriz singular)
Problema de colinealidad: X1=a+bX2
Poco usual en la prctica pero si que aparece la
casi-colinealidad (e.d. b casi 1)
En este caso (XX) es casi singular y las
estimaciones son poco estables (puede darse
grandes cambios en las estimaciones

El problema de la colinealidad
Deteccin 1: Factor de inflacin de la varianza
(FIV) y la tolerancia (T)

1
FIV =
1 R 2j

1
2
= 1 Rj
T =
FIV

Regla emprica (Kleinbaum): Existen problemas de


colinealidad si algun FIV es >10, e.d Ri2=0,9 y Ti<0,1

El problema de la colinealidad
Deteccin 2: Realizar un anlisis de componentes
principales y establecer el ndice de condicin (a
partir de los valores propios)

Mx VAP de
Min VAP de

matriz de correlaciones

Regla emprica (Belsley): Indices de condicin entre


5 y 10 colinealidad dbil. Entre 30 y 100 colinealidad
moderada o fuerte.

El problema de la colinealidad

Con SPSS:
Opcin Regresin lineal,
Estadsticos

El problema de la colinealidad

Diagnsticos de colinealidada

Modelo
1

Dimensin
1
2
3
4

Autovalor
3,985
8,389E-03
5,505E-03
1,540E-03

Indice de
condicin
1,000
21,794
26,903
50,874

a. Variable dependiente: Peso en Kg.

(Constante)
,00
,00
,03
,96

Proporciones de la varianza
Presin
diastlica
Altura (cm)
inicial
,00
,00
,00
,35
,29
,51
,71
,14

Presin
sistlica
inicial
,00
,71
,22
,06

El problema de la colinealidad
Ejercicio: Con los datos de colesterol realizar un
estudio de colinealidad usando los FIV y los
ndices de condicin
Nota: Previamente valorar la necesidad de
transformar variables

El problema de la autocorrelacin
Aparicin cuando las variables
explicativas son series temporales
P.e. si miro la altura a lo largo del
tiempo 160 siguiente medida >= 160
Problemas (los de siempre):
Mala estimacin
Varianza mal calculada
Predicciones no correctas

El problema de la autocorrelacin
Deteccin: Test de Durbin-Watson
n

d=

2
e
e
(
)

t t 1
t =1

2
e
t
t =1

Tiene en cuenta el residuo de una observacin


y el anterior (Datos ordenados!!!)
Regla:
d~2 independencia
d<2 autocorrelacin positiva
d>2 autocorrelacin negativa
Problema: d no tiene distribucin (simulacin)

El problema de la autocorrelacin

Con SPSS:
Opcin Regresin lineal,
Estadsticos

El problema de la autocorrelacin

Ejercicio: Con el modelo sin colinealidad de los


datos de colesterol validar la hiptesis de
independencia (no autocorrelacin)

Predicciones
Tras elegir el mejor modelo y validarlo podemos hacer
predicciones puntuales
1. IC prediccin del valor medio de Y para una
combinacin de X0=(1,X1,X2,,Xp) observados

y 0 t / 2,n p 1s X 0 ' ( X ' X )1 X 0


2. IC para un valor individual de Y dado x=X0 (intervalo
de prediccin)

y 0 t / 2,n p 1s 1 + X 0 ' ( X ' X )1 X 0

Predicciones
Tras elegir el mejor modelo y validarlo podemos hacer
predicciones globales
3. IC prediccin esperado

y 0 pF ( p, n p )s X 0 ' ( X ' X )1 X 0

4. IC prediccin dato observado


y 0 pF ( p, n p )s 1 + X 0 ' ( X ' X )1 X 0

Predicciones

Ejercicio: Con los datos de colesterol y el modelo


sin colinealidad estimar cul sera el nivel de
colesterol medio para un individuo de 85 aos.
y para los que no hacen ejercicio?

Interaccin y confusin

CONFUSI
Situacin en la que la relacin entre una
determinada exposicin y un determinado
resultado es debido a la influencia de una
tercera variable

Interaccin y confusin
Variable dependiente

X
Variable independiente

tercera variable

Interaccin y confusin
Variable dependiente

Variable independiente

Factor de confusin
confounder
confounding variable

Interaccin y confusin
Ejemplo intuitivo

Tasa de mortalidad /1000 (1986)


CRUDA
AJUSTADA
Costa Rica
Venezuela
Mxico
Cuba
Canad
Estados Unidos

3.8
4.4
4.9
6.7
7.3
8.7

3.7
4.6
5.0
4.0
3.2
3.6

Interaccin y confusin
X es un confusor......

Y
M
X

M
X

X NO es un confusor......
Y
M
X

M
X

M
X

Interaccin y confusin
CONTROL DE LA CONFUSIN
en el Diseo
Apareamiento
Restriccin
en el Anlisis
Estratificacin
Ajuste (estandarizacin)
Apareamiento
Modelizacin

Interaccin y confusin
Hay interaccin cuando:
la relacin entre 2 o ms factores difiere del
resultados de los efectos individuales
El efecto puede ser:
* Mayor del esperado (interaccin positiva o
sinergismo)
* Menor del esperado (interaccin negativa o
antagonismo)

Interaccin y confusin
1. Hay asociacin?
2. En ese caso: es debida a confusin?
3. Se mantiene la asociacin (magnitud similar) en
los estratos formados por una tercera variable?

NO
(Hay interaccin)

S
(No hay interaccin)

Interaccin y confusin

Ejercicio: Con los datos de Presin arterial, tabaco y


caf, contrastar la existencia de interaccin y
confusin y obtener la mejor estimacin para el efecto
de ambos factores
Nota: Previamente debemos calcular la variable de
interaccin tabaco y caf

Anda mungkin juga menyukai