Validacin y prediccin
Juan R Gonzlez
2002
El problema de la colinealidad
De nuevo aparece (XX) en este problema, si hay
colinealidad no se puede invertir (matriz singular)
Problema de colinealidad: X1=a+bX2
Poco usual en la prctica pero si que aparece la
casi-colinealidad (e.d. b casi 1)
En este caso (XX) es casi singular y las
estimaciones son poco estables (puede darse
grandes cambios en las estimaciones
El problema de la colinealidad
Deteccin 1: Factor de inflacin de la varianza
(FIV) y la tolerancia (T)
1
FIV =
1 R 2j
1
2
= 1 Rj
T =
FIV
El problema de la colinealidad
Deteccin 2: Realizar un anlisis de componentes
principales y establecer el ndice de condicin (a
partir de los valores propios)
Mx VAP de
Min VAP de
matriz de correlaciones
El problema de la colinealidad
Con SPSS:
Opcin Regresin lineal,
Estadsticos
El problema de la colinealidad
Diagnsticos de colinealidada
Modelo
1
Dimensin
1
2
3
4
Autovalor
3,985
8,389E-03
5,505E-03
1,540E-03
Indice de
condicin
1,000
21,794
26,903
50,874
(Constante)
,00
,00
,03
,96
Proporciones de la varianza
Presin
diastlica
Altura (cm)
inicial
,00
,00
,00
,35
,29
,51
,71
,14
Presin
sistlica
inicial
,00
,71
,22
,06
El problema de la colinealidad
Ejercicio: Con los datos de colesterol realizar un
estudio de colinealidad usando los FIV y los
ndices de condicin
Nota: Previamente valorar la necesidad de
transformar variables
El problema de la autocorrelacin
Aparicin cuando las variables
explicativas son series temporales
P.e. si miro la altura a lo largo del
tiempo 160 siguiente medida >= 160
Problemas (los de siempre):
Mala estimacin
Varianza mal calculada
Predicciones no correctas
El problema de la autocorrelacin
Deteccin: Test de Durbin-Watson
n
d=
2
e
e
(
)
t t 1
t =1
2
e
t
t =1
El problema de la autocorrelacin
Con SPSS:
Opcin Regresin lineal,
Estadsticos
El problema de la autocorrelacin
Predicciones
Tras elegir el mejor modelo y validarlo podemos hacer
predicciones puntuales
1. IC prediccin del valor medio de Y para una
combinacin de X0=(1,X1,X2,,Xp) observados
Predicciones
Tras elegir el mejor modelo y validarlo podemos hacer
predicciones globales
3. IC prediccin esperado
y 0 pF ( p, n p )s X 0 ' ( X ' X )1 X 0
Predicciones
Interaccin y confusin
CONFUSI
Situacin en la que la relacin entre una
determinada exposicin y un determinado
resultado es debido a la influencia de una
tercera variable
Interaccin y confusin
Variable dependiente
X
Variable independiente
tercera variable
Interaccin y confusin
Variable dependiente
Variable independiente
Factor de confusin
confounder
confounding variable
Interaccin y confusin
Ejemplo intuitivo
3.8
4.4
4.9
6.7
7.3
8.7
3.7
4.6
5.0
4.0
3.2
3.6
Interaccin y confusin
X es un confusor......
Y
M
X
M
X
X NO es un confusor......
Y
M
X
M
X
M
X
Interaccin y confusin
CONTROL DE LA CONFUSIN
en el Diseo
Apareamiento
Restriccin
en el Anlisis
Estratificacin
Ajuste (estandarizacin)
Apareamiento
Modelizacin
Interaccin y confusin
Hay interaccin cuando:
la relacin entre 2 o ms factores difiere del
resultados de los efectos individuales
El efecto puede ser:
* Mayor del esperado (interaccin positiva o
sinergismo)
* Menor del esperado (interaccin negativa o
antagonismo)
Interaccin y confusin
1. Hay asociacin?
2. En ese caso: es debida a confusin?
3. Se mantiene la asociacin (magnitud similar) en
los estratos formados por una tercera variable?
NO
(Hay interaccin)
S
(No hay interaccin)
Interaccin y confusin