Verificacin de supuestos
NOCIONES PRELIMINARES
Variables aleatorias
Es una funcin que mapea del conjunto espacio muestral al conjunto de
nmeros reales.
Discretas:
NOCIONES PRELIMINARES
Caractersticas de las variables aleatorias
Asociado a cada variable aleatoria X existe una funcin f(x) llamada
funcin de probabilidad, que determina la probabilidad de ocurrencia
de los valores posibles de la variable aleatoria.
Var ( X ) E[ X - E ( X )]2
6
NOCIONES PRELIMINARES
Relaciones entre variables
La covarianza es til en identificar el sentido de la asociacin entre
las variables X e Y pero tiene un serio problema: el resultado numrico
depende de la escala en que estn medidas las variables.
NOCIONES PRELIMINARES
Es posible que el coeficiente de correlacin sea cero, en ese caso
decimos que X e Y no estn correlacionadas.
NOCIONES PRELIMINARES
Estadsticos y parmetros
Un estadstico es una funcin que depende de los datos muestrales.
Cuando se calcula un estadstico, hay que tener presente que est
sometido a la variabilidad muestral, a diferencia de un parmetro
que es constante.
NOCIONES PRELIMINARES
Estimacin de parmetros
A simple vista puede parecer razonable pensar que una propiedad
deseable de las estimaciones es que, en promedio, sean igual o al
menos parecidas al verdadero (desconocido) parmetro. De la misma
manera, tambin parece deseable que el error (estndar) sea lo ms
pequeo posible.
sesgo() [ E () ]
10
NOCIONES PRELIMINARES
Un estimador es insesgado si el sesgo es igual a cero.
En otras palabras, un estimador es insesgado si la media de su
distribucin muestral es igual al valor del parmetro que se desea
estimar.
ECM () E[ ]2
ECM () VAR () [ E () ]2
Sesgo
11
NOCIONES PRELIMINARES
Estimacin de parmetros
Generalmente se habla de lo deseable que es usar diseos muestrales que
produzcan estimaciones vlidas y confiables, por lo tanto es preciso
definir que significan estos trminos.
12
NOCIONES PRELIMINARES
El trmino estimador se utiliza para referirse a la frmula que nos da
un valor numrico del parmetro de inters.
NOCIONES PRELIMINARES
Es posible analizar las caractersticas de los estimadores
considerando sus propiedades para un tamao de muestra dado o bien
de manera asinttica. Las preguntas relevantes son:
El estimador es insesgado?
El estimador es eficiente?
Cul de los estimadores presenta un ECM ms pequeo?
14
NOCIONES PRELIMINARES
Test de hipotesis
Un procedimiento muy habitual es la realizacin de test de hiptesis
para responder preguntas acerca de los parmetros desconocidos. En
trminos generales, los pasos bsicos para testear hiptesis son:
15
NOCIONES PRELIMINARES
Un test estadstico es una regla de decisin, basada en la informacin
proveniente de una muestra para elegir entre dos resultados posibles:
rechazar / no rechazar H0.
NOCIONES PRELIMINARES
Para cualquier tipo de test hay 3 resultados posibles:
se toma una decisin correcta, es decir se rechaza una hiptesis
falsa o no se rechaza una hiptesis verdadera.
17
NOCIONES PRELIMINARES
Asociados a cada uno de estos errores hay una probabilidad que
indicamos como P(Error Tipo I ) y P(Error Tipo II ). Idealmente,
desearamos minimizar la probabilidad de cometer ambos errores pero
esto no es posible. Lo habitual es determinar la mxima probabilidad de
Error Tipo I que estamos dispuestos a tolerar y derivar una regla de
decisin que permita minimizar la probabilidad de Error Tipo II.
Yt 1 2 X t 2 3 X t 3 ... k X tk t ; t 1,..., T
Y1 1 X 12
Y2 1 X 22
Y3 1 X 32
Y 1 X
T2
T
X 13
X 23
X 33
XT 3
X 1k 1 1
X 2k 2 2
X 3k 3 3
X Tk K T
Y(T 1) X (T K ) ( K 1) (T 1)
19
2.
Xit , i=2,...,K
(Regresores no estocsticos)
3.
E(t) = 0
4.
E(t, t-s) = 0
s 0 (ausencia de autocorrelacin)
5.
E(2t) = 2
(Homocedsticidad)
6.
Rango(X) = K
(Estimacin MCO)
7.
E(t, Xit) = 0
i, t
8.
t ~ N (0, 2 )
(Inferencia)
20
(10, 23)
(Xt,Yt)
= 1,5 2 X t
et Yt Yt
(Xt, Yt )
Xt=10
Xt
21
Q
0 (CNPO)
i
( X ' X ) 1 X ' Y
Donde:
1
2
k ( kx1)
Xt2
X'X
X
tk
X
X
t2
2
t2
X tk X t 2
X
X X
t 2 tk
2
X tk
tk
Yt
Yt X t 2
X 'Y
Y X
t
tk
Y 1 2 X t 2 3 X t 3 ... k X tk X
22
2. Insesgamiento: E ( )
3. Eficiencia:
Teorema de Gauss-Markov : El estimador MCO es de mnima
varianza.
V ( ) V (* )
Conjunto estimadores
lineales e insesgados
23
P lim( )
5. Distribucin muestral:
Para el vector de parmetros: ~ N ( , 2 ( X X ) 1 )
a11 a1k
Var ( ) 2 ( X X ) 1 2
a a
kk
k1
2
Para un parmetro individual: j ~ N ( j , a jj )
2
1
donde 2ajj es el elemento j-simo de la diagonal de ( X X )
ee
T k
24
Bondad de ajuste
R2 = SCE/SCT = 1- SCR/SCT
Yt
Yt 1 2 X t
e 'e
b X ' Y - TY 2
R =
= 12
Y ' Y - TY
Y ' Y - TY 2
2
0 R2 1
R2 = 1
Xt
K - 1
2
2
2
R = R - (1 - R )
T - K
Yt
Yt 1 2 X t
Yt
Yt 1 2 X t
R2 = 0
0 < R2 < 1
Xt
25
Xt
Inferencia en el MRLM
Nos interesa verificar si las observaciones muestrales son
compatibles con una determinada hiptesis / afirmacin. Por ej.
H 0 : i b
H a : i b (Prueba de dos colas)
Inferencia en el MRLM
Enfoque de prueba de significancia
El procedimiento se basa en utilizar un estimador y su distribucin,
suponiendo que sta se cumple bajo Ho.
i i
~ t(T k )
Se sabe que
i b
~ t(T k )
i
No rechazo Ho
(1 - )
Zona de rechazo
Zona de rechazo
/2
/2
/2
/2
.22
.24
.26
Si | t | > | tc | Rechazamos Ho
.28
-tc
.30
.32
.34
.36
.38
.40
.42
tc
.44
.46
.48
27
Inferencia en el MRLM
Valor-p
O nivel de significancia emprico del contraste, es el dato obtenido a
partir del valor del estadstico del contraste estimado a partir de una
muestra y nos informa sobre cul sera el nivel de significancia () ms
pequeo que nos hubiera permitido rechazar la H0.
Si p < (5%), rechazamos Ho
SI p > (5%), No rechazamos Ho
Cuanto ms pequeo es valor-p mayor la evidencia en contra de H0.
28
Inferencia en el MRLM
Significancia conjunta de los parmetros
Ho: 2 = 3= ...= k = 0
Ha: 2 0 ,..., k 0
a) SCE/2 ~2(k-1)
b) e'e/ 2 = SCR/ 2 ~ 2(T- k)
c) (a) y (b) son independientes
0.7
0.6
0.5
SCE / 2
(T K ) SCE
F K 1 2
~ F( K 1,T K )
SCR /
( K 1) SCR
T K
0.4
0.3
0.2
No rechazo Ho
(1 - )|
0.1
Zona de rechazo
0
0
F()
29
Inferencia en el MRLM
Tests de restricciones lineales
Sea el modelo: Yt 1 2 X t 2 3 X t 3 t
(Funcin de Prod.)
a) Significancia individual
Ho: 2 = 0
Vs.
Ha: 2 0
Vs.
Ha: 2 + 3 1
c) Significancia conjunta
Ho: 2 = 3 = 0
Vs.
Ha: 2 0, 3 0
30
Inferencia en el MRLM
Mediante el clculo de residuos libres y restringidos
Ho: El modelo con restricciones es correcto
Ha: El modelo sin restricciones es correcto.
( SCRr SCRn ) / q
F
~ F ( q, T k )
SCRn / T k
SCRr
SCRn
= nmero de restricciones.
Verificacin de supuestos
Distribuciones para tests de diagnstico
2 m
m
F m, T k a medida que T k
E(ut) = 0
El supuesto dice que la media de las perturbaciones es cero.
Para todos los tests de diagnstico, no observamos las perturbaciones
por lo que aplicamos los contrastes a los residuos de la regresin.
La media de los residuos siempre ser cero si la regresin incluye al
intercepto.
TRANS = -0.031 + 0.041LOG(TOTEXP) - 5.79910-5AGE - 0.013NK
.6
.5
.4
u 3.411016
.3
.2
.1
.0
-.1
-.2
250
500
750
1000
1250
1500
33
Multicolinealidad
34
Multicolinealidad
Pautas para detectar el problema:
35
Multicolinealidad
Y calculamos el estadstico:
Fj
R 2j / (k - 2)
2
j
(1- R ) / (T - (k -1))
~ F (k - 2, T - (k -1))
VIF ( i )
1
1 Ri2
Multicolinealidad
Soluciones:
Var ( j )
2
T Var ( X jt )(1 R 2j )
y/o
Heterocedasticidad
Incumplimiento del supuesto de la varianza del trmino de error es
constante (Var(t) = 2 t). En este caso Var(t) = 2t , t = 1,2,,T, o lo
que es lo mismo, la matriz de var-cov tendr valores distintos a lo largo
de su diagonal principal:
Var (ut ) UU
12 0
2
0
2
E (UU )
0 0
0
2 2 IT
2
T
Ejemplos:
Seccin cruzada: Pautas de consumo en economas domsticas: el
error ser mayor en familias de ingreso ms elevado (un ingreso ms
alto permite una variabilidad mayor en bienes consumidos y ahorro)
Series temporales: varianza cambiante en periodos de incertidumbre
econmica.
38
Heterocedasticidad
(Homocedasticidad)
et2
(Heterocedasticidad)
et2
x2t
X jt
(Heterocedasticidad)
et2
et2 (Heterocedasticidad)
X jt
X jt
39
Heterocedasticidad
Consecuencias de la heterocedasticidad
40
Heterocedasticidad
Contraste de White
Es uno de las tcnicas ms comunes para determinar la presencia de
heterocedasticidad.
Pasos:
a) Estimar por MCO el modelo original y obtener los residuos t
t2 0 j X j jl X j X i j X 2j t
j
j l
Heterocedasticidad
Solucin
Transformar el modelo de modelo que el nuevo modelo sea
homocedstico. Mnimos Cuadrados Ponderados consiste en dividir
las variables del modelo por la desviacin tpica de las
perturbaciones; de esa manera se asigna una mayor ponderacin a
aquellas observaciones cuya varianza sea menor.
t
1 2
... k
i
i
i
i i
Yt
X i2
X ik
42
Heterocedasticidad
Otras aproximaciones para tratar la heterocedasticidad
Autocorrelacin
Las perturbaciones del modelo estn correlacionadas consigo misma
en diferentes momentos del tiempo: Cov(t, s) 0, t s
+
u t
u t
u t 1
Time
44
Autocorrelacin
ut
+
u t
Autocorrelacin
negativa
u t 1
-+
u t
Ausencia de
autocorrelacin
Time
u t
u t 1
45
Autocorrelacin
Estadstico de Durbin-Watson
t t 1 t
Modelo: Yt 1 2 X t 2 3 X t 3 ... k X tk t
T
Estadstico de contraste: DW
(
t 2
t 1
2
t
Ha: DW 2
= -1 DW 4
?
LI
2(1 )
Ho: DW = 2
= +1 DW 0
)2
= 0 DW 2
A+
t 1
No existe
Autocorrel.
?
A-
LS
4 - LS
4 - LI
DW
46
Autocorrelacin
Test de Breusch Godfrey (test LM)
a) Estimar el modelo y obtener los residuos estimados t
b) Regresin auxiliar:
t 0 j X j j t j t
j
Autocorrelacin
Si el coeficiente se conoce, una forma de implementar el mtodo
MCG es mediante la metodologa de Cochrane-Orcutt.
Este procedimiento para corregir la autocorrelacin requiere un
supuesto acerca de la forma de autocorrelacin.
Si este supuesto es invlido, el remedio puede ser ms peligroso que
la enfermedad (Hendry and Mizon, 1978).
Sin embargo, es poco probable que se conozca la forma de
autocorrelacin, por lo que un enfoque ms moderno es que la
autocorrelacin representa una oportunidad para mejorar la regresin.
48
Especificacin
Uno de los supuestos de la regresin clsica es forma funcional
lineal, supuesto que no siempre se cumple.
49
Especificacin
Ho:
~ N(0, 2I)
Ha:
~ N(, 2I), 0
50
Especificacin
yt Axt eut ln yt ln xt ut
51
Normalidad
Estadstico Jarque-Bera
1 T ( X t X )3
A
T t 1
3
f(x)
Asimetra: A=0
N(0,2I)
Curtosis: K=3
1 T (X t X ) 4
K
T t 1
4
f(x)
Distribucin
asimtrica
Distribucin normal
x 52
Normalidad
Ho: Normalidad
Ha: Distribucin distinta a la normal
T k 2 ( K 3) 2
2
JB
A
(2)
6
4
donde:
T = tamao de la muestra.
k = nmero de parmetros estimados
A = coeficiente de asimetra.
K = coeficiente de apuntamiento (Curtosis)
53
Normalidad
Qu debemos hacer si no encontramos normalidad?
54
Normalidad
ut
+
Valor extremo 3
Oct
1987
Time
56
Estabilidad de Parmetros
Test de Chow
RESERVAS INTERNACIONALES BRUTAS DEL BCB
(1996Q1 - 2010Q4)
10,000
9730
DficitBoP
8,000
SupervitBoP
6,000
4,000
Yt 12 22 X 2t 32 X 3t t
Yt 11 21 X 2t 31 X 3t t
2,000
1171
0
1996
1998
2000
2002
2004
2006
2008
2010
Ho:
11 12 , 21 22 ,...., k1 k2
Ha:
11 12 , 21 22 .... k1 k2
(Ruptura total)
57
Estabilidad de Parmetros
Yt 1 2 X 2t 3 X 3t t
t 1, 2,..., T1
Yt 12 22 X 1t 32 X 3t t
t T1 1,..., T
Estadstico de prueba:
Requisito:
T1>>k
T2>>k
~ F( q ,T -2 K )
F
( SCR1 SCR2 )
SCRs
58
T - 2K
T -K
H 0 : 1 2 ... k
12 22 ... T2
(Modelo
estructuralmente
estable)
59
CUSUM
5% Significance
-50
1965
1970
1975
1980
1985
1990
1995
2000
60
CUSUM of Squares
5% Significance
0.8
0.6
0.4
0.2
0.0
-0.2
1965
1970
1975
1980
1985
1990
1995
2000
61
.06
.04
.02
.00
-.02
.000
-.04
.025
.050
.075
.100
.125
No requiere la
especificacin del periodo
de quiebre; computa
automticamente todos los
casos posibles,
comenzando con el tamao
de muestra mnimo
necesario.
Grafica los residuos
recursivos en la parte
superior y las
probabilidades
significativas en la parte
inferior.
.150
1965
1970
1975
1980
1985
1990
1995
2000
62
Coeficientes recursivos
.10
.08
Si muestra variaciones
significativas a medida
que se utilizan ms
observaciones, es una
indicacin de
inestabilidad.
.06
.04
.02
.00
-.02
-.04
-.06
1965
1970
1975
1980
1985
1990
1995
2000
El coeficiente
experimenta saltos
importantes cuando la
ecuacin postulada
intenta explicar cambios
estructurales.
63
64
Qt Pt Dt (Dt Pt ) t
Donde:
0 Periodo normal
Dt =
1 Periodo de crisis
65
H o : 0, 0
H a : 0, 0
a) Bajo la hiptesis nula
P
E(Qt | Pt ) Pt
E(Qt | Pt ) Pt t
E (Qt | Pt ) ( ) ( ) Pt
<0
>0
Q
66
Ho : 0
Ha : 0
Bajo la hiptesis alterna
P
E(Qt | Pt ) ( ) Pt , 0
E (Qt | Pt ) Pt
Q
67
Ho : 0
Ha : 0
Bajo la hiptesis alterna
P
E (Qt | Pt ) ( ) Pt , 0
E (Qt | Pt ) Pt
68
Y A BX U
(1)
71
A A0 A1D1 A2 D2
(2)
B B0 B1D1 B2 D2
(3)
Y ( A0 A1 D1 A2 D2 ) ( B0 B1D1 B2 D2 ) X U
A0 A1D1 A2 D2 B0 X B1D1 X B2 D2 X U
cuando X X 1
cuando X 1 X X 2
cuando X X 2
Y a0 b0 X
Y (a0 a1 ) (b0 b1 ) X
Y (a a ) (b b ) X
0
72