Anda di halaman 1dari 72

Econometra II

CAPITULO 1 Variables omitidas y error en las variables. Variables


instrumentales (VI)
Profesora: Graciela Sanroman
Ao: 2012
FCCEEA, UDELAR () Econometra II Ao: 2012 1 / 72
En este captulo nos concentraremos en como obtener buenas estimaciones
de los efectos parciales con el objetivo de estudiar relaciones causales, no
prestaremos atencin al tema de la prediccin.
El objetivo de la mayora de los estudios en economa es determinar si el
cambio en una variable (x) determina un cambio en otra variable (y),
dejando un conjunto de otras variables constante.
Ejemplos:
cursar un ao adicional de educacin tiene algn efecto en el salario?,
reducir los impuestos municipales determina un aumento en el nivel
de actividad de la ciudad?
reducir el tamao de los grupos en las escuelas mejora los resultados
escolares de los alumnos?
un cambio en el volumen de produccin determina una variacin en
el costo unitario de produccin?
cunto inuye un aumento de los precios de un bien en su demanda?
un aumento en el ingreso tiene efectos en el consumo?
aumentar los aos de educacin de la poblacin tiene algn efecto
en el producto y el crecimiento?
FCCEEA, UDELAR () Econometra II Ao: 2012 2 / 72
Relaciones causales
La nocin de ceteris paribus es el ncleo del establecimiento de una
relacin causal.
La pregunta central que intentaremos abordar es cmo podemos
trasladar este anlisis de ceteris paribus a un contexto probabilstico?
Sean y y x = (x
1
, x
2
, ..., x
k
) variables aleatorias. Si quiero centrarme
en el efecto que tiene sobre y el cambio en una variable digamos x
j
,
dejando el resto de las variables constantes difcilmente me resultar
suciente el estudiar la correlacin entre ambas variables. En cambio
utilizamos mtodos economtricos que permiten identicar ese efecto.
FCCEEA, UDELAR () Econometra II Ao: 2012 3 / 72
Esperanza condicional
Covarianza, correlacin: se trata de relaciones simtricas entre dos
variables aleatorias.
En ciencias sociales quisieramos explicar una variable aleatoria Y (por
ejemplo salario por hora) en trminos de otra variable aleatoria X (ej:
edad, educacin, gnero).
Podemos resumir la relacin entre Y y X considerando la esperanza
condicional de Y dada X la escribimos como E(y [ x) =
E(y [ x
1
, x
2
....x
j
) y la llamamos indistintamente esperanza
condicional o media condicional.
FCCEEA, UDELAR () Econometra II Ao: 2012 4 / 72
Efectos parciales
Si x
j
es una variable contina podemos obtener el efecto parcial
E(y [ x)
x
j
que mide como espero que cambie en promedio y cuando x
j
cambia,
manteniendo constantes las restantes X.
Pero tambin podra considerar la distribucin de probabilidad
condicional P(y [ X)
P(y [ x)
x
j
FCCEEA, UDELAR () Econometra II Ao: 2012 5 / 72
Es eso un anlisis ceteris paribus?
Depende de la existencia de variables no observables (omitidas) que estn
correlacionadas con x
j
.
Consideremos el caso ms general
y = (x, u)
El efecto ceteris paribus es

j
(x, u) =
(x, u)
x
j
pero tendremos dicultades en identicarlo, siempre que exista una
correlacin entre u y x
j
ya que
d(x, u)
dx
j
=
(x, u)
x
j
+
(x, u)
u
u
x
j
FCCEEA, UDELAR () Econometra II Ao: 2012 6 / 72
Independencia
Veremos tres conceptos de independencia:
Independencia estocstica
Independencia en media
Ausencia de correlacin
FCCEEA, UDELAR () Econometra II Ao: 2012 7 / 72
Independencia estocstica
Se dice que dos variables son estocsticamente independiente si se cumple
que la funcin de probabilidad conjunta es igual al producto de las
marginales
x, y continuas f
x,y
(x, y) = f
x
(x)f
y
(y)
x, y discretas Pr(x = x, y = y) =Pr(x = x) Pr(y = y)
Si dos variables aleatorias x e y son estocsticamente independientes
entonces
conocer el resultado de x no altera la probabilidad de los posibles
resultados de y y viceversa (es una propiedad simtrica)
f (y [ x) = f (y) y f (x [ y) = f (x)
E(y [ x) = E(y) y E(x [ y) = E(x)
E(yx) = E(y)E(x)
cov(y, x) = 0
Todos los momentos condicionales de y [ x y x [ y de coinciden con
los momentos no condicionales
FCCEEA, UDELAR () Econometra II Ao: 2012 8 / 72
Independencia en media
Se dice que y es independiente en media de x si se cumple que la
esperanza condicional de y [ x es igual a la esperanza incondicional de y
E(y [ x) = E(y)
Este concepto no es necesariamente simtrico
E(y [ x) = E(y) no implica E(x [ y) = E(x)
Si y es independiente en media de x se cumple:
cov(y, x) = 0
cov(y, g(x)) = 0 para toda funcin continua g(.)
Si y es independiente en media de x y se cumple E(y [ x) = 0
E(y) = 0
E(yg(x)) = 0
cov(y, g(x)) = 0
FCCEEA, UDELAR () Econometra II Ao: 2012 9 / 72
Ausencia de correlacin
Se dice que y y x estn incorrelacionados si se cumple que la covarianza
entre y y x es igual a 0
cov(y, x) = 0
Este concepto es simtrico
Si y y x estn incorrelacionados se cumple necesariamente:
cov(y, g(x)) = 0 slo si g(x) = a +bx (lineal)
FCCEEA, UDELAR () Econometra II Ao: 2012 10 / 72
Modelo de Regresin con Regresores estocsticos
Tanto la insesgadez como la consistencia del estimador MCO en el modelo
de regresin
y
i
= x
/
i
+u
i
depende del supuesto
E(u
i
[X ) = 0
La referencia a este supuesto en la literatura:
independencia entre el error y los regresores
ortogonalidad entre el error y los regresores
exogeneidad de los regresores
errores no correlacionados con las covariables
FCCEEA, UDELAR () Econometra II Ao: 2012 11 / 72
Recordemos que en el contexto del modelo de regresin simple con
regresores estocsticos,
y
i
= + x
i
+u
i
el estimador MCO de puede ser interpretado en trminos de momentos
poblacionales de la siguiente forma:
p lim

MCO
=
cov(x
i
, y
i
)
var (x
i
)
=
cov(x
i
, + x
i
+u
i
)
var (x
i
)
= +
cov(x
i
, u
i
)
var (x
i
)
por lo cual ser inconsistente si el regresor y el error estn correlacionados
FCCEEA, UDELAR () Econometra II Ao: 2012 12 / 72
En trminos ms generales si se cumple la independencia en media del
error respecto a los regresores,
E(u
i
[X ) = 0 =
E(u
i
) = 0
E(x
i
u
i
) = 0 =
_

_
E(x
1i
u
i
) = 0
E(x
2i
u
i
) = 0
.
.
.
E(x
ki
u
i
) = 0
Recordar que E(u
i
[X ) = 0 tambin implica cov(u
i
, h(x
i
)) = 0 donde
h(.) es una funcin continua, por ejemplo:
cov(u
i
, x
i
) = 0
cov(u
i
, x
2
i
) = 0
cov(u
i
, ln(x
i
)) = 0 si x
i
> 0
.
FCCEEA, UDELAR () Econometra II Ao: 2012 13 / 72
Mtodo de los momentos
Momentos poblacionales
E(u
i
[X ) = 0 =
E(u
i
) = E(y
i

0

1
x
1i
.....
k
x
ki
) = 0
E(x
1i
u
i
) = E [x
1i
(y
i

0

1
x
1i
.....
k
x
ki
)] = 0
E(x
2i
u
i
) = E [x
2i
(y
i

0

1
x
1i
.....
k
x
ki
)] = 0
.
.
.
E(x
ki
u
i
) = E [x
ki
(y
i

0

1
x
1i
.....
k
x
ki
)] = 0
FCCEEA, UDELAR () Econometra II Ao: 2012 14 / 72
Si se cuenta con una muestra iid y
i
, x
i

i =1,...N
es posible utilizar el
mtodo de los momentos (el principio de analoga) para estimar los
coecientes del modelo:
Anlogo muestral
E(u
i
) = 0
ppio analoga

1
N
N

i =1
(y
i

1
x
1i
.....

k
x
ki
) = 0
E(x
1i
u
i
) = 0
ppio analoga

1
N
N

i =1
x
1i
(y
i

1
x
1i
.....

k
x
ki
) = 0
E(x
2i
u
i
) = 0
ppio analoga

1
N
N

i =1
x
2i
(y
i

1
x
1i
.....

k
x
ki
) = 0
.
.
.
E(x
ki
u
i
) = 0
ppio analoga

1
N
N

i =1
x
ki
(y
i

1
x
1i
.....

k
x
ki
) = 0
Notar que estas condiciones son idnticas a las que dan lugar a los
estimadores MCO y MV en el MRLG.
FCCEEA, UDELAR () Econometra II Ao: 2012 15 / 72
Es muy importante tener en cuenta que el cumplimiento del. supuesto
E(u
i
[ x) = 0 no depender en general de cuestiones estadsticas sino que
depender de
cules son las relaciones econmicas que esperamos entre las variables
del modelo economtrico
los datos disponibles
FCCEEA, UDELAR () Econometra II Ao: 2012 16 / 72
Modelos de regresin lineal con regresores endgenos (no
independientes)
En econometra no se mantiene el uso tradicional de la palabra
"endgeno" que deviene de los modelos econmicos, en los cuales este
trmino designa una variable que se determina en el contexto del modelo
(no viene "dada"). En econometra, una variable
explicativa/regresor/covariable x
j
se dice que es
endgena cuando se encuentra correlacionada con el error de la
ecuacin a estimar,
exgena si est incorrelacionada.con el error de la ecuacin a estimar
FCCEEA, UDELAR () Econometra II Ao: 2012 17 / 72
Endogeneidad
En econometra la endogeneidad surge de tres fuentes:
la existencia de variables omitidas,
la presencia de errores de medida
la simultaneidad en la determinacin de alguna variable explicativa x
j
y la explicada y (s relacionado con el concepto econmico de
endogeneidad).
La estimacin consistente en presencia de correlacin entre los regresores y
el error ser posible en algunos casos, un caso es cuando se dispone de
INSTRUMENTOS VALIDOS.
FCCEEA, UDELAR () Econometra II Ao: 2012 18 / 72
Omisin de variables relevantes, inclusin de variables
irrelevantes, multicolinealidad (Wooldridge 3.3, 3.4 y
Apndice 3A)
Omisin de variables relevantes
Consideremos el modelo
y
i
=
1
x
1i
+
2
x
2i
+u
i
i = 1, ....n
E (u
i
[ x
1
, x
2
) = 0
Supongamos que observamos y y x
1
pero no x
2
. El modelo que puedo
estimar es
y
i
=
1
x
1i
+
i

i
=
2
x
2i
+u
i
FCCEEA, UDELAR () Econometra II Ao: 2012 19 / 72
En trminos de lmite de probabilidad:
p lim

1MCO
=
cov(x
1i
, y
i
)
var (x
1i
)
como el verdadero modelo para y
i
es x
1i

1
+x
2i

2
+u
i
tenemos
=
cov(x
1i
, x
1i

1
+x
2i

2
+u
i
)
var (x
1i
)
=
1
+
2
cov(x
1i
, x
2i
)
var (x
1i
)
Entonces, el estimador ser inconsistente a menos que
cov(x
1i
, x
2i
) = 0.y/o
2
= 0
FCCEEA, UDELAR () Econometra II Ao: 2012 20 / 72
En trminos de esperanzas:
En el MRLS

1MCO
=
N

i =1
(x
1i
x
1
)y
i
N

i =1
(x
1i
x
1
)
2
Notar: esto equivale al anlogo muestral de
cov (x
1i
,y
i
)
var (x
1i
)
.
FCCEEA, UDELAR () Econometra II Ao: 2012 21 / 72
El numerador lo desarrollamos como
N

i =1
(x
1i
x
1
)y
i
=
N

i =1
(x
1i
x
1
) (x
1i

1
+x
2i

2
+u
i
)
=
1
N

i =1
(x
1i
x
1
)
2
+
2
N

i =1
(x
1i
x
1
)x
2i
+
N

i =1
(x
1i
x
1
)u
i
por lo cual:

1MCO
=
1
+
2
N

i =1
(x
1i
x
1
)x
2i
N

i =1
(x
1i
x
1
)
2
+
N

i =1
(x
1i
x
1
)u
i
N

i =1
(x
1i
x
1
)
2
FCCEEA, UDELAR () Econometra II Ao: 2012 22 / 72
E
_

1MCO
[ x1, x2
_
=
1
+
2
N

i =1
(x
1i
x
1
)x
2i
N

i =1
(x
1i
x
1
)
2
=
1
+
2
+

donde

es el coeciente asociado a x1 en una regresin de x1 sobre x2
Por la Ley de las Expectativas iteradas podemos escribir:
E
_

1MCO
_
= E
_
E
_

1MCO
[ x1, x2
__
=
1
+
2
+ E(

)
=
1
+
2
+
entonces, vemos que

1MCO
es sesgado excepto que
2
= 0 y/o = 0.
FCCEEA, UDELAR () Econometra II Ao: 2012 23 / 72
El sesgo por omisin de variable relevante, entonces depende de
2
y , el
signo del sesgo estar dado por
corr (x1, x2) > 0 corr (x1, x2) < 0

2
> 0 sesgo positivo sesgo negativo

2
< 0 sesgo negativo sesgo positivo
FCCEEA, UDELAR () Econometra II Ao: 2012 24 / 72
Omisin de variables relevantes
Otra forma de verlo es:
cov(x
i
,
i
) = cov(x
1ii
, x
2i

2
+u
i
)
=
2
cov(x
1i
, x
2i
)
var (x
1i
)
se viola el supuesto de ausencia de correlacin entre los regresores y el
trmino de error
Finalmente en trminos matriciales:

1MCO
=
_
X
/
1
X
1
_
1
X
/
1
y
=
1
+
_
X
/
1
X
1
_
1
X
/
1
X
2

2
+
_
X
/
1
X
1
_
1
X
/
1

La conclusin entonces es que si la variable omitida est correlacionada


con algn regresor el estimador MCO ser sesgado e inconsistente.
FCCEEA, UDELAR () Econometra II Ao: 2012 25 / 72
Omisin de variables relevantes
Otro aspecto que es necesario analizar es la varianza del estimador. Notar
que
Var (

1MCO
) =
2
_
X
/
1
X
1
_
1
Mientras que si hubieramos estimado el modelo correcto (aquel que
incluye tambin x
2
) la varianza del estimador estara dada por el bloque
superior izquierdo de la matriz
_
X
/
X
_
1
el cual utilizando las propiedades
de la matriz particionada
_
X
/
1
X
1
X
/
1
X
2
X
/
2
X
1
X
/
2
X
2
_
1
FCCEEA, UDELAR () Econometra II Ao: 2012 26 / 72
Omisin de variables relevantes
(X
/
1
X
1
X
/
1
X
2
(X
/
2
X
2
)
1
X
/
2
X
1
)
1
=
_
X
/
1
M
2
X
1
_
1
Var (

12MCO
) =
2
_
X
/
1
M
2
X
1
_
1
Var (

1MCO
)
1
Var (

12MCO
)
1
=
1

2
X
/
1
X
2
(X
/
2
X
2
)
1
X
/
2
X
1
que es una matriz denida positiva, por lo cual la varianza del estimador
en el modelo que omite X
2
es menor que la que incluye todas las variables.
Notar que este resultado es independiente del hecho que las variables estn
correlacionadas.
FCCEEA, UDELAR () Econometra II Ao: 2012 27 / 72
Omisin de variables relevantes en el MRLM
Consideremos ahora el caso del modelo de regresin lineal mltiple (se
incluyen 3 variables, 2 observables y una inobservable):
y
i
=
1
x
1i
+
2
x
2i
+
3
x
3i
+u
i
i = 1, ....n
E (u
i
[ x
1
, x
2,
, x
3
) = 0
plim

MCO
= [Var (x)]
1
cov(x, y) =
_
_

1

3
_
_
=
_
_
Var (x1) cov(x1, x2) cov(x1, x3)
Var (x2) cov(x2, x3)
Var (x3)
_
_
1
_
_
cov(x1, y)
cov(x2, y)
cov(x3, y)
_
_
=
_
_

2
1

12

13

2
2

12

2
3
_
_
1
_
_

1Y

2Y

3Y
_
_
FCCEEA, UDELAR () Econometra II Ao: 2012 28 / 72
Si no disponemos de mediciones de x3 (o la omitimos por error)
estimaremos un modelo
y
i
=
1
x
1i
+
2
x
2i
+
i
i = 1, ....n

i
=
3
x
3i
+u
i
en el cual el supuesto E (u
i
[ x
1
, x
2
, x
3
) = 0 no asegura E (
i
[ x
1
, x
2
) = 0
En este modelo
plim
_

1MCO

2MCO
_
=
_

2
1

12

2
2
_
1
_

1Y

2Y
_
FCCEEA, UDELAR () Econometra II Ao: 2012 29 / 72
podemos re-escribir
=
_

2
1

12

2
2
_
1
_
1 0 0
0 1 0
_
_
_

1Y

2Y

3Y
_
_
=
_

2
1

12

2
2
_
1
_
1 0 0
0 1 0
_
Var (x) + [Var (x)]
1
_
_

1Y

2Y

3Y
_
_
=
_

2
1

12

2
2
_
1
_
1 0 0
0 1 0
_
Var (x) +
_
_

1

3
_
_
FCCEEA, UDELAR () Econometra II Ao: 2012 30 / 72
operando obtenemos
plim
_

1MCO

2MCO
_
=
_
_
1 0

2
2

13

12

23

2
1

2
2

2
12
0 1

2
1

23

12

13

2
1

2
2

2
12
_
_
_
_

1

3
_
_
=

1
+
3
_

2
2

13

12

23

2
1

2
2

2
12
_

2
+
3
_

2
1

23

12

13

2
1

2
2

2
12
_
FCCEEA, UDELAR () Econometra II Ao: 2012 31 / 72
Multicolinealidad
Denicin de multicolinealidad: dos o ms regresores incluidos en el
modelo estn (altamente) correlacionados.
Multicolinealidad perfecta: al menos uno de los regresores puede
escribirse como una combinacin lineal de otro(s) regresor(es). Aqu
se viola el supuesto de rango(x)=K con probabilidad 1, el modelo no
se puede calcular
Multicolinealidad: La correlacin es alta pero no perfecta (a veces se
establece un valor de 0.9 pero este nmero es slo una gua).
FCCEEA, UDELAR () Econometra II Ao: 2012 32 / 72
Multicolinealidad
Cmo detectar multicolinealidad
una seal de multicolinealidad surge cuando al estimar el modelo de
inters se observa un R2 alto con coecientes individualmente no
signicativos
tambin es aconsejable analizar la matriz de correlaciones de los
regresores o hacer regresiones de unos regresores sobre otros antes de
estimar el modelo de inters
Consecuencias de la multicolinealidad:
Si todos los regresores son exgenos el estimador MCO de los
coecientes sigue siendo consistente e insesgado
La varianza del estimador

j
se "ina", no es aconsejable realizar
inferencia sobre cada coeciente aisladamente.
Var (

j
) =

2
Var (x
j
)
(
1R
2
j
)
donde R
2
j
es el R2 de una regresin de x
j
sobre x
1,
x
2,...
x
j 1,
x
j +1,
...x
k
FCCEEA, UDELAR () Econometra II Ao: 2012 33 / 72
Multicolinealidad y omisin de variables relevantes
Intentar corregir el "problema" de la multicolinealidad omitiendo una
variable muy correlacionada con otro regresor puede llevar a un mal
mayor: omisin de variable relevante que afecta la consistencia e
insesgadez del estimador
Lo que se aconseja es realizar contrastes de signicacin conjunta de
los regresores correlacionados
El tamao de la muestra tambin juega un rol importante en este caso
FCCEEA, UDELAR () Econometra II Ao: 2012 34 / 72
Inclusin de variables irrelevantes
La inclusin de variables irrelevantes:
no afectar la insesgadez ni la consistencia del estimador de los
coecientes del modelo
aumentar la varianza (precisin) del estimador
FCCEEA, UDELAR () Econometra II Ao: 2012 35 / 72
Errores de medida (Wooldridge: 9.2 y 9.3)
Una dicultad que subyace a casi todo trabajo emprico en Economa es la
imposibilibad de disponer de observaciones muestrales de las variables que
se pretende relacionar.Por ejemplo,
las variables de Contabilidad Nacional como el PBI, el consumo, no
son sino estimaciones de conceptos tericos que no se observan en la
realidad
la Renta Permanente, la inteligencia o la habilidad de un trabajador,
no disponemos ni siquiera de estimaciones, por lo que, en el mejor de
los casos suelen utilizarse variables aproximadas, (variables proxy)
hay variables que se recolectan en encuestas pero estas mediciones
presentan errores (ingresos del hogar, educacin de los individuos,
etc.)
Cabe esperar que cuando hay error en la medicin de las variables, las
estimaciones no mantendrn las propiedades ideales que se satisfacen bajo
los supuestos del MRLG. Recordemos que estas propiedades son la
ausencia de sesgo, la consistencia, la eciencia y la normalidad asinttica.
FCCEEA, UDELAR () Econometra II Ao: 2012 36 / 72
Errores de medida en la variable dependiente
Veamos que sucede si slo puedo observar la variable dependiente sujeta a
un error de medida:
Es decir en el modelo:
y
+
i
= x
i
+u
i
i = 1, 2, .....N
E(u
i
[ x
i
) = 0
V(u
i
[ x
i
) =
2
u
observamos
y
i
, x
i

i =1,2....N
y
i
= y
+
i
+v
i
suponemos que v
i
se distribuye con media 0 y varianza
2
v
, .independiente
de u
i
y x
i
FCCEEA, UDELAR () Econometra II Ao: 2012 37 / 72
Errores de medida en la variable dependiente
Para hacer nuestro modelo estimable tenemos que expresarlo en trminos
de variables observables
y
i
= x
i
+ (u
i
+v
i
)
= x
i
+
i
E(
i
[ x
i
) = 0
V(
i
[ x
i
) =
2

=
2
u
+
2
v
Por consiguiente, el suponer que existe errores de medida en la variable
endgena no afectar la insesgadez y consistencia del estimador MCO,
aunque si afectar la varianza del error y por tanto de los estimadores
(aumenta en relacin a un modelo donde no hay errores de medida).
FCCEEA, UDELAR () Econometra II Ao: 2012 38 / 72
Errores de medida en variables independientes (regresores,
covariables)
La situacin es diferente cuando la variable que se mide con error es la
variable independiente (o regresor).
Supongamos
y
i
= x
+
i
+u
i
i = 1, 2, .....N
E(u
i
[ x
+
i
) = 0
V(u
i
[ x
+
i
) =
2
u
observamos
y
i
, x
i

i =1,2....N
x
i
= x
+
i
+w
i
Suponemos que w
i
est incorrelacionado tanto con x
+
i
como con u
i
.
FCCEEA, UDELAR () Econometra II Ao: 2012 39 / 72
Errores de medida en variables independientes (regresores,
covariables)
Entonces el modelo, expresado en trminos de las variables observables
ser
y
i
= x
i
+ (u
i
w
i
)
= x
i
+
i
El principal problema que enfrentamos es que ya no podemos suponer
E(
i
[ x
i
) = 0, debido a que
cov(x
i
,
i
) = cov(x
+
i
+w
i
, u
i
w
i
)
= cov(x
+
i
, u
i
) cov(x
+
i
, w
i
) +cov(w
i
, u
i
)
2
w
=
2
w
FCCEEA, UDELAR () Econometra II Ao: 2012 40 / 72
Errores de medida en variables independientes (regresores,
covariables)
Asintticamente
p lim

MCO
=
cov(x
i
, y
i
)
var (x
i
)
=
cov(x
+
i
+w
i
, x
+
i
+u
i
)
var (x
+
i
+w
i
)
=
var (x
+
i
)
var (x
+
i
) +var (w
i
)
=
1
1 +

2
w

2
x
=
1
1 +
Entonces

MCO
es inconsistente, excepto que
2
w
= 0, o sea en el caso que
no existe error de medida (o el mismo sea constante).
Notas:
1) El sesgo es hacia 0

p lim

MCO

< [[ por ello el sesgo por error de


medida se conoce tambin con el nombre de "sesgo de atenuacin"
2) El sesgo es mayor cuando mayor sea el ratio

2
w

2
x
FCCEEA, UDELAR () Econometra II Ao: 2012 41 / 72
Simultaneidad (Wooldridge, 16.2 Hayashi, 3.1)
La simultaneidad surge cuando al menos una de las variables explicativas
es determinada simultneamente con y. Si, digamos x
j
es determinada
parcialmente como una funcin de y, entonces x
j
y u estn en general
correlacionadas.
Por ejemplo, si y es la tasa de criminalidad en una ciudad y x
j
el tamao
de la fuerza de polica, este ltimo puede ser funcin de la tasa de
criminalidad. sta es una situacin conceptualmente difcil de analizar, ya
que debemos pensar en una situacin en que x
j
puede variar
exgenamente, an cuando en los datos que observamos y y x
j
son
generadas simultneamente.
FCCEEA, UDELAR () Econometra II Ao: 2012 42 / 72
Un modelo simple de oferta y demanda ilustra el caso:
q
d
i
=
0
+
1
p
i
+u
i
(demanda)
q
s
i
=
0
+
1
p
i
+v
i
(oferta)
Los trminos u
i
y v
i
desplazan cada una de las curvas as representan el
conjunto de otras inuencias adems del precio en cada curva. Suponemos
que E (u
i
) = E (v
i
) = 0 as como el equilibrio del mercado:
q
s
i
= q
d
i
(una tercera ecuacin que reduce el sistema a dos ecuaciones).
FCCEEA, UDELAR () Econometra II Ao: 2012 43 / 72
q
i
=
0
+
1
p
i
+u
i
(demanda)
q
i
=
0
+
1
p
i
+v
i
(oferta)
La idea de endogeneidad es que un regresor no satisface la condicin de
ortogonalidad con el trmino de error (si existe una constante en el
modelo, cuando est correlacionado con el trmino de error). En este caso,
en ambas ecuaciones p
i
est correlacionado con el trmino de error.
FCCEEA, UDELAR () Econometra II Ao: 2012 44 / 72
Resolviendo para q
i
, p
i
se obtiene:
p
i
=

0

0

1

1
+
v
i
u
i

1

1
q
i
=

1

0

0

1

1
+

1
v
i

1
u
i

1

1
El regresor p
i
es una funcin de ambos trminos de error. Cov (p
i
, v
i
) ,= 0
y Cov (p
i
, u
i
) ,= 0. En este ejemplo la endogeneidad resulta del equilibrio
de mercado.
FCCEEA, UDELAR () Econometra II Ao: 2012 45 / 72
Variables instrumentales (Wooldridge, 15.1 a 15.6)
Variables instrumentales y variables aproximadas (en el caso de
omisin una variable inobservable)
Para el caso de variables relevantes omitidas dos soluciones pueden llegar a
ser vlidas: utilizar variables proxy o utilizar variables instrumentales. Es
importante notar que la naturaleza de ambas variables es muy diferente
En el caso de variables aproximadas se sustituye la variable
inobservable por la variable PROXY que deseablemente debe estar
MUY CORRELACIONADA CON LA VARIABLE INOBSERVABLE.
Cuando se cuenta con una variable PROXY se sustituye la variable
inobservable por sta y se estima el modelo por MCO.
En el caso del mtodo de las variables instrumentales la variable
inobservable pasa a formar parte del error y necesitamos instrumento
que cumpla con varias condiciones (que veremos ms adelante) una
condicin es que debe estar INCORRELACIONADA CON LA
VARIABLE INOBSERVABLE.
FCCEEA, UDELAR () Econometra II Ao: 2012 46 / 72
Variables instrumentales
En el caso de modelos estimados por el mtodo VI se observan tres tipos
de variables (adems de la dependiente):
regresor(es) no correlacionado(s) con el error
regresor(es) correlacionado(s) con el error
el/los instrumentos.
FCCEEA, UDELAR () Econometra II Ao: 2012 47 / 72
Variables instrumentales
Consideremos un modelo
y
i
= x
/
i
+u
i
x
/
i
= (1, x
1i
, x
2i
, .....x
ki
)
cov(x
ji
, u
i
) = 0 para algun(os) j
cov(x
ji
, u
i
) ,= 0 para otro(s) j (supongamos j = k)
Tengo una muestra y
i
, x
i
, w
i

i =1,2....N
Un instrumento (z)ser una variable que no est incluida en el modelo
original (por ejemplo pertenece a w) y que cumple con las siguientes
condiciones:
no est correlacionada con el trmino de error del modelo de regresin
que quiero estimar (esto, en general, no podr ser contrastado
empricamente)
est correlacionada con la variable independiente que presenta el
problema de endogeneidad (si se puede contrastar empricamente)
FCCEEA, UDELAR () Econometra II Ao: 2012 48 / 72
Variables instrumentales
Errores de medida
Supongamos ahora que tenemos
y
i
= x
+
i
+u
i
i = 1, 2, .....N
E(u
i
[ x
+
i
) = 0
V(u
i
[ x
+
i
) =
2
u
Pero slo puedo observar x
i
sujeto a error de medida,
x
i
= x
+
i
+w
i
Suponemos que w
i
est incorrelacionado tanto con x
+
i
como con u
i
.
Entonces el modelo, expresado en trminos de las variables observables
ser
y
i
= x
i
+ (u
i
w
i
)
= x
i
+
i
FCCEEA, UDELAR () Econometra II Ao: 2012 49 / 72
Variables instrumentales
Ejemplo de un instrumento: tengo una segunda medicin de la variable en
cuestin, tambin con error, pero que el error de medida de la primera y la
segunda medicin son independientes. Supongamos entonces que
z
i
= x
+
i
+h
i
con cov(h
i
, x
+
i
) = cov(h
i
, w
i
) = cov(h
i
, u
i
) = 0.
El estimador por variables instrumentales ser:
p lim

IV
=
cov(z
i
, y
i
)
cov(z
i
, x
i
)
=
cov [x
+
i
+h
i
, x
+
i
+u
i
]
cov(x
+
i
+h
i
, x
+
i
+w
i
)
=
FCCEEA, UDELAR () Econometra II Ao: 2012 50 / 72
El mtodo de variables instrumentales (VI) proporciona una solucin
general al problema de la presencia de una variable explicativa endgena.
Para usar el mtodo de VI necesitamos de una variable adicional z, que no
est presente en la ecuacin original y que satisfaga dos condiciones
bsicas. En primer lugar deber estar incorrelacionada con el error de la
ecuacin a estimar:
Cov (z, u) = 0
En otras palabras, como x
1
, x
2
,..., x
K1
, z deber ser exgena en la
ecuacin a estimar
FCCEEA, UDELAR () Econometra II Ao: 2012 51 / 72
El segundo requerimiento se reere a la relacin entre z y la variable
endgena x
K
. La manera precisa de establecerlo se reere a la regresin de
x
K
en todas las variables exgenas (esta regresin suele denominarse
"modelo de forma reducida":
x
k
=
0
+
1
x
1
+
2
x
2
+ ... +
k1
x
k1
+z
/
+v
k
en que por denicin E (u
K
[ x
1,....
x
k1
, z) = 0. Lo que se requiere es
Rechazar Ho: = 0
No rechazar H1: ,= 0
FCCEEA, UDELAR () Econometra II Ao: 2012 52 / 72
Este requerimiento se suele enunciar en forma laxa diciendo "z debe estar
correlacionada con x
K
". En realidad el enunciado ,= 0 est indicando
algo ms, es decir que z est correlacionada con x
K
una vez que la
inuencia de x
1
, x
2
,..., x
K1
, ha sido tomada en cuenta.
No se pone restricciones sobre la distribucin de z y x
K
. Pueden ser
ambas continuas, o una o ambas ser variables discretas.
Cuando z cumple con ambas condiciones, se dice que es una candidata a
variable instrumental (o instrumento) para x
K
.
FCCEEA, UDELAR () Econometra II Ao: 2012 53 / 72
Las variables x
1
, x
2
,..., x
K1
, se suponen incorrelacionadas con u, y en ese
sentido son sus propios instrumentos en la ecuacin.
La lista completa de instrumentos en realidad es la lista de todas las
variables exgenas, aunque usualmente se hace referencia al instrumento
para la variable endgena.
FCCEEA, UDELAR () Econometra II Ao: 2012 54 / 72
Variables instrumentales (caso exactamente identicado)
En modelo de regresin mltiple, tenemos
un vector de regresores X de dimensin k,
un vector de instrumentos Z de dimensin r=k, entonces estamos en
un caso exactamente identicado

IV
=
_
Z
/
X

1
Z
/
Y
V(

IV
) =
2
_
Z
/
X

1
Z
/
Z
_
X
/
Z

1
Es importante notar que si tengo menos instrumentos (r) que regresores
(k) no podr realizar la estimacin.
FCCEEA, UDELAR () Econometra II Ao: 2012 55 / 72
Si el nico regresor endgeno es x
k
y hay un nico instrumento z
k
entonces
Z =
_

_
1 z
11
z
k1,1
z
k,1
1 z
12
z
k1,2
z
k,2
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
1 z
1N
z
k1,N
z
k,N
_

_
=
_

_
1 x
11
x
k1,1
z
k,1
1 x
12
x
k1,2
z
k,2
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
1 x
1N
x
k1,N
z
k,N
_

_
es decir algunas columnas de la matriz Z pueden coincidir con columnas
de la matrix X, esto se da para las x exgenas (a veces se dice que son sus
propios instrumentos).
FCCEEA, UDELAR () Econometra II Ao: 2012 56 / 72
Mtodo de los momentos
E(u
i
[Z ) = 0 =
E(u
i
) = E(y
i

0

1
x
1i
.....
k
x
ki
) = 0
E(x
1i
u
i
) = E [x
1i
(y
i

0

1
x
1i
.....
k
x
ki
)] = 0
E(x
2i
u
i
) = E [x
2i
(y
i

0

1
x
1i
.....
k
x
ki
)] = 0
.
.
.
E(z
ki
u
i
) = E [z
ki
(y
i

0

1
x
1i
.....
k
x
ki
)] = 0
FCCEEA, UDELAR () Econometra II Ao: 2012 57 / 72
Si se cuenta con una muestra iid y
i
, x
i
, z
i

i =1,...N
es posible utilizar el
principio de analoga:
Anlogo muestral
E(u
i
) = 0
ppio analoga

1
N
N

i =1
(y
i

1
x
1i
.....

k
x
ki
) = 0
E(x
1i
u
i
) = 0
ppio analoga

1
N
N

i =1
x
1i
(y
i

1
x
1i
.....

k
x
ki
) = 0
E(x
2i
u
i
) = 0
ppio analoga

1
N
N

i =1
x
2i
(y
i

1
x
1i
.....

k
x
ki
) = 0
.
.
.
E(z
ki
u
i
) = 0
ppio analoga

1
N
N

i =1
z
ki
(y
i

1
x
1i
.....

k
x
ki
) = 0
FCCEEA, UDELAR () Econometra II Ao: 2012 58 / 72
Variables instrumentales (caso sobreidenticado)
Si tengo ms intrumentos que regresores
un vector de regresores X de dimensin k,
un vector de instrumentos Z de dimensin r>k, entonces estamos en
un caso sobreidenticado
FCCEEA, UDELAR () Econometra II Ao: 2012 59 / 72
Mtodo de los momentos
Momentos poblacionales
E(u
i
[Z ) = 0 =
E(u
i
) = E(y
i

0

1
x
1i
.....
k
x
ki
) = 0
E(z
1i
u
i
) = E [z
1i
(y
i

0

1
x
1i
.....
k
x
ki
)] = 0
E(z
2i
u
i
) = E [z
2i
(y
i

0

1
x
1i
.....
k
x
ki
)] = 0
.
.
.
E(z
ri
u
i
) = E [z
ri
(y
i

0

1
x
1i
.....
k
x
ki
)] = 0
FCCEEA, UDELAR () Econometra II Ao: 2012 60 / 72
Si se cuenta con una muestra iid y
i
, x
i
, z
i

i =1,...N
es posible utilizar el
principio de analoga:
Anlogo muestral
E(u
i
) = 0
ppio analoga

1
N
N

i =1
(y
i

1
x
1i
.....

k
x
ki
)
E(z
1i
u
i
) = 0
ppio analoga

1
N
N

i =1
z
1i
(y
i

1
x
1i
.....

k
x
ki
)
E(z
2i
u
i
) = 0
ppio analoga

1
N
N

i =1
z
2i
(y
i

1
x
1i
.....

k
x
ki
)
.
.
.
E(z
ri
u
i
) = 0
ppio analoga

1
N
N

i =1
z
ri
(y
i

1
x
1i
.....

k
x
ki
)
Si r > k tengo ms ecuaciones que parmetros: no podr igualar a 0 todas
las ecuaciones: usar MC2E o Mtodo Generalizado de los Momentos
FCCEEA, UDELAR () Econometra II Ao: 2012 61 / 72
En el caso sobreidenticado la frmula matricial del estimador VI es,

IV
=
_
X
/
Z(Z
/
Z)
1
Z
/
X

1
X
/
Z(Z
/
Z)
1
Z
/
Y
V(

IV
) =
2
_
X
/
Z(Z
/
Z)
1
Z
/
X

1
Este estimador tambin puede interpretarse como el estimador de mnimos
cuadrados en dos etapas MC2E
FCCEEA, UDELAR () Econometra II Ao: 2012 62 / 72
Variables instrumentales: Mnimos Cuadrados en 2 Etapas (MC2E)
ETAPA 1: Regresar X sobre Z utilizando MCO y obtener una prediccin
de X :

X = Z
ETAPA 2: Regresar Y sobre

X utilizando MCO y obtener

MC2E
=
_

X
/

X
_
1

X
/
Y
Notar que

X = Z = Z [Z
/
Z]
1
Z
/
X
Se puede probar que esto es equivalente estimar por VI la ecuacin original
utilizando como instrumento para X,

X, aqu

MC2E
=
_

X
/
X
_
1

X
/
Y,
esto es debido que

X
/

X = X
/
Z [Z
/
Z]
1
Z
/
X =

X
/
X.
FCCEEA, UDELAR () Econometra II Ao: 2012 63 / 72
Mnimos Cuadrados en 2 Etapas (MC2E)
NOTAS sobre el estimador MC2E:
1) No es correcto obtener la varianza del estimador

MC2E
a travs de los
errores estndar de la segunda etapa.
2) Si no hay intrumentos vlidos para los regresores endgenos (variables a
instrumentar) los parmetros no estarn identicados
3) Si hay instrumentos vlidos pero debilmente correlacionados con las
variables a instrumentar el estimador tendr poca precisin.
4) El mtodo Generalizado de los Momentos (MGM) se utiliza como
alternativa ms eciente que MC2E (no lo veremos en el curso)
FCCEEA, UDELAR () Econometra II Ao: 2012 64 / 72
Propiedades de los estimadores VI/MC2E
a) CONSISTENCIA Si se cumple E(u
i
[Z ) = 0 el estimador VI/MC2E
ser sesgado en pequeas muestras pero consistente
b) EFICIENCIA El estimador VI/MC2E ser ineciente con relacin al
MCO, pero la comparacin tiene sentido slo bajo los supuestos
E(u
i
[X ) = 0 y E(u
i
[Z ) = 0. En dicho caso (considerando el MRLS y
bajo el supuesto E( uu
/
[X, Z ) =
2
I ) las varianzas asintticas estarn
dadas por
Var
_

jMCO
_
=

2
u
N
2
x
_ Var
_

jVI
_
=

2
u
N
2
x

2
zx
donde
2
zx
[0, 1] es el cuadrado de la correlacin entre x y z
c) NORMALIDAD ASINTTICA: El estimador

VI
/

MC2E
es
asintticamente normal bajo condiciones generales (no se requiere
normalidad de los errores)
En resumen: necesitaremos muestras grandes para poder hacer inferencia a
travs del estimador VI o MC2E, y slo se utilizar este estimador en el
caso que no se satisfaga el supuesto de exogeneidad de los regresores. En
caso contrario se utiliza MCO que es eciente.
FCCEEA, UDELAR () Econometra II Ao: 2012 65 / 72
Contraste de Hausman (Wooldridge 15.5)
Hay varios contrastes que permiten someter a prueba la exogeneidad de los
regresores. En este curso slo veremos el contraste de Hausman.
Hausman (1978) propuso un test que permite contrastar la presencia de
problemas de endogeneidad en los regresores. En trminos bien generales
el contraste es el siguiente.
Tengo dos estimadores:

E
es un estimador consistente y eciente bajo la hiptesis nula (por
ejemplo MCO en una regresin lineal de un modelo homocedstico, bajo la
hiptesis de no correlacin entre las x y el error) pero inconsistente bajo la
hiptesis alternativa

R
es un estimador consistente tanto bajo la hiptesis nula como bajo la
hiptesis alternativa, pero (probablemente) menos eciente (por ejemplo
VI) que

E
bajo la nula
FCCEEA, UDELAR () Econometra II Ao: 2012 66 / 72
Contraste de Hausman
Ho:

E
consistente y eciente,

R
consistente
H1:

E
inconsistente,

R
consistente
Hausman demostr que este contraste se puede realizar a travs del
estadstico
h =
_

E
_
/
_

V
_

E
__
1
_

E
_
(1)
=
_

E
_
/
_

V
_

R
_


V
_

E
__
1
_

E
_
y que este estadstico se distribuye asintticamente (bajo la hiptesis nula)
como una
2
k
.
FCCEEA, UDELAR () Econometra II Ao: 2012 67 / 72
Hausman aplicado a los estimadores MCO y VI (MC2E):

E
=

MCO

R
=

MC2E
Los grados de libertad de la distribucin chi-cuadrado corresponden a la
dimensin del vector
_

E
_
.
FCCEEA, UDELAR () Econometra II Ao: 2012 68 / 72
Contraste de Hausman (procedimiento alternativo)
Consideremos un modelo
y
i
= x
/
i
+u
i
x
/
i
= (1, x
1i
, x
2i
, .....x
ki
)
cov(x
ji
, u
i
) = 0 para j < k
cov(x
ji
, u
i
) ,= 0 para j = k
Tengo una muestra y
i
, x
i
, z
i

i =1,2....N
FCCEEA, UDELAR () Econometra II Ao: 2012 69 / 72
Para realizar Contraste de Hausman procedo en dos etapas:
Etapa 1:
Regreso por MCO x
k
sobre todas las variables exgenas (modelo
reducido):
x
k
=
0
+
1
x
1
+
2
x
2
+ ... +
k1
x
k1
+z
/
+v
k
obtengo
x
ki
=
0
+
1
x
1i
+
2
x
2i
+ ... +
k1
x
k1i
+z
/
i

v
ki
= x
ki
x
ki
FCCEEA, UDELAR () Econometra II Ao: 2012 70 / 72
Etapa 2:
Regreso por MCO:
y =
0
+
1
x
1
+
2
x
2
+ ... +
k1
x
k1
+
k
x
k
+ v
k
+u
k
El contraste de Hausman consiste en probar la signicacin de v
k
Ho : = 0
H
1
: ,= 0
Si rechazo Ho, tengo evidencia que me permite armar que x
k
es endgena
y por lo tanto es recomendable utilizar VI para la estimacin del modelo.
Nota: La validez del contraste de Hausman requiere del cumplimiento del
supuesto de homocedasticidad y ausencia de correlacin de los errores del
modelo a estimar.
FCCEEA, UDELAR () Econometra II Ao: 2012 71 / 72
Bibliografa:
*** Wooldridge, J. M. (2001) Introduccin a la Econometra: un enfoque
moderno, Thomson Learning, Mxico. (2a. Edicin en espaol, 2006).
Captulo 9 (9.2 y 9.3), Captulo 15.
** Hayashi, F. (2000) Econometrics, Princeton University Press. Captulo
3 (3.1).
** Card, D. (1995) "Using Geographic Variation in College Proximity to
Estimate the Return to Schooling," in Aspects of Labour Market Behavior:
Essays in Honour of John Vanderkamp, ed. L. N. Christophides, E.K.
Grant, and R. Swidinsky. Toronto: University of Toronto Press, 201222.
* Cameron A. C. y P.K. Trivedi (2009) Microeconometrics Using Stata,
Stata Press. Captulo 6.
* Wooldridge, J. (2002) Econometric Analysis of Cross Section and Panel
Data, MIT Press. Captulo 4 (4.3 y 4.4) y Captulo 5 (5.1 y 5.3).
* Greene, W. H. (1999) Anlisis Economtrico. 3a. Edicin. Prentice Hall
Iberia, Madrid. Captulo 9.
FCCEEA, UDELAR () Econometra II Ao: 2012 72 / 72

Anda mungkin juga menyukai