Anda di halaman 1dari 17

UCEMA

Econometra Aplicada
Variables Instrumentales
Motivacin
Muchos modelos econmicos implican endogeneidad: esto es una relacin terica que
no encaja exactamente dentro del esquema de regresin de Y contra X, en el cual
suponemos que la variable Y es determinada (pero no de manera conjunta) con X.
n e!ecto, los conceptos simples de demanda " o!erta en micro o la !uncin consumo
#e"nesiana en macro son relaciones de este tipo donde al menos una de las variables
explicativas es endgena o determinada conjuntamente con la variable dependiente.
$esde un punto de vista matem%tico las di!icultades que esta endogeneidad causa para
el an%lisis econom&trico son similares a las que se generan en el contexto de variables
omitidas o errores en las variables o errores de medida en las variables X.
n estos casos M'( no genera estimadores consistentes de los par%metros de inter&s.
)rataremos una solucin general al problema de regresores endgenos que tambi&n
puede ser convenientemente aplicada en otros contextos como el de variables omitidas
(o errores de medida).
l concepto general es el de estimador de variables instrumentales (*+). ,na !orma
bastante -popular. de este estimador habitualmente utili/ada en el contexto de
endogeneidad es conocida como m0nimos cuadrados en dos etapas ()121).
3ara motivar el problema, consideremos el caso de variables omitidas: por ejemplo el
caso de una ecuacin de salarios que correctamente especi!icada ser0a:
sta ecuacin no puede ser estimada porque la habilidad (abil) no es observada. 1i
tuvi&ramos una 3rox" disponible para esta variable podr0amos sustituirla por abil "
entonces la calidad de esta ecuacin depender% de la medida en que tengamos una buena
3rox". 1i simplemente ignoramos abil, entones pasar% a !ormar parte del t&rmino de
error en la especi!icacin:
1i abil " educ est%n correlacionadas M'( genera estimadores sesgados e inconsistentes.
3ara estimar de manera consistente esta ecuacin necesitamos una variable
instrumental: una nueva variable que satis!aga ciertas propiedades particulares.
1upongamos que tenemos una variable / que no est% correlacionada con u pero que si
est% correlacionada con educ. ,na variable que satis!ace estas dos condiciones es una
variable instrumental par educ.
3odemos sinteti/ar los requisitos en :
4. / no est% correlacionada con u:
'ov (/, u)56
4
sto se resume diciendo que / es exgena en la ecuacin " se denomina exogeneidad
del instrumento.
n un contexto de variables omitidas esto signi!ica que / no debe tener ning7n e!ecto
parcial sobre " (despu&s de que x " las variables omitidas se han controlado) " / no debe
estar correlacionada con las variables omitidas.
8. 'ov (/,x) 9 6 . sto implica que / debe estar relacionada positiva o negativamente
con la variable endgena x. sta condicin se conoce como relevancia del
instrumento
:o es posible testear a priori el primer supuesto dado que no observamos u, pero
podemos testear el 7ltimo supuesto (la correlacin de / con educ) simplemente haciendo
la regresin de la variable incluida sobre el instrumento.
n esta regresin podemos !%cilmente testear la ;6:
4
56. st% claro que no ha" una
eleccin 7nica de instrumento en este caso. s decir, muchas variables pueden cumplir
con ambas condiciones de no estar correlacionadas con !actores no observables que
in!luencian el salario " correlacionadas con educacin.
s importante notar que no estamos buscando por una 3rox" de abil: si tuvi&ramos una
3rox" esta no ser0a una buena *+, dado que la correlacin con abil implicar% correlacin
con el proceso estoc%stico de error u.
<u& es lo que buscamos entonces: por ejemplo algo as0 como el nivel de educacin de la
madre o el n7mero de hermanos podr0an ser un instrumento v%lido. 1i determinamos
que tenemos un instrumento ra/onable, la cuestin ahora es como usarlo.
1i volvemos a la ecuacin mal especi!icada " la escribimos en t&rminos generales de Y
" X.
1i tomamos la covariancia de cada t&rmino en la ecuacin con nuestro instrumento /:
$onde hacemos uso del hecho de que la covariancia con una constante es cero. $ado
que por supuesto el instrumento no debe estar correlacionado con el t&rmino de error, u,
el 7ltimo t&rmino tiene esperan/a cero " entones podemos resolver esta ecuacin para
obtener un estimador de
4
.

ste estimador tiene un caso especial cuando x5/, esto es cuando la variable explicativa
puede servir como su propio instrumento. 2o cual es correcto si : 'ov(x= u) 5 6.
8
n este caso particular el estimador puede ser interpretado como el estimador M'(.
ntonces M'( es un caso particular de *+, que !unciona cuando el supuesto de
exogeneidad de las x puede ser sostenido.
3odemos notar tambi&n que el estimador *+ es consistente en la medida en que los dos
supuestos sobre las propiedades del instrumento se satis!agan.
s decir plim(b
4
)5
4
.
1i alguno de los supuestos !alla , los estimadores *+ no ser%n consistentes.
s importante notar que el estimador *+ no es un estimador insesgado. sto implica que
en muestras peque>as el sesgo puede ser importante, lo que hace pre!erir muestras
grandes cuando se utili/a esta t&cnica.
Inferencia con el estimador IV
3ara reali/ar in!erencia suponemos que el error es homosced%stico: en este caso,
condicional a la variable instrumental /, no a la incluida x.
(u
8
?/) 5
8
5 +ar(u)
'on este supuesto adicional es posible derivar la variancia asinttica del estimador *+:
+ar(b
4
)

5
8
@ n
2
x

8
x,/
$onde n es el tama>o de la muestra,
8
x
es la varian/a poblacional de x.

8
x,/
es el cuadrado de la correlacin poblacional entre x " / (el A
8
).
'omo en el estimador M'( la varian/a asinttica del estimador +* disminu"e con el
tama>o de la muestra (a la tasa 4@n).
1e observa que a medida que la correlacin entre x " / aumenta, la varian/a disminu"e.
ntonces un estimador *+ generad por un -mejor. instrumento ser% m%s preciso
(condicional a la correlacin cero con u).
:ote tambi&n que esta varian/a debe exceder la del estimador M'(, dado que
6 B
8
x,/
B4.
n el caso particular en que la variable x sirve como su propio instrumento, entonces la
correlacin al cuadrado es uno (M'().
l estimador *+ siempre tendr% varian/a asinttica ma"or que M'( pero esto
simplemente re!leja el hecho de la introduccin de una !uente adicional de
incertidumbre a trav&s de un instrumento imper!ectamente correlacionado con la
variable x.
Qu pasa si usamos IV con un instrumento dbil o pobre?
,na correlacin d&bil entre x " / aumentar% el sesgo del estimador. 1i ha" alguna
correlacin entre / " u, entonces una correlacin d&bil implicar% estimadores *+
inconsistentes.
Cunque no podemos observar la correlacin entre / " u, podemos emp0ricamente
evaluar la correlacin entre las variables explicativas " su instrumento, " esto siempre
debe hacerse.
$ebe notarse tambi&n que una medida del A8 en el contexto de *+ no es -el porcentaje
de la variacin explicada. como en M'(. n presencia de correlacin entre x " u no es
D
posible descomponer la varian/a de " en dos partes independientes (11 " 11A) " el A8
no tiene una interpretacin natural.
jemplo:
Aendimiento de la educacin en mujeres casadas utili/ando el archivo Mro/.
stimamos una ecuacin de salario en !uncin de educacin
reg lw we if ww>0
Source | SS df MS Number of obs = 428
-------------+------------------------------ F( 1, 42! = "#$%
Model | 2#%241$% 1 2#%241$% &rob > F = 0#0000
'esidu(l | 1$)#001022 42 #4244%)1% '-s*u(red = 0#11)$
-------------+------------------------------ +d, '-s*u(red = 0#11"8
-o.(l | 22%#%2)441 42) #"2%01"084 'oo. MS/ = #800%
------------------------------------------------------------------------------
lw | 0oef# S.d# /rr# . &>|.| 1$"2 0o3f# 43.er5(l6
-------------+----------------------------------------------------------------
we | #10848) #014%$$8 )#"" 0#000 #080%4"1 #1%$"2%
7co3s | -#18"1$8 #18"22"$ -1#00 0#%18 -#"4$2)% #1)88)%
------------------------------------------------------------------------------
3odemos pensar que la educacin es una variable endgena. ,n instrumento puede ser
la educacin del padre. 3ara ello debe estar correlacionada con educacin " no
correlacionada con el t&rmino de error u.
;acemos la regresin de educacin contra educacin del padre
regress Ee E!ed i! EEF6
Source | SS df MS Number of obs = 428
-------------+------------------------------ F( 1, 42! = 88#84
Model | %84#841$8% 1 %84#841$8% &rob > F = 0#0000
'esidu(l | 184"#%"428 42 4#%%181)" '-s*u(red = 0#1)2
-------------+------------------------------ +d, '-s*u(red = 0#1)0
-o.(l | 22%0#1$2 42) "#222$420 'oo. MS/ = 2#081%
------------------------------------------------------------------------------
we | 0oef# S.d# /rr# . &>|.| 1$"2 0o3f# 43.er5(l6
-------------+----------------------------------------------------------------
wfed | #2$441 #028"8% $#4% 0#000 #21%2"%8 #%2"2$"
7co3s | 10#2%)0" #2)"$%% %)#10 0#000 $#$48" 10#))$42
C partir de esta regresin podemos ver la relevancia de E!ed como instrumento.
2uego podemos estimar por *+:
ivreg l !e"fed# if $%& first
(la opcin !irst permite ver el primer (21 entre la variable endgena " el instrumento)
Firs.-s.(ge regressio3s
-----------------------
Source | SS df MS Number of obs = 428
-------------+------------------------------ F( 1, 42! = 88#84
Model | %84#841$8% 1 %84#841$8% &rob > F = 0#0000
'esidu(l | 184"#%"428 42 4#%%181)" '-s*u(red = 0#1)2
-------------+------------------------------ +d, '-s*u(red = 0#1)0
G
-o.(l | 22%0#1$2 42) "#222$420 'oo. MS/ = 2#081%
------------------------------------------------------------------------------
we | 0oef# S.d# /rr# . &>|.| 1$"2 0o3f# 43.er5(l6
-------------+----------------------------------------------------------------
wfed | #2$441 #028"8% $#4% 0#000 #21%2"%8 #%2"2$"
7co3s | 10#2%)0" #2)"$%% %)#10 0#000 $#$48" 10#))$42
------------------------------------------------------------------------------
Instrumental variables (2SLS) regression
Source | SS df MS Number of obs = 428
------------------------------------------- !( "# 42$) = 2%84
Model | 2&%8$'($&$ " 2&%8$'($&$ )rob * ! = &%&+2+
,esidual | 2&2%4$&&8 42$ %4'-2-84&4 ,-s.uared = &%&+(4
------------------------------------------- /d0 ,-s.uared = &%&+"(
1otal | 22(%(2'44" 42' %-2(&"-&84 ,oot MS2 = %$8+(+
------------------------------------------------------------------------------
l3 | 4oef% Std% 2rr% t )*|t| 5+-6 4onf% Interval7
-----------------------------------------------------------------------------
3e | %&-+"'(- %&(-"4"8 "%$8 &%&+( -%&&+8++4 %"2824$(
8cons | %44""&(4 %44$"&"8 &%++ &%(2( -%4(-'("2 "%("'+(8
------------------------------------------------------------------------------
Instrumented9 3e
Instruments9 3fed
------------------------------------------------------------------------------
Chora vemos que los rendimientos a la educacin son aproximadamente la mitad de los
estimados por M'(.
Estimacin de IV en el modelo de regresin m'ltiple
Aevisin del problema de omisin de variable
1abemos que la omisin de una variable explicativa relevante en general provoca un
sesgo tanto en la estimacin de los coe!icientes como en la de la varian/a del t&rmino
de perturbacin. n consecuencia, los procedimientos de contrastacin de hiptesis
proporcionan in!erencias errneas.
1upongamos que el modelo correcto es:
1in embargo se estima
l estimador M'( de este modelo es
M'(
5 (xH x)
I4
xH".
1i ahora sustituimos el vector " por la expresin correspondiente al modelo correcto:
J
3ara calcular el sesgo de este estimador debemos obtener la esperan/a de la anterior
expresin:
1i el estimador !uera insesgado debe cumplirse que:
2a segunda de las esperan/as que componen la anterior expresin ser0a nula si las
variables incluidas !ueran exgenas, (xH) 5 6.
2a primera, por el contrario, no lo ser% a menos que las variables incluidas (x) "
excluidas (/) sean ortogonales, (xH/) 5 6, un supuesto que, como sabemos de la
discusin del problema de multicolinealidad, es poco probable en conom0a. 1i no se
cumple, el estimador M'( estar% sesgado.
Clgo parecido ocurre con la estimacin de la varian/a del t&rmino de perturbacin. 1i
denotamos con la letra v los errores muestrales del modelo propuesto una estimacin de
la varian/a es:
Y su esperan/a es:
l numerador del segundo t&rmino es el aumento en la suma de los cuadrados de los
residuos provocado al eliminar la variable relevante. 1e trata, por lo tanto, de un valor
positivo, lo que supone que la estimacin del t&rmino de perturbacin est% sesgada
-hacia arriba..
El problema de la Endogeneidad
n conometr0a se aplica a cualquier situacin en la que una variable explicativa est%
correlacionada con el t&rmino de error.
K
2a aparicin de endogeneidad en nuestros modelos puede tener tres grandes causas:
heterogeneidad inobservable, errores de medida " simultaneidad.
L ;eterogeneidad inobservable.
sta expresin se re!iere al hecho de que los individuos de una poblacin pueden di!erir
entre ellos en caracter0sticas que no son observadas por el investigador " que, en
consecuencia, son omitidas de la especi!icacin del modelo.
1ea q esta caracter0stica gen&rica no observada. (bviamente, siempre podr0amos estimar
(" M x), pero los resultados de nuestra estimacin podr0an tener poco que ver con las
relaciones que de!inen (" M x, q).
'omo vimos un ejemplo cl%sico de heterogeneidad inobservable lo constitu"e la
habilidad (no observada) de los individuos en una ecuacin de salarios.
n la medida en que la habilidad quede integrada en el termino de perturbacin del
modelo su correlacin con otros !actores explicativos como la educacin puede
provocar la endogeneidad de estos !actores.
rrores de medida.
'uando la variable observada (x) slo es una medida imprecisa de la variable de inter&s
(xN) la di!erencia entre ambas constitu"e un error de medida (eN).
1i este error esta correlacionado con la variable observada, 'ov (x, eN) 9 6, esta ser%
endgena.
*maginemos, por ejemplo, que la tasa marginal de impuestos es uno de los
determinantes del consumo de un bien pero la in!ormacin de la que disponemos se
re!iere a la tasa promedio. 1i los individuos con ma"or al0cuota media est%n asociados
con ma"ores errores de medida respecto al marginal, entonces la correlacin entre el
tipo medio " el t&rmino de perturbacin del modelo no ser% nula.
L 1imultaneidad. 2a determinacin simultanea de la variable dependiente " alguna
explicativa provoca que la correlacin entre esta dependiente " el t&rmino de
perturbacin no sea nula.
Cs0, por ejemplo, uno de los determinantes de la demanda de un bien es su precio, pero
este a su ve/ viene determinado por la cantidad demandada. n consecuencia, el precio
es una variable endgena.
Oormalmente, q
d
5 !(pP.,
d
) " p 5 !(q
d
,P,
d
) , entonces cov (p,
d
) 9 6.
2os ejemplos previos muestran que en 7ltima instancia la endogeneidad no es m%s
que un error de especi!icacin.
1i pudi&ramos observar directamente xN, por ejemplo, no tendr0amos necesidad de
abandonar el marco anal0tico que de!ine el modelo de regresin lineal para tratar los
errores de medida.
)ambi&n, los ejemplos dan una idea de la multitud de relaciones econmicas que
pueden verse a!ectadas por este tipo de problemas.
2a correlacin entre regresores " perturbaciones es un problema grave porque, como se
mencion al discutir la heterogeneidad inobservable, a!ecta a la interpretacin del
modelo de regresin como una esperan/a condicional.
Aecordemos que esta interpretacin del modelo de regresin como una esperan/a
condicional es la que nos permite estimar efectos causales bajo el supuesto del ceteris
Q
paribus.
n concreto, bajo el supuesto de linealidad el vector mide el e!ecto causal de las
variables explicativas sobre la dependiente. 1in embargo, esto solo es cierto en la
medida en que (xH) 5 6.
1i esta condicin no se cumple, entonces todav0a corresponde a la esperan/a
condicional de " dadas las explicativas, pero "a no puede interpretarse como un e!ecto
causal porque la cl%usula del ceteris paribus en la que se sustenta esta interpretacin
slo se re!iere a las variables incluidas como explicativas, mientras que para poder
llevar a cabo una interpretacin causal tambi&n deber0a incluir a los inobservables.
Cdem%s, independientemente de cual sea la causa, la endogeneidad hace que el
estimador M'( sea sesgado (e inconsistente).
2a esperan/a matem%tica del estimador M'( es:
ntonces la insesgade/ se deriva directamente del supuesto de independencia entre x "
. 1i son independientes:
3ero dado que la media poblacional del t&rmino de error es cero, esto implica que el
estimador es insesgado.
1in embargo, cuando alguno de los regresores es endgeno se rompe esta propiedad.
*ntuitivamente, el problema es que el estimador M'( da m%s cr&dito a la variable
explicativa del que le corresponder0a. 'onsideremos, por ejemplo, el caso en el que la
correlacin entre regresor " perturbacin es positiva en un modelo de regresin lineal
simple. so signi!ica que cuando la perturbacin es grande (peque>a) la variable
dependiente tender0a a ser ma"or (menor) ", debido a la citada correlacin, tambi&n la
explicativa. n consecuencia, el coe!iciente asociado tiende a sobreestimar el verdadero
e!ecto de la explicativa sobre la dependiente.
sta interpretacin del problema sugiere un procedimiento para la obtencin de
estimadores consistentes en presencia de endogeneidad.
1upongamos que la variacin de las variables explicativas tiene dos componentes: una
R
parte que, por cualquier ra/n, esta correlacionada con el termino de perturbacin (esta
es la causa de nuestros problemas) " otra parte que no lo esta. 1i pudi&ramos aislar esta
parte no correlacionada podr0amos concentrarnos en ella para obtener nuestros
estimadores, desechando al mismo tiempo la parte correlacionada que
provoca el sesgo del estimador M'(.
2a cuestin entonces es como aislar la parte que nos interesa de la variacin de las x.
l denominado estimador de variables instrumentales utili/a variables adicionales
ajenas al modelo original (-los instrumentos.) para llevar a cabo este proceso de
separacin de los componentes correlacionados " no correlacionados de las variables
explicativas.
stos instrumentos o variables instrumentales, denotados con la letra /, deben cumplir
dos condiciones !undamentales:
L Aelevancia: 'ov (/, x) 9 6.
L xogeneidad: 'ov (/, ) 5 6.
(bs&rvese que si un instrumento es relevante su variacin estar0a relacionada con la
variacin de la explicativa.
3ero si adem%s es exgeno entonces la parte de variacin de la explicativa que captura
el instrumento slo corresponder0a a aquella que es exgena, es decir, a aquella que no
esta correlacionada con el termino de perturbacin.
)rasladar estas propiedades al contexto de la estimacin de los coe!icientes del modelo
de regresin supone de!inir un estimador de variables instrumentales en dos etapas.
n la primera etapa descompondremos la variable endgena que act7a como explicativa
en los componentes correlacionados " no correlacionados.
3ara ello empleamos una regresin entre la variable " el vector de instrumentos:
( " ) * v+
sta expresin de!ine la ecuacin en !orma reducida de la variable x, siendo ) el
componente de x no correlacionado con el termino de perturbacin (variacin de la
variable x explicada por el vector de instrumentos) " v el componente correlacionado
(variacin no explicada).
n la segunda etapa del procedimiento de estimacin explotaremos el componente de
x no correlacionado con el termino de perturbacin () ) " desecharemos el componente
correlacionado (v).
n concreto, lo que utili/aremos ser% la prediccin de la variable endgena explicativa
(en lugar de la variable original) obtenida a partir de las estimaciones M'( de los
coe!icientes de la ecuacin en !orma reducida (en principio, desconocidos).
ntonces la segunda etapa del procedimiento de estimacin consiste en estimar:
S
$onde hemos sustituido las variables explicativas endgenas por las predicciones de las
mismas obtenidas a partir de la estimacin M'( reali/ada en la primera etapa,

l estimador resultante se conoce como el stimador de M0nimos 'uadrados en $os
tapas (M'8) " la generali/acin del procedimiento descrito es sencilla.
1ea la regresin de inter&s:
en la que tenemos # variables explicativas endgenas " A variables explicativas
exgenas.
s decir, x 5Tx
U
,w
r
V.
3ara estimar consistentemente los # W A coe!icientes del modelo procedemos de
la siguiente !orma.
n la primera etapa estimaremos por M'( las ecuaciones en !orma reducida de las
variables explicativas endgenas,
Y obtenemos las correspondientes predicciones
n la segunda etapa del procedimiento estimamos la siguiente regresin por M'(
(bserve que el vector de instrumentos inclu"e las M variables instrumentales " las A
variables explicativas exgenas, / 5T/
m
,ErV.
;a" dos motivos para que esto sea as0. l primero es de 0ndole pr%ctica.
sta manera de proceder nos permite de!inir nuestro estimador de variables
instrumentales como:
gracias a que cada variable (columna) de x que apare/ca en el vector de instrumentos
ser% per!ectamente replicada en la estimacin de su !orma reducida.
46
Oormalmente

2a segunda ra/n es m%s !ormal desde el punto de vista estad0stico. l estimador +* as0
obtenido es el mas e!iciente, en el sentido de que su matri/ de varian/as " co varian/as
(asinttica) siempre ser% menor que la de cualquier otra combinacin de variables
(inclu"endo por lo tanto aquella que slo utili/a las /Xs) empleada para construir el
vector de instrumentos.
(tro aspecto a tener en cuenta es que el numero de instrumentos, M, debe ser ma"or
o igual que el numero de variables explicativas endgenas, #.
1e dice entonces que los coe!icientes del modelo est%n, respectivamente,
sobreidentificados !M $ ,# o e(actamente identificados !M " ,#.
n caso contrario los coe!icientes no est%n identi!icados: si # Y M entonces la matri/
)-( no es invertible " por lo tanto el estimador no se puede calcular.
*+ " )121
3ara derivar el c%lculo del estimador *+ a partir de :
" 5 x +
$e!inimos la matri/ de instrumentos / de la misma dimensin que x.
/H" 5 /Hx W /H
l supuesto de que / no est% relacionada con el error implica que 4@:(/Hu) se aproxima a
cero en probabilidad a medida que : aumenta. ntonces podemos de!inir el estimador

*+
/H" 5 /Hx
*+

*+
5 (/Hx)
I4
/H"
3ara de!inir el estimador )121 (M'( en dos etapas) consideramos el caso en el cual
tenemos un regresor endgeno " m%s de un potencial instrumento. )121 combina
m7ltiples instrumentos en un solo instrumento ptimo el cual puede ser utili/ado en el
estimador *+ simple
)121 no es m%s que el estimador *+ con una regla de decisin que reduce el n7mero de
instrumentos al n7mero exacto de instrumentos necesarios para estimar la ecuacin de
inter&s " completar la matri/ /.
$e!inamos la matri/ de instrumentos / de dimensin n x l, para l k.
44
ntonces la primera etapa de!ine los instrumentos como:
48
x z z z z x H ) H (
4

=
$enotamos la matri/ pro"eccin
/(/H/)
I4
/H 5 3
/
.
ntonces
y x x x
TSLS
H ) H (
4


=
5 ZxH/ (/H/)
I4
/Hx[
I4
ZxH/ (/H/)
I4
/H"[
5 (xH3
/
x)
I4
xH3
/
"
$onde el estimador )121 puede ser calculado utili/ando los datos de X, \ e ".
'uando l=k el estimador )121 se reduce a *+.
1e puede demostrar que este estimador de *+ es consistente " normalmente distribuido,
por lo que todos los procedimientos de in!erencia descritos para el estimador M'( son
per!ectamente validos. :o obstante, estas propiedades dependen en buena medida de
que los instrumentos sean e!ectivamente relevantes " exgenos.
2a relevancia de los instrumentos juega un papel an%logo al del tama>o muestral
en M'(: cuanto mas relevante es el vector de instrumentos, ma"or es la precisin del
estimador. n particular, la distribucin :ormal del estimador M'8 depende
directamente de la relevancia de los instrumentos. 3or lo tanto, el empleo de
instrumentos que expliquen poco la variabilidad de las variables explicativas endgenas
(instrumentos -d&biles.) puede a!ectar gravemente a la in!erencia (e incluso a la
consistencia del estimador, en casos extremos).
3ara el caso particular en el que slo tenemos una variable explicativa endgena se
puede demostrar que el estad0stico de la O de signi!icacin conjunta del modelo
proporciona una buena medida de la relevancia de los instrumentos. 1i el estad0stico
proporciona valores superiores a 46 podemos con!iar en que nuestros instrumentos son
su!icientemente relevantes= en caso contrario deber0amos interpretar nuestros contrastes
de signi!icacin individual con cuidado.
3or su parte, la no exogeneidad de los regresores tiene un impacto directo sobre la
consistencia del estimador M'8. 1i los instrumentos no son exgenos, entonces el
estimador empleado "a no ser% consistente.
ste es un resultado intuitivamente lgico, puesto que la motivacin para el uso de un
estimador de variables instrumentales era precisamente el tratar de capturar parte de la
variabilidad exgena de las x.
:o obstante, cuando los coe!icientes est%n exactamente identi!icados resulta imposible
construir un test para contrastar la hiptesis de exogeneidad. n cambio, si disponemos
de mas instrumentos que regresores entonces podemos emplear un -contraste de
restricciones sobreidenti!icadoras..
4D
*maginemos un modelo en el que slo disponemos de una variable explicativa endgena
" dos instrumentos (en otras palabras, no ha" variables explicativas exgenas en nuestro
modelo).
sto nos permitir0a obtener dos estimadores M'8, uno para cada instrumento.
(3recisamente esto explica por que no es posible emplear este contraste cuando los
coe!icientes est%n exactamente identi!icados: simplemente no es posible comparar
di!erentes estimadores basados en instrumentos alternativos).
1i ambos instrumentos !ueran exgenos, entonces ambos estimadores tender0an a ser
mu" parecidos. 3or el contrario, si !ueran mu" di!erentes lo interpretar0amos como una
evidencia de que alguno de ellos o ambos no son exgenos, aunque no podr0amos
determinar cual. n realidad, el contraste se constru"e impl0citamente sobre esta idea.
n la pr%ctica lo que explota es el hecho de que si los instrumentos son exgenos
entonces ser0an independientes de , por lo que si constru"o una regresin auxiliar entre
los errores de la estimacin M'8 " los instrumentos " variables exgenas explicativas
los coe!icientes asociados a los instrumentos no deber0an ser conjuntamente
estad0sticamente signi!icativos.
ntonces si los errores de la estimacin )121 son:
2a regresin auxiliar a estimar es:
1ea O
/
el valor del correspondiente estad0stico de ]ald para el contraste del conjunto de
restricciones lineales dado por
0
=
1
= ...

56.
^ajo la hiptesis nula de que todos los instrumentos son exgenos (" asumiendo que los
instrumentos no son d&biles " los errores homoscedasticos) el estad0stico
_ 5 M x O
/
1e distribu"e como una 'hi cuadrado con M ` # grados de libertad.
1i recha/amos esta hiptesis podemos tener dudas acerca de la adecuacin del conjunto
de instrumentos. ,no o m%s de los instrumentos podr0a estar no tener correlacin cero
con el error.
ste test conocido como de 1argan o ^asmann est% disponible en 1tata bajo el comando
overid (ha" que instalarlo como un adicional).
Identificacin de la Endogeneidad
3odemos preguntarnos acerca de la endogeneidad de una variable. 'mo detectarlaa
s posible emplear un estad0stico de ]ald del tipo:
4G
dH.Zvar(d)[
I4
.d b
8
donde
d 5
*+
I
M'(

var(d) 5 var(
*+
) ` var(
M'(
)
^ajo la hiptesis nula de exogeneidad de los regresores el estad0stico
; 5 (
*+
I
M'(
)H Z var(
*+
) ` var(
M'(
)[
I4
(
*+
I
M'(
)
1e distribu"e como una chi cuadrado con #WA grados de libertad
ste test se conoce como test de ;ausman de exogeneidad.
:o obstante, esta !orma del -test de ;ausman. en ocasiones no puede ser calculada:
bien porque la matri/ de varian/as " covarian/as no puede ser invertida de !orma
convencional o bien porque la di!erencia d resulta ser negativa.
,na !orma alternativa del test utili/a la siguiente regresin -aumentada.:
$onde v
k
es la matri/ de dimensiHon : c # con los residuos M'( de las regresiones de
las !ormas reducidas de cada variable explicativa endgena,
n este caso un simple contraste tipo O de signi!icacin conjunta de estas variables es
su!iciente para determinar la exogeneidad de las variables explicativas de nuestro
modelo.
l test de ;ausman puede ser reali/ado en 1tata estimando primero por ivreg.
2uego se invoca el comando
estimates store iv
(iv es el nombre donde van a guardarse los coe! estimados)
2uego se corre M'( con el comando regress
l test:
hausman iv ., constant sigmamore
E.emplo con rendimiento de educacin
stimamos salario en !uncion de experiencia, experiencia al cuadrado " educacin.
ducacin se instrumenta con educacin de padre " madre.
(ejemplo 4J.G6 ]ooldridge)
use 89:;eco3ome.ri(;/co3ome.ri( (<lic(d(;mro=#d.(8, cle(r
ge3 lw = log(ww!
4J
(%2" missi3g 5(lues ge3er(.ed!
ge3 (>s*= (>?(>
i5reg lw (> (>s* (we=wfed wmed! if ww>0, firs.
Firs.-s.(ge regressio3s
-----------------------
Source | SS df MS Number of obs = 428
-------------+------------------------------ F( 4, 42%! = 28#%
Model | 4)1#20$$8 4 11)#$0"2" &rob > F = 0#0000
'esidu(l | 1)"8#")"2 42% 4#1")%88%% '-s*u(red = 0#211"
-------------+------------------------------ +d, '-s*u(red = 0#2040
-o.(l | 22%0#1$2 42) "#222$420 'oo. MS/ = 2#0%$
------------------------------------------------------------------------------
we | 0oef# S.d# /rr# . &>|.| 1$"2 0o3f# 43.er5(l6
-------------+----------------------------------------------------------------
(> | #04"22"4 #0402"0) 1#12 0#22 -#0%%8$0$ #124%41)
(>s* | -#00100$1 #00120%% -0#84 0#402 -#00%%)44 #001%"2
wfed | #18$"484 #0%%)"" "#2 0#000 #12%1$)1 #2""8$$)
wmed | #1")"$) #0%"8$41 4#%$ 0#000 #08)044 #2281"01
7co3s | $#1024 #42"14 21#%4 0#000 8#241$ $#$41084
------------------------------------------------------------------------------
43s.rume3.(l 5(ri(bles (2S@S! regressio3
Source | SS df MS Number of obs = 428
-------------+------------------------------ F( %, 424! = 8#14
Model | %0#%0)42" % 10#1024)"2 &rob > F = 0#0000
'esidu(l | 1$%#02001" 424 #4""2%"88" '-s*u(red = 0#1%")
-------------+------------------------------ +d, '-s*u(red = 0#12$
-o.(l | 22%#%2)441 42) #"2%01"084 'oo. MS/ = #)4)1
------------------------------------------------------------------------------
lw | 0oef# S.d# /rr# . &>|.| 1$"2 0o3f# 43.er5(l6
-------------+----------------------------------------------------------------
we | #01%$ #0%14%) 1#$" 0#0"1 -#000%$4" #12%18)8
(> | #0441)04 #01%4%2" %#2$ 0#001 #01)))$ #0)0")2$
(>s* | -#0008$$ #000401) -2#24 0#02 -#00188" -#00010$4
7co3s | #048100% #400%281 0#12 0#$04 -#)%8))44 #8%4$)"
------------------------------------------------------------------------------
43s.rume3.ed: we
43s.rume3.s: (> (>s* wfed wmed
------------------------------------------------------------------------------
es.im(.es s.ore i5
# reg lw (> (>s* we if ww>0
Source | SS df MS Number of obs = 428
-------------+------------------------------ F( %, 424! = 2#2$
Model | %"#0222$) % 11#)40$8$ &rob > F = 0#0000
'esidu(l | 188#%0"144 424 #44411"$0 '-s*u(red = 0#1"8
-------------+------------------------------ +d, '-s*u(red = 0#1"0$
-o.(l | 22%#%2)441 42) #"2%01"084 'oo. MS/ = #42
------------------------------------------------------------------------------
lw | 0oef# S.d# /rr# . &>|.| 1$"2 0o3f# 43.er5(l6
-------------+----------------------------------------------------------------
(> | #041"" #01%1)"2 %#1" 0#002 #01"$) #0)4%%
(>s* | -#0008112 #000%$%2 -2#0 0#040 -#001"841 -#0000%82
we | #10)48$ #01414" )#0 0#000 #0)$8%) #1%"2$"
7co3s | -#"22040 #1$8%21 -2#% 0#00$ -#$124) -#1%1144
------------------------------------------------------------------------------
A(usm(3 i5 # , co3s.(3. sigm(more
4K
No.e: .Ae r(3B of .Ae differe3ced 5(ri(3ce m(.ri> (1! does 3o. e*u(l .Ae
3umber of coefficie3.s
bei3g .es.ed (4!C be sure .Ais is wA(. Dou e><ec., or .Aere m(D be
<roblems com<u.i3g .Ae
.es.# />(mi3e .Ae ou.<u. of Dour es.im(.ors for (3D.Ai3g u3e><ec.ed
(3d <ossiblD co3sider
sc(li3g Dour 5(ri(bles so .A(. .Ae coefficie3.s (re o3 ( simil(r
sc(le#
---- 0oefficie3.s ----
| (b! (E! (b-E! s*r.(di(g(F7b-F7E!!
| i5 # Giffere3ce S#/#
-------------+----------------------------------------------------------------
we | #01%$ #10)48$ -#040$% #02)40
(> | #0441)04 #041"" #0020%$ #001"1"
(>s* | -#0008$$ -#0008112 -#00008)8 #0000"2
7co3s | #048100% -#"22040 #")0140$ #%418$4
------------------------------------------------------------------------------
b = co3sis.e3. u3der 9o (3d 9(C ob.(i3ed from i5reg
E = i3co3sis.e3. u3der 9(, efficie3. u3der 9oC ob.(i3ed from regress
-es.: 9o: differe3ce i3 coefficie3.s 3o. sDs.em(.ic
cAi2(1! = (b-E!H1(F7b-F7E!I(-1!6(b-E!
= 2#)8
&rob>cAi2 = 0#0$"4
(F7b-F7E is 3o. <osi.i5e defi3i.e!
l test muestra evidencia a !avor de la endogeneidad de educacin.
4Q

Anda mungkin juga menyukai