Anda di halaman 1dari 52

Datos panel

Datos panel
Un conjunto de datos panel consiste de una
serie de tiempo para cada miembro en un
conjunto de datos de corte transversal.

La caracterstica que distingue los datos panel
de combinaciones de corte transversal es que
las mismas unidades (individuos, firmas,
pases, etc.) son seguidas sobre un periodo
de tiempo dado.

Por ejemplo, datos financieros y de inversin
del mismo conjunto de empresas durante un
periodo de cinco aos. O el historial de
salario, educacin y empleo para un conjunto
de individuos seguidos durante un perodo de
diez aos.
Datos panel
Observar las mismas unidades en distintos
periodos de tiempo trae ciertas ventajas sobre
datos de cortes transversal o combinaciones
de corte transversal:

Controlar ciertas caractersticas no
observadas de los individuos que son
constantes a travs del tiempo.

Estudiar el resultado de toma de decisiones
o el cambio en el tiempo de ciertos
comportamientos.


El Problema de la Variable No-observable
El modelo poblacional de efectos no-observables
est descrito por la ecuacin:
o E[y|x,c] = x
donde es una variable aleatoria no-observable.
Si para todo regresor , entonces
es otro factor no observable que puede ser
integrado en . En este caso, puede ser
estimado consistentemente a travs de MCO.
Si para algn regresor , entonces
introducir en el trmino no permite estimar
consistentemente a travs de MCO.







u c y + + = x
c
0 ) , cov( = c x
j
j
x
c
u

0 ) , cov( = c x
j j
x
c u
Ejemplo
Se tienen observaciones de 46 ciudades en
dos aos 1982 y 1987, en total 92
observaciones. Se quiere ver la relacin entre
la tasa de desempleo (Unem) y la tasa de
criminalidad (Crmrte).


d87: dummy igual a 1 si la observacin es de
1987.

c
i:
Efecto fijo de la ciudad, esto es factores que
afectan la tasa de criminalidad y no cambian
en el tiempo, por ejemplo, caractersticas
geogrficas de la ciudad. Tambin pueden ser
caractersticas demogrficas de la poblacin
que no cambien en 5 aos (edad, raza y
educacin).
it i it t it
u c unem d crmrte + + + + =
1 0 0
87 | o |
Ejemplo
Se encuentra un efecto positivo pero no
significativo estadsticamente, entre la tasa de
desempleo y la tasa de criminalidad. Esto
puede deberse a un problema de variables
omitidas que el estimador agrupado no
soluciona o a problemas de
heteroscedasticidad.
unem d crmrte 427 . 0 87 94 . 7 42 . 93 + + =
(12.74) (7.98) (1.118)
n=92, R
2
=0.012


Estimacin del modelo:
MCO agrupados (Pooled)
Sea el error compuesto. Entonces, de
acuerdo con el modelo lineal general, si
entonces el vector de

parmetros puede ser consistentemente
estimado mediante MCO. Esto por supuesto
implica que:


y







u c v + =
0 ] ' x [ E = v

(*) 0 ] ' x [ E = u
(**) 0 ] ' x [ E = c
Modelo Muestral de Efectos
No-observables

Para un corte transversal -que
denota un individuo-, sea una muestra
de variables aleatorias independientes e
idnticamente distribuidas(tipo pane). Entonces,
para cada individuo, el modelo muestral est
descrito por la ecuacin:


T
t it it
y
1
)} , {(
=
x
) ,..., 2 , 1 ( N i i =
T t u c y
it i it it
,..., 2 , 1 , = + + = x
MCO agrupados (Pooled)
Sea el error compuesto .Entonces, de
acuerdo con el modelo lineal general, si
entonces el vector de
parmetros puede ser consistentemente
estimado mediante MCO. Esto por supuesto
implica que:


y







it i it
u c v + =
) ,..., 2 , 1 ( 0 ] [ E T t v
it it
= =
'
x

(*) ) ,..., 2 , 1 ( 0 ] [ E T t u
it it
= =
'
x
(**) ) ,..., 2 , 1 ( 0 ] [ E T t c
i it
= =
'
x
MCO agrupados (Pooled)
Como el error compuesto .Entonces, si


Cov(v
it
, v
it
) =E(v
it
v
it
)=E((c
i
+ u
it
)(c
i
+ u
it
))
=E(c
i
c
i
)+ 2E(c
i
u
it
)+ E(u
it
u
it
)=

2
+

2


Cov(v
it
, v
is
) =E(v
it
v
is
)=E((c
i
+ u
it
)(c
i
+
u
is
))=E(c
i
c
i
)+ 2E(c
i
u
it
)+ E(u
it
u
is
)=

2


Entonces la matriz de covarianzas de los v no
depende del tiempo y no es diagonal Y POR
LO TANTO el modelo es heteroscedstico

it i it
u c v + =
0 ] [ E =
is it
u u
0 ] [ E =
i it
c u
o
2 2
] [ E
c i
c
=
] v v E[
'
=
i i i
MCO agrupados (Pooled)
Podemos utilizar estimacin robusta,o
Podemos utilizar mnimos cuadrados
generalizados al modelar la varianza,
con lo cual ganamos eficiencia
Definimos la matriz de varianzas (no-
condicionada) de v como la matriz
=E[vv]

El inconveniente con el estimador de
GMCO es que si no es escalar, es decir,
no es de la forma (varianza del
error constante y no correlacin serial),
entonces el estimador resulta ineficiente.
Para corregir este problema
premultiplicamos la ecuacin (1) por
, de donde tenemos
T v
I
2
o =
2 / 1

De esta forma,









Debemos agregar la hiptesis













T
i i
i i
i i
i i i
I


v v
v v
v v
v v v
'
'
=
=
=
=
=
=
=





1
2 / 1 2 / 1
2 / 1 2 / 1
2 / 1 2 / 1
2 / 1 2 / 1
* * *
)' (
)' ]( E[
] )' ( E[
] )' ( E[
] )' ( E[ ) var(
MAXIMO
i i
=

] X X [ E rango
1 '
Test del multiplicador de Lagrange para
determinar si la variable omitda es problema
(Breusch-Pagan)
Derivado del test de
homoscedasticidad
Sea un modelo

=
0
+
1


Si existe heterogeneidad entre
individuos entonces



De modo que la hiptesis nula del
modelo es

0
: (

) = 0
Es decir

= idntica para todos los


individuos, es decir hace parte de la
constante
0
.
Estadstico de prueba


Puede realizarse un anlisis
ANOVA(medias y varianzas iguales por
individuos.
Test del multiplicador de Lagrange para
determinar si la variable omitda es problema
(Breusch-Pagan)
~
1
2

Estimador de primera
diferencia
) 1 (
) 2 (
1 1 1 0 1
2 2 1 0 0 2
= + + + =
= + + + + =
t u a x y
t u a x y
i i i i
i i i i
| |
| o |
El uso de datos panel, permite que el efecto
no observado a
i
se relacione con las variables
explicativas. Dado que
Restando las dos ecuaciones
i i i
i i i i i i
u x y
u u x x y y
A + A + = A
+ + =
1 0
1 2 1 2 1 0 1 2
) ( ) ( ) (
| o
| o
Ecuacin de primera diferencia.
Estimador de primera
diferencia
i i i
u x y A + A + = A
1 0
| o
Si u
it
no se relaciona con la variable explicativa en
ambos periodos de tiempo se tiene que x
i
y u
i

estn no correlacionados.

El estimador de MCO de
1
de esta ecuacin se
conoce como estimador de primera diferencia.

x
i
debe tener alguna variacin a travs del
tiempo. Por ejemplo no puede ser una variable
dummy del gnero.
Supuestos del modelo poblacional







0 ] x [ E
T
= A A u
AXIMO M ] x x [ E rango
T
= A A
Ejemplo
En el caso anterior de las ciudades la ecuacin
de primera diferencia estimada es igual a:

unem crmrte A + = A 22 . 2 4 . 15
(4.7) (0.98)
n=46, R
2
=0.127
Ahora la relacin entre la tasa de criminalidad
y desempleo es positiva y estadsticamente
significativa. El intercepto revela algo
interesante. Si la tasa de desempleo se
mantiene constante se predice un incremento
en la tasa de criminalidad (crmenes por cada
1000 personas) de 15.4. Esto es un aumento
de la tasa de criminalidad en USA entre 1982 y
1987.
Primera diferencia vs
combinacin corte transversal
Ecuacin de primera diferencia:
Considera explcitamente como los cambios
en el tiempo en las variables explicativas
afectan el cambio en y durante el mismo
periodo de tiempo.

Combinacin de corte transversal o pooled:
Estima el efecto de las variables explicativas
sobre y manteniendo c
i
fijo.

Primera diferencia vs
combinacin corte transversal
Diferenciar datos panel es una manera til de
controlar efectos no observados, sin embargo
tiene un costo:

Los conjuntos de datos panel son ms
difciles de recoger que un conjunto de corte
transversal.

Incluso si se tienen los datos de corte
transversal la diferenciacin usada para
eliminar c
i
puede reducir en gran medida la
variacin en las variables explicativas, lo cual
puede generar grandes errores estndar en
los estimadores MCO.

Ejemplo
La ecuacin de primera diferencia en este
caso es:

i i
u educ wage + A + = A
1 0
) log( | o
Aunque parece indicado usar el estimador de
diferencias en este caso, como el inters es en
personas adultas y empleadas el nmero de
aos de educacin prcticamente no cambia
en el tiempo.

De este modo slo para una pequea fraccin
de la muestra educ
i
es distinto de cero y ser
dificil obtener un estimador preciso de
1.


Efectos aleatorios
Efectos Aleatorios
El anlisis de efectos aleatorios asume los
siguientes supuestos:



donde .

Al supuesto EA.1.b se le denomina condicin de
ortogonalidad. Al supuesto EA.1.a se le
denomina exogeneidad estricta.
NOTA:COMPARE CON AGRUPADOS.




) .1.a ( ) ,..., 2 , 1 ( 0 ] , | [ E
'
EA T t c u
i i it
= = x
) EA1.b ( ) ,..., 2 , 1 ( 0 ] [ E ] | [ E T t c c
i i i
= = = x
) ,..., , (
2 1 iT i i i
x x x x
EA.1.b puede ser alternativamente reemplazado
por la condicin ms dbil:

Por otro lado, la hiptesis EA.1.b es implicada por
los siguientes supuestos:
1. es fijo.
2.
o por el supuesto de que sea independiente de
La parte importante de la hiptesis es:

El supuesto de que se tiene siempre que
incluya el intercepto.

it
x
) ,..., 2 , 1 ( 0 ] [ E T t c
i
= =
i
c
) EA.1.c ( ) ,..., 2 , 1 ( 0 ] [ E T t c
i it
= =
'
x
it
x
] [ E ] | [ E
i i i
c c = x
0 ] [ E =
i
c
it
x
Bajo EA.1, podemos escribir:














' ) 1 ,..., 1 , 1 ( j
' ) ,..., , ( u
u j v
' ) ,..., , (
' ) ,..., , ( y
donde,
) 1 ( v X y
s 1' T
T
T 2 1
T
T 2 1
T 2 1

=
=
+ =
=
=
+ =
i i i i
i i i
i i i i
i i i i
i i i
u u u
c
x x x X
y y y
Definimos la matriz de varianzas (no-condicionada)
de como la matriz:

de dimensiones .
El inconveniente con el estimador de PMCO es
que si no es escalar, es decir, no es de la forma
(varianza del error constante y no
correlacin serial), entonces el estimador resulta
ineficiente.
Para corregir este problema premultiplicamos la
ecuacin (1) por , de donde tenemos:




















i
v
] v v E[
'
=
i i i
T T

T v
I
2
o =
2 / 1

) 2 ( o
) (
* * *
2 / 1 2 / 1 2 / 1
i i i
i i i
v X y
v X y
+ =
+ =

Luego, el estimador PMCO de la ecuacin (2),
conocido como estimador de mnimos cuadrados
generalizados:



resulta eficiente.


















( ) ( ) ( ) ( )

=

=
= =
N
i
i i
N
i
i i
N
i
i i
N
i
i i
1
1 '
1
1
1 '
1
* *
1
1
* *
PMCO
y X X X y X X )' X (
Consideremos ahora el siguiente supuesto:


Bajo los supuestos EA.1 y EA.2, el estimador de
efectos aleatorios (mnimos cuadrados
generalizados, MCG)


es consistente.




















) EA.2 ( ] [ E rango
1
K
i i
=

X X
'
( ) ( )

=

=
N
i
i i
N
i
i i
1
1 '
1
1
1 '
EA
y X X X
El inconveniente con el estimador de MCG, es
que se requiere conocer la matriz , la cual es
en la mayora de las ocasiones desconocida.

Reemplazamos entonces la matriz por un
estimador consistente de ella. Con esto, el
estimados de mnimos cuadrados generalizados
factibles (MCGF) se define como:



el cual es consistente bajo EA.1 y EA.2.




















1

|
.
|

\
|
|
.
|

\
|
=

=

N
i
i i
N
i
i i
1
1
1
1
1
EA

y X X X
' '
Pero, cmo obtenemos un estimador consistente
de ? Sea el estimador de Pooled MCO, el
cual es consistente bajo EA.1. Definimos:


Entonces por la ley de los grandes nmeros, un
estimador consistente de es:





















PMCO

i PMCO i i
X y v =

=
=
N
i
i i
N
1

1

'
v v
Consideremos ahora los siguientes supuestos:



EA.3.1 implica que la varianza del error es
constante (a travs del tiempo) y los errores no
ests serialmente correlacionados. EA.3.2 es el
supuesto de homoscedasticidad del trmino no-
observable c.
Bajo EA.3, se tiene que:


de donde se tiene que .

















) EA.3.2 ( ] | E[
) EA.3.1 ( ] , | E[
2 2
T
2
c i i
u i i i i
c
c
o
o
=
=
x
I x u u
'
'
j j I
T T
2
T
2
c u
o o + =
2 2 2
c u v
o o o + =
Bajo EA.1-EA.3, un estimador consistente de
es:


donde son los residuales PMCO.

Similarmente, bajo EA.1-EA.3 un estimador
consistente de es:



Finalmente, .



















2
v
o

= =

=
N
i i
T
t
it v
v
K NT
1
2 2

o
it it it
y v x
PMCO

=
2
c
o

=

= + =

=
N
i i
T
t
T
t s
is it c
v v
K T NT
1
1 1
2

2 / ) 1 (
1

o
2 2 2

c v u
o o o =
Es importante anotar que a pesar de que EA.3 no
se satisfaga el estimador MCGF es consistente,
sin embargo, puede no ser eficiente. Necesitamos
entonces derivar una matriz de varianzas del
estimador robusta ante patrones de
heteroscedasticidad y correlacin serial de los
errores.
Sea , entonces una matriz de
varianzas robusta es:
















EA
~
X y v
i i i
=
1
1
1
1
1 1
1
1
1
EA

~ ~

) avar(

=

|
.
|

\
|
O |
.
|

\
|
O O |
.
|

\
|
O =

N
i
i i
N
i
i i i i
N
i
i i
X X X v v X X X
' ' ' '
Efectos Fijos
El anlisis de efectos fijos asume los siguientes
supuestos:


La idea del anlisis de efectos fijos es transformar
la ecuacin del modelo muestral de tal forma que
se elimine el efecto no observable . Para ello,
recordemos la ecuacin del modelo muestral:







) FE.1 ( ) ,..., 2 , 1 ( 0 ] , | [ E T t c u
i i it
= = x
i
c
) 1 ( ,..., 2 , 1 , T t u c y
it i it it
= + + = x
Sumando las T ecuaciones en (1) y dividiendo por
T a ambos lados, se tiene:


donde, , y corresponde al
promedio de cada variable.

Ahora, restando (2) de (1) tenemos:


Ntese que el efecto no observable ha
desaparecido de la ecuacin del modelo.


) 2 ( ,
i i i i
u c y + + = x

=
T
t
it i
y T y
1
1

=
T
t
it i
T
1
1
x x

=

=
T
t
it i
u T u
1
1
) 3 ( ,..., 2 , 1 ), ( ) ( T t u u y y
i it i it i it
= + = x x

Definimos , y .
Con esto la ecuacin (3) se puede escribir como:


Naturalmente, (4) puede ser estimado mediante
Pooled MCO. Entonces, definimos el estimador de
efectos fijos como el estimador PMCO de la
ecuacin (4).

Pero es este estimador consistente? En primer
lugar, debemos ver que:





i it it
y y y

i it it
x x x

i it it
u u u

) 4 ( ,..., 2 , 1 , T t u y
it it it
= + =

x
) ,..., 2 , 1 ( 0 ] [ E T t u
it it
= =

'
x
Ntese que:

Ahora, bajo FE.1


Luego . Esto a su vez implica que:


pues es una funcin de . Del mismo modo, esto
implica que:









] | [ E ] | [ E ] | [ E
i i i it i it
u u u x x x =

0 ] | [ E =
i it
u x
0 ] | [ E =
i i
u x
0 ] | [ E =
i it
u x

0 ] ,..., , | [ E
2 1
=
iT i i it
u x x x

it
x

i
x
0 ] [ E =
it it
u

'
x
Finalmente, debemos garantizar el buen
comportamiento asinttico del estimador, para ello
necesario asumir:

De este modo, bajo FE.1-FE.2 el estimador de
efectos fijos es consistente.

Sea , con esto entonces:


Luego, el sistema de ecuaciones en (4) puede ser
equivalentemente escrito como:













i i i
u X y



+ =
' '
j j j j I Q
T T T T T T
1
) (


i T i i T i i T i
u Q u X Q X y Q y = = =



, ,
) FE.2 ( ] [ E rango K
i i
= X X
'

Explcitamente, el estimador de efectos fijos est
descrito por:



Este estimador es llamado alternativamente
estimador within.

Asumamos ahora que:


Bajo FE.1, FE.3 implica que:













|
.
|

\
|
|
.
|

\
|
=

=

=
N
i
i i
N
i
i i
1
1
1
FE
y X X X
' '


) FE.3 ( ] , | [ E
2
T u i i i i
c I x u u
'
o =
T u i i i
c I x u
2
] , | [ var o =
Definimos los residuales de efectos fijos como:

entonces bajo los supuesto FE.1-FE.3, un
estimador consistente de es:



De este modo, la varianza asinttica del estimador
de efectos fijos es:












FE

x
it it it
y u

=
2
u
o

= =

=
N
i
T
t
it u
u
K T N
1 1
2 2

) 1 (
1

o
) 5 ( ) avar(
1
1
2
FE

=
|
.
|

\
|
=

N
i
i i u
X X
'

o
Como vimos, el estimador de efectos fijos es
consistente bajo FE.1-FE.2, sin embargo, sin FE.3
la expresin en (5) no es adecuada.

La presencia de heteroscedasticidad y correlacin
serial de los residuales de efectos fijos requiere el
computo de una matriz de varianza robusta.

El estimador robusto de la matriz de varianzas de
es:












FE

1
1 1
1
1
FE
) avar(

= =

=
|
.
|

\
|
|
.
|

\
|
|
.
|

\
|
=

N
i
i i
N
i
i i i i
N
i
i i
X X X u u X X X
' ' ' '

Efectos fijos vs primera
diferencia
El estimador de primera diferencia (PD) y el de
efectos fijos (EF) sirven para estimar modelos
efectos no observados.

Cuando T=2 los dos estimadores son iguales y
no importa cual se use.

Cuando T3 los estimadores no son iguales.
Adems bajo los supuestos 1) a 3), los dos
estimadores son insesgados y consistentes (con
T fijo y N ). De este modo se debe utilizar la
eficiencia relativa como criterio de seleccin de
los estimadores.
Efectos fijos vs primera
diferencia
El estimador de primera diferencia y el de
efectos fijos sirven para estimar modelos efectos
no observados.

Cuando T=2 los dos estimadores son iguales y
no importa cual se use.

Cuando T3 los estimadores no son iguales.
Adems bajo los supuestos 1) a 3), los dos
estimadores son insesgados y consistentes (con
T fijo y N ). De este modo se debe utilizar la
eficiencia relativa como criterio de seleccin de
los estimadores, la cual depende de la
correlacin serial de u
it
.
Efectos fijos vs primera
diferencia

Cuando u
it
es serialmente no correlacionado
el estimador EF es ms eficiente que el
estimador PD, por lo cual EF es ms utilizado.

Sin embargo esto no siempre se tiene. Si por
ejemplo u
it
sigue una caminata aleatoria (de
modo que hay correlacin serial positiva), la
diferencia u
it
es serialmente no correlacionada
y el estimador PD es mejor.


Efectos fijos vs primera
diferencia
Es dificil probar si u
it
es serialmente no
correlacionado despus de la estimacin de EF
(se pueden estimar los errores
it
pero no los
errores u
it
.

Sin embargo, se puede probar si los errores
diferenciados u
it
son no correlacionados
serialmente, caso en el que el estimador PD
puede ser utilizado. Si hay una correlacin serial
substancial en los u
it
probablemente es mejor el
estimador EF.

Efectos fijos vs primera
diferencia
Cuando T es grande y especialmente cuando N
no es muy grande (por ejemplo, N=20 y T=30),
se debe tener precaucin al usar el estimador
EF, ya que los resultados de las distribuciones
de los estimadores pueden no mantenerse. En
este caso es mejor utilizar el estimador PD.


A
Efectos aleatorios,fijos y
combinados
La transformacin de MCG que elimina la
correlacin serial tambien se logra definiendo:
2 / 1
2 2
2
1
(

+
=
a u
u
To o
o

El cul est entre cero y uno. La ecuacin


transformada es:
) ( ) (
) ( ) 1 (
1 1 1 0
i it ik itk k
i it i it
v v x x
x x y y
|
| |
+ +
+ + =

El estimador EF resta los promedios


temporales a las variables respectivas. La
transformacin de efectos aleatorios resta una
fraccin de dichos promedios temporales.
Efectos aleatorios
El parmetro no es conocido en la prctica
pero puede ser estimado.

Generalmente, se estima de la siguiente forma:
2 / 1
2 2
) / ( 1
1
1

+
=
u a
T o o

Donde los estimadores de las varianzas son


consistentes y pueden obtenerse con MCO
combinados o efectos fijos.
) ( ) (
) ( ) 1 (
1 1 1 0
i it ik itk k
i it i it
v v x x
x x y y
|
| |
+ +
+ + =

La ecuacin anterior relaciona el estimador de


EA con los estimadores de EF y MCO
combinado. El estimador de EF es obtenido
cuando =1. El estimador de MCO agrupado es
obtenido cuando =0.

Si es cercano a cero el estimador de EA ser muy
similar al de MCO agrupado. Esto ocurre cuando el
efecto no observado a
i
es relativamente poco
importante (tiene una varianza pequea
comparada con
u
2
).
Efectos fijos vs efectos
aleatorios
Algunos autores deciden entre efectos fijos y
aleatorios basados en si los a
i
son vistos mejor
como parmetros a ser estimados (efectos fijos) o
realizaciones de una variable aleatoria (efectos
aleatorios).

Usar efectos fijos es lo mismo que permitir un
intercepto diferente para cada observacin.



Efectos fijos vs efectos
aleatorios
An si se decide tratar a a
i
como variables
aleatorias. Se debe decidir si estn correlacionadas
con las variables explicativas. Si se puede asumir que
a
i
son no correlacionados con x
it
el mtodo apropiado
es EA.

Sin embargo, si a
i
estn correlacionados con
algunas variables explicativas, el mtodo de EF (o PD)
es necesario, pues los estimadores de EA sern
generalmente inconsistentes.



Efectos fijos vs efectos
aleatorios
Para tomar la decisin se puede utilizar la
prueba de Hausman, que prueba si hay
correlacin entre c y x asumiendo que los errores u
it

y las variables explicativas no estn
correlacionados a lo largo de todos los periodos
de tiempo.

H0 :

H =
H se distribuye como una CHI cuadrado con
Numero de betas grados de libertad




vs c 0 ] [ E
'
= x
0 ] [ E H
'
1
= c x
) ( ) ( ) ( ( )' (
1
aleatorios fijos aleat fijos aleatorios fijos
Var Var | | | | | |