Anda di halaman 1dari 6

Alejandra Rodriguez Mejia- Sofía Salamanca Ballesteros

1. Answer
a. Why is it necessary to use two subscripts, i and t, to describe panel data? What
does i refer to? What does t refer to?
La letra i significa el individuo y la letra t se refiere al periodo que se está analizando, si i y t toman
el valor de 1 quiere decir que se está analizando el individuo 1 en el periodo 1. Es necesario tener
estos indicadores en datos panel ya que yo tomo información de la misma población para
diferentes periodos de tiempo. Entonces para cada variable debo hacer la relación de a qué
individuo pertenece, pero en qué periodo de tiempo. Por ejemplo, si tenemos 𝑥23 quiere decir que
estamos tomando el valor de la variable x que le corresponde al individuo 2 en el periodo 3.
b. A researcher is using a panel data set on n = 1000 workers over T = 10 years (from
2001 through 2010) that contains the workers’ earnings, gender, education, and
age. The researcher is interested in the effect of education on earnings. Give some
examples of unobserved person-specific variables that are correlated with both
education and earnings. Can you think of examples of time-specific variables that
might be correlated with education and earnings? How would you control for these
person-specific and time-specific effects in a panel data regression?
Tiempo- específico
La teconología cambia a través del tiempo pero como todos los individuos pueden acceder a
ella, tiene efectos positivos en la cobertura de la educación en una región y de igual medida sobre
los salarios porque mejora la productividad de las empresas y mejora los salarios.
PIB del país en la medida que los individuos vivan en el mismo país no difere este dato entre
individuos y si cambia a través del tiempo. El PIB asegura un mayor gasto en educación y la
posibilidad de educarse, además un mayor ingreso para las empresas y así, incrementos en los
salarios.
Total graduados universitarios en el país, en la medida en que hay mayores graduados en el
país se sabe que el nivel y los años de educación suben en el país, además un mayor número
de graduados implica más mano de obra calificada que aumenta la oferta de trabajo y disminuye
los salarios.
Individuo- específico:
Colegio del que se graduó la personas. Variable dummy que tome el valor de 1 si es de colegio
privado y valor de 0 de un colegio público. Si sale de un colegio privado tiene más oportunidades
de estudiar en una mejor universidad y además podría significar mayor conocimiento de idioma,
mejor manejo de ciertas habilidades que no tengan los de colegios públicos. Esta variable es
constante en el tiempo pero sí difiere entre individuos.
Promedio de las notas de la universidad al graduarse. Es una variable que no varía en el
tiempo. Si la persona se gradúa con mejor promedio es probable que consiga becas para seguir
estudiando y además después consiga mejor trabajo que significa mejores salarios.
La edad de las personas es una variable que varía en la en la misma medida para todos los
individuos de la muestra, puede tener relación con el salario y con la educación porque cuando
se es mas joven se educa más y a medida que aumentan los años también lo hace la experiencia
y el salario.
Se puede incluir una variable de cada categoría en la estimación para poder capturar tanto el
efecto tiempo- específico como el efecto individuo- específico.
c. Can the regression that you suggested in response to question (b) be used to
estimate the effect of gender on an individual’s earnings? Can that regression be
used to estimate the effect of the national unemployment rate on an individual’s
earnings? Explain.
Ninguna de estas dos variables se puede estimar ya que género es una variable que no varía en
el tiempo así que su efecto sobre los salarios no puede ser estimada sin relacionarse con los
efectos de la variable individuo- específica. Por otro lado, la tasa nacional de desempleo es una
variable que tiene el mismo dato para todos los individuos en el mismo periodo de tiempo
entonces no se puede determinar su efecto sin ser relacionada con los efectos de las variables
tiempo- específico.
d. In the context of the regression you suggested for question (b), explain why the
regression error for a given individual might be serially correlated.
En datos panel como se toma información para el mismo individuo en diferentes periodos de
tiempo se puede llegar a tener correlación cuando se hace la estimación para un solo individuo
porque el pasado de un individuo afecta el futuro de este. Así, el error puede estar correlacionado
a través del tiempo porque contiene características de un individuo que se afectan
intertemporalmente.
2.
𝑦𝑖𝑡 = 𝛽1 𝑥𝑖𝑡1 + 𝛽2 𝑥𝑖𝑡2 + ⋯ + 𝛽𝑘 𝑥𝑖𝑡𝑘 + 𝑎𝑖 + 𝑢𝑖𝑡 , 𝑡 = 1,2, … , 𝑇 (1)
Suppose that the idiosyncratic errors in (1), 𝑢𝑖𝑡 : 𝑡 = 1,2, … , 𝑇 , are serially uncorrelated with
constant variance, 𝜎𝑢2 . Show that the correlation between adjacent differences, ∆𝑢𝑖𝑡 and
∆𝑢𝑖𝑡+1 , is -0.5.
Para cada t>1

𝑉𝑎𝑟(∆𝑢𝑖𝑡 ) = 𝑉𝑎𝑟(∆𝑢𝑖𝑡 − 𝑢1,𝑡−1 ) = 𝑉𝑎𝑟(∆𝑢𝑖𝑡 ) + 𝑉𝑎𝑟(𝑢1,𝑡−1 ) = 2𝜎𝑢2

Se usa el supuesto de no correlación serial en 𝑢𝑖 y varianza constante.Luego se haya la


covarianza entre ∆𝑢𝑖𝑡 y ∆𝑢1,𝑡+1. Como las dos tienen media cero, la covarianza es:

𝐸(∆𝑢𝑖𝑡 ∙ ∆𝑢1,𝑡+1 )

𝐸[(∆𝑢𝑖𝑡 − 𝑢1,𝑡−1 )( 𝑢1,𝑡+1 − ∆𝑢𝑖𝑡 )]

𝐸(∆𝑢𝑖𝑡 𝑢1,𝑡+1 ) − 𝐸(∆𝑢𝑖𝑡 2 ) − 𝐸(𝑢1,𝑡−1 𝑢1,𝑡+1 ) − 𝐸(𝑢1,𝑡−1 𝑢1𝑡 )

−𝐸(∆𝑢𝑖𝑡 2 ) = −𝜎𝑢2

por el supuesto de no correlación serial.Como la varianza es constante a través del tiempo:

𝐶𝑜𝑟𝑟(∆𝑢𝑖𝑡 , ∆𝑢1,𝑡+1 )
𝐶𝑜𝑟𝑟(∆𝑢𝑖𝑡 , ∆𝑢1,𝑡+1 ) 𝜎𝑢2
= 2 = −0,5
𝑉𝑎𝑟(∆𝑢𝑖𝑡 ) 2𝜎𝑢
3. In order to determine the effects of collegiate athletic performance on applicants, you
collect data on applications for a sample of Division I colleges for 1985, 1990, and 1995.
a. What measures of athletic success would you include in an equation? What are
some of the timing issues?
Para medir el éxito deportivo de los candidatos se pueden utilizar variables como variaciones en
su tiempo record si es un deporte individual. En el caso de deportes de grupo como el fútbol o el
baloncesto se puede utilizar el porcentaje de los juegos ganados. Las medallas ganadas por el
candidato también pueden ser un indicador de su éxito deportivo, así como una variable que
represente si ha representado a su país en torneos internacionales.
El problema con la temporalidad en los deportes es que el tiempo influye, entonces la constancia,
el entrenamiento y el tiempo que se practica el deporte afecta el rendimiento de los deportistas.
Por ende, puede que la variable del rendimiento de los deportistas aumente debido a la
continuidad en el entrenamiento y no otras variables propuestas. El éxito del año anterior influye
en el éxito del actual por la motivación y los posibles beneficios obtenidos de éxitos pasados.
Además, variables como la habilidad innata pueden afectar el rendimiento de los deportistas y es
una variable que no se puede medir.
Para que la estimación sea correcta, los datos de las variables propuestas deben hacer referencia
al año que se estudia. Por ejemplo, los partidos de un torneo de fútbol pueden empezar en un
año y su resultado puede darse en el año siguiente. Otro aspecto para considerar es que el
aspirante deberá presentar los datos de las variables propuestas antes de la fecha máxima de
aplicación, no debe incluir resultados futuros que se puedan dar.
b. What other factors might you control for in the equation?
Se pueden incluir las siguientes variables: horas de entrenamiento, cantidad de calorías
consumidas en promedio por mes, inversión en las instituciones deportivas, peso, altura, edad,
variable dummy que indique si practicó deportes en la niñez, cantidad de lesiones físicas que ha
tenido, promedio horas de sueño.
Adicionalmente, la variable de la edad cambia en igual proporción para todos los individuos y
tiene impacto en el rendimiento deportivo. De igual manera, la variable dummy que indica si el
deportista practico deporte desde la niñez no cambia en el tiempo al ser una variable individuo-
específica.
c. Write an equation that allows you to estimate the effects of athletic success on the
percentage change in applications. How would you estimate this equation? Why
would you choose this method?
log(𝑎𝑝𝑙𝑖𝑐𝑎𝑐𝑖ó𝑛): 𝛿1 1985 + 𝛿2 1990 + 𝛽0 + 𝛽1 𝑚𝑒𝑑𝑎𝑙𝑙𝑎𝑠 + 𝛽2 𝑖𝑛𝑣𝑒𝑟𝑠𝑖ó𝑛 + 𝛽3 𝑝𝑒𝑠𝑜 + 𝛽4 𝑙𝑒𝑠𝑖𝑜𝑛𝑒𝑠 + 𝛿3 𝑛𝑖ñ𝑒𝑧
+ 𝛽5 𝑠𝑢𝑒ñ𝑜 + 𝛽5 ℎ𝑟𝑠𝑒𝑛𝑡𝑟𝑒𝑛𝑜 + 𝑎𝑖 + 𝑢𝑖𝑡
El modelo propuesto no podría ser estimado por efectos fijos ya que incluímos variables que no
cambian en el tiempo como la variable dummy que representa si el deportista practicó desde la
niñez el deporte. Como hay efectos inobservables, practicar desde la niñez un deporte puede
estar correlacionada con la habilidad innata, la motivación puede relacionarse con las horas de
entrenamiento. Estas variables inobservables están incluidas en𝑎𝑖 y 𝑢𝑖𝑡 entonces, al estimar
mediante el modelo de efectos aleatorios nos permite corregir la correlación entre las variables
explictivas y el error compuesto.
4. Answer based on the article: Working and Educated Women: Culprits of a European
Kinder-Crisis?
a. Authors didn’t specify how they correct autocorrelation. How would you do it?

Los autores exponen que en los datos existen problemas de autocorrelación, es decir, existe
correlación entre miembros de series de observaciones ordenadas en el tiempo, el error está
relacionado con una variable explicativa.
Dado este problema DiCioccio y Wunnava hacen la prueba de Hausman, esta prueba determina
qué modelo usar: si efectos aleatorios o efectos fijos. El resultado determinó que es mejor utilizar
el modelo de efectos fijos. Suponiendo que esa autocorrelación es con un error que no varía en
el tiempo, el uso del modelo de efectos fijos permite capturar las diferencias que pueden presentar
entre los países incluidos en la muestra y solucionar el problema de autocorrelación, así los
estimadores son los mejores estimadores lineales insesgados.
b. What are the factors do seem to negatively contribute to countries’ fertility rates?
En la estimación se encontró que las variables que afectan negativamente la fertilidad en un país
son: educación terciaria en la mujer, la edad promedio en la que se casa la mujer, tasa de
desempleo, uso de anticonceptivos. Donde las últimas dos variables son las más significativas
entre estas variables mencionadas. La realización de la educación terciaria en mujeres lleva a
mejores oportunidades laborales para las mujeres que afectan negativamente la fertilidad. La
edad promedio a la que se casa la mujer afectan negativamente la fertilidad porque el tiempo
disponible para tener una hija es menor. El desempleo genera inestabilidad económica que
disminuye las decisiones de maternidad y la tasa de fertilidad. El uso de anticonceptivos tiene un
efecto negativo en la tasa de fertilidad porque es usado para prevenir el embarazo.
c. The constant term is significant. What implications does this have for the model?
La noción intuitiva de incluir la constante en el modelo es que así exista ausencia de todas las
variable consideradas en el modelo, la naturaleza humana es es reproducirse. Así que si el
modelo parte del origen quiere decir que la raza no se reproduce y a largo plazo se extingue. La
razón econométrica de incluir el intercepto es que los estimadores no estén sesgados porque la
constante recoge los sesgos del modelo.
d. Between the two models, what would you use? Explain
Los autores hacen la prueba de Hausman, esta prueba determina qué modelo usar, el resultado
determinó que es mejor utilizar el modelo de efectos fijos. El método de efectos fijos puede
solucionar el problema de autocorrelación que presentan los datos y arrojar unos mejores
estimadores. Es por esto qué utilizaríamos el modelo de efectos fijos sobre el modelo de efectos
aleatorios.
e. Based on the paper. What should be governments and firms’ priorities?
En el modelo se encontró que las políticas desarrolladas por el gobierno para promover la
maternidad y la flexibilidad horaria en las mujeres son consistentes y significativas por ende las
acciones que ha tomado tanto las firmas como el gobierno pueden incidir en la maternidad. Los
autores proponen que no se deben elaborar más políticas a favor de esta variable ya que han
funcionado, pero las que hay se deben mantener. Además, proponen elaborar políticas sobre la
inmigración para promover la maternidad en el país. Estas conclusiones se deben a la alta
significancia de las variables de políticas del gobierno y la flexibilidad horarias en las mujeres y la
poca significancia en variables como la oportunidad de la educación en las mujeres y el mercado
laboral.
Computer exercise
5. For this exercise, we use jtrain.xlsx to determine the effect of the job training grant on hours
of job training per employee. The basic model for the three years is:
ℎ𝑟𝑠𝑒𝑚𝑝𝑖𝑡 = 𝛽0 + 𝛿1 𝑑88𝑡 + 𝛿2 𝑑89𝑡 + 𝛽1 𝑔𝑟𝑎𝑛𝑡𝑖𝑡 + 𝛽2 𝑔𝑟𝑎𝑛𝑡𝑖,𝑡−1 + 𝛽3 log(𝑒𝑚𝑝𝑙𝑜𝑦𝑖,𝑡−1 ) + 𝑎𝑖 + 𝑢𝑖𝑡

a. Estimate the equation using fixed effects. How many firms are used in the FE
estimation? How many total observations would be used if each firm had data on
all variables (in particular, hrsemp) for all three years?

Son usadas 135 firmas en 3 años. Se usaron 290 observaciones y si se tuviera perfecta
información se utilizarían (135 ∗ 3) = 405 observaciones para los mismos 3 años.
b. Interpret the coefficient on grant and comment on its significance.
El coeficiente de grant significa que sí la firma recibio una beca en el año ceteris paribus, la firma
entrenará en promedio a cada trabajador 34,2 horas más que si no obtiene una beca. El p-valor
que arroja la estimación es menor que 0,05 lo cual lo hace significativo a un nivel de significancia
de 5%. Además, es el unico estimador significativo porque todos los demás estimadores tienen
un p-valor mayor a 0,05.
c. Is it surprising that 𝑔𝑟𝑎𝑛𝑡𝑡−1 is insignificant? Explain.
No, el que la firma haya o no obtenido una beca en el año anterior no influye en las horas de
entrenamiento del año actual ya que la beca permite aumentar las horas de entrenamiento por
empleado en el mismo año en el que se otorga.
d. Do larger firms provide their employees with more or less training, on average?
How big are the differences? (For example, if a firm has 10% more employees,
what is the change in average hours of training?)
No, la relación entre el empleo y las horas de entrenamiento por empleado es negativa. Dado que
es un modelo lin-log para la variable del empleo, si aumenta en un 1% los empleados de la firma,
ceteris paribus, se estima que en promedio disminuya 0,0017 horas en el entrenamiento por
trabajador. El estimador tiene un valor muy pequeño y además no es significativo por lo que las
diferencias no son muy grandes.

Anda mungkin juga menyukai