Anda di halaman 1dari 3

DISEÑO Y ANÁLISIS DE LA INVESTIGACIÓN SOCIAL

Tarea 2

Instrucciones Generales
La tarea puede ser realizada en grupos de hasta 2 personas. Utilicen lo visto en las clases lectivas,
lecturas, clases de Stata, y ayudantías para responder a las preguntas de esta guía. La entrega debe
realizarse hasta el día Martes 18 de junio hasta las 14:00 horas en la oficina de Consuelo Cheix. Deben
realizar la entrega de la tarea en dos archivos/documentos: 1) En formato escrito (Word, Latex, etc.)
y; 2) En formato do file (Stata), con los códigos o comandos que utilizaron para responder a las
distintas preguntas STATA de la guía. Este último archivo debe ser enviado por correo electrónico,
dentro del plazo de la entrega, con copia a la profesora y a la ayudante. No se considerarán como
entregados los trabajos enviados únicamente por correo electrónico y no cuenten con una copia física.

Preguntas
Un grupo de estudiantes de postgrado está interesado en analizar los factores explicativos de la
satisfacción general con la vida utilizando datos del German Socio-Economic Panel para el año 20091.
Los estudiantes plantean estimar inicialmente un modelo de regresión lineal (OLS) formulado de la
siguiente manera:
𝑙𝑠𝑎𝑡𝑠 = 𝛽0 + 𝛽1 𝑒𝑑𝑢 + 𝛽2 𝑣𝑜𝑐 + 𝛽3 𝑠𝑒𝑥 + 𝛽4 ℎ𝑠𝑎𝑡 + 𝛽5 𝑙𝑛ℎℎ𝑖𝑛𝑐 + 𝛽6 𝑚𝑎𝑟 + 𝛽7 𝑒𝑚𝑝 + 𝛽8 𝑎𝑔𝑒 + 𝛽9 𝑠𝑡𝑎𝑡𝑒 (1)

Donde:
- 𝑙𝑠𝑎𝑡𝑠: Escala de satisfacción general con la vida.
- 𝑒𝑑𝑢: Educación. Categorías 1=Primaria; 2=Intermedia; 3=Fachhochschulreife; 4=Secundaria
(Maturity qualification); 5=Otra.
- 𝑣𝑜𝑐: Formación vocacional o universitaria. Categorías 1=Formación vocacional; 2=Formación
vocacional en universidad; 3=Formación especializada/funcionarios públicos; 4=Otra formación
vocacional; 5=Colegio profesional; 6=Grado universitario; 7=No aplica.
- 𝑠𝑒𝑥: Género. Categorías 0=Hombre, 1=Mujer.
- ℎ𝑠𝑎𝑡: Satisfacción con su salud. Categorías de 0=Completamente insatisfecho(a) a 10=Totalmente
satisfecho(a).
- 𝑙𝑛ℎℎ𝑖𝑛𝑐: Logaritmo natural del ingreso del hogar después de transferencias del estado, medido en
Euros.
- 𝑚𝑎𝑟: Estado civil. Categorías 1=Casado(a); 2=Soltero(a); 3=Viudo(a), Divorciado(a), Separado(a).
- 𝑒𝑚𝑝: Estatus de empleo. Categorías 0=No empleado; 1=Empleado.
- 𝑎𝑔𝑒: Edad, medida en años.
- 𝑠𝑡𝑎𝑡𝑒: Estado de residencia.

En base a los datos SOEP09_t3.dta (N=4621), desarrolle las preguntas detalladas a continuación.

1
Datos obtenidos de Kohler & Kreuter, 2012.
1. Los estudiantes discuten si es necesario realizar una transformación logarítmica de los ingresos
del hogar antes de estimar su modelo base (modelo 1). Explore visualmente la distribución de la
variable ℎℎ𝑖𝑛𝑐 y exponga si la decisión de transformarla logarítmicamente es acertada. Incluya un
gráfico que apoye su justificación.

2. Estime el modelo base (1) planteado por los estudiantes. Construya a este modelo con las
siguientes variables: satisfacción con la salud, género, edad e ingreso del hogar. Interprete el
efecto de los coeficientes de regresión del modelo 1.

3. Refiérase a la bondad de ajuste del modelo (1). Interprete tanto el 𝑅 2 como el estadístico F para
un test de significancia general con su valor p.

4. El mismo grupo de estudiantes desea saber si la inclusión de las variables educación y formación
vocacional/universitaria mejoran el poder explicativo de su modelo base. Teniendo el Modelo
(1) como modelo completo, desarrolle dos tests de restricciones múltiples:
a. Un primer test que restrinja los coeficientes de regresión correspondientes a las categorías
de 𝑒𝑑𝑢.
b. Un segundo test que restrinja los coeficientes de regresión correspondientes a las categorías
de 𝑣𝑜𝑐.
Para cada test, formule las hipótesis nula y alternativa e interprete sus resultados.

5. Los integrantes del grupo deciden que cada uno realizará análisis por separado para luego
juntarse a discutir los resultados obtenidos en conjunto. Un primer estudiante está interesado en
el efecto de ser soltero(a) sobre la satisfacción general con la vida. Intuye que ser soltero(a)
puede afectar la satisfacción con la vida de dos maneras. Primero, las personas solteras pueden
tener niveles de satisfacción con la vida diferentes, en promedio, respecto a las personas que no
son solteras. Pero, de una segunda manera, el estudiante sospecha que el efecto de ser soltero(a)
podría ser distinto dependiendo del estatus de empleo de los individuos y le interesa testear esta
hipótesis. El estudiante recodifica la variable 𝑚𝑎𝑟, en una variable dicotómica llamada 𝑠𝑖𝑛𝑔𝑙𝑒,
con las categorías 0=no soltero y 1=soltero, y prevé que debe estimar el siguiente modelo:

𝑙𝑠𝑎𝑡𝑠 = 𝛽0 + 𝛽1 𝑒𝑑𝑢 + 𝛽2 𝑣𝑜𝑐 + 𝛽3 𝑠𝑒𝑥 + 𝛽4 ℎ𝑠𝑎𝑡 + 𝛽5 𝑙𝑛ℎℎ𝑖𝑛𝑐 + 𝛽6 𝑎𝑔𝑒 + 𝛽7 𝑠𝑡𝑎𝑡𝑒 +


(2)
𝛽8 𝑠𝑖𝑛𝑔𝑙𝑒 + 𝛽9 𝑒𝑚𝑝 + 𝛽10 𝑠𝑖𝑛𝑔𝑙𝑒 ∗ 𝑒𝑚𝑝
a. Explique si es pertinente incluir un término de interacción para testear la hipótesis del
estudiante. ¿Qué indica la inclusión de un efecto de interacción respecto a los efectos de ser
soltero(a) y estatus de empleo?
b. Estime el Modelo (2), indique e interprete el efecto de ser soltero(a) para:
i. Quienes no están empleados.
ii. Quienes están empleados.

6. A otra integrante del grupo le interesa analizar si el efecto de la edad sobre la satisfacción con la
vida depende del estatus de empleo de las personas. Formula el siguiente modelo:
𝑙𝑠𝑎𝑡𝑠 = 𝛽0 + 𝛽1 𝑒𝑑𝑢 + 𝛽2 𝑣𝑜𝑐 + 𝛽3 𝑠𝑒𝑥 + 𝛽4 ℎ𝑠𝑎𝑡 + 𝛽5 𝑙𝑛ℎℎ𝑖𝑛𝑐 + 𝛽6 𝑚𝑎𝑟 + 𝛽7 𝑠𝑡𝑎𝑡𝑒 +
(3)
𝛽8 𝑎𝑔𝑒 + 𝛽9 𝑒𝑚𝑝 + 𝛽10 𝑎𝑔𝑒 ∗ 𝑒𝑚𝑝
a. Estime el Modelo (3) e indique el efecto de la edad para:
i. Quienes no están empleados.
ii. Quienes están empleados.
b. La estudiante del grupo considera necesario hacer un gráfico para tener mayor claridad
respecto al efecto de la edad. Calcule los valores predichos de satisfacción general con la
vida según estatus de empleo para individuos de distintas edades y grafique.
c. Interprete sustantivamente el efecto de la edad a partir de los resultados del Modelo 3.

7. Un tercer integrante del grupo repara en que el modelo base (modelo 1) incluye la variable edad
de manera simple (lineal), cuando la literatura empírica que ha revisado suele incluirla como un
término al cuadrado y formula el siguiente modelo:
𝑙𝑠𝑎𝑡𝑠 = 𝛽0 + 𝛽1 𝑒𝑑𝑢 + 𝛽2 𝑣𝑜𝑐 + 𝛽3 𝑠𝑒𝑥 + 𝛽4 ℎ𝑠𝑎𝑡 + 𝛽5 𝑙𝑛ℎℎ𝑖𝑛𝑐 + 𝛽6 𝑚𝑎𝑟 + 𝛽7 𝑠𝑡𝑎𝑡𝑒 + 𝛽8 𝑒𝑚𝑝 +
(4)
𝛽9 𝑎𝑔𝑒 + 𝛽10 𝑎𝑔𝑒 2
a. Señale cuándo es acertado incluir un término cuadrado y qué indica la inclusión de edad al
cuadrado en la relación entre esta variable y la satisfacción general con la vida.
b. Estime el Modelo (4). Observe los coeficientes y señale qué indican los signos de edad y de
edad al cuadrado.
c. Calcule valores predichos de satisfacción general con la vida para distintas edades y
preséntelos en un gráfico.
d. Interprete sustantivamente sus resultados a partir del gráfico.

8. Una vez estimado el Modelo (4), al tercer integrante del grupo le preocupa que el modelo cumpla
con el supuesto de homoscedasticidad.
a. ¿Qué indica el supuesto de homoscedasticidad? ¿Cuáles son las consecuencias de su
incumplimiento?
b. Examine de manera visual los residuos del Modelo (4) graficándolos contra los valores
predichos. Presente su gráfico y exponga un diagnóstico preliminar respecto al supuesto de
homoscedasticidad.
c. Realice un test formal que le permita señalar si el modelo cumple con el supuesto de
homcesdasticidad.
d. En vista de sus resultados, ¿Qué solución o consejo podría dar a las preocupaciones del
estudiante?

Anda mungkin juga menyukai