NOMBRE:
INDICACIONES
1. Escriba su nombre en cada una de las hojas de respuesta, que se encuentran al final de
este certamen
2. Use los papeles por ambos lados. Debe entregar todas las hojas, incluso las preguntas y
corcheteadas.
3. Puede usar una calculadora sencilla y tablas estadísticas de las distribuciones normal,
t y F sin otra escritura que su nombre.
7. Todas las preguntas valen lo mismo. Se calificarán de 0 a 10. Nota del certamen =
(suma de puntos) * 100 / 140.
El coeficiente de Pearson está pensado para relaciones rectilíneas entre dos variables.
Supone variables continuas y muestras grandes. Spearman se aplica a variables en escala
ordinal y sirve para muestras chicas.
2. Se trata de estudiar las ventas mensuales medias de un bien durable en términos del inventario
mensual de las tiendas minoristas (retail), el IMACEC, la tasa de interés de los bonos del
gobierno a 4 y 6 meses y los ingresos mensuales brutos de los trabajadores de la industria (que
se asocian a las ventas en forma exponencial negativa). Construya un modelo adecuado si
dispone de datos mensuales desde enero de 1983 hasta abril de 1990. Justifique la formulación
del modelo.
t = 1, 2, …, 88 (meses)
St-1 = Salarios mes anterior para ser gastados este mes. También pueden llevar sub índice
t, si se consideran parte de los costos del negocio
3. En un modelo hay que usar la variable exógena NOMBRE que asume los valores Santiago,
Valparaíso, Concepción. Describa cómo la incorporaría al modelo.
4. ¿Qué diferencia hay entre el R2 y el R2 ajustado?. ¿Para qué sirve uno y el otro?
6. A un estudiante se le pide escribir el modelo de regresión lineal con una sola variable
independiente. El estudiante responde así: E[Yi] = β0 + β1X1 + εi. ¿Está Ud. de acuerdo con la
respuesta?, ¿por qué?.
No. Al tomar esperanza, la E[ ] de los residuales es cero y, por lo tanto, este término no
debe aparecer en el enunciado.
7. Explique las diferencias entre los conceptos de correlación simple, correlación parcial y
correlación múltiple. ¿Para qué sirve cada uno de ellos?.
8. ¿Es posible estimar el modelo Y = β0 + β1exp{-0,8(X – 2)}?. Sí/no, por qué, cómo ...
Sí, por MCO. Para ello es suficiente definir X1 = exp{-0,8(X – 2)}. El modelo queda: Yi
= β0 + β1 X1i + εi
ICN 312 / Certamen 1 / Santiago / Diurno / 20 abril 2006 4
NOMBRE:
9. Considere un modelo de regresión lineal simple. Obtenga las fórmulas para los estimadores de
los β si las variables X e Y se estandarizan a media cero y varianza uno.
En este caso b0 = y promedio – b1*x promedio = 0, pues ambas tienen media cero.
Problema OBLIGATORIO
Variables son:
Se le pide:
11. Establecer el mejor modelo por el método de todas las regresiones posibles. Debe decidirse por
un solo modelo y explicar sus fundamentos para elegir ese modelo.
12. Desarrollar una iteración completa del método paso a paso mixto o stepwise, a partir de un
modelo con una o dos variables en él.
Preguntas de desarrollo.
Planteo: Y es la renta disponible per capita en los estados del este de los EE. UU., en miles de
dólares, modelada en función del porcentaje de licenciados universitarios en la población de 25
años o más, X, en los diferentes estados, así como el efecto de la región (Norte, Centro, Sur) en la
renta disponible.
Se propone el modelo E[Y | x ] = βo + β1 X + β2 D1 + β3 D2 donde X e Y se definieron arriba y
D1 y D2 son variables discriminantes definidas así:
D1 = 1, si se trata de un estado del Norte; = 0 en caso contrario
D2 = 1, si se trata de un estado del Centro; = 0 en caso contrario
La base son los estados del Sur, definidos por D1 = 0 = D2.
ID Estado Y X D1 D2 Región
ME 19,76 19,2 1 0 Norte
NH 24,99 26,6 1 0 Norte
VT 20,77 27,1 1 0 Norte
MA 26,72 31 1 0 Norte
RI 23,02 27,8 1 0 Norte
CN 30,22 31,4 1 0 Norte
NY 26,06 26,8 0 1 Centro
NJ 28,31 30,1 0 1 Centro
PA 22,79 22,1 0 1 Centro
DE 24,96 25,1 0 0 Sur
MD 24,90 31,8 0 0 Sur
VA 23,00 30,3 0 0 Sur
ICN 312 / Certamen 1 / Santiago / Diurno / 20 abril 2006 6
NOMBRE:
Usando los resultados que se le entregan en las páginas anteriores, se le pide responder a las
siguientes preguntas:
El valor-p (4 por 10.000) indica que la hipótesis de que todas las pendientes βj (j = 1, 2, ..., p)
valen cero, a la vez, es rechazada. Por lo tanto, debe existir al menos una β no nula en el modelo
poblacional; es decir, alguna de las variables X (aparte del intercepto) realmente explica la
variación de la endógena Y.
• Como D3 no aparece en el modelo, los resultados se comparan sobre la base de los estados del
Sur.
• Existe una renta disponible media general para todos los estados de USA$ 8.157,3 por persona,
que corresponde a los estados del Sur.
• Si el número de licenciados universitarios aumenta en 1%, la renta disponible aumenta en
USA$ 559,7 por persona.
• El hecho de vivir en un estado del Norte implica un aumento de USA$ 876,1 por persona.
• El hecho de vivir en un estado del Centro implica un aumento de USA$ 2.825,2 por persona.
• Los estados del centro aparecen, entonces, como los estados de mayores ingresos personales,
seguidos por los estados del Norte, mientras que los del Sur son los de menores ingresos.
16. Construir UNA dócima individual habitual para UNA βj poblacional (hipótesis, desarrollo,
conclusiones).
Considerando los apalancamientos m(i,i) dados, valores cercanos a 1 indican una observación
influyente. Considerando la tabla dada arriba, no hay observaciones influyentes.
18. Estime el ingreso promedio, per capita, en miles de dólares, del estado de New Jersey
(observación No. 8) usando un intervalo al 95 de confianza.