CARRERA DE ECONOMIA
ESTADISTICA III
NOMBRE: Janeth Jaramillo, Marcos Zhinin.
Taller 2.12
El archivo stockton4.dat contiene datos sobre 15009 casas vendidas en Stockton, CA durante
1996–1998. Las descripciones de las variables están en el archivo stockton4.def
a. Parcela precio de venta de la casa frente a la sala de estar de la casa para todas las casas en la
muestra
b. Estime el modelo de regresión SPRICE ¼ b1 þ b2LIVAREA for e para todas las Casas en la muestra.
Interpreta las estimaciones. Haz un bosquejo de la línea ajustada
Cuando no se adiciona ningún pie cuadrado al área de la sala el precio ira disminuyendo en 30069.2.
El coeficiente de determinación es moderado con lo que sí se puede demostrar por medio de esta regresión
el precio de las casas.
No hay problemas de multicolinealidad.
El valor p en menor que el nivel de significancia a aun 0,01 por lo que se concluye rechazar Ho y se podrá
decir que es diferente a 0 y puede ser incluida la variable liverea en la ecuación.
10 20 30 40 50
living area, hundreds of square feet
Como se aprecia en la figura 1 podemos observar que los datos siguen una relación positiva moderada , y
los datos siguen una linealidad .
c. Calcule el modelo cuadrático SPRICE ¼ a1 þ a2LIVAREA2 þ e para todas las Casas en la muestra.
¿Cuál es el efecto marginal de un cuadrado adicional de 100Pies de área de estar para una casa con
1500 pies cuadrados de área de estar?
Tabla 2 Matriz de correlación, salida de stata.
El efecto marginal de aumentar 100 pies adicionales a 1500 pies es de 42922, por lo que el precio estimado
adicional para una cada de 1600 es de 42922 USD.
d. En el mismo gráfico, trace las líneas ajustadas de los modelos lineales y cuadráticos. ¿Cuál parece
encajar mejor con los datos? Compara la suma de los residuos al cuadrado (SSE) Para los dos
modelos. ¿Cuál es más pequeño?
10 20 30 40 50
living area, hundreds of square feet
Como podemos apreciar en la figura 2 que el modelo representa una asociación positiva entre el precio de venta y el
área de las parcelas. Por lo que es razonable concluir que mediante sea más grande el área de las parcelas, mayor
será el precio de venta de las casas.
e. Estime el modelo de regresión en (c) utilizando solo casas que están en lotes grandes. Repita la
estimación para casas que no están en grandes lotes. Interpreta las estimaciones. ¿Cómo se
comparan las estimaciones?
f. Precio de venta de la casa de la parcela contra EDAD. Estimar el modelo lineal SPRICE ¼ d1 þ d2AGE
þ e. Interpretar los coeficientes estimados. Repita este ejercicio usando el modelo log-linear
lnðSPRICEÞ ¼ u1 þ u2AGE þ e. Basado en las parcelas y ajuste visual de las líneas de regresión
estimadas, cuál de estos dos modelos le gustaría ¿preferir? Explique.
Como podemos apreciar el modelo no lineal presenta un coeficiente de determinación moderado por lo que sí
se puede demostrar por este modelo el precio de las ventas por medio de los años de antigüedad.
El valor P es menor que un nivel de significancia por lo dado a un 0,01 por lo que se rechaza Ho si y se
puede concluir que los años pueden ser incluida en el modelo de regresión.
𝒑𝒓𝒆𝒄𝒊𝒐 = 𝟏𝟐𝟖𝟑𝟕𝟕. 𝟐 − 𝟕. 𝟐𝟏𝒙𝟐
Cuando todo permanece constante el precio de venta de las casas será de 128377.2
Al aumentar los años de antigüedad el precio de las casas reducirá en 7.21 USD
Mientras aumente los años de antigüedad el precio de las casas será reducido.
Modelo logarítmico
Tabla 5 Regresión con modelo logarítmico..
g. Estimar una regresión lineal SPRICE ¼ h1 þ h2LGELOT þ e con dependientes variable SPRICE y
variable independiente el indicador LGELOT que identifica las casas en lotes más grandes. Interpreta
estos resultados.
Tabla 6 regresión lineal.
El coeficiente de determinación es muy bajo por lo que no sería razonable escoger esta variable para demostrar el
precio de venta de las casas, sería inútil representar por lo que es necesario buscar otras variables.
Ecuación
𝒑𝒓𝒆𝒄𝒊𝒐 = 𝟏𝟏𝟓𝟐𝟐𝟎 + 𝟏𝟑𝟑𝟕𝟗𝟕𝒙
La variable x puede tomar dos valores cuando X=1
Cuando x=0
𝒑𝒓𝒆𝒄𝒊𝒐 = 𝟏𝟏𝟓𝟐𝟐𝟎