Anda di halaman 1dari 9

DEPARTAMENTO DE ECONOMA GENERAL Y ESTADSTICA

PRCTICA 13 REGRESIN LINEAL SIMPLE

ESTADSTICA E INTRODUCCIN A LA ECONOMETRA 2 LADE. CURSO 2009-2010

Profesorado: Prof. Ana Gonzlez Galn Prof. Antonio Hernndez Moreno Prof. Miguel ngel Rivas Carrasco Prof. M Mar Romero Miranda

Regresin Lineal

Curso 2009-2010

1. REGRESIN LINEAL La regresin lineal estima los coeficientes de la ecuacin lineal, con una o ms variables independientes, que mejor predice el valor de la variable dependiente. Se denomina regresin lineal simple, a aqulla en la que aparece una sola variable independiente y regresin lineal mltiple, cuando aparecen ms de una variable independiente en la ecuacin. Ejemplo 1 (archivo terreno.sav). Estn relacionados el consumo a los 120 Km/h de un todo terreno con la cilindrada que posee? Analizamos en primer lugar el diagrama de dispersin. El procedimiento para obtener dicho grfico, como ya se ha visto en una prctica anterior, es Grficos/Cuadros de

dilogos antiguos/Dispersin. Puntos/Dispersin simple. Pues bien, en el diagrama de dispersin se observa una relacin lineal entre estas variables.

El consumo a los 120 Km/h y la cilindrada tienen una relacin positiva, esto es, a medida que la cilindrada aumenta, el consumo medio a los 120 Km./h tambin lo hace. Con la regresin lineal es posible modelar la relacin entre estas variables, de modo que se puede determinar una expresin matemtica que permita predecir el consumo a los 120 Km/h a partir de la cilindrada del vehculo.

Regresin Lineal

Curso 2009-2010

Para la realizacin de un anlisis de la regresin lineal en SPSS deberemos seleccionar los siguientes comandos: Analizar Regresin Lineales

Tras la realizacin de esta operacin nos aparecer el cuadro de dilogo que presentamos a continuacin, en el que procederemos a introducir la variable dependiente del modelo (y) as como la variable independiente del mismo (X), siendo nuestro objetivo la estimacin de los parmetros de un modelo lineal que pueda ser representado a travs de la siguiente funcin:

y i = 0 + 1 xi

Regresin Lineal

Curso 2009-2010

Entramos en dependiente la variable consumo a 120 km/h y en independiente la variable cilindrada. En principio, dejamos el resto de opciones por defecto y pulsamos aceptar, aunque algunas de estas opciones se pueden modificar, por ejemplo, en el recuadro Variable de seleccin, podemos introducir una regla de seleccin, de modo que los casos definidos por sta sern los que se incluyan en el anlisis. Por ejemplo, si en nuestro caso queremos incluir para el anlisis slo los vehculos con 4 plazas, utilizaremos como variable de seleccin el n de plazas y se define la regla: igual que 4 en el botn Regla. Tambin se permite un valor de cadena. Siguiendo con el ejemplo 1, SPSS muestra los siguientes resultados:

Variables introducidas/eliminadasb Variables Modelo 1 introducidas Cilindrada (cm cbicos)


a

Variables eliminadas . Mtodo Introducir

a. Todas las variables solicitadas introducidas. b. Variable dependiente: Consumo 120 km/h

Resumen del modelo R cuadrado Modelo 1 R ,644a R cuadrado ,415 corregida ,409 Error tp. de la estimacin 1,7738

a. Variables predictoras: (Constante), Cilindrada (cm cbicos)

ANOVAb Suma de Modelo 1 Regresin Residual Total cuadrados 240,909 339,806 580,715 gl 1 108 109 Media cuadrtica 240,909 3,146 F 76,568 Sig. ,000a

a. Variables predictoras: (Constante), Cilindrada (cm cbicos) b. Variable dependiente: Consumo 120 km/h

Regresin Lineal

Curso 2009-2010

Coeficientesa Coeficientes Coeficientes no estandarizados Modelo 1 (Constante) Cilindrada (cm cbicos) a. Variable dependiente: Consumo 120 km/h B 6,957 ,002 Error tp. ,628 ,000 ,644 tipificados Beta t 11,077 8,750 Sig. ,000 ,000

Empecemos analizando esta ltima tabla, en la que aparecen los coeficientes de la ecuacin de la recta de regresin lineal y sus errores estndar. A partir de estos coeficientes obtendramos la recta de regresin lineal que presentamos a continuacin: ^ CONS120 = 6,957 + 0,002 * Cilindrada Adems se realiza un contraste de hiptesis que utiliza un estadstico distribuido segn una distribucin T-Student; y que trata de probar como hiptesis nula que los parmetros de la ecuacin toman un valor igual a cero, lo cual supondra que las variables dependiente e independiente no estaran relacionadas linealmente. Ho: 1=0 H1: 10 De modo que al igual que en cualquier otro contraste, cuanto ms bajos sean los niveles de significacin ms significativo ser el contraste, y podremos rechazar con una mayor confianza la hiptesis nula. Otro de los cuadros que se nos muestra en la salida de SPSS al ejecutar el procedimiento de regresin lineal hace referencia a otro contraste cuyo estadstico sigue una distribucin FSnedeccor:
ANOVAb Suma de Modelo 1 Regresin Residual Total cuadrados 240,909 339,806 580,715 gl 1 108 109 Media cuadrtica 240,909 3,146 F 76,568 Sig. ,000a

Regresin Lineal

Curso 2009-2010

a. Variables predictoras: (Constante), Cilindrada (cm cbicos) b. Variable dependiente: Consumo 120 km/h

Este contraste trata de probar , de forma simultnea, si los parmetros del modelo son iguales a cero (excepto la constante). Cuanto menor sea el valor del nivel de significacin podemos rechazar con ms confianza la hiptesis nula de que los parmetros sean iguales a cero. En regresin simple es un contraste equivalente al que se presenta en la tabla de Coeficientes. Finalmente, el ltimo cuadro que se nos presenta en esta salida recoge distintas medidas de la bondad del ajuste, entre las que destacamos el coeficiente de determinacin, que representa el porcentaje de la varianza total explicada por nuestro modelo, tomando valores entre 0 y 1, de modo que cuanto ms cercano sea a 1 su valor, mejor ser el modelo.

Resumen del modelo R cuadrado Modelo 1 R ,644a R cuadrado ,415 corregida ,409 Error tp. de la estimacin 1,7738

a. Variables predictoras: (Constante), Cilindrada (cm cbicos)

Para que se nos muestren los valores de los residuos y las predicciones del modelo elaborado, deberemos pulsar: Analizar Regresin Lineales Guardar

Y seleccionamos: Valores pronosticados no tipificados y Residuos no tipificados.

Regresin Lineal

Curso 2009-2010

Si seleccionamos estas opciones SPSS nos crear dos nuevas variables en el editor de datos PRE_1 y RES_1 que recogen respectivamente las predicciones y los residuos:

Adems en la ventana de resultados se nos mostrar una nueva tabla en la que se ofrecen algunos estadsticos acerca de las variables creadas:

Estadsticos sobre los residuosa Mnimo Valor pronosticado Residual Valor pronosticado tip. Residuo tp. 9,615 -3,4656 -1,772 -1,954 Mximo 17,637 4,9928 3,624 2,815 Media 12,249 ,0000 ,000 ,000 Desviacin tpica 1,4867 1,7656 1,000 ,995 N 110 110 110 110

a. Variable dependiente: Consumo 120 km/h

2. EJERCICIOS (Pertenecen a la Relacin de problemas n 15).

Ejercicio 1.- C.L. es propietaria de una cadena de tiendas de helados en San Pedro, Texas. Est tratando de encontrar alguna variable que tenga una relacin positiva con las ventas diarias y decide investigar la temperatura ambiental promedio. Para ello recoge datos para una muestra aleatoria de 10 das:

Ventas diarias (galones) Temperatura promedio (F)

110 72

127 79

140 85

151 90

89 66

187 95

205 100

190 98

136 82

165 91

Regresin Lineal

Curso 2009-2010

Calcule el coeficiente de correlacin. Calcule la ecuacin de regresin muestral. Interprete la pendiente o coeficiente de regresin. Calcule el error estndar de la estimacin y el coeficiente de determinacin. Pruebe el coeficiente de regresin con un nivel de significacin del 5%. Calcule la tabla ANOVA y realice la prueba F (=5%).

Ejercicio 2.- Se ha pedido a la contable del servicio de mensajera City Parcel, J.F., que calcule una nueva tasa de horarios para los repartos locales. Ella tiene datos sobre el costo promedio de operacin del vehculo por milla de reparto, pero necesita determinar el tiempo promedio por milla para hacer dicho reparto. Ella recoge los datos de los siguientes 13 recorridos:
Minutos. Y Millas .X 28 11 27 10 35 15 15 7 8 2 14 5 20 8 29 9 13 4 16 3 40 14 9 3 31 12

Bosqueje los datos en un diagrama de dispersin. Calcule el coeficiente de correlacin y el de determinacin. Determine la ecuacin de regresin muestral. Cul es el tiempo promedio necesario por milla para hacer el reparto? Obtenga un intervalo de confianza para dicho parmetro con un nivel de confianza del 98%.

Construya la tabla de regresin ANOVA y realice una prueba para determinar si la ecuacin de regresin explica un porcentaje significativo de la varianza de la variable dependiente. Utilice un nivel de significacin del 1%.

Regresin Lineal

Curso 2009-2010

BIBLIOGRAFA

Camacho Rosales, J. (2000): Estadstica con SPSS para Windows. Ed. Rama, Madrid. Martn Pliego, F.J. (1994): Introduccin a la Estadstica Econmica y Empresarial (Teora y Prctica). Editorial AC, Madrid. SPSS Inc. (1999): SPSS 9.0. Manual de Usuario, SPSS, Chicago. Visauta Vinacua, B. (1998): Anlisis Estadstico con SPSS para Windows. Ed. McGraw-Hill, Madrid.

Anda mungkin juga menyukai