Anda di halaman 1dari 9

Unidad 7

Inferencia Estadstica

Anlisis de Regresin lineal simple y Correlacin

Contenido:

Matriz de correlaciones. Regresin lineal simple. Regresin curvilineal. Ejercicios

Anlisis de Regresin lineal simple y correlacin

Introduccin
A continuacin se muestra la base de datos con la que se explicar los procedimientos involucrados al realizar un anlisis de regresin lineal simple. Los datos corresponden a las ventas totales por ao de cada una de 11 regiones en las que una compaa opera. Dicha compaa se dedica a la venta de repuestos para automviles. Se pretende estimar el valor de las ventas futuras conociendo el nmero de distribuidoras establecidas en cada regin y el nmero de automviles registrados para cada regin.

MATRIZ DE CORRELACIONES
El primer paso que daremos consiste en analizar la matriz de correlaciones. Analizando dicha matriz se podr determinar cul de las variables independientes esta ms correlacionada con la variable dependiente. La secuencia de pasos es: Analizar, Correlaciones, Bivariadas:

Obtenemos el siguiente resultado:

106

Anlisis de Regresin lineal simple y correlacin

Correlaciones Ventas (mills $) 1 Nro Nro Autos distribuidoras (mills) .739** .548 .009 .081 11 11 11 .739** 1 .670* .009 .024 11 11 11 .548 .670* 1 .081 .024 11 11 11

Ventas (mills $)

Nro distribuidoras

Nro Autos (mills)

Correlacin de Pearson Sig. (bilateral) N Correlacin de Pearson Sig. (bilateral) N Correlacin de Pearson Sig. (bilateral) N

**. La correlacin es significativa al nivel 0,01 (bilateral). *. La correlacin es significante al nivel 0,05 (bilateral).

Se observa que la variable ventas est ms correlacionada con la variable Nmero de distribuidoras (correlacin 0.739) por lo que un primer paso ser realizar un anlisis de regresin lineal simple con esta variable independiente.

REGRESION LINEAL SIMPLE ENTRE LA INDEPENDIENTE MS CORRELACIONADA CON Y


La secuencia es: Analizar, Regresin, Lineal, se mostrar el siguiente cuadro de dilogo:

VARIABLE

Por el momento slo se proceder a obtener la ecuacin del modelo as como algunos valores representativos para la validacin de dicho modelo. Un anlisis ms riguroso del modelo y su validacin se har para el caso de regresin lineal mltiple.

107

Anlisis de Regresin lineal simple y correlacin

Resultados obtenidos:
Resumen del modelo Modelo 1 R .739a R cuadrado .546 R cuadrado corregida .496 Error tp. de la estimacin 9.7718

a. Variables predictoras: (Constante), Nro distribuidoras

El coeficiente de determinacin, denotado por R2 (0.546) implica que el 54.6% de variacin en las ventas pueden ser explicadas por el modelo de regresin.
ANOVAb Modelo 1 Suma de cuadrados 1033.836 859.393 1893.229 gl 1 9 10 Media cuadrtica 1033.836 95.488 F 10.827 Sig. .009a

Regresin Residual Total

a. Variables predictoras: (Constante), Nro distribuidoras b. Variable dependiente: Ventas (mills $)

La tabla de Anlisis de Varianza permite realizar la prueba de significacin global del modelo, se propone las siguientes hiptesis: H o : 1 = 0 En forma conjunta las variables no contribuyen al modelo H 1 : i 0 Al menos una variable es significativa para el modelo Analizando el P-Valor (0.009), el cual es inferior al 5% (nivel de significacin propuesto usualmente para la prueba), se decide que se debe rechazar la hiptesis nula con lo cual concluimos que la variable Nmero de distribuidoras s contribuye significativamente al modelo.
Coeficientesa Coeficientes no estandarizados B Error tp. 10.881 6.409 .012 .004 Coeficientes estandarizad os Beta .739

Modelo 1

(Constante) Nro distribuidoras

t 1.698 3.290

Sig. .124 .009

a. Variable dependiente: Ventas (mills $)

El modelo estimado para el presente caso ser: entas = 10.881 + 0.012( Nro de distribuidoras) V Adems de la prueba de verificacin global se puede realizar la prueba de verificacin individual de la variable independiente. H o : i = 0 La variable no es significativa para el modelo H 1 : i 0 La variable es significativa para el modelo Para el caso desarrollado (regresin lineal simple), esta prueba es anloga a la prueba de verificacin global.

108

Anlisis de Regresin lineal simple y correlacin

Una forma grfica de verificar la relacin lineal entre Y con X es realizar un grfico de dispersin, el cul muestra la posible tendencia y/o relacin posible entre variable dependiente e independiente. La secuencia para obtener dicho grfico es la siguiente:

En el cuadro de dilogo (Dispersin simple) se ingresar la informacin de la siguiente manera:

El resultado que se obtiene es el siguiente:

52.3 46.2 38.2


A

A A

Ventas (mills $)

35.0 33.1 30.0 26.0 25.2 20.2 16.0 3.5


A A A A A A

125

480

650

1233

1694

1699

1840

2011

2214

2302

2850

Nro distribuidoras

109

Anlisis de Regresin lineal simple y correlacin

REGRESIN CURVILINEAL
Analizaremos los diferentes modelos curvilneos que puedan formarse para determinar cul de ellos es el mejor. Los datos se muestran a continuacin: La secuencia para realizar una regresin curvilnea es la siguiente: Analizar, Regresin, Estimacin Curvilnea

Como se muestra, tenemos la posibilidad de elegir entre varios modelos. Para desarrollar nuestro ejemplo hallaremos los coeficientes estimados y la tabla de anlisis de varianza de los modelos: Lineal, Cuadrtico, Potencia y Exponencial.

110

Anlisis de Regresin lineal simple y correlacin

Los resultados que obtenemos son los siguientes:

LINEAL
Resumen del modelo R cuadrado corregida .920 Error tpico de la estimacin 9.017

R .966

R cuadrado .933

La variable independiente esMillas. ANOVA Suma de cuadrados 5675.152 406.557 6081.709 Media cuadrtica 5675.152 81.311

gl 1 5 6

F 69.795

Sig. .000

Regresin Residual Total

La variable independiente esMillas. Coeficientes Coeficientes no estandarizados B Millas (Constante) -2.040 91.660 Error tpico .244 5.080 Coeficientes estandarizados Beta -.966 t -8.354 18.042 Sig. .000 .000

CUADRTICO
Resumen del modelo R cuadrado corregida .979 Error tpico de la estimacin 4.584

R .993

R cuadrado .986

La variable independiente esMillas. ANOVA Suma de cuadrados 5997.661 84.048 6081.709 Media cuadrtica 2998.830 21.012

Regresin Residual Total

gl 2 4 6

F 142.721

Sig. .000

La variable independiente esMillas. Coeficientes Coeficientes no estandarizados B -3.924 .048 99.897 Error tpico .497 .012 3.330 Coeficientes estandarizados Beta -1.858 .922 t -7.900 3.918 29.998 Sig. .001 .017 .000

Millas Millas ** 2 (Constante)

111

Anlisis de Regresin lineal simple y correlacin

POTENCIA

Coeficientes Coeficientes Coeficientes no estandarizados B ln(Millas) (Constante) -,428 126,278 Error tpico ,084 25,995 estandarizados Beta -,917 t -5,125 4,858 Sig. ,004 ,005

La variable dependiente es ln(Porcentaje).

EXPONENCIAL
Resumen del modelo R .989 R cuadrado .979 R cuadrado corregida .974 Error tpico de la estimacin .104

La variable independiente esMillas. ANOVA Suma de cuadrados Regresin Residual Total 2.496 .054 2.550 gl 1 5 6 La variable independiente esMillas. Coeficientes Coeficientes no estandarizados B -.043 Error tpico .003 Coeficientes estandarizados Beta -.989 t -15.163 Sig. .000 .000 Media cuadrtica 2.496 .011 F 229.924 Sig. .000

Millas (Constante)

99.496 5.840 17.036 La variable dependiente es ln(Porcentaje).

112

Anlisis de Regresin lineal simple y correlacin

A la vista de los resultados, el modelo cbico presenta el mayor coeficiente de determinacin pero la variable independiente que acompaa al trmino cbico no es significativa para el modelo por lo que pasamos a elegir el modelo cuadrtico por tener el segundo mejor R2 y adems por que la variable que acompaa al trmino cuadrtico es significativa.

113

Anda mungkin juga menyukai