Tema 3
Aplicacin del sistema EXCEL en regresin mltiple.
Debido a que el procedimiento para determinar la mejor ecuacin de regresin, en el ejemplo del epgrafe 3.3.2,
comprende estimaciones para el caso de ms de una variable independiente, resulta conveniente utilizar algn
sistema, como el EXCEL, que permita abreviar los clculos que resultan necesarios para ello. Habr que utilizar
las herramientas para anlisis, que es un componente que, dentro de las opciones que el sistema brinda, permite
efectuar las operaciones que conducen a determinar aquellas cuestiones de las que trata la regresin, sea
simple o mltiple.
Para resolver los elementos que tienen que ver con la ecuacin 3 del referido ejemplo, que involucra las variables
X2 y X3 se declar el problema de la manera que aparece en la figura A3.1.1, donde ya tambin aparece la tabla
de resultados con sus tres componentes principales: Estadsticas de regresin, tabla ANOVA y tabla con los
coeficientes de regresin. Estos resultados aparecen debajo, con ms claridad, en la tabla A3.1.1 y son
comentados posteriormente.
Fig A3.1.1.-Muestra de la manera en que se declar para EXCEL el problema de regresin abordado y su respuesta.
44
Tabla A3.1.1.- Muestra de la salida del sistema EXCEL al procesar el problema de regresin tratado como
ejemplo
Estadsticas de la regresin
Coeficiente de correlacin
0.998927
mltiple
76
0.997856
Coeficiente de determinacin R2
68
0.997526
R2 ajustado
93
157.0098
Error tpico
98
Observaciones
16
ANLISIS DE
VARIANZA
Grados de
libertad
Regresi
n
2
Residuo
s
13
Total
15
Suma de
cuadrados
Promedio de los
cuadrados
149203028
320477.405
F
3026.171
74601513.8
78
Valor crtico
de F
4.4882E-18
24652.1081
149523505
Coeficientes
Error tpico
Estadstico t
Probabilidad
Inferior 95%
Superior 95%
Intercepcin
22.3250992
48.8668465
0.45685574
0.65531492
-83.245304
127.895502
X2
0.88744973
0.01382199
64.2056558
1.1763E-17
0.85758914
0.91731032
X3
1.25996617
0.05732124
21.9807916
1.1501E-11
1.13613117
1.38380117
Las estadsticas de regresin brindan informacin acerca de la calidad del ajuste.medinte el valor R 2=0,998, que
significa que el 99% de la variacin de los viajes atrados en la hora pico, alrededor de su media, se explica por la
regresin que comprende las plazas de empleo en la manufactura y servicios y comercio. La correlacin R entre
Y y Ye es altsima, 0,999. El valor ajustado de R2 sale de: R2=R2-(1-R2)(k-1)/(N-k),donde k es el nmero de
coeficientes a estimar y N el nmero de observaciones. En este caso R 2 ajustado=[0,998-(1-0,998)(3-1)/(13)]=
0,997 El error tpico se refiere al valor estimado de la desviacin estndar de las diferencias (error) entre Yes y Y
observado. Se le llama tambin error estndar de la regresin o de la estimacin..
La parte de la tabla que se refiere al anlisis de varianza (ANOVA) desglosa la suma de cuadrados totales
( Y Y )2
en sus dos componentes: la suma de cuadrados de los residuos o errores [(Y Ye) 2] y la suma
45
( Y esY ) 2
coeficientes de las variables, que son los ms importantes, el valor p es inferior a 0,05, lo
que quiere decir que se rechaza la hiptesis bsica H 0 para un 5% de significacin.
Adems, ya se haba visto anteriormente que, en conjunto, los coeficientes A 2 y A3 eran
significativamente diferentes de cero. No puede decirse lo mismo para el trmino
independiente. Las columnas inferior 95% y superior 95% definen el intervalo de
confianza para los coeficientes de poblacin (A 0, A2, A3).
Por todo lo anterior la ecuacin:
desde el punto de vista estadstico, para ser considerada como un estimador de los viajes atrados en la hora
pico para cualquiera de las zonas. Las dems cuestiones para la seleccin de ella u otra como la preferida se
comentan en el texto del epgrafe 3.3.2.
46