Anda di halaman 1dari 3

Anexo 1.

Tema 3
Aplicacin del sistema EXCEL en regresin mltiple.
Debido a que el procedimiento para determinar la mejor ecuacin de regresin, en el ejemplo del epgrafe 3.3.2,
comprende estimaciones para el caso de ms de una variable independiente, resulta conveniente utilizar algn
sistema, como el EXCEL, que permita abreviar los clculos que resultan necesarios para ello. Habr que utilizar
las herramientas para anlisis, que es un componente que, dentro de las opciones que el sistema brinda, permite
efectuar las operaciones que conducen a determinar aquellas cuestiones de las que trata la regresin, sea
simple o mltiple.
Para resolver los elementos que tienen que ver con la ecuacin 3 del referido ejemplo, que involucra las variables
X2 y X3 se declar el problema de la manera que aparece en la figura A3.1.1, donde ya tambin aparece la tabla
de resultados con sus tres componentes principales: Estadsticas de regresin, tabla ANOVA y tabla con los
coeficientes de regresin. Estos resultados aparecen debajo, con ms claridad, en la tabla A3.1.1 y son
comentados posteriormente.

Fig A3.1.1.-Muestra de la manera en que se declar para EXCEL el problema de regresin abordado y su respuesta.

44

Tabla A3.1.1.- Muestra de la salida del sistema EXCEL al procesar el problema de regresin tratado como
ejemplo
Estadsticas de la regresin
Coeficiente de correlacin
0.998927
mltiple
76
0.997856
Coeficiente de determinacin R2
68
0.997526
R2 ajustado
93
157.0098
Error tpico
98
Observaciones

16

ANLISIS DE
VARIANZA
Grados de
libertad
Regresi
n
2
Residuo
s
13
Total

15

Suma de
cuadrados

Promedio de los
cuadrados

149203028
320477.405

F
3026.171
74601513.8
78

Valor crtico
de F
4.4882E-18

24652.1081

149523505

Coeficientes

Error tpico

Estadstico t

Probabilidad

Inferior 95%

Superior 95%

Intercepcin

22.3250992

48.8668465

0.45685574

0.65531492

-83.245304

127.895502

X2

0.88744973

0.01382199

64.2056558

1.1763E-17

0.85758914

0.91731032

X3

1.25996617

0.05732124

21.9807916

1.1501E-11

1.13613117

1.38380117

Las estadsticas de regresin brindan informacin acerca de la calidad del ajuste.medinte el valor R 2=0,998, que
significa que el 99% de la variacin de los viajes atrados en la hora pico, alrededor de su media, se explica por la
regresin que comprende las plazas de empleo en la manufactura y servicios y comercio. La correlacin R entre
Y y Ye es altsima, 0,999. El valor ajustado de R2 sale de: R2=R2-(1-R2)(k-1)/(N-k),donde k es el nmero de
coeficientes a estimar y N el nmero de observaciones. En este caso R 2 ajustado=[0,998-(1-0,998)(3-1)/(13)]=
0,997 El error tpico se refiere al valor estimado de la desviacin estndar de las diferencias (error) entre Yes y Y
observado. Se le llama tambin error estndar de la regresin o de la estimacin..
La parte de la tabla que se refiere al anlisis de varianza (ANOVA) desglosa la suma de cuadrados totales

( Y Y )2

en sus dos componentes: la suma de cuadrados de los residuos o errores [(Y Ye) 2] y la suma

de cuadrados debido a la regresin

45

( Y esY ) 2

.De manera que si:

R2=1-(Suma cuadrados de los residuos /Suma cuadrados totales)=1- (320477.405/149523505)=0,998, que es el


valor dado en la primera subtabla para R2.
La columna que se titula F arroja los resultados de una prueb F para una hiptesis bsica H 0: Aa=0 y A3=0 frente
a la hiptesis alternativa H1 de que al menos uno de los coeficientes de poblacin A2 o A3 no sea cero.El valor F
calculado por EXCEL sigue la expresin: F=[Suma cuadrados de la regresin/(k-1)] / [Suma cuadrados residuos/
(N-k)], lo que significa en este caso. F= [149203028/2] / [320477.405/13]= 3026,17, valor muy superior al valor
crtico de F, para un 5% de error tipo , dos colas,por lo que se rechaza H0 para un nivel de significacin de 0,05.
En cuanto a la subtabla de los coeficientes de regresin, la columna coeficientes encierra el estimado mnimo
cuadrtico de los coeficientes de poblacin Aj (A0, A2 y A3 en este caso). Esos estimadores fueron llamados a 0, a2
y a3 en este problema. El error tpico de la tercera columna expresa la desviacin estndar de los estimadores de
los respectivos coeficientes mientras que el estadgrafo t .seala el valor calculado de t para la hiptesis bsica
H0: Aj=0 frente a la alternativa H1:Aj 0.Este valor calculado de t resulta de dividir el valor del coeficiente estimado
por su desviacin estndar y se compara con el t de la de distribucin de Student para (N-k) grados de libertad,
dos colas en este caso. La columna probabilidad seala el valor p de la prueba (dos colas en este caso), que
no es ms que la probabilidad de que el t calculado supere al t correspondiente de la distribucin terica, lo que
se escribe como: Pr{|t| > t-Stat}, donde t es el valor del estadgrafo para (N-k) grados de

libertad (que viene siendo el t crtico)

y t-stat es el calculado. Para el caso de los

coeficientes de las variables, que son los ms importantes, el valor p es inferior a 0,05, lo
que quiere decir que se rechaza la hiptesis bsica H 0 para un 5% de significacin.
Adems, ya se haba visto anteriormente que, en conjunto, los coeficientes A 2 y A3 eran
significativamente diferentes de cero. No puede decirse lo mismo para el trmino
independiente. Las columnas inferior 95% y superior 95% definen el intervalo de
confianza para los coeficientes de poblacin (A 0, A2, A3).
Por todo lo anterior la ecuacin:

Y=22.3250992+0.88744973X2 +1.25996617X3 rene buenas condiciones,

desde el punto de vista estadstico, para ser considerada como un estimador de los viajes atrados en la hora
pico para cualquiera de las zonas. Las dems cuestiones para la seleccin de ella u otra como la preferida se
comentan en el texto del epgrafe 3.3.2.

46

Anda mungkin juga menyukai