Anda di halaman 1dari 30

Ejercicio 16:

Se obtuvieron los siguientes datos de 14 departamentos del pas para


realizar un estudio estadstico de la maternidad adolescente (Y en %),
familia en extrema pobreza (X
1
en %) y familia desintegrada (X
2
)












a) Escriba el sistema de ecuaciones normales del modelo de regresin
lineal de Y con respecto a X
1
y X
2
en forma de matrices:
( ) XX b XY ' ' =


1 20 15
1 25 15
1 22 20
1 18 24
1 15 26
1 14 19
1 19 17
1 14 12
1 28 33
1 24 18
1 15 18
1 19 28
1 14 18
1 5 22
X
(
(
(
(
(
(
(
(
(
(
( =
(
(
(
(
(
(
(
(
(
(


12
14
16
18
20
16
10
13
22
18
11
15
13
29
Y
(
(
(
(
(
(
(
(
(
(
( =
(
(
(
(
(
(
(
(
(
(



Dpto. Y X
1
X
2

1 12 20 15
2 14 25 15
3 16 22 20
4 18 18 24
5 20 15 26
6 16 14 19
7 10 19 17
8 13 14 12
9 22 28 33
10 18 24 18
11 11 15 18
12 15 19 28
13 13 14 18
14 29 5 22
1 1 1 1 1 1 1 1 1 1 1 1 1 1
' 20 25 22 18 15 14 19 14 28 24 15 19 14 5
15 15 20 24 26 19 17 12 33 18 18 28 18 22
X
(
(
=
(
(


14 252 285
' 252 4978 5214
285 5214 6225
X X
(
(
=
(
(



0
1
2
b
|
|
|
(
(
=
(
(


227
' 3987
4832
X Y
(
(
=
(
(


(XX)*b=XY:

0
1
2
14 252 285 227
252 4978 5214 * 3987
285 5214 6225 4832
|
|
|
( ( (
( ( (
=
( ( (
( ( (



0 1 2
0 1 2
0 1 2
14 252 285 227
252 4978 5214 3987
285 5214 6225 4832
| | |
| | |
| | |
+ + =
+ + =
+ + =



b) Obtenga el vector solucin
( )
1
' ' X X X Y |

= del sistema de ecuaciones
normales y escriba el modelo de regresin propuesto.

( )
1
1.50879144 0.03282057 0.04158701
' 0.03282057 0.00235113 0.00046665
0.04158701 0.00046665 0.00245549
X X


(
(
=
(
(


( ) ( )
1
10.691634
' * ' 0.33119252
0.56413205
X X X Y

(
(
=
(
(




1 2

10.692 0.331 0.564 Y X X = +




c) Pruebe la significacin global de los coeficientes de regresin del
modelo estimado aplicado el criterio de la probabilidad P de la prueba.
Es significativo al nivel 5%?, y al nivel 1%?

PRUEBA DE HIPOTESIS GLOBAL
1. Anlisis de varianza:
1 0 2
= H : 0 =
a i
H : 0 = (Al menos uno de los parmetros es de 0)
2. Funcin de prueba:
TABLA ANOVA
PRUEBA DE
VARIACION
GL
SC
(suma de cuadrados)
MC
(cuadrados medios)
F
Regresin K=2 SSR=151.780 MSR = SSR/k=75.890
FC=MSR/MSE=4.728 Error n-k-1=11 SSE=176.578 MSE = SSE/n-k-1 = 16.053
Total n-1=13 SYY=328.357



K: Nmero de variables explicativas (independientes)
SSR: Suma de cuadrados de la regresin
SSE: Suma de cuadrados de los residuales
MSR: Cuadrados medios de la regresin
MSE: Cuadrados medios de los errores

3. Regin de rechazo:

C 1 ,k,n k 1
F F

>


0.95,2,11
F 4.728 5.256 = <
,

se acepta
4. Conclusin:
Ninguna variable explicativa (independientes) est asociada
significativamente con la variable explicada (dependiente).
P valor:
( )
2,11 4.728 0.033 = > = (

P P F

Al nivel de significancia de 1%:
0.99,2,11
F 4.728 8.912, = <
0
H
Se acepta
Ninguna variable explicativa (independientes) est asociada
significativamente con la variable explicada (dependiente).
d) Analice la matriz de correlacin simple (o de orden cero) para determinar
que variable independiente tiene fuerte o dbil correlacin con la variable
dependiente.
Segn este criterio que variable independiente debera eliminar del
modelo al nivel de significacin 2%?
12 1
21 2
31 32
1
1
1
Y
Y
r r
R r r
r r
(
(
=
(
(



( )
,
i j
i j
ij
X X
Cov X X
r
S S
=
Correlaciones de orden cero
Variables X1 X2 Y
X1 1 0,194217 -0,259867
X2 0,194217 1 0,565825
Y -0,259867 0,565825 1


Significacin unilateral de los coeficientes de correlacin
Variables Y X1 X2
Y

0,184797 0,017470
X1 0,184797

0,252922
X2 0,017470 0,252922


Se observa en la ltima columna que la variable Y est fuertemente
correlacionada con
2
X ; pero no con
1
X .
Con una significancia de 2%, la variable a eliminar es:
1
X

e) Existe multicolinearidad entre las dos variables independientes?

La correlacin simple de X
1
con X
2
es 0.194, su significancia es 0.253;
por lo tanto no existe multicorinealidad.

Otra forma de calcular si existe multicolinearidad entre las variables es
usando la prueba del factor de inflacin de la varianza, el cual por lo
general se escribe VIF. El valor de VIF se determina como sigue:


2
1
1
j
VIF
R
=





( )
1
2
1
1.0014
1 0.0377
X
VIF = =

, X
1
no est correlacionada con la otra
variable independiente.

: es el coeficiente de determinacin mltiple de cada variable
independiente

f) Analice la matriz de correlacin parcial. Realice un comentario de la
correlacin parcial de Y con X
1
y de Y con X
2
. Qu variable
independiente se debera eliminar del modelo de regresin lineal al nivel
de significacin 2%?

12, 1,2
12, 2,1
1 ,2 2 ,1
1
1
1
Y Y
Y Y
Y Y
r r
R r r
r r
(
(
=
(
(


- Coeficiente de correlacin parcial de Y con X
1
cuando X
2

permanece constante:
( )( )
1 2 12
1,2
2 2
2 12
1 1
Y Y
Y
Y
r r r
r
r r

=


- Coeficiente de correlacin parcial de Y con X
2
cuando X
1

permanece constante:
( )( )
2 1 21
2,1
2 2
1 21
1 1
Y Y
Y
Y
r r r
r
r r

=


- Coeficiente de correlacin parcial de X
1
con X
2
cuando Y
permanece constante:
( )( )
12 1 2
12,
2 2
1 2
1 1
Y Y
y
Y Y
r r r
r
r r

=



Correlacin Parcial
Variables X1 X2 Y
X1 1 0,428607 -0,457157
X2 0,428607 1 0,650611
Y -0,457157 0,650611 1

El coeficiente de determinacin parcial Y con X
1,
manteniendo constante
X
2
y X
3
es
( )
2
2
y1,2
R 0.457 0.209 = = , entonces, 20.9%es el porcentaje de
la varianza Y que se asocia con X
1
y no con X
2
y X
3
.
De igual forma
( )
2
2
y1,2
R 0.651 0.424 = = .
Por lo tanto la variable a eliminar es X
2.
g) Utilice la tcnica del intervalo de confianza para determinar si alguna de
las variables independientes X
1
y X
2
no contribuyen al modelo de
regresin mltiple al nivel de confianza de 0.95.

Prueba de Hiptesis Individual:
1. Planteamiento de la hiptesis.

0 1 0 2
1 1 1 2
: 0 : 0
: 0 : 0
H H
H H
| |
| |
= =
= =


2. Nivel de significancia:
0.05 o =
3. Estadstico de prueba:
( )

j
j
t
ES
|
|
=
4. Regla de decisin:

Valor crtico:
1 2
0.3312 0.56413
1.7045 2.8414
0.1943 0.19854
t t

= = = =

Coeficientes Error tpico Estadstico t Probabilidad Inferior 95% Superior 95%
X1 -0,331 0,194 -1,705 0,116 -0,759 0,096
X2 0,564 0,199 2,841 0,016 0,127 1,001



0.975,11
2.201 t =

{ } 2.201 2.201 RC T o T = < >

Lmites de confianza:
| |
| |
1
2
0.3312 2.201*0.1943 0.759, 0.096
0.56413 2.201*0.19854 0.127,1.001
|
|
= =
= =

Como se puede observar el intervalo
1
| contiene el valor cero. Por lo
tanto podemos concluir que
1
0 | = ; razn por la cual se elimina
1
X
h) Obtenga la estimacin del modelo de regresin resultante. Existe
regresin simple en la poblacin al nivel de significacin 1%? Qu
porcentaje de la varianza de Y se explica en la regresin?
Y X2
12 15
14 15
16 20
18 24
20 26
16 19
10 17
13 12
22 33
18 18
11 18
15 28
13 18
29 22


1 15 12
1 15 14
1 20 16
1 24 18
1 26 20
1 19 16
1 17 10
1 12 13
1 33 22
1 18 18
1 18 11
1 28 15
1 18 13
1 22 29
X Y
( (
( (
( (
( (
( (
( (
( (
( (
( (
( (
( ( = =
( (
( (
( (
( (
( (
( (
( (
( (
( (
( (




1 1 1 1 1 1 1 1 1 1 1 1 1 1
'
15 15 20 24 26 19 17 12 33 18 18 28 18 22
X
(
=
(



14 285
'
285 6225
X X
(
=
(



( )
1
1.050632911 0.04810127
'
0.04810127 0.00236287
X X


(
=
(




227
'
4832
X Y
(
=
(



( ) ( )
1
6.06835443
' * '
0.498396624
X X X Y |

(
= =
(



El nuevo modelo es:
2

6.068 0.498 Y X = +


PRUEBA DE HIPOTESIS GLOBAL
1. Anlisis de varianza:
1 0 2
= H : 0 =
a i
H : 0 = (Al menos uno de los parmetros es de 0)
2. Funcin de prueba:

Grados de
libertad
Suma de
cuadrados
Promedio de
los cuadrados
F
Valor crtico de
F
Regresin 1 105,126088 105,126088
5,65115394 0,034939507 Residuos 12 223,2310549 18,6025879
Total 13 328,3571429



3. Regin de rechazo:

C 1 ,k,n k 1
F F

>


0.99,1,12
F 5.651 11.7542 = <
,

se acepta

4. Conclusin:
Con un nivel de confianza de 99% podemos asegurar que no existe
regresin simple en la poblacin.
P valor:
( )
1,12 5.651 0.0349 P P F = > = (


Coeficiente de determinacin:
2
2 2
2
X
Y
S
R
S
| =


( )
2
2
32.5549
0.498 0.3196
25.2582
R = =


2
0.3196 31.96% R = =


El porcentaje de la varianza Y que se explica en el modelo es
31.96% 32% ~













Ejercicio 17:
El gerente de una empresa textil de Gamarra utiliz a 30 operarios en un
estudio para determinar la relacin entre las siguientes variables:

Y = Comportamiento hacia el trabajo (Prueba calificada de 0 a20)
X
1
= Horas semanales de trabajo.
X
2
= Servicios en el hogar: Telfono, TV Cable, Internet (0 = Uno de los
tres, 1 = Dos de los tres, 2 = Los tres)
X
3
= N# de prendas que confecciona por semana.
X
4
= Aos de experiencia.

Si los datos obtenidos son:

Y X
1
X
2
X
3
X
4
5 50 0 30 0,6
5 53 0 31 1
6 55 0 31 1,5
6 58 1 32 1,8
8 61 1 32 2
9 62 0 33 2,4
9 62 2 34 2,8
10 63 0 35 3
10 63 1 35 3,5
10 65 2 36 4
10 65 0 36 4,6
10 69 1 36 5
11 68 0 37 5,8
12 69 1 37 6
13 69 1 38 6,7
14 70 1 38 8
14 70 1 39 8,4
15 72 1 39 8,6
15 72 0 40 8,9
16 73 0 41 9
16 74 0 42 9
16 74 1 43 9,1
16 75 0 44 9,2
17 75 0 44 9,8
17 76 1 45 10
17 77 0 45 10,2
18 78 1 46 10,8
18 78 1 47 11
19 79 1 48 11,5
20 80 2 49 11,6
a) Defina el modelo de regresin lineal tomando como variable
dependiente el comportamiento. Ajuste este modelo a los datos de la
muestra.


1 50 0 30 0.6
1 53 0 31 1
1 55 0 31 1.5
1 58 1 32 1.8
1 61 1 32 2
1 62 0 33 2.4
1 62 2 34 2.8
1 63 0 35 3
1 63 1 35 3.5
1 65 2 36 4
1 65 0 36 4.6
1 69 1 36 5
1 68 0 37 5.8
1 69 1 37 6
1 69 1 38 6.7
X
1 70 1 38 8
1 70 1 39 8.4
1 72 1 39 8.6
1 72 0 40 8.9
1 73 0 41 9
1 74 0 42 9
1 74 1 43 9.1
1 75 0 44 9.2
1 75 0 44 9.8
=
1 76 1 45 10
1 77 0 45 10.2
1 78 1 46 10.8
1 78 1 47 11
1 79 1 48 11.5
80 2 49 11.6
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(






5
5
6
6
8
9
9
10
10
10
10
10
11
12
13
Y
14
14
15
15
16
16
16
16
17
17
17
18
18
19
20
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
=
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(
(



X'=
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
50 53 55 58 61 62 62 63 63 65 65 69 68 69 69 70 70 72 72 73 74 74 75 75 76 77 78 78 79 80
0 0 0 1 1 0 2 0 1 2 0 1 0 1 1 1 1 1 0 0 0 1 0 0 1 0 1 1 1 2
30 31 31 32 32 33 34 35 35 36 36 36 37 37 38 38 39 39 40 41 42 43 44 44 45 45 46 47 48 49
0,6 1 1,5 1,8 2 2,4 2,8 3 3,5 4 4,6 5 5,8 6 6,7 8 8,4 8,6 8,9 9 9 9,1 9,2 9,8 10 10,2 10,8 11 11,5 11,6




X'X=
30 2055 20 1163 195,8
2055 142615 1400 80887 14210,2
20 1400 26 793 139,2
1163 80887 793 45967 8140,3
195,8 14210,2 139,2 8140,3 1644,1


(X'X)
-1
=
36,0464619 -0,472959 0,51601765 -0,36211775 1,54422617
-0,472959 0,01086445 -0,00823995 -0,00388456 -0,01764616
0,51601765 -0,00823995 0,08907161 -0,00394885 0,0217755
-0,36211775 -0,00388456 -0,00394885 0,01984949 -0,02124445
1,54422617 -0,01764616 0,0217755 -0,02124445 0,07256312

X'Y=
382
27161
268
15494
2940,3

(X'X)
-1
*(X'Y)=
-8,16251163
0,13811594
0,02774333
0,18695803
0,63871322

Modelo ajustado:
1 2 3 4

8.163 0.138 0.02774 0.187 0.639 = + + + + Y X X X X




b) Describa el ajuste del modelo a los datos aplicando una estadstica
adecuada.

Usaremos el coeficiente de determinacin mltiple:
2
=
SSR
R
SYY


( )
2

'* ' | = SSR X Y nY


= + SYY SSR SSE
( ) ( )

' '* ' | = SSE Y Y X Y




551, 325525
559,866667
8, 54114208
=
=
=
SSR
SYY
SSE


2
551, 325525
559,86666
0 9
7
. 85 = = R El ajuste del modelo es excelente.

El coeficiente de determinacin mltiple ajustado:
( )
2
2
o
=
A
MSE
R
Y


1
=

SSE
MSE
n k


( )
2
0.341645683
8, 541142
2
25
19.305747
8
1
0
o
= =
=
MSE
Y


2
0.3416456832
19.305747
1 0.98
1
2 = =
A
R

c) Pruebe la significacin del modelo de regresin estimado con el
mtodo de la probabilidad P.
PRUEBA DE HIPOTESIS GLOBAL
1. Anlisis de varianza:
1 0 2
= H : 0 =
a i
H : 0 = (Al menos uno de los parmetros es de 0)
2. Funcin de prueba:


Grados de
libertad
Suma de
cuadrados
Promedio
de los
cuadrados
F
Valor
crtico de F
Regresin 4 551,325525 137,831381
403,4336975 0,0000 Residuos 25 8,54114208 0,34164568
Total 29 559,866667




3. Regin de rechazo:

C 1 ,k,n k 1
F F

>


0.95,4,25
403.434 F 3.353 = >
,

se rechaza
4. Conclusin:
Al menos una variable explicativa (independientes) est asociada
significativamente con la variable explicada (dependiente).
P valor:
( )
4, 25 403.434 0.000 = > = (

P P F

d) Es significativa la correlacin mltiple?, a qu nivel?

2
R R =

0.985 0.992 R = =
; Por lo tanto la correlacin mltiple es
altamente significativa
























Ejercicio 18:
Continuando con el problema 17
a) Obtenga la matriz de correlacin de orden cero (o simple de
Pearson). Qu variables independientes tienen correlacin
significativa con la variable dependiente? Segn este criterio, Qu
variables independientes se deberan eliminar del modelo de
regresin?

12 13 14 1
21 23 24 2
31 32 34 3
41 42 43 4
51 52 53 54
1
1
1
1
1
Y
Y
Y
Y
r r r r
r r r r
R r r r r
r r r r
r r r r
(
(
(
( =
(
(
(




( )
,
i j
i j
ij
X X
Cov X X
r
S S
=



Correlaciones de orden cero
Variable X1 X2 X3 X4 Y
X1 1 0.196109 0.957245 0.970085 0.977354
X2 0.196109 1 0.167203 0.127255 0.158331
X3 0.957245 0.167203 1 0.967764 0.975337
X4 0.970085 0.127255 0.967764 1 0.987481
Y 0.977354 0.158331 0.975337 0.987481 1

Se observa en la ltima columna que la variable Y est fuertemente
correlacionada con
1 3 4
, , X X X ; pero no con
2
X .
Segn este criterio debera eliminarse
2
X




b) Analice la multicolinearidad (o correlacin entre variables
independientes). Segn este criterio, Qu variables independientes
deberamos omitir del modelo?
Correlaciones de orden cero
Variable X1 X2 X3 X4 Y
X1 1 0.196109 0.957245 0.970085 0.977354
X2 0.196109 1 0.167203 0.127255 0.158331
X3 0.957245 0.167203 1 0.967764 0.975337
X4 0.970085 0.127255 0.967764 1 0.987481
Y 0.977354 0.158331 0.975337 0.987481 1

Significacin unilateral de los coeficientes de correlacin
Variable X1 X2 X3 X4 Y
X1

,149 ,000 ,000 ,000
X2 ,149

,189 ,251 ,202
X3 ,000 ,189

,000 ,000
X4 ,000 ,251 ,000

,000
Y ,000 ,202 ,000 ,000


La correlacin simple de X
1
con X
2
es 0.196, de X
1
con X
3
es 0.957, de
X
1
con X
4
es 0.97, de X
2
con X
3
es 0.167, de X
2
con X
4
es 0.127, de X
3

con X
4
es 0.968; por lo tanto existe multicolinearidad.
Por lo tanto las variables a eliminar serian: X
1
y X
4
.
Otra forma de calcular si existe multicolinearidad entre las variables es
usando la prueba del factor de inflacin de la varianza, el cual por lo
general se escribe VIF. El valor de VIF se determina como sigue:


2
1
1
j
VIF
R
=





( )
1
2
1
10.2965
1 0.9502
X
VIF = =

, X
1
esta correlacionada con las dems
variables independientes; por lo tanto se debe eliminar
( )
2
2
1
1.0131
1 0.1137
X
VIF = =

, X
2
no est correlacionada con las dems
variables independientes.
: es el coeficiente de determinacin mltiple de cada variable
independiente

( )
3
2
1
8.9986
1 0.9428
X
VIF = =

, X
3
no est correlacionada con las dems
variables independientes.
( )
4
2
1
13.5527
1 0.9624
X
VIF = =

, X
4
esta correlacionada con las dems
variables independientes; por lo tanto se debe eliminar.

c) Halle la matriz de correlacin parcial y comente la correlacin parcial
de Y con X
1
, Y con X
2
, Y con X
3
y de Y con X
4
. Segn este criterio,
Qu variables independientes se debera eliminar del modelo de
regresin?
Correlaciones Parciales
Variable X1 X2 X3 X4 Y
X1 1 0,227993 0,04864 0,18433 0,412939
X2 0,227993 1 0,072324 -0,230262 0,031792
X3 0,04864 0,072324 1 0,135329 0,413435
X4 0,18433 -0,230262 0,135329 1 0,630039
Y 0,412939 0,031792 0,413435 0,630039 1

De Y con X
1
es 0.413, de Y con X
2
es 0.032, de Y con X
3
es 0.413, de Y
con X
4
es 0.63
El coeficiente de determinacin parcial Y con X
1
, manteniendo constante
X
2
, X
3
y X
4
es:
( )
( )
( )
( )
2
2
1,234
2
2
2,134
2
2
3,124
2
2
4,123
0.413 0.17057 17.057%
0.032 0.001024 0.1024%
0.413 0.17057 17.057%
0.63 0.3969 39.69%
Y
Y
Y
Y
R
R
R
R
= = ~
= = ~
= = ~
= = ~









Ejercicio19:
Continuando con el problema 17
a) Desarrolle la prueba de hiptesis individual de los coeficientes de
regresin del modelo planteado, al nivel de significacin 0.05. Segn
este criterio, Qu variables predictoras se deberan eliminar del
modelo de regresin planteado?
Prueba de Hiptesis Individual:
1. Planteamiento de la hiptesis.

0 3 0 1 0 2 0 4
1 3 1 1 1 2 1 4
: 0 : 0 : 0 : 0
: 0 : 0 : 0 : 0
H H H H
H H H H
| | | |
| | | |
= = = =
= = = =


2. Nivel de significancia:
0.05 o =
3. Estadstico de prueba:
( )

j
j
t
ES
|
|
=
4. Regla de decisin:

Valor crtico:
1 2 3 4
0.138 0.02774 0.187 0.639
2.267 0.159 2.27 4.057
0.061 0.174 0.0823 0.157
t t t t = = = = = = = =

Coeficientes Error tpico Estadstico t Significancia
X1 0,138 0,061 2,267 0,032
X2 0,028 0,174 0,159 0,875
X3 0,187 0,082 2,270 0,032
X4 0,639 0,157 4,057 0,000

Si
0.975,25 c
t t >
1
2.267 2.0595 t = > , se rechaza H
0

2
0.159 2.0595 t = < , se acepta H
0
3
2.27 2.0595 t = > , se rechaza H
0
4
4.057 2.0595 t = > , se rechaza H
0





5. Conclusin:


- La variable X
1
(Horas semanales de trabajo) contribuye
significativamente en la prediccin del comportamiento hacia el trabajo.
- La variable X
2
no contribuye significativamente en la prediccin del
comportamiento hacia el trabajo, por lo tanto debera ser eliminada del
modelo.
- La variable X
3
(Nmero de prendas que confecciona por semana)
contribuye significativamente en la prediccin del comportamiento hacia
el trabajo.
-
La variable X
4
(Aos de experiencia) contribuye significativamente en la
prediccin del comportamiento hacia el trabajo.















b) De eliminar alguna(s) de las variables independientes, redefina el
modelo de regresin lineal y analice la significacin de sus coeficientes
de regresin.
Estimar el modelo:
Y X1 X3 X4
5 50 30 0,6
5 53 31 1
6 55 31 1,5
6 58 32 1,8
8 61 32 2
9 62 33 2,4
9 62 34 2,8
10 63 35 3
10 63 35 3,5
10 65 36 4
10 65 36 4,6
10 69 36 5
11 68 37 5,8
12 69 37 6
13 69 38 6,7
14 70 38 8
14 70 39 8,4
15 72 39 8,6
15 72 40 8,9
16 73 41 9
16 74 42 9
16 74 43 9,1
16 75 44 9,2
17 75 44 9,8
17 76 45 10
17 77 45 10,2
18 78 46 10,8
18 78 47 11
19 79 48 11,5
20 80 49 11,6


















X=
1 50 30 0,6
1 53 31 1
1 55 31 1,5
1 58 32 1,8
1 61 32 2
1 62 33 2,4
1 62 34 2,8
1 63 35 3
1 63 35 3,5
1 65 36 4
1 65 36 4,6
1 69 36 5
1 68 37 5,8
1 69 37 6
1 69 38 6,7
1 70 38 8
1 70 39 8,4
1 72 39 8,6
1 72 40 8,9
1 73 41 9
1 74 42 9
1 74 43 9,1
1 75 44 9,2
1 75 44 9,8
1 76 45 10
1 77 45 10,2
1 78 46 10,8
1 78 47 11
1 79 48 11,5
1 80 49 11,6

Y=
5
5
6
6
8
9
9
10
10
10
10
10
11
12
13
14
14
15
15
16
16
16
16
17
17
17
18
18
19
20

X'=
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
50 53 55 58 61 62 62 63 63 65 65 69 68 69 69 70 70 72 72 73 74 74 75 75 76 77 78 78 79 80
30 31 31 32 32 33 34 35 35 36 36 36 37 37 38 38 39 39 40 41 42 43 44 44 45 45 46 47 48 49
0,6 1 1,5 1,8 2 2,4 2,8 3 3,5 4 4,6 5 5,8 6 6,7 8 8,4 8,6 8,9 9 9 9,1 9,2 9,8 10 10,2 10,8 11 11,5 11,6

X'X=
30 2055 1163 195,8
2055 142615 80887 14210,2
1163 80887 45967 8140,3
195,8 14210,2 8140,3 1644,1



(X'X)
-1
=
33,0570222 -0,42522259 -0,33924093 1,41807436
-0,42522259 0,01010217 -0,00424987 -0,01563172
-0,33924093 -0,00424987 0,01967442 -0,02027907
1,41807436 -0,01563172 -0,02027907 0,06723962

X'Y=
382
27161
15494
2940,3

(X'X)
-1
*(X'Y)=
-8,32323679
0,14068245
0,18818798
0,63193076
Modelo estimado:
1 3 4

8.323 0.141 0.188 0.632 Y X X X = + + +



PRUEBA DE HIPOTESIS GLOBAL
1. Anlisis de varianza:
1 0 2
= H : 0 =
a i
H : 0 = (Al menos uno de los parmetros es de 0)
2. Funcin de prueba:


Grados
de
libertad
Suma de
cuadrados
Promedio
de los
cuadrados
F
Valor crtico
de F
Regresin 3 551,316883 183,772294
558,8538865 1,0206E-23 Residuos 26 8,54978335 0,32883782
Total 29 559,866667



3. Regin de rechazo:

C 1 ,k,n k 1
F F

>


0.95,3,26
F 558.854 3.6697 = >
,

se rechaza
4. Conclusin:
Al menos una variable explicativa (independientes) est asociada
significativamente con la variable explicada (dependiente).
P valor:
( )
3, 26 558.854 0.000 P P F = > = (


Prueba de Hiptesis Individual:
1. Planteamiento de la hiptesis.

0 3 0 1 0 4
1 3 1 1 1 4
: 0 : 0 : 0
: 0 : 0 : 0
H H H
H H H
| | |
| | |
= = =
= = =


2. Nivel de significancia:
0.05 o =

3. Estadstico de prueba:

( )

j
j
t
ES
|
|
=
4. Regla de decisin:
Valor crtico:
1 3 4
0.1407 0.1882 0.6319
2.44 2.34 4.25
0.0576 0.0804 0.1487
t t t = = = = = =

Coeficientes Error tpico Estadstico t Significancia
X1 0,14068245 0,05763659 2,44085304 0,02177210
X2 0,18818798 0,08043441 2,33964532 0,02725522
X3 0,63193076 0,14869744 4,24977552 0,00024311

Si
0.975,26 c
t t >
1
2.44 2.0555 t = > , se rechaza H
0

2
2.34 2.0555 t = > , se rechaza H
0
4
4.25 2.0555 t = > , se rechaza H
0






5. Conclusin:


- La variable X
1
(Horas semanales de trabajo) contribuye
significativamente en la prediccin del comportamiento hacia el trabajo.
- La variable X
3
(Nmero de prendas que confecciona por semana)
contribuye significativamente en la prediccin del comportamiento hacia
el trabajo.
-
La variable X
4
(Aos de experiencia) contribuye significativamente en la
prediccin del comportamiento hacia el trabajo.

























c) Obtenga los residuales del modelo de regresin redefinido. Utilice un
histograma para determinar si se viola el supuesto de normalidad del
modelo resultante.
Observacin
Valores
observados
Pronstico para
Y
Residuales
1 5 4,73568372 0,26431628
2 5 5,59869136 -0,59869136
3 6 6,19602164 -0,19602164
4 6 6,9958362 -0,9958362
5 8 7,54426971 0,45573029
6 9 8,12591245 0,87408755
7 9 8,56687273 0,43312727
8 10 9,02212932 0,97787068
9 10 9,33809469 0,66190531
10 10 10,123613 -0,12361296
11 10 10,5027714 -0,50277141
12 10 11,3182735 -1,31827352
13 11 11,8713237 -0,87132365
14 12 12,1383923 -0,13839226
15 13 12,7689318 0,23106823
16 14 13,7311242 0,2688758
17 14 14,1720845 -0,17208449
18 15 14,5798355 0,42016446
19 15 14,9576028 0,04239725
20 16 15,3496663 0,65033374
21 16 15,6785367 0,3214633
22 16 15,9299178 0,07008224
23 16 16,3219813 -0,32198127
24 17 16,7011397 0,29886028
25 17 17,1563963 -0,1563963
26 17 17,4234649 -0,42346491
27 18 18,1314938 -0,13149379
28 18 18,4460679 -0,44606793
29 19 19,0909037 -0,09090374
30 20 19,4829673 0,51703275
Mnimo 5 4,73568372 -1,31827352
Mximo 20 19,4829673 0,97787068
Media 12,7333333 12,7333333 1,0658E-15
Mediana 13,5 13,250028 -0,02425325













La grafica confirma la suposicin de que los residuos siguen la distribucin de
probabilidad normal. Por tanto, las inferencias que se hicieron con base en las
hiptesis global e individual se confirman con los resultados de esta evaluacin.

d) Grafique los residuales con respecto a los valores ajustados . Indica
el diagrama que viola el supuesto de homosedasticidad?
Modelo original:

Distribucin de frecuencias de residuales
Curva Normal Esperada
-2,0 -1,5 -1,0 -0,5 0,0 0,5 1,0 1,5
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
N


d
e

o
b
s
e
r
v
a
c
i
o
n
e
s
Residuos vs Predicciones
Variable dependiente: Y
4 6 8 10 12 14 16 18 20 22
Valores predecidos Y^
-1,6
-1,4
-1,2
-1,0
-0,8
-0,6
-0,4
-0,2
0,0
0,2
0,4
0,6
0,8
1,0
1,2
R
e
s
i
d
u
o
s
95% de confianza











Esta grafica revela heterogeneidad de las varianzas en una forma ideal

Modelo redefinido:
Residuos vs Predicciones
Variable dependiente: Y
4 6 8 10 12 14 16 18 20 22
Val ores predeci dos Y^
-1,6
-1,4
-1,2
-1,0
-0,8
-0,6
-0,4
-0,2
0,0
0,2
0,4
0,6
0,8
1,0
1,2
R
e
s
i
d
u
o
s
95% de confianza

Esta grafica revela heterogeneidad de las varianzas en una forma ideal

Anda mungkin juga menyukai