Anda di halaman 1dari 4

Ejercicio de Regresin Lineal Simple.

Sea X el volumen de lluvia (m3) y Y el volumen de escurrimiento (m3) en determinado lugar.


(Devore, 6a. Edicin. Pg. 517, problema 16)
Var Indep.
Var. Dep. o regresiva
No. Observ.
X
Y
1
170
180
2
280
240
3
300
200
4
300
250
5
310
250
6
400
280
7
420
250
8
430
275
9
610
300
10
620
310
11
12
13
14
15

10
3840
384
144.00617271
20737.777778
Sxx
186640
0.894064328
Coef. de correlacin, r=
Coef. de determinacin, R2= 0.7993510226
Bo=Y-B1*X
156.1626661
B1=Sxy/Sxx
0.2534826404
SSE=Syy-B1*Sxy
3010.2362838
MSE=SSE/(n-2)
376.27953547

X2
28900
78400
90000
90000
96100
160000
176400
184900
372100
384400
0
0
0
0
0

Y2
32400
57600
40000
62500
62500
78400
62500
75625
90000
96100
0
0
0
0
0

XY
30600
67200
60000
75000
77500
112000
105000
118250
183000
192200
0
0
0
0
0

1661200

657625

1020750

Suma(Y2)
1661200

Suma(X2)
657625

Sxy
47310

yiestimada
199.254714959
227.137805401
232.207458208
232.207458208
234.742284612
257.555722246
262.625375054
265.160201457
310.787076725
313.321903129
156.162666095
156.162666095
156.162666095
156.162666095
156.162666095

ei
-19.2547149593
12.8621945992
-32.2074582083
17.7925417917
15.2577153879
22.444277754
-12.6253750536
9.8397985426
-10.7870767252
-3.321903129
-156.1626660952
-156.1626660952
-156.1626660952
-156.1626660952
-156.1626660952

Bandas de confianza
LIC
LSC
172.966677 225.542753
209.360057 244.915554
215.60209 248.812826
215.60209 248.812826
218.655041 250.829529
243.313637 271.797808
247.997094 277.253656
250.234464 280.085939
283.443584 338.13057
285.087234 341.556573
113.961546 198.363786
113.961546 198.363786
113.961546 198.363786
113.961546 198.363786
113.961546 198.363786

Bandas de prediccin
LIP
LSP
147.370366 251.139064
179.002858 275.272752
184.493068 279.921848
184.493068 279.921848
187.205728 282.278841
210.611481 304.499963
215.56253 309.68822
218.004052 312.316351
258.360067 363.214087
260.424632 366.219175
94.6658424 217.65949
94.6658424 217.65949
94.6658424 217.65949
94.6658424 217.65949
94.6658424 217.65949

n=

Sumas
Promedio
Desv.Est. insesgada
Varianza insesgada
Sumas de cuadrados

2535
253.5
40.8282309737
1666.9444444445
Syy
15002.5

-780.81333048

Intervalo de confianza para el promedio de y dado x:


Si xo se fija en:
290
La estimacin puntual para la respuesta media de yo es:
229.67263
El error estndar estimado de la respuesta media es:
7.4459357
El intervalo de confianza de (1-)100% es:

<- 79.94% de la variacin de Y est explicada por el modelo de regresin


<- Ordenada al origen
<- Pendiente
<- Suma de cuadrados de los errores
<- Cuadrados medios de los errores

Si 1=0, =0, entonces la variacin de X no explica la variacin de Y o no hay regresin lineal entre X y Y
Si = 0.05

/2=
La regin de rechazo es:

Prueba de Hiptesis sobre 1:

212.50227

T=

1
1

246.84299

0.025

| t0 |>t/2

2.3060041352

El estadstico de prueba tiene distribucin T-Student con n-2 grados de libertad.

H 0 : 1=0
H 1 : 1 0

MS E

Intervalo de prediccin para y dado x


Si xo se fija en:
290
La prediccin para la respuesta yo es:

5.6454073658

229.67263
El error estndar estimado de la prediccin:

Por lo tanto: Se rechaza Ho

S xx

20.777909
Un intervalo de prediccin para yo es:
181.75869
a
277.58658

Prueba de Hiptesis sobre el coeficiente de correlacin poblacional


El estadstico de prueba tiene distribucin T-Student con n-2 grados de libertad.

H 0 : =0
H 1 : 0

T=

r n2
1r2

5.6454073658
Por lo tanto: Se rechaza Ho

400

Grfica de residuos

30

Diagrama de dispersin
350

20
300

f(x) = 0.2534826404x + 156.1626660952


R = 0.7993510226

10

ei
Linear (ei)

ei

250

200

-10100

150

f(x) = - 2.4670565240449E-017x + 6.10309692249878E-015


R = 0

200

300

400

-20

Linear
(Y)

100

LIC
LSC
LIP

50

0
100

-30

LSP

200x

300

400

500

600

700

-40

500

600

700

Var Indep.
X
1
2
3
4
5
6

n=

Var. Dep. o regresiva


Y
2.8
4.8
8.2
12
15.2
18.1

X2
1
4
9
16
25
36

Y2
7.84
23.04
67.24
144
231.04
327.61

XY
2.8
9.6
24.6
48
76
108.6

91

800.77

269.6

yiestimada
2.219047619
5.4047619048
8.5904761905
11.7761904762
14.9619047619
18.1476190476

ei
0.580952381
-0.6047619048
-0.3904761905
0.2238095238
0.2380952381
-0.0476190476

Bandas de confianza
LIC
LSC
1.2321869 3.20590834
4.66386912 6.14565469
8.01044504 9.17050734
11.1961593 12.3562216
14.221012 15.7027975
17.1607583 19.1344798

Bandas de prediccin
LIP
LSP
0.53585232 3.90224292
3.85293251 6.9565913
7.10869062 10.0722618
10.2944049 13.257976
13.4100754 16.5137342
16.4644237 19.8308144

Diagrama de dispersin
25
20

Sumas
Promedio

21
3.5

61.1
10.1833333333

Desv.Est. insesgada
Varianza insesgada

1.8708286934
3.5

5.9760912532
35.7136666667

Sumas de cuadrados

Sxx
17.5

Syy
178.5683333333

-1.33227E-015

No. Observ.
1
2
3
4
5
6

f(x) = 3.1857142857x - 0.9666666667


R = 0.9945972397

15
10
5

Sxy
55.75

4
X

Coef. De Correlacin, r= 0.9972949612


Intervalo de confianza para la respuesta media esperada dado x
Coef. De Determinacin,
0.9945972397 <- 99.46% de la variacin de Y est explicada por el modelo de regresin
R2=
Bo=Y-B1*X
B1=Sxy/Sxx

-0.966666667 <- Ordenada al origen


3.1857142857 <- Pendiente

SSE=Syy-B1*Sxy

0.9647619048 <- Suma de cuadrados de los errores

MSE=SSE/(n-2)

0.2411904762 <- Cuadrados medios de los errores

Un intervalo de confianza para la calificacin esperada es:


9.6266688
a
10.739998
Error estndar estimado de la respuesta media:

Si 1=0, =0, entonces la variacin de X no explica la variacin de Y o no hay regresin lineal entre X y Y
Si = 0.05

/2=
La regin de rechazo es:

Intervalo de prediccin para y dado x

2.7764451052
Un intervalo de prediccin para yo es:

Prueba de Hiptesis sobre 1:

H 0 : 1=0
H 1 : 10

El estadstico de prueba tiene distribucin T-Student con n-2 grados de libertad.

T=

1
1

MS E
S xx

= 27.1359962085
Por lo tanto: Se rechaza Ho

Prueba de Hiptesis sobre el coeficiente de correlacin poblacional


El estadstico de prueba tiene distribucin T-Student con n-2 grados de libertad.

H 0 : =0
H 1 : 0

T=

r n2
1r2

0.2004954

Si xo se fija en:
3.5
horas
La prediccin para la respuesta yo es: 10.183333

0.025

| t0 |>t/2

Si xo se fija en:
3.5
horas
La respuesta media esperada sera de: 10.183333

= 27.1359962085
Por lo tanto: Se rechaza Ho

8.7105374

11.656129

Error estndar estimado de la prediccin:

0.530461

FORMULARIO PARA EL AJUSTE DE LA RECTA DE REGRESIN


POR EL MTODO DE MNIMOS CUADRADOS

Y = 0 + 1 X

Verdadera recta de regresin:

y i= 0 + 1 x i+ i

Modelo lineal simple:

i ~ N (0, )

Los i se suponen errores aleatorios con distribucin normal, media cero y varianza 2;
0 y 1 son constantes desconocidas (parmetros del modelo de regresin)
Ahora, el modelo de regresin lineal simple ajustado (o recta estimada) es:

^y = ^ 0 + ^ 1 x

^ 0 = y ^ 1
x

donde:

Suma de cuadrados de X
2

S xx = ( xi x ) = x
i =1

( )

i=1

S xx

i=1

xi

S xy

Suma de cuadrados de Y
n

^ 1=

S yy = ( y i y ) = y

i=1

i =1

( )
yi

i=1

Suma de productos cruzados de X y Y


n

i=1

i=1

S xy = ( x i
x ) y i = xi y i
Coeficiente de correlacin:

r=

( )( )
i=1

R =r

Suma de cuadrados de los errores:

e i= y i ^y i

El residuo o error en la estimacin se define como:


n

i =1

i =1

SS E = e 2i = ( y i ^y i )2

Cuadrado medios de los errores (o varianza residual):

Tambin:

n 2

SS E =S yy ^ 1 S xy

SS E
=
n2

Estimacin de la respuesta media de yo dado un xo:

^ +
^ x
^ ( Y |x ) =
^Y = y
^ 0 =E

0
0
1 0
0
Bandas de confianza para la recta de regresin:

^y 0 t / 2, n2

xi

Coeficiente de determinacin:

S xx S yy

MS E = i=1

i=1

S xy

( y i ^y i ) 2

yi

[
MS E

x )2
1 ( x o
+
n
S xx

Bandas de prediccin:

^y 0 t / 2, n2 MS E

x )2
1 ( x o
1+ +
n
S xx

No. hrs. estudio


X
1
2
4
4
7
12

No. Observ.
1
2
3
4
5
6

n=

Calificacin del examen


Y
71
71
74
80
80
86

X2
1
4
16
16
49
144

Y2
5041
5041
5476
6400
6400
7396

XY
71
142
296
320
560
1032

yiestimada
71.45
72.8375
75.6125
75.6125
79.775
86.7125

ei
-0.45
-1.8375
-1.6125
4.3875
0.225
-0.7125

Bandas de confianza
LIC
LSC
67.1647411 75.7352589
69.0983479 76.5766521
72.6169957 78.6080043
72.6169957 78.6080043
76.4808953 83.0691047
80.4657154 92.9592846

Bandas de prediccin
LIP
LSP
63.1768167 79.7231833
64.8335399 80.8414601
67.9277642 83.2972358
67.9277642 83.2972358
71.9690251 87.5809749
77.2729854 96.1520146

100
95
90
85

Sumas
Promedio

30
5

462
77

Desv.Est. insesgada
Varianza insesgada

4
16

6
36

Desv. Est. sesgada


Varianza sesgada

3.6514837167
13.333333333

5.4772255751
30

Sxx
80

Syy
180

Sumas de cuadrados

230

35754

2421

-1.42109E-014

75
70
65
60
Sxy
111

55
50

Coef. De Correlacin, r=

f(x) = 1.3875x + 70.0625


R = 0.855625

80

0.925

Intervalo de confianza para la respuesta media esperada dado x


Coef. De Determinacin,
R2=

0.855625

<- 85.56% de la variacin de Y est explicada por el modelo de regresin

Bo=Y-B1*X
B1=Sxy/Sxx

70.0625
1.3875

<- Ordenada al origen


<- Pendiente

SSE=Syy-B1*Sxy

25.9875

<- Suma de cuadrados de los errores

MSE=SSE/(n-2)

6.496875

<- Cuadrados medios de los errores

/2=
La regin de rechazo es:

0.025

| t0 |>t/2

Intervalo de prediccin para y dado x


Si un alumno estudia
La prediccin para su calificacin es de:

2.7764451052
Un intervalo de prediccin para la calificacin es:

Prueba de Hiptesis sobre 1:

H 0 : 1=0
H 1 : 10

El estadstico de prueba tiene distribucin T-Student con n-2 grados de libertad.

T=

1
1

MS E
S xx

4.8688425427
Por lo tanto: Se rechaza Ho

Prueba de Hiptesis sobre el coeficiente de correlacin poblacional


El estadstico de prueba tiene distribucin T-Student con n-2 grados de libertad.

H 0 : =0
H 1 : 0

T=

r n2
1r2

horas
77

Un intervalo de confianza para la calificacin esperada es:


74.110879
a
79.889121

Si 1=0, =0, entonces la variacin de X no explica la variacin de Y o no hay regresin lineal entre X y Y
Si = 0.05

Si los alumnos estudian en promedio:


La calificacin esperada en promedio sera de:

4.8688425427
Por lo tanto: Se rechaza Ho

69.356104

84.643896

5
77

horas

9 10 11 12 13 14 15

Anda mungkin juga menyukai