Anda di halaman 1dari 23

La asociación de pasajeros de aerolíneas estudió la relación entre el número de pasajeros en un vuelo

en particular y su costo. Parece lógico que más pasajeros impliquen más peso y más equipaje, lo que a
su vez generará un costo de combustible mayor. Con una muestra de 15 vuelos, la correlación entre el
número de pasajeros y el costo total del combustible fue 0.667. ¿Es razonable concluir que hay una
asociación positiva entre las dos variables poblacionales? Utilice el nivel de significancia de 0.01.

Correlación positiva fuerte r= 0,667 H₀:ρ= 0 correlación de la población igual a 0


r²= 0,44 Hₐ:ρ≠ 0 correlación de la población diferente a 0
α= 0,01

La relación del número de pasajeros y el costo total de combustible es el 44%.

Regla de decisión
2 colas
α=0,01
gl=15 -2= 13

t= 3,012

›La hipótesis nula no se acepta.


›hay una correlación entre el numero de pasajeros y el costo
total de combustible.
e pasajeros en un vuelo
y más equipaje, lo que a
s, la correlación entre el
le concluir que hay una
ficancia de 0.01.

la población igual a 0
la población diferente a 0

3,2278

- 3,012
3,012
La Student Government Association, de la Middle Carolina University, desea demostrar la relación entre el núm
que beben los estudiantes y su contenido de alcohol en la sangre. Una muestra de 18 estudiantes participó en
cual a cada uno se le asignó al azar un número de latas de cerveza de 12 onzas que debía beber. Treinta min
consumir su número asignado de cervezas un miembro de la oficina local del alguacil midió el contenido de alco
La información muestral es la siguiente.

Contenido de
Estudiantes Cervezas alcohol en la Ejercicio 12
sangre
0.14

Contenido de alcohol en la sangre


1 6 0.10
0.12
2 7 0.09 f(x) = 0.0168304668x
0.10 R² = 0.9237876425
3 7 0.09
4 4 0.10 0.08
5 5 0.10 0.06
6 3 0.07
0.04
7 3 0.10
0.02
8 6 0.12
9 6 0.09 0.00
0 1 2 3 4 5
10 3 0.07
Cervezas
11 3 0.05
12 7 0.08
13 1 0.04 a) La relación es fuerte y es directa
14 4 0.07
15 2 0.06 b) Correlación= 0.7788
16 7 0.12
17 2 0.05
18 1 0.02

Utilice un paquete de software estadístico para responder las siguientes preguntas.

a) Elabore un diagrama de dispersión del número de cervezas consumidas y el contenido de alcohol en la san
Comente sobre la relación. ¿Parece fuerte o débil? ¿Parece directa o inversa?

b) Determine el coeficiente de correlación.

c) Con un nivel de significancia de 0.01, ¿es razonable concluir que hay una relación positiva entre el número
cervezas consumidas y el contenido de alcohol en la sangre de la población? ¿Cuál es el valor p?
c) Con un nivel de significancia de 0.01, ¿es razonable concluir que hay una relación positiva entre el número
cervezas consumidas y el contenido de alcohol en la sangre de la población? ¿Cuál es el valor p?
demostrar la relación entre el número de cervezas
ra de 18 estudiantes participó en un estudio en el
zas que debía beber. Treinta minutos después de
lguacil midió el contenido de alcohol en la sangre.

c)

Ejercicio 12

= 0.0168304668x
0.9237876425

2 3 4 5 6 7 8
Cervezas

Correlación positiva fuerte


te y es directa

La relación entre el número de cervezas que beben los estu

Regla de decisión
2 colas
α=0,01
gl=18 -2= 16

t= 2,921
tas.

el contenido de alcohol en la sangre.

Pvalor= 4,9663
relación positiva entre el número de
uál es el valor p?
›La hipótesis nula no se acepta.

Se rechaza Ho por que t es mayor que 2.921. Hay


correlación positiva entre la cerveza consumida y el conte
de alcohol en la sangre. Se acepta H1
r= 0,7788 H₀:ρ= 0 correlación de la población igual a 0
r²= 0,6065 Hₐ:ρ≠ 0 correlación de la población diferente a 0
α= 0,01

o de cervezas que beben los estudiantes y su contenido de alcohol en la sangre es el 61%.

4,9663
- 2,921 2,921

t es mayor que 2.921. Hay una


la cerveza consumida y el contenido
acepta H1
La Bradford Electric Illuminating Company estudia la relación entre kilowatts-hora (miles)
consumidos y el número de habitaciones de una residencia privada familiar. Una muestra aleatoria
de 10 casas reveló lo siguiente.

a)

Número de Kilowatts-hora Número de


habitaciones (miles) habitaciones

12 9 12
9 7 9
14 10 14
6 5 6
10 8 10
8 6 8
10 8 10
10 10 10
5 4 5
7 7 7
TOTAL 91

a) Determine la ecuación de regresión.


b) Encuentre el número de kilowatts-hora, en miles, de
una casa de seis habitaciones. b= (𝑛(Σ𝑋𝑌)−(Σ𝑋)
(Σ𝑌))/(𝑛(Σ𝑋)−
(Σ𝑋)²)
b= (10(718)−91(74
(10(895)− (91)²) = 0

a= Σ𝑌/𝑛 - bΣ𝑋/𝑛

a= 74/10 - (0,667)91/1

𝑌=𝑎+𝑏�

𝑌=1,330+0,667𝑋

b)
𝑌=𝑎+𝑏�
𝑌=1,330+0,667𝑋
𝑌=1,330+"0,667(" 6)
𝑌=5,3320
Kilowatts- X² Y² XY
hora (miles)

9 144 81 108
7 81 49 63
10 196 100 140
5 36 25 30
8 100 64 80
6 64 36 48
8 100 64 80
10 100 100 100
4 25 16 20
7 49 49 49
74 895 584 718

(𝑛(Σ𝑋𝑌)−(Σ𝑋)
Σ𝑌))/(𝑛(Σ𝑋)−
(Σ𝑋)²)
= (10(718)−91(74))/
0(895)− (91)²) = 0,667

𝑌/𝑛 - bΣ𝑋/𝑛

4/10 - (0,667)91/10=−1,330

𝑌=1,330+0,667𝑋

=1,330+0,667𝑋
1,330+"0,667(" 6)
Resumen

Estadísticas de la regresión
Coeficiente de correlación múltiple 0.9037974424
Coeficiente de determinación R^2 0.8168498168
R^2 ajustado 0.793956044
Error típico 0.9128709292
Observaciones 10

ANÁLISIS DE VARIANZA
Grados de libertad Suma de cuadrados
Regresión 1 29.7333333333
Residuos 8 6.6666666667
Total 9 36.4

Coeficientes Error típico


Intercepción 1.3333333333 1.0558636427
Número de habitaciones 0.6666666667 0.111608255

Análisis de los residuales

Observación Pronóstico Kilowatts-hora (miles) Residuos


1 9.3333333333 -0.3333333333
2 7.3333333333 -0.3333333333
3 10.6666666667 -0.6666666667
4 5.3333333333 -0.3333333333
5 8 0
6 6.6666666667 -0.6666666667
7 8 0
8 8 2
9 4.6666666667 -0.6666666667
10 6 1
Promedio de los cuadrados F Valor crítico de F
29.7333333333 35.68 0.0003331849
0.8333333333

Estadístico t Probabilidad Inferior 95% Superior 95% Inferior 95,0%


1.2627893219 0.242227285 -1.1014925928 3.7681592595 -1.1014925928
5.9732738092 0.0003331849 0.409297569 0.9240357643 0.409297569

Número de habitaciones Curva de regresión ajustada


12

10 f(x) = 0.8022346369x
R² = 0.9863090227
Kilowatts-hora (miles)

8 Kilowatts-hora (miles)
6 Linear (Kilowatts-hora (miles))
Pronóstico Kilowatts-hora
4 (miles)

0
4 6 8 10 12 14 16
Número de habitaciones
Superior 95,0%
3.7681592595
0.9240357643

stada

les)
ora (miles))
tts-hora
El señor James McWhinney, presidente de Daniel-James Financial Services, considera que hay una
relación entre el número de contactos con sus clientes y la cantidad de ventas. Para probar esta
afirmación, el señor McWhinney reunió la siguiente información muestral. La columna X indica el
número de contactos con sus clientes el mes anterior, mientras que la columna Y indica el valor de las
ventas (miles de $) el mismo mes por cada cliente muestreado.

Ventas Ventas
Número de (miles Número de (miles
de de X² Y²
contactos dólares) contactos dólares)

14 24 14 24 196 576
12 14 12 14 144 196
20 28 20 28 400 784
16 30 16 30 256 900
46 80 46 80 2116 6400
23 30 23 30 529 900
48 90 48 90 2304 8100
50 85 50 85 2500 7225
55 120 55 120 3025 14400
50 110 50 110 2500 12100
Total 334 611 13970 51581

a) Determine la ecuación de regresión.


b) Encuentre las ventas estimadas si se hicieron 40 contactos.

b)
𝑌=𝑎+𝑏�
𝑌=−12,20103752+2,1946418𝑋
𝑌=−12,20103752+2,1946418"(" 40)
𝑌=75.58
a)
b= (𝑛(Σ𝑋𝑌)−(Σ𝑋)
(Σ𝑌))/(𝑛(Σ𝑋)−
dera que hay una (Σ𝑋)²)
Para probar esta b= (10(2654)−334(611))/
lumna X indica el
dica el valor de las (10(13970)− (334)²) =
2,1946418

a= Σ𝑌/𝑛 - bΣ𝑋/𝑛

a= 611/10 - (2,1946418)334/10=−12,20103752
𝑌=𝑎+𝑏�
XY
𝑌=−12,20103752+2,1946418𝑋

336 Resumen
168
560 Estadísticas de la regresión
480 Coeficiente de correlación múltiple
3680 Coeficiente de determinación R^2
690 R^2 ajustado
4320 Error típico
4250 Observaciones
6600
5500 ANÁLISIS DE VARIANZA
26584
Regresión
Residuos
Total

Intercepción
Número de contactos

Análisis de los residuales

Observación
1
2
3
4
5
6
7
8
9
10
611))/
)²) =

34/10=−12,20103752

Estadísticas de la regresión
0.9753621465
0.9513313169
0.9452477315
9.3104457397
10

Grados de libertad Suma de cuadrados Promedio de los cuadrados


1 13555.4248010233 13555.4248010233
8 693.4751989767 86.6843998721
9 14248.9

Coeficientes Error típico Estadístico t


-12.2010375213 6.5595759579 -1.86003449
2.194641842 0.1755001784 12.505069006

Número de contactos
Pronóstico Ventas (miles de dólares) Residuos 140
18.5239482661 5.4760517339 120
14.1346645821 -0.1346645821
Ventas (miles de dólares)

100 f(x) = 1.9029348604x


31.6917993178 -3.6917993178
R² = 0.9807413646
22.91323195 7.08676805 80
88.7524872086 -8.7524872086 60

40

20
100

Ventas (miles de dólare


f(x) = 1.9029348604x
R² = 0.9807413646
80

60
38.2757248437 -8.2757248437
40
93.1417708926 -3.1417708926
97.5310545765 -12.5310545765 20
108.5042637862 11.4957362138 0
97.5310545765 12.4689454235 0 10 20 30 40
Número de contactos
F Valor crítico de F
156.3767508459 1.5649163268E-06

Probabilidad Inferior 95% Superior 95%Inferior 95,0%


Superior 95,0%
0.0999253176 -27.3274468054 2.92537176 -27.327447 2.92537176
1.564916327E-06 1.7899377047 2.59934598 1.7899377 2.59934598

mero de contactos Curva de regresión ajustada

f(x) = 1.9029348604x
R² = 0.9807413646 Ventas (miles de dólares)
Linear (Ventas (miles de dólares))
Pronóstico Ventas (miles de
dólares)
f(x) = 1.9029348604x
R² = 0.9807413646 Ventas (miles de dólares)
Linear (Ventas (miles de dólares))
Pronóstico Ventas (miles de
dólares)

10 20 30 40 50 60
Número de contactos
Con la siguiente tabla ANOVA
a) Encuentre el coeficiente de determinación.
b) Si hay una relación directa entre las variables, ¿cuál es el coeficiente de correlación?
c) Determine el error estándar de estimación.

Fuente GL SS MS F
Regresion 1 1000 1000 26
Error 13 500 38.46
Total 14 1500

a) Encuentre el coeficiente de determinación.

R²= 1-(SSE/SST) La interpretacion nos dice que el 66% de los datos


se ajusta la linea de regresion
R²= 0.667
b) Si hay una relación directa entre las variables, ¿cuál es el coeficiente de correlación?

r= raiz(R²)
r= 0.816

c) Determine el error estándar de estimación.

Sy.x=raiz(SSE/(n-2) Sy.x= 6.45497224


En el primer examen de estadística, el coeficiente de determinación entre las horas
estudiadas y la calificación obtenida fue de 80%. El error estándar de estimación fue de 10.
Había 20 estudiantes en la clase. Elabore una tabla ANOVA para efectuar el análisis de
regresión de horas estudiadas como un predictor de la calificación obtenida en el primer
examen de estadísticas.

𝑆�.�=√(𝐺𝐿𝑇/(𝑆𝑆𝐸−2))
coeficiente de determinación. R²= 0.800
error estándar de estimación. Sy.x= 10
Cant. De estudiantes n= 20
p= 2
SSE=𝐺𝐿𝑇/ 〖 (𝑆�.�) 〗 ^2
Fuente GL SS MS F
Regresion 1 -3.6775 -3.6775 -30.226027
Error 18 2.19 0.12166667
�^2=1−𝑆𝑆𝐸/𝑆𝑆𝑇
Total 19 -1.4875
𝑆�.�=√(𝐺𝐿𝑇/(𝑆𝑆𝐸−2))
SSE=𝐺𝐿𝑇/ 〖 (𝑆�.�) 〗 ^2 +2

SSE=𝐺𝐿𝑇/ 〖 (𝑆�.�) 〗 ^2 +2

�^2=1−𝑆𝑆𝐸/𝑆𝑆𝑇SSR=(1−𝑆𝑆𝐸)/�^2 −𝑆𝑆𝐸

Anda mungkin juga menyukai