Anda di halaman 1dari 15

TALLER CORRELACION Y REGRESION LINEAL

PRESENTADO POR:

JUAN SEBASTIAN FAJARDO SAENZ

PRESENTADO A:

PROFESOR(A) JOSE ANTONIO GARZON

ESTADISTICA Y PROBABILIDAD

UNIVERSIDAD DE CUNDINAMARCA EXTENSION FACATATIVA

FACATATIVÁ-CUNDINAMARCA
1. Una aerolínea comercial selecciono una muestra aleatoria de 25 vuelos y
determinó que la correlación entre el número de pasajeros y el peso total, en
libras, del equipaje almacenado en el comportamiento para ello es 0.94. Con
el nivel de significancia de 0.05. ¿Se puede concluir que hay una asociación
positiva entre ambas variables?

X: número de pasajeros
Y: peso total en libras del equipaje almacenado en el comportamiento
n= 25
r: 0.94

1° paso: Formulación de hipótesis

H0: ρ= 0 (No existe una asociación

positiva) H1: ρ≠ 0 (Existe una asociación

positiva)

2° paso: n<30 hallar los puntos críticos.

α= 0.05

p= 2.069

Zona de aceptación
de Ho

Zona de rechazo de
Zona de rechazo de
Ho
Ho

-2.069 2.06913.21

3°paso: Regla de decisión


Rechazar Ho si y solo si t0<-2.069 o t0 > 2.069

4°paso: Calculo de t0
�√𝑛 − 2
�=
√1 − �2
t0=13.21

Conclusion

Se rechaza con un nivel de significancia de 0.05, se puede concluir que si hay una
asociación positiva entre ambas variables.

2. Un sociólogo afirma que el éxito de los estudiantes en la universidad (medido


por su promedio) se relacionó con el ingreso familiar. En una muestra de 20
estudiantes, el coeficiente de correlación es de 0.40. Con el nivel de
significación de 0.01, ¿se puede concluir que hay una correlación positiva
entre las variables?

X: Tamaño familiar
Y: Cantidad gastada en diversión
n: 20
r: 0.40
1° paso: Formulación de hipótesis
H0: ρ=0 (No existe una relación
positiva) H1: ρ≠0 (Existe una relación
positiva)

2°paso: Como n<30 utilizamos t student para establecer los puntos críticos.

α= 0.01
t=1.860

Zona de aceptación
de H0

Zona de rechazo
Zona de rechazo
de H0
de H0

2.8
-2.878 1.8578

3°paso: Regla de decisión


Rechazar Ho si y solo si t0>2.878 o t0<-2.878

4°paso: Calculo de t0
�√𝑛 − 2
�=
√1 − �2
t0= 1.85

Conclusione

Por lo tanto se acepta H 0, esto quiere decir que existe una asociación
positiva entre las dos variables.

3. Un estudio que realizo la Agencia de Protección Ambiental en 12 automóviles


revelo una correlación de 0.47 entre el tamaño del motor y sus emisores. Con
un nivel de significación de 0.01, ¿se puede concluir que hay una asociación
positiva entre estas variables? ¿Cuál es el valor p?

X: Tamaño del motor


Y: Emisiones del
motor
1° paso: Formulación de hipótesis
H0: ρ≤0 (No existe una relación
positiva) H1: ρ>0 (Existe una relación
positiva)

2°paso: Como n<30 utilizamos t student para establecer los puntos críticos.
t (n-k) student = t10
α= 0.01
t= 3.169

Zona de aceptación
de H0

Zona de rechazo
de H0

3.169 1.68383.169

3°paso: Regla de decisión


Rechazar Ho si y solo si t0>3.169

4°paso: Calculo de t0
t0= 0.47*(10)1/2/((1-(0.47)2)1/2
t0= 1.6838

Conclusion

Por lo tanto se acepta H0 y se rechaza H1, esto quiere decir que no existe
una asociación positiva entre las dos variables.

5. En una muestra de 32 ciudades grandes de Estados Unidos, la correlación


entre el número medio de pies cuadrados por empleado de oficina y la renta
mensual media en el distrito comercial del centro es -0.363. Con un nivel de
significancia de 0.05, ¿se puede concluir que hay una asociación negativa
entre las dos variables poblacionales?

Primer paso: Prueba de hipótesis de la existencia de Beta (β 1)

H0 :   0
H1 :   0
Segundo paso: Tamaño de muestra n = 32, nivel de significación (α)= 5%,
Utilizamos la distribución normal como estadístico de prueba ya que n>30. Por lo
tanto el valor critico en la tabla de la distribución normal el cual es -1.64

1.64

Tercer paso: Regla de decisión

Rechazar H0 si t < = -1.64

Cuarto paso: Cálculo del estadístico

� ∗ √𝑛 − 2 −0.363 ∗ √32 −
�= 2 = −2.133779844
√1 − �2 =
√1 −(−0.363)2

Conclusion
El valor “t” calculado se encuentra en la región de rechazo. Por ello, �� se
rechaza y H1 se acepta. Esto significa que la correlación entre la población es
menor que cero. Existe una correlación negativa.

6. ¿Cuál es la relación entre la cantidad gastada por semana en diversión y el


tamaño de la familia? ¿Gastan más en diversión las familias grandes? Una
muestra de 10 familias del área de Chicago reveló las siguientes cifras por
tamaño de familia y cantidad gastada en diversión por semana.
a) Calcule el coeficiente de
correlación. ���. �

∑(� − �̅ )(� − �̅ )

�= = = �. ���
(� − � ∗ �. ���� ∗ ��.
�)���� ����

b) Establezca el coeficiente de determinación.

�� = (�. ���)� = �. ���

c) ¿Existe una asociación positiva entre la cantidad gastada en diversión y el


tamaño de la familia? Utilice el nivel de significancia 0.05

Primer paso: Prueba de hipótesis de la existencia de Beta (β 1).

H0 :   0 H1 :   0

Segundo paso: Tamaño de muestra n = 10, nivel de significación (α)= 5%,


utilizamos la tabla t (student) con n=10 – 2 grados de libertad.

n – k=

10 – 2= 8

α= 5%
Valor critico en la tabla de la distribución “t” el cual es 1.860

Tercer paso: Regla de decisión

Rechazar H0 si t > = 1.860

Cuarto paso: Cálculo del estadístico t0

� ∗ √𝑛 − 2 0.589 ∗ √10 −
�= 2 = 2.06147
√1 − �2 =
√1−0.5892

Conclusion

El valor “t” calculado se encuentra en la región de aceptación. Por ello, �� se


acepta y H1 se rechaza. Esto significa que la correlación entre la población es
menor que cero. Hay una correlación negativa y no positiva como se dice en
la pregunta.

8. El fabricante de equipo para ejercicio Cardio Glide desea estudiar la


relación entre el número de meses desde la compra de un aparato y
el tiempo que se utilizó el aparato la semana pasada.
Meses con Hora
(X - ) (Y - Ȳ) (X - )^2 (Y - (X - )(Y -
el equipo s de
Ȳ)^2 Ȳ)
uso
12 4 5.5 -1.8 30.25 3.24 -9.9
2 10 -4.5 4.2 20.25 17.64 -18.9
6 8 -0.5 2.2 0.25 4.84 -1.1
9 5 2.5 -0.8 6.25 0.64 -2
7 5 0.5 -0.8 0.25 0.64 -0.4
2 8 -4.5 2.2 20.25 4.84 -9.9
8 3 1.5 -2.8 2.25 7.84 -4.2
4 8 -2.5 2.2 6.25 4.84 -5.5
10 2 3.5 -3.8 12.25 14.44 -13.3
5 5 -1.5 -0.8 2.25 0.64 1.2
65 58 100.5 59.6 -64
6.5 Sx 3.341656
28
Ȳ 5.8 Sy 2.573367 b -
88 0.63681592
-
n 10 r a 9.93930348
0.826939
64

a. Trace la información en un diagrama de dispersión. Suponga que las


horas de uso son la variable dependiente. Comente sobre la gráfica.

Diagrama de dispersión
12

10

4
y = -0.6368x + 9.9393
2R² = 0.6838

0 12 14
0246810

La grafica al tener una pendiente negativa y al estar los puntos tan


cerca a la recta muestra que existe una correlación negativa fuerte
entre las variables. Además que por cada mes adicional el tiempo de
uso se reduce en -0.6368

b. Determine el coeficiente de correlación. Interprete el resultado.


∑(� − �̅)(� − −�� = −�. ���9
�̅)
� = � × �. ���� × �.
( � − �)(����) ����

El coeficiente de correlación es negativo, quiere decir que existe una


relación inversa entre las variables, este valor esta muy cerca al -1 por
lo que se concluye que hay una asociación fuerte.

c. Con un nivel de significancia de 0.01, ¿hay una asociación negativa


entre las variables?
H0 ρ = 0 (la correlación entre la población es cero.)
H1 ρ ≠ 0 (la correlación entre la población es diferente de cero.)

�√𝑛 − 2 −0.8269√10 − 2
�= = = −1.804
√1 − � 2 √1 − (−0.8269)2

Rechazar H0 si y solo si: -2.355 < t < 2.355

-2.355 +2.355
0

Se rechaza H0 y se acepta la H1, llegando a la conclusión que el coeficiente


de correlación de la muestra -0.8269 es demasiado grande como para
provenir de una población sin correlación. Existiendo una relación negativa
o inversa entre ambas variables, y la relación entre ambas variables es
fuerte.

9. La National Highway Association estudia la relación entre el número


de licitadores en un proyecto para una carretera y la licitación más alta
(menor costo) del proyecto. De interés particular resulta saber si el
número de licitadores aumenta o disminuye la cantidad de la oferta
ganadora.

a) Determine la ecuación de regresión. Interprete la ecuación. ¿Más


licitadores tienden a aumentar
o a disminuir la cantidad de la oferta ganadora?

RPTA: La ecuación sería esta: Y= -0.4652x + 11.218


-Por cada incremento del número de licitadores en una unidad la oferta disminuye en -0.4652

b) Estime la cantidad de la oferta ganadora si se hubieran presentado


siete licitadores.
Y= -0.4652x + 11.218
Y= -0.4652(7) + 11.218
Y= 7.9616
c) Se desea construir una nueva entrada en la carretera Ohio Turnpike. Se
presentaron siete licitadores. Determine un intervalo de predicción de 95% de
la oferta ganadora.
RPTA: Intervalo de predicción
10.9886559

d) Determine el coeficiente de determinación. Interprete su valor.

R^2 = 0.50302688

El grado de variación de la oferta ganadora por la variación de número de licitadores está


equilibrado

10. El señor William Profit estudia compañías que se hacen públicas por
primera vez. Le interesa en particular la relación entre el tamaño de la
oferta y el precio por acción. Una muestra de 15 compañías que
recién se hicieron públicas reveló la siguiente información.
a. Determine la ecuación de regresión.

Diagrama de dispersión
11.4

11.2

11

10.8 y = 0.0031x + 10.66


R² = 0.2106
10.6
10.2
0 20 40 60 80 100120140160180200
10.4

Y = 0.0031x + 10.66

b. Establezca el coeficiente de determinación. ¿Considera que el señor Pocho con


el tamaño de la oferta como variable independiente?

R^2 = 0.21721278

El señor no está satisfecho con que el tamaño de la oferta sea una variable independiente.

11. Bardi Trucking Co. ubicada en Clevland,ohio, hace entregas en la región


de los Grandes Lagos, en el lado sur y en el lado norte. Jim Bardi, el
presidente, estudia la relación entre la distancia de recorrido de un
embarque y el tiempo, en días, que dura en llegar a su destino. Para
investigar esta cuestión, el señor Bardi seleccionó una muestra aleatoria
de 20 embarques del mes pasado. La distancia de envío es la variable
independiente y el tiempo de envío es la variable dependiente. Los
resultados son los siguientes:
a) Trace un diagrama de dispersión. Con base en estos datos, ¿parece haber una
relación entre la cantidad de millas que debe recorrer el embarque y el tiempo
que tarda en llegar a su destino?

b) Determine el coeficiente de correlación. ¿Es posible concluir que hay una


correlación positiva entre la distancia y el tiempo? Utilice el nivel de
significancia 0.05.

RPTA: 0.69210443

Si existe una correlación positiva pero débil.

c) Establezca e interprete el coeficiente de determinación.

R^2 = 0.47900854

d)Determine el error estándar de estimación

RPTA:145306.55

Anda mungkin juga menyukai