Anda di halaman 1dari 36

EJERCICIOS DE REGRESIÓN MULTIPLE (Estadística)

CASO 6
En el béisbol, el éxito de un equipo se suele considerar en función del desempeño
en bateo y en lanzamiento del equipo. Una medida del desempeño en el bateo es
la cantidad de cuadrangulares que anota el equipo y una medida del desempeño
en lanzamiento es el promedio de carreras ganadas por el equipo que lanza. En
general, se cree que los equipos que anotan más cuadrangulares (home run) y
tienen un promedio menor de carreras ganadas ganan un mayor porcentaje de
juegos. Los datos siguientes pertenecen a 16 equipos que participaron en la
temporada de la Liga Mayor de Béisbol de 2003; se da la proporción de juegos
ganados, la cantidad de cuadrangulares del equipo (HR, por sus siglas en inglés)
y el promedio de carreras ganadas (ERA, por sus siglas en inglés)
(www.usatoday.com, 17 de enero de 2004).

a. Obtenga la ecuación de regresión estimada para predecir la proporción de


juegos ganados en función de la cantidad de cuadrangulares.
b. Obtenga la ecuación de regresión estimada para predecir la proporción de
juegos ganados en función del promedio de carreras ganadas por los
miembros del equipo que lanza.
c. Obtenga la ecuación de regresión estimada para predecir la proporción de
juegos ganados en función de la cantidad de cuadrangulares y del
promedio de carreras ganadas por los miembros del equipo que lanza.
d. En la temporada de 2003, San Diego ganó sólo el 39.5% de sus juegos,
siendo el más bajo de la liga nacional. Para mejorar para el año siguiente,
el equipo trató de adquirir nuevos jugadores que hicieran que la cantidad
de cuadrangulares aumentara a 180 y que el promedio de carreras
ganadas por el equipo que lanza disminuyera a 4.0. Use la ecuación de
regresión estimada obtenida en el inciso para estimar el porcentaje de
juegos que ganaría San Diego si tuviera 180 cuadrangulares y su promedio
de carreras ganadas fuera 4.0.

Solución ejercicio 6
a. Obtenga la ecuación de regresión estimada para predecir la
proporción de juegos ganados en función de la cantidad de
cuadrangulares.

1. LA RELACIÓN ESPERADA(TEÓRICA)
 HR-Proporción de ganados: relación Directa
2. DIAGRAMA DE DISPERSIÓN

Según lo esperado podemos observar la proporción de ganados tiene una relación


directa con respecto a HR, ver el siguiente diagrama
3. CORRELACIÓN
H0: 𝜌 = 0; h1: 𝜌 ≠ 0

Según lo observado en la siguiente tabla.

Correlaciones

Proporción de
ganados HR

Proporción de ganados Correlación de Pearson 1 ,391

Sig. (bilateral) ,134

N 16 16
HR Correlación de Pearson ,391 1

Sig. (bilateral) ,134

N 16 16

Con un p-value mayor al 0.05, se acepta hipótesis nula, no presenta una relación
significativa.

4. EL COEFICIENTE DE CORRELACIÓN: r=0.391, existe un correlación

Significativamente baja entre la HR con la proporción de ganados.

5. COEFICIENTE DE DETERMINACIÓN AJUSTADO


r2adj=0.093; el HR explica en 9.30 % a la estimación de la proporción de ganados
y no es explicado en 91.00%
Resumen del modelo

R cuadrado Error estándar


Modelo R R cuadrado ajustado de la estimación

1 ,391a ,153 ,093 ,066663

a. Predictores: (Constante), HR

6. PRUEBA DE VALIDEZ DEL MODELO

H0: 𝜌 = 0: la correlación no es significativa


Ha: 𝜌 ≠ 0: la correlación es significativa
ANOVAa

Suma de Media
Modelo cuadrados gl cuadrática F Sig.

1 Regresión ,011 1 ,011 2,532 ,134b

Residuo ,062 14 ,004

Total ,073 15

a. Variable dependiente: Proporcion de ganados


b. Predictores: (Constante), HR

o Con 5% de n.s, se acepta Ho. El modelo es NO significativo


7. EL MODELO
Ho: 𝛽𝑖 = 0; Ha: 𝛽𝑖 ≠ 0

Coeficientesa

Coeficientes
Coeficientes no estandarizad 95.0% intervalo de
estandarizados os confianza para B

Error Límite Límite


Modelo B estándar Beta t Sig. inferior superior

1 (Constante ,354 ,096 3,691 ,002 ,148 ,560


)

HR ,001 ,001 ,391 1,591 ,134 ,000 ,002

a. Variable dependiente: Proporcion de ganados


Proporción de ganados=0.354+0.001*HR
b. Obtenga la ecuación de regresión estimada para predecir la
proporción de juegos ganados en función del promedio de
carreras ganadas por los miembros del equipo que lanza.
1. LA RELACIÓN ESPERADA(TEÓRICA)

ERA – Proporción de ganados: relación inversa

2. DIAGRAMA DE DISPERSIÓN

Según lo esperado podemos observar que la proporción de ganados con respecto


a ERA presentan una relación inversa, ver el siguiente diagrama

3. CORRELACIÓN

H0: 𝜌 = 0; h1: 𝜌 ≠ 0
Según lo observado en la siguiente tabla.

Correlaciones

Proporcion de
ganados ERA

Proporcion de ganados Correlación de Pearson 1 -,709**

Sig. (bilateral) ,002

N 16 16
ERA Correlación de Pearson -,709** 1

Sig. (bilateral) ,002

N 16 16

**. La correlación es significativa en el nivel 0,01 (2 colas).


La proporción de ganados con ERA si presenta relación significativa al 5% de

4. EL EFICIENTE DE CORRELACIÓN:

r=0.709, existe un correlación alta significativa entre ERA con la proporción de


ganados.
5. COEFICIENTE DE DETERMINACIÓN AJUSTADO
r2adj=0.467; ERA explica en 46,7 % a la estimación de la proporción de ganados
y no es explicado en 53.3%

Resumen del modelo

R cuadrado Error estándar


Modelo R R cuadrado ajustado de la estimación

1 ,709a ,503 ,467 ,051072

a. Predictores: (Constante), ERA

6. PRUEBA DE VALIDEZ DEL MODELO

H0: 𝜌 = 0: la correlación no es significativa


Ha: 𝜌 ≠ 0: la correlación es significativa

ANOVAa

Suma de Media
Modelo cuadrados gl cuadrática F Sig.

1 Regresión ,037 1 ,037 14,167 ,002b

Residuo ,037 14 ,003

Total ,073 15

a. Variable dependiente: Proporcion de ganados


b. Predictores: (Constante), ERA

o Con 5% de n.s, se rechaza Ho. El modelo es significativo

7. EL MODELO –EVALUACION DE LOS PARÁMETROS.


Ho: 𝛽𝑖 = 0; Ha: 𝛽𝑖 ≠ 0

Coeficientesa

Coeficientes
Coeficientes no estandarizad 95.0% intervalo de confianza
estandarizados os para B

Error Límite
Modelo B estándar Beta t Sig. Límite inferior superior

1 (Constante) ,865 ,097 8,951 ,000 ,658 1,072

ERA -,084 ,022 -,709 -3,764 ,002 -,131 -,036

a. Variable dependiente: Proporcion de ganados

Proporción de ganados=0.865-0.084*ERA

c. Obtenga la ecuación de regresión estimada para predecir la


proporción de juegos ganados en función de la cantidad de
cuadrangulares y del promedio de carreras ganadas por los
miembros del equipo que lanza.

1. LA RELACIÓN ESPERADA (TEÓRICA)


o HR-Proporción de ganados: relación directa
o ERA – Proporción de ganados: relación inversa

2. DIAGRAMA DE DISPERSIÓN
Según lo esperado podemos observar la proporción de ganados tiene una relación
directa con respecto a HR, ver el siguiente diagrama
Según lo esperado podemos observar que la proporción de ganados con respecto
a ERA presentan una relación inversa, ver el siguiente diagrama

3. CORRELACIÓN

H0: 𝜌 = 0; h1: 𝜌 ≠ 0
Según lo observado en la siguiente tabla.

Correlaciones

Proporción de
ganados HR ERA

Proporción de ganados Correlación de Pearson 1 ,391 -,709**


Sig. (bilateral) ,134 ,002

N 16 16 16
HR Correlación de Pearson ,391 1 ,260
Sig. (bilateral) ,134 ,331
N 16 16 16
ERA Correlación de Pearson -,709** ,260 1

Sig. (bilateral) ,002 ,331

N 16 16 16

**. La correlación es significativa en el nivel 0,01 (2 colas).

o La proporción de ganados con ERA si presenta relación significativa al 5%


de n.s.
o La proporción de ganados con HR no presenta relación de significativa.
4. EL EFICIENTE DE CORRELACIÓN

r=0.926, existe un correlación alta significativa entre la HR y era con la


proporción de ganados.
5. COEFICIENTE DE DETERMINACIÓN AJUSTADO

r2adj=0.837; ERA y HR explica en 83,7 % a la estimación de la proporción de


ganados y no es explicado en 16.3%

Resumen del modelo

R cuadrado Error estándar


Modelo R R cuadrado ajustado de la estimación

1 ,926a ,858 ,837 ,028298

a. Predictores: (Constante), ERA, HR

6. PRUEBA DE VALIDEZ DEL MODELO

H0: 𝜌 = 0: la correlación no es significativa


Ha: 𝜌 ≠ 0: la correlación es significativa
ANOVAa

Suma de Media
Modelo cuadrados gl cuadrática F Sig.

1 Regresión ,063 2 ,032 39,374 ,000b

Residuo ,010 13 ,001

Total ,073 15

a. Variable dependiente: Proporcion de ganados


b. Predictores: (Constante), ERA, HR

o Con 5% de n.s, se rechaza Ho. El modelo es significativo


7. EL MODELO –EVALUACION DE LOS PARÁMETROS.
Ho: 𝛽𝑖 = 0; Ha: 𝛽𝑖 ≠ 0
Coeficientesa

Coeficientes
Coeficientes no estandarizado 95.0% intervalo de confianza
estandarizados s para B

Error Límite
Modelo B estándar Beta t Sig. Límite inferior superior

1 (Constante) ,709 ,060 11,808 ,000 ,579 ,839

HR ,001 ,000 ,617 5,710 ,000 ,001 ,002

ERA -,103 ,013 -,870 -8,043 ,000 -,130 -,075

a. Variable dependiente: Proporcion de ganados

Proporción de ganados= 0.709+0.001*HR-0.103*ERA


d. En la temporada de 2003, San Diego ganó sólo el 39.5% de sus
juegos, siendo el más bajo de la liga nacional. Para mejorar
para el año siguiente, el equipo trató de adquirir nuevos
jugadores que hicieran que la cantidad de cuadrangulares
aumentara a 180 y que el promedio de carreras ganadas por el
equipo que lanza disminuyera a 4.0. Use la ecuación de
regresión estimada obtenida en el inciso para estimar el
porcentaje de juegos que ganaría San Diego si tuviera 180
cuadrangulares y su promedio de carreras ganadas fuera 4.0.
Proporción de ganados= 0.709+0.001*HR-0.103*ERA
Proporción de ganados= 0.709+0.001*180-0.103*4
Proporción de ganados= 0.709+0.252 -0.412
Proporción de ganados= 0.549
Proporción de ganados= 54,9%

Ejercicio 7
Los diseñadores de mochilas usan materiales exóticos como supernailon Derlin,
polietileno de alta densidad, aluminio para aviones o espumas termo-moldeadas para
hacer que las mochilas sean más confortables y que el peso se distribuya uniformemente
eliminándose así los puntos de mayor presión. En los datos siguientes se proporciona
capacidad (en pulgadas cúbicas), evaluación del confort, y precio de 10 mochilas
probadas por Outside Magazine. El confort está medido con una escala del 1 al 5, en la
que 1 denota un confort mínimo y 5 un confort excelente. (Outside Buyer’s Guide, 2001).

Fabricante y modelo Capacidad Confort Precio


Camp Trails Paragon II 4330 2 190
EMS 5500 5500 3 219
Lowe Alpomayo 90+20 5500 4 249
Marmot Muir 4700 3 249
Kelly Bigfoot 5200 5200 4 250
Gregory Whitney 5500 4 340
Osprey 75 4700 4 389
Arc'Teryx Bora 95 5500 5 395
Dana Design Terraplane LTW 5800 5 439
The Works @ Mystery Ranch Jazz 5000 5 525

Solución ejercicio 7

a. Obtenga la ecuación de regresión estimada que permita predecir el


precio de una mochila, dada su capacidad y la evaluación de su
confort.

1. LA RELACIÓN ESPERADA (TEÓRICA)


o Capacidad – precio: Relación directa
o Confort – precio: Relación directa
o Capacidad – confort: No hay relación
2. DIAGRAMAS DE DISPERSIÓN:
o Capacidad – precio: Contra lo esperado podemos observar que los datos
no presentan relación alguna, ver el siguiente diagrama:

o Confort – precio: Según lo esperado podemos observar que los datos


presentan relación directa, con algunos puntos dispersos, ver el siguiente
diagrama:
o Capacidad – confort: Contra lo esperado podemos observar que los datos
presentan relación directa, con algunos puntos dispersos, ver el siguiente
diagrama:

3. CORRELACIÓN - PRUEBA DE HIPÓTESIS ENTRE


VARIABLES
o Ho: ρ=0: la correlación no es significativa
o Ha: ρ≠0: la correlación es significativa
o Según lo observado en la siguiente tabla:

 La capacidad no tiene relación significativa con el confort.


 El confort y el precio si presentan correlación significativa al 5% de n.s.
 La capacidad y el confort no tienen una relación significativa.
4. COEFICIENTE DE CORRELACIÓN R=0.912
Existe una correlación alta significativa entre el confort y la capacidad con el
precio.

5. COEFICIENTE DE DETERMINACIÓN AJUSTADO:


R2ADJ=0.784
El confort y la capacidad explican en 78.4% a la estimación del costo, y no es
explicado en 21.6%

6. PRUEBA DE VALIDEZ DEL MODELO:


Ho: El modelo no es significativo
Ha: El modelo es significativo.

Como p-value=0.002, entonces con 5% de n.s. se rechaza Ho. El modelo es


significativo.

7. EL MODELO – EVALUACIÓN DE LOS PARÁMETROS.


Ho: βi=0; Ha: βi≠0

Para Ho: β1=0, Ha: β1≠0, la capacidad NO contribuye significativamente


o
para estimar el precio en el modelo.
o Para Ho: β2=0, Ha: β2≠0, el confort si contribuye significativamente para
estimar el precio en el modelo.
Por lo tanto, rediseñamos el modelo con una variable menos, donde el nuevo
modelo a buscar es:
Precio = bo + b1*Confort
8. COEFICIENTE DE CORRELACIÓN NUEVO R=0.849
Existe una correlación alta significativa entre el confort con el precio.

9. COEFICIENTE DE DETERMINACIÓN AJUSTADO NUEVO:


R2ADJ=0.721
El confort explica en 72.1% a la estimación del precio, y no es explicado en 27.9%

10. PRUEBA DE VALIDEZ DEL MODELO:


Ho: El modelo no es significativo
Ha: El modelo es significativo.

Como p-value=0.002, entonces con 5% de n.s. se rechaza Ho. El modelo es


significativo.

11. EL MODELO – EVALUACIÓN DE LOS PARÁMETROS.


Ho: βi=0; Ha: βi≠0

o Para Ho: β1=0, Ha: β1≠0, el confort si contribuye significativamente para


estimar el precio en el modelo.
12. EL MODELO ES:
Precio de la mochila = -41.618 + 93.876*Confort

El precio de la mochila sin nivel de significancia y con las dos variables


es:
Precio = 356.121 -0.099*Capacidad +122.867*Confort

Sin embargo, con nivel de significancia al 5%, el modelo estimado es:


Precio = -41.618 + 93.876*Confort

b. Interprete b1 y b2.
o Con el primer modelo en el que el primer coeficiente (capacidad) no contribuye
significativamente al modelo:
0.099 es la estimación del decremento esperado en el precio que corresponde al
aumento en una pulgada cúbica en la capacidad cuando el confort permanece constante.
122.867 es la estimación del aumento esperado en el precio que corresponde al
aumento de la evaluación del confort cuando la capacidad permanece constante.

o Con el segundo modelo en el que si hay nivel de significancia:


93.876 es la estimación del aumento esperado en el precio que corresponde al
aumento de la evaluación del confort cuando la capacidad permanece constante.

c. Diga cuál será el precio de una mochila cuya capacidad sea


4500 pulgadas cúbicas y la evaluación de su confort sea 4.
o Con el primer modelo en el que el primer coeficiente (capacidad) no contribuye
significativamente al modelo:
Precio = 356.121 -0.099*(4500) +122.867*(4) = 402.09 = 402

o Con el segundo modelo en el que si hay nivel de significancia:


Precio = -41.618 + 93.876*(4) = 333.89 = 334
Ejercicio 8
En la siguiente tabla se da el rendimiento anual, la evaluación de la seguridad
(0=de alto riesgo, 10 segura) y el coeficiente de gastos anuales de 20 fondos extranjeros
(Mutual Funds, marzo del 2000).

a. Obtenga la ecuación de regresión estimada que relaciona el


rendimiento anual con la evaluación de la seguridad y con el
coeficiente de gastos anuales.
1. RELACIÓN ESPERADA (teórica):
o Rendimiento anual vs. Evaluación de seguridad: relación inversa.
o Rendimiento vs. coeficiente de gastos anuales: relación directa.
o Evaluación de seguridad vs. coeficiente de gastos anuales: no hay relación.
2. DIAGRAMA DE DISPERSIÓN:
 Rendimiento vs Factor de seguridad: como se puede observar, no hay
relación entre estas variables.
Diagrama de dispersión 1
140
120

Rendimiento Anual
100
80
60
40
20
0
0 2 4 6 8 10
Factor de Seguridad

o Rendimiento vs coeficiente de gasto: como se puede observar, no hay


relación entre estas variables.

Diagrama de dispersión 2
140

120
Rendimiento Anual

100

80

60

40

20

0
0 0.5 1 1.5 2 2.5
Coeficiente de gastos anuales

o Coeficiente de gasto vs Factor de seguridad: como se puede observar, no


hay relación entre estas variables.
Diagrama de dispersión 3
2.5

Coeficiente de variación 2

1.5

0.5

0
0 1 2 3 4 5 6 7 8 9
Factor de seguridad

3. CORRELACIÓN:
o 𝐇𝐨: 𝐩 = 𝟎: la correlacion no es significativa
o 𝐇𝐚: 𝐩 ≠ 𝟎: la correlacion es significativa

Segun lo observado en la siguiente tabla:


Correlaciones

FS COEFA RENDA

Correlación de Pearson 1 -,513* -,659**


FS Sig. (bilateral) ,021 ,002

N 20 20 20
Correlación de Pearson -,513* 1 ,668**
COEFA Sig. (bilateral) ,021 ,001
N 20 20 20
Correlación de Pearson -,659** ,668** 1

RENDA Sig. (bilateral) ,002 ,001

N 20 20 20

*. La correlación es significante al nivel 0,05 (bilateral).


**. La correlación es significativa al nivel 0,01 (bilateral).
o El factor de seguridad no tiene relación de significancia con el coeficiente anual.
Con el rendimiento anual presenta correlación significativa del 5%.
o El coeficiente anual tiene correlación de significancia al 5% de n.s con el
rendimiento anual.

4. COEFICIENTE DE CORRELACIÓN: r=0,763

Resumen del modelo

Modelo R R cuadrado R cuadrado Error típ. de la


corregida estimación

1 ,763a ,582 ,533 16,97705

a. Variables predictoras: (Constante), COEFA, FS

5. COEFICIENTE DE CORRELACIÓN AJUSTADO:


r2 adj=0,533, el factor de seguridad y el coeficiente anual explican en 53,3% al
rendimiendo anual y no es explicado en 46,7%.
Resumen del modelo

Modelo R R cuadrado R cuadrado Error típ. de la


corregida estimación

1 ,763a ,582 ,533 16,97705

a. Variables predictoras: (Constante), COEFA, FS

6. PRUEBA DE VALIDEZ DEL MODELO:


o Ho: 𝝆 = 𝟎: la correlación no es significativa
o Ha: 𝝆 ≠ 𝟎: la correlación es significativa

ANOVAa

Modelo Suma de gl Media F Sig.


cuadrados cuadrática

Regresión 6823,207 2 3411,604 11,837 ,001b


1 Residual 4899,743 17 288,220

Total 11722,950 19

a. Variable dependiente: RENDA


b. Variables predictoras: (Constante), COEFA, FS

7. EL MODELO – EVALUACIÓN DE LOS PARÁMETROS:


o 𝑯𝒐: 𝑩𝟏 = 0
o 𝑯𝒂: 𝑩𝟏 ≠ 0
o Para 𝑯𝒐: 𝑩𝟏 = 𝟎; 𝑯𝒂: 𝑩𝟏 ≠ 𝟎, El factor de seguridad si contribuye
significativamente para estimar los rendimiento anuales.
o Para 𝑯𝒐: 𝑩𝟐 = 𝟎; 𝑯𝒂: 𝑩𝟐 ≠ 𝟎, El coeficiente anual si contribuye
significativamente para estimar los rendimiento anuales.
𝑅𝑒𝑛𝑑𝑖𝑚𝑖𝑒𝑛𝑡𝑜 = 𝑏0 + 𝑏1 ∗ 𝐹𝑆 + 𝑏2 ∗ 𝐶𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑎𝑛𝑢𝑎𝑙

𝑅𝑒𝑛𝑑𝑖𝑚𝑖𝑒𝑛𝑡𝑜 = 247.358 − 32.845 ∗ 𝐹𝑆 + 34.589 ∗ 𝐶𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑎𝑛𝑢𝑎𝑙

c. Estime el rendimiento anual de una empresa cuya evaluación de


seguridad es de 7.5 y el coeficiente de gastos anuales es 2.

𝑅𝑒𝑛𝑑𝑖𝑚𝑖𝑒𝑛𝑡𝑜 = 247.358 − 32.845 ∗ 𝐹𝑆 + 34.589 ∗ 𝐶𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑎𝑛𝑢𝑎𝑙

Rendimiento=247.358-32.845*7.5+34.589*2

Rendimiento=70,2

Ejercicio 9
El ski acuático y el wakeboarding son dos deportes acuáticos muy actuales. Ya sea
que se trate de ski acuático, de wakeboarding o de navegación, hallar el modelo que mejor
se ajuste a las necesidades, puede no ser una tarea sencilla. La revista Water Ski probó
88 lanchas y proporcionó una amplia información como ayuda para los consumidores. A
continuación se presenta una parte de los datos que publicaron sobre 20 lanchas de 20 y
22 pies longitud (Water Ski, enero/febrero 2006). La manga es el ancho máximo de la
lancha (en pulgadas), HP son los caballos de fuerza del motor y velocidad máxima es la
velocidad máxima que alcanza la lancha, en millas por hora.
Fabricante y Modelo Manga HP Velocidad Máxima
Calabria Cal Air Por V-3 100 330 45.3
Correct Craft Air Nautique 210 91 330 47.3
Correct Craft Air Nautique SV-211 93 375 46.9
Corrrect Craft Air Nautique 206 Limited 91 330 46.7
Gekko GTR 22 96 375 50.1
Gekko GTS 20 83 375 52.2
Malibu Response Lxi 93.5 340 47.2
Malibu Sunsetter Lxi 98 400 46
Malibu Sunsetter 21 XTi 98 340 44
Malibu Sunscape 21 LSV 98 400 47.5
Malibu Wakesetter 21 XTi 98 340 44.9
Malibu Wakesetter VLX 98 400 47.3
Malibu vRide 93.5 340 44.5
Malibu Ride XTi 93.5 320 44.5
Mastercraft ProStar 209 96 350 42.5
Mastercraft X-1 90 310 45.8
Mastercraft X-2 94 310 42.8
Mastercraft X-9 96 350 43.2
MB Sports 190 Plus 92 330 45.3
Svfara SVONE 91 330 47.7

a. Empleando estos datos obtenga la ecuación de regresión


estimada que relaciona la velocidad máxima con la manga y los
caballos de fuerza de la lancha.

1. LA RELACIÓN ESPERADA (TEÓRICA)

o Manga-Velocidad Máxima : Relación directa


o Hp-Velocidad Máxima: Relación directa
o Manga - Hp: No hay relación

2. DIAGRAMA DE DISPERSIÓN

o Manga-Velocidad Máxima: Según lo esperado podemos observar que


los datos no tienen comportamiento directo, sino que estos no presentan
relación, ver el siguiente diagrama:
o Hp-Velocidad Máxima: Según lo esperado podemos observar que los
datos no tienen comportamiento directo, sino que estos no presentan
relación, ver el siguiente diagrama:

o Manga - Hp: Según lo esperado podemos observar que los datos no


poseen ninguna relación, ver el siguiente diagrama:
3. CORRELACIÓN – PRUEBA DE HIPÓTESIS ENTRE
VARIABLES
 𝑯𝒐: 𝒑 = 𝟎: 𝑙𝑎 𝑐𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖𝑜𝑛 𝑛𝑜 𝑒𝑠 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑡𝑖𝑣𝑎
 𝑯𝒐: 𝒑 ≠ 𝟎: 𝑙𝑎 𝑐𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖𝑜𝑛 𝑒𝑠 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑡𝑖𝑣𝑎
 𝑆𝑒𝑔𝑢𝑛 𝑙𝑜 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑑𝑜 𝑒𝑛 𝑙𝑎 𝑠𝑖𝑔𝑢𝑖𝑒𝑛𝑡𝑒 𝑡𝑎𝑏𝑙𝑎

Correlaciones

Manga Hp Velocidad_Maxima

Correlación de Pearson 1 ,258 -0,488*

Manga Sig. (bilateral) ,272 0,029

N 20 20 20
Correlación de Pearson 0,258 1 0,453*
Hp Sig. (bilateral) 0,272 0,045
N 20 20 20
Correlación de Pearson -0,488* 0,453* 1

Velocidad_Maxima Sig. (bilateral) 0,029 0,045

N 20 20 20

*. La correlación es significante al nivel 0,05 (bilateral).

o La manga no tiene relación significativa con el Hp. Con


Velocidad_Maxima presenta correlación significativa al 5% de n.s.

o 1.2 Hp también presenta una correlación significativa al 5% de n.s con


Velocidad_Maxima.

4. COEFICIENTE DE CORRELACIÓN: 𝒓 = 𝟎. 𝟕𝟕𝟑,


Existe una correlación alta significativa entre la manga y hp con el costo:
Resumen del modelo

Modelo R R cuadrado R cuadrado Error típ. de la


corregida estimación

1 ,773a ,597 ,550 1,59538

a. Variables predictoras: (Constante), Hp, Manga

5. PRUEBA DE VALIDEZ DEL MODELO

𝑯𝒐: El modelo no es significativo


𝑯𝟏 : El modelo es significativo.

ANOVAa

Modelo Suma de gl Media F Sig.


cuadrados cuadrática

Regresión 64,157 2 32,078 12,603 ,000b

1 Residual 43,269 17 2,545

Total 107,426 19

a. Variable dependiente: Velocidad_Maxima


b. Variables predictoras: (Constante), Hp, Manga

6. EL MODELO – EVALUACIÓN DE LOS PARÁMETROS

𝑯𝒐: 𝑩𝟏 = 𝟎
𝑯𝒂: 𝑩𝟏 ≠ 𝟎

o Para 𝑯𝒐: 𝑩𝟏 = 𝟎; 𝑯𝒂: 𝑩𝟏 ≠ 𝟎, El manga si contribuye significativamente para


estimar la velocidad de máxima del modelo.

o Para 𝑯𝒐: 𝑩𝟐 = 𝟎; 𝑯𝒂: 𝑩𝟐 ≠ 𝟎, El Hp si contribuye significativamente para estimar


los la velocidad de máxima del modelo.

𝑉𝑒𝑙𝑜𝑐𝑖𝑑𝑎𝑑 = 𝑏0 + 𝑏1 ∗ 𝑀𝑎𝑛𝑔𝑎 + 𝑏2 ∗ 𝐻𝑝

b. La Svfara SV 609 tiene una manga de 85 pulgadas y motor de


330 caballos de fuerza. Utilice la ecuación de regresión
estimada obtenida en el inciso a) para estimar la velocidad
máxima de la Svfara SV609.
𝑉𝑒𝑙𝑜𝑐𝑖𝑑𝑎𝑑 = 𝑏0 + 𝑏1 ∗ 𝑀𝑎𝑛𝑔𝑎 + 𝑏2 ∗ 𝐻𝑝

𝑉𝑒𝑙𝑜𝑐𝑖𝑑𝑎𝑑 = 64.966 − 0.39 ∗ 85 + 0.051 ∗ 330

𝑉𝑒𝑙𝑜𝑐𝑖𝑑𝑎𝑑 = 48.646

Ejercicio 25
Borron’s realiza revisiones anuales de los corredores de bolsa en línea, en la que
se incluyen tanto corredores a los que se les puede contactar vía un explorador de
Internet, así como corredores que tienen acceso directo y que ponen al cliente en contacto
directo con el servidor de una red de corredores de bolsa. La oferta y el desempeño de
cada corredor se evalúan en seis áreas, empleando para cada área una escala de 0 a 5.
Los resultados se ponderan para obtener una evaluación general y a cada corredor se le
asigna una evaluación final que va de cero a cinco estrellas. Tres de las áreas evaluadas
son ejecución de la operación, facilidad de uso y gama de ofertas. Un 5 en ejecución de la
operación significa que la llegada del pedido y el proceso de ejecución fluyeron con
facilidad de un paso a otro. En facilidad de uso, 5 significa que el sitio es de fácil uso y
que se puede ajustar para ver lo que le interesa al usuario ver. Un 5 en gama de ofertas
significa que todas las transacciones pueden realizarse en línea. En los datos siguientes
se presentan las puntuaciones obtenidas en ejecución de la operación, facilidad de uso y
gama de ofertas y el número de estrellas obtenidas por los integrantes de una muestra de
10 corredores de bolsa (Barron’s, 10 de marzo de 2003).
Corredor Ejecución de la Uso Gama Estrellas
operación
Wall St. Access 3.7 4.5 4.8 4.0
E*Trade (Power) 3.4 3.0 4.2 3.5
E*Trade 2.5 4.0 4.0 3.5
(Standard)
Preferred Trade 4.8 3.7 3.4 3.5
my Track 4.0 3.5 3.2 3.5
TD Waterhouse 3.0 3.0 4.6 3.5
Brown & Co. 2.7 2.5 3.3 3.0
Brokerage 1.7 3.5 3.1 3.0
America
Merrill Lynch 2.2 2.7 3.0 2.5
Direct
Strong Funds 1.4 3.6 2.5 2.0
a. Determine la ecuación de regresión estimada que se puede usar para predecir el número
de estrellas dadas las evaluaciones a ejecución, facilidad de uso y gama de ofertas.
b. Emplee la prueba F para determinar la significancia global de la relación. Empleando
como nivel de significancia 0.95, ¿cuál es la conclusión?
c. Emplee la prueba t para determinar la significancia de cada una de las variables
independientes. Empleando como nivel de significancia 0.05, ¿cuál es la conclusión?
d. Elimine cualquiera de las variables independientes que no sea significativa para la
ecuación de regresión estimada. ¿Cuál es la ecuación de regresión estimada que
recomienda? Compare R2 con el valor de R2 para el inciso a). Analice las diferencias.
Solución ejercicio 25
1. LA RELACIÓN ESPERADA (TEÓRICA)
o Ejecución de la operación - Estrellas: Relación Directa
o Uso - Estrellas: Relación Directa
o Gama - Estrellas: Relación Directa
o Ejecución de la operación – Uso: Relación Directa
o Ejecución de la operación – Gama: Relación Directa
o Uso – Gama : Relación Directa

2. DIAGRAMA DE DISPERSIÓN

o Según lo esperado podemos observar que los datos si tienen comportamiento


directo entre la Gama, Uso y la ejecución de la operación con las estrellas.
o También se observa que el uso no tiene relación con la ejecución de la operación.
o Además, la gama con el uso tampoco presentan relación.
o A sí mismo, la gama con la ejecución de la operación no tienen relación aparente.

3. CORRELACIÓN: PRUEBA DE HIPÓTESIS


Ho: p=0: La correlación no es significativa

Ha: p≠0: La correlación es significativa


Correlaciones

Ejecución de la Uso Gama Estrellas


operación

Correlación de Pearson 1 ,229 ,434 ,746*

Ejecución de la operación Sig. (bilateral) ,524 ,210 ,013

N 10 10 10 10
Correlación de Pearson ,229 1 ,301 ,420
Uso Sig. (bilateral) ,524 ,397 ,227
N 10 10 10 10
Correlación de Pearson ,434 ,301 1 ,827**
Gama Sig. (bilateral) ,210 ,397 ,003
N 10 10 10 10
Correlación de Pearson ,746* ,420 ,827** 1

Estrellas Sig. (bilateral) ,013 ,227 ,003

N 10 10 10 10

*. La correlación es significante al nivel 0,05 (bilateral).


**. La correlación es significativa al nivel 0,01 (bilateral).

o Las estrellas presentan correlación significativa al 5% de nivel de


significancia con la ejecución y la gama, mientras que con el uso no
presenta relación significativa.
o Entre la ejecución de la operación-uso, ejecución de la operación-gama y
la gama-uso no se encuentra relación significativa.

4. COEFICIENTE DE CORRELACIÓN
R= 0.941, Existe una correlación alta significativa entre la ejecución de la
operación, uso y la gama.
Resumen del modelo

Modelo R R cuadrado R cuadrado Error típ. de la


corregida estimación

1 ,941a ,886 ,828 2,43100

a. Variables predictoras: (Constante), Gama, Uso, Ejecución de la


operación

5. COEFICIENTE DE CORRELACIÓN AJUSTADO


𝑅 2adj = 0.828, la ejecución de la operación, uso y la gama explican en 82.8% a la
estimación de las estrellas, y no es explicado en 17.2%

6. PRUEBA DE VALIDEZ DEL MODELO


Ho: 𝝆 =0: el modelo no es significativo
Ha: 𝝆 ≠0: La correlación es significativa
ANOVAa
Modelo Suma de gl Media F Sig.
cuadrados cuadrática

Regresión 274,541 3 91,514 15,485 ,003b

1 Residual 35,459 6 5,910

Total 310,000 9

a. Variable dependiente: Estrellas


b. Variables predictoras: (Constante), Gama, Uso, Ejecución de la operación
Se prueba que el modelo es significativo.

7. EL MODELO – EVALUACIÓN DE LOS PARÁMETROS


Ho: βi =0: El modelo no es significativo
Ha: βi ≠0: El modela es significativo
Coeficientesa

Coeficientes no Coeficientes Intervalo de confianza de


estandarizados tipificados 95,0% para B
Modelo t Sig.
Límite Límite
B Error típ. Beta
inferior superior

(Constante) 3,451 5,307 ,650 ,540 -9,534 16,436

Ejecución de la
,255 ,086 ,460 2,978 ,025 ,045 ,464
1 operación

Uso ,132 ,140 ,138 ,944 ,382 -,211 ,476

Gama ,459 ,123 ,586 3,722 ,010 ,157 ,760

a. Variable dependiente: Estrellas


o Para Ho: β1 =0; Ha: β1 ≠0, La ejecución de la operación si contribuye
significativamente para estimar las estrellas del modelo.
o Para Ho: β2 =0; Ha: β2 ≠0, el uso NO contribuye significativamente para
estimar las estrellas del modelo.
o Para Ho: β3 =0; Ha: β3 ≠0, el uso si contribuye significativamente para estimar
las estrellas del modelo.
El modelo es:
𝑬𝒔𝒕𝒓𝒆𝒍𝒍𝒂𝒔 = 𝟑. 𝟒𝟏𝟓 + 𝟎. 𝟐𝟓𝟓 ∗ 𝒆𝒋𝒆𝒄𝒖𝒄𝒊ó𝒏 + 𝟎. 𝟏𝟑𝟐 ∗ 𝑼𝒔𝒐 + 𝟎. 𝟒𝟓𝟗 ∗ 𝑮𝒂𝒎𝒂

COEFICIENTE DE CORRELACIÓN
R= 0.932, Existe una correlación alta significativa entre la ejecución de la
operación, uso y la gama.
Resumen del modelo
Modelo R R cuadrado R cuadrado Error típ. de la
corregida estimación

1 ,932a ,869 ,831 2,41186

a. Variables predictoras: (Constante), Gama, Ejecución de la operación

COEFICIENTE DE CORRELACIÓN AJUSTADO


𝑅 2adj = 0.831, la ejecución de la operación, uso y la gama explican en 83.2% a la
estimación de las estrellas, y no es explicado en 16.8%.

PRUEBA DE VALIDEZ DEL MODELO


Ho: ρ=0: el modelo no es significativo
Ha: ρ≠0: La correlación es significativa
ANOVAa

Modelo Suma de gl Media F Sig.


cuadrados cuadrática

Regresión 269,281 2 134,640 23,146 ,001b

1 Residual 40,719 7 5,817

Total 310,000 9

a. Variable dependiente: Estrellas


b. Variables predictoras: (Constante), Gama, Ejecución de la operación

Se prueba que el modelo es significativo.

EL MODELO – EVALUACIÓN DE LOS PARÁMETROS


Ho: βi =0: El modelo no es significativo
Ha: βi ≠0: El modela es significativo

Coeficientesa

Coeficientes no Coeficientes Intervalo de confianza de


estandarizados tipificados 95,0% para B
Modelo t Sig.
Límite Límite
B Error típ. Beta
inferior superior

(Constante) 6,718 3,989 1,684 ,136 -2,715 16,151

Ejecución de la
1 ,264 ,084 ,476 3,131 ,017 ,065 ,463
operación

Gama ,485 ,119 ,621 4,080 ,005 ,204 ,767

a. Variable dependiente: Estrellas

o Para Ho: β1 =0; Ha: β1 ≠0, La ejecución de la operación si contribuye


significativamente para estimar las estrellas del modelo.
o Para Ho: β3 =0; Ha: β3 ≠0, el uso si contribuye significativamente para estimar las
estrellas del modelo.
El modelo es:
𝑬𝒔𝒕𝒓𝒆𝒍𝒍𝒂𝒔 = 𝟔. 𝟕𝟏𝟖 + 𝟎. 𝟐𝟔𝟒 ∗ 𝒆𝒋𝒆𝒄𝒖𝒄𝒊ó𝒏 + 𝟎. 𝟒𝟖𝟓 ∗ 𝑮𝒂𝒎
RESULTADOS
a. Determine la ecuación de regresión estimada que se puede usar
para predecir el número de estrellas dadas las evaluaciones a
ejecución, facilidad de uso y gama de ofertas.
𝑬𝒔𝒕𝒓𝒆𝒍𝒍𝒂𝒔 = 𝟑. 𝟒𝟏𝟓 + 𝟎. 𝟐𝟓𝟓 ∗ 𝒆𝒋𝒆𝒄𝒖𝒄𝒊ó𝒏 + 𝟎. 𝟏𝟑𝟐 ∗ 𝑼𝒔𝒐 + 𝟎. 𝟒𝟓𝟗 ∗ 𝑮𝒂𝒎𝒂

b. Emplee la prueba F para determinar la significancia global de la


relación. Empleando como nivel de significancia 0.95, ¿cuál es
la conclusión?
Utilizando la prueba F en el Análisis 1:

Ho: ρ=0: el modelo no es significativo


Ha: ρ≠0: La correlación es significativa
ANOVAa

Modelo Suma de gl Media F Sig.


cuadrados cuadrática

Regresión 274,541 3 91,514 15,485 ,003b

1 Residual 35,459 6 5,910

Total 310,000 9

a. Variable dependiente: Estrellas


b. Variables predictoras: (Constante), Gama, Uso, Ejecución de la operación

Se obtiene para F=15.485, y un p-value de 0.003 que con un 5% de significancia


se rechaza Ho. Por ello, se concluye que el la prueba proporciona evidencia estadística
suficiente para concluir que los parámetros no son igual a cero y que la relación global
entre las estrellas y el conjunto de variables independientes es significativa.

c. Emplee la prueba t para determinar la significancia de cada una


de las variables independientes. Empleando como nivel de
significancia 0.05, ¿cuál es la conclusión?
Ho: βi =0: El modelo no es significativo
Ha: βi ≠0: El modela es significativo
Coeficientesa

Coeficientes no Coeficientes Intervalo de confianza de


estandarizados tipificados 95,0% para B
Modelo t Sig.
Límite Límite
B Error típ. Beta
inferior superior

(Constante) 3,451 5,307 ,650 ,540 -9,534 16,436

Ejecución de la
,255 ,086 ,460 2,978 ,025 ,045 ,464
1 operación

Uso ,132 ,140 ,138 ,944 ,382 -,211 ,476

Gama ,459 ,123 ,586 3,722 ,010 ,157 ,760

a. Variable dependiente: Estrellas


o Para Ho: β1 =0; Ha: β1 ≠0, La ejecución de la operación si contribuye
significativamente para estimar las estrellas del modelo.
o Para Ho: β2 =0; Ha: β2 ≠0, el uso NO contribuye significativamente para estimar
las estrellas del modelo.
o Para Ho: β3 =0; Ha: β3 ≠0, el uso si contribuye significativamente para estimar las
estrellas del modelo.

d. Elimine cualquiera de las variables independientes que no sea


significativa para la ecuación de regresión estimada. ¿Cuál es la
ecuación de regresión estimada que recomienda? Compare R2
con el valor de R2 para el inciso a). Analice las diferencias.
Por lo tanto rediseñamos el modelo con una variable menos, donde el nuevo
modelo a buscar es:
Estrellas= β0 + β1 * La ejecución de la operación + β2 * Gama
Comparando R2:
Del primer análisis: R2=0.828
Del segundo análisis: R2=0.831
Se observa que cuando se eliminó la variable que no era significante para el
modelo, aumento el R2 lo que explica que hay menor porcentaje de variabilidad de las
estrellas cuando se usan las variables de ejecución de la operación y la Gama.

Ejercicio 31
La sección “Guía para el usuario” del sitio en la Red de la revista Car and Driver
proporciona información sobre pruebas viales (road test) de automóviles, camiones, SUV
(acrónimo en inglés de Sport Utility Vehicle) y vans. Abajo se presentan las puntuaciones
generales para calidad general, modelo de vehículo, frenado, manejo, economía de
combustible, confort interior, aceleración, confiabilidad, ajuste y terminado, transmisión
dadas a diversos vehículos empleando una escala del 1 (lo peor) a 10 (lo mejor). Aquí se
presenta una parte de los datos de 14 automóviles Deportivos/GT
(www.caranddriver.com, 7 de enero de 2004).

a. Dé una ecuación de regresión estimada usando manejo, confiabilidad, y ajuste y


terminado para predecir la calidad general.

b. Otro de los automóviles deportivos/GT evaluados por Car and Driver es el Honda
Accord. Las evaluaciones de manejo, confiabilidad, y ajuste y terminado dadas a este
automóvil fueron 8.28, 9.06 y 8.07, respectivamente. Estime la evaluación general dada
a este automóvil.

c. Dé un intervalo de 95% de confianza para la calidad general de todos los automóviles


deportivos y GT con las características enumeradas en el inciso a).

d. Dé un intervalo de predicción de 95% para la calidad general del Honda Accord


descrito en el inciso b).

e. La evaluación general dada por Car and Driver para el Honda Accord fue 8.65.
Compare esta evaluación con las estimaciones obtenidas en los incisos b) y d).

Solución ejercicio 31

a. Dé una ecuación de regresión estimada usando manejo,


confiabilidad, y ajuste y terminado para predecir la calidad
general.
1. LA RELACIÓN ESPERADA:
Manejo-General: relación directa
Confiabilidad-General: relación directa
Ajuste y terminado-General: relación directa
Manejo – Confiabilidad: relación directa
Manejo – Ajuste: relación directa
Ajuste – Confiabilidad: relación directa

2. DIAGRAMA DE DISPERSIÓN
Manejo-General: Según lo esperado los datos tienen comportamiento directo, ver
el siguiente diagrama:

Confiabilidad-General: Según lo esperado los datos tienen comportamiento


directo, ver el siguiente diagrama:
Ajuste y terminado-General: Según lo esperado los datos tienen comportamiento
directo, ver el siguiente diagrama:
Entre las variables independientes se espera que exista cierta relación y lo
observado es:
Manejo – Confiabilidad: sin relación
Manejo – Ajuste: relación directa
Ajuste – Confiabilidad: sin relación

3. CORRELACIÓN POR CADA PAR DE VARIABLES


o La puntuación de la calidad general tiene relación con el manejo, confiabilidad y
ajuste terminado.
o El ajuste y el manejo existe cierta relación significativa, por lo tanto puede afectar
al modelo.
o Entre el manejo y la confiabilidad no existe relación

4. COEFICIENTE DE CORRELACIÓN: R=0.93

Coeficiente de correlación: r=0.93, existe una correlación alta significativa


entre la Ajuste y terminado, Confiabilidad y manejo con el general.

5. COEFICIENTE DE DETERMINACIÓN AJUSTADO:


R2ADJ=0.824
Ajuste y terminado, Confiabilidad y manejo explican en 82.4% a la estimación del
costo, y no es explicado en 17.6%

6. VALIDEZ DEL MODELO

P-value =0, entonces el modelo es significativo con 5% de nivel de significancia.

7. EL MODELO - EVALUACIÓN DE LOS PARÁMETROS


Para ho: B1=0, Ha: B1≠o, El manejo si contribuye significativa para estimar los
costos en el modelo.
Para ho: B2=o, Ha: B2≠o , La confiabilidad si contribuye significativamente para
estimar los costos en el modelo.
Para Ho: B3=o, HA: B3≠o El ajuste y terminado si contribuye significativamente
para estimar los costos en el modelo.
Por lo tanto el modelo a usar es:
General=-0.55+0.276*Manejo+0.447*Confiabilidad+0.270*Ajuste

b) Otro de los automóviles deportivos/GT evaluados por Car and


Driver es el Honda Accord. Las evaluaciones de manejo,
confiabilidad, y ajuste y terminado dadas a este automóvil fueron
8.28, 9.06 y 8.07, respectivamente. Estime la evaluación general
dada a este automóvil
General=-0.55+0.276*8.28+0.447*9.06+0.270*8.07=7.964

Anda mungkin juga menyukai