Anda di halaman 1dari 11

Capitulo 11

1-Se tiene la siguiente información sobre salarios y experiencia laboral

Experiencia Salario (miles de


(X) $ por año (Y)
15 30
10 35
20 55
5 22
15 40
5 27

Sabiendo que Xbar= 11.67 (≈12); Ybar= 34.83(≈35); Sx= 6.055301; y, Sy=11.68617
a) Encuentre la correlación entre los dos procesos
b) Indique si este coeficiente de correlación es estadísticamente diferente de cero, al 5%

c) Encuentre la pendiente (b1) y el intercepto (b0) de la regresión lineal Y  b0  b1 * X .

d) Encuentre SSR y SSE


e) Encuentre el coeficiente de determinación (R squared)
f) Encuentre el error estándar de la regresión
g) Encuentre el error estándar del estimador de la pendiente
h) Encuentre el error estándar del estimador del intercepto
i) Encontrar el intervalo de confianza para la pendiente poblacional
j) Encontrar el intervalo de confianza para el intercepto poblacional
k) Elabore una prueba de hipótesis para la pendiente poblacional y el intercepto poblacional,
y verifique si se rechaza la hipótesis nula o no al 5%
Respuestas
a) Correlación (n=6)

1 n
  
6

 i
n  1 i 1
X  X Yi  Y   X  12Yi  35
1 i 1 i 1 307
r r r *  0.87
S X SY 5 (6.055301) * (11.68617) 5 70.84

Xi Yi X Y X i X  Y  Y 
i X i 
 X * Yi  Y 
15 30 12 35 3 -5 -15
10 35 12 35 -2 0 0
20 55 12 35 8 20 160
5 22 12 35 -7 -13 91
15 40 12 35 3 5 15
5 27 12 35 -7 -8 56
307

En Excel

b) H0: r=0
H1: r≠0
α=0.05, grados de libertad =n-2=4, t-tablas=2.776

√ √

Dado que t-calc>t-tablas, se rechaza la nula


 b1  0.87  *
SY 11.68617
c)- b1  r  1.67901
SX 6.055301

b0  Y  b1 X  b0  34.83  (1.67901) * (11.66)  14.852

En Excel
Hacer click en data/data analysis
Luego hacer click en “regression”

y
X Y bzero buno ybar SSR SSE
estimado
15 30 15.3182 1.67273 40.4091 34.8333 31.0891 108.349
10 35 15.3182 1.67273 32.0455 34.8333 7.77227 8.72934
20 55 15.3182 1.67273 48.7727 34.8333 194.307 38.7789
5 22 15.3182 1.67273 23.6818 34.8333 124.356 2.82851
15 40 15.3182 1.67273 40.4091 34.8333 31.0891 0.16736
5 27 15.3182 1.67273 23.6818 34.8333 124.356 11.0103
512.9697 169.8636
SST 682.8333
Rsquared 0.751237
R-squared= SSR/SST, SST=SSR+SSE

√ √

̅
√ √ √

Intervalos de confianza t –tablas al 95% = 2.776


Pendiente poblacional

⁄ ⁄
[0.3429906, 3.0150294]
Intercepto poblacional

⁄ ⁄

[-2.8, 35.504]
Encontrando t-calculado
a) H0: betha 1=0
H1:betha 1≠0
t-calculado= buno/sb1=1.67901/0.481275= 3.4886
Mayor al t-tablas, se rechaza H0
a) H0: betha 0=0
H1:betha 0≠0
t-calculado= bcero/sb0=14.852/6.35882= 2.335653
No es mayor al t de tablas, no se puede rechazar H0
EN EXCEL
REGRESSION

Tenemos la siguiente caja

 Para Input_Range_Y (Salario)


 Para Input_Range_X (Experiencia)

Para sombrear “Salario” (el mismo procedimientos para “Experiencia”)

 Marcando New Worksheet Ply, el resultado se obtendrá en otra hoja


 Indique el nivel de confianza-Confidence level al 95%
Si marcan “labels” se marca los encabezados (Salario y Experiencia)

Hacer click en “OK”, se tiene el siguiente “output”


Aquí se tiene “a” y “b”. Se puede ver en la columna indicada como “coefficients” (Columna B).
Deben verse similares a los resultados obtenidos líneas arriba. A la derecha, está el error estándar
de esos estimados (Columna C). En la siguiente columna (Columna D), se tiene el t-estadístico,
el mismo que se debe comparar con el t de tablas al 95% (de dos colas) con 4 (n-2) grados de
libertad (t de tablas= 2.776). Además, se tiene el P-value (Columna E). Este P-value se debe
comparar con el “nivel de significancia”. En este caso, el nivel de significancia es de 5% (1-0.95
(nivel de confianza)=0.05). Finalmente, se tiene los intervalos de confianza al 95%.
Significancia Estadística.
El intercepto no es significativo al 5% (0.069 no es menor igual a 0.05). También se puede ver
con el intervalo de confianza. Aquí, dado que, la hipótesis nula indica que el intercepto
poblacional es igual a cero, cero cae dentro del intervalo de confianza. En otras palabras, 15.31
no es estadísticamente diferente de cero. A esta conclusión también se llega comparando el t de
tablas (2.776) con el t-estadístico (2.47). Como el segundo es menor al primero, no se puede
rechazar la hipótesis nula.
Sin embargo, el intercepto si es estadísticamente significativo al 10% porque 0.069 es menor
igual a 0.10. Siendo el t de tablas al 90% de nivel de confianza a dos colas con 4 grados de
libertad igual a 2.132 y el t-estadístico 2.47 (celda D12), la hipótesis nula de rechaza. El intervalo
de confianza se tiene que recalcular al 90%.
Por otro lado, la pendiente si es estadísticamente significativa al 5%, dado que, 0.0254 (celda
E13) es menor igual a 0.05. Esto se puede ver también usando intervalos de confianza (cero no
está dentro del intervalo) y el t-de tablas (3.475 (celda D13) es mayor igual a 2.776). En ambos
casos de rechaza la hipótesis nula.
Finalmente, también se tiene el “coeficiente de determinación’ en la celda B5, y el número de
observaciones en la celda B8.
El coeficiente de determinación indica que el 75% de los cambios del “Salario” se explican por
los cambios de la “Experiencia”
Nota: El P-value, el t-estadístico y los intervalos de confianza deben arrojar el mismo resultado.
Rechazar o no la hipótesis nula.
Interpretación Económica
La pendiente positiva indica lo que se esperaba, que “Experiencia” afecta positivamente al
“Salario”.
2-Tenemos datos de producción y costos semanales de una planta de aluminio. Con esta
información, el gerente de producción quiere ver cómo afecta el incremento de la producción a
los costos para saber cómo organizar la producción.
Producción
(X) 22 30 26 31 36 30 22 45 38
Costos (Y) 3,470 3,783 3,856 3,910 4,489 3,876 3,221 4,579 4,325
Producción
(X) 30 38 41 27 28 31 37 32 41
Costos (Y) 3,589 3,999 4,158 3,666 3,885 3,574 4,495 3,814 4,430

Donde Xbar= 32.5; Ybar=$3,951.06; Sx=6.56; y, Sy= $389.61


a) Obtener la pendiente de la regresión lineal.
b) Obtener el intercepto de la regresión lineal.
c) Explique qué significa el signo y magnitud de la pendiente (interpretación económica).
d) Prediga cuanto será el costo para un nivel de producción de 36.
e) Calcule el error estándar de los estimados (S).
f) Encontrar el coeficiente de determinación. ¿Qué significa ese valor?
g) Encontrar el error estándar de la pendiente (Sb1).
h) Encontrar el intervalo de confianza al 95% (dos colas) para la pendiente poblacional.
Respuestas:
a)

 b  0.869 *
SY 389.61
b1  r  $51.66
SX 6.56

b)

b0  Y  b1 X  b0  3,951.06  (51.66) * (32.5)  $2,273.735

Esto es el costo fijo, dado que, si produce cero unidades, de todas maneras se tiene que asumir un
costo de $2,273.735. El costo fijo es constante duramente todo el proceso de producción.
c) El signo indica que si el nivel de producción sube en 1% , el costo total subirá en 51%
La pendiente es conocida como “costo marginal” porque indica el cambio del costo total ante
el cambio del nivel de producción.
d) Yestimado  b0  b1 X  Yestimado  2273.735  51.66 * 36  $4131.71
e) Y  Yestimado  $4,489  $4131.71  $357.29
f)

SSE 630957.09
s s  s  198.58
n2 16

g) Coeficiente de determinación ==SSR/SST= 1949615.86/2580572.9=0.7555. Esto indica que


aproximadamente el 75% de la variabilidad del costo total es explicada por el nivel de
producción.
* Pueden seguir el mismo procedimiento de la pregunta uno para encontrar SST, SSE y SSR

s 198.58
h) S b1   Sb   7.343
S X n 1 6.56 17

2
1 X 1 (32.5) 2
i) S b 0 s  2  S b 0  198.58   243.16
n S X n  1 18 6.562 * 17 

j)
Grados de libertad=16
t de tablas al 95% (dos colas)= 2.210
Intervalo de confianza al 95%

Límite superior= b1  ttabla * Sb1  51.66  2.210 * 7.343  67.53

Límite inferior= b1  ttabla * Sb1  51.66  2.210 * 7.343  36.09

Entonces el estimado es estadísticamente diferente de cero porque se rechaza la hipótesis nula


que la pendiente poblacional es igual a cero.
En Excel

En este “outcome” se puede corroborar los coeficientes (en amarillo); el coeficiente de


determinación (en anaranjado), los errores estándar de los estimados (en verde) y el intervalo de
confianza de la pendiente poblacional (en rosado).
Viendo el P-value, este indica que el estimado es estáticamente significativo al 5% porque P-
value ≤0.05. También se puede calcular el t-estadístico y compáralo con el t-de tablas. Solo se
divide 51.66 (estimado) entre 7.34 (error estándar) el t-estadístico es 7.03 (celda D13). Como el t
de tablas al 95% es 2.120, entonces se rechaza la nula.
¿Qué hay del intercepto? ¿Es estadísticamente significativo?
3. Para evaluar el desempeño de sus vendedores en la zona en la que le toca trabajar se estima la
siguiente regresión lineal entre territorio (tamaño de la población) y ventas
Se estima la siguiente regresión lineal
Ventas esperadas= $1,371,744+0.23675045*territorio
Complete el siguiente cuadro e indique, viendo los residuos, que vendedor supera todas la
expectativas y quien tuvo un desempeño muy pobre

Ventas
Población Ventas Actuales Esperadas Residuos
Anson 4,956,512 2,687,224 2,545,200 142,024
Ashley 8,256,603 3,543,166 3,326,498 216,668
Jonathan 9,095,310 3,320,214 3,525,063 -204,849
Rod 12,250,809 3,542,722 4,272,129 -729,407
Nicholas 4,735,498 2,251,482 2,492,875 -241,393
Clara 13,683,663 5,149,127 4,611,357 537,770
Brittany 3,580,058 2,024,809 2,219,324 -194,515
Ian 2,775,820 1,711,720 2,028,921 -317,201
Bonnie 4,637,015 3,260,464 2,469,559 790,905

 Bonnie sobrepaso las expectativas sobre todo con un mercado tan pequeño. Tiene la
mayor diferencia positiva entre “Ventas Actuales” y “Ventas Esperadas”
 Rod tuvo una pobre performance sobretodo si tiene uno de los mercados más grandes.
Tiene la mayor diferencia negativa entre “Ventas Actuales” y “Ventas Esperadas”

Anda mungkin juga menyukai