Anda di halaman 1dari 17

UNCP – FAIM

EJERCICIOS RESUELTOS DE REGRESIÓN LINEAL SIMPLE Y


CORRELACION
1. ¿Por qué son iguales los signos del coeficiente de correlación y de la
pendiente de la recta de regresión lineal de mínimos cuadrados?

SOLUCION:
 La pendiente de la recta de regresión lineal está dada por:

𝑆𝑥𝑦
b= ………….. 1
𝑆𝑥 2

 El coeficiente está dado por la siguiente relación:

𝑆𝑥𝑦
r= ……………. 2
𝑆𝑥 𝑆𝑦

De la expresión 1 y 2 se tiene que:

𝑟𝑥 𝑆𝑦 𝑏𝑆𝑥
b= r=
𝑆𝑥 𝑆𝑦

Entonces r y b tienen el mismo signo.

2. Dadas las rectas de regresión de mínimos cuadrados Y= a + bX y


X = c + dY. Compruebe que bxd es igual al coeficiente de
determinación.

SOLUCION:

Determinando el valor de b y d apartir de las siguientes ecuaciones

𝑆𝑥𝑦
 Y = a + bX b=
𝑆𝑥 2

QUISPE BOZA, Orlando 2015 -II


UNCP – FAIM

𝑦̅ - b𝑥̅ = a

𝑆𝑥𝑦
 X = c + dY d=
𝑆𝑦 2
𝑥̅ - d𝑦̅ = c
 Multiplicando los valores de b y d
𝑆𝑥𝑦 𝑆𝑥𝑦 𝑆𝑥𝑦 𝑆𝑥𝑦
bxd = x 𝑆𝑦 2 = .
𝑆𝑥 2 𝑆𝑥 𝑆𝑦 𝑆𝑥 𝑆𝑦

𝑆𝑥𝑦
Pero se sabe que: r =
𝑆𝑥 𝑆𝑦

bxd = r.r = 𝑟 2

3. Si las gráficas de las rectas de regresión de Yen X y de X en Y forman


un ángulo de 90 grados, ¿Qué se puede afirmar del índice de
correlación entre X e Y?

SOLUCION:

x - 𝑥̅ = d (y - 𝑦̅)…… (1); despejando (y - 𝑦̅) a partir de la expresión 1


x − 𝑥̅
Se tiene: y - 𝑦̅ = …….(2)
𝑑
Graficando las rectas (1) y (2):

Y ̅
𝐱 −𝒙
̅=
y -𝒚
𝒅

̅ = d (y - 𝒚
x -𝒙 ̅)

QUISPE BOZA, Orlando 2015 -II


UNCP – FAIM

A partir de la gráfica de las rectas se puede observar que las rectas


tienen un punto en común (𝑥̅ ; 𝑦̅)

r = 0 por ser las rectas perpendiculares y por tener un punto


en común.

4. Si (𝑥1 ; 𝑦1 ), (𝑥2 ; 𝑦2 ),………………….. (𝑥𝑛 ; 𝑦𝑛 ) son n pares de datos


observados que se encuentran en la recta L: Y = mX + b, ¿Por qué L es
la recta de regresión de mínimos cuadrados para esto puntos?, ¿Qué
porcentaje de la varianza total de los 𝑦𝑖 es explicado por L?.
SOLUCION:
Los n pares de datos observados son: (𝑥1 ; 𝑦1 ), (𝑥2 ; 𝑦2 ),…………………..
(𝑥𝑛 ; 𝑦𝑛 ) además la ecuación de la recta es:

L: Y = mX + b………. (1)

Para x = 𝑥𝑖 entonces la ecuación (1) toma la forma siguiente:

𝑦̅𝑖 = b + m𝑥𝑖 , donde 𝑦̅𝑖 es el valor estimado.

Si 𝑥𝑖 es un valor de la muestra (𝑥𝑖 ; 𝑦𝑖 ) es un punto de la recta de


regresión:
Y= b +mX

𝑦𝑖
Y = b + mx

𝑦̅𝑖

𝑥𝑖

QUISPE BOZA, Orlando 2015 -II


UNCP – FAIM

Donde: 𝑑𝑖 = 𝑦𝑖 - 𝑦̅𝑖 , y la suma de cuadrados de errores es:


∑𝑛𝑖=1 𝑑𝑖 2 = ∑𝑛𝑖=1(𝑦𝑖 − 𝑦̅𝑖 )2 = ∑𝑛𝑖=1(𝑦𝑖 − b − m𝑥𝑖 )2

El porcentaje es y = 100%, por que ∑(𝑦𝑖 − 𝑦̅𝑖 )2 =0

5. Dada la recta de regresión de mínimos cuadrados Y = a + bX, si se


produce un incremento igual a “c” en X, ¿cuánto es el incremento
promedio respectivo que se produce en Y?, ¿Por qué?

SOLUCION:

y = a + bx, es la ecuación de la recta


Planteamiento: Cuando X cambia una unidad, esto es si 𝑥𝑖 se
incrementa en 1, entonces 𝑦̅𝑖 se incrementa en promedio en b.

Generalizando: si 𝑥𝑖 se incrementa en k unidades; 𝑦̅𝑖 se incrementa


en promedio en b unidades.

Si se incrementa en “c”, se tiene la siguiente relación:

𝑦̅𝑖 = a + bcX
Donde:
a, es constante (no varía)
bc, es el incremento

se observa que hay un incremento de bc

6. Se obtiene una regresión de Y en X aplicando una muestra de 10 datos


(𝑥𝑖 ; 𝑦𝑖 ). Si la varianza de los 𝑦𝑖 es igual a 16 y la suma de cuadrados

QUISPE BOZA, Orlando 2015 -II


UNCP – FAIM

debido a la regresión obtenida es 140, ¿qué porcentaje de la varianza


de los 𝑦𝑖 es explicada por la regresión?
SOLUCION:
Del problema se tiene los siguientes datos:

𝑆𝑦 2 = 16; ∑ 𝑦 2 = 140 y n = 10
𝑟𝑒𝑒𝑚𝑝𝑙𝑎𝑧𝑎𝑛𝑑𝑜 𝑒𝑠𝑡𝑜𝑠 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑒𝑛 𝑠𝑖𝑔𝑢𝑖𝑒𝑛𝑡𝑒 𝑒𝑐𝑢𝑎𝑐𝑖𝑜𝑛:

𝑆𝑥𝑦
y - 𝑦̅ = (x − 𝑥̅ )
𝑆𝑥 2

el porcentaje es: 87,5%

7. El coeficiente de correlación entre dos variables X e Y es r = 0.60. Si


𝑆𝑥 = 1.50, 𝑆𝑦 =2.00, 𝑥̅ =10, 𝑦̅ = 20 obtenga la recta de regresión:
a) De Y en X b) de X en Y

SOLUCION:
Datos del problema:

r = 0.60; Si 𝑆𝑥 = 1.50; 𝑆𝑦 =2.00; 𝑥̅ =10; 𝑦̅ = 20

a) La ecuación de la recta de Y en X es:

𝑆𝑥𝑦
y - 𝑦̅ = (x − 𝑥̅ )
𝑆𝑥 2
Calculamos 𝑆𝑥𝑦 :

𝑆𝑥𝑦 = r𝑆𝑥 𝑆𝑦 𝑆𝑥𝑦 = 0.6x1.5x2 =18

18
y - 20= (x − 10)
25

La ecuación de la recta es y = 0,8X + 12

b) Determinando la ecuación de la recta de X en Y:

QUISPE BOZA, Orlando 2015 -II


UNCP – FAIM

𝑆𝑥2
x − 𝑥̅ = (y − 𝑦̅)
𝑆𝑥𝑦

1,8
X – 10 = (Y – 20)
4

La ecuación de la recta es X = 0,45Y + 1

8. Si la ecuación de regresión: Y= 62 + 0.76X se obtuvo de n pares datos,


donde, 𝑆𝑥 = 5, ¿es cierto que la medida de la variabilidad conjunta es
mayor que 20?
SOLUCION:
Si: 𝑆𝑥 = 5, entonces el valor de 𝑆𝑥 2 es:
𝑆𝑥 2 = 25
Como:
𝑆𝑥𝑦
y - 𝑦̅ = (x − 𝑥̅ )
𝑆𝑥 2

25y - 25𝑦̅ = X𝑆𝑥𝑦 -𝑥̅ 𝑆𝑥𝑦

25y = X𝑆𝑥𝑦 + (-𝑥̅ 𝑆𝑥𝑦 + 25𝑦̅), despejando y se tiene:

X𝑆𝑥𝑦 (−𝑥̅ 𝑆𝑥𝑦 + 25𝑦̅)


Y= +
25 25

Del enunciado se tiene que la ecuación de la recta es: Y = 0,76 X + 62

 Igualamos los coeficientes de X:


𝑆𝑥𝑦
0,76 = 𝑆𝑥𝑦 = 19
25

No es cierto, porque: 𝑆𝑥𝑦 = 𝑐𝑜𝑣𝑥𝑦 = 19

9. Utilizando los n pares de datos (𝑥1 ; 𝑦1 ),………………….. (𝑥𝑛 ; 𝑦𝑛 ) se


obtuvo un modelo de regresión lineal simple de Y con X de pendiente
igual a -1. Determine el índice de correlación lineal.

QUISPE BOZA, Orlando 2015 -II


UNCP – FAIM

SOLUCION:
La pendiente de la recta de regresión lineal está dado por la siguiente
relación:
𝑆𝑥𝑦
b=
𝑆𝑥 2
𝑆𝑥𝑦
Entonces: b = = a -1
𝑆𝑥 2

Además:
𝑆𝑥𝑦 (𝑎−1)𝑆𝑥
r= = , donde a-1 = b
𝑆𝑥 𝑆𝑦 𝑆𝑦

𝑏𝑆𝑥
r= = -1
𝑆𝑦

10. Si la ecuación de regresión de Y en X es: Y = 3 + 2X y 𝑥̅ =20, halle la


ecuación de regresión de Y´ en X´, donde X´= X + 3 e Y´ = Y + 6.

SOLUCION:
A partir de las ecuaciones:
X´= X + 3 e Y´ = Y + 6
podemos formar los siguientes sistemas de ecuaciones:

X´= X + 3
h = -3
X´= X - h
Donde h y k son constantes
Y´ = Y + 6
K = -6
Y´ = Y - k

Si realizamos transformaciones en x o y o en ambos; b y r son


invariantes es decir no cambian.

𝑆𝑥𝑦 𝑆X´Y´ 𝑆X´Y 𝑆XY´


b= = = =
𝑆𝑥 2 𝑆𝑥 2 𝑆𝑥 2 𝑆𝑥 2

QUISPE BOZA, Orlando 2015 -II


UNCP – FAIM

𝑆𝑥𝑦 𝑆𝑥 𝑆Y´ 𝑆X´Y 𝑆𝑥 𝑆Y´


r= = = =
𝑆𝑥 𝑆𝑦 𝑆X´ 𝑆Y´ 𝑆X´ 𝑆Y 𝑆X 𝑆Y´

Entonces la ecuación de regresión de Y´ en X´ es:

Y´ = 3 + 2 X´
11. Al estudiar la regresión lineal de los ingresos medios (Y en $) en
función del número de hijos de familia (X), se obtuvo la siguiente
información:

𝑥̅ = 3, 𝑦̅ =700, 𝑆𝑥 = 0.5x√𝐶𝑜𝑣𝑥𝑦
Estime los ingresos de las familias con 4 hijos, ¿a cuántos hijos por
familia correspondería un ingreso estimado en $712?
SOLUCION:
Datos: 𝑥̅ = 3, 𝑦̅ =700, 𝑆𝑥 = 0.5x√𝐶𝑜𝑣𝑥𝑦

Reemplazando estos valores en la ecuación:


𝑆𝑥𝑦
y - 𝑦̅ = (x − 𝑥̅ )
𝑆𝑥 2

𝐶𝑜𝑣𝑥𝑦 (x−3)
 y - 700= 0,25y = x -3 +175
0,25𝐶𝑜𝑣𝑥𝑦

 Y = 4X + 688

 Si hay 4 hijos, entonces x = 4

Y = 4x4 + 688 = $704 (viene a ser el ingreso estimado)

 Determinando el número de hijos por familia al cual le corresponde


un ingreso estimado en $712
712 = 4X + 688 = $704
X=6

QUISPE BOZA, Orlando 2015 -II


UNCP – FAIM

Entonces el número de hijos es 6

12. Si Y = a + bX es la ecuación de regresión obtenida de una muestra y si


(y−𝑦̅) (X−𝑋̅)
𝑧𝑦 = , 𝑧𝑥 = son las variables estandarizadas de Y y X
𝑆𝑦 𝑆𝑋
respectivamente, compruebe que la ecuación de regresión es
𝑆𝑥
equivalente a: 𝑧𝑦 = b 𝑧𝑥 .
𝑆𝑦

SOLUCION:
(y−𝑦̅) (X−𝑋̅)
Se tienen los siguientes datos: 𝑧𝑦 = , 𝑧𝑥 = y la ecuación de la recta
𝑆𝑦 𝑆𝑋
de regresión lineal es: Y = a + bX
Además podemos formar las siguientes ecuaciones:
y - 𝑦̅ = 𝑧𝑦 . 𝑆𝑦 …. (1) ^ x − 𝑥̅ = 𝑧𝑥 . 𝑆𝑥 …. (2)
Además:
y - 𝑦̅ = b (x − 𝑥̅ )………..3
Reemplazando los valores de y - 𝑦̅ ^ x − 𝑥̅ en la ecuación 3
𝑧𝑦 . 𝑆𝑦 = b 𝑧𝑥 . 𝑆𝑥
𝑆𝑥
𝑧𝑦 = b 𝑧𝑥
𝑆𝑦

13. Si n valores (𝑥1 ; 𝑦1 ),………………….. (𝑥𝑛 ; 𝑦𝑛 ) de (X,Y) tienen índice de


correlación r, compruebe que la recta de regresión en las variables
(𝑥𝑖 −𝑥̅ ) (𝑦𝑖 −𝑦̅)
estandarizadas 𝑧𝑦 y 𝑧𝑥 cuyos valores son: 𝑧𝑥𝑖 = , 𝑧𝑦𝑖 = ,
𝑆𝑥 𝑆𝑦
para i= 1, 2, 3,…, n, es 𝑧𝑦 = r𝑧𝑥

SOLUCION:
𝑆𝑥𝑦 𝑆𝑥𝑦
En la ecuacion: y - 𝑦̅ = (x − 𝑥̅ ), es igual a:
𝑆𝑥 2 𝑆𝑥 2

𝑆𝑥𝑦
=b
𝑆𝑥 2

QUISPE BOZA, Orlando 2015 -II


UNCP – FAIM

y - 𝑦̅ = b (x − 𝑥̅ )………1
𝑟𝑥 𝑆𝑦
además b es igual a: b= ; reemplazando el valor de b en la ecuacion
𝑆𝑥
1
𝑟𝑥 𝑆𝑦 y − 𝑦̅ (x−𝑥̅ )
y - 𝑦̅ = (x − 𝑥̅ ) =𝑟𝑥
𝑆𝑥 𝑆𝑦 𝑆𝑥

y − 𝑦̅ (x−𝑥̅ )
reemplazando los valores de y
𝑆𝑦 𝑆𝑥

𝑍𝑌 = 𝑟𝑥 𝑍𝑋

14. Si los (𝑥1 ; 𝑦1 ),………………….. (𝑥𝑛 ; 𝑦𝑛 ) son tales que cumplen la relación
Y = bX obtenga b aplicando el método de mínimos cuadrados.

SOLUCION:
La ecuación general es:

∑𝑛𝑖=1 𝑥𝑖 𝑦𝑖 = a∑𝑛𝑖=1 𝑥𝑖 +b ∑𝑛𝑖=1 𝑥𝑖 2 ………..1

La ecuación de la recta de regresión lineal es: Y = bX = a + bX


Entonces el valor de a es: a= 0, reemplazando este valor en la ecuacion 1
∑𝑛𝑖=1 𝑥𝑖 𝑦𝑖 = b ∑𝑛𝑖=1 𝑥𝑖 2 , despejando el valor de b

∑𝑛
𝑖=1 𝑥𝑖 𝑦𝑖 ∑ 𝑥𝑦
b= ∑𝑛 2
= ∑ 𝑥2
𝑖=1 𝑥𝑖

15. En el estudio de la producción diaria (Y) de un bien y los años de


servicio (X) de los empleados de la fábrica se usó una recta de
regresión lineal simple aplicando una muestra de 4 empleados. Si las
producciones observadas fueron 10, 8, 6, 14 y las producciones

QUISPE BOZA, Orlando 2015 -II


UNCP – FAIM

estimadas respectivas resultaron: 10.8, 8.2, 5.6, 13.4, ¿Qué porcentaje


de la varianza de la producción es explicada por la recta de regresión?
SOLUCION:
Elaborando las tablas (1) y (2) para hallar los valores de 𝑆𝑥𝑦 , 𝑆𝑥 para
calcular r y determinar el porcentaje:
n=4

obrero 1 2 3 4
Observación=X 10 8 6 14
Estimación =y 10.8 8.2 5.6 13.4
Tabla (1)

X Y XY 𝑋2 𝑦2
10 10.8 108 100 116.64
8 8.2 65.6 64 67.24
6 5.6 33.6 36 31.36
14 13.4 187.6 196 179.56
Ʃ 38 38 394.8 396 394.8
Tabla (2)
𝑆𝑥𝑦
r= ; 𝑦̅ = 𝑥̅ = 9.5
𝑆𝑥 𝑆𝑦

calculando 𝑆𝑥𝑦 :
∑ 𝑋𝑌 394.8
𝑆𝑥𝑦 = - 𝑥̅ 𝑦̅ = – 90.25 =8.45
𝑛 4

Calculando 𝑆𝑥 :

∑ 𝑥2 396
 𝑆𝑥 = √ − 𝑥̅ 2 = √ − 90.25 = 2.958
𝑛 4

Determinando el valor de r:

QUISPE BOZA, Orlando 2015 -II


UNCP – FAIM

8.45
r= =0.983
2.96𝑥2.958

𝑟 2 = 0.9662

 Entonces el porcentaje es: 96,62%

16. Con el fin de tener un modelo de regresión lineal entre ingresos


mensuales y gastos de educación de las familias aplicando una
muestra de familias, se obtuvo un coeficiente de determinación del
90.25%, medias respectivas de $10 y $120, y desviaciones estándar
respectivas de $10 y $7. Con el modelo de regresión obtenido.
a) ¿En cuánto estima usted el gasto mensual en educación de una
familia cuyo ingreso mensual es de $300?
b) Si una familia estima en $379 en educación ¿Cuánto debería ser su
ingreso mensual?
c) Si una familia tiene un aumento de $50 en su ingreso mensual, ¿en
cuánto se incrementaría la estimación de sus gastos en educación?
d) ¿es verdad que la variabilidad de los ingresos mensuales de las
familias es mayor que la variabilidad de los gastos mensuales?

SOLUCION:

Calculando el coeficiente de correlación a partir del porcentaje

𝑟 2 = 90.25% r= 0.95

Interés (x) 𝑥̅ = 420 𝑆𝑥 = $10


Gasto (y) 𝑦̅ = 120 𝑆𝑦 = $7
Calculando el valor de 𝑆𝑥𝑦 :
𝑆𝑥𝑦 =r𝑆𝑥 𝑆𝑦
𝑆𝑥𝑦 = 9.5x10x7 = 665
Calculando el valor de b:
𝑆𝑦 7
b =r = 0,95x = 0.665
𝑆𝑥 10

QUISPE BOZA, Orlando 2015 -II


UNCP – FAIM

determinando la ecuación
y - 𝑦̅ = b (x − 𝑥̅ )
y - 120 = 0.665X – 0.665x420, despejando Y
y = 0.665X – 159.3
 a) el gasto estimado es Y=0.665(300) – 159.3 = 40.2
 b) su ingreso mensual debe ser: 320 = 0.665(X) – 159.3
X = 795,93
 C) la estimación de sus gasto se incrementaría en 33.25
 d) no, el coeficiente de variabilidad de gastos es mayor que el
coeficiente de variabilidad de incremento.

17. Se realizó un estudio estadístico para determinar un modelo de


regresión simple con el fin de predecir el monto de las ventas
semanales de un producto en función de la demanda. De una muestra
de montos de ventas (Y en cientos de soles) y demandas semanales X
(en unidades del producto) resultaron las siguientes estadísticas:
𝑥̅ = 50, 𝑦̅ = 300, 𝑆𝑥 = 4.487, 𝑆𝑦 = 175, 𝐶𝑜𝑣𝑥𝑦 = 765.6
a) Obtenga el modelo de regresión planteado.
b) ¿Qué tanto por ciento de la variabilidad de Y es explicada por la
regresión? ¿Qué opina usted sobre la bondad de ajuste del modelo a
los datos de la muestra?
c) Si el modelo obtenido es el adecuado, pronostique el monto de venta
para una semana que tenga una demanda de 60 unidades del
producto.
d) ¿Cuánto fue la demanda en una semana donde el monto de venta llego
a 1060. 536?
e) ¿Es la variabilidad de las ventas menor que la variabilidad de
demanda?

SOLUCION:
Datos: 𝑥̅ = 50, 𝑦̅ = 300, 𝑆𝑥 = 4.487, 𝑆𝑦 = 175, 𝐶𝑜𝑣𝑥𝑦 = 765.6

QUISPE BOZA, Orlando 2015 -II


UNCP – FAIM

a) determinando el modelo de regresión

𝑆𝑥𝑦 765.6
y - 𝑦̅ = (x − 𝑥̅ ) y - 300 = (x − 50)
𝑆𝑥 2 20.0524

20.0524y - 300x20.0524 = 765.6x – 765.6x50


Despejando el valor de Y:
 Y = - 1608.998 +38.1799X

b) Calculando el porcentaje de variabilidad


𝑆𝑥𝑦 765.6
r= = = 0.975
𝑆𝑥 𝑆𝑦 4.487𝑥175

 𝑟 2 = 0.95%

c) Determinando el monto estimado :

𝑌𝑒𝑠𝑡𝑖𝑚𝑎𝑑𝑜 = - 1608.998 +38.1799 (60)

𝑌𝑒𝑠𝑡𝑖𝑚𝑎𝑑𝑜 = 681.796 (monto estimado)

d) La demanda cuando el monto de venta en una semana fue de


1060.536 es:

1060.536 = - 1608.998 +38.1799 (X)

X = 60

e) No, la variabilidad de las ventas es mayor que la variabilidad de la


demanda
𝐶𝑜𝑣𝑦 = 0.583 ; 𝐶𝑜𝑣𝑥 = 0.089

𝐶𝑜𝑣𝑦 > 𝐶𝑜𝑣𝑥

18. Al estudiar la relación entre costos (X) y las utilidades (Y) en dólares
de ciertos productos usando una muestra se obtuvo la siguiente
información:

QUISPE BOZA, Orlando 2015 -II


UNCP – FAIM

𝑆𝑥 = 5, 𝑆𝑦 = 4, 𝑥̅ = 100, 𝑦̅ = 50, Y=-26 + 0.76X


a) ¿Qué porcentaje de la variabilidad de utilidades es explicada por la
ecuación de regresión dada?
b) ¿Es la variabilidad conjunta mayor que 20?
c) ¿Se confirma que la variabilidad de los costos es mayor que la
variabilidad de las utilidades?

SOLUCION:
A partir de la ecuación de la recta: Y=-26 + 0.76X
Se tiene que:

a= -0.26 y b= 0.76

𝑆𝑥𝑦 𝑆𝑥𝑦 𝑏𝑆𝑥 0.76𝑥5


 r= ;b= r= = = 0.95
𝑆𝑥 𝑆𝑦 𝑆𝑥 2 𝑆𝑦 4

 𝑟 2 = 0.9025

a) El porcentaje es: 0.9025x100% = 90.25%

b) Determinando el valor de 𝑆𝑥𝑦 :

𝑆𝑥𝑦 𝑆𝑥𝑦
y - 𝑦̅ = 2
(x − 𝑥̅ ) = (x − 𝑥̅ )
𝑆𝑥 25

25y - 25𝑦̅ = x𝑆𝑥𝑦 − 𝑥̅ 𝑆𝑥𝑦 ; despejando “y”

𝑋𝑆𝑥𝑦 𝑥̅ 𝑆𝑥𝑦
Y= + 𝑦̅ - = -26 + 0.76X
25 25

𝑆𝑥𝑦
 = 0.76 𝑆𝑥𝑦 = 19
25

Entonces no es cierto que la variabilidad conjunta sea mayor que 20

QUISPE BOZA, Orlando 2015 -II


UNCP – FAIM

19. Una compañía de alimentos maneja una cadena de tiendas al


menudeo. Para medir la eficiencia de las tiendas se estudió la relación del
número de empleados (X) y el promedio del volumen de ventas mensuales

(Y) en cientos de dólares para todas las tiendas durante el año pasado. La
grafica de los datos sugiere una relación lineal entre las variables. Se tiene
la siguiente información:

n= 100, ∑ 𝑥 = 600, ∑ 𝑦= 1600, ∑ 𝑥𝑦 = 13600, ∑ 𝑥 2 = 5200, ∑ 𝑦 2 = 37700


a) Obtenga el modelo de regresión lineal simple para predecir las
ventas a partir del número de empleados. ¿En cuánto se estiman las
ventas para una tienda de 8 empleados?
b) ¿Qué porcentaje de la varianza de las ventas es explicada por la
variabilidad del número de empleados?
c) ¿Cuántos empleados tiene la tienda cuya venta promedio se estima
en $1,100?

SOLUCION:

a) Determinando el modelo de regresión lineal


Calculando 𝑥̅ :
∑𝑥 600
𝑥̅ = = =6
𝑛 100

Calculando 𝑦̅:
∑𝑦 1600
𝑦̅= = = 16
𝑛 100

Hallando b:

𝑛 ∑ 𝑥𝑦− ∑ 𝑥 ∑ 𝑦 100𝑥13600−600𝑥1600
b= = =2.5
𝑛 ∑ 𝑥 2 − (∑ 𝑥)2 100𝑥5200− (600)2

Además: a = 𝑦̅ −b𝑥̅ =16 – 2.5x6 = 1

Para x =8, Y será:

QUISPE BOZA, Orlando 2015 -II


UNCP – FAIM

Y = 1 + 2.5x8 = 21 o $2100

b) Determinando el porcentaje:
 Hallando 𝑆𝑥𝑦 :

∑ 𝑥𝑦 13600
𝑆𝑥𝑦 = - 𝑌̅ . 𝑥̅ = - 6.16 = 40
𝑛 100

 Hallando 𝑆𝑥 :
∑ 𝑥2 5200
𝑆𝑥 2 = - 𝑥̅ 2 = - 36 = 16
𝑛 100

𝑆𝑥 = 4

 Hallando 𝑆𝑦 :

∑ 𝑦2 37700
𝑆𝑦 2 = - 𝑦̅ 2 = - 256 = 121
𝑛 100

𝑆𝑦 = 11

𝑆𝑥𝑦 40
r= = = 0.909 𝑟 2 = 0.826
𝑆𝑥 𝑆𝑦 4𝑥11

El porcentaje es: 0.862x10% = 86.2%

c) Determinando el número de empleados de una tienda cuya venta


promedio se estima en $1,100

En Y: 1 + 2.5 X = Y

1 + 2.5Y = 1100

X = 4 empleados

QUISPE BOZA, Orlando 2015 -II