Ejemplo 1
Para ilustrar el método de mínimos cuadrados, supóngase que se recolectan datos de una muestra de
10 restaurantes Armand’s Pizza Parlors ubicados todos cerca de campus. universitarios.
Poblacion
de
estudiantes
(miles) Ventas
trimestrales
Restaurante i xi (miles de $) yi
1 2 58
2 6 105
3 8 88
4 8 118
5 12 117
6 16 137
7 20 157
8 20 169
9 22 149
10 26 202
Solución
DIAGRAMA DE DISPERSIÓN
250
Ventas trimestrales (miles $)
200
150
100
50
0
0 5 10 15 20 25 30
Poblacion de estudiantes en (miles)
Usamos la ecuación de regresión simple estimada la cual es:
� ̂_(𝑖=𝑏_(0+) 𝑏_1 �_� )
donde:
ŷi = Valor estimado de las ventas trimestrales (en miles de dólares) del restaurante i
b0 = Intersección de la recta de regresión con el eje y
b1 = pendiente de la recta de regresión
xi = Tamaño de la población de estudiantes (en miles) del restaurante i
𝑏_1=(∑▒ 〖〖 (� 〗 _�−� )
(�_�−� ) 〗 )/(∑▒ 〖 (𝑥_𝑖−𝑥 ̅) 〗
^2 )
𝑏_0=� ̅−𝑏_1 𝑥 ̅
donde
xi = Valor de la variable independiente en la observación i
yi = Valor de la variable dependiente en la observacion i
𝑥 ̅ = Media de la variable independiente
� ̅ = Media de la variable dependiente
n = Número total de observaciones
Restaurante (𝑥_𝑖−𝑥 ̅
i xi yi 𝑥_𝑖−𝑥 ̅ �_𝑖−� ̅ (𝑥_𝑖−𝑥 ̅ )(�_𝑖−� ̅ ) )^2
1 2 58 -12 -72 864 144
2 6 105 -8 -25 200 64
3 8 88 -6 -42 252 36
4 8 118 -6 -12 72 36
5 12 117 -2 -13 26 4
6 16 137 2 7 14 4
7 20 157 6 27 162 36
8 20 169 6 39 234 36
9 22 149 8 19 152 64
10 26 202 12 72 864 144
10 140 1300 2840 568
n ∑xi ∑yi (𝑥_𝑖−𝑥 ̅
(𝑥_𝑖−𝑥 ̅ )(�_𝑖−� ̅
∑ ) ∑ )^2
𝑥 ̅ = 14
� ̅=∑▒�ⅈ/�
� ̅ = 130
𝑏_1=(∑▒ 〖〖 (� 〗 _�−� )
(�_�−� ) 〗 )/(∑▒ 〖 (𝑥_𝑖−𝑥 ̅) 〗
^2 )
b1= 5
bo= 60
𝑏_0=� ̅−𝑏_1 𝑥 ̅
� ̂_(𝑖=𝑏_(0+) 𝑏_1 �_� )
Verificación mediante la hoja de Excel � ̂_𝑖=60+5𝑥
DIAGRAMA DE DISPERSIÓN
250
Ventas trimestrales (miles $)
200
f(x) = 5x + 60
150 R² = 0.90273363
100
50
0
0 5 10 15 20 25 30
Poblacion de estudiantes en (miles)
Ventas trimestral
100
50
0
0 5 10 15 20 25 30
Poblacion de estudiantes en (miles)
Calculamos la suma de cuadrados debida al error (SCE) en el ejemplo de Armand´s Pizza Parlors
mediante el siguiente cuadro.
Poblacion de Ventas
estudiantes trimestrales Ventas
pronosticadas ŷi Error Error al cuadrado
Restaurante (miles) (miles de $) = 60 +5xi yi - ŷi (yi - ŷi)^2
i yi
xi
1 2 58 70 -12 144
2 6 105 90 15 225
3 8 88 100 -12 144
4 8 118 100 18 324
5 12 117 120 -3 9
6 16 137 140 -3 9
7 20 157 160 -3 9
8 20 169 160 9 81
9 22 149 170 -21 441
10 26 202 190 12 144
𝑆��=∑▒ 〖 (�𝑖−� ̂_𝑖) 〗 ^2 SCE= 1530
Calculamos la suma total de cuadrados (STC) en el ejemplo de Armand´s Pizza Parlors mediante el
siguiente cuadro.
Poblacion de Ventas
estudiantes trimestrales Desviación al
Restaurante (miles) (miles de $) Desviación cuadrado
i �_𝑖−� ̅ (�𝑖−� )^2
yi
xi
1 2 58 -72 5184
2 6 105 -25 625
3 8 88 -42 1764
4 8 118 -12 144
5 12 117 -13 169
6 16 137 7 49
7 20 157 27 729
8 20 169 39 1521
𝑆𝑇�=∑▒ 〖 (�𝑖−� ̅) 〗 ^2
9 22 149 19 361
10 26 202 72 5184
STC= 15730
SCR= 14200
�^2=14200
/15730
�^
2
0.90273363
= 90.27%
�^
2
En el ejemplo de Armand´s Pizza se concluye que el 90.27% de la variabilidad en las ventas se explica
por la relavión lineal que existe entre el tamaño de la población de estudiantes y las ventas.
�_𝑥�=(𝑠𝑖𝑔�𝑜 𝑑𝑒 𝑏_1 )∗√(�𝑜𝑒𝑓𝑖𝑐𝑖𝑒�𝑡𝑒 𝑑𝑒 𝑑𝑒𝑡𝑒�𝑚𝑖�𝑎𝑐𝑖ó�)
�_𝑥�=(𝑠𝑖𝑔�𝑜 𝑑𝑒 𝑏_1 )∗√(�^2 )
rxy= 0.9501229552
Este valor correspondiente a rxy indica que hay una fuerte relación lineal entre x y y.
AUTOEXAMEN
MÉTODO
Xi Yi
1 3
2 7
3 5
4 11
5 14
Diagrama de dispersión
16
14
12
10
8
yi
6
4
2
0
0.5 1 1.5 2 2.5 3 3.5 4 4.5 5 5.5
xi
b) ¿Qué indica el diagrama de dispersión del inciso a) respecto a la relación entre las dos variables?
Viendo el diagrama de dispersion se puede apreciar que existe una relación lineal positiva entre x y y, esto refiere a
que si se trazara una linea esta tendría una pendiente positiva.
c)Trate de aproximar la relación entre x y y trazando una línea recta que pase a través de los puntos dados.
6
4
2
0
0.5 1 1.5 2 2.5 3 3.5 4 4.5 5 5.5
xi
d) Con las ecuaciones (14.6) y (14.7) calcule b0 y b1 para obtener la ecuación de regresión estimada.
d) Con las ecuaciones (14.6) y (14.7) calcule b0 y b1 para obtener la ecuación de regresión estimada.
𝑥 ̅=∑▒𝑥ⅈ/�
𝑥 ̅ = 3
� ̅=∑▒�ⅈ/�
� ̅ = 8
𝑏_1=(∑▒ 〖〖 (𝑥 〗 _𝑖−𝑥 ̅)
(�_𝑖−� ̅) 〗 )/(∑▒ 〖 (𝑥_𝑖−𝑥 ̅) 〗
^2 )
b1= 2.6
𝑏_0=� ̅−𝑏_1 𝑥 ̅
bo= 0.2
� ̂_(𝑖=𝑏_(0+) 𝑏_1 𝑥_𝑖 )
� ̂_𝑖=0.2+2.6𝑥
Verificación mediante la hoja de Excel
6
4
2
0
0.5 1 1.5 2 2.5 3 3.5 4 4.5 5 5.5
xi
4
2
0
0.5 1 1.5 2 2.5 3 3.5 4 4.5 5 5.5
xi
e) Use la ecuación de regresión estimada para predecir el valor de y cuando x = 4.
� ̂_𝑖=0.2+2.6𝑥
� ̂_𝑖=0.2+2.6(4)
ŷi= 10.6
xi yi
3 55
12 40
6 55
20 10
14 15
Diagrama de dispersión
60
50
40
30
yi
20
10
0
2 4 6 8 10 12 14 16 18 20 22
xi
b) ¿Qué indica el diagrama de dispersión del inciso a) respecto a la relación entre las dos variables?
Viendo el diagrama de dispersion se puede apreciar que existe una relación lineal negativa entre x y y, esto refiere a
que si se trazara una linea esta tendría una pendiente negativa.
c)Trate de aproximar la relación entre x y y trazando una línea recta que pase a través de los puntos dados.
50
40
30
yi
20
10
0
2 4 6 8 10 12 14 16 18 20 22
xi
d) Con las ecuaciones (14.6) y (14.7) calcule b0 y b1 para obtener la ecuación de regresión estimada.
𝑥 ̅=∑▒𝑥ⅈ/�
𝑥 ̅ = 11
� ̅=∑▒�ⅈ/�
� ̅ = 35
𝑏_1=(∑▒ 〖〖 (𝑥 〗 _𝑖−𝑥 ̅)
(�_𝑖−� ̅) 〗 )/(∑▒ 〖 (𝑥_𝑖−𝑥 ̅) 〗
^2 )
b1= -3
𝑏_0=� ̅−𝑏_1 𝑥 ̅
bo= 68
� ̂_(𝑖=𝑏_(0+) 𝑏_1 𝑥_𝑖 )
� ̂_𝑖=68−3𝑥
40
30
20
10
0
2 4 6 8 10 12 14 16 18 20 22
� ̂_𝑖=68−3𝑥
� ̂_𝑖=68−3(4)
ŷi= 56
Ejercicio 3 Dadas las observaciones siguientes sobre estas dos variables obtenidas en un estudio de
regresión.
Xi Yi
2 7
6 18
9 9
13 26
20 23
Diagrama de dispersión
30
25
20
15
yi
10
0
0 5 10 15 20 25
xi
b) ¿Qué indica el diagrama de dispersión del inciso a) respecto a la relación entre las dos variables?
Viendo el diagrama de dispersion se puede apreciar que existe una relación lineal positiva entre x y y, esto refiere a
que si se trazara una linea esta tendría una pendiente positiva.(no tan pronunciada es decir tiende a ser plana)
c)Trate de aproximar la relación entre x y y trazando una línea recta que pase a través de los puntos dados.
25
20
15
yi
10
5
25
20
15
yi
10
0
0 5 10 15 20 25
xi
d) Con las ecuaciones (14.6) y (14.7) calcule b0 y b1 para obtener la ecuación de regresión estimada.
𝑥 ̅=∑▒𝑥ⅈ/�
𝑥 ̅ = 10
� ̅=∑▒�ⅈ/�
� ̅ = 16.6
𝑏_1=(∑▒ 〖〖 (𝑥 〗 _𝑖−𝑥 ̅)
(�_𝑖−� ̅) 〗 )/(∑▒ 〖 (𝑥_𝑖−𝑥 ̅) 〗
^2 )
b1= 0.9
𝑏_0=� ̅−𝑏_1 𝑥 ̅
bo= 7.6
� ̂_(𝑖=𝑏_(0+) 𝑏_1 𝑥_𝑖 )
� ̂_𝑖=7.6+0.9𝑥
Verificación mediante la hoja de Excel
25
f(x) = 0.9x + 7.6
R² = 0.5472972973
20
15
yi
10
GRÁFICA DE LA ECUACIÓN DE REGRESIÓN ESTIMADA
30
25
f(x) = 0.9x + 7.6
R² = 0.5472972973
20
15
yi
10
0
0 5 10 15 20 25
xi
� ̂_𝑖=7.6+0.9𝑥
� ̂_𝑖=7.6+0.9(4)
ŷi= 11.2
AUTOEXAMEN
MÉTODO
Xi Yi
1 3
2 7
La ecuación de regresión estimada para
estos datos es ŷi= 0.20 + 2.60x 3 5
4 11
5 14
a)Empleando las ecuaciones (14.8), (14.9) y (14.10) calcule SCE, STC y SCR.
Error al
Elemento Ecuación Error cuadrado
xi yi estimada ŷi
i = 0.20 +2.60xi
yi - ŷi (yi -
ŷi)^2
� ̅=∑▒�ⅈ/�
= 8
Desviación Desviación al
Elemento cuadrado
xi yi
i �_𝑖−� ̅
(�𝑖−� ̅)^2
1 1 3 -5 25
2 2 7 -1 1
3 3 5 -3 9
3 4 11 3 9
5 5 14 6 36
𝑆𝑇�=∑▒ 〖 (�𝑖−� ̅) 〗 ^2
STC= 80
𝑆𝑇�=𝑆�𝑅+𝑆��
Despejando SCR
𝑆�𝑅=𝑆𝑇�−𝑆��
𝑆�𝑅=80−12.4
SCR= 67.6
b) Calcule el coeficiente de determinación r2. Haga un comentario sobre la bondad del ajuste.
�^2=𝑆�𝑅/𝑆
𝑇�
�^2=67.8/8
0
�^ 0.845
2
Si expresamos el coeficiente de determinación en forma de porcentaje:
�^ = 84.50%
2
Para este ejercicio se concluye que el 84.50% de la variabilidad en y ha sido explicada por la
recta de minimos cuadrados ya calculada. Tambien podemos concluir que la bondad de ajuste
es buena.
�_𝑥�=(𝑠𝑖𝑔�𝑜 𝑑𝑒 𝑏_1 )∗√(�𝑜𝑒𝑓𝑖𝑐𝑖𝑒�𝑡𝑒 𝑑𝑒 𝑑𝑒𝑡𝑒�𝑚𝑖�𝑎𝑐𝑖ó�)
�_𝑥�=(𝑠𝑖𝑔�𝑜 𝑑𝑒 𝑏_1 )∗√(�^2 )
rxy= 0.9192388155
Este valor correspondiente a rxy indica que hay una fuerte relación lineal entre x y
y.
Ejercicio 2 Los datos a continuación son los datos del ejercicio 2.
xi yi
3 55
12 40
La ecuación de regresión estimada para
estos datos es ŷi= 68 - 3x 6 55
20 10
14 15
a)Empleando las ecuaciones (14.8), (14.9) y (14.10) calcule SCE, STC y SCR.
Error al
Elemento Ecuación Error cuadrado
xi yi estimada ŷi
i = 68 - 3xi
yi - ŷi (yi -
ŷi)^2
1 3 55 59 -4 16
2 12 40 32 8 64
3 6 55 50 5 25
4 20 10 8 2 4
5 14 15 26 -11 121
𝑆��=∑▒ 〖 (�𝑖−� ̂_𝑖) 〗 SCE=
^2 230
� ̅=∑▒�ⅈ/� = 35
Desviación Desviación al
Elemento cuadrado
xi yi
i �_𝑖−� ̅
(�𝑖−� ̅)^2
1 3 55 20 400
2 12 40 5 25
3 6 55 20 400
4 20 10 -25 625
5 14 15 -20 400
𝑆𝑇�=∑▒ 〖 (�𝑖−� ̅) 〗 ^2
STC= 1850
𝑆𝑇�=𝑆�𝑅+𝑆��
𝑆�𝑅=1850−230
SCR= 1620
b) Calcule el coeficiente de determinación r2. Haga un comentario sobre la bondad del ajuste.
�^2=𝑆�𝑅/𝑆
𝑇�
�^2=1620/
1850
�^ 0.8756756757
2
Si expresamos el coeficiente de determinación en forma de porcentaje:
�^ = 87.57%
2
Para este ejercicio se concluye que el 87.57% de la variabilidad en y ha sido explicada por la
recta de minimos cuadrados ya calculada. También podemos concluir que la bondad de ajuste
es buena.
�_𝑥�=(𝑠𝑖𝑔�𝑜 𝑑𝑒 𝑏_1 )∗√(�𝑜𝑒𝑓𝑖𝑐𝑖𝑒�𝑡𝑒 𝑑𝑒 𝑑𝑒𝑡𝑒�𝑚𝑖�𝑎𝑐𝑖ó�)
�_𝑥�=(𝑠𝑖𝑔�𝑜 𝑑𝑒 𝑏_1 )∗√(�^2 )
rxy= -0.935775441
Este valor correspondiente a rxy indica que hay una fuerte relación lineal entre x y
y.
Ejercicio 3 Los datos a continuación son los datos del ejercicio 3.
Xi Yi
2 7
La ecuación de regresión estimada para 6 18
estos datos es ŷi= 7.6 + 0.9x 9 9
13 26
20 23
Error al
Elemento Ecuación Error cuadrado
xi yi estimada ŷi
i = 7.6 + 0.9xi
yi - ŷi (yi -
ŷi)^2
� ̅=∑▒�ⅈ/� = 16.6
Desviación Desviación al
Elemento cuadrado
xi yi
i �_𝑖−� ̅
(�𝑖−� ̅)^2
1 2 7 -9.6 92.16
2 6 18 1.4 1.96
3 9 9 -7.6 57.76
4 13 26 9.4 88.36
5 20 23 6.4 40.96
𝑆𝑇�=∑▒ 〖 (�𝑖−� ̅) 〗 ^2
STC= 281.2
Despejando SCR
𝑆�𝑅=𝑆𝑇�−𝑆��
𝑆�𝑅=281.2−127.3
SCR= 153.9
�^2=𝑆�𝑅/𝑆
𝑇�
�^2=153.9/
281.2
�^ 0.5472972973
2
Si expresamos el coeficiente de determinación en forma de porcentaje:
�^ = 54.73%
2
Para este ejercicio se concluye que el 54.73% de la variabilidad en y ha sido explicada por la
recta de minimos cuadrados ya calculada. También podemos concluir que la bondad de ajuste
es regular.
�_𝑥�=(𝑠𝑖𝑔�𝑜 𝑑𝑒 𝑏_1 )∗√(�𝑜𝑒𝑓𝑖𝑐𝑖𝑒�𝑡𝑒 𝑑𝑒 𝑑𝑒𝑡𝑒�𝑚𝑖�𝑎𝑐𝑖ó�)
�_𝑥�=(𝑠𝑖𝑔�𝑜 𝑑𝑒 𝑏_1 )∗√(�^2 )
rxy= 0.7397954429
Este valor correspondiente a rxy indica que hay una moderada relación lineal entre
x y y.