Anda di halaman 1dari 25

REGRESIÓN

LINEAL
SIMPLE

Práctica No. I
Aplicar, desarrollar y analizar las técnicas de
regresión lineal simple para hacer predicciones
de sucesos futuros en el ramo empresarial.
MANUAL DE PRÁCTICAS PARA LA MATERIA ESTADÍSTICA II

Práctica No. I

REGRESIÓN LINEAL SIMPLE

Objetivo:
Aplicar, desarrollar y analizar las técnicas de regresión lineal simple para hacer
predicciones de sucesos futuros en el ramo empresarial.

Introducción:

La regresión es una técnica estadística que se utiliza para resolver problemas comunes
en el ramo empresarial, la cual consiste en un método matemático que modela la
relación lineal entre dos variables, una llamada variable dependiente, la cual suponemos
se ve afectada por los cambios producidos por una variable independiente, y un término
aleatorio (comúnmente llamado error).
A menudo, se intenta determinar la relación que existe entre un par de variables, por
ejemplo: ¿Existe una relación entre el promedio obtenido por un alumno a nivel
preparatoria y el promedio obtenido a nivel profesional? , ¿Las ventas se ven afectadas
por los gastos de publicidad? Etc.
En muchas situaciones, los valores de las variables no se determinan simultáneamente
en el tiempo; más bien, se ajusta una de las variables a un determinado valor, y éste por
su parte, afecta el valor de la segunda variable. Por ejemplo, el presupuesto dedicado a
mercadotecnia se suele decidir antes de que estén determinadas las cifras de ventas, y la
cantidad de catalizador empleado en un experimento se suele establecer antes de que se
pueda determinar el resultado del mismo. La variable cuyo valor se determina con
anterioridad recibe el nombre de variable de entrada, variable predictora o variable
independiente, mientras que a la otra se le conoce como variable de salida, variable
respuesta o dependiente.
Las observaciones las clasificamos en dos tipos de datos, x, y donde x es la variable
independiente y y la variable dependiente.

Instituto Tecnológico de Querétaro


Regresión Lineal Simple
M.C. G. Patricia Yscapa Morán
1
MANUAL DE PRÁCTICAS PARA LA MATERIA ESTADÍSTICA II

El tipo de relación más sencilla entre este par de variables es la relación que se establece
mediante una línea recta, o relación
y = β 0 + β1 x lineal, en la forma:

Sin embargo, este modelo supone que (una vez que los parámetros β 0 y β1 estén
determinados) es posible predecir exactamente la respuesta a cualquier valor de la
variable de entrada. En la práctica, tal precisión casi nunca es alcanzable, de modo que
lo máximo que se puede esperar es que la anterior ecuación sea válida sujeta a un error
aleatorio.
Consideremos un par de variables, una de las cuales será denominada variable de
entrada y la otra, variable de respuesta. Supongamos que para un valor dado, x, de la
variable de entrada, la variable de respuesta, Y, se puede expresar en la forma:
y = β 0 + β1 x + ei

Los elementos β 0 y β1 son parámetros. Se asume que la variable e, denominada error


aleatorio, es una variable aleatoria con media 0.
La relación entre la variable de respuesta, y, y la variable de entrada, x, especificadas
ambas en la anterior ecuación (nótese que es una ecuación de primer orden), se
denomina regresión lineal simple.
Los parámetros β 0 y β1 serán, por lo general, desconocidos y se deberán estimar a
partir de los datos muestrales.
De ahí que el modelo que encontremos quede definido como:
yˆ = βˆ0 + βˆ1 x

En donde β̂ 0 es la ordenada al origen y β̂1 es la pendiente de la recta o lo que hace


cambiar x a y.
En primer lugar para determinar si existe una relación lineal entre x e y , es necesario
graficar la pareja de datos en un plano cartesiano, relacionando la pareja (x,y).
El diagrama de dispersión es la representación mediante el eje cartesiano de estos datos.
En donde de forma visual podremos observar si hay alguna relación entre el par de
variables y de que tipo es.

Instituto Tecnológico de Querétaro


Regresión Lineal Simple
M.C. G. Patricia Yscapa Morán
2
MANUAL DE PRÁCTICAS PARA LA MATERIA ESTADÍSTICA II

Correlación fuerte positiva Correlación fuerte negativa Correlación débil positiva


( y aumenta claramente ( y disminuye claramente ( y aumenta algo cuando
cuando aumenta x) cuando aumenta x) aumenta x

Correlación débil positiva Correlación compleja ( y Correlación nula (no hay


( y disminuye algo cuando parece relacionarse con x relación entre x y y)
aumenta x) pero no de un modo lineal) Los puntos en el diagrama
no tienen un patrón u orden
aparente.

El Diagrama de Dispersión se puede utilizar para estudiar:

• Relaciones causa-efecto. Este es el caso más común en su utilización para la


mejora de la calidad. Se utiliza el diagrama a partir de la medición del efecto
observado y de su posible causa. Comprobar la relación entre el número de
errores y la hora en que se cometen.
• Relaciones entre dos efectos. Sirve para contrastar la teoría de que ambos
provienen de una causa común desconocida o difícil de medir. Analizar la
relación entre el número de quejas que llegan y el aumento o disminución de las
ventas, suponiendo que los dos dependen del nivel de satisfacción del cliente.

Instituto Tecnológico de Querétaro


Regresión Lineal Simple
M.C. G. Patricia Yscapa Morán
3
MANUAL DE PRÁCTICAS PARA LA MATERIA ESTADÍSTICA II

• Posibilidad de utilizar un efecto como sustituto de otro. Se puede utilizar para


controlar efectos difíciles o costosos de medir, a través de otros con medición
más simple. Estudiar la relación existente entre reducción de costos y
satisfacción del cliente para utilizar el parámetro de más fácil medición en la
evaluación de las actividades de planificación.

Una vez realizada la nube de dispersión se puede observar si el modelo corresponde


una ecuación de primer orden, es decir un modelo lineal. Los parámetros son los que
dan forma gráfica al modelo.
Hay tres posibles formas para la línea recta descrita por el modelo de regresión
lineal simple y son:

yˆ = βˆ0 + βˆ1 x yˆ = βˆ0 − βˆ1 x yˆ = βˆ0

β1 > 0 β1 < 0 β1 = 0

El valor de β1 representa la magnitud en que la variable x influye sobre el


comportamiento de la variable y.

Mientras mayor sea el valor absoluto de β1 , se tiene mayor influencia de x sobre y.

• Cuando β1 >0, implica que a medida que aumenta x, aumenta y de ahí que la
pendiente sea positiva.

• Cuando β1 <0, implica que a medida que aumenta x , disminuye y, de ahí que la
pendiente sea positiva

• Cuando β1 =0, implica que a medida que aumenta x , y permanece constante,


de ahí que el cambio de y por x sea nulo , es decir 0.

Instituto Tecnológico de Querétaro


Regresión Lineal Simple
M.C. G. Patricia Yscapa Morán
4
MANUAL DE PRÁCTICAS PARA LA MATERIA ESTADÍSTICA II

Ejemplo:
Se pidió a los alumnos de un curso de estadística II llenaran un formulario con los
siguientes datos.

Prom. Calificac Tiempo Calific.


Prom. Edad Estatura Número
del ión que Calific. Estadísti
Estatura Peso de promedi promedi de Cálculo
Género Edad Semestr Cálculo dedicas Probabil ca
(en cm) (en Kg) bachille o de tus o de tus herman integral
e diferenc a hacer idad Inferen.
rato papás papás os
Anterior ial ejercicio lI

Una vez obtenidos intuitivamente propusieron una relación entre la calificación


obtenida en la asignatura de Probabilidad (variable predictora x) y la obtenida en
Estadística I (variable respuesta y )

Se sugirió realizar un diagrama de dispersión para realizar el análisis gráfico (diagrama


de dispersión) que pudiera sugerir una relación entre ambas variables

Calificación Calificación Calificación Calificación


obtenida en obtenida en obtenida en obtenida en
Probabilidad Estadstica I Probabilidad Estadstica I
72 82 83 83
85 87 86 83
85 90 82 91
84 80 84 88
80 84 83 87
86 83 93 92
95 87 80 85
80 81 75 80
73 80 88 90
74 75 78 81
84 87 70 70
90 90 82 78
90 88 85 78
70 75 86 87
84 86 93 95
74 85 71 78
96 95 80 81
96 95 100 95
96 95 77 75
80 78 84 86

Instituto Tecnológico de Querétaro


Regresión Lineal Simple
M.C. G. Patricia Yscapa Morán
5
MANUAL DE PRÁCTICAS PARA LA MATERIA ESTADÍSTICA II

70 74 80 78
87 90 83 84
85 76 90 86
75 77 90 92

Uticemos MINITAB para construir el diagrama de dispersión


Gráfica de dispersión de Calif Estad y vs. Calif Prob x

95

90
Calif Estad y

85

80

75

70

70 75 80 85 90 95 100
Calif Prob x

Interpretando el diagrama podemos suponer que existe una relación entre la calificación
obtenida en la asignatura Probabilidad y la calificación de la asignatura Estadística I de
tal forma que a mayor precio calificación en la asignatura Probabilidad la calificación
de la asignatura Estadística I aumenta, es decir la relación es fuerte positiva, y el modelo
lineal es el apropiado para esta colección de datos.

Estimación de los parámetros de regresión

Si pretendemos estimar los valores de y i correspondientes a los valores de entrada xi

i = 1.....n para estimar los parámetros β 0 y β1 del modelo de regresión lineal simple

y = β 0 + β1 x + ei primero debemos determinar los estimadores de β 0 y β1 , utilizando

los valores muestrales entonces: si β̂ 0 y β̂1 fueran los estimadores respectivos de β 0 y

β1 , el estimador de la respuesta correspondiente a la entrada xi sería yˆ = βˆ0 + βˆ1 x .


A la diferencia entre la respuesta observada y su valor estimado lo conocemos como el
error que se deriva de usar los estimadores β̂ 0 y β̂1 para predecir la respuesta al valor

de entrada xi .

Instituto Tecnológico de Querétaro


Regresión Lineal Simple
M.C. G. Patricia Yscapa Morán
6
MANUAL DE PRÁCTICAS PARA LA MATERIA ESTADÍSTICA II

Donde:
ei ≡ yi − ( βˆ0 + βˆ1x ) = y − yˆ i i

Para elegir como estimadores de β 0 y β1 debemos encontrar a aquellos valores β̂ 0 y

β̂1 que satisfagan que estos errores sean pequeños.

Se elegirán aquellos valores de β̂ 0 y β̂1 que minimicen el valor de ∑e


n 2
i i , la suma de

los cuadrados de los errores.


Los estimadores de β 0 y β1 resultantes de este procedimiento reciben el nombre de
estimadores de mínimos cuadrados.

∑ ei = ∑ ( yi − βˆ0 + βˆ1 )
n n
2 2

i =1 i =1

Se puede demostrar que los estimadores de mínimos cuadrados de β 0 y β1 que se

denotarán por β̂ 0 y β̂1 , vienen dados por:

Fórmulas Conceptuales
n _ _

∧ ∑ xy − n x y
β1 = i =1
n _2

∑x −nx
2
i
i =1
∧ _ ∧ _
β 0 = y − β1 x

Donde
n n

_ ∑ xi _ ∑Y i
x= i =1
y y= i =1
n n
Sea:
n _ n
S xy = ∑ ( xi − x)( yi − y ) = ∑ xi yi −
∑ x∑ y
i= i =1 n
n

n _ 2 n
(∑ xi ) 2
S xx = ∑ ( xi − x) = ∑ xi2 − i =1

i= i =1 n
n

n n
( ∑ yi ) 2
S yy = ∑ ( yi − y ) 2 = ∑ yi2 − i =1

i =1 i =1 n

Instituto Tecnológico de Querétaro


Regresión Lineal Simple
M.C. G. Patricia Yscapa Morán
7
MANUAL DE PRÁCTICAS PARA LA MATERIA ESTADÍSTICA II

Fórmulas simplificadas

Por tanto
∧ S xY
β1 =
S xx
∧ _ ∧ _
β0 = y− β 1 x

La ecuación de regresión obtenida es:

Calific. Estadistica = 26.5 + 0.694 Calific. Probabilidad

Interpretación β̂ 0 Interpretación β̂1


De acuerdo a los datos obtenidos la Debido a que β̂1 b tiene un valor positivo,
ordenada al origen corta al eje Y en el la pendiente de la recta es positiva. Por
punto (0, 26.5). cada punto que aumenta la calificación de
probabilidad , la calificación de estadística
aumenta en 0.694

Significancia de la regresión

Para realizar la significancia del modelo recurrimos al Análisis de Varianza (ANOVA)


la cual parte la variabilidad total en dos componentes uno debido al modelo y otro
debido al error

Gráfica de dispersión de Calificación obt vs. Calificación obt

95
yi ŷ
Variabilidad
Calificación obtenida en Estads

Debida al
90 Variabilidad
Total Variabilidad
Debida al
85 modelo
͞y

80

75

70

70 75 80 85 90 95 100
Calificación
Instituto obtenida
Tecnológico en Probab
de Querétaro
Regresión Lineal Simple
M.C. G. Patricia Yscapa Morán
8
MANUAL DE PRÁCTICAS PARA LA MATERIA ESTADÍSTICA II

Variabilidad total = Variabilidad del modelo + Variabilidad del error


SSTotales = SS Modelo + SS Error

n n n

∑ ( yi − y ) = ∑ ( yi − y ) 2 + ∑ ( yi − yi ) 2
i =1
2

i =1 i =1

Resumiendo la información en la siguiente tabla:

H 0 ; β1 = 0

H1 ; β1 ≠ 0
ANOVA
Fórmulas conceptuales

Fuente df SS MS F
Regresión k n
SS Modelo MS Modelo
∑ ( y
i =1
i − y)2
k MS Error
Error n-k-1 n
SSerror
residual ∑(y
i =1
i − yi ) 2
n − k −1
Total n-1 n

∑(y
i =1
i − y)2

La primera columna contiene las fuentes de variación


Regresión, Error residual, Total

La segunda columna corresponde a los grados de libertad


Modelo k = número de variables predictoras
Error n-k-1 = número total de observaciones menos número de variables regresoras
menos 1
Total n-1 = número total de observaciones menos1

La tercera columna contiene las sumas de cuadrados de las desviaciones

Instituto Tecnológico de Querétaro


Regresión Lineal Simple
M.C. G. Patricia Yscapa Morán
9
MANUAL DE PRÁCTICAS PARA LA MATERIA ESTADÍSTICA II

La cuarta columna el componente de varianza para el modelo y el error.

La quinta columna el valor de F

El análisis de varianza anterior postula las siguientes hipótesis:

H 0 ; β1 = 0

H1 ; β1 ≠ 0

La hipótesis nula supone que ; β1 = 0 , como β1 es la razón de cambio esto sugiere que
no hay cambio alguno de la variable respuesta debido a la variable predictora.
La hipótesis nula será rechazada si la variabilidad del modelo es mayor a la variabilidad
del error, si esto ocurre, x (variable predictora) le es significativa a y (variable
respuesta) pues lo hace variar cuando ella varia.

ANOVA
Simplificada

Fuente df SS MS F

βˆS xy = βˆ ∑ xi yi − ∑
Regresión k n x∑ y SS Modelo MS Modelo
i =1 n k MS Error
Error n-k-1 SSTotales − SS Modelo SSerror
residual n − k −1
Total n-1 n

n
( ∑ yi ) 2
∑y
i =1
2
i − i =1
n

Para nuestro ejemplo

H 0 ; β1 = 0

H1 ; β1 ≠ 0

ANOVA
Fuente df SS MS F P
Regresión 1 1302.1 1302.1 95.63 0.000
Error 45 626.3 13.6
Instituto Tecnológico de Querétaro
Regresión Lineal Simple
M.C. G. Patricia Yscapa Morán
10
MANUAL DE PRÁCTICAS PARA LA MATERIA ESTADÍSTICA II

residual
Total 47 626.3

Finalmente concluyamos e interpretemos

Conclusión Interpretación
Como Existe evidencia suficiente para
P vs α decir que la calificación obtenida
0.000 0.02 en probabilidad si predice la
Como P > α se rechaza H 0 ; β1 = 0 calificación que se obtiene en
estadística.

Análisis de Correlación.

El análisis de correlación nos muestra a través del coeficiente de determinación r2 y el


coeficiente de correlación r que tan bien le queda el modelo propuesto a nuestros datos.
El coeficiente de determinación mide por un lado el porcentaje de la variabilidad

explicada por el modelo sabemos que: SSTotales = SS Modelo + SS Error entonces

SS Modelo
r2 =
SSTotales
En nuestro ejemplo sabemos que:

1928.479167 626.3363934 1302.090677

SS TOTALES SSERROR SSMODELO

SS Modelo 1302.1
De ahí que: r = = = 0.675
2

SSTotales 1928.47916
Conclusión Interpretación
r2=0.675 El 67.5% de la variabilidad total se ve explicada por el
r2=67.5% modelo

El coeficiente de correlación es simplemente la raíz cuadrada del coeficiente de


determinación
SS Modelo 1302.1
r= r2 = = = 0.675 = .822
SSTotales 1928.47916

Conclusión Interpretación

Instituto Tecnológico de Querétaro


Regresión Lineal Simple
M.C. G. Patricia Yscapa Morán
11
MANUAL DE PRÁCTICAS PARA LA MATERIA ESTADÍSTICA II

r = 0.822
El 82.2% de las variables (x,y) están relacionadas
r =82.2%

¿Pero cuál es el valor aceptable para r2?


Resulta arriesgado dar una respuesta única a esta pregunta, el contexto donde se utilice
el modelo y finalmente el criterio del analista decidirá cual valor es el apropiado. No es
lo mismo que el modelo se use en la industria farmacéutica o de aviación que en el
análisis de una empresa de comportamiento humano. En el primer caso quizá se
requieran valores de r2 por arriba del 99% y en el segundo caso un r2 del 70% sería
suficiente.
Finalmente el criterio del analista tiene la sensibilidad para conocer cuando un valor de
r2 es adecuado de acuerdo a la situación a la que se esté enfrentando.

Correlación con el programa:

Tema1 Regresión lineal simple y correlación.

1.1 Modelo de regresión simple.


1.3 Determinación de la ecuación de regresión.
1.8 Aplicaciones.

Material y equipo:

 Computadora
 Excel

Metodología:

Instituto Tecnológico de Querétaro


Regresión Lineal Simple
M.C. G. Patricia Yscapa Morán
12
MANUAL DE PRÁCTICAS PARA LA MATERIA ESTADÍSTICA II

Resolvamos el problema planteado utilizando Excel, encontrando la ecuación de


regresión con las fórmulas conceptuales y las fórmulas simplificadas y posteriormente,
la Adecuación del Modelo con las fórmulas conceptuales y las simplificadas.

1. Abre un libro Excel y llámalo Práctica Regresión Simple, captura la tabla del
ejemplo en una hoja que llames Regresión.

2. Prepara la hoja de cálculo insertando las siguientes columnas:


Calif Prob Calif Estad
xy x2
x y

3. Obtén el promedio de las variables x y y

Instituto Tecnológico de Querétaro


Regresión Lineal Simple
M.C. G. Patricia Yscapa Morán
13
MANUAL DE PRÁCTICAS PARA LA MATERIA ESTADÍSTICA II

Posiciónate al final de la(s) columnas que contienen la(s) variable(s) y escribe el signo
=, presiona fx selecciona la categoría Estadísticas y selecciona la función PROMEDIO

haz click en Aceptar aparece el sig. Cuadro de diálogo.

Selecciona desde la columna A2 hasta la A49 Aceptar, aparecerá el PROMEDIO de la


variable x; realiza lo mismo con la variable y

4. Utilizando las fórmulas conceptuales necesitamos obtener la suma de:

xy X2

Instituto Tecnológico de Querétaro


Regresión Lineal Simple
M.C. G. Patricia Yscapa Morán
14
MANUAL DE PRÁCTICAS PARA LA MATERIA ESTADÍSTICA II

Fórmulas Conceptuales
n _ _

∧ ∑ xy − n x y 338287 − 48(84.229)(83.208)
β1 = i =1
= = 0.694214
n _2 335036 − 48(83.208) 2
∑x −nx
2
i
i =1
∧ _ ∧ _
β 0 = y − β1 x = 84.229 − 0.694214(83.208) = 26.464778

5. Para obtener la recta ajustada con las fórmulas simplificadas

Instituto Tecnológico de Querétaro


Regresión Lineal Simple
M.C. G. Patricia Yscapa Morán
15
MANUAL DE PRÁCTICAS PARA LA MATERIA ESTADÍSTICA II

Fórmulas simplificadas

S xY 1875.70833
β1 = = = 0.694214
S xx 2701.91667
∧ _ ∧ _
β 0 = y − β 1 x = 84.22916 − 0.694214 * 83.20833 = 26.46

Quedando la Ecuación de regresión

yˆ i = 26.464 + .6942 x
Interpretación β̂ 0 Interpretación β̂1
De acuerdo a los datos obtenidos la Debido a que β̂1 b tiene un valor positivo,
ordenada al origen corta al eje Y en el la pendiente de la recta es positiva. Por
punto (0, 26.5). cada punto que aumenta la calificación de
probabilidad , la calificación de estadística
aumenta en 0.694

6. Inserta en la hoja de trabajo las siguientes columnas:

yˆ i = 26.464 + .6942 x ( y i − y i ) 2 ( yi − y ) 2

Instituto Tecnológico de Querétaro


Regresión Lineal Simple
M.C. G. Patricia Yscapa Morán
16
MANUAL DE PRÁCTICAS PARA LA MATERIA ESTADÍSTICA II

Calculemos el valor de las celdas de la siguiente forma:

Selecciona la celda y aparecerá un signo más deslízalo hacia abajo y apareceran los
valores ajustados para cada valor de x.

7. Para encontrar la celda . En la celda F2 escriba =(B2-$B$50)* (B2-$B$50),


el signo de pesos es para dejar fija la casilla B50 que es donde se encuentra y .

8. Realice la misma operación que en la celda E para encontrar todos los valores y al
final obtén la suma.

 2
9. Para encontrar la celda ( y i − y i ) En la celda G2 escriba =(B2-E2)*(B2-E2)

Instituto Tecnológico de Querétaro


Regresión Lineal Simple
M.C. G. Patricia Yscapa Morán
17
MANUAL DE PRÁCTICAS PARA LA MATERIA ESTADÍSTICA II

10. Realice la misma operación que en la celda E para encontrar todos los valores y al
final obtén la suma.

11. Para encontrar la celda En la celda H2 escriba = (E2-$B$50)*(E2-$B$50) el


signo de pesos es para dejar fija la casilla B50 que es donde se encuentra y .

12. Realice la misma operación que en la celda F para encontrar todos los valores y al
final obtén la suma.

13. Llena la tabla Anova con las Sumas encontradas

H 0 ; β1 = 0

H1 ; β1 ≠ 0

ANOVA
Fórmulas conceptuales

Fuente df SS MS F
Regresión 1 1302.090677 1302.090677 1302.090677 1302.0906
= 95.629
=
1 13.6160

Instituto Tecnológico de Querétaro


Regresión Lineal Simple
M.C. G. Patricia Yscapa Morán
18
MANUAL DE PRÁCTICAS PARA LA MATERIA ESTADÍSTICA II

Error 48--2= 46 626.3363934 626.3363


= 13.6160
residual 46
Total 48-1 =47 1928.47916
1928.479167 626.3363934 1302.090677

SS TOTALES SSERROR SSMODELO

Gráfica de distribución
F, df1=1, df2=46

0.7

0.6

0.5
Densidad

0.4

0.3

0.2

0.1
0.04
0.0
0 4.467
X

Conclusión Interpretación
Como Existe evidencia suficiente para decir que
F α=.04, 1, 46 vs F α= , 1, 46 la calificación obtenida en probabilidad si
4.467 < 95.629 predice la calificación que se obtiene en
Se rechaza H0 estadística.
14. Encontremos los valores de ANOVA con las Fórmulas Simplificadas.

H 0 ; β1 = 0

H1 ; β1 ≠ 0

ANOVA

Simplificada

Fuente df SS MS F

Regresión k n
βˆ1 S xy = βˆ1 ∑ x i y i −
∑ x∑ y SS Modelo MS Modelo
i =1 n k MS Error

Instituto Tecnológico de Querétaro


Regresión Lineal Simple
M.C. G. Patricia Yscapa Morán
19
MANUAL DE PRÁCTICAS PARA LA MATERIA ESTADÍSTICA II

Error n-k-1 SSTotales − SS Modelo SSerror


n − k −1
residual

Total n-1 n

n
(∑ y i ) 2
∑y
i =1
2
i − i =1

15. Para encontrar SS TOTALES, debemos incluir en nuestra hoja de trabajo la columna I

con los valores de

2
yi

En la celda I2 escriba=B2*B2

16. Realice la misma operación que en la celda E para encontrar todos los valores y al

final obtén la suma.

17. Obtén la SS TOTALES = I50-((B52*B52)/48)

Instituto Tecnológico de Querétaro


Regresión Lineal Simple
M.C. G. Patricia Yscapa Morán
20
MANUAL DE PRÁCTICAS PARA LA MATERIA ESTADÍSTICA II

18. Obtén la SS REGRESIÓN = =I57*E64 (observa en donde están posicionados tus valores

de β̂1 y S xy )

19. Finalmente llena la tabla ANOVA con los valores encontrados.

H 0 ; β1 = 0

H1 ; β1 ≠ 0

ANOVA

Simplificada

Instituto Tecnológico de Querétaro


Regresión Lineal Simple
M.C. G. Patricia Yscapa Morán
21
MANUAL DE PRÁCTICAS PARA LA MATERIA ESTADÍSTICA II

Fuente df SS MS F P

Regresión 1 1302.142955 1302.143 95.619 8.26E-13

Error 46 SSt − SS Re g =1928.479167-1302.142955 13.6160

residual =626.336212

Total 47 1928.479167

Gráfica de distribución
F, df1=1, df2=46
1.4

1.2

1.0
Densidad

0.8

0.6

0.4

0.2

8.2578E-13
0.0
0 f= 95.619

Conclusión Interpretación
Enfrentemos Existe evidencia suficiente para decir que
P vs α la calificación obtenida en probabilidad si
8.26E-13 <
0.05 predice la calificación que se obtiene en
Se rechaza H0 estadística.

20. Para encontrar el valor de r 2 posiciónate en la celda I65 =H50/F50 .

Instituto Tecnológico de Querétaro


Regresión Lineal Simple
M.C. G. Patricia Yscapa Morán
22
MANUAL DE PRÁCTICAS PARA LA MATERIA ESTADÍSTICA II

Conclusión Interpretación
r2=0.675 El 67.5% de la variabilidad total se ve explicada por el
r2=67.5% modelo

21. Para encontrar el valor de r posiciónate en la celda I69=IM.RAIZ2(I65)

Conclusión Interpretación
r = 0.822
El 82.2% de las variables (x,y) están relacionadas
r =82.2%

Reporte del alumno:

Busca en los reportes del INEGI un problema en donde tu creas se describa por medio
de un modelo de regresión lineal simple, llena la tabla con los datos

OBS. xi yi
1
2
3
4
5
.
.
.
n

 Define ¿cuál es la variable respuesta y la variable predictora?

 Realiza el diagrama de dispersión

 Encuentra la ecuación de regresión lineal simple que describa la relación entre x


y y.

Instituto Tecnológico de Querétaro


Regresión Lineal Simple
M.C. G. Patricia Yscapa Morán
23
MANUAL DE PRÁCTICAS PARA LA MATERIA ESTADÍSTICA II

A).- Con las fórmulas conceptuales (Excel).


B).- Con las fórmulas simplificadas (Excel).

 Construye la tabla ANOVA


A).- Con las fórmulas conceptuales
B).- Con las fórmulas simplificadas

 Plantea las hipótesis necesarias.

H0;

H1 ;

Fuente Grados Suma de Media de los F


libertad Cuadrados Cuadrados
Regresión
Error
Total

 Con los resultados de la tabla ANOVA.

Conclusión Interpretación

 Realiza la prueba utilizando el valor de P.

 Realiza la gráfica del estadístico F.

Bibliografía:

1. Levin I. Richard. Estadística para administradores. Editorial: Prentice-Hall.


2. Mendenhall. Estadística para administradores. Editorial: Grupo Editorial
Iberoamericana.
3. William Mendenhall, D. Wackerly, L. Scheaffer. Estadística matemática con
aplicaciones. Grupo Editorial Iberoamericana.
4. Walphole. Probabilidad y estadística. Editorial: McGrawHill.
5. Freund A. Simon John E. Estadística elemental. Editorial: Prentice-Hall
6. Sheldon M. Ross Introducción a la Estadística, Editorial Reverté

Instituto Tecnológico de Querétaro


Regresión Lineal Simple
M.C. G. Patricia Yscapa Morán
24

Anda mungkin juga menyukai