I Regresion Simple PDF

REGRESIÓN
LINEAL
SIMPLE
Práctica No. I
Aplicar, desarrollar y analizar las técnicas de
regresión lineal simple para hacer predicciones
de sucesos futuros en el ramo empresarial.
MANUAL DE PRÁCTICAS PARA LA MATERIA ESTADÍSTICA II
Práctica No. I
REGRESIÓN LINEAL SIMPLE
Objetivo:
Aplicar, desarrollar y analizar las técnicas de regresión lineal simple para hacer
predicciones de sucesos futuros en el ramo empresarial.
Introducción:
La regresión es una técnica estadística que se utiliza para resolver problemas comunes
en el ramo empresarial, la cual consiste en un método matemático que modela la
relación lineal entre dos variables, una llamada variable dependiente, la cual suponemos
se ve afectada por los cambios producidos por una variable independiente, y un término
aleatorio (comúnmente llamado error).
A menudo, se intenta determinar la relación que existe entre un par de variables, por
ejemplo: ¿Existe una relación entre el promedio obtenido por un alumno a nivel
preparatoria y el promedio obtenido a nivel profesional? , ¿Las ventas se ven afectadas
por los gastos de publicidad? Etc.
En muchas situaciones, los valores de las variables no se determinan simultáneamente
en el tiempo; más bien, se ajusta una de las variables a un determinado valor, y éste por
su parte, afecta el valor de la segunda variable. Por ejemplo, el presupuesto dedicado a
mercadotecnia se suele decidir antes de que estén determinadas las cifras de ventas, y la
cantidad de catalizador empleado en un experimento se suele establecer antes de que se
pueda determinar el resultado del mismo. La variable cuyo valor se determina con
anterioridad recibe el nombre de variable de entrada, variable predictora o variable
independiente, mientras que a la otra se le conoce como variable de salida, variable
respuesta o dependiente.
Las observaciones las clasificamos en dos tipos de datos, x, y donde x es la variable
independiente y y la variable dependiente.
Instituto Tecnológico de Querétaro

Regresión Lineal Simple
M.C. G. Patricia Yscapa Morán
1
El tipo de relación más sencilla entre este par de variables es la relación que se establece
mediante una línea recta, o relación
y = β 0 + β1 x lineal, en la forma:
Sin embargo, este modelo supone que (una vez que los parámetros β 0 y β1 estén
determinados) es posible predecir exactamente la respuesta a cualquier valor de la
variable de entrada. En la práctica, tal precisión casi nunca es alcanzable, de modo que
lo máximo que se puede esperar es que la anterior ecuación sea válida sujeta a un error
aleatorio.
Consideremos un par de variables, una de las cuales será denominada variable de
entrada y la otra, variable de respuesta. Supongamos que para un valor dado, x, de la
variable de entrada, la variable de respuesta, Y, se puede expresar en la forma:
y = β 0 + β1 x + ei
Los elementos β 0 y β1 son parámetros. Se asume que la variable e, denominada error

aleatorio, es una variable aleatoria con media 0.
La relación entre la variable de respuesta, y, y la variable de entrada, x, especificadas
ambas en la anterior ecuación (nótese que es una ecuación de primer orden), se
denomina regresión lineal simple.
Los parámetros β 0 y β1 serán, por lo general, desconocidos y se deberán estimar a
partir de los datos muestrales.
De ahí que el modelo que encontremos quede definido como:
yˆ = βˆ0 + βˆ1 x
En donde β̂ 0 es la ordenada al origen y β̂1 es la pendiente de la recta o lo que hace

cambiar x a y.
En primer lugar para determinar si existe una relación lineal entre x e y , es necesario
graficar la pareja de datos en un plano cartesiano, relacionando la pareja (x,y).
El diagrama de dispersión es la representación mediante el eje cartesiano de estos datos.
En donde de forma visual podremos observar si hay alguna relación entre el par de
variables y de que tipo es.

2
Correlación fuerte positiva Correlación fuerte negativa Correlación débil positiva

( y aumenta claramente ( y disminuye claramente ( y aumenta algo cuando
cuando aumenta x) cuando aumenta x) aumenta x
Correlación débil positiva Correlación compleja ( y Correlación nula (no hay

( y disminuye algo cuando parece relacionarse con x relación entre x y y)
aumenta x) pero no de un modo lineal) Los puntos en el diagrama
no tienen un patrón u orden
aparente.
El Diagrama de Dispersión se puede utilizar para estudiar:
• Relaciones causa-efecto. Este es el caso más común en su utilización para la

mejora de la calidad. Se utiliza el diagrama a partir de la medición del efecto
observado y de su posible causa. Comprobar la relación entre el número de
errores y la hora en que se cometen.
• Relaciones entre dos efectos. Sirve para contrastar la teoría de que ambos
provienen de una causa común desconocida o difícil de medir. Analizar la
relación entre el número de quejas que llegan y el aumento o disminución de las
ventas, suponiendo que los dos dependen del nivel de satisfacción del cliente.

3
• Posibilidad de utilizar un efecto como sustituto de otro. Se puede utilizar para

controlar efectos difíciles o costosos de medir, a través de otros con medición
más simple. Estudiar la relación existente entre reducción de costos y
satisfacción del cliente para utilizar el parámetro de más fácil medición en la
evaluación de las actividades de planificación.
Una vez realizada la nube de dispersión se puede observar si el modelo corresponde

una ecuación de primer orden, es decir un modelo lineal. Los parámetros son los que
dan forma gráfica al modelo.
Hay tres posibles formas para la línea recta descrita por el modelo de regresión
lineal simple y son:
yˆ = βˆ0 + βˆ1 x yˆ = βˆ0 − βˆ1 x yˆ = βˆ0
β1 > 0 β1 < 0 β1 = 0
El valor de β1 representa la magnitud en que la variable x influye sobre el

comportamiento de la variable y.
Mientras mayor sea el valor absoluto de β1 , se tiene mayor influencia de x sobre y.
• Cuando β1 >0, implica que a medida que aumenta x, aumenta y de ahí que la
pendiente sea positiva.
• Cuando β1 <0, implica que a medida que aumenta x , disminuye y, de ahí que la
pendiente sea positiva
• Cuando β1 =0, implica que a medida que aumenta x , y permanece constante,

de ahí que el cambio de y por x sea nulo , es decir 0.

4
Ejemplo:
Se pidió a los alumnos de un curso de estadística II llenaran un formulario con los
siguientes datos.
Prom. Calificac Tiempo Calific.

Prom. Edad Estatura Número
del ión que Calific. Estadísti
Estatura Peso de promedi promedi de Cálculo
Género Edad Semestr Cálculo dedicas Probabil ca
(en cm) (en Kg) bachille o de tus o de tus herman integral
e diferenc a hacer idad Inferen.
rato papás papás os
Anterior ial ejercicio lI
Una vez obtenidos intuitivamente propusieron una relación entre la calificación

obtenida en la asignatura de Probabilidad (variable predictora x) y la obtenida en
Estadística I (variable respuesta y )
Se sugirió realizar un diagrama de dispersión para realizar el análisis gráfico (diagrama

de dispersión) que pudiera sugerir una relación entre ambas variables
Calificación Calificación Calificación Calificación

obtenida en obtenida en obtenida en obtenida en
Probabilidad Estadstica I Probabilidad Estadstica I
72 82 83 83
85 87 86 83
85 90 82 91
84 80 84 88
80 84 83 87
86 83 93 92
95 87 80 85
80 81 75 80
73 80 88 90
74 75 78 81
84 87 70 70
90 90 82 78
90 88 85 78
70 75 86 87
84 86 93 95
74 85 71 78
96 95 80 81
96 95 100 95
96 95 77 75
80 78 84 86

5
70 74 80 78
87 90 83 84
85 76 90 86
75 77 90 92
Uticemos MINITAB para construir el diagrama de dispersión

Gráfica de dispersión de Calif Estad y vs. Calif Prob x
95
90
Calif Estad y
85
80
75
70
70 75 80 85 90 95 100
Calif Prob x
Interpretando el diagrama podemos suponer que existe una relación entre la calificación
obtenida en la asignatura Probabilidad y la calificación de la asignatura Estadística I de
tal forma que a mayor precio calificación en la asignatura Probabilidad la calificación
de la asignatura Estadística I aumenta, es decir la relación es fuerte positiva, y el modelo
lineal es el apropiado para esta colección de datos.
Estimación de los parámetros de regresión
Si pretendemos estimar los valores de y i correspondientes a los valores de entrada xi
i = 1.....n para estimar los parámetros β 0 y β1 del modelo de regresión lineal simple
y = β 0 + β1 x + ei primero debemos determinar los estimadores de β 0 y β1 , utilizando
los valores muestrales entonces: si β̂ 0 y β̂1 fueran los estimadores respectivos de β 0 y
β1 , el estimador de la respuesta correspondiente a la entrada xi sería yˆ = βˆ0 + βˆ1 x .

A la diferencia entre la respuesta observada y su valor estimado lo conocemos como el
error que se deriva de usar los estimadores β̂ 0 y β̂1 para predecir la respuesta al valor
de entrada xi .

6
Donde:
ei ≡ yi − ( βˆ0 + βˆ1x ) = y − yˆ i i
Para elegir como estimadores de β 0 y β1 debemos encontrar a aquellos valores β̂ 0 y
β̂1 que satisfagan que estos errores sean pequeños.
Se elegirán aquellos valores de β̂ 0 y β̂1 que minimicen el valor de ∑e

n 2
i i , la suma de
los cuadrados de los errores.

Los estimadores de β 0 y β1 resultantes de este procedimiento reciben el nombre de
estimadores de mínimos cuadrados.
∑ ei = ∑ ( yi − βˆ0 + βˆ1 )
n n
2 2
i =1 i =1
Se puede demostrar que los estimadores de mínimos cuadrados de β 0 y β1 que se
denotarán por β̂ 0 y β̂1 , vienen dados por:
Fórmulas Conceptuales
n _ _
∧ ∑ xy − n x y
β1 = i =1
n _2
∑x −nx
2
i
i =1
∧ _ ∧ _
β 0 = y − β1 x
Donde
n n
_ ∑ xi _ ∑Y i
x= i =1
y y= i =1
n n
Sea:
n _ n
S xy = ∑ ( xi − x)( yi − y ) = ∑ xi yi −
∑ x∑ y
i= i =1 n
n
n _ 2 n
(∑ xi ) 2
S xx = ∑ ( xi − x) = ∑ xi2 − i =1
i= i =1 n
n
n n
( ∑ yi ) 2
S yy = ∑ ( yi − y ) 2 = ∑ yi2 − i =1
i =1 i =1 n

7
Fórmulas simplificadas
Por tanto
∧ S xY
β1 =
S xx
∧ _ ∧ _
β0 = y− β 1 x
La ecuación de regresión obtenida es:
Calific. Estadistica = 26.5 + 0.694 Calific. Probabilidad
Interpretación β̂ 0 Interpretación β̂1

De acuerdo a los datos obtenidos la Debido a que β̂1 b tiene un valor positivo,
ordenada al origen corta al eje Y en el la pendiente de la recta es positiva. Por
punto (0, 26.5). cada punto que aumenta la calificación de
probabilidad , la calificación de estadística
aumenta en 0.694
Significancia de la regresión
Para realizar la significancia del modelo recurrimos al Análisis de Varianza (ANOVA)

la cual parte la variabilidad total en dos componentes uno debido al modelo y otro
debido al error
Gráfica de dispersión de Calificación obt vs. Calificación obt
95
yi ŷ
Variabilidad
Calificación obtenida en Estads
Debida al
90 Variabilidad
Total Variabilidad
Debida al
85 modelo
͞y
80
75
70
70 75 80 85 90 95 100
Calificación
Instituto obtenida
Tecnológico en Probab
de Querétaro
8
Variabilidad total = Variabilidad del modelo + Variabilidad del error

SSTotales = SS Modelo + SS Error
n n n
∑ ( yi − y ) = ∑ ( yi − y ) 2 + ∑ ( yi − yi ) 2
i =1
2
i =1 i =1
Resumiendo la información en la siguiente tabla:
H 0 ; β1 = 0
H1 ; β1 ≠ 0
ANOVA
Fórmulas conceptuales
Fuente df SS MS F
Regresión k n
SS Modelo MS Modelo
∑ ( y
i =1
i − y)2
k MS Error
Error n-k-1 n
SSerror
residual ∑(y
i =1
i − yi ) 2
n − k −1
Total n-1 n
∑(y
i =1
i − y)2
La primera columna contiene las fuentes de variación

Regresión, Error residual, Total
La segunda columna corresponde a los grados de libertad

Modelo k = número de variables predictoras
Error n-k-1 = número total de observaciones menos número de variables regresoras
menos 1
Total n-1 = número total de observaciones menos1
La tercera columna contiene las sumas de cuadrados de las desviaciones

9
La cuarta columna el componente de varianza para el modelo y el error.
La quinta columna el valor de F
El análisis de varianza anterior postula las siguientes hipótesis:
H 0 ; β1 = 0
H1 ; β1 ≠ 0
La hipótesis nula supone que ; β1 = 0 , como β1 es la razón de cambio esto sugiere que
no hay cambio alguno de la variable respuesta debido a la variable predictora.
La hipótesis nula será rechazada si la variabilidad del modelo es mayor a la variabilidad
del error, si esto ocurre, x (variable predictora) le es significativa a y (variable
respuesta) pues lo hace variar cuando ella varia.
ANOVA
Simplificada
Fuente df SS MS F
βˆS xy = βˆ ∑ xi yi − ∑
Regresión k n x∑ y SS Modelo MS Modelo
i =1 n k MS Error
Error n-k-1 SSTotales − SS Modelo SSerror
residual n − k −1
Total n-1 n
n
( ∑ yi ) 2
∑y
i =1
2
i − i =1
n
Para nuestro ejemplo
H 0 ; β1 = 0
H1 ; β1 ≠ 0
ANOVA
Fuente df SS MS F P
Regresión 1 1302.1 1302.1 95.63 0.000
Error 45 626.3 13.6
10
residual
Total 47 626.3
Finalmente concluyamos e interpretemos
Conclusión Interpretación
Como Existe evidencia suficiente para
P vs α decir que la calificación obtenida
0.000 0.02 en probabilidad si predice la
Como P > α se rechaza H 0 ; β1 = 0 calificación que se obtiene en
estadística.
Análisis de Correlación.
El análisis de correlación nos muestra a través del coeficiente de determinación r2 y el

coeficiente de correlación r que tan bien le queda el modelo propuesto a nuestros datos.
El coeficiente de determinación mide por un lado el porcentaje de la variabilidad
explicada por el modelo sabemos que: SSTotales = SS Modelo + SS Error entonces
SS Modelo
r2 =
SSTotales
En nuestro ejemplo sabemos que:
1928.479167 626.3363934 1302.090677
SS TOTALES SSERROR SSMODELO
SS Modelo 1302.1
De ahí que: r = = = 0.675
2
SSTotales 1928.47916
r2=0.675 El 67.5% de la variabilidad total se ve explicada por el
r2=67.5% modelo
El coeficiente de correlación es simplemente la raíz cuadrada del coeficiente de

determinación
SS Modelo 1302.1
r= r2 = = = 0.675 = .822
SSTotales 1928.47916

11
r = 0.822
El 82.2% de las variables (x,y) están relacionadas
r =82.2%
¿Pero cuál es el valor aceptable para r2?

Resulta arriesgado dar una respuesta única a esta pregunta, el contexto donde se utilice
el modelo y finalmente el criterio del analista decidirá cual valor es el apropiado. No es
lo mismo que el modelo se use en la industria farmacéutica o de aviación que en el
análisis de una empresa de comportamiento humano. En el primer caso quizá se
requieran valores de r2 por arriba del 99% y en el segundo caso un r2 del 70% sería
suficiente.
Finalmente el criterio del analista tiene la sensibilidad para conocer cuando un valor de
r2 es adecuado de acuerdo a la situación a la que se esté enfrentando.
Correlación con el programa:
Tema1 Regresión lineal simple y correlación.
1.1 Modelo de regresión simple.

1.3 Determinación de la ecuación de regresión.
1.8 Aplicaciones.
Material y equipo:
 Computadora
 Excel
Metodología:

12
Resolvamos el problema planteado utilizando Excel, encontrando la ecuación de

regresión con las fórmulas conceptuales y las fórmulas simplificadas y posteriormente,
la Adecuación del Modelo con las fórmulas conceptuales y las simplificadas.
1. Abre un libro Excel y llámalo Práctica Regresión Simple, captura la tabla del
ejemplo en una hoja que llames Regresión.
2. Prepara la hoja de cálculo insertando las siguientes columnas:

Calif Prob Calif Estad
xy x2
x y
3. Obtén el promedio de las variables x y y

13
Posiciónate al final de la(s) columnas que contienen la(s) variable(s) y escribe el signo
=, presiona fx selecciona la categoría Estadísticas y selecciona la función PROMEDIO
haz click en Aceptar aparece el sig. Cuadro de diálogo.
Selecciona desde la columna A2 hasta la A49 Aceptar, aparecerá el PROMEDIO de la

variable x; realiza lo mismo con la variable y
4. Utilizando las fórmulas conceptuales necesitamos obtener la suma de:
xy X2

14
Fórmulas Conceptuales
n _ _
∧ ∑ xy − n x y 338287 − 48(84.229)(83.208)
β1 = i =1
= = 0.694214
n _2 335036 − 48(83.208) 2
∑x −nx
2
i
i =1
∧ _ ∧ _
β 0 = y − β1 x = 84.229 − 0.694214(83.208) = 26.464778
5. Para obtener la recta ajustada con las fórmulas simplificadas

15
Fórmulas simplificadas
∧
S xY 1875.70833
β1 = = = 0.694214
S xx 2701.91667
∧ _ ∧ _
β 0 = y − β 1 x = 84.22916 − 0.694214 * 83.20833 = 26.46
Quedando la Ecuación de regresión
yˆ i = 26.464 + .6942 x
Interpretación β̂ 0 Interpretación β̂1
De acuerdo a los datos obtenidos la Debido a que β̂1 b tiene un valor positivo,
ordenada al origen corta al eje Y en el la pendiente de la recta es positiva. Por
punto (0, 26.5). cada punto que aumenta la calificación de
probabilidad , la calificación de estadística
aumenta en 0.694
6. Inserta en la hoja de trabajo las siguientes columnas:
yˆ i = 26.464 + .6942 x ( y i − y i ) 2 ( yi − y ) 2

16
Calculemos el valor de las celdas de la siguiente forma:
Selecciona la celda y aparecerá un signo más deslízalo hacia abajo y apareceran los
valores ajustados para cada valor de x.
7. Para encontrar la celda . En la celda F2 escriba =(B2-$B$50)* (B2-$B$50),

el signo de pesos es para dejar fija la casilla B50 que es donde se encuentra y .
8. Realice la misma operación que en la celda E para encontrar todos los valores y al
final obtén la suma.
 2
9. Para encontrar la celda ( y i − y i ) En la celda G2 escriba =(B2-E2)*(B2-E2)

17
11. Para encontrar la celda En la celda H2 escriba = (E2-$B$50)*(E2-$B$50) el

signo de pesos es para dejar fija la casilla B50 que es donde se encuentra y .
12. Realice la misma operación que en la celda F para encontrar todos los valores y al
13. Llena la tabla Anova con las Sumas encontradas
H 0 ; β1 = 0
H1 ; β1 ≠ 0
ANOVA
Fórmulas conceptuales
Fuente df SS MS F
Regresión 1 1302.090677 1302.090677 1302.090677 1302.0906
= 95.629
=
1 13.6160

18
Error 48--2= 46 626.3363934 626.3363

= 13.6160
residual 46
Total 48-1 =47 1928.47916
1928.479167 626.3363934 1302.090677
SS TOTALES SSERROR SSMODELO
Gráfica de distribución
F, df1=1, df2=46
0.7
0.6
0.5
Densidad
0.4
0.3
0.2
0.1
0.04
0.0
0 4.467
X
Como Existe evidencia suficiente para decir que
F α=.04, 1, 46 vs F α= , 1, 46 la calificación obtenida en probabilidad si
4.467 < 95.629 predice la calificación que se obtiene en
Se rechaza H0 estadística.
14. Encontremos los valores de ANOVA con las Fórmulas Simplificadas.
H 0 ; β1 = 0
H1 ; β1 ≠ 0
ANOVA
Simplificada
Fuente df SS MS F
Regresión k n
βˆ1 S xy = βˆ1 ∑ x i y i −
∑ x∑ y SS Modelo MS Modelo
i =1 n k MS Error

19
Error n-k-1 SSTotales − SS Modelo SSerror

n − k −1
residual
Total n-1 n
n
(∑ y i ) 2
∑y
i =1
2
i − i =1
15. Para encontrar SS TOTALES, debemos incluir en nuestra hoja de trabajo la columna I
con los valores de
2
yi
En la celda I2 escriba=B2*B2
17. Obtén la SS TOTALES = I50-((B52*B52)/48)

20
18. Obtén la SS REGRESIÓN = =I57*E64 (observa en donde están posicionados tus valores
de β̂1 y S xy )
19. Finalmente llena la tabla ANOVA con los valores encontrados.
H 0 ; β1 = 0
H1 ; β1 ≠ 0
ANOVA
Simplificada

21
Fuente df SS MS F P
Regresión 1 1302.142955 1302.143 95.619 8.26E-13
Error 46 SSt − SS Re g =1928.479167-1302.142955 13.6160
residual =626.336212
Total 47 1928.479167
Gráfica de distribución
F, df1=1, df2=46
1.4
1.2
1.0
Densidad
0.8
0.6
0.4
0.2
8.2578E-13
0.0
0 f= 95.619
Enfrentemos Existe evidencia suficiente para decir que
P vs α la calificación obtenida en probabilidad si
8.26E-13 <
0.05 predice la calificación que se obtiene en
Se rechaza H0 estadística.
20. Para encontrar el valor de r 2 posiciónate en la celda I65 =H50/F50 .

22
r2=0.675 El 67.5% de la variabilidad total se ve explicada por el
r2=67.5% modelo
21. Para encontrar el valor de r posiciónate en la celda I69=IM.RAIZ2(I65)
r = 0.822
El 82.2% de las variables (x,y) están relacionadas
r =82.2%
Reporte del alumno:
Busca en los reportes del INEGI un problema en donde tu creas se describa por medio
de un modelo de regresión lineal simple, llena la tabla con los datos
OBS. xi yi
1
2
3
4
5
.
.
.
n
 Define ¿cuál es la variable respuesta y la variable predictora?
 Realiza el diagrama de dispersión
 Encuentra la ecuación de regresión lineal simple que describa la relación entre x

y y.

23
A).- Con las fórmulas conceptuales (Excel).

B).- Con las fórmulas simplificadas (Excel).
 Construye la tabla ANOVA

A).- Con las fórmulas conceptuales
B).- Con las fórmulas simplificadas
 Plantea las hipótesis necesarias.
H0;
H1 ;
Fuente Grados Suma de Media de los F

libertad Cuadrados Cuadrados
Regresión
Error
Total
 Con los resultados de la tabla ANOVA.
 Realiza la prueba utilizando el valor de P.
 Realiza la gráfica del estadístico F.
Bibliografía:
1. Levin I. Richard. Estadística para administradores. Editorial: Prentice-Hall.

2. Mendenhall. Estadística para administradores. Editorial: Grupo Editorial
Iberoamericana.
3. William Mendenhall, D. Wackerly, L. Scheaffer. Estadística matemática con
aplicaciones. Grupo Editorial Iberoamericana.
4. Walphole. Probabilidad y estadística. Editorial: McGrawHill.
5. Freund A. Simon John E. Estadística elemental. Editorial: Prentice-Hall
6. Sheldon M. Ross Introducción a la Estadística, Editorial Reverté

24

I Regresion Simple PDF

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

I Regresion Simple PDF

Diunggah oleh

Hak Cipta:

Format Tersedia

REGRESIÓN

REGRESIÓN LINEAL SIMPLE

Instituto Tecnológico de Querétaro

Los elementos β 0 y β1 son parámetros. Se asume que la variable e, denominada error

En donde β̂ 0 es la ordenada al origen y β̂1 es la pendiente de la recta o lo que hace

Instituto Tecnológico de Querétaro

Correlación fuerte positiva Correlación fuerte negativa Correlación débil positiva

Correlación débil positiva Correlación compleja ( y Correlación nula (no hay

El Diagrama de Dispersión se puede utilizar para estudiar:

• Relaciones causa-efecto. Este es el caso más común en su utilización para la

Instituto Tecnológico de Querétaro

• Posibilidad de utilizar un efecto como sustituto de otro. Se puede utilizar para

Una vez realizada la nube de dispersión se puede observar si el modelo corresponde

yˆ = βˆ0 + βˆ1 x yˆ = βˆ0 − βˆ1 x yˆ = βˆ0

El valor de β1 representa la magnitud en que la variable x influye sobre el

Mientras mayor sea el valor absoluto de β1 , se tiene mayor influencia de x sobre y.

• Cuando β1 =0, implica que a medida que aumenta x , y permanece constante,

Instituto Tecnológico de Querétaro

Prom. Calificac Tiempo Calific.

Una vez obtenidos intuitivamente propusieron una relación entre la calificación

Se sugirió realizar un diagrama de dispersión para realizar el análisis gráfico (diagrama

Calificación Calificación Calificación Calificación

Instituto Tecnológico de Querétaro

Uticemos MINITAB para construir el diagrama de dispersión

Estimación de los parámetros de regresión

Si pretendemos estimar los valores de y i correspondientes a los valores de entrada xi

y = β 0 + β1 x + ei primero debemos determinar los estimadores de β 0 y β1 , utilizando

los valores muestrales entonces: si β̂ 0 y β̂1 fueran los estimadores respectivos de β 0 y

β1 , el estimador de la respuesta correspondiente a la entrada xi sería yˆ = βˆ0 + βˆ1 x .

Instituto Tecnológico de Querétaro

Para elegir como estimadores de β 0 y β1 debemos encontrar a aquellos valores β̂ 0 y

β̂1 que satisfagan que estos errores sean pequeños.

Se elegirán aquellos valores de β̂ 0 y β̂1 que minimicen el valor de ∑e

los cuadrados de los errores.

Se puede demostrar que los estimadores de mínimos cuadrados de β 0 y β1 que se

denotarán por β̂ 0 y β̂1 , vienen dados por:

Instituto Tecnológico de Querétaro

La ecuación de regresión obtenida es:

Calific. Estadistica = 26.5 + 0.694 Calific. Probabilidad

Interpretación β̂ 0 Interpretación β̂1

Para realizar la significancia del modelo recurrimos al Análisis de Varianza (ANOVA)

Gráfica de dispersión de Calificación obt vs. Calificación obt

Variabilidad total = Variabilidad del modelo + Variabilidad del error

Resumiendo la información en la siguiente tabla:

La primera columna contiene las fuentes de variación

La segunda columna corresponde a los grados de libertad

La tercera columna contiene las sumas de cuadrados de las desviaciones

Instituto Tecnológico de Querétaro

La cuarta columna el componente de varianza para el modelo y el error.

La quinta columna el valor de F

El análisis de varianza anterior postula las siguientes hipótesis:

Para nuestro ejemplo

Finalmente concluyamos e interpretemos

El análisis de correlación nos muestra a través del coeficiente de determinación r2 y el

explicada por el modelo sabemos que: SSTotales = SS Modelo + SS Error entonces

1928.479167 626.3363934 1302.090677

SS TOTALES SSERROR SSMODELO

El coeficiente de correlación es simplemente la raíz cuadrada del coeficiente de

Instituto Tecnológico de Querétaro

¿Pero cuál es el valor aceptable para r2?

Correlación con el programa:

Tema1 Regresión lineal simple y correlación.

1.1 Modelo de regresión simple.