Anda di halaman 1dari 29

Universidad Nacional Autnoma de Mxico

Facultad de Estudios Superiores Cuautitln

PRESENTACIN

Regresin y Correlacin lineal simple es el noveno fascculo, de una serie de


guas de estudio en las que se desarrollan los temas de los programas de las
asignaturas del rea de Probabilidad y Estadstica, as como temas selectos
que complementan el aprendizaje de de esta disciplina. Tienen la
caracterstica de que el estudiante adquiera slo aquella que trate el tema
que necesite reforzar o el que sea de su propio inters.

Estas guas de estudio pretenden reorientar y actualizar el enfoque con el que


se debe abordar el estudio de los mtodos estadsticos, despertando la
inquietud por aprender y resolver los problemas y casos planteados.

Cada gua integra el desarrollo del tema con ejercicios, casos de estudio y con
la seccin llamada Aprendiendo.com. En esta ltima seccin se le proporciona
al estudiante un ambiente interactivo, utilizando los recursos disponibles en
Internet, de tal forma que los casos planteados los desarrolle en ambientes
de aprendizaje que le permitan encontrarse con el conocimiento,
manipularlo, hacerlo suyo. Con esta filosofa se utilizan applets, sitios de
internet con acceso a bases de datos reales, software de uso libre y en
general los recursos de la Web 2.0, que se refieren a una segunda generacin
en la historia de la Web basada en comunidades de usuarios, que fomentan la
colaboracin y el intercambio gil de informacin entre los mismos.

Nuestro reconocimiento a la Direccin General de Asuntos del Personal


Acadmico de nuestra Casa de Estudios, que a travs del Programa de Apoyo
a Proyectos para la Innovacin y Mejoramiento de la Enseanza (PAPIME) ha
apoyado nuestro proyecto Implantacin de un Laboratorio Virtual de
Estadstica y Elaboracin de las Guas de Estudio con Soporte Multimedia
clave PE302709.

Los Autores

Regresin y Correlacin Lineal Simple


http://www.cuautitlan.unam.mx
Universidad Nacional Autnoma de Mxico
Facultad de Estudios Superiores Cuautitln

REGRESIN Y CORRELACIN LINEAL SIMPLE

Es comn que las personas tomen decisiones personales y profesionales


basadas en predicciones de sucesos futuros. Para hacer estos pronsticos, se
basan en la relacin intuitiva y calculada entre lo que ya se sabe y lo que se
debe estimar. Si los responsables de la toma de decisiones pueden
determinar cmo lo conocido se relaciona con un evento futuro, pueden
ayudar considerablemente al proceso de toma de decisiones.

Cualquier mtodo estadstico que busque establecer una ecuacin que


permita estimar el valor desconocido de una variable a partir del valor
conocido de una o ms variables, se denomina anlisis de regresin.

Los anlisis de regresin y correlacin mostrarn como determinar la


naturaleza y la fuerza de una relacin entre dos variables.

El trmino regresin fue utilizado por primera vez por el genetista y


estadstico ingls Francis Galton (1822-1911) en 1877 Galton efecto un
estudio que demostr que la altura d los hijos de padres altos tenda a
retroceder, o regresar, hacia la talla media de la poblacin. Regresin fue
el nombre que le dio al proceso general de predecir una variable,(la talla de
los nios) a partir de otra (la talla de los padres).

Hoy en da, esta tendencia de miembros de cualquier poblacin que estn


en una posicin extrema (arriba o debajo de la media poblacional) en un
momento, y luego en una posicin menos extrema en otro momento, (ya sea
por s o por medio de sus descendientes), se llama efecto de regresin.

El anlisis de regresin se desarrolla una ecuacin de estimacin, es decir,


una formula matemtica que relaciona las variables conocidas con las
desconocidas. Luego de obtener el patrn de dicha relacin, se aplica el
anlisis de correlacin para determinar el grado de relacin que hay entre las
variables.

Regresin y Correlacin Lineal Simple


http://www.cuautitlan.unam.mx
Universidad Nacional Autnoma de Mxico
Facultad de Estudios Superiores Cuautitln

REGRESIN LINEAL SIMPLE

Una tcnica estadstica que establece una ecuacin para estimar el


valor desconocido de una variable, a partir del valor conocido de otra
variable, (en vez de valores de muchas otras variables) se denomina anlisis
de regresin simple.

Por lo tanto el anlisis de regresin lineal simple, es el proceso general de


predecir una variable (Y) a partir de otra (X).

Las relaciones entre las variables pueden ser directas o tambin inversas.

Relacin directa: la pendiente de esta lnea es positiva, por que la variable


Y crece a medida que la variable X tambin lo hace.

Relacin inversa: La pendiente de esta lnea es negativa, por que a medida


que aumenta el valor de la variable Y, el valor de la variable X disminuye.

Regresin y Correlacin Lineal Simple


http://www.cuautitlan.unam.mx
Universidad Nacional Autnoma de Mxico
Facultad de Estudios Superiores Cuautitln

VARIABLE INDEPENDIENTE (X)

En el anlisis de regresin una variable cuyo valor se suponga conocido y


que se utilice para explicar o predecir el valor de otra variable de inters se
llama variable independiente; se simboliza con la letra X.

Otros nombres alternativos para la variable independiente (X), son


variable explicatoria, variable predictora y en ocasiones variable regresora.

VARIABLE DEPENDIENTE (Y)

En el anlisis de regresin una variable cuyo valor se suponga desconocido


y que se explique o prediga con ayuda de otra se llama variable dependiente
y se simboliza con la letra Y.

La variable dependiente, al igual que la variable independiente es llamada


de diferentes maneras algunas de ellas son: variable explicada o variable
pronosticada.

Regresin y Correlacin Lineal Simple


http://www.cuautitlan.unam.mx
Universidad Nacional Autnoma de Mxico
Facultad de Estudios Superiores Cuautitln

DIAGRAMAS DE DISPERSIN

Un diagrama de dispersin es una ilustracin grfica que se usa en el


anlisis de regresin. Consta de una dispersin de puntos tal que cada punto
representa un valor de la variable independiente (medido a lo largo del eje
horizontal), y un valor asociado de la variable dependiente (medido a lo largo
del eje vertical).

El diagrama de dispersin, tambin llamado nube de puntos, brinda dos


tipos de informacin, visualmente se pueden determinar los patrones que
indican como las variables estn relacionadas (lineal o mediante una curva) y
por otro lado si existe una relacin entre ellas visualizando la clase de lnea o
ecuacin de estimacin que describe a dicha relacin.

A continuacin se ilustran algunas relaciones en los diagramas de


dispersin:

Regresin y Correlacin Lineal Simple


http://www.cuautitlan.unam.mx
Universidad Nacional Autnoma de Mxico
Facultad de Estudios Superiores Cuautitln

METODO DE MINIMOS CUADRADOS

El mtodo que por lo comn se utiliza para ajustar una lnea a los datos
muestrales indicados en el diagrama de dispersin, se llama mtodo de
mnimos cuadrados. La lnea se deriva en forma tal que la suma de los
cuadrados de las desviaciones verticales entre la lnea y los puntos
individuales de datos se reduce al mnimo.

El mtodo de mnimos cuadrados sirve para determinar la recta que


mejor se ajuste a los datos muestrales, y los supuestos de este mtodo son:

El error es cero.
Los datos obtenidos de las muestra son estadsticamente independientes.
La varianza del error es igual para todos los valores de X.

Una lnea de regresin calculada a partir de los datos muestrales, por el


mtodo de mnimos cuadrados se llama lnea de regresin estimada o lnea
de regresin muestral.

Dicha lnea recta es la que mejor se ajusta al conjunto de datos (X, Y) y es


aquella en que la distancia que hay entre los datos y la supuesta recta es la
menor posible, y se calcula mediante la siguiente formula:

y = a + bx
Para calcular el valor de b (pendiente), que representa el grado de
inclinacin que tiene la recta, se emplea la siguiente formula:

b= xy n x y
x nx 2 2

Para calcular el valor de a (ordenada al origen), que representa el punto


en que la recta corta al eje de las Y, se emplea la siguiente formula:

a = y + bx
Las variables a y b son constantes numricas que son las que se calculan
mediante el mtodo de mnimos cuadrados.

Regresin y Correlacin Lineal Simple


http://www.cuautitlan.unam.mx
Universidad Nacional Autnoma de Mxico
Facultad de Estudios Superiores Cuautitln

ERROR ESTANDAR DE ESTIMACIN

El siguiente proceso que se necesita en el anlisis de la regresin lineal


simple es cmo medir la confiabilidad de la ecuacin de estimacin que
hemos desarrollado.

El error estndar de estimacin mide la variabilidad o dispersin de los


valores observados alrededor de la lnea de regresin y se representa como
Se. Su formula es la siguiente:

y 2
(a y ) (b xy )
Se =
n2

Cuanto mayor sea el error estndar de la estimacin, ms grande ser la


dispersin (o esparcimiento) de puntos alrededor de la lnea de regresin.
Por el contrario, si Se= 0, se espera que la ecuacin de estimacin sea un
estimador perfecto de la variable dependiente, en este caso todos los
puntos caeran directamente sobre la lnea de regresin y no habra puntos
dispersos, como se muestra en la siguiente figura:

El error estndar de estimacin tiene la misma aplicacin que de la


desviacin estndar que se vio en los temas anteriores. Esto es, suponiendo
que los puntos observados tienen una distribucin normal alrededor de la
recta de regresin, podemos esperar que:

Regresin y Correlacin Lineal Simple


http://www.cuautitlan.unam.mx
Universidad Nacional Autnoma de Mxico
Facultad de Estudios Superiores Cuautitln

68% de los puntos estn dentro de 1se


95.5% de los puntos estn dentro de 2se
99.7% de los puntos estn dentro de 3se

El error estndar de la estimacin se mide a lo largo del eje Y, y no


perpendicularmente desde la recta de regresin.

Las suposiciones son:

1. Los valores observados para Y tienen distribucin normal alrededor


de cada valor estimado de y
2. La varianza de las distribuciones alrededor de cada valor posible de
y es la misma.

Si esta segunda suposicin no fuera cierta, entonces el error estndar en un


punto de la recta de regresin podra diferir del error estndar en otro punto.

PROCEDIMIENTO PARA REALIZAR UN ANLISIS DE REGRESIN LINEAL


SIMPLE

1. Obtencin de los datos muestrales.

Regresin y Correlacin Lineal Simple


http://www.cuautitlan.unam.mx
Universidad Nacional Autnoma de Mxico
Facultad de Estudios Superiores Cuautitln

2. Los datos obtenidos se tabulan. (tener cuidado en determinar


correctamente quien es la variable independiente y dependiente)

X Y

3. La informacin se grfica en un diagrama de dispersin,


establecindose la posible relacin entre las dos variables

4. Se calcula la pendiente.

b=
xy n x y
x n(x )
2 2

5. Se calcula la ordenada al origen.

a = y + bx

Regresin y Correlacin Lineal Simple


http://www.cuautitlan.unam.mx
Universidad Nacional Autnoma de Mxico
Facultad de Estudios Superiores Cuautitln

6. Se obtiene la ecuacin que mejor se ajusta a la informacin obtenida.

y = a + bx

7. Se traza la lnea estimada en el diagrama de dispersin.

8. Se calcula el error estndar de estimacin.

y 2
(a y ) (b xy )
Se =
n2

Por ejemplo:

Una cadena de Pizzeras toma una muestra de diez de sus sucursales


para tratar de encontrar un modelo matemtico que le permita predecir sus
ventas y obtuvo los siguientes datos: la poblacin de personas en miles fue
de 2, 6, 8, 8, 12, 16, 20, 20, 22, 26; y las ventas trimestrales en miles de pesos
fue de: 58, 105, 88, 118, 117, 137, 157, 169, 169, 149, 202.

Realice una regresin para estimar las ventas de dos sucursales que tienen
14,000 y 30,000 personas como potenciales clientes respectivamente.

Solucin

Datos
n=10

Regresin y Correlacin Lineal Simple


http://www.cuautitlan.unam.mx
Universidad Nacional Autnoma de Mxico
Facultad de Estudios Superiores Cuautitln

X: Poblacin de personas en miles


Y: Ventas trimestrales en miles de pesos

1. Tabular los datos obtenidos:


Sucursal X Y
1 2 58
2 6 105
3 8 88
4 8 118
5 12 117
6 16 137
7 20 157
8 20 168
9 22 149
10 26 202

2. Graficar los datos en un diagrama de dispersin y determinar la posible


relacin entre las variables X Y.

Se puede observar una relacin lineal directa.

Regresin y Correlacin Lineal Simple


http://www.cuautitlan.unam.mx
Universidad Nacional Autnoma de Mxico
Facultad de Estudios Superiores Cuautitln

3. Realizar los clculos correspondientes

2 2
Sucursal X Y XY X Y
1 2 58 116 4 3364
2 6 105 630 36 11025
3 8 88 704 64 7744
4 8 118 944 64 13924
5 12 117 1404 144 13689
6 16 137 2192 256 18769
7 20 157 3140 400 24649
8 20 168 3380 400 28224
9 22 149 3278 484 22201
10 26 202 5252 676 40804
= 140 1300 21040 2528 184393
4. Calculo de la pendiente.

140
x= = 14 mil personas
10
1300
y= = 130 mil pesos
10
Por lo tanto la pendiente es

21040 10(14 )(130 )


b= =5
2528 10(14 )
2

5. Calculo de la ordenada al origen.

a = 130 5(14) = 60
6. Obtener la ecuacin que mejor se ajuste.

y = 60 + 5( x )

Regresin y Correlacin Lineal Simple


http://www.cuautitlan.unam.mx
Universidad Nacional Autnoma de Mxico
Facultad de Estudios Superiores Cuautitln

7. Trazar la lnea estimada.

8. Calcular el error estndar de estimacin.

184393 (60 1300) (5 21040)


Se = = 12.21
10 2

Tiene un error de estimacin de 12,210 pesos.

Para una N = 14,000 1

y = 60 + 5(14 ) = 130
(14,130 )

Para una N = 30,000

y = 60 + 5(30 ) = 210
(30,210 )

1
Recuerda que estamos trabajando con miles de pesos, en este ejercicio.

Regresin y Correlacin Lineal Simple


http://www.cuautitlan.unam.mx
Universidad Nacional Autnoma de Mxico
Facultad de Estudios Superiores Cuautitln

CORRELACIN SIMPLE

Mientras que el anlisis de regresin simple establece una ecuacin


precisa que enlaza dos variables, el anlisis de correlacin es la herramienta
estadstica que podemos usar para describir el grado o fuerza en el que una
variable esta linealmente relacionada con otra.

Dependiendo del tamao de esta medida cuantitativa se puede decir, que


tan cercanamente se mueven dos variables, y por lo tanto, con cuanta
confiabilidad se puede estimar una variable con ayuda de la otra.

Una tcnica estadstica que establece un ndice que proporciona, en un


solo nmero, una medida de la fuerza de asociacin entre dos variables de
inters, se llama anlisis de correlacin simple.

El anlisis de correlacin es la herramienta estadstica de que nos valemos


para describir el grado de relacin que hay entre dos variables.

A menudo el anlisis de correlacin simple se utiliza junto con el anlisis de


regresin lineal simple para medir la eficacia con que la lnea de regresin
explica la variacin de la variable dependiente, Y.

Diagramas de dispersin con correlacin dbil y fuerte.

Existen dos medidas para describir la correlacin entre dos variables: el


coeficiente de determinacin y el coeficiente de correlacin.

Regresin y Correlacin Lineal Simple


http://www.cuautitlan.unam.mx
Universidad Nacional Autnoma de Mxico
Facultad de Estudios Superiores Cuautitln

COEFICIENTE MUESTRAL DE DETERMINACIN

La medida ms importante de que tambin ajusta la lnea de regresin


estimada en los datos muestrales en los que esta basada, es el coeficiente de
determinacin muestral, este es igual a la proporcin de la variacin total de
los valores de la variable dependiente, Y, que puede explicarse por medio
de la asociacin de Y con X medida por la lnea de regresin estimada.

El coeficiente de determinacin es la manera primaria de medir el


grado, o fuerza, de la relacin que existe entre dos variables, X y Y.

El coeficiente de determinacin muestral se representa como r2, y mide


exclusivamente la fuerza de una relacin lineal entre dos variables.

El Calculo del coeficiente de determinacin se lleva a cabo con la siguiente


formula:

(a y ) + (b xy ) (n y 2
)
=
y (n y )
2
r 2
2

COEFICIENTE MUESTRAL DE CORRELACIN

La raz cuadrada del coeficiente de determinacin muestral, r 2 , es un


ndice alternativo comn del grado de asociacin entre dos variables
cuantitativas. Esta mediad se llama coeficiente de correlacin muestral (r) y
es un estimador puntual del coeficiente de correlacin poblacional ().

El coeficiente de correlacin muestral es la segunda medida con que


puede describirse la eficacia con que una variable es explicada por otra, as
pues el signo de r indica la direccin de la relacin entre las dos variables X y
Y.

Regresin y Correlacin Lineal Simple


http://www.cuautitlan.unam.mx
Universidad Nacional Autnoma de Mxico
Facultad de Estudios Superiores Cuautitln

El siguiente esquema representa adecuadamente la intensidad y la


direccin del coeficiente de correlacin muestral.

El calculo del coeficiente de correlacin muestral se lleva a cavo con la


siguiente formula:

r = r2
INTERVALO DE CONFIANZA

Debido a que la recta estimada de regresin, no es del todo real, es


necesario elaborar un intervalo de confianza que le de seguridad a nuestros
clculos.

Como se ha visto, cuando se utilice el mtodo de mnimos cuadrados,


los coeficientes de regresin, a y b son estimadores insesgados, eficientes y
consistentes de y , tambin aqu es muchas ocasiones es deseable
establecer intervalos de confianza.

Los intervalos de confianza se calculan con la siguiente frmula:

S
yc = y t / 2 , gln 2 e
n

Regresin y Correlacin Lineal Simple


http://www.cuautitlan.unam.mx
Universidad Nacional Autnoma de Mxico
Facultad de Estudios Superiores Cuautitln

INTERVALO DE PREDICCIN

El intervalo de prediccin, como su nombre lo indica, se utiliza para


predecir un intervalo de valores de Y, dado un valor de X.

El intervalo de prediccin se calcula con la siguiente frmula:

y p = y (t 2 (n 2)) S e 1 + +
1 (X x ) 2

n x 2 n(x )2

PROCEDIMIENTO PARA REALIZAR UN ANLISIS DE CORRELACIN LINEAL


SIMPLE

1. Obtencin y tabulacin de los datos muestrales.

2. La informacin se grfica en un diagrama de dispersin.

3. Calcular la pendiente y ordenada al origen.

4. Se obtiene la ecuacin que mejor se ajusta a la informacin obtenida.

5. Se traza la lnea estimada en el diagrama de dispersin.

6. Calcular el error estndar de estimacin.

7. Calcular el coeficiente de determinacin.

8. Determinar el coeficiente de correlacin.

9. Determinar el intervalo de confianza.

10. Determinar el intervalo de prediccin.

Regresin y Correlacin Lineal Simple


http://www.cuautitlan.unam.mx
Universidad Nacional Autnoma de Mxico
Facultad de Estudios Superiores Cuautitln

Por ejemplo:

Un gerente de ventas reuni los datos siguientes relacionados con las


ventas anuales en miles de pesos y los aos de experiencia de diez
vendedores. Estime las ventas anuales para un vendedor con 7 aos de
experiencia.

Solucin

1. Obtencin y tabulacin de los datos muestrales.

X: Aos de experiencia
Y: Ventas anuales en miles de pesos.

Vendedor X Y
1 1 80
2 3 97
3 4 92
4 4 102
5 6 103
6 8 111
7 10 119
8 10 123
9 11 117
10 13 136
= 70 1080

2. Diagrama de dispersin.

Regresin y Correlacin Lineal Simple


http://www.cuautitlan.unam.mx
Universidad Nacional Autnoma de Mxico
Facultad de Estudios Superiores Cuautitln

3. Realizar los clculos correspondientes y determinar la pendiente y


ordenada al origen.

Vendedor X Y XY X2 Y2
1 1 80 80 1 6400
2 3 97 291 9 9409
3 4 92 368 16 8464
4 4 102 408 16 10404
5 6 103 618 36 10609
6 8 111 888 64 12321
7 10 119 1190 100 14161
8 10 123 1230 100 15129
9 11 117 1287 121 13689
10 13 136 1768 169 18496
= 70 1080 8128 632 119082

1080
y= = 108
10
70
x= =7
10

8128 10(7 )(108)


b= =4
632 10(7 )
2

a = 108 4(7 ) = 80

4. Ecuacin que mejor se ajusta.

y = 80 + 4( x )
Para un vendedor con 7 aos de experiencia, sus ventas estimadas seran:

y = 80 + 4(7 ) = 108 ventas anuales

Regresin y Correlacin Lineal Simple


http://www.cuautitlan.unam.mx
Universidad Nacional Autnoma de Mxico
Facultad de Estudios Superiores Cuautitln

5. Trazo de la lnea estimada en el diagrama de dispersin

6. Calcular el error estndar de estimacin.

119082(80 1080) (4 8128)


Se = = 4.61
10 2

7. Calcular el Coeficiente de Determinacin.

(80 1080 ) + (4 8128) (10 1082 )


2
= =
r
(
119082 10 1082 )
r 2 = 93.03%
El 93% de las ventas anuales se deben a la experiencia de los vendedores y
el 7% restante de debe a otros factores.

8. Calcular el Coeficiente de Correlacin

r = 0.9303 = 0.9645

Este nmero nos indica que las variables X Y tienen una correlacin positiva
intensa.

Regresin y Correlacin Lineal Simple


http://www.cuautitlan.unam.mx
Universidad Nacional Autnoma de Mxico
Facultad de Estudios Superiores Cuautitln

9. Determinar el intervalo de confianza al 95%.

Considerando
y = 108 ventas anuales
4.61
yc = 108 2.306
10
108 3.3617 yc 108 + 3.3617
104.6383 yc 111.3617

Se puede asegurar con un nivel de confianza del 95% que las ventas de los
vendedores con 7 aos de experiencia estn entre 104.6 y 111.4 miles pesos
anuales.

10. Determinar el intervalo de prediccin para un vendedor con 9 aos de


experiencia se tiene

y p = y (t 2 (n 2)) S e 1 + +
1 (X x ) 2

n x 2 n(x )2
Sustituyendo:

1
y p = 108 2.306 4.61 1 + +
(9 7 ) 2

10 632 10(7) 2
108 11.291 y p 108 + 11.291
96.709 y p 119.291

Se puede asegurar con un nivel de confianza del 95% que las ventas
pronosticadas de un vendedor con 9 aos de experiencia estn entre 96.71
y 119.3 miles pesos anuales.

Regresin y Correlacin Lineal Simple


http://www.cuautitlan.unam.mx
Universidad Nacional Autnoma de Mxico
Facultad de Estudios Superiores Cuautitln

Ejercicios propuestos:

1. El jefe del departamento de aguas de una ciudad desea establecer una


relacin entre el consumo mensual domiciliario de agua Y, y el tamao de las
familias X, Dados los datos muestrales, determine:

Galones Tamao
de de
Agua familia.
Y X
650 2
1200 7
1300 9
430 4
1400 12
900 6
1800 9
640 3
793 3
925 2

a) Elabora el diagrama de dispersin.


b) Calcula la pendiente y ordenada al origen.
c) Obtener la ecuacin que mejor se ajusta a los datos.
d) Traza la lnea estimada en el diagrama de dispersin.
e) Calcula el error estndar de estimacin.
f) Calcula el coeficiente de determinacin.
g) Determina el coeficiente de correlacin.
h) Determina el intervalo de confianza al 99%.
i) Determina el intervalo de prediccin 99%

Regresin y Correlacin Lineal Simple


http://www.cuautitlan.unam.mx
Universidad Nacional Autnoma de Mxico
Facultad de Estudios Superiores Cuautitln

2. El gerente de una compaa de seguros desea establecer la relacin entre


el seguro de vida de las personas Y, y sus salarios X. Realice una regresin con
los datos muestrales:

Seguro Salario
de Anual.
vida
Y X
50 10
80 29
100 30
130 31
150 36
a) Elabora el diagrama de dispersin.
b) Calcula la pendiente y ordenada al origen.
c) Obtener la ecuacin que mejor se ajusta a los datos.
d) Traza la lnea estimada en el diagrama de dispersin.
e) Calcula el error estndar de estimacin.
f) Calcula el coeficiente de determinacin.
g) Determina el coeficiente de correlacin.
h) Determina el intervalo de confianza al 90%.
i) Determina el intervalo de prediccin 90%

3. Un economista desea establecer la relacin entre la tasa de desempleo Y, y


la tasa de cuentas vencidas de la Tesoreras, Determine la regresin y
correlacin con los datos muestrales.

Y X
6.7 9.7
7.3 9.8
8.9 7.6
9.1 6.1
7.2 10.2
5.2 12.7
6.9 14.3
6.9 7.9
7.1 8.9

1. Elabora el diagrama de dispersin.


2. Calcula la pendiente y ordenada al origen.
3. Obtener la ecuacin que mejor se ajusta a los datos.

Regresin y Correlacin Lineal Simple


http://www.cuautitlan.unam.mx
Universidad Nacional Autnoma de Mxico
Facultad de Estudios Superiores Cuautitln

4. Traza la lnea estimada en el diagrama de dispersin.


5. Calcula el error estndar de estimacin.
6. Calcula el coeficiente de determinacin.
7. Determina el coeficiente de correlacin.
8. Determina el intervalo de confianza al 95%.
9. Determina el intervalo de prediccin 95%

4. Un director de ventas desea establecer la relacin entre las ventas del


segundo ao de vendedores Y, y sus ventas del primer ao X. Realice un
anlisis de regresin.

Y 69 75 86 111 129 133


X 170 133 86 161 112 133

a) Elabora el diagrama de dispersin.


b) Calcula la pendiente y ordenada al origen.
c) Obtener la ecuacin que mejor se ajusta a los datos.
d) Traza la lnea estimada en el diagrama de dispersin.
e) Calcula el error estndar de estimacin.
f) Calcula el coeficiente de determinacin.
g) Determina el coeficiente de correlacin.
h) Determina el intervalo de confianza al 95%.
i) Determina el intervalo de prediccin 95%

5. Un gerente de comercializacin desea establecer la relacin entre las


ventas Y, y el precio de un producto similar fabricado por la competencia
X, Realice un anlisis de correlacin.

Ventas Precio de
competencia
Y X
520 13
550 13
600 15
610 15
620 16
724 21
680 21
300 14
962 40
270 12

Regresin y Correlacin Lineal Simple


http://www.cuautitlan.unam.mx
Universidad Nacional Autnoma de Mxico
Facultad de Estudios Superiores Cuautitln

1. Elabora el diagrama de dispersin.


2. Calcula la pendiente y ordenada al origen.
3. Obtener la ecuacin que mejor se ajusta a los datos.
4. Traza la lnea estimada en el diagrama de dispersin.
5. Calcula el error estndar de estimacin.
6. Calcula el coeficiente de determinacin.
7. Determina el coeficiente de correlacin.
8. Determina el intervalo de confianza al 99%.
9. Determina el intervalo de prediccin 99%

6. Se hizo una encuesta a una muestra de 10 los estudiantes de 3er. Semestre


de la carera de Lic. En administracin del grupo 1301 del semestre 2009-1 y se
encontraron los siguientes datos:

Estudiante Altura (mts) Peso (Kg)


1 1.50 48
2 1.54 50
3 1.60 52
4 1.72 70
5 1.80 72
6 1.50 50
7 1.61 57
8 1.54 54
9 1.63 80
10 1.70 62
a) Elabora el diagrama de dispersin.
b) Calcula la pendiente y ordenada al origen.
c) Obtener la ecuacin que mejor se ajusta a los datos.
d) Traza la lnea estimada en el diagrama de dispersin.
e) Calcula el error estndar de estimacin.
f) Calcula el coeficiente de determinacin.
g) Determina el coeficiente de correlacin.
h) Determina el intervalo de confianza al 95%.
i) Determina el intervalo de prediccin 95%

Regresin y Correlacin Lineal Simple


http://www.cuautitlan.unam.mx
Universidad Nacional Autnoma de Mxico
Facultad de Estudios Superiores Cuautitln

7. Los datos siguientes muestran las ventas (en miles de cajas) y los costos de
un anuncio publicitario para la televisin (en millones de pesos) para 7 marcas
principales de refrescos.
Marca Gastos de Ventas de cajas
publicidad ($) (miles)
Coca-Cola 13.0 19.3
Pepsi-Cola 9.4 13.8
Sprite 6.4 8.4
Diet Coke 5.7 5.5
7-Up 4.2 5.9
Jarritos 2.9 5.3
Boing 1.6 2.5
a) Dibuje el diagrama de dispersin, que parece indicar este diagrama
acerca de la relacin entre las dos variables?
b) Trace una recta que pase por los datos, para aproximar una relacin
lineal entre los gastos del anuncio y las ventas.
c) Aplique el mtodo de los cuadrados mnimos para plantear la ecuacin
estimada de regresin.
d) Prediga las ventas para una marca que decida gastar $7 millones de
pesos en un anuncio publicitario.
e) Calcule el error estndar en la regresin.
f) Calcule el coeficiente de determinacin y correlacin e interprtelos.
g) Determina el intervalo de confianza al 95%.
h) Determina el intervalo de prediccin 95%

8. La revista del consumidor publico en su nmero 381 del mes de noviembre


del 2008 la siguiente informacin acerca del uso de los telfonos celulares:

Ao Usuarios que compran


tiempo aire en (miles de
usuarios)
2000 1628
2001 1784
2002 2006
2003 2029
2004 2508
2005 3268
2006 4035
2007 5199

Regresin y Correlacin Lineal Simple


http://www.cuautitlan.unam.mx
Universidad Nacional Autnoma de Mxico
Facultad de Estudios Superiores Cuautitln

a) Trace un diagrama de dispersin para estos datos,


b) Aplique el mtodo de mnimos cuadrados para plantear la ecuacin
estimada de regresin.
c) Trace una recta que pase por los datos, para aproximar una relacin
lineal entre la altura y el peso.
d) Prediga cuantos usuarios compraran tiempo aire para su telfono
celular para el ao 2009.
e) Calcule el error estndar en la regresin.
f) Calcule el coeficiente de correlacin y el coeficiente de determinacin
e interprtelos.
g) Determina el intervalo de confianza al 92%.
h) Determina el intervalo de prediccin 92%

9. Un vendedor de Century 21 desea establecer la relacin entre el tiempo en


meses que estn a la venta los departamentos antes de lograr su venta y el
precio pedido por ellos. Los datos de una muestra de 9 departamentos se
muestran a continuacin:

Meses en venta 6.5 7.0 8.6 12.1 9.0 9.5 8.6 10.6 15.0
Precio pedido (en 800 1000 990 1250 1400 1100 990 990 1250
miles de pesos)

a) Trace un diagrama de dispersin para estos datos,


b) Aplique el mtodo de mnimos cuadrados para plantear la ecuacin
estimada de regresin.
c) Prediga cuanto tiempo se tardara en vender un departamento que
cueste $ 1500,000 pesos.
d) Calcule el error estndar en la regresin.
e) Calcule el coeficiente de correlacin y el coeficiente de determinacin
e interprtelos.
f) Determina el intervalo de confianza al 95%.
g) Determina el intervalo de prediccin 95%

Regresin y Correlacin Lineal Simple


http://www.cuautitlan.unam.mx
Universidad Nacional Autnoma de Mxico
Facultad de Estudios Superiores Cuautitln

10. El Orgamismo Operador de agua en el Muncipio de cuautitln Izcalli


OPERAGUA quiere conocer la relacin entre en consumo mensual domiciliario
de agua y el tamao de las familias, toma una muestra de 10 familias elegidas
al azar y encuentra los siguientes datos:

Metros cbicos 65 120 130 43 140 90 180 64 79 92


consumidos
Tamao de la 2 7 9 4 12 6 9 3 3 4
familia
a) Trace un diagrama de dispersin para estos datos,
b) Aplique el mtodo de mnimos cuadrados para plantear la ecuacin
estimada de regresin.
c) Prediga cuantos metros cbicos al mes consumir una familia que tiene
10 miembros.
d) Calcule el error estndar en la regresin.
e) Calcule el coeficiente de correlacin y el coeficiente de determinacin
e interprtelos.
f) Determina el intervalo de confianza al 95%.
g) Determina el intervalo de prediccin 95%

11- El gerente de una mueblera FAMSA quiere conocer la relacin de las


ventas logradas por un vendedor en dos aos, toma una muestra de 8
vendedores que lograron la etiqueta de (vendedor del mes) y encontr los
siguientes datos:

Unidades vendidas en el ao 2007 170 133 86 161 112 133 136 82


Unidades vendidas en el ao 2006 99 95 50 80 92 88 130 100
a) Trace un diagrama de dispersin para estos datos,
b) Aplique el mtodo de mnimos cuadrados para plantear la ecuacin
estimada de regresin.
c) Calcule el error estndar en la regresin.
d) Calcule el coeficiente de correlacin y el coeficiente de determinacin e
interprtelos.
e) Determina el intervalo de confianza al 95%.
f) Determina el intervalo de prediccin 95%

Regresin y Correlacin Lineal Simple


http://www.cuautitlan.unam.mx
Universidad Nacional Autnoma de Mxico
Facultad de Estudios Superiores Cuautitln

12. Segn el INEGI los nacimientos registrados en el pas en el 2007 fueron:

Nacimientos
Mes de registro Registrados
1 Enero 220,670
2 Febrero 211,330
3 Marzo 213,299
4 Abril 270,819
5 Mayo 225,298
6 Junio 205,572
7 Julio 211,180
8 Agosto 249,626
9 Septiembre 220,666
10 Octubre 241,529
11 Noviembre 211,857
12 Diciembre 173,237
a) Aplique el mtodo de mnimos cuadrados para plantear la ecuacin
estimada de regresin.
b) El INEGI reporto que en julio de 2007 se registraron 211,330
nacimientos, utiliza la ecuacin obtenida y predice cuantos debieron
de haberse registrado en ese mes, compara resultados y obtn tus
conclusiones.
c) Estime cuantos nacimientos se registraron en enero de 2008.
d) Calcule el error estndar en la regresin.
e) Calcule el coeficiente de correlacin y el coeficiente de determinacin
e interprtelos.
f) Determina el intervalo de confianza al 95%.
g) Determina el intervalo de prediccin 95%

Regresin y Correlacin Lineal Simple


http://www.cuautitlan.unam.mx

Anda mungkin juga menyukai