Anda di halaman 1dari 20

ANÁLISIS CUANTITATIVO UNIDAD 7

Análisis Cuantitativo

Guía de estudio de la
Unidad 7

Regresión y correlación
lineal

REGRESIÓN Y CORRELACIÓN 183


ANÁLISIS CUANTITATIVO UNIDAD 7

1. Introducción

En múltiples ocasiones en la práctica nos encontramos con situaciones en las que se


requiere analizar la relación entre dos variables cuantitativas. Los dos objetivos
fundamentales de este análisis serán, por un lado, determinar si dichas variables están
asociadas y en qué sentido se da dicha asociación (es decir, si los valores de una de las
variables tienden a aumentar –o disminuir- al aumentar los valores de la otra); y por otro,
estudiar si los valores de una variable pueden ser utilizados para predecir el valor de la otra.

La forma correcta de abordar el primer problema es recurriendo a coeficientes de


correlación. Sin embargo, el estudio de la correlación es insuficiente para obtener una
respuesta a la segunda cuestión: se limita a indicar la fuerza de la asociación mediante un
único número, tratando las variables de modo simétrico, mientras que nosotros estaríamos
interesados en modelizar dicha relación y usar una de las variables para explicar la otra. Para
tal propósito se recurrirá a la técnica de regresión. Aquí analizaremos el caso más sencillo en
el que se considera únicamente la relación entre dos variables. Así mismo, nos limitaremos
al caso en el que la relación que se pretende modelizar es de tipo lineal.

2. Objetivos

a) Determinar la ecuación de regresión lineal. Discusión de la validez del modelo e


interpretación de los resultados
b) Determinar y saber interpretar el coeficientes de correlación r de Pearson y el
coeficiente de determinación
c) Determinar y saber interpretar el coeficiente de correlación por rangos de Spearman

3. Caso de estudio

Los miembros de un club gastronómico han sido valorados tomando como baremos
el sentido del humor y la obesidad y sus resultados han sido representados en la
siguiente gráfica donde cada punto representa una persona:
a.) Trata de reconocer en algunos puntos en la gráfica a

REGRESIÓN Y CORRELACIÓN 184


ANÁLISIS CUANTITATIVO UNIDAD 7

 Dalmaso es un obeso cascarrabias.


 Felipe es muy delgado, pero tiene bastante buen humor.

b.) Salvo las dos excepciones del apartado anterior, observa que, entre los miembros de este
club hay una cierta tendencia a tener tanto mejor humor cuanto más gordos sean. Si tuvieras
que concretar esa tendencia con una recta, ¿te parece adecuada la de ecuación
y = 1 + 3/5 (x – 1)?
Represéntala y si no te parece adecuada, dibuja la recta que, según tu opinión, marca la
tendencia de esa población.
c.) Va a ingresar un nuevo socio en este club. Sabemos que su obesidad es de +1. ¿Entre qué
valores te parece más probable que oscile su humor?
d.) ¿Será razonable escribir una fórmula que proporcione directamente el valor del humor en
función de la obesidad?

4. Contenidos

7.1- Análisis de regresión. Modelo de regresión lineal simple. Ajuste por el método de los
mínimos cuadrados.
7.2- Correlación. Diagrama de dispersión.
7.3- Correlación lineal. Coeficiente r de Pearson.
7.4- Coeficiente de asociación por rangos. Coeficiente Rs de Spearman

REGRESIÓN Y CORRELACIÓN 185


ANÁLISIS CUANTITATIVO UNIDAD 7

ANÁLISIS DE REGRESIÓN Y CORRELACIÓN LINEAL

Todos los días se toman decisiones basadas en predicciones de sucesos futuros. Para
hacer estas predicciones nos basamos en la relación entre lo que ya se sabe y lo que se debe
estimar. Si podemos determinar cómo lo conocido se relaciona con el evento futuro, nos
ayudaría a tomar la decisión. Este es el objetivo del análisis de regresión y de correlación:
cómo determinar la relación entre las variables.

ANÁLISIS DE REGRESIÓN

El análisis de regresión proporciona los conceptos y la metodología básica para extraer de


grandes cantidades de datos las características principales de una relación que no es evidente.

Se supone la existencia de un conjunto de n mediciones y1 , y2 ,... yn de una variable


respuesta Y, las cuales se han observado bajo un conjunto de condiciones experimentales
{ x1 , x2 ,... xk } que representan k variables de predicción X.

Ejemplos:

 Los economistas pueden predecir el PBN (producto bruto nacional anual), basados en el
"consumo final". En este caso la variable "consumo final" es la variable independiente
(o variable de predicción) y el PBN es la variable dependiente (o variable respuesta)

 Existe una relación entre la cantidad de aerosoles vendidos y la cantidad de


fluorocarburos liberados en la atmósfera. En este caso la variable "cantidad de aerosoles
vendidos" es la variable independiente (o variable de predicción) y la variable "cantidad
de fluorocarburos liberados en la atmósfera" es la variable dependiente (o variable
respuesta)

El interés recae en determinar una función matemática sencilla, que describa de manera
razonable el comportamiento de la variable respuesta Y , dados los valores de la variable de
predicción X , llamada ecuación de estimación, esto es, una fórmula matemática que
relacione las variables conocidas X con la variable desconocida Y .

Si se estima el valor de una variable aleatoria (la variable dependiente Y) conociendo el


valor de una sola variable asociada (la variable independiente X), es un modelo de
regresión lineal simple; si se conocen dos ó más variables independientes es un modelo de
regresión lineal múltiple.

Ejemplo:

 Se desea estimar el costo de calefaccionar una casa en alta montaña (variable


dependiente Y) para lo cual consideramos 4 variables independientes importantes
1) X 1 : Temperatura exterior mínima 3) X 3 : número de ventanas de la casa
diaria promedio,
2) X 2 : número de pulgadas de aislante, 4) X 4 : antigüedad del calefactor

REGRESIÓN Y CORRELACIÓN 186


ANÁLISIS CUANTITATIVO UNIDAD 7

SUPUESTOS:

1- Se ha seleccionado la forma correcta de la ecuación de regresión. Es decir, cualquier


variabilidad en la variable respuesta que no puede ser explicada por la ecuación de
regresión se debe a un error aleatorio.

2- Los datos que se observan son comunes, es decir constituyen una muestra representativa
de la población.

3- Se supone que cada valor observado está constituido por un valor real y una
componente aleatoria. Es decir, si se toman muestras con los mismos valores de x ,
podemos esperar que varíen los valores de y .

4- Para toda i  1,2,..., n , el valor medio de los errores es E ( )  0 y la varianza del


error es Var ( )   2 . Dado que las variables de predicción no son variables aleatorias,
la varianza de la variable respuesta Yi también es  2 , para toda i, y por lo tanto
independiente del punto de observación.

5- Los valores de la variable de predicción se fijan de antemano.

DIAGRAMA DE DISPERSIÓN

Si hay una sola variable de predicción, se realiza un gráfico denominado diagrama de


dispersión que nos da una idea del tipo de relación entre las variables: si se puede aproximar
por una recta, si no hay ningún tipo de relación o si se puede aproximar por algún otro tipo
de función.

El diagrama de dispersión es una gráfica en la que se trazan cada uno de los puntos que
representan un par de valores observados para las variables independiente y dependiente. El
valor de la variable independiente se gráfica en el eje horizontal y la variable dependiente en
el eje vertical.

Si la gráfica indica una relación, que en términos generales es lineal, entonces


buscaremos la recta que mejor ajuste a esos datos, llamada ecuación de regresión o
ecuación predictiva o ecuación de pronóstico

Ejemplo:

Los datos que se proporcionan en la siguiente tabla, representan las utilidades por acción
correspondiente a una compañía durante 10 años. Por simplicidad, se codificó el tiempo
llamando año 1 a 1989, 2 a 1990, 3 a 1991,....., 10 a 1999.

Año 1 2 3 4 5 6 7 8 9 10
Utilidad 1,38 1,50 1,61 1,68 1,87 2,17 2,62 2,66 2,29 2,90

El diagrama de dispersión para estos datos es

REGRESIÓN Y CORRELACIÓN 187


ANÁLISIS CUANTITATIVO UNIDAD 7

La ecuación lineal que representa el modelo de regresión lineal simple (poblacional) es:

Yi    xi  i

Yi es el valor de la variable dependiente en la i-ésima observación


 indica el valor de Y cuando x  0 (ordenada al origen)
 indica la pendiente de la línea de regresión
xi es el valor de la variable independiente en la i-ésima observación
 i error aleatorio en la i-ésima observación

Los coeficientes de regresión  y  son parámetros a estimar a partir de los datos


muestrales. Al denotar sus estimaciones con a y b , respectivamente, podemos estimar
este modelo poblacional con la recta de regresión

yˆ  a  bx

Cada observación en la muestra satisface yi  a  bxi  ei (donde ei es el error aleatorio


llamado residuo)

Una vez seleccionado el modelo, hay que obtener estimaciones para los parámetros  y
 , que intervienen en el mismo. Una técnica muy aceptada para este propósito es el método
de los mínimos cuadrados.

REGRESIÓN Y CORRELACIÓN 188


ANÁLISIS CUANTITATIVO UNIDAD 7

MÉTODO DE MÍNIMOS CUADRADOS PARA AJUSTAR UNA LÍNEA DE


REGRESIÓN

Este método proporciona lo que comúnmente se conoce como la recta de "mejor ajuste".
Minimiza la suma de los cuadrados de las desviaciones verticales con respecto a la recta.

La recta que mejor ajusta los datos es

yˆ  a  bx
donde
n  n  n 
n  xy    x   y 
b  i 1  i 1  i 1 
2 y
2 
n n 
n  x    x 
i 1  i 1 

n n
 yi  b  x
i 1 i 1
a  y  bx
n

Retomando el ejemplo, haremos los cálculos con una tabla:

x y xy x2
1 1,38 1,38 1
2 1,5 3 4
3 1,61 4,83 9
4 1,68 6,72 16
5 1,87 9,35 25
6 2,17 13,02 36
7 2,62 18,34 49
8 2,66 21,28 64
9 2,29 20,61 81
10 2,9 29 100
  55
x  y  20, 68  xy  127, 53 2
 x  385

10.(127,53)  55.( 20,68)


b  0,17
10.( 385)  (55) 2

20,68  0,17( 55)


a  1,15
10

La ecuación de regresión nos queda: yˆ  1,15  0,17 x .


La representamos junto al diagrama de dispersión:

REGRESIÓN Y CORRELACIÓN 189


ANÁLISIS CUANTITATIVO UNIDAD 7

Podríamos utilizar esta ecuación de regresión para estimar el valor esperado (o estimado) en
el 2000, para lo cual le damos a x el valor codificado 11

yˆ 2000  1,15  0,17(11)  3,02

 Estas estimaciones deben tomarse con cuidado, ya que no hay base


estadística para suponer que la recta de regresión sea apropiada
fuera de los límites considerados en la muestra. Generalmente, si la
variable independiente es el tiempo, lo que me indica la línea de
regresión es una idea de la tendencia de los datos. En este ejemplo,
vemos que los valores muestran una tendencia a aumentar a medida
que pasa el tiempo.

Nota:

 La diferencia entre el valor real (representado por los puntos) y el valor estimado por
la recta de regresión se llama residuo ei  yi  yˆ i , y describe el error en el ajuste
del modelo en el i-ésimo punto.

10
9 yi
8
ei  yi  yˆ i
7
6
5
ŷ i
4
3
2
1
0
0 2 4 6 8 10

REGRESIÓN Y CORRELACIÓN 190


ANÁLISIS CUANTITATIVO UNIDAD 7

ACTIVIDAD 1:

Un agrónomo experimentó con distintas cantidades de fertilizante líquido en una muestra de


parcelas del mismo tamaño. Las cantidades de fertilizante y los rendimientos
correspondientes son:

PARCELA CANTIDAD DE RENDIMIENTO


FERTILIZANTE (en tn) (en cientos de bushels)
A 2 7
B 1 3
C 3 8
D 4 10

1. El agrónomo está interesado en pronosticar el rendimiento. ¿Cuáles son la variable


dependiente y la independiente?
2. Trace un diagrama de dispersión
3. Determine la ecuación de regresión y represéntela en el gráfico

ANÁLISIS DE CORRELACIÓN.

Hasta aquí hemos supuesto que la variable X no es una variable aleatoria (es decir que se
mide con poco error). En muchas aplicaciones de las técnicas de regresión es más realista
suponer que X e Y son ambas variables aleatorias, por lo que consideraremos el problema de
medir la intensidad de la relación lineal entre esas dos variables.

La correlación también se puede utilizar sola para medir el grado de asociación entre dos
variables.

El análisis de correlación intenta medir la fuerza de tales relaciones por medio de


números. En este curso veremos dos: el coeficiente de correlación lineal y el coeficiente
de determinación.

COEFICIENTE DE CORRELACIÓN LINEAL :

REGRESIÓN Y CORRELACIÓN 191


ANÁLISIS CUANTITATIVO UNIDAD 7

Originado por el investigador Karl Pearson (aproximadamente en 1900), el coeficiente de


correlación describe la intensidad de la relación entre dos variables de nivel de intervalo o de
nivel de razón.

 Se denota r y se lo llama también r de Pearson o coeficiente de correlación - producto


momento de Pearson.

 Se lo calcula con la siguiente expresión:

n  n  n 
n  xy    x   y 
r i 1  i 1  i 1 
 n n   n
2
n  
2
2  2 
n  x    x   n  y    y  
 i 1  i 1    i 1  i 1  

 r toma valores entre –1 y 1 (inclusive)


 el coeficiente de correlación no indica que entre las variables exista una relación de causa
a efecto

Un coeficiente de correlación nos indica tres cosas fundamentalmente:

 La existencia o no de una relación entre las variables

 La dirección de esta relación, si es que existe (es decir si es positiva o


negativa)

 El grado de esta relación (cuyo valor máximo es  1 y cuyo valor mínimo


es la no correlación r =0)

El esquema siguiente representa adecuadamente la intensidad y la dirección del


coeficiente de correlación:

Ejemplo:

Una empresa decide pasar anuncios publicitarios durante la semana e distintos medios de
comunicación y desea saber si hay relación entre las ventas de fin de semana y la cantidad de
anuncios publicitarios. Los datos son:

Nº anuncios 4 2 5 6 3

REGRESIÓN Y CORRELACIÓN 192


ANÁLISIS CUANTITATIVO UNIDAD 7

Ventas 1500 800 2100 2400 1700

Hacemos una tabla para los cálculos:

x y xy x2 y2
4 1500 6000 16 2250000
2 800 1600 4 640000
5 2100 10500 25 4410000
6 2400 14400 36 5760000
3 1700 5100 9 2890000
 x  20  y  8500  xy  37600  x 2  90  y 2  15950000

5( 37600)  20(8500
r  0,93
5(90)  (20) 5(15950000)  (8500) 
2 2

 El coeficiente de correlación lineal es r = 0,93 (alta correlación lineal entre las


variables)

 El diagrama de dispersión indica una relación lineal positiva entre las variables, lo que
significa que al aumentar el número de anuncios publicitarios aumentan también las
ventas

Nota: En muchas ocasiones se halla la recta de regresión y se grafica junto al


diagrama de dispersión

COEFICIENTE DE DETERMINACIÓN:

Los términos “débil, moderado o fuerte” utilizados con el coeficiente de correlación no


tienen un significado preciso. Para lograr esta precisión se utiliza el coeficiente de
determinación, que se calcula al elevar al cuadrado el coeficiente de correlación.

REGRESIÓN Y CORRELACIÓN 193


ANÁLISIS CUANTITATIVO UNIDAD 7

En el ejemplo anterior r2=0,8649. Esto se interpreta como un porcentaje: el 86,5% de la


variación total de las ventas de fin de semana se explica, o se debe, a la cantidad de anuncios
publicitarios

COEFICIENTE DE DETERMINACIÓN r2 :

La proporción de la variación total en la variable dependiente Y que se explica por (o que


se debe a) la variación en la variable dependiente X. Se calcula elevando al cuadrado el
coeficiente de correlación lineal

COEFICIENTE DE NO DETERMINACIÓN 1 - r2 :

La proporción de la variación total en la variable dependiente Y que no es explicada por la


variación en X. Se calcula como 1 – r2. En el ejemplo 0,1351: el 13,5% de la variación total
de las ventas de fin de semana no son explicados por la cantidad de anuncios, es decir se
deben a otras razones

ACTIVIDAD 2:

Estudia en cuáles de los siguientes casos los resultados ofrecidos son compatibles entre sí:
a) La recta de regresión es: y = 4x + 5, y que el coeficiente de correlación: rxy = -0.3
b) y = 9 x - 4; rxy = 3
c) y = 5x + 8; rxy = 0.2
d) y = -0.3x + 9; rxy = - 0.2

CORRELACIÓN DE RANGOS

Charles Spearman, estadístico británico, ideó una medida de correlación para datos de nivel
ordinal o de rangos, es decir para datos que pueden clasificarse de menor a mayor, o
viceversa. A esta medida se la conoce como coeficiente de rango de Spearman y se lo
denota rS.

El coeficiente de Spearman mide el grado de relación entre dos conjuntos de


observaciones ordenadas por rango o jerarquizadas.

n
6  di
i 1
rs  1  2
n ( n  1)

di diferencia entre los rangos del par i


n número de observaciones por pares

REGRESIÓN Y CORRELACIÓN 194


ANÁLISIS CUANTITATIVO UNIDAD 7

 Toma valores desde –1 hasta 1

 1 y –1 indican relación perfecta entre los rangos

 0 indica que no hay relación entre los rangos

Ejemplo:

Se entrena al personal en técnicas especiales de ventas. Un grupo de 10 vendedores es


rankeado según la nota de entrenamiento (RE), siendo 1 el valor más bajo y 10 el orden del
mayor puntaje. A la semana de estar trabajando, se anotan las ventas realizadas por cada
uno de ellos. Determinar la relación entre los ranking correspondientes a entrenamiento y
nivel de ventas.

Empleado 1 2 3 4 5 6 7 8 9 10
Ventas 319 150 175 460 348 300 280 200 190 300
RE 3 9 6 1 4 10 5 2 7 8

Vamos a jerarquizar a los empleados elaborando un ranking según el nivel de ventas.


Para ello ordenamos las ventas de menor a mayor

Empleado Ventas realizadas Rango de


ventas
2 150 1
3 175 2
9 190 3
8 200 4
7 280 5
6 300 6
10 300 7
1 319 8
5 348 9
4 460 10

A la menor venta se le asigna el rango 1, a la que sigue el rango 2 y así siguiendo. Cuando
se presenta un empate (vemos que los representantes 6 y 10 realizaron ventas por $300), el
rango que se les otorga es el promedio entre el 6º y 7º lugar, es decir (6+7)/2= 6,5

REGRESIÓN Y CORRELACIÓN 195


ANÁLISIS CUANTITATIVO UNIDAD 7

Rango de ventas Rango de di d i2


entrenamiento
1 9 -8 64
2 6 -4 16
3 7 -4 16
4 2 2 4
5 5 0 0
6,5 10 -3,5 12,25
6,5 8 -1,5 2,25
8 3 5 25
9 4 5 25
10 1 9 81
 d i  0  d i  245,5
2

6( 245,5)
rS  1   0, 49
10(100  1)

rS = - 0,49 ( hay una relación negativa moderada entre los dos ranking)

Si hacemos un diagrama de dispersión con los dos ranking vemos que hay una
moderada relación lineal negativa entre los dos ranking

A veces para visualizar mejor la relación se traza la recta de mínimos cuadrados

Relación entre el rango de ventas y el rango


de entrenamiento

12
Rango de entrenamiento

10
8
6
4
2
0
0 2 4 6 8 10 12
Rango de ventas

ACTIVIDAD 3:
Los entrenadores de fútbol califican el desempeño de los jugadores en una escala de 0 a 100,
tanto en las prácticas semanales como en el juego. Una muestra de jugadores que participó
en un campeonato reveló las siguientes calificaciones:

PUNTUACIÓN

REGRESIÓN Y CORRELACIÓN 196


ANÁLISIS CUANTITATIVO UNIDAD 7

JUGADOR EN PRÁCTICAS DURANTE EL JUEGO


Juan 80 80
Marcelo 20 10
Pedro 100 90
Enrique 65 50
Sergio 50 35
Jorge 40 30
Carlos 90 95
Facundo 60 35

Determine el grado de relación entre la forma en que se calificó el desempeño de los


jugadores durante las prácticas y el rango que obtuvieron durante el juego utilizando el
coeficiente rs. Interprete.
Realice un diagrama de dispersión.

ACTIVIDAD 4:

Resuelva el caso de estudio

PREGUNTAS DE COMPRENSIÓN:

Responder verdadero o falso.

1. El análisis de regresión lineal se usa para describir qué tan bien la ecuación de una recta
describe la relación que se está estudiando.

2. Dado que la ecuación para una línea es Y = 26 - 24X, podemos decir que la relación de Y
con X es positiva y lineal.

3. Un valor r2 cercano a cero indica una fuerte correlación entre X eY.

4. Los análisis de regresión y correlación se usan para determinar relaciones de causa y


efecto.

5. El coeficiente de correlación muestral, r, no es nada más que la raíz cuadrada del


coeficiente de determinación.

6. La línea de regresión se deriva de una muestra y no de toda la población.

8. Podemos interpretar el coeficiente de determinación muestral coma la variación en Y que


es explicada por la línea de regresión.

REGRESIÓN Y CORRELACIÓN 197


ANÁLISIS CUANTITATIVO UNIDAD 7

9. Si una línea se ajusta a un conjunto de puntos mediante el método de mínimos cuadrados,


los errores individuales positivos y negativos desde la línea suman cero.

10. Supongamos que la pendiente de una ecuación de estimación es positiva. Entonces el de


r debe ser la raíz cuadrada positiva de r2.

11. Si r = 0.8, entonces la ecuación de regresión explica 80% de la variación total en la


variable dependiente.

12. Un valor r2 mide sólo la fuerza de una relación lineal entre las dos variables X e Y.

13. El coeficiente de determinación nos determina el porcentaje de la varianza de Y


explicada por la variable X

14. Cuando el coeficiente de determinación toma valores próximos a 1, el modelo es bueno y


los residuos pequeños

15. - Cuando los residuos se distribuyen uniformemente alrededor de la recta de regresión,


eso se llama homocedasticidad.

RESUMEN DE LA UNIDAD

ANÁLISIS DE REGRESIÓN LINEAL

La recta que mejor ajusta los datos es yˆ  a  bx donde

n  n  n 
n  xy    x   y  n n
b  i 1  i 1  i 1   yi  b  x
2 y i 1 i 1
n
2 
n  a  y  bx
n  x    x  n
i 1  i 1 

COEFICIENTE DE CORRELACIÓN DE PEARSON

REGRESIÓN Y CORRELACIÓN 198


ANÁLISIS CUANTITATIVO UNIDAD 7

n  n  n 
n  xy    x   y 
r i 1  i 1  i 1 
 n n   n
2
n  
2
2  2 
n  x    x   n  y    y  
 i 1  i 1    i 1  i 1  

COEFICIENTE DE DETERMINACIÓN r2
COEFICIENTE DE RANGO DE SPEARMAN

n
6  di
i 1
rs  1  2
n ( n  1)

BIBLIOGRAFÍA

MASON Y LIND - Estadística para Administración y Economía - Editorial Alfaomega -


1998

LEVIN Y RUBIN - Estadística para Administradores- Editorial Prentice Hall – 1996

Trabajo práctico Nº 7:
REGRESIÓN Y CORRELACIÓN LINEAL
1- Los ejercicios que siguen se basan en el siguiente diagrama de dispersión:

Relac ión entre el prec io y la c antidad pedida

Precio

a) El gráfico anterior se llama:


A) Gráfica de puntos
B) Gráfica de barras
C) Diagrama de dispersión

REGRESIÓN Y CORRELACIÓN 199


ANÁLISIS CUANTITATIVO UNIDAD 7

D) Gráfica lineal
E) Tiene otro nombre
b) La ecuación de la recta que pasa por los puntos tiene como expresión:
A) Y = a + b + c B) Y = a + bx
2
C) Y = a + bx D) Y = x – 1
E) Y = a + b
c) En este problema el investigador intenta pronosticar:
A) La cantidad pedida con base en el precio
B) El precio con base a la cantidad solicitada
C) Tanto el precio como las cantidades solicitadas
D) Ninguna de las opciones es correcta
d) Si se calcula el signo de b en la ecuación resulta
A) positivo
B) negativo
C) no se puede conocer de antemano
e) Cualquier pronóstico realizado con la línea de regresión de este gráfico
resulta
A) Sin error
B) De poca o ninguna utilidad
C) Ninguna opción es correcta
f) A la variable que se utiliza para pronosticar otra variable se la denomina
A) variable independiente
B) variable dependiente
C) variable de correlación
D) Ninguna de estas opciones es correcta
g) El método empleado para llegar a la recta de “mejor ajuste” en el análisis de
regresión se denomina:
A) método de dibujo a mano libre
B) método de no determinación
C) método de mínimos cuadrados
D) método de correlación
2- En Economía, la función demanda de un producto se estima a menudo calculando la
regresión de la cantidad vendida (Q) sobre el precio (P). Una empresa que produce
perfumes muy finos lanza al mercado un nuevo producto, con diferentes estrategias
publicitarias y precios, según los lugares de venta. Obtiene los siguientes datos:

precio 100 47 85 80 45 40 30 20
unitario($)
cantidad vendida 1000 1500 1280 1200 1620 1700 1800 2000
a) Dibuje un diagrama de dispersión.
b) Calcule el coeficiente de correlación y la ecuación de la recta de regresión.
c) Interprete el significado de los coeficientes de la ecuación de la recta de regresión para
este problema.
d) Calcule la cantidad esperada en las ventas cuando el precio es de $60.

3- La tabla muestra los índices de precios de consumo de alimentos y los de asistencia


para la salud durante los años 1985 a 1993, comparados con el año 1977 como base
( índice=1) .

REGRESIÓN Y CORRELACIÓN 200


ANÁLISIS CUANTITATIVO UNIDAD 7

AÑO 1985 1986 1987 1988 1989 1990 1991 1992 1993
ALIMENTACIÓN 1.75 1.81 1.92 2.11 2.35 2.55 2.75 2.86 2.92
ASISTENCIA 1.69 1.85 2.02 2.19 2.40 2.66 2.95 3.29 3.57
SANITARIA
a) Dibujar diagramas de dispersión (nube de puntos) que vinculen:
1) el año y el índice de consumo de alimentos
2) el año y el índice de asistencia sanitaria
3) el índice de consumo y el índice de asistencia sanitaria
b) Determinar la ecuación de la recta de regresión en los 3 casos
c) Representar la recta de regresión sobre la nube de puntos en los 3 casos
d) Usar la recta para pronosticar el índice correspondiente a la asistencia sanitaria cuando el
de alimentación vale 3.51.
e) Estimar un valor aproximado para el coeficiente de correlación lineal observando el
gráfico 3)
f) Calcular el coeficiente de correlación lineal entre los índices.
g) Hallar el coeficiente de determinación e interpretar
h) ¿Cuánto han subido los alimentos durante el período analizado?
i) ¿Cuánto ha subido la asistencia para la salud durante el período analizado?

4- Los comisionistas de inmobiliarias necesitan saber cómo cambia el precio de una


casa según el tamaño de la misma. Después de mirar los avisos clasificados del diario
para casa de barrio, obtienen los siguientes datos sobre la superficie (en m2) y los
precios (en miles de $) para once casas del tipo de la que buscan:

superficie (m2) 100 135 145 145 128 120 100 153 170 135 120
precio (miles de 40 49 54 51 48 46 41 56 62 50 45
$)
a) Dibuje un diagrama de dispersión. ¿Le sugiere el diagrama una asociación lineal entre las
variables?
b) Halle la ecuación de la recta de regresión del precio sobre la superficie de las casas.
c) Dibuje la recta de regresión en el gráfico del punto a).
d) Interprete, en términos del problema, el significado de los coeficientes de la ecuación de
la recta de regresión.
e) Calcule el valor esperado de una casa de 150 m2.
f) En términos generales, ¿puede estimar en cuántos pesos aumenta el precio de una casa
por cada metro cuadrado adicional?
g) Calcule el coeficiente de correlación y el coeficiente de determinación e interprete

5- Es importante poder determinar de manera aproximada el valor del coeficiente de


correlación lineal observando simplemente los diagramas de dispersión.

a) Asigne los valores 0,95; 0,4; -0,7 y -1 a los coeficientes de correlación de cada uno de los
gráficos siguientes.

REGRESIÓN Y CORRELACIÓN 201


ANÁLISIS CUANTITATIVO UNIDAD 7

b) Los coeficientes de correlación correspondientes a estas seis distribuciones son, no


respectivamente, los siguientes: 0.46; -0.94; 1; 0; 0.9; -0.63. Mírelas con atención y
asigne a cada cual su valor.

rXY  rXY  rXY 

REGRESIÓN Y CORRELACIÓN 202

Anda mungkin juga menyukai