2014
U N I V E R S I D A D N A C I O N A L D E L C E N T R O D E L P E R
Pgina 1
UNI V E R S I DAD NAC I ONAL DE L C E NT R O DE L P E R
INTEGRANTES:
ALIAGA ORDEZ MARDIN
CRISPN MIRANDA JULIO
ESPINOZA PERALTA LUIS JORDAN
FABIN CALDERN ROY
FLORIANO GUTIRREZ JORDEE
MOSCOSO LAURA CRISTIAN
PACCORI PILLPA CLUTBER
PINEDA PREZ TALO
SNCHEZ VALENZUELA BRYAN
2014
Mtodos Cuantitativos
ANLISIS DE RELACIN Y CORRELACIN
MG. ELSA LAGOS QUISPE
AO DE LA INVERSIN PARA EL DESARROLLO R
Mtodos Cuantitativos
2014
U N I V E R S I D A D N A C I O N A L D E L C E N T R O D E L P E R
Pgina 2
DEDICATORIA
El presente trabajo est
dedicado a nuestros padres y
maestros quienes da a da
se esfuerzan para poder
brindarnos su apoyo
incondicional como tambin
impartirnos sus
conocimientos.
Mtodos Cuantitativos
2014
U N I V E R S I D A D N A C I O N A L D E L C E N T R O D E L P E R
Pgina 3
INTRODUCCIN
El objetivo de este tema es analizar el grado de la relacin existente entre
variables utilizando modelos matemticos y representaciones grficas. As pues,
para representar la relacin entre dos o ms variables desarrollaremos una
ecuacin que permitir estimar una variable en funcin de la otra.
Por ejemplo, en qu medida, un aumento de los gastos en publicidad hace
aumentar las ventas de un determinado producto?, cmo representamos que la
bajada de temperaturas implica un aumento del consumo de la calefaccin?,...
A continuacin, estudiaremos dicho grado de relacin entre dos variables
en lo que llamaremos anlisis de correlacin. Para representar esta relacin
utilizaremos una representacin grfica llamada diagrama de dispersin y,
finalmente, estudiaremos un modelo matemtico para estimar el valor de una
variable basndonos en el valor de otra, en lo que llamaremos anlisis de regresin.
Mtodos Cuantitativos
2014
U N I V E R S I D A D N A C I O N A L D E L C E N T R O D E L P E R
Pgina 4
PRESENTACIN
Mediante el presente trabajo damos a conocer el tema de Regresin y
Correlacin Simple como suele pasar muchas veces en los procesos econmicos
donde las decisiones suelen basarse en la relacin entre dos o ms variables. Por
ejemplo, observar la relacin entre el gasto en publicidad y las ventas puede
permitir a un gerente de mercadotecnia tratar de predecir las ventas
correspondientes a un determinado gasto en publicidad. O, una empresa de
servicios pblicos puede emplear la relacin entre la temperatura diaria y la
demanda de electricidad para predecir la demanda de electricidad considerando
las temperaturas diarias que se esperan el mes siguiente. Algunas veces los
directivos se apoyan en la intuicin para juzgar la relacin entre dos variables. Sin
embargo, cuando es posible tener datos, puede emplearse un procedimiento
estadstico llamado anlisis de regresin para obtener una ecuacin que indique
cul es la relacin entre las variables.
Es por esta razn que consideramos que este tema es de mucha importancia
en nuestra formacin acadmica y profesional y sin ms que decirles les
presentamos el siguiente trabajo esperando que sea de mucha ayuda en su
formacin.
Mtodos Cuantitativos
2014
U N I V E R S I D A D N A C I O N A L D E L C E N T R O D E L P E R
Pgina 5
NDICE
DEDICATORIA
INTRODUCCIN
PRESENTACIN
NDICE
ANLISIS DE REGRESIN 6
REGRESIN LINEAL SIMPLE 7
Estimacin de parmetros 7
Ecuacin de regresin 8
Representacin grfica del modelo de Regresin Lineal 10
La recta de regresin 12
Proceso de estimacin de la regresin lineal simple 12
Lneas posibles de regresin en la regresin lineal simple 13
Mtodo de mnimos cuadrados 14
Estimacin de la variancia en el anlisis de regresin 15
Inferencia en Regresin 16
ANLISIS DE CORRELACIN 17
CORRELACIN LINEAL SIMPLE 17
Coeficiente de correlacin lineal 17
Coeficiente de determinacin 20
EJERCICIOS 22
SUGERENCIAS 24
BIBLIOGRAFA 25
Mtodos Cuantitativos
2014
U N I V E R S I D A D N A C I O N A L D E L C E N T R O D E L P E R
Pgina 6
ANLISIS DE REGRESIN
Es un procedimiento estadstico que estudia la relacin funcional entre
variables. Con el objeto de predecir una en funcin de la/s otra/s.
Una relacin funcional matemticamente hablando, est dada por:
(1)
Dnde:
Y: Variable respuesta (o dependiente).
xi: La i-sima variable independiente (i=1,...,n).
j: El j-simo parmetro en la funcin (j=1,...m).
f: La funcin.
Para elegir una relacin funcional particular como la representativa de la
poblacin bajo investigacin, usualmente se procede:
1) Una consideracin analtica del fenmeno que nos ocupa, y
2) Un examen de diagramas de dispersin.
Una vez decidido el tipo de funcin matemtica que mejor se ajusta (o
representa nuestro concepto de la relacin exacta que existe entre las variables) se
presenta el problema de elegir un expresin particular de esta familia de
funciones; es decir, se ha postulado una cierta funcin como trmino del verdadero
estado en la poblacin y ahora es necesario estimar los parmetros de esta funcin
(ajuste de curvas).
Como los valores de los parmetros no se pueden determinar sin errores
por que los valores observados de la variable dependiente no concuerdan con los
valores esperados, entonces la ecuacin (1) replanteada, estadsticamente, sera:
(2)
Donde representa el error cometido en el intento de observar la
caracterstica en estudio, en la cual muchos factores contribuyen al valor que
asume .
Mtodos Cuantitativos
2014
U N I V E R S I D A D N A C I O N A L D E L C E N T R O D E L P E R
Pgina 7
I REGRESIN LINEAL SIMPLE
Este tipo se presenta cuando una variable independiente ejerce
influencia sobre otra variable dependiente. Ejemplo: Y = f(x)
Esta regresin se utiliza con mayor frecuencia en las ciencias
econmicas, y sus disciplinas tecnolgicas. Cualquier funcin no lineal, es
transformada en lineal para su estudio y efectos.
Cuando la relacin funcional entre las variables dependiente (Y) e
independiente (X) es una lnea recta, se tiene una regresin lineal simple,
dada por la ecuacin.
Dnde:
(3)
La estimacin de parmetros consiste en determinar los
parmetros
de la muestra, que
represente a
, respectivamente.
De la ecuacin (3), para un
determinado, se tiene el
correspondiente
.
Empleando el mtodo de los mnimos cuadrados, es decir
minimizando la suma de cuadrados de los errores, se determinan los
valores de
, as
Mtodos Cuantitativos
2014
U N I V E R S I D A D N A C I O N A L D E L C E N T R O D E L P E R
Pgina 8
(5)
Al sistema formado por las ecuaciones (4) y (5) se les
denomina ecuaciones normales.
Resolviendo las ecuaciones normales, se tiene:
Dnde:
SPXY: denota a la suma de productos de X con Y,
SCX: denota a la suma de cuadrados de X.
1.2. Ecuacin De Regresin:
Dnde:
:
es la interseccin o el valor estimado de Y cuando X=0
.
1.2.1. Objetivo
Se utiliza la regresin lineal simple para:
Determinar la relacin de dependencia que tiene una
variable respecto a otra.
Mtodos Cuantitativos
2014
U N I V E R S I D A D N A C I O N A L D E L C E N T R O D E L P E R
Pgina 9
Ajustar la distribucin de frecuencias de una lnea, es
decir, determinar la forma de la lnea de regresin.
Predecir un dato desconocido de una variable partiendo
de los datos conocidos de otra variable.
1.2.2. Supuestos del modelo de regresin lineal
En el caso en que nuestras observaciones sean una
muestra aleatoria proveniente de una poblacin, estaremos
interesados en realizar inferencias sobre la misma. A fin de
que estas inferencias sean estadsticamente razonables, se
han de cumplir las siguientes condiciones:
a. En la poblacin, la relacin entre las variables X e Y
debe ser aproximadamente lineal, i e:
,
siendo la v.a. que representa los residuos
(diferencias entre el valor estimado por el modelo y el
verdadero valor de Y).
b. Los residuos se distribuyen segn una Normal de
media 0, i.e., N (0, 2).
c. Los residuos son independientes unos de otros.
d. Los residuos tienen varianza 2 constante.
Afortunadamente, el modelo de regresin lineal es
bastante robusto, lo que significa que no es necesario que
las condiciones anteriores se cumplan con exactitud (en
particular las tres ltimas).
1.2.2.1. Supuestos de Regresin Lineal Clsica
Cada error est normalmente distribuido con:
Esperanza de los errores igual a 0.
Variancia de los errores igual a una
constante
.
Covariancia de los errores nulas para todo i
.
Mtodos Cuantitativos
2014
U N I V E R S I D A D N A C I O N A L D E L C E N T R O D E L P E R
Pgina 10
1.3. Representacin grfica del modelo de Regresin Lineal
Nota: en esta figura se muestran las distribuciones de
probabilidades de Y para distintos valores de X
1.4. La recta de regresin
Considrese una variable aleatoria respuesta (o dependiente)
y, que se supone relacionada con otra variable (no necesariamente
aleatoria) que se llamar explicativa, predictora o independiente y
que se denotar por x.
A partir de una muestra de n individuos para los que se
dispone de los valores de ambas variables, {
}, se
puede visualizar grficamente la relacin existente entre ambas
mediante un grfico de dispersin, en el que los valores de la variable
x se disponen en el eje horizontal y los de y en el vertical. El problema
que subyace a la metodologa de la regresin lineal simple es el de
encontrar una recta que ajuste a la nube de puntos del diagrama as
dibujado, y que pueda ser utilizada para predecir los valores de y a
partir de los de x. La ecuacin general de la recta de regresin ser
entonces de la forma:
.
El problema radica en encontrar aquella recta que mejor
ajuste a los datos.
Tradicionalmente se ha recurrido para ello al mtodo de
mnimos cuadrados, que elige como recta de regresin a aquella que
minimiza las distancias verticales de las observaciones a la recta.
Mtodos Cuantitativos
2014
U N I V E R S I D A D N A C I O N A L D E L C E N T R O D E L P E R
Pgina 11
Cualquier observacin i-sima y i diferir verticalmente de
esa recta (por ahora desconocida) en un valor
. Luego es el valor
de una variable aleatoria.
El valor de cualquier observacin determinada depender de
un posible error de medicin y de los valores de otras variables
distintas de x que podran influir sobre y. Habr que calcular los
valores de y de la lnea de regresin, es decir la ecuacin de la
recta que de alguna manera da el mejor ajuste. En referencia al
grfico anterior, es relativamente fcil trazarla a simple vista con un
poco de sentido comn. Sin embargo, lo habitual es recurrir a un
mtodo menos subjetivo.
1.4.1. Propiedades de las rectas de regresin.
Propiedad 1: la suma de los residuos
Demostracin:
Ya que a y b son solucin de la primera ecuacin del sistema.
Mtodos Cuantitativos
2014
U N I V E R S I D A D N A C I O N A L D E L C E N T R O D E L P E R
Pgina 12
Propiedad 2: Si la dependencia existente entre las dos
variables es funcional, las dos rectas de regresin son
coincidentes.
Propiedad 3: La covarianza de las variables Y y e vale 0.
, y sabemos por la propiedad 1 que a10=
0, entonces bastar demostrar que a11 = 0 (sin demostracin).
1.5. Proceso de estimacin de la regresin lineal simple
Modelo de regresin
Ecuacin de regresin
Parmetros desconocidos
Datos de la muestra
x y
proporcionan estimados
Ecuacin estimada de regresin
Estadsticos de la muestra
1.6. Lneas posibles de regresin en la regresin lineal simple
Seccin A
Relacin lineal positiva
Mtodos Cuantitativos
2014
U N I V E R S I D A D N A C I O N A L D E L C E N T R O D E L P E R
Pgina 13
Seccin B
Relacin lineal negativa
Seccin C
No hay relacin
1.7. Mtodo De Mnimos Cuadrados
Obtiene un buen ajuste si minimiza el error entre estimado y
observado.
Uso del error total para determinar el mejor ajuste.
Uso del valor absoluto del error para medir mejor el ajuste.
La suma de los valores absolutos no pone nfasis en la magnitud
del error.
1.7.1. Mnimos cuadrados Supuestos
El modelo de regresin es lineal en los parmetros.
Los valores de X son fijos en muestreo repetido.
Mtodos Cuantitativos
2014
U N I V E R S I D A D N A C I O N A L D E L C E N T R O D E L P E R
Pgina 14
El valor medio de la perturbacin
es igual a cero.
Homocedasticidad o igual variancia de
.
No autocorrelacin entre las perturbaciones.
La covariancia entre
es cero.
El nmero de observaciones n debe ser mayor que el
nmero de parmetros a estimar.
Variabilidad en los valores de X.
El modelo de regresin est correctamente especificado.
No hay relaciones lineales perfectas entre las explicativas.
1.8. Estimacin de la variancia de los trminos del error ()
Debe ser estimada por varios motivos:
Para tener una indicacin de la variabilidad de las distribuciones
de probabilidad de Y.
Para realizar inferencias con respecto a la funcin de regresin y
la prediccin de Y.
La lgica del desarrollo de un estimador de
para el modelo de
regresin es la misma que cuando se muestrea una sola
poblacin
La variancia de cada observacin
es
provienen de diferentes
distribuciones de probabilidades con medias diferentes que
dependen del nivel de X, la desviacin de una observacin
n
debe ser calculada con respecto a su propia media estimada
Por tanto, las desviaciones son los residuales Y la suma de
cuadrados es:
La suma de cuadrados del error, tiene n-2 grados de libertad
asociados con ella, ya que se tuvieron que estimar dos parmetros.
Por lo tanto, las desviaciones al cuadrado dividido por los
grados de libertad, se denomina cuadrados medios.
Mtodos Cuantitativos
2014
U N I V E R S I D A D N A C I O N A L D E L C E N T R O D E L P E R
Pgina 15
Donde CM es el Cuadrado medio del error o cuadrado medio
residual. Es un estimador insesgado de
.
1.9. Anlisis de Variancia en el anlisis de regresin
El enfoque desde el anlisis de variancia se basa en la
particin de sumas de cuadrados y grados de libertad asociados con
la variable respuesta Y.
La variacin de los
La medida de la variacin total
, es la suma de las
desviaciones al cuadrado
Desarrollo formal de la particin
Consideremos la desviacin
Podemos descomponerla en
Donde:
(T): desviacin total.
(R): es la desviacin del valor ajustado por la regresin con
respecto a la media general.
(E): es la desviacin de la observacin con respecto a la lnea
de regresin.
Si consideremos todas las observaciones y elevamos al
cuadrado para que los desvos no se anulen
Mtodos Cuantitativos
2014
U N I V E R S I D A D N A C I O N A L D E L C E N T R O D E L P E R
Pgina 16
Donde:
(
Los valores para este coeficiente estn comprendidos entre -1
y 1.
Se tiene los siguientes criterios para r
{
Entre ms se aproxima a los valores 1 y -1 la aproximacin a
una correlacin se considera buena. Cuando ms se aleja de 1 o de -1
y se acerca a cero se tiene menos confianza en la dependencia lineal
por lo que una aproximacin lineal ser lo menos apropiado, sin
embargo no significa que no existe dependencia, lo nico que
podemos decir es que la dependencia no es lineal. Un valor positivo
para r indica que a medida que una variable crece la otra tambin lo
hace, por el contrario si su valor es negativo, lo que podemos decir es
que a medida que una variable crece la otra decrece.
Grficos de correlacin
{
Mtodos Cuantitativos
2014
U N I V E R S I D A D N A C I O N A L D E L C E N T R O D E L P E R
Pgina 19
Correlacin Negativa Perfecta
Correlacin Positiva Perfecta
Ausencia de Correlacin
Mtodos Cuantitativos
2014
U N I V E R S I D A D N A C I O N A L D E L C E N T R O D E L P E R
Pgina 20
Correlacin Fuerte y Positiva
Frmula para el coeficiente de correlacin (r)
Pearson
2.2. Coeficiente de Determinacin
Denominamos coeficiente de determinacin
como el
coeficiente que nos indica el porcentaje del ajuste que se ha
conseguido con el modelo lineal, es decir el porcentaje de la variacin
de Y que se explica a travs del modelo lineal que se ha estimado, es
decir a travs del comportamiento de X. A mayor porcentaje mejor es
nuestro modelo para predecir el comportamiento de la variable Y.
Tambin se puede entender este coeficiente de determinacin
como el porcentaje de varianza explicada por la recta de regresin y
su valor siempre estar entre 0 y 1 y siempre es igual al cuadrado del
coeficiente de correlacin (r).
Es una medida de la proximidad o de ajuste de la recta de
regresin a la nube de puntos.
Tambin se le denomina bondad del ajuste.
Toma el valor 0 cuando la regresin no explica
nada de la variabilidad de los valores observados y
por tanto el ajuste obtenido no modeliza
adecuadamente (ni siquiera mnimamente) la
relacin entre variables.
Toma el valor 1 cuando el ajuste efectuado recoge
toda la variabilidad de la variable original, y por
tanto el ajuste es perfecto.
Para valores entre 0 y 1, el ajuste es tanto mejor
cuanto ms se aproxima a 1 el coeficiente de
determinacin. Los ajustes se consideran
razonables cuando
.
Mtodos Cuantitativos
2014
U N I V E R S I D A D N A C I O N A L D E L C E N T R O D E L P E R
Pgina 22
EJERCICIOS
Se desea estudiar la relacin entre las calificaciones obtenidas en un test
(puntuado de 0 a 5) y el sexo del alumno que lo realiza. Los resultados observados
fueron:
a) Mida el grado de asociacin existente entre las dos variables mediante el
coeficiente ms adecuado.
b) Calcule el coeficiente de correlacin de Pearson y compare su valor con el
calculado en el apartado anterior.
a) Siendo dicotmica la segunda variable, calcularemos el coeficiente de
correlacin biserial puntual:
Denominando Y a la variable sexo (asignamos: 1=Hombre; 0=Mujer) y X a la
variable puntuacin en el test, procederemos a los clculos necesarios para su
obtencin. Ello nos conduce a calcular las medias de los valores de X que se
corresponden con un 1 y con un 0 en Y (
Mtodos Cuantitativos
2014
U N I V E R S I D A D N A C I O N A L D E L C E N T R O D E L P E R
Pgina 23
Con esto:
b) Coeficiente de correlacin de Pearson:
El propsito de este apartado no es otro que comprobar que efectivamente
coinciden los coeficientes de correlacin de Pearson y biserial puntual. Calculemos
la media y desviacin tpica de Y, as como la covarianza:
Mtodos Cuantitativos
2014
U N I V E R S I D A D N A C I O N A L D E L C E N T R O D E L P E R
Pgina 24
SUGERENCIAS
Antes de calcular una lnea de regresin para un conjunto de puntos de
datos, investigar cualquier punto distante.
Conocer muy bien las variables y realizar el experimento en el momento
que no se vea afectado por otras variables.
Mtodos Cuantitativos
2014
U N I V E R S I D A D N A C I O N A L D E L C E N T R O D E L P E R
Pgina 25
BIBLIOGRAFA
[1] D.A. Lind, R.D. Mason, W.G. Marchal (2001): Estadstica para
Administracin y Economa. Ed. Irwin McGraw-Hill.F.
[2] Kvanli, A. Introduction to Business Statistics South-Western
[3] R. Johnson (1996): Elementary Statistics. Ed. Duxbury
[4] Richard I. Levin & David S. Rubin (1996): Estadstica para
Administradores. Ed. Prentice Hall.
[5] E. Farber (1995):A Guide to Minitab. Ed. McGraw-Hill.