Anda di halaman 1dari 25

Mtodos Cuantitativos

2014
U N I V E R S I D A D N A C I O N A L D E L C E N T R O D E L P E R

Pgina 1


UNI V E R S I DAD NAC I ONAL DE L C E NT R O DE L P E R


INTEGRANTES:
ALIAGA ORDEZ MARDIN
CRISPN MIRANDA JULIO
ESPINOZA PERALTA LUIS JORDAN
FABIN CALDERN ROY
FLORIANO GUTIRREZ JORDEE
MOSCOSO LAURA CRISTIAN
PACCORI PILLPA CLUTBER
PINEDA PREZ TALO
SNCHEZ VALENZUELA BRYAN


2014





Mtodos Cuantitativos
ANLISIS DE RELACIN Y CORRELACIN
MG. ELSA LAGOS QUISPE

AO DE LA INVERSIN PARA EL DESARROLLO R


Mtodos Cuantitativos
2014
U N I V E R S I D A D N A C I O N A L D E L C E N T R O D E L P E R

Pgina 2

DEDICATORIA
El presente trabajo est
dedicado a nuestros padres y
maestros quienes da a da
se esfuerzan para poder
brindarnos su apoyo
incondicional como tambin
impartirnos sus
conocimientos.


Mtodos Cuantitativos
2014
U N I V E R S I D A D N A C I O N A L D E L C E N T R O D E L P E R

Pgina 3

INTRODUCCIN

El objetivo de este tema es analizar el grado de la relacin existente entre
variables utilizando modelos matemticos y representaciones grficas. As pues,
para representar la relacin entre dos o ms variables desarrollaremos una
ecuacin que permitir estimar una variable en funcin de la otra.

Por ejemplo, en qu medida, un aumento de los gastos en publicidad hace
aumentar las ventas de un determinado producto?, cmo representamos que la
bajada de temperaturas implica un aumento del consumo de la calefaccin?,...

A continuacin, estudiaremos dicho grado de relacin entre dos variables
en lo que llamaremos anlisis de correlacin. Para representar esta relacin
utilizaremos una representacin grfica llamada diagrama de dispersin y,
finalmente, estudiaremos un modelo matemtico para estimar el valor de una
variable basndonos en el valor de otra, en lo que llamaremos anlisis de regresin.



Mtodos Cuantitativos
2014
U N I V E R S I D A D N A C I O N A L D E L C E N T R O D E L P E R

Pgina 4
PRESENTACIN

Mediante el presente trabajo damos a conocer el tema de Regresin y
Correlacin Simple como suele pasar muchas veces en los procesos econmicos
donde las decisiones suelen basarse en la relacin entre dos o ms variables. Por
ejemplo, observar la relacin entre el gasto en publicidad y las ventas puede
permitir a un gerente de mercadotecnia tratar de predecir las ventas
correspondientes a un determinado gasto en publicidad. O, una empresa de
servicios pblicos puede emplear la relacin entre la temperatura diaria y la
demanda de electricidad para predecir la demanda de electricidad considerando
las temperaturas diarias que se esperan el mes siguiente. Algunas veces los
directivos se apoyan en la intuicin para juzgar la relacin entre dos variables. Sin
embargo, cuando es posible tener datos, puede emplearse un procedimiento
estadstico llamado anlisis de regresin para obtener una ecuacin que indique
cul es la relacin entre las variables.

Es por esta razn que consideramos que este tema es de mucha importancia
en nuestra formacin acadmica y profesional y sin ms que decirles les
presentamos el siguiente trabajo esperando que sea de mucha ayuda en su
formacin.



Mtodos Cuantitativos
2014
U N I V E R S I D A D N A C I O N A L D E L C E N T R O D E L P E R

Pgina 5
NDICE

DEDICATORIA
INTRODUCCIN
PRESENTACIN
NDICE
ANLISIS DE REGRESIN 6
REGRESIN LINEAL SIMPLE 7
Estimacin de parmetros 7
Ecuacin de regresin 8
Representacin grfica del modelo de Regresin Lineal 10
La recta de regresin 12
Proceso de estimacin de la regresin lineal simple 12
Lneas posibles de regresin en la regresin lineal simple 13
Mtodo de mnimos cuadrados 14
Estimacin de la variancia en el anlisis de regresin 15
Inferencia en Regresin 16
ANLISIS DE CORRELACIN 17
CORRELACIN LINEAL SIMPLE 17
Coeficiente de correlacin lineal 17
Coeficiente de determinacin 20
EJERCICIOS 22
SUGERENCIAS 24
BIBLIOGRAFA 25




Mtodos Cuantitativos
2014
U N I V E R S I D A D N A C I O N A L D E L C E N T R O D E L P E R

Pgina 6
ANLISIS DE REGRESIN

Es un procedimiento estadstico que estudia la relacin funcional entre
variables. Con el objeto de predecir una en funcin de la/s otra/s.

Una relacin funcional matemticamente hablando, est dada por:

(1)

Dnde:

Y: Variable respuesta (o dependiente).
xi: La i-sima variable independiente (i=1,...,n).
j: El j-simo parmetro en la funcin (j=1,...m).
f: La funcin.

Para elegir una relacin funcional particular como la representativa de la
poblacin bajo investigacin, usualmente se procede:

1) Una consideracin analtica del fenmeno que nos ocupa, y
2) Un examen de diagramas de dispersin.

Una vez decidido el tipo de funcin matemtica que mejor se ajusta (o
representa nuestro concepto de la relacin exacta que existe entre las variables) se
presenta el problema de elegir un expresin particular de esta familia de
funciones; es decir, se ha postulado una cierta funcin como trmino del verdadero
estado en la poblacin y ahora es necesario estimar los parmetros de esta funcin
(ajuste de curvas).

Como los valores de los parmetros no se pueden determinar sin errores
por que los valores observados de la variable dependiente no concuerdan con los
valores esperados, entonces la ecuacin (1) replanteada, estadsticamente, sera:

(2)

Donde representa el error cometido en el intento de observar la
caracterstica en estudio, en la cual muchos factores contribuyen al valor que
asume .



Mtodos Cuantitativos
2014
U N I V E R S I D A D N A C I O N A L D E L C E N T R O D E L P E R

Pgina 7
I REGRESIN LINEAL SIMPLE

Este tipo se presenta cuando una variable independiente ejerce
influencia sobre otra variable dependiente. Ejemplo: Y = f(x)

Esta regresin se utiliza con mayor frecuencia en las ciencias
econmicas, y sus disciplinas tecnolgicas. Cualquier funcin no lineal, es
transformada en lineal para su estudio y efectos.

Cuando la relacin funcional entre las variables dependiente (Y) e
independiente (X) es una lnea recta, se tiene una regresin lineal simple,
dada por la ecuacin.



Dnde:

: El valor de la ordenada donde la lnea de regresinse intersecta al eje Y.

: El coeficiente de regresin poblacional (pendiente de la lnea recta)


: El error.

1.1. Estimacin De Parmetros

La funcin de regresin lineal simple es expresado como:

(3)

La estimacin de parmetros consiste en determinar los
parmetros

a partir de los datos mustrales observados; es


decir, deben hallarse valores como

de la muestra, que
represente a

, respectivamente.

De la ecuacin (3), para un

determinado, se tiene el
correspondiente

, y el valor del error i sera

.

Empleando el mtodo de los mnimos cuadrados, es decir
minimizando la suma de cuadrados de los errores, se determinan los
valores de

, as



Mtodos Cuantitativos
2014
U N I V E R S I D A D N A C I O N A L D E L C E N T R O D E L P E R

Pgina 8
(5)
Al sistema formado por las ecuaciones (4) y (5) se les
denomina ecuaciones normales.

Resolviendo las ecuaciones normales, se tiene:



Dnde:

: es el valor que representa (estimador) a

: es el valor que representa (estimador) a


SPXY: denota a la suma de productos de X con Y,
SCX: denota a la suma de cuadrados de X.

1.2. Ecuacin De Regresin:



Dnde:

: es el valor estimado de Y para distintos X.

:

es la interseccin o el valor estimado de Y cuando X=0

: es la pendiente de la lnea, o el cambio promedio de Y para cada


cambio en una unidad de X el principio de mnimos cuadrados es
usado para obtener

.

1.2.1. Objetivo

Se utiliza la regresin lineal simple para:

Determinar la relacin de dependencia que tiene una
variable respecto a otra.


Mtodos Cuantitativos
2014
U N I V E R S I D A D N A C I O N A L D E L C E N T R O D E L P E R

Pgina 9
Ajustar la distribucin de frecuencias de una lnea, es
decir, determinar la forma de la lnea de regresin.
Predecir un dato desconocido de una variable partiendo
de los datos conocidos de otra variable.

1.2.2. Supuestos del modelo de regresin lineal

En el caso en que nuestras observaciones sean una
muestra aleatoria proveniente de una poblacin, estaremos
interesados en realizar inferencias sobre la misma. A fin de
que estas inferencias sean estadsticamente razonables, se
han de cumplir las siguientes condiciones:

a. En la poblacin, la relacin entre las variables X e Y
debe ser aproximadamente lineal, i e:

,
siendo la v.a. que representa los residuos
(diferencias entre el valor estimado por el modelo y el
verdadero valor de Y).

b. Los residuos se distribuyen segn una Normal de
media 0, i.e., N (0, 2).

c. Los residuos son independientes unos de otros.

d. Los residuos tienen varianza 2 constante.

Afortunadamente, el modelo de regresin lineal es
bastante robusto, lo que significa que no es necesario que
las condiciones anteriores se cumplan con exactitud (en
particular las tres ltimas).

1.2.2.1. Supuestos de Regresin Lineal Clsica

Cada error est normalmente distribuido con:

Esperanza de los errores igual a 0.
Variancia de los errores igual a una
constante

.
Covariancia de los errores nulas para todo i
.



Mtodos Cuantitativos
2014
U N I V E R S I D A D N A C I O N A L D E L C E N T R O D E L P E R

Pgina 10
1.3. Representacin grfica del modelo de Regresin Lineal


Nota: en esta figura se muestran las distribuciones de
probabilidades de Y para distintos valores de X

1.4. La recta de regresin

Considrese una variable aleatoria respuesta (o dependiente)
y, que se supone relacionada con otra variable (no necesariamente
aleatoria) que se llamar explicativa, predictora o independiente y
que se denotar por x.

A partir de una muestra de n individuos para los que se
dispone de los valores de ambas variables, {

}, se
puede visualizar grficamente la relacin existente entre ambas
mediante un grfico de dispersin, en el que los valores de la variable
x se disponen en el eje horizontal y los de y en el vertical. El problema
que subyace a la metodologa de la regresin lineal simple es el de
encontrar una recta que ajuste a la nube de puntos del diagrama as
dibujado, y que pueda ser utilizada para predecir los valores de y a
partir de los de x. La ecuacin general de la recta de regresin ser
entonces de la forma:

.

El problema radica en encontrar aquella recta que mejor
ajuste a los datos.

Tradicionalmente se ha recurrido para ello al mtodo de
mnimos cuadrados, que elige como recta de regresin a aquella que
minimiza las distancias verticales de las observaciones a la recta.



Mtodos Cuantitativos
2014
U N I V E R S I D A D N A C I O N A L D E L C E N T R O D E L P E R

Pgina 11
Cualquier observacin i-sima y i diferir verticalmente de
esa recta (por ahora desconocida) en un valor

. Luego es el valor
de una variable aleatoria.



El valor de cualquier observacin determinada depender de
un posible error de medicin y de los valores de otras variables
distintas de x que podran influir sobre y. Habr que calcular los
valores de y de la lnea de regresin, es decir la ecuacin de la
recta que de alguna manera da el mejor ajuste. En referencia al
grfico anterior, es relativamente fcil trazarla a simple vista con un
poco de sentido comn. Sin embargo, lo habitual es recurrir a un
mtodo menos subjetivo.

1.4.1. Propiedades de las rectas de regresin.

Propiedad 1: la suma de los residuos

vale 0 (y por tanto su


media, tambin), esto es:


Demostracin:



Ya que a y b son solucin de la primera ecuacin del sistema.



Mtodos Cuantitativos
2014
U N I V E R S I D A D N A C I O N A L D E L C E N T R O D E L P E R

Pgina 12
Propiedad 2: Si la dependencia existente entre las dos
variables es funcional, las dos rectas de regresin son
coincidentes.

Propiedad 3: La covarianza de las variables Y y e vale 0.



, y sabemos por la propiedad 1 que a10=
0, entonces bastar demostrar que a11 = 0 (sin demostracin).

1.5. Proceso de estimacin de la regresin lineal simple

Modelo de regresin


Ecuacin de regresin


Parmetros desconocidos


Datos de la muestra
x y


proporcionan estimados


Ecuacin estimada de regresin


Estadsticos de la muestra



1.6. Lneas posibles de regresin en la regresin lineal simple

Seccin A

Relacin lineal positiva





Mtodos Cuantitativos
2014
U N I V E R S I D A D N A C I O N A L D E L C E N T R O D E L P E R

Pgina 13
Seccin B

Relacin lineal negativa



Seccin C

No hay relacin



1.7. Mtodo De Mnimos Cuadrados

Obtiene un buen ajuste si minimiza el error entre estimado y
observado.
Uso del error total para determinar el mejor ajuste.
Uso del valor absoluto del error para medir mejor el ajuste.
La suma de los valores absolutos no pone nfasis en la magnitud
del error.

1.7.1. Mnimos cuadrados Supuestos

El modelo de regresin es lineal en los parmetros.
Los valores de X son fijos en muestreo repetido.


Mtodos Cuantitativos
2014
U N I V E R S I D A D N A C I O N A L D E L C E N T R O D E L P E R

Pgina 14
El valor medio de la perturbacin

es igual a cero.
Homocedasticidad o igual variancia de

.
No autocorrelacin entre las perturbaciones.
La covariancia entre

es cero.
El nmero de observaciones n debe ser mayor que el
nmero de parmetros a estimar.
Variabilidad en los valores de X.
El modelo de regresin est correctamente especificado.
No hay relaciones lineales perfectas entre las explicativas.

1.8. Estimacin de la variancia de los trminos del error ()
Debe ser estimada por varios motivos:

Para tener una indicacin de la variabilidad de las distribuciones
de probabilidad de Y.
Para realizar inferencias con respecto a la funcin de regresin y
la prediccin de Y.
La lgica del desarrollo de un estimador de

para el modelo de
regresin es la misma que cuando se muestrea una sola
poblacin
La variancia de cada observacin

es

, la misma que la de cada


trmino del error. Dado que los

provienen de diferentes
distribuciones de probabilidades con medias diferentes que
dependen del nivel de X, la desviacin de una observacin

n
debe ser calculada con respecto a su propia media estimada



Por tanto, las desviaciones son los residuales Y la suma de
cuadrados es:




La suma de cuadrados del error, tiene n-2 grados de libertad
asociados con ella, ya que se tuvieron que estimar dos parmetros.

Por lo tanto, las desviaciones al cuadrado dividido por los
grados de libertad, se denomina cuadrados medios.





Mtodos Cuantitativos
2014
U N I V E R S I D A D N A C I O N A L D E L C E N T R O D E L P E R

Pgina 15

Donde CM es el Cuadrado medio del error o cuadrado medio
residual. Es un estimador insesgado de

.

1.9. Anlisis de Variancia en el anlisis de regresin

El enfoque desde el anlisis de variancia se basa en la
particin de sumas de cuadrados y grados de libertad asociados con
la variable respuesta Y.

La variacin de los

se mide convencionalmente en trminos


de las desviaciones



La medida de la variacin total

, es la suma de las
desviaciones al cuadrado



Desarrollo formal de la particin

Consideremos la desviacin



Podemos descomponerla en



Donde:
(T): desviacin total.
(R): es la desviacin del valor ajustado por la regresin con
respecto a la media general.
(E): es la desviacin de la observacin con respecto a la lnea
de regresin.

Si consideremos todas las observaciones y elevamos al
cuadrado para que los desvos no se anulen



Mtodos Cuantitativos
2014
U N I V E R S I D A D N A C I O N A L D E L C E N T R O D E L P E R

Pgina 16



Donde:
(

): Suma de cuadrados total.


(

): Suma de cuadrados de la regresin.


(): Suma de cuadrados del error.

Dividiendo por los grados de libertad, (n-1), (k) y (n-2),
respectivamente cada suma de cuadrados, se obtienen los
cuadrados medios del anlisis de variancia.

1.10. Inferencia en Regresin

Los supuestos que establecimos sobre los errores nos
permiten hacer inferencia sobre los parmetros de regresin
(prueba de hiptesis e intervalos de confianza), ya que los
estimadores de

pueden cambiar su valor si cambia la


muestra.

Por lo tanto debemos conocer la distribucin de los
estimadores para poder realizar prueba de hiptesis e intervalos de
confianza.



Mtodos Cuantitativos
2014
U N I V E R S I D A D N A C I O N A L D E L C E N T R O D E L P E R

Pgina 17
ANLISIS DE CORRELACIN

Consiste en emplear mtodos que permitan medir el grado o intensidad de
asociacin entre dos o ms variables. El concepto de correlacin est
estrechamente vinculado al concepto de regresin, pues, para que una ecuacin de
regresin sea razonable los puntos mustrales deben estar ceidos a la ecuacin
de regresin; adems el coeficiente de correlacin debe ser:

Grande cuando el grado de asociacin es alto, y pequeo cuando es bajo.
Independiente de las unidades en que se miden las variables.

II CORRELACIN LINEAL SIMPLE

2.1. Coeficiente de correlacin lineal

El Coeficiente de Correlacin (r) requiere variables medidas
en escala de intervalos o de proporciones

Recordemos que para el caso de una variable, la varianza era
un parmetro que nos mostraba cuanta variacin exista entre la
media un conjunto de datos. En el mismo tenor, estamos en
determinar la dependencia entre dos variables por lo que una
primera propuesta es construir una medida que nos permita en
forma anloga tratar la variacin.

Se define la covarianza como la variacin que existe entre los
datos de dos variables, expresada como:



Donde x, y,

son las variables para n datos que intervienen en


el estudio.

En realidad la correlacin es una medida sobre el grado de
relacin entre dos variables, sin importar cual es la causa y cual es el
efecto. La dependencia de la que se habla en este sentido es la
dependencia entre la varianza de las variables.



Mtodos Cuantitativos
2014
U N I V E R S I D A D N A C I O N A L D E L C E N T R O D E L P E R

Pgina 18
Como hemos visto el manejo de unidades adimensionales nos
permiten tener u coeficiente sobre el que de forma cmoda se pueda
trabajar, por lo que podemos dividir entre el producto de las
desviaciones de las variables, es decir:



Los valores para este coeficiente estn comprendidos entre -1
y 1.

Se tiene los siguientes criterios para r

{





Entre ms se aproxima a los valores 1 y -1 la aproximacin a
una correlacin se considera buena. Cuando ms se aleja de 1 o de -1
y se acerca a cero se tiene menos confianza en la dependencia lineal
por lo que una aproximacin lineal ser lo menos apropiado, sin
embargo no significa que no existe dependencia, lo nico que
podemos decir es que la dependencia no es lineal. Un valor positivo
para r indica que a medida que una variable crece la otra tambin lo
hace, por el contrario si su valor es negativo, lo que podemos decir es
que a medida que una variable crece la otra decrece.

Grficos de correlacin

{







Mtodos Cuantitativos
2014
U N I V E R S I D A D N A C I O N A L D E L C E N T R O D E L P E R

Pgina 19
Correlacin Negativa Perfecta



Correlacin Positiva Perfecta


Ausencia de Correlacin





Mtodos Cuantitativos
2014
U N I V E R S I D A D N A C I O N A L D E L C E N T R O D E L P E R

Pgina 20
Correlacin Fuerte y Positiva



Frmula para el coeficiente de correlacin (r)
Pearson



2.2. Coeficiente de Determinacin

Denominamos coeficiente de determinacin

como el
coeficiente que nos indica el porcentaje del ajuste que se ha
conseguido con el modelo lineal, es decir el porcentaje de la variacin
de Y que se explica a travs del modelo lineal que se ha estimado, es
decir a travs del comportamiento de X. A mayor porcentaje mejor es
nuestro modelo para predecir el comportamiento de la variable Y.
Tambin se puede entender este coeficiente de determinacin
como el porcentaje de varianza explicada por la recta de regresin y
su valor siempre estar entre 0 y 1 y siempre es igual al cuadrado del
coeficiente de correlacin (r).



Es una medida de la proximidad o de ajuste de la recta de
regresin a la nube de puntos.

Tambin se le denomina bondad del ajuste.

nos indica qu porcentaje de las variaciones no se


explica a travs del modelo de regresin, es como si fuera la varianza
inexplicada que es la varianza de los residuos.


Mtodos Cuantitativos
2014
U N I V E R S I D A D N A C I O N A L D E L C E N T R O D E L P E R

Pgina 21

Valores del coeficiente de determinacin.

El coeficiente de determinacin toma valores entre 0 y
1;



Toma el valor 0 cuando la regresin no explica
nada de la variabilidad de los valores observados y
por tanto el ajuste obtenido no modeliza
adecuadamente (ni siquiera mnimamente) la
relacin entre variables.



Toma el valor 1 cuando el ajuste efectuado recoge
toda la variabilidad de la variable original, y por
tanto el ajuste es perfecto.



Para valores entre 0 y 1, el ajuste es tanto mejor
cuanto ms se aproxima a 1 el coeficiente de
determinacin. Los ajustes se consideran
razonables cuando

.



Mtodos Cuantitativos
2014
U N I V E R S I D A D N A C I O N A L D E L C E N T R O D E L P E R

Pgina 22
EJERCICIOS

Se desea estudiar la relacin entre las calificaciones obtenidas en un test
(puntuado de 0 a 5) y el sexo del alumno que lo realiza. Los resultados observados
fueron:



a) Mida el grado de asociacin existente entre las dos variables mediante el
coeficiente ms adecuado.
b) Calcule el coeficiente de correlacin de Pearson y compare su valor con el
calculado en el apartado anterior.

a) Siendo dicotmica la segunda variable, calcularemos el coeficiente de
correlacin biserial puntual:

Denominando Y a la variable sexo (asignamos: 1=Hombre; 0=Mujer) y X a la
variable puntuacin en el test, procederemos a los clculos necesarios para su
obtencin. Ello nos conduce a calcular las medias de los valores de X que se
corresponden con un 1 y con un 0 en Y (

) de forma separada, as como la


desviacin tpica de X.

Las siguientes tablas facilitan nuestras operaciones:




Mtodos Cuantitativos
2014
U N I V E R S I D A D N A C I O N A L D E L C E N T R O D E L P E R

Pgina 23


Con esto:


b) Coeficiente de correlacin de Pearson:
El propsito de este apartado no es otro que comprobar que efectivamente
coinciden los coeficientes de correlacin de Pearson y biserial puntual. Calculemos
la media y desviacin tpica de Y, as como la covarianza:






Mtodos Cuantitativos
2014
U N I V E R S I D A D N A C I O N A L D E L C E N T R O D E L P E R

Pgina 24
SUGERENCIAS

Antes de calcular una lnea de regresin para un conjunto de puntos de
datos, investigar cualquier punto distante.
Conocer muy bien las variables y realizar el experimento en el momento
que no se vea afectado por otras variables.



Mtodos Cuantitativos
2014
U N I V E R S I D A D N A C I O N A L D E L C E N T R O D E L P E R

Pgina 25
BIBLIOGRAFA

[1] D.A. Lind, R.D. Mason, W.G. Marchal (2001): Estadstica para
Administracin y Economa. Ed. Irwin McGraw-Hill.F.

[2] Kvanli, A. Introduction to Business Statistics South-Western

[3] R. Johnson (1996): Elementary Statistics. Ed. Duxbury

[4] Richard I. Levin & David S. Rubin (1996): Estadstica para
Administradores. Ed. Prentice Hall.

[5] E. Farber (1995):A Guide to Minitab. Ed. McGraw-Hill.

Anda mungkin juga menyukai