Anda di halaman 1dari 10

ESTADSTICA II

Pgina 1

REGRESIN Y CORRELACIN
REGRESIN
Es un proceso estadstico utilizado para la prediccio n o previsio n, o tambie n
llamada esperanza condicional; donde se estima el valor promedio de la
variable dependiente cuando se fijan las variables independientes.
Se analiza la relacio n existente entre variables, entendiendo co mo el valor de la
variable dependiente cambia cuando cualquiera de las variables independientes
es variada, mientras se mantienen otras variables independientes fijas. Este
proceso entonces observa si las variaciones de una caracterstica provocan
variaciones en la magnitud de otra caracterstica, adema s que permite explorar
las formas de estas relaciones.

Por ejemplo:
EL precio de venta depende del precio de costo de un artculo.
EL costo total depende de la produccio n total.
El tiempo de servicios de un trabajador depende de su edad.
EL consumo familiar esta en funcio n del ingreso familiar.
Este ana lisis de regresio n puede utilizarse para inferir relaciones causales entre
variables independientes y dependientes, sin embargo puede conducir a
ilusiones o falsas relaciones.

LA RECTA DE REGRESIN
Llamamos lnea de regresio n a la curva que mejor se ajusta a nube de puntos, es
una curva ideal en torno a la que se distribuyen los puntos de la nube.
Se utiliza para predecir la variable dependiente (Y) a partir de la independiente
(X).

La diferencia entre el valor real (yi) y el teo rico (yi*) se llama residuo. En
nuestro caso esta lnea es una recta que se calcula imponiendo dos condiciones:
ESTADSTICA II

Pgina 2

Debe pasar por el punto (x, y), centro de gravedad de la distribucio n.
La suma de los cuadrados de los residuos debe ser mnima.

Con esto obtenemos la ecuacio n de la RECTA de REGRESIO N de Y sobre X:

La pendiente de esta recta es el llamado COEFICIENTE de REGRESIO N=
Si lo que deseamos es predecir el valor de X, habremos de calcular otra recta de
regresio n, ana loga a la anterior, intercambiando las x con las y.
CORRELACIN
La correlacin entre dos variables busca determinar el grado de relacin que
existe entre ellas. Para determinar esta relacin se calcula por medio de los
coeficientes de correlacin (r).


Cuando representamos grficamente una distribucin bidimensional en un
sistema cartesiano obtenemos lo que llamamos diagrama de dispersin o nube
de puntos. La forma que adopta la nube de puntos nos indica el tipo y grado de
relacin o dependencia entre ambas variables.
Hablaremos de correlacin lineal cuando los datos tienden a agruparse
alrededor de una recta.
Si esta recta tiene pendiente positiva la correlacin o dependencia es directa,
incrementos positivos en una variable implican aumentos en la otra.
Si la recta tiene pendiente negativa la correlacin o dependencia es inversa, al
aumentar una disminuye la otra.
Coeficiente de correlacin lineal: Este coeficiente, llamado de Pearson, es una
medida objetiva de la correlacin lineal entre dos variables.
Su valor est entre -1 y 1.
Su signo es el de la covarianza, si r>0 la correlacin es directa, si r<0 inversa.
Si se aproxima a -1 o a 1 la correlacin es fuerte, si est prximo a 0 es dbil.
Cuando vale -1 o 1 es perfecta, los puntos estn situados en una recta.

ESTADSTICA II

Pgina 3

TEORA DE REGRESIN Y CORRELACIN
APLICACIONES

1.- TEORA DE REGRESIN
En te rminos de estadstica los conceptos de regresio n y ajuste con lneas
paralelas son sino nimos lo cual resulta estimar los valores de la variable
dependiente (Y) correspondiente a los valores dados de la variable
independiente (X), por lo que si se estima el valor de "Y" a partir de "X"
decimos que se trata de una curva de regresio n de "Y" sobre "X". Ejemplo.- El
peso depende de la estatura, el consumo del ingreso etc.

1.2 DIAGRAMA DE DISPERSIN.-
Es una gra fica en el eje cartesiano en la que cada punto trazado representa los
valores de las variables (X, Y) y el cual nos permite encontrar la curva de mejor
ajuste por los distintos me todos de aproximacio n como ser: Me todo de mano
alzada, me todo libre, me todo semi-promedio y el me todo de los mnimos
cuadrados.
Ejemplo.- Dados los gasto de publicidad en los meses enero a julio los cuales
general los sgts. Ingresos:



A) MTODO DE MANO ALZADA (Mtodo Grfico).-
Consiste en utilizar como referencia el diagrama de dispersio n e identificar
la funcio n de acuerdo a la tendencia de los puntos de la gra fica.
Observacin.- En la gra fica podemos identificar las desviaciones de los puntos
con respecto a la recta. La desventaja de este me todo consiste en la
dependencia existente entre ambas variables ya que si aumentan los valores de
X, tambie n lo hara n los valores de Y.

B) MTODO LIBRE.-

Consiste en ajustar una recta a una curva de tendencia mediante la observacio n
del gra fico. Los puntos que servira n de base para establecer la funcio n deseada
ESTADSTICA II

Pgina 4

sera n escogidos por el observador. Mediante el diagrama de dispersio n
observamos que se trata de una funcio n lineal (Por la forma de los puntos de
"X, Y").



C) MTODO SEMIPROMEDIO.-

Consiste en agrupar los datos en dos estratos preferiblemente iguales y lograr
dos puntos en el gra fico para trazar una recta de tendencia. Este me todo nos
permite trazar funciones lineales para cada semipromedio y luego resolver
mediante el sistema lineal deseado.



D) MTODO DE LOS MNIMOS CUADRADOS.-

Al realizar un ana lisis lo gico entre las variables es necesario determinar el tipo
de funcio n matema tica que representa la relacio n entre ellas, para lo cual se
debe ajustar la recta o curva de regresio n en base a la forma que representa la
gra fica. La curva de mejor ajuste se la puede realizar por el me todo de los
mnimos cuadrados aplicando a diferentes tipos de funciones tal como ser:
Funcio n Lineal, Parabo lica, Potencial, Exponencial, etc.


ESTADSTICA II

Pgina 5

Funcin lineal o recta de regresin de los mnimos cuadrados.- Si
al observar el diagrama de dispersio n notamos un comportamiento
rectilneo, el ajuste de la recta de regresio n de los mnimos cuadrados se
lo realiza de la forma siguiente:

Funcin parablica de regresin de los mnimos cuadrados.- Las
relaciones lineales se la pueden adaptar a diferentes tipos de curva. El
ajuste correspondiente se lo realiza de la siguiente forma:



ESTADSTICA II

Pgina 6

Funcin Potencial.- Es muy utilizada en proyecciones, por su flexibilidad
se la conoce como funcio n de elasticidad por lo que es muy sensible al
comportamiento en el diagrama de dispersio n. Su expresio n matema tica
es la siguiente:

Funcin Exponencial.- Cuando se desea calcular tasas de crecimiento,
tomando en cuenta los puntos observados en el perodo histo rico, se
recurre a la siguiente funcio n:



ESTADSTICA II

Pgina 7

2.-TEORA DE CORRELACIN

Una de las principales dificultades que nos presenta la regresio n es la
confiabilidad en la funcio n utilizada, para lo cual recurrimos a otro tipo de
ana lisis denominado me todo de Correlacio n el cual determina el grado de
relacio n existente entre las variables y el efecto producido por el cambio de
una variable con respecto de la otra.

TIPOS DE CORRELACIN

El tipo de Correlacio n debe ser analizado en el diagrama de dispersio n en base
a la forma que toma la curva de la funcio n y a la relacio n entre las variables.
Cuando el ana lisis se basa en el estudio de dos variables se denomina
Correlacio n simple, cuando se analizan ma s variables se las denomina
Correlacio n mu ltiple.



MEDIDAS DE CORRELACIN

Se utiliza para determinar el grado de Correlacio n existente entre las variables
observadas, mediante los siguientes indicadores.

A) VARIANZA GENERAL.- Es utilizada para la determinacio n del coeficiente
de Correlacio n y se obtiene sumando la varianza no
explicada con la varianza explicada.

(Yi-y)
2
= (Yi-y*)
2
+ (Y*-y)
2

VAR.TOTAL = VAR. NO EXPLIC.+ VAR. EXPLIC.
2103,71 = 9,75 + 2094,38

Ejemplo.-En base a la funcio n lineal Y= 11.36X 2,22 establecer si dicha
funcio n puede ser confiable.

ESTADSTICA II

Pgina 8



B) COEFICIENTE DE DETERMINACIN.- Es el cociente de la variacio n
explicada y la variacio n general y es de gran utilidad para la
determinacio n del coeficiente de Correlacio n. Su expresio n matema tica
esta dada por:

r
2
= VARIACION EXPLICADA = (Y*-y)
2
=2094,38 = 0,9956
VARIACION TOTAL (Yi-y)
2
2103,71


C) COEFICIENTE DE CORRELACIN.- Es la raz cuadrada del cociente de
los valores calculados y los valores estimados. Su valor esta
comprendido entre (-1) y (+1) determinando la correlacio n positiva o
negativa; el valor cero significa que existe una gran correlacio n entre las
variables.


D) ERROR TIPICO DE LA ESTIMA.- Es la sumatoria de los desvos
cuadra ticos de las variables observadas y estimadas. El error tpico tiene
propiedades ana logas a las de la desviacio n tpica ya que poseen similar
expresio n matema tica.

E) MARGEN DE SEGURIDAD (Intervalos de Confianza).- Nos ayuda a
determinar el grado de confianza en la utilizacio n de una funcio n
determinada y se calcula sumando y restando a los valores ma ximos y
mnimos de (Y*), el valor del error tpico de la estima, con lo cual se
obtienen dos lneas paralelas.


ESTADSTICA II

Pgina 9


F) MARGEN DE ERROR Y MARGEN DE CONFIANZA.- Se denomina margen
de error al cociente de dividir los valores del nu mero de observaciones
que han quedado fuera del margen de seguridad entre el nu mero total
de observaciones.
Margen de confianza es el cociente entre las observaciones que han
quedado dentro del margen de seguridad y el nu mero total de
observaciones.
El margen de confianza debe ser superior al 60% para que tengamos la
seguridad que utilizamos una curva de mejor ajuste de regresio n. Si el
margen de seguridad no fuese superior al 60% la curva de regresio n
debe ser ajustada a otro tipo de funcio n. Ambos ma rgenes deben ser
expresados en te rminos porcentuales y la suma de ambos debe dar
como resultado el 100%.

Interpretacin.- Existe un 71,43% de confianza que la funcio n lineal de
regresio n de los mnimos cuadrados Y= 11,36X-2,22 es la ma s confiable,
al cumplir con la siguiente condicio n:
MC>60%

ESTADSTICA II

Pgina 10

BIBLIOGRAFA
http://eeduc.files.wordpress.com/2008/02/correlacion-y-regresion-lineales.pdf
http://www.fao.org/docrep/003/x6845s/x6845s02.htm
http://recursostic.educacion.es/descartes/web/materiales_didacticos/Correlacion_re
gresion_recta_regresion/correlacion_y_regresion.htm