Anda di halaman 1dari 20

UNIVERSIDAD PERUNA CAYETANO HEREDIA DEPARTAMENTO DE ESTADISTICA, DEMOGRAFIA, HUMANIDADES Y CIENCIAS SOCIALES

Anlisis de Regresin y Correlacin lineal simple

Correlacin Lineal Simple


El anlisis de correlacin es un procedimiento que permite medir la asociacin o relacin lineal que puede existir entre dos variables cuantitativas, y determina su grado de relacin y sentido.

Para medir que tan intensa es la relacin lineal se utiliza el coeficiente de correlacin de PEARSON denotado por .

Diagrama de dispersin
Correlacin Fuerte, Positiva: El valor de la variable "Y" (eje vertical) aumenta claramente con el valor de la variable "X" (eje horizontal). Correlacin Fuerte, Negativa: El valor de "Y" disminuye claramente cuando "X" aumenta.

Sin correlacin lineal

El rango de variacin de es:


-1 1 = -1 Correlacin lineal perfecta inversa = 1 Correlacin lineal perfecta directa = 0 Variables incorrelacionadas linealmente. Para estimar se recurre a una muestra aleatoria de tamao n: (x1, y1) (x2, y2) . . . (xn , yn).

Coeficiente de Correlacin Simple de la muestra

Prueba de hiptesis acerca del parmetro (rho) Saber si X e Y estn correlacionados: Ho : = 0 H1 : 0 Estadstico de prueba es:

t n-2 =

n2

1r2

Ejemplo1 Los siguientes valores representan 15 lecturas que indican el volumen de trfico y la concentracin de monxido de carbono tomado en un laboratorio para determinar la calidad del aire de cierta ciudad. Volumen del trfico (automviles por hora) CO (PPM) (X) (Y) 100 8.8 110 9.0 125 9.5 150 10.0 175 10.5 190 10.5 200 10.5 225 10.6 250 11.0 275 12.1 300 12.1 325 12.5 350 13.0 375 13.2 400 14.5 X= 3.550 Y = 167.8 X2 = 974,450 Y2 = 1,915.36 X*Y = 41,945

16 14 12

CO (PPM)

10 8 6 4 2 0 0 100 200 300 400 500 Volmen del trfico Serie1

Coeficiente de correlacin
15*41945-(3550)(167.8)
r= (15*974450- 3550)(15*1915,36- 167,8) r = 0.985

Anlisis de Regresin Lineal simple


Objetivos
Establecer una relacin lineal entre una variable dependiente (Y) en funcin de una variable independiente (X). Predecir valores de Y para valores especficos de X. Las variables X e Y son de naturaleza cuantitativa y de preferencia Y debe ser continua. El modelo de regresin lineal simple en la poblacin est dado por:

y= + *x + e

Regresin Lineal Simple


Donde: Y es la variable dependiente X es la variable independiente.

es el coeficiente de regresin
es el intercepto e: es una variable aleatoria con media 0 y varianza y/x. De preferencia e debe tener distribucin normal con sus parmetros respectivos. Para estimar la ecuacin de regresin lineal simple se recurre a una muestra aleatoria de tamao n: (x1, y1) (x2, y2) . . . (xn , yn).

Lnea de Regresin estimado

Como todos los puntos no estn exactamente sobre una lnea recta, se cometen errores en el ajuste.

Estimadores Mnimo-Cuadrticos

Ejemplo 2
Una compaa farmacutica conduce un estudio piloto para evaluar la relacin entre tres dosis en un nuevo agente hipntico y tiempo de sueo. Los resultados de este estudio son presentados de la siguiente manera.

Tiempo de sueo en horas: Dosis (mM/Kg)

Diagrama de Dispersin
Segn el diagrama de dispersin, se espera una relacin positiva o directa entre ambas variables. Modelo estimado de regresin lineal simple:
y =a+bx

Clculos Estadsticos

Estimacin de la Recta de Regresin


9

Por consiguiente el modelo de Regresin Estimado es:

Que significa b:

Por cada incremento de una unidad de dosis (agente hipntico) su respectivo tiempo de sueo promedio aumentar en 0,5 puntos.

Coeficiente de determinacin: R
Para medir el ajuste de los puntos a la recta utilizamos el coeficiente de determinacin. R*100 nos indica que porcentaje de la variabilidad de los valores de Y es explicada por la regresin. Considerando el ejemplo R=r= 81.1% y nos indica que el 81.1% de la variabilidad en los valores de tiempo de sueo es explicada por la regresin (cuando se considera dosis de un agente hipntico).

Anda mungkin juga menyukai