Para medir que tan intensa es la relacin lineal se utiliza el coeficiente de correlacin de PEARSON denotado por .
Diagrama de dispersin
Correlacin Fuerte, Positiva: El valor de la variable "Y" (eje vertical) aumenta claramente con el valor de la variable "X" (eje horizontal). Correlacin Fuerte, Negativa: El valor de "Y" disminuye claramente cuando "X" aumenta.
Prueba de hiptesis acerca del parmetro (rho) Saber si X e Y estn correlacionados: Ho : = 0 H1 : 0 Estadstico de prueba es:
t n-2 =
n2
1r2
Ejemplo1 Los siguientes valores representan 15 lecturas que indican el volumen de trfico y la concentracin de monxido de carbono tomado en un laboratorio para determinar la calidad del aire de cierta ciudad. Volumen del trfico (automviles por hora) CO (PPM) (X) (Y) 100 8.8 110 9.0 125 9.5 150 10.0 175 10.5 190 10.5 200 10.5 225 10.6 250 11.0 275 12.1 300 12.1 325 12.5 350 13.0 375 13.2 400 14.5 X= 3.550 Y = 167.8 X2 = 974,450 Y2 = 1,915.36 X*Y = 41,945
16 14 12
CO (PPM)
Coeficiente de correlacin
15*41945-(3550)(167.8)
r= (15*974450- 3550)(15*1915,36- 167,8) r = 0.985
y= + *x + e
es el coeficiente de regresin
es el intercepto e: es una variable aleatoria con media 0 y varianza y/x. De preferencia e debe tener distribucin normal con sus parmetros respectivos. Para estimar la ecuacin de regresin lineal simple se recurre a una muestra aleatoria de tamao n: (x1, y1) (x2, y2) . . . (xn , yn).
Como todos los puntos no estn exactamente sobre una lnea recta, se cometen errores en el ajuste.
Estimadores Mnimo-Cuadrticos
Ejemplo 2
Una compaa farmacutica conduce un estudio piloto para evaluar la relacin entre tres dosis en un nuevo agente hipntico y tiempo de sueo. Los resultados de este estudio son presentados de la siguiente manera.
Diagrama de Dispersin
Segn el diagrama de dispersin, se espera una relacin positiva o directa entre ambas variables. Modelo estimado de regresin lineal simple:
y =a+bx
Clculos Estadsticos
Que significa b:
Por cada incremento de una unidad de dosis (agente hipntico) su respectivo tiempo de sueo promedio aumentar en 0,5 puntos.
Coeficiente de determinacin: R
Para medir el ajuste de los puntos a la recta utilizamos el coeficiente de determinacin. R*100 nos indica que porcentaje de la variabilidad de los valores de Y es explicada por la regresin. Considerando el ejemplo R=r= 81.1% y nos indica que el 81.1% de la variabilidad en los valores de tiempo de sueo es explicada por la regresin (cuando se considera dosis de un agente hipntico).