Anda di halaman 1dari 2

5.

3 Regresin y correlacin Regresin De una forma general, lo primero que suele hacerse para ver si dos variables aleatorias estn relacionadas o no (de ahora en adelante las llamaremos X e Y, denotando con Y a la variable dependiente, y X a la variable independiente o regresora), consiste en tomar una muestra aleatoria. Sobre cada individuo de la muestra se analizan las dos caractersticas en estudio, de modo que para cada individuo tenemos un para de valores (xi, yi) (i=1,...,n). Seguidamente, representamos dichos valores en unos ejes cartesianos, dando lugar al diagrama conocido como diagrama de dispersin o nube de puntos. As, cada individuo vendr representado por un punto en el grfico, de coordenadas, xi, yi. De esa forma, podremos obtener una primera idea acerca de la forma y de la dispersin de la nube de puntos. Al dibujar la nube de puntos, podemos encontrarnos, entre otros, los casos a los que hace referencia la figura 6.1. En primer lugar deberemos distinguir entre dependencia funcional y dependencia estocstica. En el primer caso la relacin es perfecta: Y=f(X) (ver figura 6.1d y e); es decir, los puntos del diagrama de dispersin correspondiente, aparecen sobre la funcin Y=f(X). Por ejemplo, el caso de la figura 6.1d sera Y=a+bX. Sin embargo, lo que suele ocurrir es que no existe una dependencia funcional perfecta, sino otra dependencia o relacin menos rigurosa que se denomina dependencia estocstica (figura 6.1b y c); entonces, la relacin entre X e Y, podramos escribirla (en el caso de la figura 6.1.b) de la forma Y=a+bX+e, donde e es un error o un residual, debido por ejemplo, a no incluir variables en el modelo que sean importantes a la hora de explicar el comportamiento de Y, y cuyos efectos sean diferentes a los de X; errores aleatorios o de medida, o simplemente a que estamos especificando mal el modelo (por ejemplo, que en lugar de ser una recta, sea una parbola).

Correlacin Como hemos visto con anterioridad, al analizar las relaciones existentes entre dos variables aleatorias cuantitativas, deberemos responder a las preguntas, de si existe dependencia estocstica entre ellas y de qu grado. El anlisis de correlacin nos dar respuesta a dichas preguntas. Ejercicios: 1. Las notas obtenidas por 10 alumnos en Matemticas y en Msica son: Matemticas xi 6 4 8 5 3,5 7 5 10 5 4 Msica yi 2 5 5 6 7 6 7 9 10 10 Calcula la covarianza y el coeficiente de correlacin. Existe correlacin entre las dos variables? Cul ser la nota esperada en Msica para un alumno que hubiese obtenido un 8,3 en Matemticas?

Solucin

a) Covarianza = 3,075. Coeficiente de correlacin r = 0,92. b) Existe una correlacin positiva fuerte. c) Recta de regresin: y = 1,6 + 0,817 x La nota esperada en Msica = 8, 38 2. Cinco nias de 2, 3, 5, 7 y 8 aos de edad pesan respectivamente 14, 20, 30, 42 y 44 kg. Halla la ecuacin de la recta de regresin de la edad sobre el peso. Cul sera el peso aproximado de una nia de 6 aos?

Solucin

Ecuacin de la recta de regresin: x = 0,192 y - 0,76 Peso aproximado de una nia de 6 aos: 35,2 kg

Anda mungkin juga menyukai