Anda di halaman 1dari 17

UNIVERSIDAD AUTÓNOMA DE BAJA

CALIFORNIA

Correlación y Regresión Lineal


Simple
Materia:
Estadística Inferencial
Introducción
 El análisis de correlación lineal (ACL) y el análisis de
regresión lineal (ARL) forman la pareja de técnicas más
“populares” para estudiar la existencia de una relación
lineal entre dos variables de naturaleza cuantitativa.

 El ACL estudia la intensidad y la dirección de la relación


lineal entre dos variables de naturaleza cuantitativa.

 El ARL ayuda en la predicción de los valores de una


variable cuantitativa (llamada dependiente) cuando se conoce
el valor de otra variable cuantitativa (llamada independiente)
con la que tiene una relación de tipo lineal.
2
Parámetros a conocer!
 El análisis de correlación es un grupo de técnicas estadísticas
usadas para medir la fuerza de la asociación entre dos
variables.
 Un diagrama de dispersión es una gráfica que representa la
relación entre dos variables.
 La variable dependiente es la variable que se predice o calcula y
se denota con la letra Y.
 La variable independiente proporciona las bases para el cálculo.
Es la variable de predicción y se denota con la letra X.
 Se dice que dos variables están relacionadas, si los cambios
producidos (causa) en la variable independiente producen un
3
efecto en la variable dependiente.
Análisis de Correlación
 El proceso para determinar el grado de relación
lineal se puede resumir en los siguientes pasos:
 Elaboración del diagrama de dispersión.
 Inspección del diagrama en busca de una relación lineal.
 Cálculo de la covarianza entre las dos variables.
 Cálculo de las desviaciones estándar.
 Cálculo del coeficiente de correlación.

4
Diagramas de Dispersión
 Consiste en la representación en ejes de coordenadas de
los puntos correspondientes a los pares de valores de
cada individuo.
 Las notas de 12 alumnos de una clase en Matemáticas y Física
son las siguientes:
Matemáticas 2 3 4 4 5 6 6 7 7 8 10 10
Física 1 3 2 4 4 4 6 4 6 7 9 10

Grafica de Dispersión
12

10

6
Coordenadas Xi, Yi
4

2
5 0
0 2 4 6 8 10 12
Calculo de la Covarianza
 La covarianza entre dos variables cuantitativas, nos indica si la
posible relación entre dos variables es directa o inversa. La
covarianza muestral se calcula de la siguiente manera:
σ𝒏
𝒊=𝟏 𝒇𝒊 ∗𝒙𝒊 ∗𝒚𝒊
𝝈𝒙𝒚 = ഥ∗𝒚
− 𝒙 ഥ
𝒏
 Si la covarianza es negativa, entonces la relación es inversa.
 Si la covarianza es positiva, entonces la relación es directa.
 Si la covarianza es cero, entonces la relación es nula (no
relacionados).
 El signo de la covarianza nos dice si el aspecto de la nube de
puntos es creciente o no, pero no nos dice nada sobre el grado de
relación entre las variables.
6

 Un largo curso de introducción a la sociología, un profesor administra dos
exámenes. El profesor quiere determinar si las calificaciones obtenidas por los
estudiantes en el segundo examen están correlacionadas con la calificaciones del
primero. Para facilitar los cálculos se elige una muestra de ocho estudiantes. Sus
calificaciones se presentan en la siguiente tabla:
Grafica de Dispersion
Examen 1 (Xi) Examen 2 (Yi) Xi * Yi 110

100
60 60 3600
90

Examen 2 Yi
75 100 7500 80

70
70 80 5600 Coordenadas Xi,Yi
60

72 68 4896 50

40
54 73 3942 50 55 60 65 70 75 80 85 90
Examen 1 Xi
83 97 8051
𝟓𝟓𝟗 𝟔𝟓𝟑

𝒙= = 𝟔𝟗. 𝟖𝟖 ഥ=
𝒚 = 𝟖𝟏. 𝟔𝟑
80 85 6800 𝟖 𝟖

65 90 5850 𝟒𝟔, 𝟐𝟑𝟗


𝝈𝒙𝒚 = − 𝟔𝟗. 𝟖𝟖 ∗ 𝟖𝟏. 𝟔𝟑 = 𝟕𝟓. 𝟓𝟕
7 559 653 46,239 𝟖
El coeficiente de correlación (r)
 El coeficiente de correlación (r) es una medida de la
intensidad de la relación lineal entre dos variables.

 Requiere datos de nivel de razón.

 Puede tomar cualquier valor de -1.00 a 1.00.

 Los valores de -1.00 o 1.00 indican la correlación perfecta y


fuerte.

 Los valores cerca de 0.0 indican la correlación débil.

 Los valores negativos indican una relación inversa y los


valores positivos indican una relación directa.
8
Tipos de Correlación
 Correlación directa
 La correlación directa se da cuando al aumentar una de las
variables la otra aumenta.
 La recta correspondiente a la nube de puntos de la distribución
es una recta creciente.

9
Tipos de Correlación
 Correlación inversa
 La correlación inversa se da cuando al aumentar una de las
variables la otra disminuye.
 La recta correspondiente a la nube de puntos de la distribución
es una recta decreciente.

10
Tipos de Correlación
 Correlación nula
 La correlación nula se da cuando no hay dependencia de ningún
tipo entre las variables.
 En este caso se dice que las variables son incorreladas y la nube
de puntos tiene una forma redondeada.

11
Grados de Correlación
 Correlación fuerte
 La correlación será fuerte cuanto más cerca estén los puntos de
la recta.

12
Grados de Correlación
 Correlación débil
 La correlación será débil cuanto más separados estén los puntos
de la recta.

13

 El siguiente diagrama resume el análisis de coeficiente de
correlación entre dos variables:

14
Calculo del coeficiente de
correlación lineal
 El coeficiente de correlación lineal es el cociente entre la
covarianza y el producto de las desviaciones típicas de ambas
variables.

 El coeficiente de correlación lineal se expresa mediante la letra r:


𝝈𝒙𝒚
𝒓=
𝝈𝒙 ∗ 𝝈𝒚
 El signo del coeficiente de correlación es el mismo que el de la
covarianza.
 Si la covarianza es positiva, la correlación es directa.
 Si la covarianza es negativa, la correlación es inversa.
 Si la covarianza es nula, no existe correlación.

15

 Un largo curso de introducción a la sociología, un profesor administra dos
exámenes. El profesor quiere determinar si las calificaciones obtenidas por los
estudiantes en el segundo examen están correlacionadas con la calificaciones del
primero. Para facilitar los cálculos se elige una muestra de ocho estudiantes. Sus
calificaciones se presentan en la siguiente tabla:

Examen 1 Examen 2
Xi * Yi 𝑥𝑖2 𝑦𝑖2
Grafica de Dispersion
(Xi) (Yi)
110
60 60 3600 3600 3600
100
75 100 7500 5625 10000
90

Examen 2 Yi
70 80 5600 4900 6400
80
72 68 4896 5184 4624
70
54 73 3942 2916 5329 60
Coordenadas Xi,Yi
83 97 8051 6889 9409 50
80 85 6800 6400 7225 40
65 90 5850 4225 8100 50 55 60 65 70 75 80 85 90
559 653 46239 39739 54687 Examen 1 Xi

559 653 39,739


𝑥ҧ = = 69.88 𝑦ത = = 81.63 𝜎𝑥2 = − 69.882 = 84.16 𝜎𝑥 = 84.16 = 9.17
8 8 8

46,239 54,687
𝜎𝑥𝑦 = = 69.88 ∗ 81.63 = 75.57 𝜎𝑦2 = − 81.632 = 172.42 𝜎𝑦 = 172.42 = 13.13
8 8
75.57
Correlación Positiva Fuerte 𝑟= = 0.63
16 9.17 ∗ 13.13
Coeficiente de Determinación
 El coeficiente de determinación (R2) es la proporción de
la variación total en la variable dependiente (y) que se
explica por la variación en la variable independiente (x).

 Es el cuadrado del coeficiente de correlación.


 Su rango es de 0 a 1.
 No da ninguna información sobre la dirección de la relación entre las
variables.
R2 = (r2)*100

17

Anda mungkin juga menyukai