Anda di halaman 1dari 21

Universidad Nacional Tecnológica de Lima Sur

Facultad de Ingeniería y Gestión


Escuela de Ingeniería de Sistemas

Estadística General
Correlación lineal

Mg. Myrna Manco Caycho


Estudio conjunto de dos variables cuantitativas
 En una muestra o en una Estatura Peso
población es posible estudiar a Individuo (cm) (Kg)
los individuos (unidades 1 162 61
estadísticas) atendiendo a la 2 154 60
variación simultánea de dos o 3 180 78
más características. 4 158 62
5 171 66
6 169 60
 Ejemplo: Estudiar la relación entre 7 166 54
la estatura y el peso de un 8 176 84
conjunto de individuos. 9 163 68
… ... ...

 Objetivo:
Determinar la relación entre las
variables 2
Diagrama de dispersión o nube de puntos

Tenemos las alturas y los pesos de 30 individuos representados en un


diagrama de dispersión.

100
90
Pesa 76 kg.
80
Peso

70

Mide 187 cm.


60
Pesa 50 kg.
50
40
Mide 161 cm.
30
140 150 160 170 180 190 200

Estatura
3
Relación entre variables.
¿Existe alguna relación entre las variables?

100
90
80
70
60
50
40
30
140 150 160 170 180 190 200

4
 Se desea saber
si existe
relación entre la
calificación
promedio y el
salario inicial
(u.m.) de los
recién
graduados. Se
recolectaron los
siguientes
datos:
Elabore el diagrama de dispersión. Comente
5
Elabore el diagrama de dispersión. Comente

Myrna Manco C. 6
 Se hace un estudio para determinar las edades
(años) de un gran grupo de máquinas de una fábrica
y las eficiencias de las máquinas (%). Los datos se
dan en la siguiente tabla:

Tiempo de 2 4 11 9 4 6 7 8
vida
Eficiencia 90 65 25 40 80 60 35 50

Representar los datos en un diagrama de dispersión.


Calcule el coeficiente de correlación entre las dos
variables
7
Relaciones lineales
100
80
90 Fuerte relación 70 Cierta relación
80 directa. 60 inversa
70 50

60 40
30
50
20
40
10
30 0
140 150 160 170 180 190 200 140 150 160 170 180 190 200

Relación lineal directa.


Relación lineal inversa o negativa
110
330

280 No existe relación 100

90

230
80

180 70

130 60

50
80
40
30
30
Y
140 150 160 170 180 190 200 -8 -6 -4 -2 0 2 4 6 8

No existe relación lineal


8
Medir la intensidad de la relación

100
(Xi, Yi)
90

80

70

y 60

50

40 (Xi, Yi)

30
140 150 160 170 180 190 200
x

9
Covarianza de dos variables X e Y
 La covarianza entre dos variables, Sxy, nos indica si
la posible relación entre dos variables es directa o
inversa.

Sxy  (xi  x)( yi  y)


 Directa: Sxy >0 1
 Inversa: Sxy <0
 Incorreladas: Sxy =0
n i
 El signo de la covarianza nos dice si el aspecto de la
nube de puntos es creciente o no, pero no nos dice
nada sobre el grado de relación entre las variables.

10
Coeficiente de correlación lineal de Pearson

 El coeficiente de correlación lineal de Pearson de Sxy


dos variables, r, nos indica si los puntos tienen una
tendencia a disponerse alineadamente r
(excluyendo rectas horizontales y verticales). Sx Sy
 tiene el mismo signo que Sxy por tanto de su signo
obtenemos el que la posible relación sea directa o
inversa.

 r es útil para determinar si hay relación lineal entre


dos variables, pero no servirá para otro tipo de
relaciones (cuadrática, logarítmica,...)

11
Propiedades de r
 Es adimensional
 Relación lineal perfecta entre dos variables  r=+1 o r=-1
 Excluimos los casos de puntos alineados horiz. o verticalmente.
 Cuanto más cerca esté r de +1 o -1 mejor será el grado de
relación lineal.
 Siempre que no existan observaciones anómalas.

Relación Relación
Variables
inversa directa
incorrelacionadas
perfecta perfecta
12
Aplicación: Botes inflables
 Los adelantos tecnológicos han hecho
posible fabricar botes inflables. Estos botes Baggage
de goma inflables, que pueden enrollarse Boat Capacity Price ($)
formando un paquete no mayor que una
S14 4 1595
bolsa de golf, tienen tamaño suficiente para
dos pasajeros con su equipo de Orinoco 4 1399
excursionismo. La revista Canoe & Kayac
Outside Pro 4 1890
probó los botes de nueve fabricantes para
ver su funcionamiento en un recorrido de
tres días. Uno de los criterios de evaluación Explorer 380X 3 795
fue su capacidad para equipaje que se
evaluó utilizando una escala de 4 puntos, River XK2 2.5 600
siendo 1 la puntuación más baja y 4 la Sea Tiger 4 1995
puntuación más alta. Los datos siguientes
muestran la evaluación que obtuvieron Maverik II 3 1205
respecto a capacidad para equipaje y los Starlite 100 2 583
precios de los botes.
Fat Pack Cat 3 1048
 Archivo: Boats

13
Estrés y mecanismos de afrontamiento
En la tabla inferior se muestran las puntuaciones recogidas a
partir de una muestra de 27 sujetos en una escala
observacional de estrés y en un test orientado a evaluar la
utilización de mecanismos de afrontamiento. El rango de
puntuaciones en ambas variables puede oscilar entre 0 a
100, significando puntuaciones más altas mayor estrés y
mayor capacidad de utilización de mecanismos de
afrontamiento, respectivamente.

(a) Elabore el diagrama de dispersión. Comente


14
En una fábrica de combustible se hizo un
estudio en 15 vehículos de la misma
marca y modelo para relacionar la
velocidad (x) en km/h con el gasto de
combustible (y) en litros por kilómetro,
la cual se muestra en la siguiente tabla:

a) Si una vehículo gasta 1 litro por


kilómetro, ¿A qué velocidad debe correr
aproximadamente para lograr ese
consumo?
b) ¿Qué gasto de combustible puede
esperarse de un vehículo cuando corra
a la velocidad de 40 km/h?
c) Calcular r.

15
Se realizó una encuesta en diferentes
ciudades importantes de un país para
relacionar el grado de
contaminación ambiental (x) en imecas
con el porcentaje de población afectado
de las vías respiratorias (y), la cual se
muestra en la siguiente tabla:

a) Si una población alcanza 150 imecas,


¿Qué porcentaje de su `población es de
esperarse que padezca de las vías
respiratorias?
b) Si una población tiene el 60% de
enfermos de las vías respiratorias, ¿Qué
grado de contaminación
es de suponerse que tenga?
c) Calcular r.
16
Coeficiente de correlación de rangos de Spearman

(Londres, 1863-1945) Psicólogo británico. Spearman


desarrolló la técnica estadística conocida como análisis
factorial. También aportó el coeficiente de correlación ordinal
que lleva su nombre, que permite correlacionar dos variables
por rangos en lugar de medir el rendimiento separado en
cada una de ellas.

Charles Edward Spearman

Este coeficiente es una medida de asociación lineal que utiliza los rangos,
números de orden, de cada grupo de sujetos y compara dichos rangos. Se
puede aplicar a variables ordinales.

Fórmula

en donde di es la diferencia entre los rangos de X e Y.

𝑑𝑖 = 𝑟𝑥𝑖− 𝑟𝑦𝑖
Myrna Manco C. 17
Ejemplo
Sean los Rangos:
2
datos: 𝑟𝑥𝑖 𝑟𝑦𝑖 𝑑𝑖 2
= 𝑟𝑥𝑖− 𝑟𝑦𝑖

Myrna Manco C. 18
Myrna Manco C. 19
Myrna Manco C. 20
 Revisar ejercicios en
 https://www.monografias.com/trabajos85/coeficiente-correlacion-rangos-
spearman/coeficiente-correlacion-rangos-
spearman.shtml#targetText=Este%20coeficiente%20se%20emplea%20c
uando,y%20peso%20de%20los%20atletas.

Myrna Manco C. 21

Anda mungkin juga menyukai