Tema: “Correlación”
Nombre/ Carné
Para poder entender esta relación tendremos que analizarlo en forma gráfica:
n n n En donde:
n xi y i xi * y i R = coeficiente de
r i 1 i 1 i 1
correlación
n 2 n 2
n 2 n
2
N = número de pares
n xi xi n y i y i
i 1 i 1 i 1 i 1 ordenados
X = variable independiente
Y = variable independiente
Ejemplo:
n n n
n x y x * y
i 1 i i i 1 i i 1 i 7 * 13483 (183 * 499)
r 0.65638606
n n n 2 n 2
2 7 * 5319 (183)2 7 * 36403 ( 499)2
n x x n y y
2
i 1 i i 1 i i 1 i i 1 i
Primero tendremos que pensar que se genera una matriz, ya que, ahora
estamos juntando dos tablas de distribución de frecuencias y por ello nuestros
cálculos serán más laboriosos, por lo que les recomiendo el uso de una hoja de
calculo o al menos una calculadora con regresión para datos agrupados. De
cualquier forma aquí tambien estamos evaluando numéricamente si existe relación
entre dos variables y lo haremos con la siguiente ecuación.
k l l k
n f xi y i fx xi * fy y i
j 1 i 1 i 1 i 1
r
l l
k
2
k
2
n f x x i f x x i n f y y i f y y i
2 2
i 1 i 1 i 1 i 1
En donde podemos encontrar k como el número de clases para la variable "y" y l
para el número de clases de "x".
También podemos observar que hay varios tipos de "f" es decir, la que se
encuentra sola (sin subíndice) que nos habla de las frecuencias celdares (cada
una de las frecuencias que se encuentran en la intersección entre una columna y
un renglón) y las "f" con subíndices que representan las frecuencias de cada una
de las variables.
k l l k
n f x i y i f x x i * fy y i
j 1 i 1 i 1 i 1 48 * 5380.77 - (82.06 * 3116)
r 0.695
l l k
2
k
2
((48 * 140.8982) - 82.06 2 ) * (( 48 * 212072) - 31162 )
n f x x i f x x i n f y y i f y y i
2 2
i 1 i 1 i 1 i 1
Correlaciones parciales
El coeficiente de determinación R2
Estudiar cómo influye la estatura del padre sobre la estatura del hijo, estima
el precio de una vivienda en función de su superficie, predice la tasa de paro para
cada edad, aproximar la calificación obtenida en una materia según el número de
horas de estudio semanal, prevé el tiempo de computación de un programa en
función de la velocidad del procesador.
Determinista
Conocido el valor de X, el valor de Y queda perfectamente
establecido. Son del tipo:
y = f (x)
Ejemplo: La relación existente entre la temperatura en grados
centígrados (X) y grados Fahrenheit (Y) es:
y = 1,8x + 32
No determinista
Conocido el valor de X, el valor de Y no queda perfectamente
establecido. Son del tipo:
y = f (x) + u
Lineal
Cuando la función f (x) es lineal,
f (x) = β0 + β1x
Ausencia de Relación
Cuando f (x) = 0.
Yi = β0 + β1Xi + Ui
donde:
Y = β0 + β1X1 + · · · + βpXp + ε
Ejemplo:
Según el ajuste anterior:
Recuento = 25.7115 + 1.5818Temperatura + 1.5424Humedad.
3. Por ejemplo, considera que las variables son el ingreso familiar y el gasto
familiar. Se sabe que los aumentos de ingresos y gastos disminuyen juntos.
Por lo tanto, están relacionados en el sentido de que el cambio en cualquier
variable estará acompañado por un cambio en la otra variable.