4 Concordancia.
A veces sabemos que dos variables X e Y, son independientes. No obstante, se desea saber si
en sus variaciones existe una cierta concordancia.
Por ejemplo dos profesores corrigen un mismo examen a un mismo grupo de alumnos, de
manera independiente de tal forma que uno no conoce las calificaciones del otro. Sera
interesante conocer si existe concordancia entre las variaciones que se producen.
5 Covariacin Causal.
Hay veces que entre dos variables se observa una sincronizacin de la que pudiera deducirse
una asociacin o dependencia entre dichas variables. No obstante dicha covariacin o
dependencia puede ser accidental o casual.
A esta conclusin se llega cuando se sabe a ciencia cierta que no existe dicha relacin entre
dichas variables.
Es conveniente resaltar que el tipo de relacin observada entre dos variables no se deduce de
los datos estadsticos de que se disponga; el decir a cul l de los cinco tipos de covariacin
pertenece el caso que estemos estudiando depende del conocimiento previo que tengamos de
ambas variables.
La estadstica lo que hace es por medio de tcnicas numricas cuantificar y formalizar
matemticamente la relacin si existe, para poder explicarla, y poder realizar predicciones.
Peso en Kg.
En primer lugar vamos a centrar un poco el tema, con unos ejemplos grficos.
Para empezar a entender el problema vamos a ver un ejemplo, tomamos los pesos y alturas
correspondientes al grupo de clase.
Como podemos observar en el diagrama de dispersin, la nube de puntos tiene una cierta
tendencia hacia arriba, es decir, al aumentar la altura tiende a aumentar el peso
El problema que estudiamos tiene dos aspectos fundamentales:
Primer aspecto. Existe dependencia entre las variables?
Es decir, queremos saber si existe una cierta covariacin conjunta entre las dos variables, y
determinar el grado de dependencia que existe entre las dos variables y por supuesto reflejado
numricamente.
Segundo aspecto Podemos encontrar una recta que se pueda ajustar lo ms posible a la
nube de puntos?
Una vez decidido si existe o no esa dependencia entre las variables es importante saber si
podemos encontrar una recta que nos d una buena aproximacin de la nube de puntos y
que nos sirva, por tanto, para hacer predicciones.
La correlacin responde a este primer aspecto, mientras la regresin responde al segundo
aspecto. Pero no adelantemos acontecimientos y vayamos poco a poco.
x x
i
Peso en Kg.
En este tema nos vamos a centrar en la correlacin y regresin lineal. Aunque quedan
sentadas las bases para poder entender lo que sera una correlacin no lineal y una regresin
no lineal, buscando otras curvas matemticas que se ajusten mejor que la recta a la nube de
Vamos a trazar unos ejes que pasen
Relacin entre las alturas y
por el centro de la distribucin x , y
pesos
100
y vamos a calcular las diferencias que
90
existen con respecto a estos ejes de
80
cada punto de la nube con lo que
70
60
tendremos las siguientes diferencias.
50
40
150
160
170
180
Alura en cm.
Altura en cm
156
159
164
165
168
169
170
172
172
173
175
178
178
180
180
182
puntos.
Peso en Kg.
45
47
62
60
75
57
70
63
65
60
60
63
65
65
80
91
190
y2
n12
n22
n32
y3
n13
n23
n33
ym
n1m
n2m
n3m
nn1
n1
n1
n2
n3
n3
nm
Marginal de x
x1
x2
x3
xn
nn2 nn3
nn.m
n2 n3
nn
Marginal de y
Donde nij representa la frecuencia absoluta del punto (x i , yj) y donde ni y nj son las
correspondientes distribuciones marginales de x e y respectivamente. Que corresponde a las
distribuciones de ambas variables si las considersemos como variables unidimensionales.
n x x y y
S
N
n ,m
xy
xy
ij
i , j 1
n x y
S N x y
n.m
xy
xy
i , j 1
ij
y
nxij. i y xi yx jx y
n,m nxxij i yj y n,m j
j
Sxyxy
i,j1
i,j1