Anda di halaman 1dari 5

Tema 2: Distribuciones Bidimensionales

2.1 Introduccin a la Dependencia estadstica.


2.2 Variables cuantitativas:
2.2.1 Anlisis de la correlacin.
2.2.2 Rectas de regresin.
2.1 Introduccin a la Dependencia estadstica.
En el tema anterior hemos estudiado caractersticas de una sola variable (medias,
desviaciones, cuartiles) Vamos a estudiar ahora dos o ms variables, pero no aisladamente
cada una de ellas, pues esto nos conducira a repetir el estudio a cada variable como ya vimos
en el tema anterior. Nos referimos al estudio conjunto de ambas variables, para poder estudiar
o determinar si existe alguna relacin o dependencia entre ellas.
Vamos a hablar principalmente de dos conceptos fundamentales. regresin y correlacin.
De la vida ordinaria pueden tomarse algunos ejemplos en los que puede apreciarse que ciertas
variables se mueven o varan con una sincronizacin ms o menos intensa. Para expresar esta
variacin conjunta o sincronizacin, emplearemos el trmino de covariacin. La eleccin de
sta palabra es porque permite incluir los cinco casos distintos que se exponen a continuacin.
Para el caso de dos variables que notaremos por X e Y.
1 Dependencia causal unilateral.
Esto se da cuando una variable influye en la otra, pero no al contrario. Por ejemplo la cantidad
de lluvia (X) influye en el rendimiento de la cosecha (Y), pero el rendimiento de la cosecha
(Y) no influye sobre la cantidad de lluvia.
En esta forma de dependencia, la variable X se denomina independiente explicativa la
variable Y se denomina dependiente explicada.
2 Interdependencia.
En este caso la influencia entre X e Y es recproca y se produce por lo tanto en dos
direcciones. Hay pues dependencia bilateral o independencia.
Un ejemplo de esto es la relacin entre el precio al que se vende un determinado producto y
la cantidad demandada de dicho producto. Se sabe que el precio influye en la demanda, pero
que tambin la cantidad de producto influye en el precio.
3 Dependencia indirecta.
Dos variables X e Y pueden mostrar una covariacin conjunta, debido a la influencia de una
tercera variable Z que influye sobre las dos.
Por ejemplo si medimos en una variable X la longitud del Pie de un nio y en una variable Y
su capacidad lectora, observaremos que a un mayor tamao de pie corresponde una mejor
capacidad lectora. Esto es debido que la variable Z = edad del nio influye tanto en el
crecimiento del pie como en su capacidad para leer.

4 Concordancia.
A veces sabemos que dos variables X e Y, son independientes. No obstante, se desea saber si
en sus variaciones existe una cierta concordancia.
Por ejemplo dos profesores corrigen un mismo examen a un mismo grupo de alumnos, de
manera independiente de tal forma que uno no conoce las calificaciones del otro. Sera
interesante conocer si existe concordancia entre las variaciones que se producen.
5 Covariacin Causal.
Hay veces que entre dos variables se observa una sincronizacin de la que pudiera deducirse
una asociacin o dependencia entre dichas variables. No obstante dicha covariacin o
dependencia puede ser accidental o casual.
A esta conclusin se llega cuando se sabe a ciencia cierta que no existe dicha relacin entre
dichas variables.
Es conveniente resaltar que el tipo de relacin observada entre dos variables no se deduce de
los datos estadsticos de que se disponga; el decir a cul l de los cinco tipos de covariacin
pertenece el caso que estemos estudiando depende del conocimiento previo que tengamos de
ambas variables.
La estadstica lo que hace es por medio de tcnicas numricas cuantificar y formalizar
matemticamente la relacin si existe, para poder explicarla, y poder realizar predicciones.

2.2 Variables cuantitativas:


Vamos a estudiar la covariacin que existe entre dos variables cuantitativas. Dejaremos para
ms adelante el estudio de la dependencia cuando una o las dos variables son cualitativas, en
las que obviamente las tcnicas a emplear deben ser distintas.

Peso en Kg.

En primer lugar vamos a centrar un poco el tema, con unos ejemplos grficos.

Relacin entre las alturas y


pesos
100
90
80
70
60
50
40
150 160 170 180 190
Alura en cm.

Para empezar a entender el problema vamos a ver un ejemplo, tomamos los pesos y alturas
correspondientes al grupo de clase.

Como podemos observar en el diagrama de dispersin, la nube de puntos tiene una cierta
tendencia hacia arriba, es decir, al aumentar la altura tiende a aumentar el peso
El problema que estudiamos tiene dos aspectos fundamentales:
Primer aspecto. Existe dependencia entre las variables?
Es decir, queremos saber si existe una cierta covariacin conjunta entre las dos variables, y
determinar el grado de dependencia que existe entre las dos variables y por supuesto reflejado
numricamente.
Segundo aspecto Podemos encontrar una recta que se pueda ajustar lo ms posible a la
nube de puntos?
Una vez decidido si existe o no esa dependencia entre las variables es importante saber si
podemos encontrar una recta que nos d una buena aproximacin de la nube de puntos y
que nos sirva, por tanto, para hacer predicciones.
La correlacin responde a este primer aspecto, mientras la regresin responde al segundo
aspecto. Pero no adelantemos acontecimientos y vayamos poco a poco.

x x
i

Peso en Kg.

En este tema nos vamos a centrar en la correlacin y regresin lineal. Aunque quedan
sentadas las bases para poder entender lo que sera una correlacin no lineal y una regresin
no lineal, buscando otras curvas matemticas que se ajusten mejor que la recta a la nube de
Vamos a trazar unos ejes que pasen
Relacin entre las alturas y
por el centro de la distribucin x , y
pesos
100
y vamos a calcular las diferencias que
90
existen con respecto a estos ejes de
80
cada punto de la nube con lo que
70
60
tendremos las siguientes diferencias.
50
40
150

160

170

180

Alura en cm.

Altura en cm
156
159
164
165
168
169
170
172
172
173
175
178
178
180
180
182

puntos.

Peso en Kg.
45
47
62
60
75
57
70
63
65
60
60
63
65
65
80
91

190

En primer lugar vamos a centrarnos en la bsqueda del coeficiente de correlacin.


Queremos un coeficiente que nos d una idea de la variacin conjunta de las dos variables.
Luego vamos a explicar un poco lo que pretendemos. Por lo que vamos a ver las siguientes
situaciones: (insertar grficos escnaeados)
La correlacin va a ser mayor cunto ms se aproximen los puntos a las curva.
Si sumamos esos productos y los dividimos por el tamao de la muestra obtenemos la
covarianza.
Antes de seguir, en primer lugar vamos a analizarlos tipos de tablas con los que vamos a
trabajar. Nos podemos encontrar fundamentalmente con dos tipos de tablas, segn el nmero
de datos. Cuando el nmero de datos es pequeo la informacin puede venir dada como en el
ejemplo que estamos estudiando, es decir, una tabla en la que aparecen los datos punto a
punto, pero cuando el tamao de la muestra es grande, en la mayora de los casos, entonces
los datos vendrn tabulados en una tabla de doble entrada.
y1
n11
n21
n31

y2
n12
n22
n32

y3
n13
n23
n33

ym
n1m
n2m
n3m

nn1
n1

n1
n2
n3
n3
nm

Marginal de x

x1
x2
x3

xn

nn2 nn3
nn.m
n2 n3
nn
Marginal de y
Donde nij representa la frecuencia absoluta del punto (x i , yj) y donde ni y nj son las
correspondientes distribuciones marginales de x e y respectivamente. Que corresponde a las
distribuciones de ambas variables si las considersemos como variables unidimensionales.

n x x y y
S
N

n ,m

xy

xy

ij

al igual que en el caso de la varianza, esta

i , j 1

n x y
S N x y
n.m

medida podemos calcularla usando otra expresin.

Para ello basta con desarrollar la primera expresin.

xy

xy

i , j 1

ij

y
nxij. i y xi yx jx y
n,m nxxij i yj y n,m j
j
Sxyxy

i,j1

i,j1

Anda mungkin juga menyukai