Anda di halaman 1dari 13

2/8/2017 4.5 Medidas de dependencia.

Coeficientes de relacin

Siguiente: 4.6 Ejercicios Subir: 4. Anlisis conjunto de Anterior: 4.4 Independencia ndice General
ndice de Materias

Subsecciones

4.5.1 Variables continuas. Correlacin


4.5.1.1 Covarianza
4.5.1.2 Coeficiente de correlacin de Pearson
4.5.1.3 Coeficiente de correlacin biserial

4.5.2 Variables ordinales. Concordancia


4.5.2.1 Coeficiente de correlacin por rangos de Spearman
4.5.2.2 Coeficiente de Kendall
4.5.2.3 Coeficiente de Goodman-Kruskal

4.5.3 Atributos. Contingencia


4.5.3.1 Coeficiente

4.5.3.2 Coeficiente de contingencia


4.5.3.3 Coeficiente de Cramer
4.5.3.4 Coeficiente

4.5 Medidas de dependencia. Coeficientes de


relacin
Los trminos asociacin, correlacin, contingencia, concordancia y otros similares, se suelen utilizar como equivalentes muy a
menudo. No obstante, haciendo un uso ms correcto de la terminologa estadstica, an con significado semejante, se puede
considerar:

correlacin de variables propiamente dichas, o sea, medidas en escala de intervalo.


concordancia de ordenaciones, entendindose como tales las denominadas variables ordinales, y
asociacin o contingencia de variables nominales o atributos.
As, para clasificar los coeficientes que detectan y miden el grado de relacin, o dependencia estadstica, se ha tenido en cuenta el
tipo y la naturaleza de las variables sometidas a estudio.

4.5.1 Variables continuas. Correlacin


4.5.1.1 Covarianza
Para facilitar el estudio y la notacin de la covarianza, se introduce previamente el concepto de momentos bidimensionales.

Se define el momento de orden respecto al origen como:

http://carleos.epv.uniovi.es/~carleos/docencia/teloydisren/descriptiva+probabilidad/l_edyp/lib_edyp_html/node27.html 1/13
2/8/2017 4.5 Medidas de dependencia. Coeficientes de relacin

Es fcil ver que es la media de y que es la media de .

Por otro lado, el momento de orden respecto a la media viene dado por:

Constatndose que es cero, al igual que , que y son las varianzas de e , respectivamente, y

que es posible expresar los momentos respecto a la media en funcin de los momentos respecto al origen. En particular se da la
relacin

A se le denomina covarianza de la distribucin, denotndosele tambin por . Este coeficiente juega un importante

papel en el estudio de la relacin lineal entre las variables. Para analizar esta cuestin, se consideran las representaciones grficas
de la figura que reflejan distintas situaciones, dichas representaciones reciben el nombre de nube de puntos o, tambin,
diagrama de dispersin.

Figura: Anlisis de la
covarianza

El punto que viene determinado por la media de y la media de constituye el centro de gravedad de las nubes de puntos en
todos los casos.

Como se sabe, la covarianza viene dada por la expresin

es una medida simtrica y se puede leer como la suma de los productos de las desviaciones de por las desviaciones de

con respecto a sus medias respectivas; de tal forma, que si el signo de la desviacin de coincide con la de , como ocurre
en el primer y tercer cuadrante, se genera un sumando positivo; y cuando el signo es distinto -segundo y cuarto cuadrante- la
aportacin a la covarianza es negativa. Por tanto, la concentracin de valores en los distintos cuadrantes determina el signo y la
cuanta de . As, en los casos y de la figura , se aproxima a cero, en el caso va a ser alta y positiva, y en

el alta y negativa. Por tanto, se est en condiciones de afirmar que la covarianza detecta la relacin lineal entre las variables y
el sentido de sta, pero no distingue entre la no presencia de relacin, caso , y la existencia de alguna dependencia no lineal,
caso . De todas formas, an para el estudio de relaciones lineales la covarianza adolece de ciertos problemas, como el de venir
acompaada de las unidades de las variables y el de depender del nmero de observaciones.

4.5.1.2 Coeficiente de correlacin de Pearson


http://carleos.epv.uniovi.es/~carleos/docencia/teloydisren/descriptiva+probabilidad/l_edyp/lib_edyp_html/node27.html 2/13
2/8/2017 4.5 Medidas de dependencia. Coeficientes de relacin

Para obviar las carencias de la covarianza se introduce el coeficiente de correlacin lineal o coeficiente de correlacin de Pearson

que es una medida adimensional, ordinal, toma valores en el intervalo y tiene el signo de , por lo que cuando la

relacin lineal entre e es exacta y directa, es decir, todos los puntos se encuentran sobre una recta con pendiente positiva,
vale 1, cuando es exacta e inversa, es decir, todos los puntos se encuentran sobre una recta con pendiente negativa, vale y

cuando no hay relacin lineal 0; con un anlisis lgico para las posiciones intermedias. Cuando vale cero, se dice que las
variables estn incorreladas.

En el caso lineal, al cuadrado de se le llama coeficiente de determinacin y se le denota por , representando una medida
cardinal o cuantitativa para medir la relacin lineal entre las variables. Se estudia este coeficiente con ms detalle en el captulo
siguiente.

Se concluye este apartado indicando que la independencia implica incorrelacin, pero el recproco no siempre es cierto. Este
resultado es consecuencia de que la independencia supone la descomposicin de los momentos de orden (respecto al

origen o respecto a la media) en el producto de los momentos y ; as, y por tanto

, con lo que y las variables estn incorreladas. En sentido contrario, la

incorrelacin slo implica esa descomposicin para el momento . En cierta forma, se puede decir que la incorrelacin es

una independencia de primer orden o lineal.

Por tanto, el coeficiente de correlacin de Pearson mide el grado de relacin lineal entre dos variables cuantitativas indicando el
sentido directo o inverso de la relacin. Es el ms comn de todos los coeficientes porque es la base de otras muchas medidas de
relacin entre variables de distinta naturaleza, de hecho, a menudo se tiende a interpretar cualquier coeficiente como si del de
Pearson se tratase.

4.5.1.3 Coeficiente de correlacin biserial


Se utiliza para establecer el grado de correlacin entre dos variables cuantitativas cuando una de ellas ha sido dicotomizada
previamente. Se trata de una modificacin del coeficiente de correlacin de Pearson entre una variable continua y otra que
se ha dicotomizado y que en origen responde a una estructura de distribucin normal4.1.

El coeficiente de correlacin biserial se denota por y se puede calcular indistintamente por cualquiera de las siguientes

expresiones:

http://carleos.epv.uniovi.es/~carleos/docencia/teloydisren/descriptiva+probabilidad/l_edyp/lib_edyp_html/node27.html 3/13
2/8/2017 4.5 Medidas de dependencia. Coeficientes de relacin

donde:

es la variable continua
es la variable dicotomizada
es la media de cuando vale 0

es la media de cuando vale 1

es la media de la distribucin marginal de


es la desviacin tpica de la marginal de
es la proporcin de elementos con asignacin 0 en la variable

es la proporcin de elementos con asignacin 1 en la variable ,

es el valor de la ordenada correspondiente a un valor de que divide el rea de la distribucin


normal tipificada en dos partes, una igual a y otra igual a .

Se interpreta de forma anloga al coeficiente de correlacin de Pearson en lo referente a la intensidad de la relacin, no a su


sentido; adems, cuando la correlacin es alta y el requisito de normalidad de no se cumple de forma estricta, el coeficiente de
correlacin biserial puede valer ms de 1 o menos de -1.

Como variante, aunque con idntica interpretacin y similar notacin y expresin, se debe tener presente el coeficiente de
correlacin biserial-puntual, que se utiliza para medir la correlacin entre una variable continua y otra dicotmica por naturaleza,
definido por:

http://carleos.epv.uniovi.es/~carleos/docencia/teloydisren/descriptiva+probabilidad/l_edyp/lib_edyp_html/node27.html 4/13
2/8/2017 4.5 Medidas de dependencia. Coeficientes de relacin

4.2

4.5.2 Variables ordinales. Concordancia


4.5.2.1 Coeficiente de correlacin por rangos de Spearman
Este coeficiente se utiliza para medir la relacin entre dos sucesiones de valores ordinales. Es el coeficiente de correlacin de
Pearson para las llamadas variables cuasi-cuantitativas, discretas, o bien, para aquellas cuantitativas que han sido transformadas en
http://carleos.epv.uniovi.es/~carleos/docencia/teloydisren/descriptiva+probabilidad/l_edyp/lib_edyp_html/node27.html 5/13
2/8/2017 4.5 Medidas de dependencia. Coeficientes de relacin

ordinales ( primeros nmeros naturales para cada variable) tiene la forma

donde:

es el coeficiente de correlacin por rangos de Spearman

es la diferencia entre el valor ordinal de la variable y el de la variable en el elemento -


simo
es el tamao de la muestra

Se verifica que .

Si hay un gran nmero de elementos con el mismo valor en alguna de las dos variables, es decir, si hay muchos empates, es
conveniente recurrir a las correcciones de este coeficiente. Quedando el coeficiente como

con:

donde:

es el nmero de empates en el rango de la variable

es el nmero de empates en el rango de la variable

Sus caractersticas e interpretacin son similares a las del coeficiente de correlacin de Pearson.

4.5.2.2 Coeficiente de Kendall

De forma anloga al coeficiente de Spearman, el coeficiente considera el orden de los objetos o elementos tanto de una
variable como de la otra e intenta medir el grado de concordancia o correspondencia entre ellos. Dicho coeficiente viene dado por

http://carleos.epv.uniovi.es/~carleos/docencia/teloydisren/descriptiva+probabilidad/l_edyp/lib_edyp_html/node27.html 6/13
2/8/2017 4.5 Medidas de dependencia. Coeficientes de relacin

donde:

es el coeficiente de Kendall

el nmero de coincidencias o acuerdos

el nmero de no coincidencias o desacuerdos

Nuevamente, si hay gran nmero de empates, conviene aplicar una correccin, quedando el coeficiente como

con:

donde y coinciden con los definidos para el coeficiente de correlacin de Spearman.

Sus caractersticas e interpretacin son similares a las del coeficiente de correlacin de Pearson.

4.5.2.3 Coeficiente de Goodman-Kruskal

Se utiliza para medir el grado de concordancia entre dos variables ordinales, estando especialmente indicado cuando hay muchas
observaciones y pocos valores posibles, es decir, muchos empates.

Su expresin e interpretacin es muy similar a la del coeficiente de Kendall, considerando la proporcin de pares semejantes y la
proporcin de pares no semejantes entre los empatados, resultando

donde:

es el coeficiente de Goodman-Kruskal

es el nmeros de pares semejantes o no invertidos

es el nmero de no semejantes o invertidos

http://carleos.epv.uniovi.es/~carleos/docencia/teloydisren/descriptiva+probabilidad/l_edyp/lib_edyp_html/node27.html 7/13
2/8/2017 4.5 Medidas de dependencia. Coeficientes de relacin

Tabla: Clculo del coeficiente de correlacin


de Spearman

http://carleos.epv.uniovi.es/~carleos/docencia/teloydisren/descriptiva+probabilidad/l_edyp/lib_edyp_html/node27.html 8/13
2/8/2017 4.5 Medidas de dependencia. Coeficientes de relacin

4.5.3 Atributos. Contingencia


4.5.3.1 Coeficiente

El coeficiente se utiliza para medir el grado de asociacin entre dos variables cualitativas con y categoras

respectivamente. Este estadstico est basado en la comparacin de las frecuencias observadas con las esperadas bajo una cierta
hiptesis, generalmente de independencia, respondiendo a la expresin

http://carleos.epv.uniovi.es/~carleos/docencia/teloydisren/descriptiva+probabilidad/l_edyp/lib_edyp_html/node27.html 9/13
2/8/2017 4.5 Medidas de dependencia. Coeficientes de relacin

donde:

son las frecuencias observadas o empricas

son las frecuencias esperadas o tericas

Cuando y toman el valor , es decir, cuando se est trabajando con una tabla de contingencia , se aplica la

denominada correccin de Yates, resultando el coeficiente:

El coeficiente siempre toma valores no negativos, pero al tratarse de una medida no acotada, es de difcil interpretacin por s sola,
si bien, cuanto ms relacionadas estn las variables sometidas a estudio ms se alejar el coeficiente del valor 0. Su valor depende
del nmero de observaciones y de las categoras en que stas se dividen, por tanto el coeficiente y sus derivados no son

comparables con cualquier otro coeficiente obtenido con distinto nmero de categoras.

Este coeficiente es la base de otros obtenidos a partir de l y que solucionan el problema de su falta de acotacin.

4.5.3.2 Coeficiente de contingencia

Es uno de los coeficientes derivados del , resultando til bajo las mismas condiciones que aquel pero con mayores

posibilidades de interpretacin. Se denota por y se define como

siendo el tamao muestral.

Se cumple que y mide la intensidad de la relacin sin indicar su sentido.

4.5.3.3 Coeficiente de Cramer

Es otro de los coeficientes derivados del . Se caracteriza por y su expresin es

siendo:

http://carleos.epv.uniovi.es/~carleos/docencia/teloydisren/descriptiva+probabilidad/l_edyp/lib_edyp_html/node27.html 10/13
2/8/2017 4.5 Medidas de dependencia. Coeficientes de relacin

el tamao muestral

el mnimo entre y

el nmero de categoras de la variable

el nmero de categoras de la variable

Se verifica que y se interpreta igual que el coeficiente de contingencia, teniendo en cuenta que slo proporciona

informacin sobre la relacin entre las variables y no sobre el sentido de la misma.

4.5.3.4 Coeficiente

Se trata de un coeficiente especialmente indicado para medir la asociacin entre dos variables dicotmicas. Su expresin es

donde:

es el nmero de veces que se da el par

es el nmero de veces que se da el par

es el nmero de veces que se da el par

es el nmero de veces que se da el par

En cuanto a su interpretacin, el coeficiente toma valores en el intervalo , midiendo de forma similar al coeficiente de

Pearson la intensidad de la asociacin entre las dos variables; salvo que alguna de las frecuencias sea nula, en cuyo caso el

coeficiente vale 1 -1.

En el caso en que se estudie el grado de correlacin entre dos variables cuantitativas dicotomizadas, e , siempre y cuando
stas respondan a variables continuas bajo una ley normal (que se estudiar ms adelante), el coeficiente suele denominarse

coeficiente de correlacin tetracrica.

http://carleos.epv.uniovi.es/~carleos/docencia/teloydisren/descriptiva+probabilidad/l_edyp/lib_edyp_html/node27.html 11/13
2/8/2017 4.5 Medidas de dependencia. Coeficientes de relacin

http://carleos.epv.uniovi.es/~carleos/docencia/teloydisren/descriptiva+probabilidad/l_edyp/lib_edyp_html/node27.html 12/13
2/8/2017 4.5 Medidas de dependencia. Coeficientes de relacin

Son varios los coeficientes de relacin que a lo largo de esta seccin se han ido enumerando, coincidiendo con los que por sus
caractersticas, naturaleza y facilidad de clculo son ms utilizados y, por consiguiente, conocidos en los distintos campos donde su
aplicacin tiene cabida.

Siguiente: 4.6 Ejercicios Subir: 4. Anlisis conjunto de Anterior: 4.4 Independencia ndice General
ndice de Materias
Autor: Grupo de Investigacin TeLoYDisRen
WWW: http://www.uca.es/grupos-inv/FQM270
ISBN: 84-9828-058-3

http://carleos.epv.uniovi.es/~carleos/docencia/teloydisren/descriptiva+probabilidad/l_edyp/lib_edyp_html/node27.html 13/13

Anda mungkin juga menyukai