CHI CUADRADO
Qu es la Chi Cuadrada?
Es una prueba estadstica para evaluar hiptesis acerca de
la relacin entre dos variables categricas
Se simboliza por 2
Hiptesis a probar : Correlacinales
( H0 : no hay asociacin y H1 hay asociacin)
Variables involucradas: Dos, esta prueba no considera
relaciones causales
Nivel de medicin de las variables: Nominal u ordinal
Otras caractersticas
Es una distribucin asimtrica
Slo toma valores positivos y es asinttica con respecto al
eje de las x positivas ( 0 < 2 < +)
Est caracterizada por un nico parmetro n llamado
grados de libertad adoptando formas distintas segn el
valor de n
El rea comprendida entre la curva y el eje de las x es 1
100%
Aplicaciones
Entre las aplicaciones ms frecuentes de esta
distribucin en el rea de salud, podemos sealar:
1. La prueba de asociacin, la cual permite al investigador
determinar si existe asociacin entre dos variables en
escala de medicin nominal u ordinal. Tambin aparece
en la literatura con el nombre de tablas de
contingencia
2. La prueba de bondad de ajuste
PROCEDIMIENTO
Se calcula a travs de una tabla de contingencia o
tabulacin cruzada.
Es una tabla de dos dimensiones y cada dimensin
contienen una variable
Cada variable se subdivide en dos o ms categoras.
Ejemplo: tabla 2x2 => cada dgito indica una variable y el
valor de este indica el nmero de categoras de la variable
Ejemplo de una Tabla de Contingencia
SEXO
MASCULINO
FEMENINO
CANDIDATO A
CANDIDATO B
Dos variables : voto y sexo
Cada variable con dos categoras VOTO
Ejemplo Tabla 2x3
Norte Sur
Partido 1
180
100
Partido 2
190
280
Partido 3
170
120
Identificacin
politica
Zona Distrito electoral
En esencia la prueba de Chi Cuadrado es .......
es una prueba que parte del supuesto de no relacin
entre las variables
una comparacin entre la tabla de frecuencias
observadas y la denominada tabla de frecuencias
esperadas
La lgica es Si no hay relacin entre las variables debe
tenerse una tabla como la de frecuencias esperadas, si la
hay la tabla que obtengamos como resultado de nuestra
investigacin debe ser muy diferente respecto de la tabla
de frecuencias esperadas
Paso a paso....................
1. En la tabla de contingencia se anotan las frecuencias
observadas en la muestra de la investigacin.
2. Se calculan las frecuencias esperadas para cada celda
fe = (total marginal de rengln)*(total marginal de columna)
N
donde N= nmero total de frecuencias observadas
Paso a paso....................
3. Se aplica la siguiente frmula de Chi Cuadrada:
2 = (O E) / E
donde O = frecuencia observada en cada celda
E = frecuencia esperada en cada celda
Es decir:
Se calcula la diferencia entre la frecuencia observada y la
esperada, esta diferencia se eleva al cuadrado y se divide entre
la frecuencia esperada. Finalmente, se suman estos resultados y
la sumatoria es el valor de la 2 obtenida
Otra forma de calcular Chi Cuadrado es.............
Procedimiento para calcular la Chi Cuadrada
Celda O E O E ( O E ) ( O E ) / E
Zona Norte / P 1
180 145,4 34,6 1.197,16 8,23
Zona Norte / P 2
190 244,4 -54,4 2.959,36 12,11
Zona Norte / P3
170 150,6 19,4 376,36 2,50
Zona Sur / P 1
100 134,6 -34,6 1.197,16 8,89
Zona Sur / P 2
280 226,0 54,0 2.916,00 12,90
Zona Sur/ P 3
120 139,4 -19,4 376,33 2,7
2 = 47,33
Paso a paso.................
4. Clculo del Ji cuadrada crtico: el cual se obtiene de una
tabla especfica, en donde se busca la interseccin entre
los grados de libertad y el nivel de significacin
gl = ( r-1)*(c-1)
donde r = n de renglones de la tabla de contingencia
c = n de columnas
Ejemplo => gl = ( 3 1 ) * ( 2 1 ) = 2
Con un nivel de confianza de 0,05 0,01 y con los
grados de libertad vamos a la tabla y obtenemos el valor
2
Paso a paso....................
5. Regin de rechazo R: est constituida por todos los valores del
Ji cuadrado iguales o mayores que el Ji Cuadrado crtico
Si nuestro valor calculado de 2 es igual o superior al de la
tabla, decimos que las variables estn relacionadas ( 2 fue
significativa
En nuestro ejemplo => 2 tabla es 5,991
2 calculado es 47,33
El valor calculado por nosotros es muy superior al de la tabla :
2 es significativa, es decir estn relacionadas .
Observaciones
Mientras mayor sea la diferencia entre los valores
observados y los esperados, mayor ser el valor de 2 y
aumentar por tanto la probabilidad de rechazar la
hiptesis de nulidad
No se puede usar la prueba de 2 cuando el valor esperado
en alguna celda es menor que 5, en ese caso debe usarse la
probabilidad exacta de Fisher
La suma de las frecuencias observadas debe coincidir con
la suma de las frecuencias esperadas.
TABLAS DE CONTINGENCIAS
OTRO USO
Qu otra utilizacin tienen las tablas
de contingencia?
Son tiles para describir conjuntamente a dos o ms
variables.
Esto se hace convirtiendo las frecuencias observadas en
frecuencias relativas o porcentajes
Qu otra utilizacin tienen las tablas
de contingencia?
En una tabulacin cruzada puede haber tres tipos de porcentajes
respecto a cada celda:
Porcentaje en relacin al total de frecuencias observadas (N)
Porcentaje en relacin al total marginal de la columna
Porcentaje en relacin al total marginal del rengln
Veamos un ejemplo:
sexo
Masc Fem
A 25 25
B 40 60
Preferencia
por el
conductor
25
25,00%
38,46% a
50,00%
c
b
d
Frecuencias observadas
En relacin a N
En relacin a a + b
En relacin a a + c
a + b = 65
c + d
a + c = 50
b + d
N=100
25
25,0%
38,5%
50,0%
25
25,0%
71,4%
,50,0%
40
40,0%
61,5%
80,0%
10
10,0%
28,6%
20,0%
Tabla N 1.- Tabla de contingencia para describir
conjuntamente dos variables
Sexo
Masculino
Femenino
A
B
Preferencia
por el
conductor
50
50
65
35
Comentario final
Una cuarta parte de la
muestra est constituida por
hombres que prefieren al
conductor A, el 10 % son
mujeres que prefieren al
conductor B. Ms del 60%
de los hombres pprefieren a
B, etc..
EL TEST EXACTO DE FISHER
El test exacto de Fisher permite analizar si dos variables
dicotmicas estn asociadas cuando la muestra a estudiar es
demasiado pequea.
El test exacto de Fisher se basa en evaluar la probabilidad
asociada a cada una de las tablas 2 x 2 que se pueden formar
manteniendo los mismos totales de filas y columnas que los
de la tabla observada.
Cada una de estas probabilidades se obtiene bajo la
hiptesis nula de independencia de las dos variables que se
estn considerando.
La probabilidad exacta de observar un conjunto concreto
de frecuencias a, b, c y d en una tabla 2 x 2 cuando se
asume independencia y los totales de filas y columnas se
consideran fijos viene dada por la distribucin
hipergeomtrica:
Esta frmula se obtiene calculando todas las posibles
formas en las que podemos disponer n sujetos en una
tabla 2 x 2 de modo que los totales de filas y columnas
sean siempre los mismos, (a+b), (c+d), (a+c) y (b+d).
! ! ! ! !
! ! ! !
d c b a n
d b c a d c b a
p