Anda di halaman 1dari 32

PRUEBA DE SIGNIFICANCIA

CHI CUADRADO
Qu es la Chi Cuadrada?
Es una prueba estadstica para evaluar hiptesis acerca de
la relacin entre dos variables categricas

Se simboliza por 2

Hiptesis a probar : Correlacinales
( H0 : no hay asociacin y H1 hay asociacin)

Variables involucradas: Dos, esta prueba no considera
relaciones causales

Nivel de medicin de las variables: Nominal u ordinal

Otras caractersticas
Es una distribucin asimtrica

Slo toma valores positivos y es asinttica con respecto al
eje de las x positivas ( 0 < 2 < +)

Est caracterizada por un nico parmetro n llamado
grados de libertad adoptando formas distintas segn el
valor de n

El rea comprendida entre la curva y el eje de las x es 1
100%

Aplicaciones

Entre las aplicaciones ms frecuentes de esta
distribucin en el rea de salud, podemos sealar:

1. La prueba de asociacin, la cual permite al investigador
determinar si existe asociacin entre dos variables en
escala de medicin nominal u ordinal. Tambin aparece
en la literatura con el nombre de tablas de
contingencia

2. La prueba de bondad de ajuste


PROCEDIMIENTO

Se calcula a travs de una tabla de contingencia o
tabulacin cruzada.

Es una tabla de dos dimensiones y cada dimensin
contienen una variable

Cada variable se subdivide en dos o ms categoras.

Ejemplo: tabla 2x2 => cada dgito indica una variable y el
valor de este indica el nmero de categoras de la variable
Ejemplo de una Tabla de Contingencia
SEXO
MASCULINO
FEMENINO
CANDIDATO A
CANDIDATO B

Dos variables : voto y sexo
Cada variable con dos categoras VOTO

Ejemplo Tabla 2x3


Norte Sur

Partido 1

180

100

Partido 2

190

280

Partido 3

170

120
Identificacin
politica
Zona Distrito electoral
En esencia la prueba de Chi Cuadrado es .......

es una prueba que parte del supuesto de no relacin
entre las variables

una comparacin entre la tabla de frecuencias
observadas y la denominada tabla de frecuencias
esperadas

La lgica es Si no hay relacin entre las variables debe
tenerse una tabla como la de frecuencias esperadas, si la
hay la tabla que obtengamos como resultado de nuestra
investigacin debe ser muy diferente respecto de la tabla
de frecuencias esperadas
Paso a paso....................
1. En la tabla de contingencia se anotan las frecuencias
observadas en la muestra de la investigacin.

2. Se calculan las frecuencias esperadas para cada celda

fe = (total marginal de rengln)*(total marginal de columna)
N

donde N= nmero total de frecuencias observadas
Paso a paso....................
3. Se aplica la siguiente frmula de Chi Cuadrada:

2 = (O E) / E

donde O = frecuencia observada en cada celda
E = frecuencia esperada en cada celda
Es decir:
Se calcula la diferencia entre la frecuencia observada y la
esperada, esta diferencia se eleva al cuadrado y se divide entre
la frecuencia esperada. Finalmente, se suman estos resultados y
la sumatoria es el valor de la 2 obtenida

Otra forma de calcular Chi Cuadrado es.............
Procedimiento para calcular la Chi Cuadrada
Celda O E O E ( O E ) ( O E ) / E
Zona Norte / P 1
180 145,4 34,6 1.197,16 8,23
Zona Norte / P 2

190 244,4 -54,4 2.959,36 12,11
Zona Norte / P3

170 150,6 19,4 376,36 2,50
Zona Sur / P 1

100 134,6 -34,6 1.197,16 8,89
Zona Sur / P 2

280 226,0 54,0 2.916,00 12,90
Zona Sur/ P 3

120 139,4 -19,4 376,33 2,7
2 = 47,33
Paso a paso.................
4. Clculo del Ji cuadrada crtico: el cual se obtiene de una
tabla especfica, en donde se busca la interseccin entre
los grados de libertad y el nivel de significacin

gl = ( r-1)*(c-1)

donde r = n de renglones de la tabla de contingencia
c = n de columnas
Ejemplo => gl = ( 3 1 ) * ( 2 1 ) = 2

Con un nivel de confianza de 0,05 0,01 y con los
grados de libertad vamos a la tabla y obtenemos el valor
2


Paso a paso....................

5. Regin de rechazo R: est constituida por todos los valores del
Ji cuadrado iguales o mayores que el Ji Cuadrado crtico

Si nuestro valor calculado de 2 es igual o superior al de la
tabla, decimos que las variables estn relacionadas ( 2 fue
significativa

En nuestro ejemplo => 2 tabla es 5,991
2 calculado es 47,33

El valor calculado por nosotros es muy superior al de la tabla :
2 es significativa, es decir estn relacionadas .

Observaciones

Mientras mayor sea la diferencia entre los valores
observados y los esperados, mayor ser el valor de 2 y
aumentar por tanto la probabilidad de rechazar la
hiptesis de nulidad

No se puede usar la prueba de 2 cuando el valor esperado
en alguna celda es menor que 5, en ese caso debe usarse la
probabilidad exacta de Fisher

La suma de las frecuencias observadas debe coincidir con
la suma de las frecuencias esperadas.
TABLAS DE CONTINGENCIAS
OTRO USO
Qu otra utilizacin tienen las tablas
de contingencia?


Son tiles para describir conjuntamente a dos o ms
variables.

Esto se hace convirtiendo las frecuencias observadas en
frecuencias relativas o porcentajes
Qu otra utilizacin tienen las tablas
de contingencia?
En una tabulacin cruzada puede haber tres tipos de porcentajes
respecto a cada celda:

Porcentaje en relacin al total de frecuencias observadas (N)
Porcentaje en relacin al total marginal de la columna
Porcentaje en relacin al total marginal del rengln

Veamos un ejemplo:
sexo
Masc Fem
A 25 25
B 40 60
Preferencia
por el
conductor

25

25,00%
38,46% a

50,00%


c

b


d
Frecuencias observadas
En relacin a N
En relacin a a + b
En relacin a a + c
a + b = 65
c + d
a + c = 50
b + d
N=100

25
25,0%
38,5%
50,0%

25
25,0%
71,4%
,50,0%

40
40,0%
61,5%
80,0%

10
10,0%
28,6%
20,0%
Tabla N 1.- Tabla de contingencia para describir
conjuntamente dos variables
Sexo

Masculino
Femenino
A

B

Preferencia
por el
conductor

50

50
65

35
Comentario final

Una cuarta parte de la
muestra est constituida por
hombres que prefieren al
conductor A, el 10 % son
mujeres que prefieren al
conductor B. Ms del 60%
de los hombres pprefieren a
B, etc..
EL TEST EXACTO DE FISHER

El test exacto de Fisher permite analizar si dos variables
dicotmicas estn asociadas cuando la muestra a estudiar es
demasiado pequea.


El test exacto de Fisher se basa en evaluar la probabilidad
asociada a cada una de las tablas 2 x 2 que se pueden formar
manteniendo los mismos totales de filas y columnas que los
de la tabla observada.

Cada una de estas probabilidades se obtiene bajo la
hiptesis nula de independencia de las dos variables que se
estn considerando.
La probabilidad exacta de observar un conjunto concreto
de frecuencias a, b, c y d en una tabla 2 x 2 cuando se
asume independencia y los totales de filas y columnas se
consideran fijos viene dada por la distribucin
hipergeomtrica:





Esta frmula se obtiene calculando todas las posibles
formas en las que podemos disponer n sujetos en una
tabla 2 x 2 de modo que los totales de filas y columnas
sean siempre los mismos, (a+b), (c+d), (a+c) y (b+d).

! ! ! ! !
! ! ! !
d c b a n
d b c a d c b a
p

La probabilidad anterior deber calcularse para todas las


tablas de contingencia que puedan formarse con los
mismos totales marginales que la tabla observada.
Posteriormente, estas probabilidades se usan para calcular
valor de la p asociado al test exacto de Fisher.

Este valor de p indicar la probabilidad de obtener una
diferencia entre los grupos mayor o igual a la observada,
bajo la hiptesis nula de independencia.

Si esta probabilidad es pequea (p<0.05) se deber
rechazar la hiptesis de partida y deberemos asumir que las
dos variables no son independientes, sino que estn
asociadas. En caso contrario, se dir que no existe
evidencia estadstica de asociacin entre ambas variables.
Grupo Si No Total
Expuesto

No expuesto
A B

C D
A + B

C + D


Total

A+C B+D

N
Supongamos que el suceso investigado es, si una enfermedad es ms
frecuente en el grupo de expuestos que en el de los no expuestos a un
posible factor causal .tendremos la siguiente tabla
El test exacto de Fisher
Ejemplo:

Supngase que un grupo de 16
personas se reuni a comer en un
restaurante. Diez comieron pastel
de mariscos y 6 comieron carne. Al
da siguiente, 11 de los comensales
amanecieron enfermos de
gastroenteritis
La tabla adjunta muestra las
frecuencia de enfermos en los que
comieron mariscos y en los que
comieron carne.
Lo que se quiere averiguar, es si la
asociacin entre el tipo de comida
y enfermar, es estadsticamente
significativa
Comida Si No Total
Mariscos
Carne
9 1
2 4

10
6
Total 11 5 16
Enfermos
Procedimiento
La Ho = frecuencia de enfermos entre los que comieron mariscos es la
misma que la de los que enfermaron despus de comer carne
11/16 =0,6875, la frecuencia de enfermos en el grupo total.

Las probabilidades se pueden obtener en forma aproximada de la Tabla
de Valores Crticos de D o C en la prueba de Fisher *,

Se busca la seccin de la tabla en que los totales del margen derecho
son A + B ( 10) y C + D = 6.

Buscamos en la columna B o (A) si aparece 1, que es el valor de B en
nuestro ejemplo. Dado que no se encuentra, se debe utilizar el valor de
A = 9

Procedimiento
Dado que tuvimos que buscar la fila del valor A = 9, lo que
corresponde es buscar el valor de C en la tabla , que corresponde
al valor 2.

Valor observado es mayor o igual que el valor crtico indica
asociacin => 2 2 para 5% de significancia. => se declara
significativa la asociacin

Si es valor observado es menor que el crtico , entonces no existe
asociacin y se acepta la Ho

Un valor 2 es suficiente para declarar significativa la asociacin
entre el consumo de alimentos y la enfermedad a nivel de 5% pero
no a nivel 2,5% o 1%


C O E F I C I E N T E S
DE
C O R R E L A C I O N
Qu son los coeficientes de correlacin e
independencia para tabulaciones cruzadas?

Son coeficientes que tambin sirven para evaluar si las
variables incluidas en la tabla de contingencia o
tabulacin cruzada estn correlacionadas


Algunos de estos coeficientes se pueden observar en la
siguiente tabla resumen:


Coeficiente Para tablas
de
contingencia
Nivel de
medicin
de las
variables
Interpretacin

Phi () 2x2 Nominal Vara de 0 a +1, donde 0 implica
ausencia de correlacin entre las
variables y +1 significa
correlacin de manera perfecta
Coef. de
Pearson
Cualquier
tamao
Nominal Su valor mnimo es 0 ( ausencia de
correlacin). Su valor mximo
depende del tamao de la tabla de
contingencia = > 2x2 ( 0 y 0,707)
3x3 ( 0 y 0,816)
V de Cramer Mayores de
2x2
Nominal Vara de 0 a +1 ; donde 0 es nula
correlacin y +1 es perfecta
correlacin.
Lambda (b) Cualquier
tamao
Nominal Vara de 0 a +1 ; +1 significa que
puede predecirse sin error a la
variable dependiente definida en la
tabla, sobre la base de la
independiente
Coeficiente Para tablas
de
contingencia
Nivel de
medicin
de las
variables
Interpretacin


Gamma ( r)
Cualquier
tamao
Ordinal Vara de 1 a +1 , donde 1 es una
relacin negativa perfecta y +1 una
relacin positiva perfecta)


Tau-b de
Kendall
(Tau-b)
Cualquier
tamao,
pero ms
apropiado
para tablas
con igual
nmero de
renglones y
columnas



Ordinal



Vara de 1 a +1
D. De Somers Cualquier
tamao
Ordinal Vara de 1 a +1

Anda mungkin juga menyukai