La prueba de X2 de Pearson es una prueba estadstica inferencial no paramtrica, bivariada, para investigar la asociacin de 2 variables cualitativas o categricas. El objetivo de la prueba es determinar si existe una relacin entre las variables, que no se explique por el azar, es decir que la variable independiente y la variable dependiente estn relacionadas y que esta relacin tenga significancia estadstica.
Para efectuar este test, los datos numricos de las frecuencias observadas en cada una de las categoras de las variables de estudio son contrastadas con sus respectivas frecuencias esperadas, y analizadas utilizando la siguiente formula que explicaremos a continuacin:
(Fo 2= X Fe
2 Fe)
(Fo 2= X Fe
2 Fe)
Tabla de contingencia
Para efectuar el clculo se vuelcan los datos obtenidos como frecuencias observadas en una tabla de contingencia. Se le llama tabla de contingencia a las tablas de frecuencia de dos variables presentadas en forma simultanea, en una matriz, las que son construidas listando todas las categoras de una variable como filas y de la otra variable como columnas.
Tabla de contingencia
Despus de llenar los datos de la frecuencia observada (Fo) en cada celda, las cifras son sumadas en totales por fila, por columna y total general (n). Para ejemplificar utilizar una de las tablas de contingencia de mi trabajo de investigacin.
Tabla de contingencia
La frecuencia esperada para cada celda se obtiene multiplicando los totales de la fila y de la columna (llamadas tambin frecuencias marginales) y dividindolo por n, en este caso para la celda correspondiente a sexo masculino y retenidos, es 279 x 299 / 692 = 120.6 Fe = 120.6
Ntese que los totales de las sumatorias de Fe en columnas y filas es igual a las sumatorias de Fo obtenidas en la misma forma.
Se procede a restar de la frecuencia observada, la frecuencia esperada, colocndose el valor obtenido bajo cada celda
Fo - Fe
Ntese que la sumatoria de las diferencias en cada columna y en cada fila tienen como resultado = 0
X = 2.647
Una vez obtenido el valor de X se procede a la determinacin de los valores crticos que nos permiten concluir si podemos o no rechazar la hiptesis nula (Ho). Para determinar la significancia estadstica se ingresa en una tabla el valor de X y los grados de libertad. Los grados de libertad se definen como el numero de filas -1 multiplicado por el numero de columnas 1, en este caso tenemos 2 filas y dos columnas, lo que nos da como resultado gl = 1 o tambin gf = 1
Asi se compara el valor de X obtenido (2.647) con la cifra correspondiente al valor de la significancia estadstica del presente estudio, que en este caso es p < 0.05
Hacer click
marcar
Y hacer click .
Marcar
Y hacer click
Y obtenemos:
Aqu tenemos el ejemplo de otra tabla de contingencia, de 6 columnas y 2 filas, gl = 5 y con significancia estadstica
Es muy importante dejar en claro que en cada casilla de la tabla de contingencia solo puede haber frecuencias y no otros valores como por ejemplo porcentajes o proporciones, ya que en esos casos el test no puede operar. Otra restriccin importante del test de X es que el tamao de nuestra muestra n no puede ser menor a 20 y ninguna casilla con una frecuencia menor a 5.
Conclusin
El test de significancia de X es una herramienta til para determinar si tiene sentido que el investigador interprete las tablas de contingencia. Un resultado significativo significa que los valores de las celdas de la tabla de contingencia debe ser interpretada. Un test no significativo significa que no se descubri efectos, y las diferencias en las casillas se pueden explicar por el azar. En este caso la interpretacin de las frecuencias en cada casilla no esta indicada.
Muchas gracias!!!