X 2=
(fofe)2
fe
Siendo :
fo: Observado
fe: esperado
DUERMEN BIEN
44
81
DUERMEN MAL
10
35
Es lo mismo tomar somniferos o placebos para dormir bien o mal en este grupo de
enfermos?
Las hiportesis de este ejemplo, serian las siguientes:
Ho: no es lo mismo tomar somniferos o placebos para dormir bien o mal
H1: es lo mismo tomar somniferos o placebos para dormir bien o mal
Para la realizacion del ejemplo se muestran los pasos a seguir.
PASO 1:
Completar la tabla de frecuencias observadas.
SOMNIFEROS
PLACEBOS
TOTAL
DUERMEN BIEN
44
81
125
DUERMEN MAL
10
35
45
TOTAL
54
116
170
PASO 2:
Calcular las frecuencias teoricas.
Para este calculo, tenemos que basarnos en la formula: (total filas x total de
columnas)/ total
fe 1=
125 x 54
=39.71
170
fe 2=
116 x 125
=85.29
170
fe 3=
45 x 54
=14.29
170
fe 4=
45 x 116
=30.71
170
La suma de las frecuencias observables debia ser igual a la suma de las frecuencias
esperdas. En este caso podemos decir, que dicho pronostico se cumple:
Suma de frecuencias observadas = 170
Suma de frecuencias esperadas= 39.71 + 85.29 + 14.29 + 30.71 =170
PASO 3:
Calcular los grados de libertad. En este caso, como son dos los criterios de
clasificacion, el grado de libertad se calcularia asi:
Grados de libertad = (# de filas 1) x (# de columnas-1)
Grados de libertad = (2-1) x (2-1) = 1 x 1 = 1
PASO 4:
Calcular el valor de chi cuadrado.
X 2=
PASO 5:
Ver la tabla.
Buscamos en la tabla de la distribucion
X2
resultado del chi cuadrado. Tenemos que tener en cuenta el nivel de significacion
(0.05) y el grado de libertad (1).
PASO 6:
Comparar los valores.
Valor calculado = 2.57
Valor de la tabla = 3.84
CONCLUSION
2.57 <3.84
t , existe una distribucion chi cuadrada para cada numero distinto de grados de
libertad. Para un numero muy pequeo de grados de libertad, la distribucion chi
cuadrada esta seriamente sesgada hacia la derecha. Conforme aumenta el numero de
grados de libertad, rapidamente la curva se va haciendo cada vez mas simetrica hasta
que el numero de grados de libertad se hace bastante grande, en cuyo caso la
distribucion puede aproximarse con la normal.
dice que, de un conjunto de observaciones, los grados de libertad estn dados por el
nmero de valores que pueden ser asignados de forma arbitraria, antes de que el
resto de las variables tomen un valor automticamente, producto de establecerse las
que son libres, esto, con el fin de compensar e igualar un resultado el cual se ha
conocido previamente. Se encuentran mediante la frmula n-r, donde n=nmero de
sujetos en la muestra que puede tomar un valor de forma libre y r es el nmero de
sujetos cuyo valor depender del que tomen los miembros de la muestra que son
libres. Tambin pueden ser representados por k-r, donde k=nmero de grupos, esto,
cuando se realizan operaciones con grupos y no con sujetos individuales.
Cuando se trata de eliminar los estadsticos con un conjunto de datos, los residuos
-expresados en forma de vector- se encuentran habitualmente en un espacio de
menor dimensin que aqul en el que se encontraban los datos originales. Los grados
de libertad del error los determina, precisamente, el valor de esta menor dimensin.
Tablas de contingencia
Suponga que en cuatro regiones, la Compaa Nacional de Cuidado de la Salud
muestrea las actitudes de los empleados de sus hospitales con respecto al examen de
desempeo en el trabajo. A los trabajadores se les da a escoger entre el mtodo
actual (dos exmenes al ao) y un nuevo mtodo propuesto (exmenes cada
trimestre).
NORESTE
Nmero de
empleados
que prefieren
el mtodo
actual
Nmero de
empleados
68
SURESTE
75
CENTRAL
57
COSTA
OCCIDENTAL
79
TOTAL
279
que prefieren
32
45
33
31
141
el nuevo
mtodo.
Total de
100
120
90
110
400
empleados
muestreados
en cada
regin.
Una tabla como esta, est conformada por renglones y columnas: los renglones corren
de manera horizontal y las columnas verticalmente. Note que las cuatro columnas de
la tabla anterior proporcionan una base de clasificacin (regiones geogrficas) y que
los dos renglones clasifican la informacin de otra manera: preferencia por algn
mtodo de revisin. Se le conoce como tabla de contingencia de 2 x 4, ya que
consta de dos renglones y cuatro columnas. Describimos las dimensiones de una tabla
de contingencia estableciendo primero el nmero de renglones y luego el nmero de
columnas. La columna y el rengln con el total no se cuentan como parte de las
dimensiones.
pc
plan
pw
Si la hiptesis nula es verdadera, podemos combinar los datos de las cuatro muestras
y luego estimar la proporcin de la fuerza de trabajo total (la poblacin total) que
prefiere el mtodo actual de revisin:
Porcin combinada de trabajadores que prefieren el mtodo presente, suponiendo
que la hiptesis nula de ninguna diferencia es verdadera.
68+75+57+ 79
100+120+ 90+110
279
420
0.6643
NORESTE
SURESTE
CENTRAL
COSTA
Numero total
muestreado
Proporcion
estimada que
prefiere el
mtodo actual
Numero que se
espera que
prefiera el
mtodo actual.
Numero total
muestreado
Proporcion
estimada que
prefiere el
nuevo mtodo.
Numero que se
espera que
prefiera el
nuevo metodo
100
120
0.6643
66.43
100
0.3357
33.57
0.6643
90
0.6643
OCCIDENTAL
110
0.6643
79.72
59.79
73.07
120
90
110
0.3357
0.3357
40.28
30.21
0.3357
36.93
SURESTE
CENTRAL
COSTA
OCCIDENTAL
68
75
57
79
66.43
79.72
59.79
73.07
FRECUENCIA DE
PREFERENCIA
DEL METODO
ACTUAL
Frecuencia
observada
(real)
Frecuencia
esperada
(terica)
FRECUENCIA DE
PREFERENCIA
DEL NUEVO
METODO
Frecuencia
observada
(real)
Frecuencia
esperada
(terica)
32
45
33
31
33.57
40.28
30.21
36.93
que fueron observadas con las frecuencias que esperaramos si la hiptesis nula fuera
verdadera. Si los conjuntos de frecuencias observadas y esperadas son casi iguales,
podemos razonar de manera intuitiva que aceptaremos la hiptesis nula. Si existe una
diferencia grande entre estas frecuencias, podemos intuitivamente rechazar la
hiptesis nula y llegar a la conclusin de que existen diferencias significativas en las
proporciones de empleados de las cuatro regiones que prefieren el nuevo mtodo.
La estadstica chi cuadrada
Para ir ms all de nuestros sentimientos intuitivos acerca de las frecuencias
observadas y esperadas, podemos hacer uso de la estadstica de chi cuadrada, la cual
se calcula de la manera siguiente.
1. Restamos
f e de f o
mostrada
2. Elevamos al cuadrado cada una de las diferencias
3. Dividimos cada diferencia al cuadrado entre f e y
4. Sumamos los ocho resultados
La respuesta obtenida de 2.764 es el valor de chi cuadrada en nuestro problema de
comparacin de preferencias de mtodos de evaluacin. Si este valor fuera muy
grande, digamos 20, indicara una diferencia sustantiva entre nuestros valores
observados y los valores esperados.
Suponga que la compaa Gordon requiere que los recin graduados de la universidad
que buscan una colocacin en la empresa sean entrevistados por tres ejecutivos
diferentes. Esto permite a la compaa obtener una evaluacin condensada de los
candidatos. Cada uno de los ejecutivos califica al candidato en forma positiva o
negativa. En la tabla se muestran los resultados de las entrevistas de los ltimos 100
candidatos.
11
100
entrevistas.
H 1 :Una distribucion binominal con p=0.40
entrevistas
Para determinar este problema, debemos determinar si las discrepancias entre las
frecuencias observadas y aquellas que esperaramos (si la distribucin binominal fuera
el mtodo apropiado a utilizarse) debern atribuirse al azar. Podemos empezar por
determinar cules seran las probabilidades binominales para esta situacin en
particular. Para las tres entrevistas, encontraramos la probabilidad de xitos en la
tabla de distribucin normal.