Anda di halaman 1dari 25

DISTRIBUCIN DEL CHI CUADRADO

ANTECEDENTES HISTRICOS DE LA DISTRIBUCIN CHI CUADRADO:


El matemtico Karl Pearson (18571936), advirti que cuando un cientfico
realiza un experimento de resultados aleatorios, generalmente tiene en mente
como referente un modelo terico ideal que de antemano establece cmo
debera ser el comportamiento y cules deberan ser los resultados estadsticos
esperados del experimento. Sin embargo, en el mundo real es muy normal que
los resultados empricos obtenidos dentro de Muestras Estadsticas sobre la
realizacin de un experimento aleatorio no coincidan plenamente con los
resultados tericos esperados. En muchos casos es normal que ocurran
grandsimas fluctuaciones en los resultados observados en el experimento
aleatorio, y aun as es posible seguir afirmando que esos resultados
fluctuantes todava estn ocurriendo dentro de los lmites previstos por el
modelo terico ideal. Justamente, una gran dificultad a la que se enfrentaron los
primeros cientficos de la Modernidad fue cmo hallar una frmula matemtica
para determinar con exactitud que las fluctuaciones o variaciones observadas en
los resultados de un experimento eran suficientemente significativas como
para permitir concluir que esos resultados ya no respondan a las expectativas
del modelo terico.
Por ese motivo Karl Pearson hacia 1900 propuso uno de los primeros Test
Estadsticos que desde la ptica de las distribuciones de la probabilidad sirve
para calcular si los resultados estadsticos de un experimento se alejan
significativamente o no de los resultados esperados del modelo terico, test que
actualmente es conocido como el Test Chi Cuadrado. Luego otros
importantes matemticos han propuesto la axiomatizacin de diversas funciones
matemticas o estadsticas que permiten definir y calcular los lmites ideales a
partir de los cuales se puede afirmar con gran certeza que los resultados
observados en un experimento aleatorio definitivamente ya no responden a las
expectativas tericas del modelo ideal, es decir, permiten concluir que realmente
son muy significativas las disparidades existentes entre los resultados
observados y los resultados esperados. Algunas de las ms importantes
funciones estadsticas empleadas para ese propsito son la prueba Fisher, la
prueba T-Student, la prueba Z, el test Wishart, la prueba McNemar, la prueba Q
de Cochran, los tests de Bondad de Ajuste, etc.
A continuacin tratare sobre la Distribucin Chi-Cuadrado de la probabilidad y su
relacin con el Test Chi-Cuadrado, recalcando su aplicacin en los denominados
Contrastes de Significacin que se pueden realizar entre los resultados
tericos esperados y los resultados empricos observados de un experimento.

COMPRENDIENDO EL MODELO IDEAL DE LA DISTRIBUCIN CHI


CUADRADO:
La denominada Distribucin Chi Cuadrado (que usualmente se escribe y se
lee como: Ji Cuadrado), es una distribucin cuadrtica de la probabilidad que
utiliza bsicamente variables aleatorias continuas. La Distribucin Chi Cuadrado
de la probabilidad se denota mediante la letra griega minscula ji elevada al
cuadrado (2), y consiste en establecer un espacio continuo delimitado por la
suma de los cuadrados de n variables aleatorias que son independientes entre
s, espacio dentro del cual la variable X puede asumir cualquiera de los infinitos
valores que lo conforman, y por tanto para establecer el valor aproximado de una
variable X dentro de ese espacio se procede a incluir una estimacin de sus
posibles lmites que estn dados por los distintos Grados de Libertad que
pueden existir entre las variables aleatorias analizadas que dan origen al referido
espacio. En otras palabras, la Distribucin Chi Cuadrado en un delimitado
espacio conjuga un determinado nmero de variables aleatorias independientes
entre s, con unos valores de probabilidad ubicados entre 1 y 0 que son
atribuibles a esas variables, y con unos lmites de la probabilidad para el
verdadero valor de X delimitados por los Grados de Libertad atribuibles a las
variables aleatorias analizadas.
La Distribucin Chi Cuadrado permite calcular la probabilidad existente para que
una variable X, que tiene un determinado Grado de Libertad frente a otras
variables del mismo conjunto, permanezca dentro de unos lmites ideales
previstos para X cuando tiene ese especfico Grado de Libertad o independencia.
En otras palabras, la Distribucin Chi Cuadrado suministra un modelo ideal sobre
los lmites probables que deberan regir las fluctuaciones en la aparicin de un
determinado valor aleatorio X dependiendo del Grado de Libertad que tiene ese
valor frente a otras variables similares dentro de un conjunto de datos
analizados. La frmula matemtica para calcular la probabilidad de que una
variable X permanezca dentro del lmite ideal correspondiente al respectivo
Grado de Libertad es la siguiente:
Xk / 2 1 e X / 2
2k (X) =
2k /2 (k / 2)
En esta ecuacin la letra k que aparece como un subndice de la
expresin 2 indica el Grado de Libertad que se toma como lmite para calcular la

probabilidad de la variable aleatoria X. Esta ecuacin para ser despejada


requiere el uso de la compleja Funcin Gamma (representada por la letra griega
mayscula gamma: ), y por tanto generalmente para solucionar esta ecuacin
se emplean mtodos basados en la consulta de tablas o en el uso de algoritmos
para ordenador que permiten obtener los valores de probabilidad respectivos.
EXPLICACIN DE LOS GRADOS
DISTRIBUCIN CHI CUADRADO:

DE

LIBERTAD

USADOS

EN

LA

Dentro de la Distribucin Ji Cuadrado los denominados Grados de Libertad


atribuibles a un conjunto de variables equivalen al nmero de datos
independientes entre s existentes dentro de ese conjunto que es necesario
conocer previamente para poder estimar el valor de cualquier otro dato
independiente del mismo grupo. Por ejemplo, si se afirma que en un cesto hay un
conjunto de 10 manzanas, conformado por 2 clases independientes de
manzanas, pues algunas de esas 10 manzanas son de color rojo y otras son de
color verde, entonces en tal caso basta con saber que en el cesto hay 4
manzanas rojas para poder calcular inmediatamente que las restantes son 6
manzanas de color verde, es decir, en este caso hay 2 clases de datos
independientes entre s (rojas y verdes), pero para poder conocer el valor de una
clase de esos dos datos es siempre necesario conocer previamente el valor de la
otra clase de datos, motivo por el cual se concluye que el Grado de Libertad o el
grado de independencia existente entre las dos clases de datos tiene un valor de
uno (1).
En otro ejemplo, si se afirma que en una sala hay un conjunto de 30 personas,
conformado por 3 clases de razas independientes entre s, pues algunas de esas
personas son caucsicas, otras son negras y otras son asiticas, entonces basta
con saber que en la sala hay 12 personas caucsicas y 9 negras para poder
calcular exactamente que las restantes 9 personas son asiticas, es decir, en
este caso hay 3 clases de datos independientes entre s, pero para poder
conocer cul es el valor de una clase particular de esos datos es siempre
necesario conocer previamente el valor de las otras 2 clases de datos; en otras
palabras, si slo se sabe que en la sala hay 12 personas caucsicas, ese dato
resulta insuficiente para poder saber con exactitud cuntas son negras y cuntas
son asiticas dentro de las restantes 18 personas de la sala, y si slo se sabe
que en la sala 9 personas son asiticas, ese dato por s slo tambin resulta
insuficiente para poder saber cuntas son negras y cuntas son caucsicas
dentro de las restantes 21 personas de la sala, motivo por el cual se concluye
que el Grado de Libertad o grado de independencia existente entre las tres
clases de datos tiene un valor de 2, pues nicamente conociendo el valor de 2
clases de datos se puede saber con exactitud cmo estn distribuidas las tres
clases de razas dentro de la poblacin total del conjunto analizado.

En otro ejemplo, si se afirma que existe un conjunto formado por 5 nmeros


diferentes que al ser sumados dan como resultado 24, en tal caso no es
indispensable conocer previamente todos los cinco nmeros que conforman el
conjunto, pero para poder calcular el valor exacto de cualquiera de los 5 nmeros
que conforman ese conjunto s es necesario conocer al menos 4 de esos 5
nmeros, como podra ocurrir con la combinacin conformada por los siguientes
cinco nmeros: 4+3+10+2+X = 24, combinacin en la cual necesariamente se
requiere conocer al menos 4 nmeros para poder calcular directamente que el
quinto nmero desconocido (representado por la X) es un 5, es decir, el Grado de
Libertad existente entre los cinco datos diferentes tiene un valor de 4.
En sntesis, el Grado de Libertad, que usualmente se representa por las letras
G.L., equivale a restarle 1 a un conjunto conformado por k variables
consideradas independientes entre s, lo cual se resume en la frmula: G.L. =k
1. As, si el conjunto contiene 5 variables consideradas independientes entre s,
entonces el Grado de Libertad que le corresponde a cualquier variable de ese
conjunto es de: G.L. = 51 = 4, lo que equivale a que en ese conjunto slo 4
variables una vez conocidas pueden operar de manera independiente sin
necesidad de que deba ser conocido el valor exacto de la quinta variable del
conjunto. Y si el conjunto contiene 2 variables independientes, como en el
ejemplo de las manzanas verdes y las manzanas rojas, entonces el Grado de
Libertad es 1, ya que: G.L. = 21 = 1, lo que equivale a que en ese conjunto slo
una variable ya conocida puede operar de manera independiente sin necesidad
de que deba ser conocido el valor exacto de la otra.
PARA QU SE USA?
La distribucin de Chi cuadrada tiene muchas aplicaciones especialmente en las
ciencias biolgicas y sociales, en donde se estudia una conducta (lo esperado)
en funcin de una respuesta (lo observado). Si el conjunto de valores observados
sigue el mismo comportamiento de lo esperado, entonces, estadsticamente, se
acepta la hiptesis que lo observado sigue el comportamiento de lo esperado.
Esta metodologa puede ser utilizada para una prueba de:
-

Frecuencias y bondad de Ajuste.

Independencia entre variables

Homogeneidad de muestras

Homogeneidad de variancias.

Casos de frecuencias y bondad de Ajuste:


-

La relacin de ingresantes a la UJCM de colegios particulares a


nacionales es de 2 a 1.

un juego al azar (Ruleta) es realmente al azar.

el nmero de accidentes que ocurre en un determinado lugar sigue una


ley de Poisson,

el nmero de tubrculos daados en plantas sigue una ley Poisson.

la longitud de una cola de espera en un lugar de atencin al pblico sigue


una Poisson.

el tiempo de respuesta de una transaccin en un banco sigue una ley


exponencial.

el nmero de artculos defectuosos en cajas de 10, sigue una ley Binomial.

el nmero de plantas germinadas de paquetes de 10 semillas sigue una


ley Binomial.

el nmero de bolsas de leche defectuosas producidas en una hora sigue


una ley Poisson.

Casos de Independencia.
-

Preferencias a ciertos productos y localidades.

Procedencia de colegio nacional y privado y el rendimiento en la


Universidad.

Relacin talla, sexo, peso, situacin econmica y el rendimiento en la


Universidad.

El nivel de pobreza y estudio en la zona rural y urbana

Casos de Homogeneidad de muestra:


-

La distribucin del consumo de tipo de carne en distritos de la provincia


Lima.

La preferencia o popularidad de candidatos por distritos.

La distribucin de estudiantes por procedencia de lugar en las


Universidades de Lima.

Todas estas pruebas y otras que involucren la comparacin de lo observado


frente a lo esperado pueden ser analizado estadsticamente mediante la prueba
de Chi Cuadrada.
La distribucin Chi cuadrada X, permite resolver tal inferencia, definida por:

Esta variable (W) sigue una distribucin de probabilidades Chi cuadrada, con
cierto grado de libertad, que es su parmetro, donde:
Oi = Frecuencia observada en una clase o categora de estudio.
Ei = Frecuencia esperada en la misma clase o categora.
Hiptesis
H0: La variable tiene distribucin X con tales parmetros
H1: La variable no tiene la distribucin X

DEFINICIN
En realidad la distribucin ji-cuadrada es la distribucin muestral de s 2. O sea que
si se extraen todas las muestras posibles de una poblacin normal y a cada
muestra se le calcula su varianza, se obtendr la distribucin muestral de
varianzas.

Para estimar la varianza poblacional o la desviacin estndar, se necesita conocer


el estadstico X2. Si se elige una muestra de tamao n de una poblacin normal
con varianza 2, el estadstico:

tiene una distribucin muestral que es una distribucin ji-cuadrada con gl=n-1
grados de libertad y se denota X 2 (X es la minscula de la letra griega ji). El
estadstico ji-cuadrada esta dado por:

Donde n es el tamao de la muestra, s 2 la varianza muestral y 2 la varianza dela


poblacin de donde se extrajo la muestra. El estadstico ji-cuadrada tambin
se puede dar con la siguiente expresin:

PROPIEDADES DE LAS DISTRIBUCIONES JI-CUADRADA


1. Los valores de X2 son mayores o iguales que 0.
2. La forma de una distribucin X2 depende del gl=n-1. En consecuencia, hay
un nmero infinito de distribuciones X2.
3. El rea bajo una curva ji-cuadrada y sobre el eje horizontal es 1.
4. Las distribuciones X2 no son simtricas. Tienen colas estrechas que se
extienden a la derecha; esto es, estn sesgadas a la derecha.
5. Cuando n>2, la media de una distribucin X 2 es n-1 y la varianza es 2(n-1).
6. El valor modal de una distribucin X2 se da en el valor (n-3).
La siguiente figura ilustra tres distribuciones X 2. Note que el valor modal aparece
en el valor (n-3) = (gl-2).

CMO SE USA LA TABLA DE LA DISTRIBUCIN CHI CUADRADA PARA


AVERIGUAR

Supongamos un riesgo del 5% (o un nivel de confianza del 95%), =0.05, y grados


de libertad =10.
Cul es el valor de
? Se busca la interseccin y el resultado es 18.307.
ste es el valor crtico para rechazar la hiptesis alternativa.

EJEMPLOS:
1. Las frecuencias esperadas de un cruce gentico entre la prole estn
en una proporcin fenotipo de 3:1 de normal a mutante. Las
frecuencias observadas fueron:

Realice la prueba estadstica para la prueba de la proporcin


planteada.
Hiptesis:
H0: La proporcin fenotipo normal y mutante es de 3:1
H1: La proporcin no es 3:1
Nivel de riesgo = 0.10
El nmero esperado por fenotipo es:
Fenotipo normal = (Oi) P(normal) = 90 (3/4) = 67.5
Fenotipo mutante= (Oi) P(mutante) = 90 (1/4) = 22.5

Grados de libertad = 2 - 1 = 1
Los grados de libertad es igual a 1, no es necesario la correccin de Yates
porque la muestra es mayor de 50. El valor de Chi cuadrado calculado es:

X(calculado) = 2.3148 + 6.9444 = 9.2592


El valor crtico para gl = 1 y = 0.10

X2(1) = 2.705
Se observa que el valor calculado es mayor que el tabular, entonces se
rechaza la hiptesis planteada; por lo tanto se concluye que no hay
suficiente razn estadstica para tal afirmacin sobre la proporcin
planteada.

2. Suponga que los tiempos requeridos por un cierto autobs para


alcanzar un de sus destinos en una ciudad grande forman una
distribucin normal con una desviacin estndar
=1 minuto. Si se
elige al azar una muestra de 17 tiempos, encuentre la probabilidad de
que la varianza muestral sea mayor que 2.
Solucin:
Primero se encontrar el valor de ji-cuadrada correspondiente a s 2=2 como
sigue:

El valor de 32 se busca adentro de la tabla en el rengln de 16 grados de


libertad y se encuentra que a este valor le corresponde un rea a la
derecha de 0.01. En consecuencia, el valor de la probabilidad es P(s 2>2)

3. Encuentre la probabilidad de que una muestra aleatoria de 25


observaciones, de una poblacin normal con varianza
una varianza muestral:

, tenga

a) Mayor que 9.1


b) Entre 3.462 y 10.745
Solucin.
a. Primero se proceder a calcular el valor de la ji-cuadrada:

Al buscar este nmero en el rengln de 24 grados de libertad nos da un


rea a la derecha de 0.05. Por lo que la P(s 2 >9.1) = 0.05
b. Se calcularn dos valores de ji-cuadrada:

y
Aqu se tienen que buscar los dos valores en el rengln de 24 grados de
libertad. Al buscar el valor de 13.846 se encuentra un rea a la derecha de
0.95. El valor de 42.98 da un rea a la derecha de 0.01. Como se est
pidiendo la probabilidad entre dos valores se resta el rea de 0.95 menos
0.01 quedando 0.94.
Por lo tanto la P(3.462

s2

10.745) = 0.94

4. En una investigacin sociolgica se efecta una determinada pregunta


a 5000 personas, respondiendo todas ellas si o no. De estas
respuestas, 2449 son afirmativas y 2551 negativas. Puede afirmarse,
al nivel de significacin del 5 % que la poblacin se halla igualmente
repartida en orden a su opinin sobre la pregunta formulada?
Anlisis
Decir que la poblacin se halla igualmente repartida en cuanto a su opinin
es equivalente a establecer la hiptesis de que la proporcin de respuestas
afirmativas es igual a la proporcin de respuestas negativas.
Ho: la poblacin se halla igualmente repartida en orden a la pregunta
formulada.
H1: la poblacin no se halla igualmente repartida.
La frecuencia terica establecida para la poblacin segn Ho es entonces
mitad / mitad: es decir respuesta afirmativa: 2500, y respuesta negativa
2500.
Establecemos la tabla de contingencia:

La frmula que d el estadstico de prueba (de la muestra) es el siguiente:

Que debe ser comparado con el estimador (estadstico terico aproximado


de la poblacin) dado en una tabla

Donde

es el nivel de significacin estadstica


K = (i 1)*(j-1) K: grados de libertad de la distribucin, i: nmero de filas, j:
nmero de columnas.
Criterio de decisin:

Se acepta Ho cuando
estadstico < estimador: se acepta Ho y se rechaza la hiptesis alternativa
H1
En nuestro caso:
La desviacin de los valores de la encuesta es debida al azar, y por ello,
aceptamos la hiptesis de que la poblacin se halla igualmente repartida en
orden a la pregunta formulada.
5. Al nivel de significacin del 5 %, contrastar la hiptesis de que una
moneda est bien construida, sabiendo que los resultados obtenidos
en 5000 lanzamientos fueron: cara 1820 veces, cruz 3180 veces.
Anlisis
Al decir que la moneda est bien construida, quiere expresarse que los dos
sucesos, cara y cruz, son igualmente probables. Por ello, la frecuencia
esperada de cara y cruz en 5000 lanzamiento seria de 2500 y 2500
respectivamente.
Ho: las monedas estn bien construidas, los dos sucesos son igualmente
probables.
H1: las monedas estn defectuosas o no bien construidas.
Establecemos la tabla de contingencia:

La frmula que d el estadstico de prueba (de la muestra) es el siguiente:

Que debe ser comparado con el estimador (estadstico terico aproximado


de la poblacin ) dado en una tabla.

Donde
es el nivel de significacin estadstica )
K = (i 1)*(j-1) K: grados de libertad de la distribucin, i: nmero de filas, j:
nmero de columnas.
Criterio de decisin:

Al nivel de significacin del 5 %, la desviacin NO es debida slo al azar, y


por ello, RECHAZAMOS la hiptesis de que la moneda estn bien
construida.
6. Con objeto de estudiar la demanda de un producto durante los cuatro
trimestres de un ao se dispone de la siguiente informacin:

Establecer una hiptesis sobre el carcter de la distribucin de la


demanda, verificando la bondad de ajuste (para comprobar si los
datos se ajustan a una distribucin concreta) al nivel de significacin
del 1 %.
Anlisis

El anlisis de la informacin que proporciona la distribucin uniforme de la


demanda, esto es que la misma (la demanda) se distribuye por igual a lo
largo de los cuatro trimestres, por lo que la frecuencia de demanda
esperada o terica para cada trimestre es de 4000/4 = 1000 unidades c/
trimestre.
Ho: la demanda se distribuye uniformemente a lo largo de los 4 trimestres.
H1: la demanda no se distribuye uniformemente.
Establecemos la tabla de contingencia:

La frmula que d el estadstico de prueba (de la muestra) es el siguiente:

Que debe ser comparado con el estimador (estadstico terico aproximado


de la poblacin) dado en una tabla.

Donde
es el nivel de significacin estadstica
K = (i 1)*(j-1) K: grados de libertad de la distribucin, i: nmero de filas =
4, j: nmero de columnas = 2
Criterio de decisin:

Al nivel de significacin del 1 %, la desviacin obtenida entre lo que


establece la hiptesis y la informacin obtenida NO es debida slo al azar, y
por ello, RECHAZAMOS la hiptesis de que la demanda se distribuya por
igual a lo largo de los cuatro trimestres.
7. Para conseguir determinada calificacin profesional, 100 personas se
someten a dos tipos de tests independientes entre si; el resultado de
cada test puede ser favorable (F) o desfavorable (D) para cada
individuo. A la vista de los resultados que figuran en la tabla, los
calificadores determinan 3 grupos, resultando indiferente, a efectos de
la inclusin en el segundo, el test donde se obtuvo la calificacin
favorable. Contrastar, al nivel de significacin del 5 %, la hiptesis de
que la proporcin terica de individuos calificados con F o con D en
cada tests es la que se seala.

Anlisis
Ho: la proporcin terica es de , , para cada grupo respectivamente.
H1: la proporcin terica es distinta a , , respectivamente.
Establecemos la tabla de contingencia:

La frmula que d el estadstico de prueba (de la muestra) es el siguiente:

Que debe ser comparado con el estimador (estadstico terico aproximado


de la poblacin) dado en una tabla

Donde
es el nivel de significacin estadstica
K = (i 1)*(j-1) K: grados de libertad de la distribucin, i: nmero de filas =
3, j: nmero de columnas = 2
Criterio de decisin:

Al nivel de significacin del 5 %, la desviacin obtenida entre lo que


establece la hiptesis y la informacin obtenida no es significativa. Dicha
desviacin es debida slo al azar, y por ello, aceptaremos la hiptesis de
que la proporcin de los tres grupos es , , , respectivamente.
8. Mndel tena arvejas con dos tipos de tegumento, rugoso y liso y,
segn su hiptesis, en cruzamientos realizados entre ciertos tipos de
plantas, el esperaba que aparecieran en la descendencia de dichos
cruzamientos, arvejas de tegumento liso y rugoso en la proporcin
3:1. Supongamos que en un experimento en el cual se obtiene una
descendencia compuesta por 400 semillas, un genetista encuentra 285
semillas de tegumento liso y 115, de tegumento rugoso. Sera
razonable, con = 0.05, pensar que esa proporcin observada no est
demasiado alejada de la proporcin 3:1 dictada por la ley de Mndel?
Anlisis
Segn hiptesis de Mndel la frecuencia esperada o terica de los dos tipos
de tegumentos era 3:1, es decir, 3 semillas de tegumento liso por cada
semilla de tegumento rugoso. Calculando dicha proporcin para las 400
semillas sern: *400 = 300 (teg. liso), y * 400 = 100 (teg. rug.). Se trata
de comprobar si los datos se ajustan a una distribucin concreta, por lo cual
utilizamos el mtodo de Test o prueba de bondad de ajuste o significancia).
H0: la proporcin es 3:1; H1: la proporcin no es 3:1.
Nivel de significacin. = 0.05.

Establecemos una tabla:

La frmula que d el estadstico de prueba (de la muestra) es el siguiente:

Que debe ser comparado con el estimador (estadstico terico) dado en una
tabla

Donde
es el nivel de significacin estadstica
K = (i 1)*(j-1) K: grados de libertad de la distribucin, i: nmero de filas =
2, j: nmero de columnas = 2 (de datos en la tabla de contingencia, no de
clculos)
Criterio de decisin:

Al nivel de significacin del 5 %, la desviacin obtenida entre lo que


establece la hiptesis de Mndel y la informacin obtenida no es
significativa. Dicha desviacin es debida slo al azar, y por ello,
aceptaremos la hiptesis de que la proporcin entre los tegumentos lisos y
rugosos es 3:1 respectivamente.

9. En un estudio del mercado, se tiene como objetivo establecer si las


preferencias acerca del envase de dulce de leche son similares para
hombres y mujeres. Se ha hecho una encuesta a 200 personas y se
han obtenido los siguientes datos:

Establecer un contraste de hiptesis entre las preferencias de envase


entre hombres y mujeres con nivel de significacin del 5%.
Anlisis
Como podemos observar, se trata de una prueba de homogeneidad entre la
poblacin hombres y mujeres. Segn hiptesis podemos establecer que las
preferencias no difieren segn el sexo por lo cual optamos que la frecuencia
esperada de preferencia para cada tipo de envase es del 50 % del total
para hombres y mujeres.
H0: las preferencias (%) acerca del envase de dulce de leche no difieren
entre hombres y mujeres
H1: las preferencias (%) acerca del envase de dulce de leche difieren entre
hombres y mujeres
Establecemos la tabla de contingencia:

La frmula que d el estadstico de prueba (de la muestra) es el siguiente:

Finalmente, el estadstico
Que debe ser comparado con el estimador (estadstico terico) dado en la
tabla 2

Donde
es el nivel de significacin estadstica
K = (i 1)*(j-1) K: grados de libertad de la distribucin, i: nmero de filas =
2, j: nmero de columnas = 4 (de datos en la tabla de contingencia, no
incluir la columna de clculos)
Criterio de decisin:

Se rechaza Ho, las preferencias acerca del envase de dulce de leche


difieren entre hombres y mujeres.

10. La siguiente tabla muestra las frecuencias observadas al lanzar un


dado 120 veces. Ensayar la hiptesis de que el dado est bien hecho
al nivel de significacin del 0.05.

Cara

Frecuencia Observada

25

17

15

23

24

16

Ho; Las frecuencias observadas y esperadas son significativamente iguales


(Dado bien hecho)
H1; Las frecuencias observadas y esperadas son diferentes (dado cargado).
Primero se procede a calcular los valores esperados. Como es bien sabido
por todos la probabilidad de que caiga cualquier nmero en un dado no
cargado es de 1/6. Como la suma de los valores observados es de 120, se
multiplica este valor por 1/6 dando un resultado de 20 para cada
clasificacin.
Cara

Total

Frecuencia Observada

25

17

15

23

24

16

120

Frecuencia esperada

20

20

20

20

20

20

Grados de libertad = k-1-m = 6-1-0 = 5


No se tuvo que calcular ningn parmetro para obtener las frecuencias
esperadas.

Regla de decisin:
Si X2R

11.1 no se rechaza Ho.

Si X2R >11.1 se rechaza Ho.

Justificacin y decisin:
Como 5 es menor a 11.1 no se rechaza H o y se concluye con una
significacin de 0.05 que el dado est bien hecho.
11. En los experimentos de Mendel con guisantes, observ 315 lisos y
amarillos, 108 lisos y verdes, 101 rugosos y amarillos y 32 rugosos y
verdes. De acuerdo con su teora, estos nmeros deberan presentarse
en la proporcin 9:3:3:1. Hay alguna evidencia que permita dudar de
su teora al nivel de significacin del 0.01?
Ensayo de Hiptesis:
Ho; La teora de Mendel es acertada.
H1; La teora de Mendel no es correcta.
El nmero total de guisantes es 315+108+101+32=556. Puesto que los
nmeros esperados estn el la proporcin 9:3:3:1 (9+3+3+1=16), se
esperara:

lisos y amarillos

lisos y verdes

rugosos y amarillos

rugosos y verdes
Grados de libertad = k-1-m = 4-1-0 = 3
No se tuvo que calcular ningn parmetro para obtener las frecuencias
esperadas.

Regla

de

Si X2R

11.3

decisin:
no se rechaza Ho.

Si X2R >11.3 se rechaza Ho.


Clculos:

Justificacin y decisin:
Como 0.470 es menor que 11.3 no se rechaza H o y se concluye con un
nivel de significacin de 0.01 que la teora de Mendel es correcta.
Como el valor de 0.470 est cercano a cero, se procede a hacer un ensayo
unilateral izquierdo:
Ensayo de Hiptesis:
Ho; La teora de Mendel es acertada.
H1; La teora de Mendel es muy acertada.

Regla de decisin:
Si X2R

0.115 no se rechaza Ho.

Si X2R < 0.115 se rechaza Ho.

Como el valor de 0.470 no es menor a 0.115 se concluye que el


experimento o la teora de Mendel solo es buena.