Anda di halaman 1dari 22

Distribución de Pearson, llamada también ji cuadrada(o) o chi cuadrado(a) (χ²) Eudo

En estadística, la distribución de Pearson, llamada también ji cuadrada(o) o chi


cuadrado(a) (χ²), es unadistribución de probabilidad continua con un parámetro que
representa los grados de libertad de la variable aleatoria

Donde son variables aleatorias normales independientes de media cero y varianza uno.
El que la variable aleatoria tenga esta distribución se representa habitualmente
así: .

Índice

 1Propiedades
o 1.1Función de densidad
o 1.2Función de distribución acumulada
 2Relación con otras distribuciones
 3Aplicaciones
 4Véase también
 5Enlaces externos

Propiedades[editar]
Función de densidad[editar]
Su función de densidad es:

donde es la función gamma.

[Expandir]Demostración

Función de distribución acumulada[editar]


Su función de distribución es

donde es la función gamma incompleta.


El valor esperado y la varianza de una variable aleatoria X con distribución χ² son,
respectivamente, k y 2k.

Relación con otras distribuciones[editar]


La distribución χ² es un caso especial de la distribución gamma. De

hecho, Como consecuencia, cuando , la distribución


χ² es una distribución exponencial de media .
Cuando k es suficientemente grande, como consecuencia del teorema central del
límite, puede aproximarse por una distribución normal:

Aplicaciones[editar]
La distribución χ² tiene muchas aplicaciones en inferencia estadística. La más
conocida es la de la denominada prueba χ² utilizada como prueba de independencia y
como prueba de bondad de ajuste y en la estimación de varianzas. Pero también está
involucrada en el problema de estimar la media de una población normalmente
distribuida y en el problema de estimar la pendiente de una recta de regresión lineal, a
través de su papel en la distribución t de Student.
Aparece también en todos los problemas de análisis de varianza por su relación con
la distribución F de Snedecor, que es la distribución del cociente de dos variables
aleatorias independientes con distribución χ².

Prueba χ² de Pearson
Véase también: distribuciones de Pearson

La prueba χ² de Pearson se considera una prueba no paramétrica que mide la


discrepancia entre una distribución observada y otra teórica (bondad de ajuste), indicando
en qué medida las diferencias existentes entre ambas, de haberlas, se deben al azar en
el contraste de hipótesis. También se utiliza para probar la independencia de dos variables
entre sí, mediante la presentación de los datos en tablas de contingencia.
La fórmula que da el estadístico es la siguiente:

Cuanto mayor sea el valor de , menos verosímil es que la hipótesis sea correcta.
De la misma forma, cuanto más se aproxima a cero el valor de chi-cuadrado, más
ajustadas están ambas distribuciones.
Los grados de libertad gl vienen dados por :

Donde r es el número de filas y k el de columnas.

 Criterio de decisión:

No se rechaza cuando . En caso contrario sí se


rechaza.
Donde t representa el valor proporcionado por las tablas, según el nivel
de significación estadística elegido.
Chi-cuadrado de ajuste

En una prueba de ajuste la hipótesis nula establece que una variable X


tiene una cierta distribución de probabilidad con unos determinados valores de
los parámetros. El tipo de distribución se determina, según los casos, en
función de: La propia definición de la variable, consideraciones teóricas al
margen de esta y/o evidencia aportada por datos anteriores al experimento
actual.

A menudo, la propia definición del tipo de variable lleva implícitos los


valores de sus parámetros o de parte de ellos; si esto no fuera así dichos
parámetros se estimarán a partir de la muestra de valores de la variable que
utilizaremos para realizar la prueba de ajuste.

Como en casos anteriores, empezaremos definiendo las hipótesis.

Hipótesis nula: X tiene distribución de probabilidad f(x) con


parámetros y1,..., yp

Hipótesis alternativa: X tiene cualquier otra distribución de


probabilidad.

Es importante destacar que el rechazo de la hipótesis nula no implica


que sean falsos todos sus aspectos sino únicamente el conjunto de ellos; por
ejemplo, podría ocurrir que el tipo de distribución fuera correcto pero que nos
hubiésemos equivocado en los valores de los parámetros.

Obviamente, necesitaremos una muestra de valores de la variable X. Si


la variable es discreta y tiene pocos valores posible estimaremos las
probabilidades de dichos valores mediante sus frecuencias muestrales; si la
variable es continua o si es una discreta con muchos o infinitos valores
estimaremos probabilidades de grupos de valores (intervalos).

Metodológicamente, la prueba se basa en la comparación entre la serie


de frecuencias absolutas observadas empíricamente para los valores de la
variable (Oi) y las correspondientes frecuencias absolutas teóricas obtenidas
en base a la función de probabilidad supuesta en la hipótesis nula (Ei).

Así pues, una vez calculadas las frecuencias absolutas de cada valor o
intervalo de valores, obtendremos el número total de observaciones de la
muestra (T) sumando las frecuencias observadas
Para calcular las frecuencias esperadas repartiremos este número total
de observaciones (T) en partes proporcionales a la probabilidad de cada
suceso o grupo de sucesos. Para ello calcularemos dichas probabilidades
utilizando la función de probabilidad definida en la hipótesis nula f(x), de modo
que, cada valor Ei tendrá la siguiente expresión:

Por tanto, tendremos los siguientes datos para la prueba:

Valor de la variable x1 x2 x3 ... xi ... xk


Frecuencias observadas O1 O2 O3 ... Oi ... Ok

Frecuencias esperadas E1 E2 E3 ... Ei ... Ek

Si la hipótesis nula es cierta, las diferencias entre valores observados y


esperados (que siempre existirán por tratarse de una muestra aleatoria) son
atribuibles, exclusivamente, al efecto del azar. En estas condiciones, se puede
calcular un parámetro que depende de ambos, cuya distribución se ajusta a
una chi-cuadrado.

Si, por el contrario, la hipótesis nula fuera falsa los Ei ya no serían,


realmente, los valores esperados de las frecuencias; por tanto, las diferencias
entre los valores "esperados" y los observados reflejarían no sólo el efecto del
azar sino también las diferencias entre los Ei y la auténtica serie de valores
esperados (desconocida) Como consecuencia, las diferencias de los
numeradores de la expresión anterior tienden a ser más grandes y, por estar
elevadas al cuadrado, la suma de cocientes ser positiva y mayor que lo que se
esperaría para los valores de una chi-cuadrado.

Por tanto, el parámetro anterior será el estadístico de contraste de la


prueba de hipótesis y la región crítica se encontrar siempre en la cola derecha
de la distribución chi-cuadrado. Evidentemente, esta prueba será siempre de
una sola cola.

Estadístico de contraste

Se acepta la hipótesis nula si , el percentil 1 – α de la


distribución chi-cuadrado con grados de libertad.

Cabe señalar que en las pruebas chi-cuadrado lo corriente es que


pretendamos comprobar que una variable tiene una cierta distribución y, por
tanto, habitualmente, nos vemos obligados a colocar nuestra propia hipótesis
en la hipótesis nula. Únicamente podremos colocar nuestra hipótesis en la
alternativa en el caso excepcional de que pretendamos demostrar que cierto
tratamiento produce una distorsión de la distribución básica de la variable en
estudio.

El número de grados de libertad de la variable chi-cuadrado se calcula


de la siguiente forma:

 A priori, tendrá tantos grados de libertad como parejas frecuencia


observada - frecuencia esperada.

 A esta cantidad se debe restar el número de restricciones lineales


impuestas a las frecuencias observadas, es decir, el número de
parámetros que es necesario calculardirectamente a partir de los
valores observados para establecer los valores esperados. Este número
es, como mínimo, uno ya que siempre tendremos que calcular el número
total de observaciones de la muestra.

Una condición básica para que podamos llevar a cabo una prueba chi-
cuadrado es que las frecuencias de las distintas clases deben ser
suficientemente altas como para garantizar que pequeñas desviaciones
aleatorias en la muestra no tengan importancia decisiva sobre el valor del
estadístico de contraste.

Las reglas que determinan cuando es posible o no realizar el contraste


varían mucho de unos autores a otros. En un extremo de máxima rigidez se
encuentran aquellos que opinan que no se puede realizar la prueba cuando
alguna de las frecuencias, observadas o esperadas, sea menor que 5. En el
otro extremo se encuentran quienes opinan que, para que la prueba sea viable
ninguna de las frecuencias esperadas debe ser menor que 1 y no más del 25%
pueden ser menores que 5; en lo que refiere a las frecuencias observadas no
existirían límites. La autora de este texto simpatiza más con la segunda
postura, no sólo por razones prácticas, sino porque lo razonable es que la
distribución esperada esté adecuadamente definida y, por tanto, no debe incluir
valores muy bajos; sin embargo, los valores extremos en la distribución
observada simplemente reflejan diferencias importantes entre la distribución
supuesta por la hipótesis nula y la real.

Sea cual sea el criterio que elijamos, si resultara que la prueba no es


viable podríamos recurrir a englobar los valores o clases de valores con sus
vecinos más próximos y pasar así a engrosar sus frecuencias. Este
procedimiento no puede llevarse hasta el absurdo pero proporciona una salida
digna a situaciones complejas. En casos excepcionales se pueden englobar
valores que no sean vecinos porque exista algún nexo lógico de conexión entre
ellos.

Cuando sea necesario agrupar valores, los grados de libertad no se


deben calcular hasta que tengamos establecidas definitivamente las parejas de
frecuencias observadas y esperadas con las que calcularemos el estadístico de
contraste.

Chi-cuadrado de contingencia o independencia ANGGIE

La prueba chi-cuadrado de contingencia sirve para comprobar la


independencia de frecuencias entre dos variables aleatorias, X e Y.

Las hipótesis contrastadas en la prueba son:

Hipótesis nula: X e Y son independientes.

Hipótesis alternativa: X e Y no son independientes (No importa cual


sea la relación que mantengan ni el grado de esta.

La condición de independencia, tal como fue definida en la página


anterior era: X e Y son independientes si y sólo si para cualquier pareja de
valores x e y la probabilidad de que X tome el valor x e Y el valor y,
simultáneamente, es igual al producto de las probabilidades de que cada una
tome el valor correspondiente.

Por tanto, todo lo que necesitamos serán unas estimas de las funciones
de probabilidad de ambas variables por separado (f(x) y f(y)) y de la función de
probabilidad conjunta (f(x,y))
Empezaremos la prueba tomando una muestra de parejas de valores
sobre la que contaremos la frecuencia absoluta con la que aparece cada
combinación de valores (xi,yj) o de grupos de valores (i,j) (Oij) La tabla
siguiente, en la que se recogen estos datos, es en realidad nuestra estimación
de la función de probabilidad conjunta multiplicada por el número total de datos
(T).

Para obtener las estimas de las funciones de probabilidad marginales


debemos sumar por filas y por columnas los valores de las frecuencias
conjuntas. Las sumas de filas (Fi) son, en cada caso, el número de veces que
hemos obtenido un valor de X (xi) en cualquier combinación con distintos
valores de Y, es decir, son nuestra estima de la función de probabilidad de X
multiplicada por el número total de observaciones; análogamente, las sumas de
columnas (Cj) son nuestra estima de la función de probabilidad de Y
multiplicada por el número total de observaciones.

El número total de observaciones lo podemos obtener como la suma de


todas las frecuencias observadas o, también, como la suma de las sumas de
filas o de las sumas de columnas:

Así pues, si las variables fueran independientes debería cumplirse que

Naturalmente, nadie espera que esta condición se cumpla exactamente


debido al efecto de los errores de muestreo aleatorio. Por tanto, nuestro
problema consiste en distinguir entre las diferencias producidas por efecto del
muestreo y diferencias que revelen falta de independencia.
Podemos convertir la ecuación anterior a frecuencias absolutas
multiplicando por T:

 Si X e Y son independientes, Oij debe ser igual a y,


por tanto,

 bajo la hipótesis de independencia, es el valor


esperado de Oij (Eij)

Tal como pasaba en la prueba anterior, si las variables son


independientes, es decir, si las frecuencias Eij son realmente los valores
esperados de las frecuencias Oij, se puede calcular un parámetro que depende
de ambas que tiene distribución chi-cuadrado,

Por otra parte, si las variables no son independientes, las diferencias


entre las series de frecuencias observadas y esperadas serán mayores que las
atribuibles al efecto del azar y, al estar elevadas al cuadrado en el numerador
de la expresión anterior, ésta tenderá a ser mayor que lo que suele ser el valor
de una variable chi-cuadrado.

Por tanto, el parámetro anterior ser el estadístico de la prueba de


hipótesis y la región crítica se encontrar siempre en la cola derecha de la
distribución chi-cuadrado. Nuevamente, esta prueba será siempre de una sola
cola.

Estadístico de contraste

Se acepta la hipótesis nula si , el percentil 1 – α de la


distribución chi-cuadrado con grados de libertad.
Tal como ocurría en la prueba anterior lo corriente es que queramos
demostrar que dos variables son independientes, es decir, que, habitualmente,
nos veremos obligados a colocar nuestra hipótesis en la hipótesis nula.

El número de grados de libertad de la chi-cuadrado que sirve de


contraste se calcula de la siguiente forma:

 A priori tendremos tantos grados de libertad como combinaciones de


valores xi, yj tengamos (I J)

 A este número tendremos que restarle I debido a que, para calcular las
frecuencias esperadas, necesitamos calcular las I sumas de filas en la
tabla anterior. Conocidas las sumas de filas obtenemos el número total
de observaciones sin perder ningún grado de libertad.

 A continuación, necesitaremos calcular, a partir de las frecuencias


observadas J - 1 de las sumas de columnas; la restante podemos
obtenerla restando la suma de las anteriores del total de observaciones
(T).

En resumen, el número de grados de libertad de la prueba es el producto


del número de filas menos uno por el número de columnas menos uno.

En cuanto a la magnitud mínima necesaria de las frecuencias


observadas y esperadas, rigen las mismas normas que en el caso de la prueba
de ajuste. En este caso, si nos viéramos obligados a juntar valores para sumar
frecuencias, debemos unir columnas o filas completas (y contiguas).
Obviamente, los grados de libertad no deben calcularse hasta que no se hayan
realizado todas las agrupaciones necesarias y quede claro cual es el número
de filas y columnas de la tabla definitiva.

Como hemos visto, esta prueba no hace ninguna suposición acerca del
tipo de distribución de ninguna de las variables implicadas y utiliza únicamente
información de la muestra, es decir, información contingente. Esta es la razón
por la que, habitualmente, se le llama chi-cuadrado de contingencia.

Comparación múltiple de distintas proporciones o probabilidades


JESELLE

Una aplicación concreta de la chi-cuadrado de independencia es la


comparación múltiple de las distintas proporciones o probabilidades de un
suceso en I poblaciones diferentes.
Supongamos que tenemos I poblaciones en las cuales las
observaciones se pueden clasificar como A o no-A. Llamemos Pi a la
probabilidad del suceso A en cada población i y P a la frecuencia media de A
en el conjunto de las poblaciones; la probabilidad del suceso no-A en cada
población i ser 1 - Pi y la media de todas ellas valdrá 1 - P.

Las hipótesis de la prueba serán:

Hipótesis nula:

Hipótesis alternativa:

Si tomamos una muestra de tamaño ni en cada población y contamos en


cada caso el número de sucesos A aparecidos en la muestra obtendríamos la
siguiente tabla:

Esta es una tabla típica a la que se puede aplicar la metodología de la prueba


chi-cuadrado de independencia. Veamos como corresponden las hipótesis de
una y otra prueba. Si la clasificación de las observaciones en sucesos A y no-A
fuera independiente de la clasificación en muestras, la frecuencia relativa de A
(y la de no-A) serían iguales en todos los casos y los valores esperados de las
frecuencias absolutas se calcularían multiplicando la estima común de la
frecuencia relativa global por el número de observaciones en cada muestra.

La estima global de la frecuencia de A se hallara dividiendo el número


total de sucesos A por el número total de observaciones:
lo cual no es otra cosa que el cociente entre la suma de la fila uno (F 1) y el total
de observaciones (T)

Por tanto, el valor esperado de la frecuencia observada de A en la


muestra i (EA,i) será:

La estima global de la frecuencia de no-A se hallara dividiendo el


número total de sucesos no-A por el número total de observaciones:

lo cual no es otra cosa que el cociente entre la suma de la fila dos (F2) y el total
de observaciones (T)

Por tanto, el valor esperado de la frecuencia observada de no-A en la


muestra i (Eno-A,i) será:

Es decir, los valores esperados se calcularían, en pura lógica, tal como


indica el procedimiento estándar de la prueba de contingencia. En definitiva:

Hipótesis nula: La clasificación en sucesos es


independiente de la clasificación en poblaciones.

Hipótesis alternativa: La clasificación en sucesos


no es independiente de la clasificación en poblaciones.
En resumen, la prueba de comparación múltiple de proporciones se
realizar mediante una prueba de contingencia que nos dirá si las probabilidades
son todas iguales o si, al menos, existe una que sea diferente de las demás.

Los grados de libertad serán siempre:

Prueba de homogeneidad de muestras Oliver

Otra de las aplicaciones interesantes de la prueba chi-cuadrado de


independencia consiste en la comprobación de la homogeneidad de distintas
muestras de una variable.

Supongamos que hemos obtenido J muestras de tamaño n j de una


misma variable aleatoria (X) y queremos comprobar si son homogéneas, es
decir, si la variable tiene la misma distribución de probabilidad en todas ellas,
bien para utilizarlas conjuntamente, bien porque se trate de identificar
diferencias entre las poblaciones de procedencia de las distintas muestras. Las
frecuencias observadas serán las de la tabla siguiente, en la que F i es la
frecuencia absoluta total del valor xi y T es el número total de

observaciones

El razonamiento en este caso es idéntico al anterior. Si las muestras son


homogéneas, se puede obtener una estima conjunta de la frecuencia de cada
valor xi (Fi / T) y el valor esperado de la frecuencia absoluta de xi en cada
muestra se calcular como el producto de dicha frecuencia por el tamaño de la
muestra correspondiente
Así pues, las hipótesis de la prueba serán:

Hipótesis nula: Las muestras son homogéneas La clasificación


de las observaciones según los valores de la variable es
independiente de la clasificación en muestras.

Hipótesis alternativa: Las muestras no son homogéneas. La


clasificación de las observaciones según los valores de la
variable no es independiente de la clasificación en muestras.

Obviamente, la prueba se realizar según la metodología habitual.

En este caso, a la prueba chi-cuadrado de contingencia se le suele


llamar chi-cuadrado de homogeneidad.

La prueba del chi cuadrado es solo un cálculo que se utiliza para ver qué tanto se parece la
distribución observada con los resultados teóricos, para determinar si un suceso es al azar o
tiene alguna tendencia. Por ejemplo, si lanzas una moneda, en teoría tienes 50% de
probabilidad de cara o cruz en cada uno. Si la lanzas y te sale un resultado más seguido que el
otro, entonces puedes determinar mediante el chi cuadrado que los resultados no son al azar.
Para interpretar este dato, el resultado que te salga lo tienes que comparar con un "nivel de
tolerancia" que quieras dar al error en una distribución. Entre más alta sea el valor de la chi
cuadrada, será mayor la probabilidad de que los datos tengan una tendencia. Normalmente se
utiliza la siguiente fórmula para aceptar o rechazar el valor del chi cuadrado.
x²<x²t(r-1)(k-1)
Donde
x²=chi cuadrada
t=Valor proporcionado por las tablas, según el nivel de significación elegido.
r=número de filas
k=número de columnas

PRUEBAS CHI-CUADRADA Y ESTADISTICA NO PARAMETRICA

Como ya se ha visto varias veces, los resultados obtenidos de


muestras no siempre concuerdan exactamente con los resultados
teóricos esperados, según las reglas de probabilidad. Por ejemplo,
aunque consideraciones teóricas conduzcan a esperar 50 caras y 50
cruces cuando se lanza 100 veces una moneda bien hecha, es raro
que se obtengan exactamente estos resultados.
Supóngase que en una determinada muestra se observan una serie
de posibles sucesos E1, E2, E3, . . . , EK, que ocurren con frecuencias
o1, o2, o3, . . ., oK, llamadas frecuencias observadas y que, según las
reglas de probabilidad, se espera que ocurran con frecuencias e1, e2,
e3, . . . ,eK llamadas frecuencias teóricas o esperadas.

A menudo se desea saber si las frecuencias observadas difieren


significativamente de las frecuencias esperadas. Para el caso en que
solamente son posibles dos sucesos E1 y E2 como, por ejemplo, caras
o cruces, defectuoso, etc., el problema queda resuelto
satisfactoriamente con los métodos de las unidades anteriores. En
esta unidad se considera el problema general.

Definición de X2

Una medida de la discrepancia existente entre las frecuencias


observadas y esperadas es suministrada por el estadístico X2, dado
por:

donde si el total de frecuencias es N,

Si X2 = 0, las frecuencias observadas y esperadas concuerdan


exactamente, mientras que si X2>0, no coinciden exactamente. A
valores mayores de X2, mayores son las discrepancias entre las
frecuencias observadas y esperadas.

Si las frecuencias esperadas son al menos iguales a 5, la


aproximación mejora para valores superiores.

El número de grados de libertad está dado por:

=k–1–m

en donde:

K = número de clasificaciones en el problema.

m = número de parámetros estimados a partir de los datos muestrales


para obtener los valores esperados.
Ensayo de Hipótesis

En la práctica, las frecuencias esperadas se calculan de acuerdo con


la hipótesis Ho. Si bajo esta hipótesis el valor calculado de X2 dado es
mayor que algún valor crítico, se deduce que las frecuencias
observadas difieren significativamente de las esperadas y se rechaza
Ho al nivel de significación correspondiente. En caso contrario, no se
rechazará. Este procedimiento se llama ensayo o prueba de chi-
cuadrado de la hipótesis.

Debe advertirse que en aquellas circunstancias en que X2 esté muy


próxima a cero debe mirarse con cierto recelo, puesto que es raro que
las frecuencias observadas concuerden demasiado bien con las
esperadas. Para examinar tales situaciones, se puede determinar si el
valor calculado de X2 es menor que las X2 críticas o de tabla (ensayo
unilateral izquierdo), en cuyos casos se decide que la concordancia
es bastante buena.

Ejemplos:

1. La siguiente tabla muestra las frecuencias observadas al lanzar


un dado 120 veces. Ensayar la hipótesis de que el dado está
bien hecho al nivel de significación del 0.05.

Cara 1 2 3 4 5 6

Frecuencia Observada 25 17 15 23 24 16

Solución:

Ensayo de Hipótesis:

Ho; Las frecuencias observadas y esperadas son


significativamente iguales

(dado bien hecho)

H1; Las frecuencias observadas y esperadas son diferentes


(dado cargado).

Primero se procede a calcular los valores esperados. Como es


bien sabido por todos la probabilidad de que caiga cualquier
número en un dado no cargado es de 1/6. Como la suma de los
valores observados es de 120, se multiplica este valor por 1/6
dando un resultado de 20 para cada clasificación.
Cara 1 2 3 4 5 6 Total

Frecuencia Observada 25 17 15 23 24 16 120

Frecuencia esperada 20 20 20 20 20 20

Grados de libertad = k-1-m = 6-1-0 = 5

No se tuvo que calcular ningún parámetro para obtener las


frecuencias esperadas.

Regla de decisión:

Si X2R 11.1 no se rechaza Ho.

Si X2R >11.1 se rechaza Ho.

Cálculos:

Justificación y decisión:

Como 5 es menor a 11.1 no se rechaza Ho y se concluye con


una significación de 0.05 que el dado está bien hecho.

2. En los experimentos de Mendel con guisantes, observó 315 lisos


y amarillos, 108 lisos y verdes, 101 rugosos y amarillos y 32
rugosos y verdes. De acuerdo con su teoría, estos números
deberían presentarse en la proporción 9:3:3:1. ¿Hay alguna
evidencia que permita dudar de su teoría al nivel de significación
del 0.01?

Solución:

Ensayo de Hipótesis:
Ho; La teoría de Mendel es acertada.

H1; La teoría de Mendel no es correcta.

El número total de guisantes es 315+108+101+32=556. Puesto


que los números esperados están el la proporción 9:3:3:1
(9+3+3+1=16), se esperaría:

lisos y amarillos

lisos y verdes

rugosos y amarillos

rugosos y verdes

Grados de libertad = k-1-m = 4-1-0 = 3

No se tuvo que calcular ningún parámetro para obtener las


frecuencias esperadas.

Regla de decisión:

Si X2R 11.3 no se rechaza Ho.

Si X2R >11.3 se rechaza Ho.

Cálculos:
Justificación y decisión:

Como 0.470 es menor que 11.3 no se rechaza Ho y se concluye


con un nivel de significación de 0.01 que la teoría de Mendel es
correcta.

Como el valor de 0.470 está cercano a cero, se procede a hacer


un ensayo unilateral izquierdo:

Ensayo de Hipótesis:

Ho; La teoría de Mendel es acertada.

H1; La teoría de Mendel es muy acertada.

Regla de decisión:

Si X2R 0.115 no se rechaza Ho.

Si X2R < 0.115 se rechaza Ho.

Como el valor de 0.470 no es menor a 0.115 se concluye que el


experimento o la teoría de Mendel solo es buena.

3. Una encuesta sobre 320 familias con 5 niños dio la distribución


que aparece en la siguiente tabla. ¿Es el resultado consistente
con la hipótesis de que el nacimiento de varón y hembra son
igualmente posibles? Use = 0.05.

Número de niños 5 4 3 2 1 0

Número de niñas 0 1 2 3 4 5

Número de familias 18 56 110 88 40 8

Solución:

Ensayo de hipótesis:
H0; El nacimiento de niños y niñas es igualmente probable.

H1; El nacimiento de niños y niñas no es igualmente probable.

Este experimento tiene un comportamiento binomial, puesto que


se tienen dos posibles resultados y la probabilidad de éxito se
mantiene constante en todo el experimento.

Se le llamará éxito al nacimiento de un varón o niño. Por lo que


la variable aleatoria "x" tomará valores desde 0 hasta 5.

Como se quiere ver si es igualmente probable el nacimiento de


niños y niñas, la probabilidad de éxito será de 0.5.

Utilizando la fórmula de la distribución binomial se calcularán las


probabilidades, que multiplicadas por el número total de familias
nos darán los valores esperados en cada clasificación.

Recordando la fórmula de la distribución binomial:

en donde n = 5 y "x" es el número de niños .

Probabilidad de 5 niños y 0 niñas =

Probabilidad de 4 niños y 1 niña =

Probabilidad de 3 niños y 2 niñas =

Probabilidad de 2 niños y 3 niñas =

Probabilidad de 1 niño y 4 niñas =

Probabilidad de 0 niños y 5 niñas =

Si cada una de estas probabilidades se multiplican por 320 se


obtienen los valores esperados:
Número de niños 5 4 3 2 1 0
Total
Número de niñas 0 1 2 3 4 5

Número de familias 18 56 110 88 40 8 320

Frecuencias esperadas 10 50 100 100 50 10

Grados de libertad: k-1-m = 6-1-0 = 5

Regla de decisión:

Si X2R 11.1 no se rechaza Ho.

Si X2R >11.1 se rechaza Ho.

Cálculos:

Justificación y decisión:

Como el 12 es mayor a 11.1, se rechaza H0 y se concluye con


un = 0.05 que el nacimiento de hombres y mujeres no es
igualmente probable.

4. Una urna contiene 6 bolas rojas y 3 blancas. Se extraen al azar


dos bolas de la urna, se anota su color y se vuelven a la urna.
Este proceso se repite un total de 120 veces y los resultados
obtenidos se muestran en la siguiente tabla. Determinar al nivel
de significación del 0.05 si los resultados obtenidos son
consistentes con los esperados.

0 1 2

Bolas blancas 2 1 0
Número de extracciones 6 53 61

Solución:

Este experimento tiene las características de una distribución


hipergeométrica, por lo cual se calcularán los valores esperados con el
razonamiento de esta distribución.

Se llamara "x" a la variable aleatoria de interés que en este caso serán


las bolas rojas. Por lo tanto "x" puede tomar valores desde 0 hasta 2.

La fórmula de la distribución hipergeométrica es:

Se tiene:

Probabilidad de extraer 0 rojas y 2 blancas:

Probabilidad de extraer 1 roja y 1 blanca:

Probabilidad de extraer 2 rojas y 0 blancas:

Con las probabilidades anteriores se obtendrán los valores esperados


multiplicando por 120.
0 1 2

Bolas blancas 2 1 0

Número de extracciones 6 53 61

Frecuencias esperadas 10 60 50

Grados de libertad: k-1-m = 3-1-0 = 2

Regla de decisión:

Si X2R 5.991 no se rechaza Ho.

Si X2R >5.991 se rechaza Ho.

Cálculos:

Justificación y decisión:

Como el 4.83 no es mayor a 5.991, no se rechaza H0 y se concluye


con un
= 0.05 que los resultados son los mismos que los esperados.

Anda mungkin juga menyukai