Hasta ahora se han mencionado formas de probar lo que se puede llamar hipótesis
paramétricas con relación a una variable aleatoria, o sea que se ha supuesto que se
conoce la ley de probabilidad y se vieron pruebas de hipótesis que declaran valores para
los parámetros. En algunos casos se necesita probar si una variable o unos datos siguen
determinada distribución de probabilidad, un método para hacer esta prueba es el de
bondad de ajuste o chi-cuadrado.
Las diferencias entre lo observado y lo esperado dan las discrepancias entre la teoría y la
realidad. Si no hay diferencias, la realidad coincidirá perfectamente con la teoría y por el
contrario, si las diferencias son grandes indica que la realidad y la teoría no se parecen.
Hipótesis
H0: La variable tiene distribución X con tales parámetros
H1: La variable no tiene la distribución X
Estadística de Trabajo
( )
∑ ∑
Nota:
Donde:
m: Número de clases
K: Número de estimadores obtenidos a partir de la muestra.
α: Nivel de significancia.
EJEMPLO 1
Se desea probar si la estatura de los empleados tiene distribución normal. Se toma una
muestra aleatoria de 200 empleados a quienes se les pregunta su estatura en pulgadas.
Los resultados obtenidos son:
No. EMPLEADOS 29 75 68 28
Con base en ésta información, ¿se puede concluir que su distribución es normal?
Solución
H0: La estatura de los empleados tiene distribución normal
H1: La estatura de los empleados no tiene distribución normal
MODELOS DE SIMULACIÓN ESTADÍSTICOS
PRUEBA DE BONDAD DE AJUSTE
PROFESOR: OSCAR SAAVEDRA – ANDRÉS DURANGO
( )
ESTATURA nj pj ej =n pj
57,5 - 63,5 29 0,.1335 26,7
63,5 - 69,5 75 0,4613 92,26
69,5 - 72,5 68 0,2264 45,28
72,5 - 78,5 28 0,1788 35,76
TOTAL n = 200 1 200
( )
∑
Con una confiabilidad del 95 por ciento, en una tabla de la distribución chi-cuadrado y un
grado de libertad (número de clases: m=4, número de estimadores obtenidos a partir de la
muestra: k=2, promedio y desviación estándar. Entonces m-k-1 = 1) se obtiene un valor
para de 3,8415. El valor de la estadística de trabajo está en la zona de rechazo de
la hipótesis nula (Figura 1), por lo tanto con una confiabilidad del 95 por ciento, se acepta
que la estatura de los empleados no tiene distribución normal.
Ejemplo 2
No. de CLIENTES 0 1 2 3 4 5
No. de DÍAS 40 36 16 7 2 1
Solución
H0: El número de clientes por día tiene distribución Poisson
H1: El número de clientes por día no tiene distribución Poisson
Para el cálculo de la estadística de trabajo se debe tener en cuenta que cada una de las
frecuencias esperadas debe ser mayor o igual a 5; para cumplir esta condición se deben
unir las tres últimas clases obteniéndose así una frecuencia esperada de 8,16 y una
frecuencia observada de 10.
MODELOS DE SIMULACIÓN ESTADÍSTICOS
PRUEBA DE BONDAD DE AJUSTE
PROFESOR: OSCAR SAAVEDRA – ANDRÉS DURANGO
No. DE
No. DE DIAS pj ej
CLIENTES
0 40 0,368 37,536
1 36 0,368 37,536
2 16 0,184 18,768
3 7 0,061 6,222
4 2 0,015 1,53
5 1 0,004 0,408
TOTAL N=102 1
( )
∑
Asumiendo una confiabilidad del 99 por ciento, en una tabla de la distribución chi-
cuadrado y dos grados de libertad (número de clases: m=4, número de estimadores
obtenidos a partir de la muestra, la media, k=1. Entonces m-k-1 = 2) se obtiene un valor
para de 9,2104. El valor de la estadística de trabajo está en la zona de no rechazo
de la hipótesis nula (Figura 2), por lo tanto con una confiabilidad del 99 por ciento, se
concluye que el número de clientes que visitan al abogado tiene una distribución Poisson.
EJEMPLO 3
Si los autos llegan a un supermercado siguiendo un proceso de Poisson, el tiempo entre
llegadas sucesivas es una variable aleatoria con distribución exponencial. Se registraron
las horas de llegada para todos los automóviles durante 2 horas y los tiempos entre
llegadas (en minutos) se resumen a continuación:
MODELOS DE SIMULACIÓN ESTADÍSTICOS
PRUEBA DE BONDAD DE AJUSTE
PROFESOR: OSCAR SAAVEDRA – ANDRÉS DURANGO
TIEMPO ENTRE
≤1 1-2 2-3 ≥3
LLEGADAS
No. DE AUTOS 40 29 15 8
Solución
H0: El tiempo entre llegadas tiene distribución exponencial
H1: El tiempo entre llegadas no tiene distribución exponencial
( )
( )
TIEMPO nj pj ej
1 40 0,5084 46,77
1-2 29 0,2499 22,99
2-3 15 0,1229 11,31
3 8 0,1188 10,93
TOTAL 92 1 92
( )
∑
Asumiendo una confiabilidad del 95 por ciento, en una tabla de la distribución chi-
cuadrado y dos grado de libertad (número de clases: m=4, número de estimadores
obtenidos a partir de la muestra: k=1. Entonces m-k-1 = 2) se obtiene un valor para
de 5,9915. El valor de la estadística de trabajo está en la zona de no rechazo de la
hipótesis nula (Figura 3), por lo tanto con una confiabilidad del 95 por ciento, no se
rechaza que el tiempo entre llegadas de los autos tiene una distribución exponencial.
2. Una revisión de 100 informes que tienen diez datos cada uno presentado por los
vendedores de una gran compañía permitió determinar algún tipo de error en dichos
informes. Los resultados fueron como aparecen en la tabla que sigue:
3. Louis Armstrong, vendedor de la compañía Dillard Paper, tiene que visitar cinco clientes
por día. Se sugiere que la variable, vendida por el señor Armstrong, puede ser descrita
mediante una distribución binomial, con una probabilidad de vender en cada visita de
p=0.4. Dada la siguiente distribución de frecuencia del número de ventas hechas por
Armstrong, ¿podemos concluir que los datos, de hecho, siguen la distribución sugerida?
Utilice un nivel de significancia del 0.05.
Valor observado de la variable < 2.6 2.6-3.79 3.8-4.99 5-6.19 6.2-7.39 7.4
Frecuencia observada 6 30 41 52 12 9
Tomado de:
* http://www.itchihuahuaii.edu.mx/academico/CB/MEG/documentos/4.3.1.1.htm
* http://www.virtual.unal.edu.co/cursos/sedes/manizales/4030006/docs_curso/contenido.html