Anda di halaman 1dari 5

PRUEBAS DE BONDAD DE AJUSTE

Estas pruebas permiten verificar que la poblacin de la cual proviene una muestra tiene una distribucin especificada o supuesta. Sea X: variable aleatoria poblacional f0(x) la distribucin (o densidad) de probabilidad especificada o supuesta para X

Se desea probar la hiptesis: Ho: f(x) = f0(x) En contraste con la hiptesis alterna: Ha: f(x) no= f0(x) (negacin de Ho)

PRUEBA JI-CUADRADO
Esta prueba es aplicable para variables aleatorias discretas o continuas. Sea una muestra aleatoria de tamao n tomada de una poblacin con una distribucin especificada f0(x) que es de inters verificar. Suponer que las observaciones de la muestra estn agrupadas en k clases, siendo oi la cantidad de observaciones en cada clase i = 1, 2, ..., k Con el modelo especificado f0(x) se puede calcular la probabilidad pi que un dato cualquiera pertenezca a una clase i. Con este valor de probabilidad se puede encontrar la frecuencia esperada ei para la clase i, es decir, la cantidad de datos que segn el modelo especificado deberan estar incluidos en la clase i: ei = pi n, i = 1, 2, ..., k

Tenemos entonces dos valores de frecuencia para cada clase i oi: frecuencia observada (corresponde a los datos de la muestra) ei: frecuencia esperada (corresponde al modelo propuesto) La teora estadstica demuestra que la siguiente variable es apropiada para realizar una prueba de bondad de ajuste: Definicin Estadstico para la prueba de bondad de ajuste =
2

Ji-cuadrado

k (o e ) 2 i i

i =1

ei

, distribucin Ji-cuadrado con =kr1 grados de libertad

donde r es la cantidad de parmetros de la distribucin que deben estimarse a partir de la muestra Es una condicin necesaria para aplicar esta prueba que i, ei 5 .

Dado un nivel de significancia se define un valor crtico 2 para el rechazo de la hiptesis propuesta Ho: f(x) = f0(x). Si las frecuencias observadas no difieren significativamente de las frecuencias esperadas calculadas con el modelo propuesto, entonces el valor de estadstico de prueba 2 ser cercano a cero, pero si estas diferencias son significativas, entonces el valor del estadstico 2 estar en la regin de rechazo de Ho
2 rechazo H 0 2 > :

Regin de rechazo de Ho Ejemplo

Se ha tomado una muestra aleatoria de 40 bateras y se ha registrado su duracin en aos. Estos resultados se los ha agrupado en 7 clases en el siguiente cuadro i clase (duracin) frecuencia observada (oi) 1 1.45 1.95 2 2 1.95 2.45 1 3 2.45 2.95 4 4 2.95 3.45 15 5 3.45 3.95 10 6 3.95 4.45 5 7 4.45 4.95 3 Verificar con 5% de significancia que la duracin en aos de las bateras producidas por este fabricante tiene duracin distribuida normalmente con media 3.5 y desviacin estndar 0.7
Solucin Sea X: duracin en aos (variable aleatoria contnua)
X ~ N ( 3.5 ,0.7 ) 1) Ho: 2) Ha: no H0 3) = 0.05

(distribucin normal, =3.5, =0.7)

Clculo de la probabilidad correspondiente a cada intervalo p1 = P(X1.95) = P(Z(1.95 3.5)/0.7) = 0.0136 p2 = P(1.95X2.45) = P((1.95 3.5)/0.7 Z (2.45 3.5)/0.7) = 0.0532 p3 = P(2.45X2.95) = P((2.45 3.5)/0.7 Z (2.95 3.5)/0.7) = 0.135 ... (etc)

Clculo de las frecuencias esperadas e1 = p1 n = 0.0136 (40) 0.5 e2 = p2 n = 0.0532 (40) 2.1 e3 = p3 n = 0.135 (40) 5.4 ... (etc) Resumen de resultados duracin (aos) frecuencia observada (oi) frecuencia esperada (ei) 1.45 1.95 2 0.5 1.95 2.45 1 2.1 2.45 2.95 4 5.4 2.95 3.45 15 10.3 Ojo con el redondeo, 3.45 3.95 10 10.7 la suma debe ser n =40 3.95 4.45 5 7 4.45 4.95 3 3.5 Es necesario que se cumpla la condicin i, ei 5 por lo que se deben agrupar clases adyacentes. Como resultado se tienen cuatro clases k=4
duracin (aos) frecuencia observada (oi) frecuencia esperada (ei) 1.45 2.95 7 8.5 2.95 3.45 15 10.3 3.45 3.95 10 10.7 3.95 4.95 8 10.5

Ahora se puede definir la regin de rechazo de Ho Observemos que en este ejemplo la media y la desviacin estndar de la distribucin normal no se estimaron, sino que estn propuestas, de donde r = 0 = 0.05, = k 1 = 3, 2.05 = 7.815 0 2 Rechazar Ho si > 7.815
5) Clculo del estadstico de prueba

(Tabla 2)

(oi ei ) 2 (7 8.5) 2 (15 10.3) 2 (10 10.7)2 (8 10.5)2 = = + + + = 3.05 10.3 10.7 10.5 ei 8 .5 i =1
2

6) Decisin Como 3.05 no es mayor a 7.815, se dice que no hay evidencia suficiente para rechazar el modelo propuesto para la poblacin.

Ejemplo 2

La siguiente tabla presenta informacin de cantidades sobre el nmero de plantas Larrea divaricata halladas en cada uno de los 48 cuadrantes de nuestro, como se publica en el el artculo Some Sampling Characteristics of Plants and Arthropods of the Arizona Desert (Ecology,1962: 567-571)
i 1 2 3 4 5 6 7 Nro. De plantas 0 1 2 3 4 5 6 frecuencia observada (oi) 9 9 10 14 2 2 2

Podran estos datos ajustarse a una distribucin de Poissn? Utilice un nivel 0,05 de significancia.
Solucin El valor de en este caso debe estimarse x i .oi = 101 = 2,10 = n 48 1) Ho: X ~ Poisson( 2 ,10 ) 2) Ha: no H0 3) = 0.05

(distribucin de Poisson con = 2,10 )

Clculo de la probabilidad correspondiente a cada intervalo p1 = P(X=0) =

e 2,1 (2,1) 0 = e 2,1 0! e 2,1 (2,1) 2 2!

p2 = P(X=1)=

e 2,1 (2,1) 1 = 0,25725 1!

p3 = P(X=2)= ... (etc)

Clculo de las frecuencias esperadas e1 = p1 n = e2 = p2 n = e3 = p3 n = e 2,1 (48) = 5,88 (0,25725)(48 ) = 12,34 12,96 ... (etc)

Resumen de resultados i Nro. De plantas frecuencia observada (oi) frecuencia esperada (ei) 1 0 9 5,88 2 1 9 12,34 3 2 10 12,96 4 3 14 9,07 5 >= 4 6 7,75 Es necesario que se cumpla la condicin i, ei 5 por lo que se deben agrupar clases adyacentes. Como resultado se tienen cinco clases k=5

Ahora se puede definir la regin de rechazo de Ho Observemos que en este ejemplo se estim el parmetro de la distribucin, de donde r = 1 = 0.05, = 5 1 - 1 = 3, 2.05 = 7.815 0 (Tabla 2)

Rechazar Ho si 2 > 7.815 5) Clculo del estadstico de prueba

(oi ei ) 2 (9 5,88) 2 (6 7 ,75) 2 = + ........ + = 6 ,31 e 7 ,75 i 5,88 i =1 6) Decisin Como 6,31 no es mayor a 7.815, se dice que no hay evidencia suficiente para rechazar el modelo propuesto para la poblacin, de modo que al nivel de 5%, la distribucin de Poisson da un ajuste razonable a los datos. 2 =
k

Anda mungkin juga menyukai