Anda di halaman 1dari 15

PRUEBA DE BONDAD DE AJUSTE BINOMIAL

Si un ingeniero de control de calidad toma una muestra de 10 neumticos que salen de


una lnea de ensamblaje y l desea verificar sobre la base de los datos que siguen, los
nmeros de llantas con defectos observadas en 200 das, si es cierto que el 5 de todos
los neumticos tienen defecto! es decir, si el muestrea una "oblaci#n binomial con n $
10 y

$ %05





1% &stablecer la 'i"#tesis

(o) *a "oblaci#n es binomial
(a) *a "oblaci#n no es binomial

2% &stablecer la estadstica de "rueba




+i $ ,alor observado en la i-simo celda%
&i $ ,alor es"erado en la i-simo celda%
. $ /ategoras o celdas%
m $ 0armetros

1% 1% 2efinir el nivel de significancia y la 3ona de rec'a3o
g,l $ 4- m 5 1 $ 61 5 0- 17 $
5%88

9ivel de significancia $ 0%05
:ona de rec'a3o $ ;
2 2
<

5%887
m $ 0 "orque no se necesito estimar ningn "armetro
=% /alculo de la estadstica de "rueba
9mero de unidades con defecto 9mero de muestras
0 11>
1 51
2 # ms 8
[ ]

=
k
i e
e o
i
i i
f
f f
1
2
2



0ara "oder calcular las frecuencias es"eradas tenemos que calcular las
"robabilidades utili3aremos la formula de la binomial
( )
x n x n
x
x f

= 7 1 6 7 6

donde n $ 10

$ 0%05


( )
0 10 0 10
0
7 05 % 0 1 6 05 % 0 7 0 6

= f
$ %588

( )
1 10 1 10
1
7 05 % 0 1 6 05 % 0 7 1 6

= f
$ %115

y la "robabilidad de 2 # ms $ 1%0 - %588 - %115 $ %0>?

a'ora ya "odemos encontrar las frecuencias es"eradas)
200 6 %5887 $ 118%> 2006%1157 $ ?1 200 6%0>?7 $ 1@%2


Al a"licar la formula se tiene)

2 % 1@
7 2 % 1@ 8 6
?1
7 0 % ?1 51 6
> % 118
7 > % 118 11> 6
2 2 2
2

+

=
$ >%2?



5% /omo >%2? es mayor que 5%88, se rec'a3a la 'i"#tesis nula con un nivel de
significancia de 0%05%

?% /onclusi#n
Se concluye que el "orcentaje verdadero de neumticos con defecto no es el 5%
[ ]

=
k
i e
e o
i
i i
f
f f
1
2
2

UNIDAD: PRUEBA DE BONDAD DE AJUSTE


Pruebas de tablas de contingencias
En muchas ocasiones, los n elementos de una muestra de poblacin pueden clasificarse de
acuerdo con dos criterios diferentes. Por ello interesa conocer si los dos mtodos de
clasificacin son estadsticamente independientes; por ejemplo, podemos considerar la
poblacin de ingenieros graduado y tal vez deseemos determinar si el salario inicial es
independiente de las disciplinas acadmicas.
upngase !ue el primer mtodo de clasificacin tiene r niveles y !ue el segundo mtodo de
clasificacin tiene c niveles. ea oij la frecuencia observada para el nivel i del primer mtodo de
clasificacin y el nivel j del segundo mtodo de clasificacin. "os datos apareceran, en general,
como en la tabla. #na tabla de tales caractersticas se llama com$nmente tabla de contingencia
r % c.
Estamos interesados en probar la hiptesis de !ue los mtodos de clasificacin de rengln y de
columna son independientes. i rechazamos esta hiptesis, concluimos !ue hay cierta
interaccin entre los dos criterios de clasificacin. "os procedimientos de prueba e&actos son
difciles de obtener, pero una estadstica de prueba apro&imada es valida para n grande.
upngase las oij como variables aleatorias multinomiales y pij como la probabilidad de !ue un
elemento elegido al azar cae en la celda ijesima, dado !ue las dos clasificaciones son
independientes. Entonces pij ' uivj , donde ui es la probabilidad de !ue un elemento elegido al
azar caiga en el rengln de clase i y vj es la probabilidad de !ue un elemento seleccionado en
forma aleatoria caiga en la columna de clase j. "uego, suponiendo independencia, los
estimadores de m(&ima probabilidad de ui y vj son)
*i ' +ij
*j ' +ij
Una tabla de contingencia r c
,olumnas
- . ... c
- +-- +-. ... +-c
. +.- +.. ... +.c
/englones ... ... ... ... ...
r +r- +r. ... +rc
En consecuencia, el n$mero esperado de cada celda es
Eij ' n*ivj ' +ij +ij
Entonces, para n grande, la estadstica
.
%
.
0 ' 1 %
.
2r 3 -4 2c 3 -4
5pro&imadamente, y rechazaramos la hiptesis de independencia si
%
.
0 6 %
.
a
,
2r 3 -4 2c 3 -4.
Prueba de bondad de a!uste de !i"cuadrada
El procedimiento de prueba re!uiere una muestra aleatoria de tama7o n de la variable aleatoria
%, cuya funcin de densidad de probabilidad se desconoce. Estas n observaciones se arreglan
en un histograma de frecuencias, teniendo 8 intervalos de clase. ea 0- la frecuencia
observada en el intervalo de la clase iesimo. 9e la distribucin de probabilidad hipottica,
calculamos la frecuencia esperada en el intervalo de clase iesimo, denotada E-. "a estadstica
de prueba es)
%
.
0 '
Puede demostrar !ue %:0 sigue apro&imadamente la distribucin ji cuadrada con 81p1- grados
de libertad, donde p representa el numero de par(metros de la distribucin hipottica estimada
por el medio de estadstica de muestra. Esta apro&imacin se mejora cuando n aumenta.
/echazaramos la hiptesis de !ue % se ajusta ala distribucin hipottica si %:06%:; 81p1-
#n punto !ue debe advertirse en la aplicacin de este procedimiento de prueba se refiere ala
magnitud de las frecuencias esperadas. i estas frecuencias esperadas son demasiado
pe!ue7as, entonces %:0 no reflejan la desviacin de las observaciones respecto alas
esperadas, si no solo las mas pe!ue7as de las frecuencias esperadas. <o hay un acuerdo
general en relacin con el valor mnimo de las frecuencias esperadas, aun!ue los valores de
=,> y ? se utilizan ampliamente como mnimos. i la frecuencia esperada es demasiado
pe!ue7a, puede combinarse con la frecuencia esperada en un intervalo de clase adyacente.
"as frecuencias observadas correspondientes se combinaran tambin en ese caso, y 8 se
reducir( en -. <o se re!uiere !ue los intervalos de clase sean de igual ancho.
E!e#$lo
#na distribucin completamente especificada #n cientfico de computadoras ha desarrollado un
algoritmo para generar enteros pseudoaleatorios sobre el intervalo 01@. ,odifica el algoritmo y
genera -000 dgitos pseudoaleatorios. "os datos se muestran en la tabla --1=. AE&iste
evidencia de !ue el generador de n$meros aleatorios esta trabajando correctamenteB
i esta trabajando de manera correcta, entonces los valores 01@ deben seguir la distribucin
uniforme discreta, la cual implica !ue cada uno de los enteros debe ocurrir e&actamente -00
veces. Esto es, las frecuencias esperadas E '-00 para C'0,-,D.,@ Puesto !ue estas
frecuencias estimadas pueden estimarse sin !ue sea necesario estimular ning$n par(metro a
partir de los datos de muestra, la prueba resultante de bondad de ajuste de la ji cuadrada
tendr( 81p1-'-0101-'@ grados de libertad.
Eotal
0 - . = > ? F G H @ n
IIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIII
Jrecuencia
+bservada + @> @= --. -0- -0> @? -00 @@ -0H @> -000
Jrecuencias
Esperada E -00 -00 -00 -00 -00 -00 -00 -00 -00 -00 -000
IIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIII
El valor esperado de la estadstica de prueba es
. . . .
%
.
0 ' '
Puesto !ue % '-F.@. no somos capaces de rechazar la hiptesis de !ue los datos proviene de
una distribucin uniforme discreta. En consecuencia, el generador de n$meros aleatorios
parece estar trabajando en forma satisfactoria.
%& Test de 'ol#ogoro("S#irno(
Para la aplicacin del test se7alado, es necesario determinar la Jrecuencia
observada acumulada. Para la frecuencia observada en el caso especial de
Kumbel, se ordena la informacin de menor a mayor y se aplica)
9onde)
Jn 2&4) frecuencia observada acumulada.
n) <L total de orden
<) <L total de datos.
En el caso de la frecuencia terica acumulada, sta se determina a travs de la
funcin de Kumbel.
#na vez determinadas ambas frecuencias, se obtiene el supremo de las
diferencias entre ambas, en la i1sima posicin de orden, !ue se denomina 9.
"uego, asumiendo un valor de significancia, se recurre a la tabla de valores
crticos de 9 en la prueba de bondad de ajuste de Molmogorov1mirnov, y
considerando el tama7o de la muestra, se establece lo siguiente)
i 9 N 9 tabla, se acepta !ue 2el ajuste es adecuado, con el nivel de
confiabilidad asumido.
)& Proble#as
E!ercicio %. 5nte la sospecha de !ue el h(bito de fumar de una embarazada puede influir en el
peso de su hijo al nacer, se tomaron dos muestras, una de fumadoras y otra de no fumadoras,
y se clasific a sus hijos en tres categoras en funcin de su peso en relacin con los
percentiles O-0 y O@0 de la poblacin. El resultado se e&presa en la tabla siguiente)
Peso del ni7o
APadre fumadoraB Penor de O-0 Entre O-0 y O@0 Payor de O@0
i --G ?.@ -@
<o -.> -->G --G
AQay una evidencia significativa a favor de la sospecha a la vista de los resultados de la
muestraB
PRUEBA *+I"*UADRADA PARA LA BONDAD DEL
AJUSTE
A lo largo de este curso nos ocu"amos de la "rueba de 'i"#tesis estadsticas acerca de
"armetros de una "oblaci#n como , y P. 5hora se considera una prueba para
determinar si una poblacin tiene una distribucin terica especfica. "a prueba
se basa en !u tan buen ajuste se tiene entre la frecuencia de ocurrencia de
las observaciones en una muestra observada y las frecuencias esperadas !ue
se obtienen a partir de la distribucin hipottica.
"a formula !ue se utilizar( para calcular el valor de chi1cuadrada es igual a la
de la seccin anterior, con el mismo concepto de grados de libertad.
Ejemplo)
-. #na moneda fue lanzada al aire -000 series, de ? veces cada serie y se
observ el n$mero de caras de cada serie. El n$mero de series en los
!ue se presentaron 0, -, -, =, > y ? caras se muestra en la siguiente
tabla.
N,#ero de
caras
N,#ero de series
-.recuencia
obser(ada/
0 =H
- ->>
. =>.
= .HG
> -F>
? .?
Eotal
%000
2% 5justar una distribucin binomial a los datos con un ' 0.0?.
3. Solucin:
>. Q
0
; "os datos se ajustan a una distribucin binomial.
?. Q
-
; "os datos no se ajustan a una distribucin binomial.
?% Para obtener los valores esperados se tiene !ue utilizar la formula de la
distribucin binomial) , donde n en este ejercicio vale ?, p y
q son las probabilidades respectivas de cara y sello en un solo
lanzamiento de la moneda. Para calcular el valor de p, se sabe !ue
'np en una distribucin binomial, por lo !ue ' ?p.
G. Para la distribucin de frecuencias observada, la media del n$mero de
caras es)
H.
@. Por lo tanto . 5s pues, la distribucin binomial
ajustada viene dada por p2&4 ' .
-0. 5l seguir esta frmula se calcula la probabilidad de obtener caras, seg$n
el valor de la variable aleatoria. "a probabilidad multiplicada por -000
nos dar( el valor esperado. e resumen los resultados en la tabla
siguiente)
N,#ero de caras
-1/
P-1 caras/
2recuencia
es$erada
2recuencia
obser(ada
0 0.0==. ==.. =H
- 0.-F-@ -F-.@ ->>
. 0.=-F. =-F.. =>.
= 0.=0HG =0H.G .HG
> 0.-?0G -?0.G -F>
? 0.0.@> .@.> .?
--. Para los grados de libertad el valor de m ser( uno, ya !ue se tuvo !ue
estimar la media de la poblacin para poder obtener el valor de p y as
poder calcular los valores esperados.
-.. Krados de libertad) 81-1m ' F1-1- ' >
-=.
->. /egla de decisin)
15% i %
.
/
@.>@ no se rechaza Q
o
.
-F. i %
.
/
6@.>@ se rechaza Q
o
.
-G. ,(lculos)
-H.
Rustificacin y decisin)
18% ,omo el G.?> no es mayor a @.>@, no se rechaza Q
0
y se concluye con
un
' 0.0? !ue el ajuste de los datos a una distribucin binomial es
bueno.
.0. e propone !ue el n$mero de defectos en las tarjetas de circuito
impreso sigue una distribucin Poisson. e re$ne una muestra aleatoria
de F0 tarjetas de circuito impreso y se observa el n$mero de defectos.
"os resultados obtenidos son los siguientes)
N,#ero de
de.ectos
2recuencia
obser(ada
0 =.
- -?
. @
= m(s >
21% APuestran estos datos suficiente evidencia para decir !ue provienen de
una distribucin PoissonB. Qaga la prueba de la bondad del ajuste con
un ' 0.0?.
22. Solucin:
.=. Q
0
; "a forma de la distribucin de los defectos es Poisson.
.>. Q
-
; "a forma de la distribucin de los defectos no es Poisson.
.?. "a media de la distribucin Poisson propuesta en este ejemplo es
desconocida y debe estimarse a partir de los datos contenidos en la
muestra.
.F.
.G. 5 partir de la distribucin Poisson con par(metro 0.G?, pueden
calcularse las probabilidades asociadas con el valor de &. Esto es la
frmula de la Poisson es)
.H.
.@. ,on esta frmula se calculan las probabilidades, mismas !ue se
multiplican por F0 para obtener los valores esperados.
N,#ero de
de.ectos
Probabilidad
2recuencia
es$erada
2recuencia
obser(ada
0 0.>G. .H.=. =.
- 0.=?> .-..> -?
. 0.-== G.@H @
= m(s 0.0>- ..>F >
=0. Puesto !ue la frecuencia esperada en la $ltima celda es menor !ue ?, se
combinan las dos $ltimas celdas.
N,#ero de
de.ectos
2recuencia
es$erada
2recuencia
obser(ada
0 .H.=. =.
- .-..> -?
. m(s -0.>> -=
=-. "os grados de libertad seran =1-1-'-, debido a !ue la media de la
distribucin Poisson fue estimada a partir de los datos.
=..
==. /egla de decisin)
1=% i %
.
/
=.H> no se rechaza Q
o
.
=?. i %
.
/
6=.H> se rechaza Q
o
.
=F. ,(lculos)
=G.
=H. Rustificacin y decisin)
18% ,omo el ..@> no es mayor a =.H>, no se rechaza Q
0
y se concluye con
un
' 0.0? !ue la distribucin de defectos en las tarjetas de circuito
impreso es Poisson.
=0% Pruebe la hiptesis de !ue la distribucin de frecuencia de las
duraciones de bateras dadas en la siguiente tabla, se puede apro&imar
mediante una distribucin normal con media ' =.? y desviacin
est(ndar '0.G. #tilice un
' 0.0?.
"mites
de clase
2recuencias
obser(adas
-.>? 3 -.@? .
-.@? 3 ..>? -
..>? 3 ..@? >
..@? 3 =.>? -?
=.>? 3 =.@? -0
=.@? 3 >.>? ?
>.>? 3 >.@? =
Solucin:
e procede a elaborar el histograma, para visualizar los datos)
,omo se puede observar el histograma tiene una forma !ue aparenta
ser normal, se probar( esta hiptesis.
Q
0
; "os datos provienen de una distribucin normal.
Q
-
; "os datos no provienen de una distribucin normal.
En este ejercicio en particular se cuenta con la media y desviacin est(ndar de
la poblacin, por lo !ue no se tiene !ue estimar. En caso de !ue no se tuviera,
se estimaran a partir de los datos agrupados con las frmulas !ue se vieron en
la #nidad CCC del curso de probabilidad y estadstica, tomando en cuenta !ue
para los grados de libertad el valor de m sera ., ya !ue se estimara la media y
la desviacin est(ndar.
e proceder( a calcular los valores de z para encontrar las probabilidades en la
tabla. /ecordando !ue , se sustituye el valor de & por los lmites de
clase comenzando con el lmite de -.@?
L3#ite real P-1/
-.@? 1...-
P2& -.@?4 ' 0.0-=??
..>? 1-.?0
P2& ..>?4 ' 0.0FFH0
..@? 10.G@
P2& ..@?4 ' 0..->GF
=.>? 10.0G
P2& =.>?4 ' 0.>G.-0
=.@? 0.F>
P2& =.@?4 ' 0..F-0@
>.>? -.=F
P2& >.>?4 ' 0.0HF@-
"a razn por la cual se comienza con el lmite de -.@? y se termina con
el lmite de >.>?, es por!ue la suma de todas las probabilidades debe
ser -, bajo la curva normal.
5 continuacin se muestra la curva normal con sus respectivas
probabilidades, seg$n los limites reales. "as probabilidades !ue no se
muestran en la tabla anterior y est(n en la curva se calcularon por
diferencias.
P2-.@? & ..>?4 ' 0.0FFH10.0-=??= ' 0.0?=.?>
P2..>? & ..@?4 ' 0..->GF10.0FFH ' 0.->G@?=
P2..@? & =.>?4 ' 0.>G.-10..->GF ' 0..?G=>
P2=.>? & =.?04 ' 0.?010.>G.- ' 0.0.G@
P2=.?0 & =.@?4 ' 0.?010..F-0@' 0..=H@-
P2=.@? & >.>?4 ' 0..F-0@10.0HF@-? ' 0.-G>-G
,on estas probabilidades se calcular(n los valores esperados, multiplicando
cada probabilidad por >0.
"mites de
clase
2recuencias
obser(adas
Probabilidad
2recuencia
es$erada
-.>? 3 -.@? . 0.0-=?? 0.?>.-.
-.@? 3 ..>? G - 0.0?=.? ..-=0-F
..>? 3 ..@? > 0.->G@? ?.@-H-.
..@? 3 =.>? -? 0..?G=> -0..@=F0
=.>? 3 =.@? -0 0..FFH- -0.FG.>0
=.@? 3 >.>? H ? 0.-G>-G F.@FFH0
>.>? 3 >.@? = 0.0HF@- =.>GFF0
Krados de libertad) 81-1m ' >1-10 ' =
/egla de decisin)
i %
.
/
G.H-? no se rechaza Q
o
.
i %
.
/
6G.H-? se rechaza Q
o
.
,(lculos)
Rustificacin y decisin)
,omo el =.0F no es mayor de G.H-?, no se rechaza Q
0
y se concluye con un
' 0.0? !ue el ajuste de los datos a una distribucin normal es bueno.

Anda mungkin juga menyukai