Anda di halaman 1dari 10

Estad ístico modi ficado de Kol mog orov-Smirnov:

Aplicación al test de bon dad de ajuste

por J O S E M. CA,SAS SA N C H EZ
^ {nstituto Nacional de Estadfstice

I. INTRODUCC ION

Sean xi, x^, ..... ., x,^ una muestra aleatoria de tamaño n, de una población
de tipo continuo con función de dlstribución F(x) y funcián de densidad f(x). ^l pro-
problema general de bondad de ajuste consiste en, contrastar la hipbtesis nula

Ho : F(x) = Fo(x; 8i, 8$ , . . . . , 9,^)

irente a una alternativa no especití3cada ; donde

(e^, e:, . . . . . . , e x)

son los pará^metros de la iuncidn de distribución Fo.

En este problema consideramos dos casos importantes :

1.^ La hipótesis nula Ho es simple, es decir, la función de distribución Fo, bajo Ho,
está completa^mente especiflcada, tanto su forma como los valoxes de los pará-
xnetros 8s que en ella intervienen y el contraste se realiza aplicando directamente
.
el test de Kolmogorov-Smirnov (*).

(+} El test de ^{olmogorov-Smirnov está basado en ei estadístico

D,^ = sup (S„(x) - Fo(x)^


x
^
98 ESTADISTICA ESPAÑOLA

2.^ La 11ipÚrtesiS nula es cotnpuesta, o sc.^^t, solamente se conoce la forma funcic^nal


de F^ y los parámetros que en ella intervienen pueden ser algunos o todos des-
conocidos.
Aquí nos vamos a referir al segundo caso, admitiendo, por tanto, que la hipfite-
sis nula H© solamente nos da la forma de Fo y uno o varios de los parámetros 8{ (i =
= 1, ^, ...., k) no están especificados. Sabemos que el test ^^ de Pearsot^ de bon-
dad de ajuste se puede ^rnodificar y aplicarlo a este caso, estimando convenientemente
los parárnetros desconocidos. Pero una de las objeciones que se le ponen a este pro-
cedimiento es que su validez es discutible cuando cl ta^^^aiio de la muestra es peque-
ñ.o. Por otro lado, teniendo presente que el estadistico de 1{.oimogorov-Smirnov, D ^ ,,,
da lu;gar a un test que tiene, en ^eneral, xnayo^• potencia que el test x^ de Pearsun
cuando Ho es simple, entonces se puede intentar moc^ificar el estadístico I^ „ para el
caso en que Ho sea compuesta. ^sta modificación es posible solamente en al^unos
casos que han sido estudiados por ha^^id y Johnson (3). Así, pues, lle^an a prohar
^ ^
que si Fo depende solamente de los parámetros el y 8z y si pl y Q^ son clos estimadores
de 8^, y$2, respectiva^nente, entonces la distribución de la variable aleatoria Fo Cx^
„ ,.
81, 8^) bajo la hipótesis nula 1-to depende solamentc^ de la forrna fui^.cional cle F^ y
,-,
no de los parámetros 91 y$2. Además, si def31timos el estacifstico D„:
,. ,.. „
^^,^ ^-` 3L11) ( Sri(x) ` Í^ O^x i ^1 ^ e2) I
x

la distribución de D„ es no-paramétri.ca y por tanto el estadtstico I^ri se puede utili-


^ar co^no un test estadfstico, obteniéndose la tabla correspondiente para cualquier ^,o
dada.
E'sto ha sido aplicado por Lillieí'ors (10) para contrastar si un conjunto dc obser-
vacianes proceden de urxa distribución exponencital, cuya media no es conocida, y
por tanto debe ser estimada a partir de la muestra. Para realizar este cc^ntraste se
construye, haciendo aplicacián del método de Monte-Garlo, una tabla, que da para
^. ,.
los distintos valores de n y a los valores crfticos de d^ de I) n para los cuales la P(D ,^ >
,.
> d^) = oc, aceprtando la hipótesis 1-3© si D „^ da ((*).

en donde S„(x) es la función de distribución ernpírica de la muestra, dc^finida como si^ue :


K
S„(x) _ ;(K = n.^ de observaciones xi ^ x).
n
La distribución de Dri es independ3ente de Fo. Existen tablas, como son las dacias por t3irn-
baurn, Massey, Miller y otros, que nos dan para los distintos valores de n y cx los valores críticos
dQ de Dri, tales que la P(I3n > da) = c^t; entonces, si para un cicrto n y a resulta t^ue Dn C da
se acepta la Ho, o sea, las observaciones mucstrales proceden de la poblaciún hipotética Fo, y
en caso contrario se rechaza.
{*) Esto mismo también se puede hacer para el caso en clue sc intente contrastar si un con-
junto de observaciones proceden de una distribucián normal, cuya media y varianza no son co-
nacidas y se deben de estimar a partir de la tnuestra.
ESTADISTICO DE KOLMOGOROV-SMIRNOV: APLICACION AI. TEST DE BONDAD DE AJUSTE 9^

.^.
'1'ambi;^n se Ilcga a probar que el tcst basado en c^l estadístieo D n es más potente
que c^l test x2 c.íc l'earson, presentando también la ventaja de que se puede utilizar
para muestras pequeñas, lo cual, en el caso cíel test x z, era problemático.
l^n este trabajo no vamos a utilizar los estadísticos de K-- S dadas anterior-
IY^ente, sino que daremos un nuevo estadistico, modificado de I{ -- S, basado en un
estiinador ciiferente cíN la función de cíistribucián Fu.

2. MOI) IFICAC ION DEI. ESTAD ISTICO D„ I^E 1{ -- S


^
Para llel;ar a este nuevo estadístico, D„ de 1{ --- S, realizainos una modiflcación
clel estadístiec^ D„ de 1{ --S, que eonsiste en tomar un estimade^r cíe la funeión de
clistribución Fe, cliferente de los utilizados ant es.

Supondremos que Fo(x; 81, 92, ........, 8 x) es tal que t^, t2, ... ..., ll son con-
julitalnetite c.^stacílsticos suficientes para los parámetros el, 9^, ....., 9 k, Para un
númc^ru real fijo u definimos la variable aleatc^ria 7, conio sigue:

7. -
(i en el resto

en donde x1 es ^una de las n observaciortes; nosotros hemos elegido la primera.

F^s evidente que 1 es un estimador insesgado de Fo(u ; 8i, 92, ....., 9 k) bajo la
t^ipótesis nula Ho, pues

F [7. j -- Fo(u ; 8,, @^, . . . .. . , 8k)

pero teniendo presente la teoria ^eneral dc^ est adísticos suficientes ( *) resulta que el
est adíst ico
^
.
^ U(ll, @1, 2^ .. .... , @k) "" F% [,Z /1,, .... , ^^ ^

es un estimador insesgado de Fo(u ; ol, 02, ...., 6 k) y cuya varianza es Inenor que
la de 7,. Si, además, los estadisticos tc son completos, en•tolices, basándonos en el teo-
rema cíe Blackwell-Rao (**), resulta que
^
F^,(^! ; e^, . . . . . . , ek> _. ^-: ^1 ^t,, ....... , ^^ ^

es un estimador insesgado y unifo^•^ilemei^tc de lníni^na varianza de-P`o^^^; f3^-, .-.--_ _.., $,^_

(*)v`er Blackwell, Lehmann-Schefié y Rao.


(**) Si t^(i = 1, 2, ....., 1) son estadisticos suflcientes y completos y existe un estimador
inses^ado cle Z de I^o(u; e,, @^, ....., 6x), entonces existe un estimador insesgado y uniforme-
mente dc^ mínima variatiza cíe I^o(u; @,, @2, . . . . . , 6^•) que viene dado por E [?:/t^, . . . . . , t^j.
lOO ESTADISTICA ESPAÑ^LA

Ahora ya podemos dar la nueva definición del estadístico de 1{ -- S y le liamare-


^
mas estadEslico modifrcado de K- 5', D„
^
D,^ -- supx ^ S„(z) -- Fo{s ; 9a, . . . , . . , 8 x) +
^
Si la distribucidn de este estadístico D„ no depende de los parámetros ^^, ...... , 8,r,
^
entonces es evidente que ^este astadfstico D,^ será válido para contrastar una hipó-
tesis compuesta Ho.

3. APLICAC ION A LA D^ ISTR II-^tJC ION EXPONENC IAL

Vamos a contrastar ia hipdtesis nula Ho, consistente en que


.^ e-^, ^x-8^ ; x ^ e 0
Ho : F{x) = Fo(ac; 8, 11,) =
; x c ^9
donde
^ 6^ c vc y^. ^ ^

para los siguientes casos:

I. O CONOCIDO Y^1. DESCONOCIDO, PERO MAYOR QiJE CERO.

Puesto que 8 es conocido y toma un valor constante, para simplificar supondre-


mos que 8=U y entonces, bajo la hipátesis nula Ho, la función de densidad la obten-
dremos a partir de j 1), y será

f o(x ; ^,) = 1^ e-,^ x ; para x^ 8

Considerando el estadístico
1

que, como se sabe, es suficiente y completo, l^egamos a obtener, para un número real
u fi^ado previa^nente, que
u n-t u n-i
^
Fo(u ; ?^) - E [ Z / ^ ] - 1 , ^ ._._ ^ - 1 .._._ ^ ._
^ xt nx
t

en donde Z es la variable aleatoría que hemos definido antes.


^
^ teniendo en cuenta la definición del estadfstico D,,, tendremos que
^ ^
D„ -^ max 1 S,^(x{) -- Fo(xi; ^,) ( ;(M .= tamar^o de la muestra)
^ ^ { ^ n
ESTADISTICO DE ICOLMOGOROV-SII^IIRNOV: APLICACION AL TEST DE BONDAD DE AJUSTE 101

y realizando la transformacián
^{
z^ -- ,
^
^
resulta que el estadf stico modificado de K-- S, D^, toma la f orma
^ ^
D,^ ^ ma^ { Sx(i!t) - F^(ir{^ 1){
i ^ ^ ^ ^

que tiene una distribución independiente de ^, (*) y que se utiliza para realizar el
contraste de la hipótesis Ho.

Para una muestra de tamaño n y un nivel de significacián a, rechazarernos la


Iy N

hipátesis nula Ho si D A> da de D,^ y doc están relacionados por la expresiárt


^
P [ U„ > da = a.
^
Lus valores críticos da de D ri para los distintos valores de a y para valores de
n= 4, 5, ........, 30 y superíores, aparecen en la tabla I, obtenida aplicando el
método de Monte-Carlo y los resultados de Massey y Lilliefors.

TABLA I

^^^.-., a ^

^^ ^^ ^,.. U.2U U.U.S 0.1 U 0.05 U.O1


n `^.
-^....

^4 0.29 0.31 0.34 0.38 0.45


5 0.2? 0.28 0.31 0.34 0.41
fi 0.25 0.26 0.28 0.31 0.38
7 0.23 0.24 0.26 0.29 0.36
8 0.22 0.23 0.25 0:28 0.34
9 0.21 0.22 0.24 0.27 0.32
10 0.20 0.21 0.23 0.25 0.31
12 0.18 0.20 0.21 0.24 0.29
14 0.17 0.19 U.20 0.22 0.27
16 0.17 0.18 0.19 0.21 ^ 0.26
18 0.16 0.17 0.18 0.20 0.25
20 0.15 0.16 0.17 0.19 0.24
22 0.14 0.15 0.17 0.19 0.23
24 0.14 0.15 0.16 0.18 0.22
26 0.14 0.14 0.16 0.17 0.21
28 0,13 0.14 0.15 0.17 0. 21
30 0.13 0.14 0.15 0.1 fi 0.20

0.726 0.767 0.825 0.928 1.138


30
n n n n n

^
(*) Puede admitirse que ^, = 1 para obtener la distribución de D^ n.
E5TADISTICO DE KOLMOGOROV-SMIRNOV: APLICACION AL TEST DE BONDAD DE AJUSTE 1^3

TAeL^ II

I
a ^,
U.2lf U.1:^ ^ 1.1.1f1 i 1 ^ .(1,^ U.O1
71
^
--_._____. ___..__ .^._.__.....^ ^ _ __. _..,.___.

U.37 U.39 0.42 0.48 0.58


0.34 0.38 0,42 0.46 0.55
U.33 0.35 0.38 U.44 U.53
(^.31 0.35 0.38 U.42 0.52
0.30 U.32 U.35 0.41 0.48
0,29 0.31 0.35 0.40 C1.48
U.2H 0.29 0.33 U.38 0.47
U.27 0.29 0.32 0.3fi 0.45
U.2(i U.2R 0.30 U.35 0.44
0.25 U.27 0.3U 0.3^1 0.42
0.24 U.2(i 0.29 0.33 0.42
U.24 0.2(^ 0.28 0.33 0.30
U.23 (1.25 0.27 U.31 0.39
U.22 l). 2-1 U. `l7 U. 30 0. 38
U.22 0.2^1 0.26 0.29 0.37
O.21 U.23 0.25 U.29 0.36
U.21 0.22 0.25 0.28 0.35
0.20 U.22 U.24 0.27 0.35
0.20 0.22 U.24 0.27 0.34
().20 0.21 U.23 U.27 4.33
U.19 U.21 0.'l3 0.27 0.32
0.19 0.`li 0.22 0.26 0.31
0.19 U.20 0.22 0.25 0.31
0.18 0.2^ 0.22 0.24 0.30
0.18 0.20 0.22 0.24 0.30
U.18 0.19 0.21 0.24 0.29
C1.18 U.1 J 0.21 0.24 0.29

> U.968 1.U5^ 1.151 1.343 1.567


30
^n ^n ^n ^n ^n
.

III. 8 Y ñ, n^scozvoclnos.

^n este caso

i _... e-JC(u-8) ; i1 > e


^: o(u ; e, ^,) ^
0 ;u<6

Como sabemos, x^, y la media muestral x son conjuntamente dos estadfsticas su-
ficientes y completos para (6, ñ,). Razonaztdo de foI•ma análoga a corno la hacfamos
ax^tes, resulta que el estimador insesgado y uniformemente de mínima varlanza de
Fo(u ; 9, ^,) será
^
^^o(U; e, a^) ^ ^J[zlxp, x^
lU4 ESTADISTICA ESPAÑOLA

y utilizando las técnicas dadas por Tate [16], como se hacía axxtes, tendremas que

u C zp

^. 1 u - x^, ^-^ _
Fo(u ; 8, Á.) = 1- 1 -- ---- 1-- _ ; u E nz -(n - 1)xp
n n(ac - ar!)

; en los dem^s cato+s

en los demás casos, resu.itando que el estadisti^co madlflcado de K-- S será


^
D,^ = max ^ Sw(xt) -- Fo(xt^ e, ^) ^
^^i^^^

^
y real%zando la transformación r^{ _^,(a^{ - 8) se ve que la distribución de D.^ es
independiente de 8 y de ^, y se puede admitir, por tanto, que 8= 0 y^, = 1.

E1 contraste se realiza como siempre.


Si,guiendo un procedimiento análogo al utilizado para obtener la tabla anterior,

abtendrfamos la tabla III, que nos dará los valares criticas dQ de D ri para los dis-
tintos valores de n y ot.

TwaLw III
,^
^ a
0.20 0.15 0.10 0.05 0,01
n

4 0.26 0.27 0.2^8 0.32 0,38


5 0,24 0.25 0.2? U.30 0.37
6 0.22 0.23 0.25 0.28 0.35
7 0.21 0,22 0.24 0.27 0.34
8 0.20 0.21 0.23 0.26 0.32
9 0.19 0, 20 0. 22 0. 25 0.31
10 0.18 0. 20 0, 21 0, 24 0.29
11 0.18 0,19 0. 21 0. 23 0.28
12 0.1 ? 0,18 0. 20 0. 22 0. 28
13 0.17 0.18 0.20 0, 22 0.27
14 0.17 0,18 0.19 0, 21 0.26
15 0.1 fi 0,17 0.19 0. 21 0, 25
16 0.16 0.17 0. i 8 0. 20 0. 25
1? 0.15 0.16 0.18 0. 20 0. 24
18 0.15 0.1 fi 0.17 0.20 0. 24
19 0.15 0,1 á 0,17 0.19 0, 24
20 0.14 0.15 0.17 0.19 0.24
21 0.14 0,15 0,17 0,19 0.23
22 0.14 U.15 0.16 0.19 0.23
23 0.14 0.15 0.16 O.i8 0.2i
24 0.14 0.14 O,lfi 0.17 0.21
25 0.13 0,14 0, 2 5 0.17 0. 21
ESTADISTICO DE KOLMOGOROV-SMIRNOV: APLICACION AI. TEST DE BONDAD DE AJUSTE 105

~^^... a ^
^^ '^^^ 0,20 0,15 ( 1,1U (l,US (1,01
n ^^
^ ^

26 0.13 0.14 0.15 0.17 0.21


27 0.13 0.14 0.15 0.17 0.20
28 0.13 0.14 0.15 0.16 0. 20
29 0.13 0.13 0.14 0.16 0.20
30 0.12 0.13 0.14 0.16 0. 20

> 0.715 0.759 0.822 0.923 1.126


30 _ -------
^n 1%n ^rt ^/n ^n
i

BIBLIOGRAFIA

1. BIMBAUM Z. W.: «Numerical tabulation of the distribution of Kolmogorov's Statistic for


finite sample sizer, Journal of American Statisttical Assoeiation, vol. 47, págs. 425-441.
2. BLACKWELL, D.: «Conditional expectation and unbiased sequential estimationr, The Annals
of Mathematical Statistics, vol. 18, p^gs. 106-110.
3. DAVID and .TOHN30N : «The probability transformation when parameter are estimated from
the sample», Biométrica, vol. 35, págs. 182-190.
4. EPSTEIN and SoBEL: «Some theorems relevant to life testing from an eYponential distri-
bution«, The Annals o f Mathematical Statistics, vol. 25, págs. 373-381.
5. Joxxsox and KoTS: Distributions in Statistics, vol. III: Continuous Univariate Distribu-
tion (1970). New-York: Houghton-Mifflin.
6. KrrvTx ( 1969): «Semi numerical algorithms^. Reading, Mass: Addison-^JVesley.
7. LEHMANN árid SCHEFFE: «Completeness, similar regions and unbiased estimation^, Fart I,
.^ankhya, vol. 26, págs. 305-340.
8. LIEBERMAN arid RESNIKOFF: «Sampling plans for inspection by variables«, Annals Staiist.
Ass, vol. 50, págs. 45?-516.
9. LILLIEFORS, H. W.: «On the Kolmogorov-Smirnov Test for normality with mean and va-
riance unknownr, Journal o f American Statistical Association, vol. 62, págs. 399-402.
10. LILLIEFORS, H. W.: «On the Kolmogorov-Smirnov Test for the exponencial distribution
with mean unknown^^, Journal of American Statistical Association, vol. 64, págs. 378-389.
11. MASEY, F. J. :«The Kolmogorov-Smirnov Test for goodness of flst«, Journal o f American
Statistical Association, vol. 46, págs. 68-78.
12. MILLER, L. H.: «Table of percentile points of Kolmogorov Sttatistics^, Journal of American
Statistical Association, vol. 51, págs. 111-121.
13. NOETHER (1967) : Elements o f non-pararnetric statistics, New York, J. Wiley.
14. RIEDWYL, H. :«Goodness of fitN, Journal o f American Statistical Association, vol. 62, pá-
ginas 390-398.
15. ROHAT(II (1976): «An introduction to probability theory and rnathematical statist.ics ^>,
J. Wiley.
16. TATE, R. F. :«Unbiased estimation : funtions of location and scale parametersN, 7'he Annals
o f Mathematical Statistics, vol. 30, págs. 341-366.
17. WILKS : «Mathernatical Statistics«, J. Wiley.

Anda mungkin juga menyukai