Anda di halaman 1dari 13

METODO GRAFICO, BASADO EN LA PRUEBA DE KOLMOGOROV, PARA LA TIPIFICACION DE TESTS

JOSE M." DOMENECH MASSONS


Profesor de Estadstica del Departamento de Psicologia de la Facultad de Filosofia y Letras. Universidad de Barcelona.

Mtodo g~fico,basndo en la pyzleba ...

31

1.

- NOTA PRELIMINAR

Una de las tareas que incumbe a la Psicologia es la medida por medio de tests, de unos rasgos generalmente distribuidos en forma normal y corresponde al psiclogo la tipificacin de 10s mismos. Para ello, se ha de escoger una muestra de individuos de tamaiio y composicin adecuada con la poblacin a la cua1 queremos baremar el test y seguir el proceso estadstic0 representado en el diagrama de bloques de la fig.. 1.

1 - 1 + ~ 1 + ~ i / - p ~
De todo el procedimiento 10s dos Gltimos pasos realizados en forma analtica, requieren un considerable nmero de operaciones y el mtodo grfico que proponemos, permite a partir de la media , desviacin tipo cr y porcentajes acumulados Pi de la distribucin emprica: 1P verificar su normalidad, 2: obtener el baremo, en un tiempo inferior a 10s 5 minutos y por tanto notablemente reducido respecto al sistema clsico. Estoy muy agradecido al Dr. J. Torrens Ibern a quien se debe la revisin cientfica de este trabajo.

FIG. 1:

2. - PRUEBA DE KOLMOGOROV: 2. 1.

- Introduccin terica a la prueba. -

La prueba del profesor ruso Kdmorogov, estudia la diferencia mxima D,, -debida al azar y con un riesgo prefijado- entre la funcin terica de dit$ tribucion S (x) de una variable aleatoria continua y 10s porcentajes acumulados Pa(x) de la distribucin emprica de una muestra de tamao n extrada de dicha poblacin. Pudiendo demostrarse que la distribucin de las diferencias mximas D,, es independiente de la funcin terica S(x), Kolmogorov ha calculado la distribucin D, cuando el tamao n, de la muestra de la distribuci6n emprica, tiende a infinita. Massey ha calculado la distribuci6n de las diferencias mximas D para ,

32

J . M." Domnech

m e s t r a s de pequeo tamao procedentes de una pobIaci6n de la que se c a tiocen sus verdaderos parmetros (m,; a). Lilliefors ha calculado la distribucin D para muestras de pequeo ta, t~luo procendentes de una poblacin normal de la que no se conocen sus pariimetros. En este caso, la prueba se realiza a partir de los parmetros (m,; a) dl. la muestra. , As, las distribuciones de las diferencias mximas D estudiadas por Masscy y Lilliefors, estn dadas en la tabla 7, para distintos tamaos de mucstra 3 distintos riesgos de primera especie. Del mismo modo y por ser D, independiente de la distribucin terica S(x), podemos resolver tanto problemas de tip0 no pararntrico como problemas param6trico.s tales como la verificacin de la hiptesis de normalidad cIc una distribucin. Smirnov, profesor de la Universidad de Moscou, a partir de la prueba de Kolmogorov, ha estudiado las mximas diferencias D.?,,, -debidas al azar y con un riesgo prefijado- entre 10s porcentajes acumulados de las distribuviones empiricas de dos muestras de tamao respectivo m y n extraidss de tina misma poblacin. De esta forma podemos verificar la hiptcsis de que las dos muestras proceden de una misma poblacin. Desde el punto de vista psicolgico, la prueba de Kolmogorov es til para verificar la hiptesis de normalidad de una distribucin y para comprobar \ipuede aceptarse la hiptesis de que dos muestras proceden de una misma ~~oblacin. En este estudio empleamos la prueba de Kolmogorov para probar la hip6tesis de normalidad. Tiene la ventaja sobre la prueba de ~"adems de permitir una interpretacin grfica fcil- de ser un mtodo estadisticamente exacto para 10s tamaos de muestra habituales en psicologia, mientras que es s610 vlida para muestras grandes. 1 ley de 3

2.2. - Ejemplo.

Como ejemplo de aplicacin analtica de la prueba de Kolmogorov, se ha csscogido el estudio del Dr. M. Betran Quera y P. Valldeperes sobre la bateria de factorial al P.M.A. Thurstone.
EJEMPLO 1 cccomprobar la normalidad de la distribucin de las notas ob: tenidas en el test de comprensin verbal (factor c(V,,) por un grupo de 299 alumnos de 4." curso de bachillerato del Colegio S. Ignacio de Barcelona. (Tabla I ) . La distribucin tiene una media de 29,06 puntos y un3 desviacin tip0 de 7,62 puntos.),
Se construye la tabla 1 con las siguientes columnas:

I ) : Intervalos de clase (2) : Efectivos o nmero de observaciones

UNIVERSIDAD DE BARCELONA DEPARTAMENTO DE PSlCOLOGlA ESTADISTICA

P M.A. : Factor "V.

Mtodo grfico, basado en la prueba.. .

37

(3) (4) (5) (6)

: Frecuencias acumuladas : Porcentajes acumulados de la distribucin emprica : Lmites superiores de los intervalos de clase
: Diferencias entre los lmites superiores de los intervalos de clase y

media. Simblicamente: (6) = (5) - m, = (5) - 29,06 (7) : Valores de la variable tipificada correspondientes a los lmites superiores de los intervalos de clase que siguen una ley normal terica de media m, = 29,09 y desviacin tipo o = 7,62

Simblicamente: (7) = (6) : a = (6) : 7,62 (8) : Aress (con su signo) obtenidas de la ley normal reducida a partir los valores de la variable tipificada de la columna (7) (9) : Porcentajes acumulados correspondientes a la ley normal terica de media 29,06 y desviacin tipo 7,62 Simblicamente: (9) = 50 + (8) (10) Diferencias entre los porcentajes acumulados de las distribuciones emprica y terica en valor absoluto. Simblicamente: (10) = (4) - (9) TABLA 1:

La mxima diferencia entre la distribucin terica y emprica la apreciamos en la columna (10) de la tabla 1. Vale:

38

J . M." Domnech

Dividimos por 100 puesto que la tabla 7 nos da las referencias D. en tanto por uno. Como la prueba se ha realizado a partir de la media y desviacin tipo de la muestra, la tabla de Lilliefors nos dar la mxima diferencia permisible:
TABLA 2
RIESGO D6 l . = ESPECIE
a=SO/o

a = 1%

D = ,

0,886

v%F
max.

= 0,0512

DI, =

1,031

0,0594

11

29F

Puesto que D = ,
se opone

PJi- Si
1O 0

= 0,0396 es menor que 0,0512 nada

a la afirmacin de la hiptesis de normalidad de la distribucin.

3.

- PRUEBA GRAFICA DE NORMALIDAD:

3.1.

- Introduccin terica a la prueba

Si disponemos de un grfico como el de la figura 4 (esquematizado en la fig. 2) con el eje de ordenadas graduado centil a centil (segn la ley normal) y con el eje de abcisas graduado de medio punto en medio punto segn las notas directas, es fcil demostrar que una distribucin perfectamente normal est representada sobre este grfico por una recta (Recta de Henri). Los distintos porcentajes acumulados Si calculados en la prueba de Kolmogorov, columna (9) de la tabla 1, correspondientes a la ley normal teri-

FIG. 2

TABLA 3

ca de media m, y desviacin tip0 a,estan sobre la recta de Henri que pssa evidentemente por 10s puntos A; B; M de la fig. 2 que son 10s indicados en la tabla 3. En el grafico de la figura 4, las ordenadas z = 1 y z = -1, correspondientes a 10s centiles 84 y 16 respectivamente, estn dibujadas con lineas de trazo grueso con el fin de facilitar la representacin de la recta de Henri. Si ademb dibujamos sobre el grfico 10s porcentajes acumulados (que coinciden con 10s centiles) de la distribucin a estudiar, obtendremos una lnea quebrada que representa la distribucibn emprica. Los puntos de dicha linea quebrada corresponden en la prueba de Kolmogorov a 10s valores Pi, columna (4) de la tabla l. Nota: A fin de mejorar la lectura de la distancia maxima D,, es interesante tomar la escala del eje de abcisas de forma que la recta de Henri presente una inclinacin aproximada de 45", tal como esta representada en la fig. 2.

3.2. - Ciculo gr5fico de la mxima distancia D,.

--

Una vez representada~las distribuciones teorica y emprica sobre el ~nismo grafico, se obtiene un dibujo parecido al esquematizado en la fig. 3.

En este caso, I Pi - Si ( max. es la mxima distancia o diferencia entre la recta de Henri (distribucin terica) y la linea quebrada (distribucin emprica). Las divergencias se miden graficamente por el nmero de centiles (lineas horizontales del grfico) que hay entre la ordenada de la recta de Henri y la ordenada de la linea quebrada. Asi por ej., segn el dibujo de la fig. 3,

40

J . M." Domnech

PrS, 1 max. vale aproximadamente 2, puesto que la mxima distancia entre la recta (linea continua) y la quebrada (linea de trazos) es de centiles. El valor D, ser:

, Si la diferencia mxima D no supera, el nivel de confianza escogido, el valor dado por la tabla de Lilliefors, pensaremos que las diferencias son dcbidas al azar. En caso contrario no podremos aceptar la hiptesis dc quc la muestra ha sido extrada de una poblacin normal.
4.

- OBTENCION GRAFICA DEL BAREMO:

Los centiles se calculan, en forma analtica, mediante una interpolacin lineal entre 10s porcentajes acumulados correspondientes a dos intcrvalos de clase consecutivos. La interpolacin se realiza graficamente uniendo 10s puntos representativos de 10s porcentajes acumulados (centiles) de la distribucin emprica. Estos segmentos forman Ia Iinea quebrada antes mencionada, linea que sobre el grfico nos da la correspondencla entre notas directas y centiles. Podremos leer en cl grfico, para cada nota directa su centil correspondiente o para cada centil su nota directa, segn nos interese. De csta forma sc obtiene el baremo. Puesto que el grfico esta graduado por su lado dcrecho en notas z, si deseamos construir un baremo en puntuaciones z, hasta realizar las mismas operaciones pero leyendo en la escala z en vez de leer en la escala centn. Ntese que la lnea quebrada da la correspondencia entre notas directas y puntuacin tip0 normalizada. La recta de Henri da la correspondcncia cntre notas directas y puntuaci6n tipo.

5. - EJEMPLO D E APLICACION DEL METODO GRAFICO:


En resumen, para resolver el ejemplo 1 compl.eto, hay que calcular en primer lugar 10s valores estadisticos (m,; a) y luego, por aplicacicin del metodo grfico, se verifica la normalidad de la distribucin y se obtiene cl barcnlo.

EJEMPLO 2: ccobtener el baremo en centiles, para el test de comprensidtl verbal (factor .Va) de la bateria P.M.A., partir de las nr, a tas obtenidas por un grupo normativo de 299 alumnos de 4.' curso de bachillerato. Las notas son las dadas en la tabla 1..

Mtodo grafico, basado en la prueba ...

41

Se siguen 10s tres pasos indicados en el diagrama de bloques de la fig. 1; para el10 se construye la tabla 4 cuyas 6 primeras columnas sirven para hallar los valores estadsticos (m,; c ) que permiten dibujar la recta de He-nri, y las 3 ltimas que dan 10s porcentajes acumulados (percentiles) correspondientes a cada extremo superior del interval0 de clase a fin de dibujar ia distribucin emprica sobre el grfico.
TABEA 4:
(1) (2) (3) - - - -- x fl xl
-

(4)
fl

(5)

(6) (7) -

(8)

(9)

fltl

fitl?
49 108 175 288 108 88 45 O 51 172 234 352 300 1970

F.
1 4 11 29 41 63 108 145 196 239 265 287 299

PI
0,33 1,34 3,67 9,69 13,69 21,U 36.07 48,43 65,46 79,83 88,Sl 95,86 100

1 I., I

-CALCULOS

6-- 8

9-11 12-14 IS17 18-20 21-23 24-26 27-29 30-32 33-35 36-38 39--41 42-45

3
7 18 12 22 45 37 51 43 26 22 12

7 10 13 16 19 22 25 28 31 34 37 40 43

-7
-4

-7
-18 -35 -72 -36 -44 4 5 O 51 86 78 88 60 106

-5 4 -3 -2 -1 O 1 2 3 4 5

8,5 Media: 11,s 106 14,s mx = 28 + -' 3 = 29,06 299 17,5 20,s Desviacin tipo: 23,s 1.970 2 5 c2=3' (%)I]= 29,5 32,5 D ? = ~ ~ . ~ ~ ~ 3.53 5=7=7,62 38,5 41,5,

[= -

.=v

4451

TOTAL 299

Primero se dibuja sobre el grfico de la figura 4 la recta de Henri que pasa por 10s puntos:

Luego se representan sobre el grfico 10s puntos correspondientes a la distribucin emprica que estn dados por las columnas (8) y (9) de la tabla 4. Unindolos se obtiene la linea quebrada que vemos en la figura 4. La mxima distancia se observa que esta en el punto 29,5 y corresponde aproximadamente a 4 unidades (ya que en este punto la distribucin terica y emprica estn separadas por 4 centiles). En la tabla de Lilliefors (tabla 7) -igual que para el ej 1 obtenemos , el valor D mximo para N = 299:

TABLA 5 RIESGO DE 1."


a =
506

ESPECIE

a = 1%

D = ,

1 Pi

- Si

max.

4 - = 0,04

100

1 00

Puesto que 0.04 es menor que 0.0512. nada se bpone a la afirmaci6n de 1 ; hiptesis de normalidad de la distribucin. (Ntese la coincidencia con 10 obtenido mediante el largo proceso analtic0 del ejemplo l).

TABLA 6 x centil

BAREMO: El grfico permite obtener el baremo segn la tabla 6, es decir, viendo 10s centiles correspondientes a determinadas notas (de dos puntos en dos puntos; por ej.). A fin de aumentar la informacin contenida en el bsremo, por convenio asignaremos el centil cero a la nota directa ms pequea (alcanzada por todos 10s individuo~de la muestra normativa) y centil cien a la primera nota directa que ningun individuo ha alcanzsdo.

6. - CONCLUSIONES:
El mCtodo propuesto, tal como hemos demostrado, constituye un rpido proceso de verificacin de la normalidad y obtencin del baremo, a partir de las notas obtenidas por el grupo normativo, con notable rigurosidad estadfstica, a pesar de ser un procedimiento grhfico y en consecuencia aproximado. No obstante la precisin de 10s resultados est6 dentro de 10s limites exigidos en psicometria. Es un mtodo aconsejable para simplificar 10s procesos de clculo en gabinetes psicomtricos y en trabajos de investigacin siempre que no se disponga de un ordenador digital de sobremesa para efectuar 10s clculos.

Mtodo gufico, basado en la prueba.. .


7 . - TABLAS PARA LA PRUEBA DE KOLMOGOROV:

43

--

TABLA 7:
a =0O ,S

Tamao de la muestra (n)

Massey u=0,05 a =0,01

Lilliefors
a =0,01

sup a 30

NOTAS:

- Los valores

dados por Massey se refieren a leyes de probabilidad de variable continua con parametros conocidos independientemente de la muestra. Los valores dados por Lilliefors se refieren a una ley de probabilidad normal con parametros desconocidos estimados mediante la muesra.

FUENTES:
Valores de Massey ~Cuadernosde estadstica aplicada e Investigacibn operativas Vol 11, fasc. 3, 1963. pag. 195. Valores de Lilliefors: aJourna1 of the American Stadistical Associationu Vol. 62, n.Q318, 1967. PAg. 400.

44

J . M." Domnech

RESUMEN

EI proceso estadstic0 a seguir en la tipificacin de tests que miden rasgos distribuidos normalmente comprende: 1.0-Calculo de 10s parmetros estadsticos. 2.0-Verificacin de la hiptesis de normalidad de la distribucin emprica obtenida. 3.0-Clculo del baremo. Los pasos segundo y tercero, realizados analticamente, requieren un considerable nmero de operaciones. El mtodo grafico propuesto permite, a partir de la media m, de la desviaci6n tip0 a y de 10s porcentajcs acumulados Pi de la distribucin emprica, verificar la normalidad y obtener el baremo con una precisin superior a -c 0,4 puntos, en un tiempo inferior a 10s cinco minutos.

RESUME
Dans l'talonnage de la distribution des tests --qui msurent des caractb res distribus normalment- le processus suivre est dtrmin par: 1.-Calcul des paramktres statistiques. 2.-Vrification de l'hypothse de normalit de la distribution cxpCrimc2ntal obtenue. 3.-Calcul du bareme. Pour realiser analytiquement les points second et troisibme, i1 faut un grand nombre d'operations. La mthode graphique propose permet de v6rifier la normalitd et d'obtenir le bareme avec une prcision supricure a +- 0,4 points, en moins de cinq minutes, B partir de la moyenne x, de I'cart-type cr et des pourcentages cumuls Pi de la distribution cxprimentale.

SUMMARY
The statistic process to standardize distributions of psychological tests, which measure the normal distribution aspects, comprises: Ist-To compute the mean and standard deviation. 24--To test the normal hypothesis of empirical distribution obtained. 3=LTo compute the profile chart. To make the second and third analytically require a great number of operations. With the graphic procedure that we suggest we can test the normality and obtain the profile chart with a precission superior to -1- 0,4 points in no more than five minutes, from the mean x, the standard deviation a and the cummulative percentages Pi of the empirical distribution.