Anda di halaman 1dari 4

PRUEBAS NO PARAMETRICAS

MARCO TERICO

La mayor parte de los procedimientos de prueba de hiptesis se basan en la suposicin


de que las muestras aleatorias se seleccionan de poblaciones normales.
Afortunadamente, la mayor parte de estas pruebas an son confiables cuando
experimentamos ligeras desviaciones de la normalidad, en particular cuando el tamao de
la muestra es grande. Tradicionalmente, estos procedimientos de prueba se
denominan mtodos paramtricos. En este trabajo se consideran varios procedimientos
de prueba alternativos, llamados no paramtricos o mtodos de distribucin libre, que a
menudo no suponen conocimiento de ninguna clase acerca de las distribuciones de las
poblaciones fundamentales, excepto que stas son continuas.
Asimismo las pruebas no paramtricas competen a la estadstica no paramtrica que es
una rama de la estadstica que estudia las pruebas y modelos estadsticos cuya
distribucin subyacente no se ajusta a los llamados criterios paramtricos. La utilizacin
de estos mtodos se hace recomendable cuando no se puede asumir que los datos se
ajusten a una distribucin conocida, cuando el nivel de medida empleado no sea, como
mnimo, de intervalo.
Los procedimientos no paramtricos o de distribucin libre se usan con mayor frecuencia
por los analistas de datos. Existen muchas aplicaciones en la ciencia y la ingeniera donde
los datos se reportan no como valores de un continuo sino ms bien en una escala ordinal
tal que es bastante natural asignar rangos a los datos.
Una definicin ms simple y especifica es la denominacin que se da a las pruebas no
paramtricas como aquellas que no presuponen una distribucin de probabilidad para los
datos, por ello se conocen tambin como de distribucin libre. En la mayor parte de ellas
los resultados estadsticos se derivan nicamente a partir de procedimientos de
ordenacin y recuento, por lo que su base lgica es de fcil comprensin. Cuando
trabajamos con muestras pequeas (n < 10) en las que se desconoce si es vlido suponer
la normalidad de los datos, conviene utilizar pruebas no paramtricas, al menos para
corroborar los resultados obtenidos a partir de la utilizacin de la teora basada en la
normal.
Entre las principales pruebas no paramtricas encontramos:
-

Prueba de Ji Cuadrado
Prueba de Signos
Prueba Wilcoxon
Prueba de Kruskal-Wallis

a) Prueba de Chi Cuadrada


La distribucin chi cuadrada es toda una familia de distribuciones. Existe una
distribucin chi-cuadrada para cada grado de libertad.
Los resultados obtenidos de muestras no siempre concuerdan exactamente con
los resultados tericos esperados, segn las reglas de probabilidad. Por
ejemplo, aunque consideraciones tericas conduzcan a esperar 50 caras y 50
cruces cuando se lanza 100 veces una moneda bien hecha, es raro que se
obtengan exactamente estos resultados.
Supngase que en una determinada muestra se observan una serie de posibles
sucesos E1, E2, E3, . . . , EK, que ocurren con frecuencias o1, o2, o3, . . ., oK,
llamadas frecuencias observadas y que, segn las reglas de probabilidad, se
espera que ocurran con frecuencias e1, e2, e3, . . . ,eK llamadas frecuencias
tericas o esperadas.
A menudo se desea saber si las frecuencias observadas difieren
significativamente de las frecuencias esperadas. Para el caso en que solamente
son posibles dos sucesos E1 y E2 como, por ejemplo, caras o cruces,
defectuoso, etc., el problema queda resuelto satisfactoriamente con los
mtodos de las unidades anteriores. En esta unidad se considera el problema
general.
Definicin de X. Una medida de la discrepancia existente entre las frecuencias
observadas y esperadas es suministrada por el estadstico X2, dado por:

Donde si el total de frecuencias es N,

Si X2 = 0, las frecuencias observadas y esperadas concuerdan exactamente,


mientras que si X2>0, no coinciden exactamente. A valores mayores de X 2,
mayores son las discrepancias entre las frecuencias observadas y esperadas.
Si las frecuencias esperadas son al menos iguales a 5, la aproximacin mejora
para valores superiores.
El nmero de grados de libertad

est dado por:

=k1m
En donde:
K = nmero de clasificaciones en el problema.
m = nmero de parmetros estimados a partir de los datos mustrales para
obtener los valores esperados.

b) Prueba de kruskal-Wallis

En estadstica, la prueba de Kruskal-Wallis (de William Kruskal y W. Allen Wallis) es


un mtodo no paramtrico para probar si un grupo de datos proviene de la misma
poblacin. Intuitivamente, es idntico al ANOVA con los datos reemplazados por
categoras. Es una extensin de la prueba de la U de Mann-Whitney para 3 o ms grupos.
Las hiptesis son:
H0: Todas las k poblaciones tienen la misma distribucin.
H1: No todas las k poblaciones tienen la misma distribucin.

Ya que es una prueba no paramtrica, la prueba de Kruskal-Wallis no


asume normalidad en los datos, en oposicin al tradicional ANOVA. S asume, bajo la
hiptesis nula, que los datos vienen de la misma distribucin. Una forma comn en que se
viola este supuesto es con datos heterocedsticos.

1. El estadstico est dado por:


Donde:

es el nmero de observaciones en el grupo

es el rango (entre todas las observaciones) de la observacin


grupo

es el nmero total de observaciones entre todos los grupos

,
es el promedio de

Note que el denominador de la expresin para

.
es exactamente.

en el

Luego

.
2. Se puede realizar una correccin para los valores repetidos dividiendo
, donde
repetidos, y

por

es el nmero de grupos de diferentes rangos

es el nmero de observaciones repetidas dentro del grupo que

tiene observaciones repetidas para un determinado valor. Esta correccin hace


cambiar a

muy poco al menos que existan un gran nmero de observaciones

repetidas.
3. Finalmente, el p-value (valor p) es aproximado por
es pequeo (

) la distribucin de

. Si algn

puede ser distinta de la chi-cuadrado.

Anda mungkin juga menyukai