Anda di halaman 1dari 14

Bioestadstica Aplicada I Ing.

LUZ BULLN 1

ESTADSTICA NO PARAMTRICA
(DE LIBRE DISTRIBUCIN)


Los procedimientos de inferencia presentados previamente trataron la estimacin y prueba de
hiptesis referidas a los parmetros de las poblaciones en estudio. Estas pruebas llamadas
paramtricas utilizan los estadsticos calculados con los datos de las muestras provenientes de
esas poblaciones. Sin embargo, la formulacin de estas pruebas requiere suposiciones restrictivas
tales como
Muestras provenientes de poblaciones con distribucin normal
Variancias conocidas
Muestras independientes
Muestras grandes para garantizar normalidad por el Teorema central del lmite
La estadstica no paramtrica proporciona tcnicas y pruebas alternativas las cuales no hacen
suposiciones restrictivas sobre la forma de la distribucin de la poblacin. Estas pruebas
alternativas son denominadas ms comnmente, pruebas de distribucin libre.
Las pruebas no paramtricas disponibles son muchas, en el presente trabajo abordaremos las
mejor conocidas y de mayor uso para una y dos muestras, como son:
1. La prueba del signo
2. Prueba del signo para datos (muestras) pareados
3. Prueba de rangos con signo o de Wilcoxon
4. Prueba de rangos para dos muestras independientes denominada U de Mann- Withney
Una prueba no paramtrica se aplica cuando no es posible aceptar las suposiciones de la
estadstica paramtrica, principalmente la de la distribucin normal (u otra distribucin
especificada) de los datos muestrales y cuando stos tienen una escala de medicin inferior que
no permite realizar operaciones aritmticas. Para comprender completamente esta ltima
afirmacin es necesario entender el significado de medicin y de las diversas escalas de medicin
que se utilizan.

MEDICIN. Se define como la asignacin de nmeros a objetos o eventos de acuerdo con un
conjunto de reglas. Las diversas escalas de medicin son consecuencia del hecho de que la
medicin puede llevarse a cabo segn diferentes conjuntos de reglas. En orden de menos a ms,
por su nivel, las escalas que se utilizan son:

1. NOMINAL. Escala de medicin ms dbil, baja. Consiste en categoras a las que se asigna
como su nombre lo indica, un nombre sin que exista ningn orden implcito entre ellas. Las
observaciones se nombran o clasifican en estas categoras mutuamente excluyentes y
colectivamente exclusivas.

2. ORDINAL. Escala de medicin de siguiente nivel. Consiste en categoras ordenadas y el
nmero de stas debe ser mnimo tres. Entre observaciones clasificadas en esta escala se
establece una relacin de orden o jerarqua, pero las diferencias entre categoras pueden no
ser iguales.
Bioestadstica Aplicada I Ing. LUZ BULLN 2


3. INTERVLICA. Siguiente escala de medicin. Con esta escala no slo es posible ordenar las
mediciones sino que se conoce la tambin la distancia entre dos mediciones cualesquiera. La
capacidad para hacer esto ltimo implica establecer distancias unitarias iguales entre sus
categoras y un punto cero pero stos son arbitrarios. A diferencia de las dos anteriores es una
escala realmente cuantitativa, donde de hecho puede determinarse la igualdad de los
intervalos. Cuando se logran satisfacer las suposiciones del modelo, pueden utilizarse los
procedimientos usuales de estadsticas parmetricas.

4. PROPORCIONAL O DE RAZN. Escala de ms alto nivel, completa. Puede determinarse la
igualdad de las razones adems de la de los intervalos. Para esta escala es fundamental un
punto cero significativo y puede utilizarse cualquier operacin aritmtica as como cualquier
procedimiento estadstico siempre que se cumplan las suposiciones especficas del modelo
que se utiliza.


Una prueba til (no significa que sea la mejor) para datos en escala nominal, tambin lo es para
datos en escalas superiores. Por lo contrario, una prueba que es til para datos en escala de
intervalo es inaplicable para datos de escala inferior.


VENTAJAS DE LOS MTODOS NO PARAMTRICOS

1. No requieren hacer la suposicin de que la poblacin est distribuida normalmente o
tiene otra forma especfica.
2. En general, son ms fciles de comprender y aplicar
3. Requieren supuestos muy generales acerca de la poblacin
4. La escala de medicin puede ser de las inferiores


DESVENTAJAS DE LOS MTODOS NO PARAMTRICOS

1. Desperdician informacin al utilizar signos o rangos en lugar de los valores de las
variables
2. No recomendables cuando una buena alternativa sea un mtodo paramtrico, desde que a
menudo no son tan eficientes o "exactas" como stas.

Cuando se recurre a pruebas no paramtricas se hace un compromiso: perder eficiencia en la
estimacin de intervalos, pero adquirir la habilidad de utilizar menos informacin.



Bioestadstica Aplicada I Ing. LUZ BULLN 3


1. PRUEBA DEL SIGNO PARA UNA MUESTRA

Es una de las pruebas no paramtricas ms sencillas de utilizar. Su nombre proviene del hecho en
que se basa en la direccin (o signo) de los datos en lugar de su valor numrico.

La prueba se usa cuando:
No es posible suponer normalidad de los datos
Los datos disponibles estn en escala ordinal, por lo menos

La prueba supone que la muestra se obtiene de una poblacin simtrica en la cual la probabilidad
de que un valor muestral sea menor que la mediana (media) es 1/2 e igual a la probabilidad de
que sea mayor.

Para los clculos de la prueba los datos son signos + y , dependiendo si las observaciones estn
por arriba o por debajo de la mediana hipottica.


PROCEDIMIENTO

1. Las hiptesis H
0
: Me = H
0
: Me H
0
: Me
H
1
: Me H
1
: Me > H
1
: Me <

Si H
0
es cierta, se esperara que el nmero de observaciones mayores que sea igual al
nmero de observaciones menores, es decir, que la probabilidad de observar un signo + es
igual a la probabilidad de observar un signo , entonces tambin se puede plantear

H
0
: P(+) = P() = 1/2

2. Estadstica de prueba: S = nmero de signos + en la muestra

H
1
determina la conveniencia de +

S H
1
: P(+) < P(), la estadstica de prueba es el nmero de signos + y un nmero
suficientemente pequeo de signos + causar el rechazo de H
0
.

S H
1
: P(+) > P(), la estadstica de prueba es el nmero de signos y un nmero
suficientemente pequeo de signos causar el rechazo de H
0
.

S H
1
: P(+) P(), un nmero suficientemente pequeo de + causar rechazo. Se puede
tomar como estadstica de prueba el nmero de signos que ocurra con menos frecuencia

3. Distribucin de la estadstica de prueba

Las observaciones constituyen ensayos de Bernoulli, luego S tiene distribucin binomial con
probabilidad de xito igual a 1/2.


Bioestadstica Aplicada I Ing. LUZ BULLN 4

4. Decisin

Cuando H
1
: P(+) < P(), se rechaza H
0
, s bajo H
0
cierta, la probabilidad de observar s
menos signos + es menor igual que
Cuando H
1
: P(+) > P(), se rechaza H
0
, s bajo H
0
cierta, la probabilidad de observar s
menos signos es menor igual que
Cuando H
1
: P(+) P(), se rechaza H
0
, s bajo H
0
cierta, la probabilidad de obtener un valor
de s tanto ms extremo como el que se calcul, es menor igual que /2.

En una prueba unilateral, el valor p = P(S s), si la prueba es bilateral, se rechaza H
0
si P(S
s) < /2


OBSERVACIONES

1. La estadstica de prueba S tiene distribucin Binomial (n, =1/2)
2. Si el tamao de muestra n, es pequeo, se usar la verdadera distribucin.
Si n es grande (n>30), la distribucin de S se puede aproximar por la normal con parmetros
= n y = n (1- ), luego con la correccin de continuidad,

+
=
) 1 (
2 / 1
) (

n
n s
Z P s S P



EJEMPLO 1: En el estudio del nivel de actividad fsica (escala medida de 0 a 10) y su relacin
con el peso corporal en nios de 7 a 15 aos, se ha determinado que el nivel adecuado sera de 5
o ms. Para verificar esta afirmacin en una poblacin particular donde se sospecha que este
nivel es menor, se toma una muestra de 11 nios de un centro educativo encontrndose los
niveles de actividad fsica que se detallan. Qu puede concluir respecto a la afirmacin? (Use
= 0.05?

Nio 1 2 3 4 5 6 7 8 9 10 11
Act. Fsica 4 4 7 3 2 4 8 5 4 4 7


PROCEDIMIENTO:

1. La hiptesis H
0
: Me = 5 equivalentemente, H
0
: P(+) = P()
H
1
: Me < 5

2. Signos de las diferencias respecto al valor planteado:

1 2 3 4 5 6 7 8 9 10 11
+ + 0 +

Si alguna diferencia resulta cero, se elimina la observacin correspondiente, disminuyendo el
tamao de muestra.
Bioestadstica Aplicada I Ing. LUZ BULLN 5

3. Estadstica de prueba: S = nmero de signos + (el que ocurre con menos frecuencia) en la
muestra. Un nmero suficientemente pequeo de + causar rechazo

4. Distribucin de la estadstica de prueba. Las observaciones constituyen ensayos de Bernoulli,
luego S tiene distribucin binomial con probabilidad de xito igual a 1/2 y tamao de
muestra reducida si hay ceros, n = 10

5. Decisin. La prueba es unilateral, se rechaza H
0
si el valor p = P(S s)<

6. Clculo de la probabilidad:
= ) 3 (S P 0.000977 + 0.009766 + 0.043945 + 0.117188 = 0.171875

Como p > , no se rechaza la hiptesis nula.

Sign Test for Median: AF

Sign test of median = 5.000 versus < 5.000

N Below Equal Above P Median
AF 11 7 1 3 0.1719 4.000



MUESTRA GRANDE

Suponga una situacin con una muestra grande (n = 40) donde se observaron 11 signos y 29
signos +.
Se desea contrastar las hiptesis
H
0
: P(+) = P() = 1/2
H
1
: P(+) > P()
La estadstica de prueba es el nmero de signos y un nmero suficientemente pequeo de
signos causar el rechazo de H
0
.
La distribucin binomial de la estadstica de prueba S se aproxima por la distribucin normal de
la forma siguiente:

+
=
) 2 / 1 )( 2 / 1 ( 40
) 2 / 1 ( 40 5 . 0 11
) 11 ( Z P S P = ( ) 2.69 P Z


Cumulative Distribution Function

Normal with mean = 0 and standard deviation = 1

x P( X <= x )
-2.69 0.0035726


Como 0.05 p < = , luego, se rechaza H
0


Bioestadstica Aplicada I Ing. LUZ BULLN 6

2. PRUEBA DEL SIGNO PARA MUESTRAS PAREADAS


Un dato pareado o de una muestra pareada es un dato bivariado (x,y) que corresponde a:
Dos variables obtenidas para un mismo elemento de la poblacin.
Una variable obtenida en un mismo elemento de la poblacin, en dos momentos distintos o
por dos observadores.

La prueba se usa cuando:
No son satisfechas las suposiciones de la prueba t
Los datos disponibles estn en escala ordinal, por lo menos

La prueba se basa en las medianas de X e Y.
Supone que se muestrean dos poblaciones simtricas que son dependientes, relacionadas.

La prueba compara los valores del par observado y se basa en la direccin de esta diferencia. Se
toma la pareja de datos de la observacin i y se obtiene la diferencia x
i
- y
i
, la cual puede ser
mayor que 0 menor que 0, es decir, tener signo + . Si la diferencia entre las medianas es 0, se
esperara que un par x
i
, y
i
cualquiera tenga igual probabilidad de dar un signo + .


PROCEDIMIENTO

La hiptesis

H
0
: Me
x
= Me
y
, (Me
x
Me
y
= 0) equivalentemente
H
0
: P (x
i
> y
i
) = P (x
i
< y
i
) = 1/2

Tambin se puede plantear,

H
0
: P(+) = P() = 0.5

En una muestra aleatoria se esperara que el nmero de signos + y sea casi igual. Si existen ms
signos + que los que pueden atribuirse nicamente al azar, cuando H
0
es verdadera, se dudar
de la veracidad de H
0
. Mediante la prueba de signos, es posible determinar cuntos signos de uno
u otro tipo son ms de los que pueden atribuirse nicamente al azar.

El procedimiento contina como en el caso de una muestra.

EJEMPLO 2. Un estudio analiz la influencia de charlas educativas de nutricin en cambios de
actitudes hacia la preparacin de alimentos en familias de pocos ingresos. Se seleccionaron
aleatoriamente quince familias de caractersticas similares, a las cuales se les instruy en el valor
nutritivo de distintos productos locales y en la importancia de preparar comidas balanceadas. A
continuacin se presenta los resultados de la evaluacin de la preparacin de alimentos antes y
despus de las charlas educativas. Los resultados se presentan en una escala de 1 = pobre a 7 =
alto valor nutritivo de las comidas preparadas en casa. Realizar la prueba de los rangos
signados de Wilcoxon. Usar = 0.05.
Bioestadstica Aplicada I Ing. LUZ BULLN 7


Familia 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Antes 3 6 6 1 5 3 1 4 6 3 6 4 5 2 4
Despus 4 5 4 6 5 5 7 7 6 5 3 3 7 5 6
Signo + + 0 + + + 0 + + + +

Hiptesis H
o
: Charlas educativas no tuvieron ningn impacto
H
1
: Luego de las charlas mejor la preparacin de las comidas,

o equivalentemente, H
o
: Me 0
H
1
: Me >0




Cumulative Distribution Function

Binomial with n = 13 and p = 0.5

x P( X <= x )
4 0.133423



Sign Test for Median: Dif

Sign test of median = 0.00000 versus > 0.00000

N Below Equal Above P Median
Dif 15 4 2 9 0.1334 2.000


Bioestadstica Aplicada I Ing. LUZ BULLN 8

3. PRUEBA DE WILCOXON (O DEL RANGO CON SIGNO)

La prueba de Wilcoxon se usa cuando se desea probar una hiptesis con respecto a la media de
una poblacin, pero por alguna razn, ni Z ni t resultan adecuadas como estadstica de prueba.
La prueba supone respecto a los datos:
La muestra es aleatoria
La variable es continua
La poblacin es simtrica
La escala de medicin es al menos de intervalo
La prueba utiliza las magnitudes de las diferencias entre las observaciones y el parmetro de
inters ordenadas por rangos.

RANGOS
Muchas pruebas no paramtricas usan los rangos en lugar de los datos. Un RANGO es un
nmero asignado a una observacin teniendo en consideracin su importancia relativa (o
jerarqua) respecto a los dems datos.
EJEMPLO: Suponga los datos 14.5, 10.3, 11.0, 8.5 y 15.8. stos pueden ordenarse de
menor a mayor y tener rangos respectivamente:
Datos ordenados: 8.5 10.3 11.0 14.5 15.8
Rangos: 1 2 3 4 5

EMPATES EN LOS RANGOS
En caso de empate o coincidencia de observaciones se asigna el promedio de los rangos que
ocupan las observaciones.
EJEMPLO: Los nmeros 9, 5, 11, 9, 12, 16 y 8 reciben los rangos de 1 a 7, pero hay un
empate de 9 con los rangos 3 y 4. Se calcula media de 3 y 4 (que es 3.5) y asignamos los rangos:
Datos ordenados: 5 8 9 9 11 12 16
Rangos: 1 2 3.5 3.5 5 6 7

De manera similar, si el empate es de las tres observaciones ms pequeas cuyos rangos son 1, 2
y 3, entonces a cada una se le asigna el rango medio (1+2+3) / 3 = 2


PROCEDIMIENTO DE LA PRUEBA

Las hiptesis que pueden probarse para alguna media de poblacin no conocida:

H
0
: =
0
H
0
:
0
H
0
:
0
H
1
:
0
H
1
: <
0
H
1
: >
0



1. Obtener las diferencias d
i
= x
i

0
. Si cualquier d
i
= 0, eliminarla de los clculos, reduciendo
por lo tanto n
Bioestadstica Aplicada I Ing. LUZ BULLN 9

2. Ordenar las d
i
de menor a mayor sin considerar el signo. Si dos ms |d
i
| son iguales asignar
a cada valor la media de la posicin que ocupa en la lista. Por ejemplo, si las tres |d
i
| ms
pequeas, sus posiciones son 1, 2 y 3, dentro del rango, luego a cada una se le asigna el rango
(1+2+3)/3=2
3. A cada categora se le asigna el signo de la diferencia correspondiente
4. Encontrar las estadsticas: T
+
, la suma de las categoras con signo + y T
-
, la suma de las
categoras con signo -.
Si H
0
es verdadera, la probabilidad de una diferencia positiva de una magnitud dada, es igual a la
probabilidad de una diferencia negativa de la misma magnitud, es decir, P(d
i
+
) = P(d
i
-
). Luego, el
valor esperado de T
+
es igual al valor esperado de T
-
. A partir de una muestra no se espera una
gran diferencia entre sus valores
La estadstica de prueba es T
+
T
-
, dependiendo de la hiptesis alternativa.
El valor calculado se compara con los valores crticos de la estadstica de prueba de Wilcoxon
que se encuentran en la tabla correspondiente. Los valores se presentan para todas las muestras de
tamao 4 hasta n = 50.


OBSERVACIONES
Si n > 30, se define la estadstica de prueba:
2

=
i
i
R
R
T

S no hay empates sta se simplifica:
6
) 1 2 )( 1 ( + +
=

n n n
R
T
i


Luego se usa la aproximacin de la distribucin normal estndar.



EJEMPLO 3: En el estudio del nivel de actividad fsica (escala medida de 0 a 10) y su relacin
con el peso corporal en nios de 7 a 15 aos, se ha determinado que el nivel adecuado sera de 5
o ms. Para verificar esta afirmacin en una poblacin particular donde se sospecha que este
nivel es menor, se toma una muestra de 11 nios de un centro educativo encontrndose los
niveles de actividad fsica que se detallan.
4 4 7 3 2 4 8 5 4 4 7

Qu puede concluir(=0.05) respecto a la afirmacin?


La hiptesis H
0
: Me = 5
H
1
: Me < 5

Los clculos necesarios se muestran en la tabla siguiente:

Bioestadstica Aplicada I Ing. LUZ BULLN 10

Nivel de
actividad
fsica
Diferencia:
0
=
i i
x d
Rango de
| d
i
|
Rango con
signo de d
i


4
4
7
3
2
4
8
5
4
4
7
- 1
- 1
+ 2
- 2
- 3
- 1
+ 3
0
- 1
- 1
+ 2
3
3
7
7
9.5
3
9.5

3
3
7
- 3
- 3
+ 7
- 7
- 9.5
- 3
+ 9.5

- 3
- 3
+ 7
La segunda columna
corresponde a los valores de
la diferencia, de la
observacin menos el valor
hipottico planteado

En la columna 3 se otorgan
rangos a las diferencias sin
tomar en cuenta el signo


T
+
= 23.5
T

= 31.5

Se suma los rangos con
signo, por separado rangos
negativos y positivos.

La estadstica de prueba es el menor entre los valores T, en este caso T
+
= 23.5, la pregunta es
es suficientemente pequeo para rechazar H
0
?
El valor crtico, (tabla de Wilcoxon) para una hiptesis unilateral es T = 11. Luego no se puede
rechazar la hiptesis nula.
CONCLUSIN. Es posible afirmar a un nivel de significacin de 5%, que el nivel de actividad
fsica en la poblacin estudiada, no es significativamente menor al recomendado.


Wilcoxon Signed Rank Test: C1

Test of median = 5.000 versus median < 5.000

N for Wilcoxon Estimated
N Test Statistic P Median
Niv-ActFis 11 10 23.5 0.361 4.500


PRUEBA DE WILCOXON PARA DATOS PAREADOS

EJEMPLO 4. Un estudio analiz la influencia de charlas educativas de nutricin en cambios de
actitudes hacia la preparacin de alimentos en familias de pocos ingresos. Se seleccionaron
aleatoriamente quince familias de caractersticas similares, a las cuales se les instruy en el valor
nutritivo de distintos productos locales y en la importancia de preparar comidas balanceadas. A
continuacin se presenta los resultados de la evaluacin de la preparacin de alimentos antes y
despus de las charlas educativas. Los resultados se presentan en una escala de 1 = pobre a 7 =
alto valor nutritivo de las comidas preparadas en casa. Realizar la prueba de los rangos
signados de Wilcoxon. Usar = 0.05.

Bioestadstica Aplicada I Ing. LUZ BULLN 11

Familia 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Antes 3 6 6 1 5 3 1 4 6 3 6 4 5 2 4
Despus 4 5 4 6 5 5 7 7 6 5 3 3 7 5 6
|d
j
| 1 1 2 5 0 2 6 3 0 2 3 1 2 3 2
Rango 2 2 6 12 * 6 13 10 * 6 10 2 6 10 6
R
j
con
signo
2 2 6 12 * 6 13 10 * 6 10 2 6 10 6

Hiptesis H
o
: Charlas educativas nos tuvieron ningn impacto
H
1
: Luego de las charlas mejor la preparacin de las comidas,

o equivalentemente, H
o
: Me 0
H
1
: Me >0
T
+
= 71
T

= -20
El valor de tabla:
CONCLUSION

Wilcoxon Signed Rank Test: Dif

Test of median = 0.000000 versus median > 0.000000

N for Wilcoxon Estimated
N Test Statistic P Median
Dif 15 13 71.0 0.040 1.000


Estadstico de prueba y clculo de la evidencia muestral

=
n
j
j
R
1
= 2 2 6 + 12 + 6 + 13 + 10 + 6 10 2 + 6 + 10 + 6 = 47

=
n
j
j
R
1
2
= (2)
2
+ (2)
2
+ (6)
2
+ 12
2
+ 6
2
+ 13
2
+ 10
2
+ 6
2
+ (10)
2
+ (-2)
2
+ 6
2
+ 10
2
+ 6
2
= 805
805
47
13
1
2
13
1 *
= =

=
=
i
i
i
i
R
R
Z
calc
= 1.6565
p-value = P(Z 1.6565) = 0.0488
CONCLUSIN
p-value = 0.0488 < 0.05 , por lo tanto rechazar la hiptesis nula y concluir que las charlas
educativas s tuvieron efecto positivo en la preparacin de comidas de mayor nivel nutritivo.
Bioestadstica Aplicada I Ing. LUZ BULLN 12

4. PRUEBA DE MANN -WHITNEY
(PARA DOS MUESTRAS INDEPENDIENTES)

Alternativa a la prueba t para la diferencia de dos medias.
Las preguntas que se hacen y que la prueba va a responder son:
Hay tendencia de una poblacin a producir valores ms grandes que la otra poblacin?
Son las medianas de las poblaciones iguales?

La prueba supone que las dos muestras, de tamaos n
1
y n
2
respectivamente, han sido extradas
independientemente y en forma aleatoria de sus poblaciones
Si las poblaciones son diferentes, difieren slo en lo que respecta a sus medianas
La escala de medicin es por lo menos ordinal

La prueba utiliza la informacin de los datos ordenados por rangos.

Las HIPTESIS se refieren a las medianas de las poblaciones:

H
0
: Me
x
= Me
y
H
0
: Me
x
Me
y
H
0
: Me
x
Me
y
H
1
: Me
x
Me
y
H
1
: Me
x
> Me
y
H
1
: Me
x
< Me
y




PROCEDIMIENTO

Combinar los valores de ambas muestras aleatorias y luego asignar rangos (de menor a mayor)
sin importar a que poblacin pertenece cada valor. En caso de empate o coincidencia de
observaciones se asigna el promedio de los rangos que ocupan las observaciones.
Si la mediana de la poblacin X es, en efecto, ms pequea (o ms grande) que la mediana de la
poblacin Y, es de esperar, (para muestras de igual tamao) que la suma de los rangos asignados
a las observaciones de X sea menor (o mayor) que la suma de los rangos asignados a las
observaciones de la poblacin Y
La prueba estadstica se basa en
U = mn ( U
1
, U
2
), donde U
1
y U
2
son funciones de R
x
R
y
de la forma siguiente:
x
R
n n
n n U
+
+ =
2
) 1 (
1 1
2 1 1

y
R
n n
n n U
+
+ =
2
) 1 (
2 2
2 1 2

Se rechaza H
0
: Las medianas son iguales, las poblaciones son idnticas, s U < U

La tabla de valores U, presenta la probabilidad P (U U

) para muestras pequeas (n 20)




EJEMPLO 4. En un experimento diseado para estimar los efectos de la inhalacin prolongada
de xido de cadmio, 15 animales de laboratorio sirvieron de sujetos para el experimento,
mientras que 10 animales similares sirvieron de controles. La variable de inters fue la
concentracin de hemoglobina (gramos) despus del experimento. Los resultados se muestran a
Bioestadstica Aplicada I Ing. LUZ BULLN 13

seguir.

Animales expuestos
X
14.4 14.2 13.8 16.5 14.1 16.6 15.9 15.6 14.1 15.3
15.7 16.7 13.7 15.3 14.0
Animales no expuestos
Y

17.4 16.2 17.1 17.5 15.0 16.0 16.9 15.0 16.3 16.8

Se desea saber si es posible concluir que la inhalacin prolongada de xido de cadmio disminuye
el nivel de hemoglobina.

Las hiptesis: H
0
: Me
x
Me
y
H
1
: Me
x
< Me
y


PROCEDIMIENTO:

Datos y rangos para el clculo de la estadstica de prueba:

X Rango Y Rango
13.7
13.8
14.0
14.1
14.1
14.2
14.4


15.3
15.3
15.6
15.7
15.9



16.5
16.6
16.7





1
2
3
4.5
4.5
6
7


10.5
10.5
12
13
14



18
19
20







15.0
15.0





16.0
16.2
16.3



16.8
16.9
17.1
17.4
17.5







8.5
8.5





15
16
17



21
22
23
24
25
R
x
= 145 R
y
= 180


Clculo de U = mn ( U
1
, U
2
), donde U
1
y U
2
son:

Bioestadstica Aplicada I Ing. LUZ BULLN 14

125 145
2
16 15
10 15
2
) 1 (
1 1
2 1 1
=

+ =
+
+ =
x
R
n n
n n U
25 180
2
11 10
10 15
2
) 1 (
2 2
2 1 2
=

+ =
+
+ =
y
R
n n
n n U

U = mn ( U
1
, U
2
) = 25

El valor de la Tabla de valores crticos de U de Mann-Whitney es 44 =

U

Luego, se rechaza H
0
. La prueba result significativa. Es posible concluir que la inhalacin
prolongada de xido de cadmio disminuye el nivel de hemoglobina (p<0.05)


OBSERVACIONES

Para muestras grandes, n>20, se usa la aproximacin de la distribucin normal:
La prueba se puede basar en U
1
U
2
(pruebas equivalentes)
Bajo H
0
, las dos muestras provienen de poblaciones idnticas, se puede probar:

U
=
2
2 1
n n
y
U
=
12
) 1 (
2 1 2 1
+ + n n n n
, luego Z =
U
U U
U


tiene distribucin normal
estndar.

DECISIN

Rechazar H
0
: Me
x
= Me
y
, a favor de:

H
1
: Me
x
Me
y
si Z < - Z
/2
Z > Z
/2

H
1
: Me
x
< Me
y
s Z > Z

(valores grandes de U corresponden a menores valores de R


x
)
H
1
: Me
x
> Me
y
s Z < - Z







Mann-Whitney Confidence Interval and Test

Expuesto N = 15 Median = 15.300
No expue N = 10 Median = 16.550

Point estimate for ETA1-ETA2 is -1.300

95.1 Percent CI for ETA1-ETA2 is (-2.300,-0.600)

W = 145.0

Test of ETA1 = ETA2 vs ETA1 < ETA2 is significant at 0.0030

The test is significant at 0.0030 (adjusted for ties)

Anda mungkin juga menyukai