FACULTAD DE MEDICINA
DEPARTAMENTO ACADMICO DE MEDICINA PREVENTIVA Y SALUD PBLICA
EAP DE OBSTETRICIA.
ASIGNATURA: BIOESTADISTICA
AGOSTO-DICIEMBRE 2015
SOLUCIONARIO DE LA PRCTICA N 10
PRUEBA DE HIPOTESIS PARA UNA Y DOS MEDIAS, Y DATOS PAREADOS
(Mircoles 11 de Noviembre del 2015)
Dr. Ricardo Terukina Terukina
Profesor Principal
Antes de resolver los ejercicios sobre pruebas de hiptesis para una y dos medias (Muestras independientes y
apareadas), y tres medias, veamos previamente qu tipo de pruebas se usan en estos casos.
Nota: En la resolucin de estos ejercicios debemos considerar el supuesto que se tratan de variables distribuidas
normalmente en las poblaciones de estudio.
A. Prueba de hiptesis para una media,
Estn dirigidas a inquirir si la media ( x ) de un conjunto de observaciones directas son iguales a un valor estndar o
normales de la poblacin () .
A1: Si la muestra es grande (> 30): Prueba Z
A2: Si la muestra es pequea (<30): Prueba t o de Student.
B. Prueba de hiptesis para dos medias.
Estn dirigidas a determinar si las medias de dos muestras son iguales.
Como se trata de pruebas de hiptesis para la diferencia de dos medias, previamente debemos sealar los casos que
se presentan y cules son las pruebas ms adecuadas:
B.1. Prueba de hiptesis para la diferencia de medias poblacionales de poblaciones normales con
y conocidas.
Cundo se dice que la varianza es conocida? En primer lugar, debemos aclarar que la varianza conocida se
refiere a la varianza de la poblacin (2); se dice que una varianza es conocida cuando se conoce la varianza
poblacional. Cuando se conoce la varianza de la muestra, se trata de una varianza desconocida, porque se
refiere a la estimacin de la varianza poblacional, salvo que se trate de una muestra grande (n 30), en cuyo
caso se considera que la estimacin de la varianza es confiable y se maneja como si fuera una varianza
conocida ().
Existen dos casos:
1.
Z Estadstico Z
x1 Media de la 1 muestra
Z
2.
x 2 Media de la 2 muestra
x1 x 2 (1 2 )
12 2 2
n1
n2
x1 x 2 (1 2 )
12 2 2
n1
n2
t Estadstico t
x1 Media de la 1 muestra
x 2 Media de la 2 muestra
Grados de libertad = n1 + n2 2
B.2. Prueba de hiptesis para la diferencia de medias poblacionales de poblaciones normales con
y desconocidas.
Cuando el tamao de la muestra es grande (n 30 ) la estimacin de la varianza y desviacin estndar es
confiable y se maneja como si fueran una varianza conocida (). Caso B.1. - 1.
Cuando se trata de prueba de hiptesis para la diferencia de medias poblacionales con varianzas desconocidas
se usa la prueba t.
En el desarrollo de la prueba t para grupos independientes existen dos casos:
1. Que las varianzas de las muestras sean desconocidas e iguales.
Cuando las varianzas son iguales se utiliza la varianza combinada. (sp2)
x1 x 2 (1 2 )
sp2
n1
sp2
n2
t Estadstico t
x1 Media de la 1 muestra
x 22 Media de la 2 muestra
s p Varianza combinada dse ambas muestras
Donde n1 Tamao de la 1 muestra
n 2 Tamao de la 2 muestra
2
2
s 2 (n1 1) s1 (n 2 1) s 2
p
n1 n 2 2
Grados de libertad = n1 + n2 2
2.
x x 2 (1 2 )
t 1
s12 s 2 2
n1 n 2
t Estadstico t
x1 Media de la 1 muestra
x 2 Media de la 2 muestra
2
s Varianza de la 1 muestra
Donde 12
1 Varianza de la 1 muestra
2
s1 Varianza de la 2 muestra
n1 T amaode la 1 muest ra
n 2 T amao de la 2 muest ra
2
s 2 s 2
1 2
n2
n1
2
n1 1 n 2 1
d (1 2 )
t
sd
n
t Estadstico t
Grados de libertad = n 1
1.
El requerimiento humano de sal es de 220 mg/da. Si una muestra de 38 raciones iguales de un cereal para el
desayuno tiene un contenido promedio de NaCl de 196 mg con una desviacin de 24.5 mg, Se podra afirmar que
una racin de este cereal satisface el requerimiento diario de cloruro de sodio? Use = 0.05
Datos:
x
s
n
= 196,0 mg
= 24,5 mg
= 38 raciones
= 220 mg/da
= 0.05
6,038609635 6,0386
s
24 ,5
24 ,5
3,974424818
6,164414003
n
38
Paso 7: Toma de decisin y conclusin.
Como la Zcalc (-6,0386) es menor que - Z tab (-1,96), se rechaza la H 0 con un nivel de significacin de 0,05
o 5%.
Se recomienda que adems de expresar si se rechaza o acepta la hiptesis nula se determine el valor de la
probabilidad de Z. (valor p)
Existen dos formas para determinar el valor de la probabilidad de Z:
a
Utiliza
ndo la
tabla
del
rea
bajo la
curva
normal
estnd
ar.
Como
se
sabe,
la
tabla
muestr
a
el
rea
(proba
bilidad
) bajo
la
curva
normal
situad
o a la
derech
a de
los
valore
s
positiv
os de
Z. En
este
caso
debem
os
determ
inar el
rea
(proba
bilidad
)
situad
o a la
izquier
da de
los
valore
s
negati
vos de
Z
(Z
--6,03
86).
Para
obtene
r
la
probab
ilidad
a
la
izquier
da de
-Z
debo
hallar
la
probab
ilidad
de su
valor
simtri
co, o
sea P
(Z
6,0386
), ya
que el
rea o
probab
ilidad
a
la
izquier
da o
menor
de Z =
-6,038
6
es
igual
al rea
o
probab
ilidad
mayor
a Z =
6,0386
por
simetr
a. Se
busca
en la
tabla
la
probab
ilidad
de Z
6,0386
y
se
halla
que la
tabla
slo
muestr
a
el
rea o
probab
ilidade
s
de
los
valore
s de Z
hasta
3,09 y
es de
0,001;
por
consig
uiente:
P (Z
6,0386
) = P
(Z
-6,038
6) <
0,001;
este
valor
corres
ponde
a a/2;
por
consig
uiente
para
obtene
r
el
valor
de se
multip
lica
por 2
(0.001
x 2 =
0.002)
y
se
obtien
e
el
valor
final
de p <
0.002.
b. Como sabemos, Excel muestra el rea o probabilidad a la izquierda de Z; por consiguiente, se consulta
directamente Excel para una prueba bilateral o de dos colas (Funcin Estadstica:
DISTR.NORM.ESTAND.N) y encontramos que para Z -6,0386, p = 7.7728-10 = 0,00000000077728.
Este valor corresponde a a/2; por consiguiente para obtener el valor de se multiplica por 2 (7,7728 -10
x 2 = 1,55456-9 ) y se obtiene el valor final de p = 1,55456-9 = 0,00000000155456.
Conclusin: Una racin de este cereal no satisface los requerimientos diarios de cloruro de sodio.
2.
Una compaa productora de leche pasteurizada tiene como norma no aceptar leche cruda con un contenido de grasa
mayor a los 34 g/100g. Una muestra de 36 litros de leche obtenidos de otras tantas vacas pertenecientes a una misma
granja, dio un valor medio del contenido de grasa en la leche de 35.2 g/100g con una desviacin de 4.1 g/100g.
Ser aceptada la leche por la compaa pasteurizadora? La compaa admite un nivel de error de tipo I del 1%.
Datos:
x
s
n
=
=
=
=
=
35,2 g/100g
4,1 g/100 g.
36
34,0 g/100 g
0.01
1,756097562 1,7561
s
4,1
4,1 0,68333333
6
n
36
Paso 7: Toma de decisin y decisin.
Como la Zcalc (1,7561|) es menor que Ztab (2,33), no se rechaza la H0 con un nivel de significacin de 0,01
o 1%.
Se recomienda que adems de expresar si se rechaza o acepta la hiptesis nula se determine el valor de la
probabilidad Z. (valor de p)
b.
Utilizando la tabla del rea bajo la curva normal estndar. Como se sabe, la tabla muestra el rea
(probabilidad) bajo la curva normal situado a la derecha de los valores positivos de Z. En este caso
debemos determinar el rea (probabilidad) situado a la derecha de Z; por consiguiente se busca
directamente en la tabla y se halla que para Z 1,7561, 0,0401 > p > 0,0392.
Consultando Excel para una prueba unilateral o de una cola a la derecha (Funcin Estadstica:
DISTR.NORM.ESTAND.N). Como esta funcin de Excel muestra la probabilidad a la izquierda de Z,
para hallar la probabilidad a la derecha de Z debo obtener la probabilidad de su valor simtrico, o sea la
P (Z -1,7561), ya que P (Z 1,7561) = P (Z -1,7561); buscamos la probabilidad a la izquierda de Z
= -1,7561 y se halla que p = 0.039535668; por consiguiente: P (Z 1,7561) = 0,039535668.
Dos laboratorios de investigacin en forma independiente han producido medicamentos que alivian los sntomas que
sufren los pacientes que tienen gastritis. El primer frmaco (A) fue probado en un grupo de 30 pacientes con
gastritis, ofrecindoles un promedio de 8,5 horas de alivio de los sntomas, con una desviacin estndar de 1,8 horas.
El segundo frmaco (B) fue probado en 25 pacientes con gastritis y produjo un promedio de 7,9 horas de alivio, con
una desviacin estndar de 2,1 horas. Con un nivel de significancia 0,05, el segundo medicamento B ofrece menos
horas de alivio del dolor, que el primer frmaco A?
Datos:
nA = 30 pacientes.
nB = 25 pacientes.
xA
= 8,5 horas de alivio
xB
= 7,9 horas de alivio
sA = 1,8 horas
sB = 2,1 horas
= 0.05
Pasos:
Se identifican las variables de estudio:
Horas de alivio de la gastritis y medicamento recibido
Paso 1: Formulacin de Hiptesis
Ho: B A (La media de las horas de alivio de la gastritis con el medicamento B es igual o mayor que
con A)
H1: B < A (La media de las horas de alivio de la gastritis es menor con el medicamento B que con el A)
Paso 2: Nivel de significacin: = 0.05
Paso 3: Seleccin de la prueba estadstica: Prueba t unilateral a la izquierda, por tratarse de varianzas desconocida.
Sin embargo, cuando el tamao de la muestra es grande (n 30 ) la estimacin de la desviacin estndar
es confiable y se maneja como si fuera una varianza conocida (). Caso B.1. - 1.
En este caso, vamos a elegir la prueba de la distribucin Z.
Paso 4: Regla de decisin:
Rechazar Ho si Zcal es menor que Ztabular (-1,645).
Paso 5: Clculo de la prueba:
x B x A ( B A )
B2 A 2
nB
nA
7,9 8,5
2
2,1 1,8
25
30
0.6
0.6
0.6
0.6
4,41 3,34
30 ( 4,41) 25 (3,34 )
132 ,3 83,5
215 ,8
25
30
750
750
750
0.6
0.6
1,118551957 1,1186
0
.
536407805
0.287733333
Planteamiento de hiptesis:
H0 : s2A = s2B
b.
c.
d.
e.
s2 B
s
2,12
1,8
4,41
1,361111111 1,3611
3,24
f. Decisin estadstica:
Como el valor de F observado es menor que el valor F tabular, NO se rechaza la hiptesis nula de
que ambas varianzas son iguales
Cuando las varianzas son iguales se utiliza la varianza combinada (sp2).
Se elige una prueba de significacin estadstica para diferencia de medias poblacionales con varianza
desconocida e iguales, la que est dada por la siguiente frmula:
t Estadstico t
x1 Media de la 1 muestra
x 22 Media de la 2 muestra
s p Varianza combinada dse ambas muestras
x1 x 2 (1 2 )
t
Donde n1 Tamao de la 1 muestra
n 2 Tamao de la 2 muestra
sp2 sp 2
2
2
n1 n 2
s 2 (n1 1) s1 (n 2 1) s 2
p
n1 n 2 2
Grados de libertad = n1 + n2 2
Paso 4: Regla de decisin:
Grados de libertad: nA + nB 2 = 30 + 25 - 2 = 53
Al consultar la tabla se observa que no existe el valor de t para 53 grados de libertad: de 40 pasa a 60
grados de libertad. Por consiguiente, el valor crtico de t para 53 grados de libertad se halla entre -1,684
(40 grados de libertad) y -1,671 (60 grados de libertad). Al consultar Excel, se halla que el valor crtico
de t es de 1,6741. Entonces, rechazar Ho si t cal es menor de 1,6741
Paso 5: Clculo de la prueba:
( x 1 x 2 ) ( 1 2 )
s 2p
n1
s 2p
s 2p
n2
( n1 1 )s12 ( n2 1 )s 22
n1 n 2 2
3,7698
53
53
53
(7,9 8,5)
3,7698 3,7698
25
30
0,6
30 (3,7698 ) 30 (3,7698 )
750
0,6
0,6
0,6
0,6
1,141146447 1,1411
0,525787029
0,276452
Para comprobar si un tratamiento con cidos grasos es eficaz en pacientes con eczema atpico, se tomaron 10
pacientes con eczema de ms de 9 meses y se les someti durante 3 semanas a un tratamiento ficticio (placebo) y
durante las tres siguientes a un tratamiento con cidos grasos. Tras cada perodo, un mdico ajeno al proyecto
evalu la importancia del eczema en una escala de 0 (no eczema) a 10 (tamao mximo de eczema). Los datos
fueron los siguientes:
PlaPlacebo
Acidos grasos 5
o
o
d 0
d < 0
o
o
d 0
d > 0
En ambos casos los resultados seran iguales pero con signos contrarios: si en el primero sale positivo, el
segundo sale negativo y viceversa.
Nosotros vamos a utilizar la hiptesis planteada en primer lugar, ya que la pregunta de investigacin est
referida en este sentido.
Paso 2: Nivel de significacin = 0,05
Paso 3: Seleccin de la prueba estadstica: Prueba t para datos pareados, (Caso C).
Paso 4: Regla de decisin
Rechazar H0 para una prueba unilateral a la izquierda para 9 grados de libertad, si t calc es menor que t
ttab .
Grados de libertad (gl) = n 1 donde n es el tamao de la muestra
gl = 10 1 = 9
Se consulta la tabla de la distribucin de t para 9 grados de libertad y encontramos que el valor crtico al
nivel de 0,05 para una prueba unilateral de cola inferior (a la izquierda) es -1,833
Paso 5: Clculo de la prueba: Se emplea la siguiente frmula: :
t Estadstico t
d (1 2 )
t
sd
n
Paciente
(1)
1
2
3
4
5
6
7
8
9
10
Total
5
6
4
5
3
6
6
2
2
6
57
6
8
4
8
5
6
5
6
4
5
45
dd
(5)
0.2
-0.8
1.2
-1.8
-0.8
1.2
2.2
-2.8
-0.8
2.2
0
(d d ) 2
(
(6)
0.04
0.64
1.44
3.24
0.64
1.44
4.84
7.84
0.64
4.84
25.6
5.1. Calcular la media de las diferencias entre el puntaje del tamao del eczema entre los dos tratamientos.
Para ello se suman las diferencias entre el puntaje del tamao del eczema con el tratamiento a base de
cidos grasos y el placebo (Columna 4), y esta suma se divide entre el nmero de casos
d
d - 12 1,2
n
10
5.2. Calcular la desviacin estndar de las diferencias. Para ello se obtienen las diferencias entre cada
diferencia (d) y su correspondiente media (Columna 5); cada una de estas diferencias se elevan al
cuadrado y se suman (Columna 6); esta suma se divide entre n-1 y se obtiene la varianza, y
finalmente se obtiene la desviacin estndar sacando la raz cuadrada de la varianza.
sd
(d d)
n 1
25,6
10 1
25,6
2,84444444 1,686548085 1,6865
9
5.3. Calcular t:
t
d d 1,2 (0)
1,2
1,2
2,250064154 2,2501
sd
1,6865
1,6865
0,533318127
3,16227766
10
n
Conclusin: Para un nivel de significacin de 0.05 podemos afirmar que el tratamiento con cidos grasos es
eficaz contra el eczema.