Anda di halaman 1dari 26

PRUEBA DE

HIPÓTESIS CON DOS


MUESTRAS
Comparando dos poblaciones
•Frecuentemente el investigador está interesado
en comparar dos poblaciones:
x 2µx2
•El material A es más resistente que el B 1

•El descenso de peso con la dieta A es x12µx2


menor que con la B
•El porcentaje de hombres que cruzan
x 2p x
en rojo es mayor al de mujeres 1 2

•Los ingresos familiares de la ciudad A son más


variables que los de la B x 2x
1 2
Comparando dos poblaciones
•Para llevar a cabo esta comparación, el
investigador necesita muestrear

•Las muestras pueden ser:


•dependientes
•independientes
Ejemplo
• Un investigador cree que los fumadores tienden a fumar
más durante los períodos de stress.
• Para comprobarlo debe elegir entre dos metodologías:

– Encuestar a un grupo de fumadores en condiciones normales y a


otro grupo de fumadores bajo stress

– Encuestar a un grupo de fumadores en condiciones normales y al


mismo grupo cuando está bajo stress
Ejemplo
• Interroga a cada individuo con respecto a la
cantidad de cigarrillos diarios fumados

m. indep m. dep

Sin stress Con stress Individuo Sin stress Con stress


15 20 1 15 20
45 31 2 45 31
50 50 3 50 50
16 30 4 16 30
56 72 5 56 72
Muestras dependientes o
pareadas
• Cada observación en una muestra está directamente
relacionada con otra observación en la otra muestra
• Cada individuo es observado dos veces
• Las dos muestras difieren solo en el factor que interesa
comparar
• Las dos muestras deben ser del mismo tamaño
Muestras independientes
• Cada observación en una muestra no está
relacionada con ninguna observación en la otra
muestra
• Cada individuo es observado una vez
• Las dos muestras pueden difieren en varios factores,
no solo en el que interesa comparar
• Las dos muestras no necesariamente son del mismo
tamaño
Muestras dependientes vs independientes

• Se desea determinar si los sueldos percibidos por


gerentes mujeres son inferiores a los de hombres
en el mismo puesto.
• Se debe elegir entre dos comerciales de galletitas
para niños. A un grupo de niños panelistas se les
exhiben los dos comerciales y deben asignarle un
puntaje a cada uno
Comparando dos promedios
¿los sueldos percibidos por gerentes mujeres son
inferiores a los de hombres en el mismo puesto?
•Ho:

•H1:

Una muestra aleatoria de tamaño n1 extraída de


la población 1 con media µ1 y desvío std 1

Una muestra aleatoria de tamaño n2 extraída


la población 2 con media µ2 y desvío std 2
Comparando dos promedios con
muestras independientes
•Comparamos dos promedios haciendo
inferencia sobre m1-m2, la diferencia entre los
dos promedios poblacionales.
•Si los dos promedios poblaciones son
iguales, entonces m1-m2 = 0.
•El mejor estimador de m1-m2 es la diferencia
entre los dos promedios muestrales,

x1  x2
Distribución muestral
de x1  x2
1. The meande
La media is m1  m 2 , the
of x1  x2 es differenceentre
la diferencia in
the
las population means.
medias poblacionales Z 
( x1  x2 )  ( µ1  µ2 )
x1  x 2  12  22

n1 n2
 12  22
2. El
The standard
desvío deviation
estándar of x1  x2 is
(ES) de esSE   .
n1 n2
3. If
Si the sample sizes
la población are large,
original the distribución
sigue una sampling distributi on
normal o
ofsixeltamaño
x is de las muestras
approximat ely normal,  xcan
( x 1SE
and 2 )  1  µ2 )
be( µestimated
1 2
es lo suficientemente grande, Z 
1 x x
2
 12  22
s1x 1 s2x 2
2 2

SE  una distribución
as sigue  . normal n1 n2
n1 n2
Comparando dos promedios con
muestras independientes
Sueldo de los gerentes Hombres Mujeres
(miles de $)

Tamaño de la muestra 35 27

Promedio muestral 3.5 2.6

Desvío std poblacional 1.3 1.8


Comparando dos promedios
con  conocidos

•Ho:
•H1:

•CR:
Comparando las varianzas o desvíos
estándar de dos poblaciones
¿Las dos máquinas dispensadoras son
igualmente variables?
•Ho:
•H1:

•CR:
Distribución muestral
de s21/s22
1.1.The
El mean
cociente is m1 elmcociente
of sx211/s22x2estima 2 , the difference
21/ 22 in
2. population
the Si las poblaciones
means.originales siguen una distribución
normal, el cociente …. Seguirá una distribución conocida
F de Fisher-Snedecor  2
 2
como
2. The standard  x2nis
deviationof x1con n2 
1 ySE  libertad
grados1 de 2
.
n1 n2
3. If the samplesizesare large,the samplingdistribution
of x1  x2 is approximately normal,and SE can be estimated
s12 s22
as SE   .
n1 n2
Comparando dos promedios con muestras
independientes y desvíos poblacionales
desconocidos

• Para poder comparar los promedios es necesario


determinar si las varianzas de las dos poblaciones son
iguales o no.
• Por ello deben compararse previamente las varianzas
de las dos poblaciones (Prueba F)
• Si las varianzas no difieren se calcula una varianza
amalgamada s2a “promediando” las varianzas de las
dos muestras

S 2
n  1  S 2 n 2  1
2
Sa 
2 1 1

n1  n2  2
Comparando dos promedios con
muestras independientes y desvíos
poblacionales desconocidos
• Si se concluye que las poblaciones poseen
varianzas iguales se calcula una varianza
amalgamada s2a “promediando” las varianzas de las
dos muestras

S 2
n  1  S 2 n 2  1
2
Sa 
2 1 1

n1  n2  2
• Si se concluye que las poblaciones poseen
varianzas distintas no es correcto amalgamar las
varianzas muestrales
Comparación de dos promedios con desvíos
poblacionales desconocidos y supuestamente
iguales

t muestral 
x 1 
 x 2  ( µ1  µ2 )
t crit  t n1 n 22
1 1
Sa 
n1 n2
Comparación de dos promedios con desvíos
poblacionales desconocidos y supuestamente
distintos
2 2
 S1 S 2 
2
  

tmuestral 

x1  x 2  ( µ1  µ2 )
tcrit  tGL GL   n1 n2 
2 2 2 2
2
S1 S 2 2
 S1  1  S 2  1
     
n1 n2  n1   1  n2   2
Comparando dos proporciones
•En ciertos casos estamos interesados en comparar la
proporción de “éxito” en dos poblaciones
independientes.
•La proporción de semillas que germinan siendo
tratadas o no con un funguicida.
•El porcentaje de hombres y de mujeres que votan a
determinado candidato.
•Para efectuar esta comparación se requiere
Una muestra aleatoria de tamaño n1 extraída de
la población 1 con parámetro p1
Una muestra aleatoria de tamaño n2 extraída de
la población 2 con parámetro p2
Comparando dos proporciones
•Comparamos las dos proporciones haciendo
inferencia sobre p1-p2, la diferencia entre las dos
proporciones poblacionales.
•Si las dos proporciones poblacionales son
iguales, entonces p1-p2 = 0.
•El mejor estimador de p1-p2 es la diferencia
entre las dos proporciones muestrales,
rx11 rx22
pˆ 1  pˆ 2  
n1 n2
Distribución muestral
de pˆ 1  pˆ 2
1. The
La media of pˆ1  pˆ 2 es
meande is p1  p2 , the difference
la diferencia in
entre
thelas
population proportion
proporciones s.
poblacionales pˆ 
r1  r2
n1  n2

p q  1 p2q12 
2. The standard
El desvío deviation
estándar of
(ES) de ˆ
p1  ˆ
p 2
esSE pˆ (1  pˆ )  .
is 1 1
1 1 
pˆ (1  pˆ )  
r  r n 1
 n1 n n2 
2
donde pˆ  1 n n 1
2 2

1  n 2arelarge,thesampling
3. If thesamplensizes distribution
3. Si el tamaño de las muestras
of pˆ1  pˆ 2 is approximat ely normal,
Z and


SEpˆ 1 can 
 pˆ 2beestimated
( p1  p 2 )
es lo suficientemente grande, muestral
 1 1 
ˆ1 qˆ pˆ 2
pˆp pˆ 2qˆ2 pˆ (1  pˆ )  
SE  una distribución
assigue 1 1
. normal  n1 n 2 
n1 n2 Copyright ©2003 Brooks/Cole
A division of Thomson Learning, Inc.
Ejemplo
¿Es efectiva la aspirina?
• Se registró la presencia de infartos (incidencia)
durante 5 años:
Grupo Infarto No infarto n Incidencia

Placebo 239 10795 11034 0.0217

Aspirina 139 10898 11037 0.0126


ACLARANDO
• Una planta industrial utiliza un procedimiento tradicional (T) de producción. Se
propone un procedimiento de producción moderno(M). La planta cambiará el
procedimiento T por el procedimiento M solo si este último resulta más rápido.
A fin de tomar la decisión se escogieron dos muestras aleatorias
independientes de 9 y 10 tiempos respectivamente. ¿con α = 0,05) cuál es la
decisión a tomar?. Asuma los requerimientos del método. (Córdova Z.)
Muestra T 06, 14, 08, 11, 10, 18, 15, 20, 13

Muestra M 12, 11, 12, 10, 14, 15, 10, 13, 14, 12

En primer lugar debemos analizar la homogeneidad de varianzas ;


siendo la estadística de prueba F = S2T / S2M
La región crítica para esta prueba bilateral será:
T M F (8,9; 0,025) = 0,23
6 12
14 11 F (8,9; 0,975) = 4,10
8 12
11 10 F = S2T / S2M = 20,6944/2.9 = 7,136
10 14
18 15
15 10
20 13 SON POBLACIONES NO HOMOGÉNEAS EN SU DISPERSIÓN
13 14
12
12.7777778 12.3 PRUEBA DE DIFERENCIA DE LAS DOS MEDIAS
4.5491146 1.7029386 H0 : µT = µm
20.6944444 2.9 H0 : µT ≠ µM
SON POBLACIONES NO HOMOGÉNEAS EN SU DISPERSIÓN

T M
6 12 PRUEBA DE DIFERENCIA DE LAS DOS MEDIAS
14 11 H0 : µT = µm
8 12 H1 : µT ≠ µM
11 10
10 14 2 2
S S 
2
18 15
  
x  x  (µ  µ )
1 2
15 10
20 13 tmuestral 
1 2 1 2
tcrit  tGL GL   n1 n2 
2 2 2 2
13 14
S12 S 22  S1  1  S 2  1
12      
n1 n2  n1   1  n2   2
12.7777778 12.3
4.5491146 1.7029386
20.6944444 2.9
GL = 10,004 ≈ 10
HALLAMOS REGIÓN CRÍTICA PARA t(10; 0,975) = ± 2,228

Tc = 0,297
Ejemplo
• Ho:
• H1:

• CR:

Anda mungkin juga menyukai