Anda di halaman 1dari 22

Estatstica I

Parte III
Testes de hipteses duas amostras
Cap. 10 (Levine et al., 2008)
Prof
a
. Solange Kanso
Economia 2012/1
Teste para Duas Amostras
At agora estudamos uma variedade de procedimentos de testes de hipteses que
se relacionam a uma nica amostra de dados extrada de uma nica
populao.
A partir de agora iremos aprender a estender o teste de hipteses para os
procedimentos que comparam estatsticas oriundas de duas amostras de
dados extradas de duas populaes.
Exemplo: A mdia aritmtica das vendas semanais de Coca Cola Zero quando ficam
expostas na ponta do corredor igual mdia aritmtica das vendas semanais
de Coca Cola Zero quando esto expostas em localizao regular em
prateleiras?
Teste para Duas Amostras
Os testes de hipteses so freqentemente usados para comparar duas populaes
distintas (dois mtodos de ensino, duas marcas, duas cidades, dois distritos
escolares, e outros casos anlogos).
A hiptese nula pode ser a de que as duas populaes tem mdias iguais:
H
0
:
1

2
= 0
1
=
2
H
1
:
1

2
0
1

2
Outras hipteses podem ser:
H
0
:
1

2
H
0
:
1

2
H
1
:
1
>
2
H
1
:
1
<
2
Fonte: Slide cedido pela Prof. Solange Maria Fortuna Lucas.
Comparando as mdias de
duas populaes independentes
Teste Z para a diferena entre duas mdias (quando conhecemos
1
e
2
)
Populao 1
1
e
1
Populao 2
2
e
2
A estatstica do teste utilizada para determinar a diferena entre as mdias
aritmticas das populaes baseada na diferena entre as mdias
aritmticas das amostras (X
1
- X
2
).
Pressupostos: As amostras selecionadas de modo aleatrio e independente, a partir
de populaes que tm distribuio normal, a estatstica segue uma
distribuio normal padronizada.
Caso as populaes no sejam distribudas nos moldes da normal, o teste Z , ainda
assim, apropriado, contando que os tamanhos das amostras sejam
suficientemente grandes (n
1
e n
2
30).
Comparando as mdias de
duas populaes independentes
Teste Z para a diferena entre duas mdias (quando conhecemos
1
e
2
)
Onde:
X
1
= mdia da amostra extrada da populao 1

1
= mdia da populao 1

2
1
= varincia da populao 1
n
1
= tamanho da amostra extrada da populao 1
X
2
= mdia da amostra extrada da populao 2

2
= mdia da populao 2

2
2
= varincia da populao 2
n
2
= tamanho da amostra extrada da populao 2

( ) ( )
2
2
2
1
2
1
2 1
2 1
n n
X X
Z


+

=
A estatstica do teste Z
segue uma distribuio
normal padronizada
Comparando as mdias de
duas populaes independentes
Teste t para a diferena entre duas mdias (quando desconhecemos
1
e
2
,
mas supomos serem iguais)
Na maioria dos casos, as varincias das duas populaes no so conhecidas, as
informaes que temos so as mdias e as varincias das amostras.
Pressupostos: As amostras selecionadas de modo aleatrio e independente, a partir
de populaes que tm distribuio normal e que as varincias das populaes
so iguais (
2
1
=
2
2
), utiliza-se o teste t de varincia agrupada para
determinar se existe uma diferena significativa entre as mdias das duas
populaes.
Caso as populaes no sejam distribudas nos moldes da normal, o teste t de
varincia agrupada , ainda assim, apropriado, contando que os tamanhos das
amostras sejam suficientemente grandes (n
1
e n
2
30).
Comparando as mdias de
duas populaes independentes
Teste t de varincia agrupada para a diferena entre duas mdias (quando
desconhecemos
1
e
2
, mas supomos serem iguais)
Onde:
X
1
= mdia da amostra extrada da populao 1
S
2
1
= varincia da amostra extrada da populao 1
n
1
= tamanho da amostra extrada da populao 1
X
2
= mdia da amostra extrada da populao 2
S
2
2
= varincia da amostra extrada da populao 2
n
2
= tamanho da amostra extrada da populao 2

( ) ( )
( ) ( )
( ) ( )
(

+
(

+
+

=
2 1 2 1
2
2 2
2
1 1
2 1
2 1
1 1
1 1
1 1
n n n n
S n S n
X X
t

A estatstica do teste t
segue uma distribuio
t com n
1
+ n
2
- 2 graus de
liberdade (g.l.)
Comparando as mdias de
duas populaes independentes
Exemplo: Uma rede de supermercados deseja determinar se a mdia das vendas
semanais de Coca Cola Zero mesma quando utilizada a localizao regular
de prateleiras e quando utilizada uma exposio em ponta de corredor.
Vendas de Coca Cola Zero (em nmero de embalagens) correspondentes s duas amostras
22 34 52 62 30 52 71 76 54 67
40 64 84 56 59 83 66 90 77 84
Fonte: Levine et al., 2008 (pg. 326)
Normal Ponta de Corredor
Local de exposio da Coca Cola Zero
Comparando as mdias de
duas populaes independentes
Sabemos que foram selecionadas duas amostras e definido o
- 10 filias da rede de supermercados utilizam a exposio de
prateleiras regulares;
- 10 filias da rede de supermercados utilizam a exposio em pontas
de corredor.
- Nvel de confiana = 0,05 ()
A hiptese nula e alternativa so:
H
0
:
1
=
2

1

2
= 0
H
1
:
1

2

1

2
0
Comparando as mdias de
duas populaes independentes
A estatstica do teste t segue uma distribuio t com:
10+10-2=18 (n
1
+n
2
-2) graus de liberdade
Portanto,
Rejeito a hiptese nula se t > t
n1+n2-2
ou se t < -t
n1+n2-2
No rejeito a hiptese nula, caso contrrio
Estimativa do intervalo de confiana para a
diferena entre duas mdias
Alm de testar a diferena entre as mdias de duas populaes
independentes, podemos estimar o IC da diferena entre duas
mdias.

( )
( ) ( )
( ) ( )
(

+
(

+
+

+
2 1 2 1
2
2 2
2
1 1
2
2 1
1 1
1 1
1 1
2 1
n n n n
S n S n
t X X
n n
Comparando as propores de duas
populaes
Para realizar um teste para a diferena entre duas propores
selecionadas de amostras independentes utilizando dois mtodos
diferentes: um deles a estatstica do teste Z que pode ser
aproximada por uma distribuio normal padronizada e o outro, a
estatstica do teste
2
que pode ser aproximada por uma distribuio
qui-quadrado.
A estatstica do teste Z baseada na diferena entre as duas
propores de amostra (p
1
^ - p
2
^)
Comparando as propores de duas
populaes
Teste Z para a diferena entre duas propores
Onde:
p^
1
= proporo de sucessos na amostra 1
X
1
= nmero de sucessos na amostra 1
n
1
= tamanho da amostra 1
p
1
= proporo de sucessos na populao 1
p^
2
= proporo de sucessos na amostra 2
X
2
= nmero de sucessos na amostra 2
n
2
= tamanho da amostra 2
p
2
= proporo de sucessos na populao 2
p- = estimativa agrupada para a proporo de sucessos na populao

2 1
2 1
n n
X X
p
+
+
=
A estatstica do teste Z
segue aproximadamente uma
distribuio normal padronizada
( ) ( )
|
|

\
|
+

=
2 1
2 1 2 1
1 1
) 1 (

n n
p p
p p p p
Z
1
1
1

n
X
p =
2
2
2

n
X
p =
Comparando as propores de duas
populaes
Teste Z para a diferena entre duas propores
Teste bicaudal Teste Unicaudal Teste Unicaudal
Exemplo: Suponha que voc seja gerente de uma rede de hotis 5 estrelas
localizados em duas ilhas. Em uma das ilhas, Ilha do Mel, so dois hotis, Praia
do Farol e Fim da Trilha. Ao tabular as respostas para a pergunta: voc est
propenso a escolher novamente este hotel? tem-se que:
Praia do Farol = 163 dentre os 227 hspedes responderam que sim.
Fim da Trilha = 154 dentre os 262 hspedes responderam que sim.
H
0
: p
1
= p
2
H
1
: p
1
p
2
H
0
: p
1
p
2
H
1
: p
1
< << < p
2
H
0
: p
1
p
2
H
1
: p
1
> >> > p
2
Comparando as propores de duas
populaes
Teste Z para a diferena entre duas propores
No nvel de significncia de 0,05, existem evidncias significativas de uma
diferena em termos da satisfao de hspedes entre os dois hotis?
Estimativa do intervalo de confiana para a
diferena entre duas propores
Alm de testar a diferena entre as propores de duas populaes
independentes, podemos estimar o IC da diferena entre duas
propores.

( )
2
2 2
1
1 1
2 1
) 1 ( ) 1 (

n
p p
n
p p
Z p p


Teste F (Fisher-Snedecor) para a
diferena entre duas varincias
Com frequncia necessrio testar se duas populaes independentes possuem a
mesma variabilidade e para isso testam-se as varincias.
Tem-se dois casos para aplicar o teste:
Varincia agrupada (o caso de varincias iguais);
Varincias separadas (o caso de varincias desiguais).
O teste t para a diferena entre as varincias de duas populaes independentes
baseado na frao entre as varincias das duas amostras. Considerando que
cada uma das populaes tem distribuio normal, ento a frao S
1
2
/ S
2
2
segue uma distribuio F. Os valores crticos da distribuio F dependem de
dois conjuntos de graus de liberdade. Os graus de liberdade no numerador da
frao correspondem primeira amostra, e os graus de liberdade no
denominador correspondem segunda amostra.
Teste F (Fisher-Snedecor) para a
diferena entre duas varincias
Estatstica do teste F para testar a igualdade entre duas varincias
F = S
1
2
/ S
2
2
em que:
S
1
2
= varincia da amostra 1
S
2
2
= varincia da amostra 2
n
1
= tamanho da amostra extrada da populao 1
n
2
= tamanho da amostra extrada da populao 2
n
1
- 1 = graus de liberdade da amostra 1 (numerador)
n
2
- 1 = graus de liberdade da amostra 2 (denominador)
A estatstica do teste F
segue uma distribuio F,
com n
1
1 e n
2
1
graus de liberdade
Teste F (Fisher-Snedecor) para a
diferena entre duas varincias
Hipteses:
H
0
:
1
2
=
2
2
H
1
:
1
2

2
2
Portanto, rejeito a hiptese nula, se a estatstica do teste F calculada for
maior do que o valor crtico da cauda superior, F
S
, a partir da
distribuio F com n
1
1 graus de liberdade no numerador e n
2
1
graus de liberdade no denominador, ou se a a estatstica do teste F
calculada for menor do que o valor crtico da cauda inferior, F
I
, da
distribuio F com n
1
1 graus de liberdade no numerador e n
2
1
graus de liberdade no denominador.
Teste F (Fisher-Snedecor) para a
diferena entre duas varincias
Regra de deciso:
Rejeito a hiptese nula se F > F
S
ou se F < F
I
No rejeito a hiptese nula, caso contrrio
A tabela F nos fornece os valores crticos de F correspondentes a uma rea
especfica () da cauda superior
Encontrando os valores crticos da cauda inferior a partir da distribuio F:
F
I
= 1/F
S*
Em que 1/F
S*
oriundo de uma distribuio F, com n
2
1 graus de liberdade no
numerador e n
1
1 graus de liberdade no denominador.
Teste F (Fisher-Snedecor) para a
diferena entre duas varincias
Exemplo: Voltando ao exemplo das vendas de Coca-Cola zero em diferentes
localizaes no supermercado, tem-se que: n
1
= n
2
= 10 e nvel de significncia
= 0,05.
Consultando a tabela, o valor crtico da cauda superior da distribuio F
4,03.
F
I
= 1/4,03 = 0,248
Pela regra de deciso:
Rejeito a hiptese nula se F > F
S
= 4,03 ou se F < F
I
= 0,248
No rejeito a hiptese nula, caso contrrio
Calculando F = S
1
2
/ S
2
2
= 350,6778 / 157,3333 = 2,2289.
Resultado: no rejeita a hiptese nula.
Roteiro para selecionar
um TESTE para DUAS AMOSTRAS
Testes para
Duas Amostras
Tipos de
Dados
Teste Z para
a diferena entre
duas propores
Amostras
Independentes?
Categricos Numricos
Sim No
Teste t para
Varincias Separadas
Teste t em Pares
Foco
Variabilidade
Teste F para

1
2
=
2
2

1
2
=
2
2
?
Teste t para
Varincias Agrupadas
Sim No

Anda mungkin juga menyukai