Comparao de mdias
Amostras Independente s
Varincias desconhecida s
Varincias diferentes
Duas amostras casuais simples e independentes: X1, X2, ..., Y1, Y 2, ..., Xn Ym X ~N(x,x2) Y ~N(y,y2)
Hipteses H: x = y H: x - y =0 A: x y ou
A: x - y 0
Estatstica:
XY
Sabemos que
2 x X ~ N x , n 2 y Y ~ N y , m
X e Y
so independentes
Logo,
(X Y ) ( Z=
2
y )
2
y x + n m
~ N(0,1)
(X Y )
2 y x + n m 2
~ N(0,1)
Nvel de significncia Rejeitamos H quando Z < -z ou Z > z. = P(erro tipo I)= P(rejeitar H | H verdadeira) = P(Z<-zc ou Z > zc| x=y) RC:{Z: Z < -zc ou Z> -zc }
Exemplo 1 (ex. 9.6 - Magalhes & Lima). Uma empresa avaliadora de imveis est estudando as regies central e oeste da cidade de So Paulo. O objetivo principal verificar se o preo mdio, praticado para imveis comerciais de um dado tamanho, o mesmo nas duas reas. De levantamentos anteriores, a empresa sabe que a rea oeste apresenta uma heterogeneidade de preos imobilirios (em UPC unidade padro de construo) maior do que a regio central, sendo os desvios padres iguais a 0,82 UPC par a regio oeste e 0,71 UPC para a regio central. Para verificar se os preos mdios so iguais ou no, duas amostras, uma de tamanho 20 e outra de tamanho 18 foram retiradas aleatoriamente de cada regio. Os dados so os seguintes.
Regio Central 41,2 40,6 40,5 40,3 39,6 39,2 39,4 40,6 38,9 39,7 39,1 40,3 40,9 40,9 41,2 39,6 40,4 39,7 40,0 41,2
Regio Central 37,2 37,4 34,9 36,1 38,1 35,9 35,4 36,9 35,7 37,4 37,7 37,5 36,4 38,0 36,6 36,8 36,1 36,4
Regio Central 20 40,2 41,3 0,7 28,9 41,2 Oeste 18 36,7 36,7 0,9 34,9 38,0 Ambas 38 38,5 39 1,9 34,9 41,2
preco 35 36 37 38 39 40 41
Variveis aleatrias X: preos na regio central Y: preos na regio oeste Hipteses H: As mdias de preos nas duas regies so iguais (H: x = y ) A: As mdias de preos nas duas regies so diferentes( x y ) ou equivalentemente, H: x - y =0 A: x - y 0
Estatstica:
D = X Y
2 x2 y X Y ~ N x y , + n m
y=0,71 , n= 20 e m=18
y2
P(rejeitar H 0 | H 0 verdadeira) = P(D RC | x y = 0) d c1 d c2 = 0,05 ou Z > = P Z < 0,06 0,06 d c1 d c2 = 1,96 d c1 = 0,49 e = 1,96 d c 2 = 0,49 0,06 0,06 Consequentemente : RC = {d : d < 0,49 ou d > 0,49} com d = x- y
( )
Nesse caso, d obs = 40,2 36,7 = 3,5 pertence RC, logo rejeitamos H 0 ao nvel de 5% de significncia, ou seja ao nvel de 5%, os preos nas regies central e oeste tm preos diferentes.
S2 = x
(X
n i =1
n 1
S =
2 y
(Y Y )
m i =1 i
m 1
Se x2 = y2 (=2), temos
(X Y ) (
y )
2
2 y x + n m
(X Y ) ( =
y )
2 2 + n m
(X Y ) ( =
y )
1 1 + n m
S2 = p
(n 1)Sx + (m 1)Sy
2
n+m2
Estatstica
T=
(X Y )
Sp 1 1 + n m
~ t n + m2
Nvel de significncia
Rejeitamos H quando T< -tc ou T > tc = P(erro tipo I)= P(rejeitar H | H verdadeira) = P(T<-tc ou T> tc | x=y) RC:{T: T<-tc ou T> tc } -tc e tc so os ts crticos.
Exemplo 2 Duas tcnicas de vendas so aplicadas por dois grupos de vendedores. A tcnica A por 12 vendedores e a tcnica B, por 15 vendedores. Espera-se que a tcnica B produza melhores resultados no final de um ms. Obtiveram-se os resultados
Vendas Tcnica A Mdia Varincia No. Vendedores 68 50 12 Tcnica B 76 75 15
Exemplo 2
Vamos testar, ao nvel de 5% se h diferenas significativas entre as vendas resultantes das duas tcnicas. Informaes adicionais permitem supor que as vendas sejam normais com uma varincia comum desconhecida 2.
Tcnica B
s 2 = 75 B
x B = 76
x A = 68
n= 12
m=15
Exemplo 2 XA ~N(A,A2) : vendas sob a tcnica A YB ~N(B,B2) : vendas sob a tcnica B 1. Hipteses H: A = B A: A < B 2. Estatstica
T=
(Y X )
Sp 1 1 + n m
~ t n + m 2 , sob H
Exemplo 2
3. Nvel de significncia =5% =P(erro tipo I)=P(rejeitar H | H verdadeira ) = P(T>tc | A = B )
function(x) dt(x, k) (x) 0.4 0.1 0.2 0.3
5%
0.0 -3 -2 -1 0 x 1 2 3
2,07
Exemplo 2
4. Amostra
t= sp
2 p
(y x )
1 1 + n m
(76 68)
64 1 1 + 12 15
= 2,56
Ento podemos obter de uma tabela da distribuio t (usando n+m-2 graus de liberdade) o valor t tal que
(Y X ) (
sp
x )
1 1 + n m
~ t n +m2
0 .0
0 .1
-3 -2 -1 0 x 1 2 3
Logo,
-t
1 1 1 1 I.C.( x y ; ) = P y x t .s p + ; y x + t .s p + = n m n m
1 1 1 1 y x t .s p I .C.( x y ; ) = P + ; y x + t .s p + = n m n m
Exemplo 3 Deseja-se comparar duas tcnicas A e B de montagem de um produto industrial. Para tal foi selecionada uma amostra casual de 20 operrios e estes foram divididos aleatoriamente em dois grupos de 10 operrios. Aqueles pertencentes ao grupo A utilizaram a tcnica A e os demais a tcnica B para a montagem do produto. Os tempos necessrios montagem foram anotados e foram obtidas as seguintes estatsticas.
Tcnica A Tcnica B
x = 6,0
y = 7, 2
2 s A = 1,2
2 s B = 1,0
Exemplo 3 Suposies: Normalidade Independncia Igualdade de varincias 1. Hipteses H: A = B A: A B 2. Estatstica do teste n=m=10
T =
(Y X )
Sp 1 1 + n m
~ t n + m 2 , sob H
Exemplo 3
3. Nvel de significncia: = 5% =P(erro tipo I)=P(rejeitar H | H verdadeira ) = P(T < - tc ou T > tc | A = B )=5%
0 .4
t18
tc = 2,101
0 .0 -3
0 .1
0 .2
0 .3
-2
-1
0 x
2,5%
Exemplo 3
4. Amostra:
t= sp
(y x )
1 1 + n m
(6,0 7,2)
1,2 1 1 + 10 10
= 2,45
5. Deciso e concluso -2,45 RC Concluso: rejeitamos a hiptese H a um nvel de significncia de 5%. H evidncias de que a tcnica A melhor que a tcnica B.
Exerccio 3 - Seo 9.2 (Magalhes & Lima) Para verificar se duas populaes tm a mesma mdia, amostras independentes foram retiradas. Sabendo que a populao I Normal (1, 25) e a populao II Normal (2, 40), que concluso pode ser tirada, ao nvel de 2%? Os valores obtidos foram:
Pop. I II Dados 12 13 14 17 15 14 14 13 13 16 17 17 14 18 13 16
Exerccio 4-Seo 9.6 O salrio de recm formados em Veterinria foi amostrado em duas cidades. Na cidade A, 10 profissionais foram sorteados e na cidade B, 15. Os resultados, em salrios mnimos. So apresentados a seguir.
Cidade A 7,3 Cidade B 6,5 6,9 6,6 7,8 7,9 6,8 8,2 8,4 7,4 69 9,3 8,3 7,9 9,5 6,5 9,7 7,9 9,1 8,7 9,5 8,1 7,4 8,5 8,0
Admitindo que a variabilidade do salrio seja a mesma nas duas cidades e que o modelo Normal adequado, verifique se a cidade B paga, em mdia, melhor do que A. Obtenha o nvel descritivo e tome sua deciso utilizando um nvel de significncia =5%.