Anda di halaman 1dari 29

Teste de Hiptese

Comparao de mdias de dois grupos de uma distribuio Normal Parte I

Comparao de mdias

Amostras Independente s

Varincias conhecidas Varincias iguais

Varincias desconhecida s

Amostras dependentes (pareadas)

Varincias diferentes

Teste para comparao de duas mdias de populaes Normais.

Duas amostras casuais simples e independentes: X1, X2, ..., Y1, Y 2, ..., Xn Ym X ~N(x,x2) Y ~N(y,y2)

Objetivo: Comparar as mdias

Hipteses H: x = y H: x - y =0 A: x y ou

A: x - y 0

Estatstica:

XY
Sabemos que
2 x X ~ N x , n 2 y Y ~ N y , m

: Diferena das mdias amostrais (estimador de x - y )

X e Y

so independentes

Logo,

2 2 x y X Y ~ N x y , + n 24 1 4 m 3 varincia da diferena de mdias

(X Y ) ( Z=
2

y )
2

y x + n m

~ N(0,1)

Assim, sob a hiptese nula H: x - y =0 , temos


Z=

(X Y )
2 y x + n m 2

~ N(0,1)

1o. Caso: Supondo que x2 e y2 sejam conhecidas

Nvel de significncia Rejeitamos H quando Z < -z ou Z > z. = P(erro tipo I)= P(rejeitar H | H verdadeira) = P(Z<-zc ou Z > zc| x=y) RC:{Z: Z < -zc ou Z> -zc }

Exemplo 1 (ex. 9.6 - Magalhes & Lima). Uma empresa avaliadora de imveis est estudando as regies central e oeste da cidade de So Paulo. O objetivo principal verificar se o preo mdio, praticado para imveis comerciais de um dado tamanho, o mesmo nas duas reas. De levantamentos anteriores, a empresa sabe que a rea oeste apresenta uma heterogeneidade de preos imobilirios (em UPC unidade padro de construo) maior do que a regio central, sendo os desvios padres iguais a 0,82 UPC par a regio oeste e 0,71 UPC para a regio central. Para verificar se os preos mdios so iguais ou no, duas amostras, uma de tamanho 20 e outra de tamanho 18 foram retiradas aleatoriamente de cada regio. Os dados so os seguintes.

Regio Central 41,2 40,6 40,5 40,3 39,6 39,2 39,4 40,6 38,9 39,7 39,1 40,3 40,9 40,9 41,2 39,6 40,4 39,7 40,0 41,2

Regio Central 37,2 37,4 34,9 36,1 38,1 35,9 35,4 36,9 35,7 37,4 37,7 37,5 36,4 38,0 36,6 36,8 36,1 36,4

Medidas Descritivas n Mdia Mediana Desvio-padro Mnimo Mximo

Regio Central 20 40,2 41,3 0,7 28,9 41,2 Oeste 18 36,7 36,7 0,9 34,9 38,0 Ambas 38 38,5 39 1,9 34,9 41,2

preco 35 36 37 38 39 40 41

Central Regiao Oeste

Variveis aleatrias X: preos na regio central Y: preos na regio oeste Hipteses H: As mdias de preos nas duas regies so iguais (H: x = y ) A: As mdias de preos nas duas regies so diferentes( x y ) ou equivalentemente, H: x - y =0 A: x - y 0

Estatstica:
D = X Y

: Diferena das mdias amostrais (estimador de x - y )

Temos que com x=0,82 , Logo,

2 x2 y X Y ~ N x y , + n m

y=0,71 , n= 20 e m=18

0,712 0,82 2 + = + = 0,06 varincia da diferena = n m 20 18


Para =0,05 temos

y2

P(rejeitar H 0 | H 0 verdadeira) = P( D RC | x y = 0) d c1 d c2 Z < = 0,05 = P ou Z > 0,06 0,06

P(rejeitar H 0 | H 0 verdadeira) = P(D RC | x y = 0) d c1 d c2 = 0,05 ou Z > = P Z < 0,06 0,06 d c1 d c2 = 1,96 d c1 = 0,49 e = 1,96 d c 2 = 0,49 0,06 0,06 Consequentemente : RC = {d : d < 0,49 ou d > 0,49} com d = x- y

( )

Nesse caso, d obs = 40,2 36,7 = 3,5 pertence RC, logo rejeitamos H 0 ao nvel de 5% de significncia, ou seja ao nvel de 5%, os preos nas regies central e oeste tm preos diferentes.

2o. Caso: Supondo que x2 e y2 sejam desconhecidas e iguais


Estimamos as varincias x2 e y2 atravs das varincias amostrais : Sx2 e Sy2

S2 = x

(X
n i =1

n 1

S =
2 y

(Y Y )
m i =1 i

m 1

Se x2 = y2 (=2), temos

(X Y ) (

y )
2

2 y x + n m

(X Y ) ( =

y )

2 2 + n m

(X Y ) ( =

y )

1 1 + n m

Um estimador no viesado de 2 (varincias iguais) a varincia amostral ponderada.

S2 = p

(n 1)Sx + (m 1)Sy
2

n+m2

Estatstica

T=

(X Y )
Sp 1 1 + n m

~ t n + m2

sob a hiptese H (nula)

Nvel de significncia

Rejeitamos H quando T< -tc ou T > tc = P(erro tipo I)= P(rejeitar H | H verdadeira) = P(T<-tc ou T> tc | x=y) RC:{T: T<-tc ou T> tc } -tc e tc so os ts crticos.

Exemplo 2 Duas tcnicas de vendas so aplicadas por dois grupos de vendedores. A tcnica A por 12 vendedores e a tcnica B, por 15 vendedores. Espera-se que a tcnica B produza melhores resultados no final de um ms. Obtiveram-se os resultados
Vendas Tcnica A Mdia Varincia No. Vendedores 68 50 12 Tcnica B 76 75 15

Exemplo 2
Vamos testar, ao nvel de 5% se h diferenas significativas entre as vendas resultantes das duas tcnicas. Informaes adicionais permitem supor que as vendas sejam normais com uma varincia comum desconhecida 2.

Vendas Tcnica A Mdia Varincia No. Vendedores


s 2 = 50 A

Tcnica B
s 2 = 75 B
x B = 76

x A = 68

n= 12

m=15

Exemplo 2 XA ~N(A,A2) : vendas sob a tcnica A YB ~N(B,B2) : vendas sob a tcnica B 1. Hipteses H: A = B A: A < B 2. Estatstica
T=

(Y X )
Sp 1 1 + n m

~ t n + m 2 , sob H

Exemplo 2
3. Nvel de significncia =5% =P(erro tipo I)=P(rejeitar H | H verdadeira ) = P(T>tc | A = B )
function(x) dt(x, k) (x) 0.4 0.1 0.2 0.3

5%
0.0 -3 -2 -1 0 x 1 2 3

2,07

Exemplo 2

4. Amostra
t= sp
2 p

(y x )
1 1 + n m

(76 68)
64 1 1 + 12 15

= 2,56

(n 1)s A + (m 1)s B 11 50 + 14 75 s = = = 64 n+m2 12 + 15 2


5. Deciso e concluso 2,56 RC Portanto, rejeitamos H a um nvel de significncia de 5%. H evidncias de que a tcnica B produz melhores resultados do que a tcnica A.

Intervalo de confiana para diferena B - A com coeficiente de confiana


Sabemos que
Y X ( y x ) P t < < t = 1 1 sp + n m

Ento podemos obter de uma tabela da distribuio t (usando n+m-2 graus de liberdade) o valor t tal que

(Y X ) (
sp

x )

1 1 + n m

~ t n +m2

Intervalo de confiana para diferena B - A com coeficiente de confiana


0 .4 fu ctio (x d , k (x) n n ) t(x ) 0 .2 0 .3

0 .0

0 .1

-3 -2 -1 0 x 1 2 3

Logo,

-t

1 1 1 1 I.C.( x y ; ) = P y x t .s p + ; y x + t .s p + = n m n m

Intervalo de confiana para diferena B - A com coeficiente de confiana


No exemplo temos:

1 1 1 1 y x t .s p I .C.( x y ; ) = P + ; y x + t .s p + = n m n m

1 1 1 1 = I.C.( x y ; ) = 76 68 2,06 * 8 + ; 76 68 + 2,06 * 8 + 12 15 12 15 I.C.( x y ; ) = (1,62 ; 14,38)

Exemplo 3 Deseja-se comparar duas tcnicas A e B de montagem de um produto industrial. Para tal foi selecionada uma amostra casual de 20 operrios e estes foram divididos aleatoriamente em dois grupos de 10 operrios. Aqueles pertencentes ao grupo A utilizaram a tcnica A e os demais a tcnica B para a montagem do produto. Os tempos necessrios montagem foram anotados e foram obtidas as seguintes estatsticas.
Tcnica A Tcnica B

x = 6,0
y = 7, 2

2 s A = 1,2

2 s B = 1,0

Compare os dois mtodos atravs de um teste de hiptese e use =5%.

Exemplo 3 Suposies: Normalidade Independncia Igualdade de varincias 1. Hipteses H: A = B A: A B 2. Estatstica do teste n=m=10
T =

(Y X )
Sp 1 1 + n m

~ t n + m 2 , sob H

Exemplo 3

3. Nvel de significncia: = 5% =P(erro tipo I)=P(rejeitar H | H verdadeira ) = P(T < - tc ou T > tc | A = B )=5%
0 .4

t18

fu c n d , k) (x n tio (x) t(x )

tc = 2,101

0 .0 -3

0 .1

0 .2

0 .3

-2

-1

0 x

RC={t: t < -2,101 ou t > 2,101}

2,5%

Exemplo 3

4. Amostra:

(n 1)s A + (m 1)s B 1,3 9 + 1,1 9 s = = = 1,2 n+m2 10 + 10 2


2 p

t= sp

(y x )

1 1 + n m

(6,0 7,2)
1,2 1 1 + 10 10

= 2,45

5. Deciso e concluso -2,45 RC Concluso: rejeitamos a hiptese H a um nvel de significncia de 5%. H evidncias de que a tcnica A melhor que a tcnica B.

Exerccio 3 - Seo 9.2 (Magalhes & Lima) Para verificar se duas populaes tm a mesma mdia, amostras independentes foram retiradas. Sabendo que a populao I Normal (1, 25) e a populao II Normal (2, 40), que concluso pode ser tirada, ao nvel de 2%? Os valores obtidos foram:
Pop. I II Dados 12 13 14 17 15 14 14 13 13 16 17 17 14 18 13 16

Exerccio 4-Seo 9.6 O salrio de recm formados em Veterinria foi amostrado em duas cidades. Na cidade A, 10 profissionais foram sorteados e na cidade B, 15. Os resultados, em salrios mnimos. So apresentados a seguir.
Cidade A 7,3 Cidade B 6,5 6,9 6,6 7,8 7,9 6,8 8,2 8,4 7,4 69 9,3 8,3 7,9 9,5 6,5 9,7 7,9 9,1 8,7 9,5 8,1 7,4 8,5 8,0

Admitindo que a variabilidade do salrio seja a mesma nas duas cidades e que o modelo Normal adequado, verifique se a cidade B paga, em mdia, melhor do que A. Obtenha o nvel descritivo e tome sua deciso utilizando um nvel de significncia =5%.

Anda mungkin juga menyukai