Introduo: hipteses e erros de concluso Testes de hipteses para mdias Testes de hipteses para varincias Testes de hipteses para propores
Testes de hipteses
Problema a ser resolvido pela Inferncia Estatstica
testar uma hiptese
Definio: o teste de hipteses um procedimento estatstico onde se busca verificar uma hiptese a respeito da populao no sentido de rejeit-la, tendo por populao, base dados amostrais amostrais.
1 2
Hiptese estatstica
A hiptese estatstica uma suposio feita a respeito de um ou mais parmetros (, 2, , etc.).
1.
Exemplo: Para verificar se uma nova droga eficaz no tratamento da presso alta, a presso mdia de um grupo de pacientes submetidos a esta droga (amostra) comparada com um valor que considerado normal (valor padro). Uma populao Uma amostra Uma estimativa ( x) do parmetro de interesse () Um valor conhecido e comprovado (0)
H 0 : = 0
Escolher uma das trs
Comparao de uma mdia () com um valor padro (0) Comparao entre duas mdias (1 e 2)
3
H A : 0 > 0 < 0
2.
Exemplo 1: Teste bilateral Problema cientfico: A raa Holandesa produz mais leite que a raa Jersey? Populao H vacas da raa Holandesa Populao J vacas da raa Jersey Varivel em estudo X: produo de leite
Hipteses estatsticas:
Exemplo: Para verificar, entre dois tipos de raes, qual d maior ganho de peso, comparamos os ganhos mdios de peso de dois grupos de cobaias (duas amostras), cada um submetido a um tipo de rao. Populao 1 Populao 2 Amostra 1 Estimativa de 1 x1
H 0 : 1 = 2
Escolher uma das trs
H J
Amostra 2 Estimativa de 2 x2
H 0 : H = J H A : H J
Bilateral
H A : 1 2
1 > 2 1 < 2
Quando no temos motivos suficientes para supor que uma das mdias ser maior que a outra, formulamos uma hiptese alternativa bilateral (mais genrica). genrica).
6
Exemplo 2: Teste unilateral Problema cientfico: Um novo inseticida eficaz no combate cientfico: lagarta da soja? Populao C lavouras com aplicao do inseticida Populao S lavouras sem aplicao do inseticida Varivel em estudo X: nmero de insetos mortos
Hipteses estatsticas:
C S
H 0 : C = S H A : C > S
Unilateral direita
Quando temos motivos suficientes para supor que uma das mdias ser maior que a outra, podemos formular uma hiptese alternativa unilateral (mais especfica). especfica)
7
Ser muito mais econmico e menos trabalhoso utilizar amostras das populaes.
8
Erros de concluso
Deciso do juiz Ru No condenar Inocente Culpado Condenar
Importante!!!
As duas taxas de erro e esto relacionadas negativamente, negativamente de modo que a reduo de implica no aumento de e vice-versa.
Acerto Erro 2
Deciso
Erro 1 Acerto
H 0 :1 = 2
O nico meio de reduzir ambos os tipos de erro aumentando o tamanho da amostra o que nem sempre amostra, vivel. nvel de significncia Em geral, a preocupao est voltada para o erro tipo I (), pois na maioria dos casos ele considerado o mais grave.
9 10
= Erro Tipo I: Declarar diferena quando ela no existe = Erro Tipo II: No declarar diferena quando ela existe
11
12
Situaes comuns em testes de hipteses a respeito de 1. Comparao de uma mdia () com um valor padro (0) 2. Comparao entre duas mdias (1 e 2)
Duas amostras independentes
12 e 22 desconhecidas, mas iguais 12 e 22 desconhecidas, mas diferentes
1.Comparao de uma mdia () com um valor padro (0) 1. Pressuposio: A varivel em estudo tem distribuio normal e varincia 2 desconhecida X ~ N ( , 2) Hiptese sob verificao:
H0 : = 0
Estatstica do teste:
onde: =n1
T=
X 0 ~ t () S n
13
T=
X 0 S n
/2 /2
Mas quo grande ser essa diferena para ser considerada significativa? Este limite dado pelos valores crticos.
T=
X 0 S n
0 t
um valor positivo.
-t/2
t/2
Mas quo grande ser essa diferena para ser considerada significativa? Este limite dado pelo valor crtico.
Rejeio de H0
No rejeio de H0
Rejeio de H0
No rejeio Rejeio de H0 de H0
Se o valor t (calculado na amostra) estiver entre -t/2 e t/2, no temos motivos para rejeitar H0 Se o valor t (calculado na amostra) for menor que -t/2 ou maior que t/2, rejeitamos H0
15
Se o valor t (calculado na amostra) for menor que t, no temos motivos para rejeitar H0 Se o valor t (calculado) for maior que t, rejeitamos H0
16
T=
X 0 S n
-t 0
um valor negativo.
Mas quo grande ser essa diferena para ser considerada significativa? Este limite dado pelo valor crtico.
Exemplo: Um processo deveria produzir bancadas com 0,85 m de altura. O engenheiro desconfia que as bancadas que esto sendo produzidas so diferentes que o especificado. Uma amostra de 8 valores foi coletada e indicou mdia de 0,87 e desvio padro de 0,010. Sabendo-se que os dados seguem a distribuio normal, teste a hiptese do engenheiro usando um nvel de significncia =0,05. Soluo: X 0 3) Pressuposio: A varivel em T= S estudo tem distribuio normal 2) =0,05 n 1) H0: = 0,85
HA: 0,85
4)
5)
0,025 0,025
=n-1=7
Rejeio No rejeio de H0 de H0
tc =
= 5,66
-2,365 Rejeita H0
+2,365 Rejeita H0
No se rejeita H0
Se o valor t (calculado na amostra) for maior que -t, no temos motivos para rejeitar H0 Se o valor t (calculado) for menor que -t, rejeitamos H0
17
Concluso: Ao nvel de 5% de significncia, conclui-se que as bancadas que esto sendo produzidas devem ter altura diferente do especificado, maiores que 0,85m.
18
Exerccio proposto: O tempo mdio, por operrio, para executar uma tarefa, tem sido 100 minutos, segundo a distribuio normal. Introduziu-se uma modificao para diminuir este tempo, e, aps certo perodo, sorteou-se uma amostra de 16 operrios, medindose o tempo de execuo gasto por cada um. O tempo mdio da amostra foi 91 minutos com desvio padro de 12 minutos. Este resultado evidencia uma melhora no tempo gasto para realizar a tarefa? Apresente as concluses ao nvel de 5% de significncia. Soluo: H0: = 100 HA: < 100
-1,753
Outro critrio de deciso Valor p: Probabilidade de que seja obtido um valor de T mais extremo que o valor observado, dado que H0 verdadeira
=0,05 =n-1=15
c
T=
x 0 91 100 = = -3 s 12 n 16
c 20
Rejeita-se H0 ao nvel de 5% de significncia e pode-se concluir que a modificao deve ter diminudo o tempo de execuo da tarefa.
19
c
21
c
22
Exerccio proposto: O tempo mdio, por operrio, para executar uma tarefa, tem sido 100 minutos, segundo a distribuio normal. Introduziu-se uma modificao para diminuir este tempo, e, aps certo perodo, sorteou-se uma amostra de 16 operrios, medindose o tempo de execuo gasto por cada um. O tempo mdio da amostra foi 91 minutos com desvio padro de 12 minutos. Este resultado evidencia uma melhora no tempo gasto para realizar a tarefa? Apresente as concluses ao nvel de 5% de significncia. Soluo: H0: = 100 HA: < 100
-1,753 =0,05 e =n-1=15
H0 : 1 = 2
T=
X1 X 2 1 1 2 + S n n 2 1
~ t ()
tc =
x 0 91 100 = = -3 s 12 16 n
Qual o valor p?
p< p 0,005 (0,5%)
= (n1 1) + (n2 1)
Rejeita-se H0 ao nvel de 5% de significncia e pode-se concluir que a modificao deve ter diminudo o tempo de execuo da tarefa.
23
S2 =
24
Exemplo: Dez cobaias adultas criadas em laboratrio, foram separadas, aleatoriamente, em dois grupos: um foi tratado com rao normalmente usada no laboratrio (padro) e o outro grupo foi submetido a uma nova rao (experimental). As cobaias foram pesadas no incio e no final do perodo de durao do experimento. Os ganhos de peso (em gramas) observados foram os seguintes:
Rao experimental Rao padro 220 200 200 180 210 190 220 190 210 180
Pressuposies: varivel ganho de peso com distribuio 2 normal, amostras independentes e supe-se que 1 = 2 . 2
s2 =
70 (5 1) + 70 (5 1) = 70 (5 1) + (5 1)
S2 =
tc =
212 188 1 1 + 70 5 5
= 4,54
T=
X1 X 2 1 1 2 n + n S 1 2
Utilize um teste de hiptese, ao nvel = 0,01, para verificar se as duas raes diferem entre si quanto ao ganho de peso.
Experimental
=0,05 e =(n1-1)+(n2-1)=8
H0 : 1 = 2
HA : 1 2
= 0,05
x1 = 212
s12 = 70
Padro x2 = 188
2 s2 = 70
-3.355
3,355
H0 rejeitada
n1 = 5
n2 = 5
Concluso: ao nvel de 5%, conclui-se que a rao experimental deve dar maior ganho de peso que a rao padro.
25 26
Exemplo: As resistncias de dois tipos de concreto, que segue o modelo normal, foram medidas, mostrando os resultados da tabela. Fixado um nvel de significncia de 10%, existe evidncias de que o concreto do tipo X seja mais resistente do que o concreto do tipo Y?
Tipo X Tipo Y 54 51 55 54 58 55 50 52 61 53
Os dados obtidos da tabela so: X = 55,6 e Y = 53,0 S 2 = 17,3 e S 2 = 2,5 X Y
H0 : 1 = 2
H0: X = Y HA: X Y
= 0,10
T=
2 1 2 2 2
T=
X1 X 2 S S + n1 n2
2 1 2 2
2 (S1 n1 + S 2 n2 ) 2 (17,3 5 + 2,5 5)2 15,6816 2 = = = 5,13 2 (S1 n1 )2 (S 2 n2 )2 (17,3 5)2 (2,5 5)2 3,0554 + 2 + 4 4 n1 1 n2 1
~ t ()
onde:
= 10% e = 5
X1 X2 S S + n1 n2
2 1 2 2
(S n1 + S n2 ) 2 (S1 n1 )2 (S 2 n2 )2 + 2 n1 1 n2 1
27
0,05 -2,015
0,05 2,015
Com estas amostras, ao nvel de 10% de significncia, no possvel afirmar que o concreto do tipo X seja mais resistente do que o concreto do tipo Y.
28
= 0,05
No teste unilateral o valor t crtico menor porque a rea a sua direita deve corresponder a todo . Assim, esta rea o dobro da rea direita do valor t crtico do teste bilateral.
Consideraes
Os intervalos de confiana e os testes de hipteses bilaterais so procedimentos estatsticos relacionados. Se forem utilizados para analisar os mesmos dados, ao mesmo nvel de significncia, devem conduzir aos mesmos resultados. O intervalo de confiana para uma mdia est relacionado com o teste de hipteses que compara uma mdia com um padro. padro H0 no rejeitada valor padro est coberto pelo intervalo O intervalo de confiana para a diferena entre duas mdias est relacionado com o teste de hipteses que compara duas mdias mdias. H0 no rejeitada zero est coberto pelo intervalo
30
Como consequncia, um valor t no rejeitado no teste bilateral pode ser rejeitado no teste unilateral. Portanto, o teste unilateral mais poderoso que o teste bilateral.
29
Exemplo: Um botnico recebeu a informao de que o dimetro mdio de flores de uma determinada planta de 9,6cm. Para testar a veracidade da informao, tomou uma amostra aleatria de 30 plantas, cujo dimetro mdio observado das flores foi 9,3cm, com desvio padro de 3,2cm. Considerando que o dimetro de flores segue a distribuio normal: a) Verifique, utilizando teste de hipteses ao nvel de 5% de significncia, se a informao recebida pelo botnico verdadeira. b) Verifique se a informao verdadeira, utilizando intervalo de confiana ao nvel de 95%. c) Houve coerncia entre os resultados do teste de hipteses e do intervalo de confiana?
31
a) Teste de Hiptese Varivel em estudo: X = dimetro de flores (cm) Pressuposio: A varivel em estudo tem distribuio normal 1. Hipteses estatsticas:
H0 : = 9,6
HA : 9,6
= 0,05
32
b) Intervalo de confiana Varivel em estudo: X = dimetro de flores (cm) Pressuposio: A varivel em estudo tem distribuio normal.
= 5% e = 29
T=
IC( ; 1 ) : X t /2
4. Deciso e concluso
S n
0,025
-2,045
2,045
Estimativas:
x = 9,3
= 30 1 = 29
No rejeitamos H0. Conclumos, ao nvel de 5% de significncia, que o dimetro mdio de flores desta planta no difere significativamente do valor padro (9,6cm). Portanto, a informao recebida pelo botnico deve ser verdadeira.
33
s 3,2 = = 0,5842 n 30
34
b) Intervalo de confiana
IC( ; 1 ) : X t /2 S n
IC (; 0,95): 9,3 2,045 0,5842 Limite inferior = 9,3 1,195 = 8,11 Limite superior = 9,3 + 1,195 = 10,50 P(8,11 < < 10,50) = 0,95 Conclumos que o intervalo de confiana, ao nvel de 95%, para o verdadeiro dimetro mdio de flores desta planta de 8,11 a 10,50cm. c) Sim, o resultado do teste de hipteses esta coerente com o do intervalo de confiana, pois o valor padro 9,6, que segundo o teste de hiptese no difere de , est dentro do intervalo de confiana, ou seja, um valor possvel para .
35
T=
d sd / n
36
Exemplo: Cinco operadores de mquinas foram treinados em duas mquinas de diferentes fabricantes, para verificar qual delas apresentava maior facilidade de aprendizagem. Mediu-se o tempo que cada um dos operadores gastou na realizao de uma mesma tarefa com cada um dos dois tipos de mquinas. Os resultados esto na tabela. Ao nvel de 5%, possvel afirmar que a tarefa realizada na mquina X demora mais do que na mquina Y? Soluo: H0: X = Y (d = 0) HA: X Y (d 0)
Operador 1 2 3 4 5 Maq. X 80 72 65 78 85 Maq. Y 75 70 60 72 78
d=
d
n
Sd =
(d d )
i
n -1
d = 5 e sd = 1,8708
= 5% e = n - 1 = 4
Operador 1 2 3 4 5
Maq. X 80 72 65 78 85
Maq. Y 75 70 60 72 78
di 5 2 5 6 7
di 5 2 5 6 7
-2,776 2,776
t=
d 5 = = 5,98 sd / n 1,8708/ 5
= 5%
T=
d sd / n
37
Com 5% de significncia, rejeita-se H0, e conclui-se que realizar a tarefa com a mquina X deve demorar mais do que com a mquina Y, esta apresentando maior facilidade de aprendizagem.
38
HA : 2 2 0 2 > 2 0
2 2 < 0
A estatstica do teste
Q= (n 1)S2
2 0
~ 2 (n 1)
39
...
40
10
Exemplo: Uma das maneiras de controlar a qualidade de um produto controlar a sua variabilidade. Uma mquina de empacotar caf est regulada para encher os pacotes com mdia de 500 g e desvio padro de 10 g, onde o peso de cada pacote distribui-se normalmente. Colhida uma amostra de n=16, observou-se uma varincia de 169 g2. possvel afirmar com este resultado que a mquina est desregulada quanto a variabilidade, supondo uma significncia de 5%? Soluo: H0: HA:
Q=
2 2
= 100 100
2,5% 6,26 95%
= 5% = n - 1 = 15
(n 1)S2
2 0
2,5% 27,49
A estatstica do teste
Com 5% de significncia, no se rejeita H0, isto , no possvel afirmar que a mquina est desregulada.
41
F=
2 S1 S2 2
Exemplo: As resistncias de dois tipos de concreto foram medidas, mostrando os resultados da tabela. Fixado um nvel de significncia de 10%, teste a hiptese de igualdade das varincias, considerando que os dados seguem a distribuio normal?
Tipo X Tipo Y 54 51 55 54 58 55 50 52 61 53
H0: 2X = 2Y HA: 2X 2Y
2 S1 17,3 = = 6,92 2,5 S2 2
F=
0,05
0,05
6,39
...
43
Neste caso, rejeita-se H0, ao nvel de 10% de significncia, e assume-se que as varincias populacionais so diferentes.
44
11
Exerccio: Uma alta quantidade de nitrato introduzida na alimentao animal tem mostrado possuir efeitos deletrios incluindo baixa produo de tiroxina, aumento de incidncia de cianose em recm nascidos e baixa produo de leite. Os dados que seguem referem-se a medida de ganho de peso percentual em ratos de laboratrio, submetidos a uma dieta padro e a uma dieta com 2000 ppm de nitrato na gua de beber.
Nitrato: 12,7 19,3 20,5 10,5 14,0 10,8 16,6 14,0 17,2 Controle: 18,2 32,9 10,0 14,3 16,2 27,6 15,7.
2 x N = 15,07 sN = 12,66
x C = 19,27 s 2 = 64,85 C
a) Verifique, atravs do teste F, se as varincias das populaes so iguais. b) Verifique, atravs do teste t, o efeito do nitrato sobre o ganho de peso.
T= X1 X2 1 1 2 + S n n 1 2
S2 =
2 S1 (n1 1) + S2 (n2 1) 2 (n1 1) + (n2 1)
H0 : = 0 HA : 0
Z=
H0 : =
2 1
2 2
2 HA : 1 2 2
F=
S S
2 1 2 2
> 0 < 0
p 0 0 (1 0 ) n
T=
X1 X2
2 S1 S2 + 2 n1 n2
2 (S1 n1 + S 2 n2 ) 2 2 2 (S1 n1 )2 (S 2 n2 )2 + 2 n1 1 n2 1
O teste se baseia na aproximao da distribuio Normal. Pressuposio: n grande np > 5 e n(1-p) > 5 p estimador de
p= x n
46
45
Exemplo: As condies de mortalidade de uma regio so tais que a proporo de nascidos que sobrevivem at 70 anos de 0,60. Testar esta hiptese ao nvel de 5% de significncia se em 1000 nascimentos amostrados aleatoriamente, verificou-se 530 sobreviventes at os 70 anos. Soluo:
p = 530 1000 = 0,53
A aproximao Normal tambm pode ser usada para testar a hiptese que dois parmetros de Binomiais sejam iguais, ou seja, para testar: H0 : 1 = 2
HA : 1 2 1 > 2 1 < 2
H0 : = 0,60
HA : 0,60
p 0 = 0 (1 0 ) n
= 0,05
-1,96 1,96
z=
Nesse caso, amostras de tamanho n1 e n2 so retiradas de cada populao, gerando x1 e x2 itens pertencentes classe associada com p e calcula-se os estimadores de x x para cada populao como: p1 = 1 p2 = 2 n1 n2 A estatstica para o teste :
Z= p1(1 p1) p2 (1 p2 ) + n1 n2
48
Decidi-se rejeitar H0, ao nvel de 5% de significncia. Neste caso, pode-se afirmar que a taxa dos que sobrevivem at os 70 anos menor do que 60%.
47
p1 p2
12
Exemplo: Em uma pesquisa de opinio, 32 dentre 80 homens declararam apreciar certa revista, acontecendo o mesmo com 26 dentre 50 mulheres. Ao nvel de 5% de significncia os homens e as mulheres apreciam igualmente a revista? Soluo: H0: H = M pH = 32 / 80 = 0,40 pM = 26 / 50 = 0,52 HA: H M
= 0,05
Z=
-1,96
1,96
13