Análise de Variância
Departamento de Estatística
Março 2017
.
Sumário
1.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
2.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
3.1 Independência . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
3.2 Normalidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
i
ii SUMÁRIO
A Tabelas 25
Capítulo 1
1.1 Introdução
No estudo da inferência para duas populações, vimos como estimar a diferença entre médias
populacionais de variáveis quantitativas a partir de amostras independentes retiradas de duas populações.
Mas, e se quisermos comparar mais de duas populações? Vimos como fazer isso no caso de variáveis
qualitativas, quando estudamos o teste qui-quadrado para homogeneidade. Estudaremos, agora, o método
da análise de variância ou ANOVA (do inglês ANalysis Of VAriance), que permite comparar várias as médias
de várias populações representadas por variáveis quantitativas. Assim como no caso de duas populações,
algumas hipóteses sobre os dados devem ser satisfeitas. É interessante notar que, embora o método
envolva comparação de variâncias, o objetivo é a comparação de médias, conforme será visto agora.
Dois processos novos de produção de chaves devem ser comparados com o processo tradicional no
intuito de se comparar o peso médio das chaves. Deseja-se comparar a acidez, medida pelo pH, da água
de riachos em quatro grandes parques nacionais. Com o intuito de obter a maior produtividade, compara-
se a produção de milho em lotes plantados sob quatro diferentes níveis de concentração de fertilizante.
Em todos esses exemplos, temos uma população (chaves e seu peso, riachos e seu pH, lotes e produção
de milho) categorizada segundo um fator (tipo de processo no caso das chaves, os parques nacionais no
caso do pH da água e os níveis de concentração de fertilizante no caso da produção de milho). Esse é o
contexto da análise da variância de um fator: uma população, representada por uma variável quantitativa
X , categorizada por um único fator com k níveis. Amostras aleatórias simples independentes são retiradas
para cada um dos níveis do fator. Os níveis do fator muitas vezes são chamados de tratamentos ou
sub-populações.
Na Tabela 1.1 apresentamos um esquema das informações relevantes para uma análise de variância.
Temos amostras independentes dos diferentes tratamentos e nosso objetivo é determinar se essas
observações vêm de uma única população (Figura 1.1a) ou de populações distintas (Figura 1.1b).
2 CAPÍTULO 1. ANÁLISE DE VARIÂNCIA DE UM FATOR
ni
X
Xi· = Xij (1.2)
j=1
ni
1 X
X i· Xij
ni
= (1.3)
j=1
ni
k X
X
X·· = Xij (1.4)
i=1 j=1
ki n
1 XX
X ·· Xij
n
= (1.5)
i=1 j=1
1.2. ANOVA DE UM FATOR - O BÁSICO 3
X ni
k X X ni
k X ni
k X
X ni
k X
X
(Xij − X ·· ) = Xij − X ·· = Xij − nX ·· = 0 (1.7)
i=1 j=1 i=1 j=1 i=1 j=1 i=1 j=1
A soma dos quadrados total (SQT) é a soma dos quadrados dos desvios de todas as observações
em torno da média geral, isto é:
Xk Xni
SQT = (Xij − X ·· )2 (1.8)
i=1 j=1
X ni
k X ni
k X
X
(Xij − X ·· )2 = (Xij − X i· + X i· − X ·· )2
i=1 j=1 i=1 j=1
X ni
k X ni
k X
X ni
k X
X
= (Xij − X i· )2 + (X i· − X ·· )2 + 2 (Xij − X i· )(X i· − X ·· )
i=1 j=1 i=1 j=1 i=1 j=1
ni
k X k ni k ni
X X X X X
= (Xij − X i· )2 + (X i· − X ·· )2 1+2 (X i· − X ·· ) (X
− X i· )
ij
i=1 j=1 i=1 j=1 i=1 j=1
| {z }
0 por 1.6
Resulta que
X ni
k X X ni
k X k
X
(Xij − X ·· )2 = (Xij − X i· )2 + ni (X i· − X ·· )2
i=1 j=1 i=1 j=1 i=1
ou equivalentemente
X ni
k X k
X ni
k X
X
(Xij − X ·· )2
= ni (X i· − X ·· ) + 2
(Xij − X i· )2 (1.9)
i=1 j=1 i=1 i=1 j=1
O primeiro somatório no lado direito da igualdade acima é uma medida de variação entre as médias
dos tratamentos e a média geral (segmentos em vermelho na Figura 1.2); sendo assim, ela é chamada
de soma de quadrados devida ao tratamento (ou soma de quadrados entre grupos). Aqui, como temos
apenas um fator A, vamos denotá-la por SQA, uma vez que iremos considerar, no próximo capítulo, análise
de variância com dois fatores A e B. No segundo somatório no lado direito temos uma medida de variação
entre elementos do mesmo grupo, uma vez que são considerados os desvios de cada elemento e a média
do seu grupo (segmentos em azul na Figura 1.2). Essa soma representa o que deixou de ser explicado
pelo fator A, e, assim, é chamada de soma de quadrados dos erros (ou soma de quadrado dentro dos
grupos), denotada por SQE. A soma de quadrados total é uma medida de variação global, envolvendo os
desvios entre todos os elementos e a média geral (alguns segmentos em verde na Figura 1.2 representam
esses desvios). Temos, assim, a decomposição
A cada soma de quadrados está associado um número de graus de liberdade, que pode ser pensado
como o número de parcelas independentes no somatório.
Podemos pensar nos graus de liberdade da seguinte forma também: temos n observações para
estimar a média geral; sendo assim, “sobram” n − 1 graus de liberdade.
Podemos pensar nos graus de liberdade da seguinte forma também: temos n observações para
estimar k médias; sendo assim, “sobram” n − k graus de liberdade.
SQA → gl = k − 1
1.2. ANOVA DE UM FATOR - O BÁSICO 5
A divisão de uma soma de quadrados pelo seu número de graus de liberdade resulta em uma média
quadrática. Sendo assim, temos
SQA
k −1
MQA = (1.11)
SQE
n−k
MQE = (1.12)
Note que a média quadrática total nada mais é que a variância SX2 dos dados; sendo assim, ela não recebe
um outro nome.
As informações acima costumam ser resumidas em uma tabela, chamada de tabela da ANOVA, cuja
forma geral é
Fonte de variação SQ GL MQ
Fator A SQA k −1 MQA
Erro SQE n-k SQE
Total SQT n−1
Na próxima seção veremos como usar essas informações para testar a hipótese de igualdade das
médias.
Assim como no cálculo da variância S 2 , vamos apresentar fórmulas alternativas que, além de serem
numericamente mais precisas, são mais fáceis de serem obtidas em cálculos manuais. Tais fórmulas são
completamente análogas à fórmula já vista para S 2 .
• SQT
X ni
k X ni
k X
X
(Xij − X ·· )2 (Xij2 − 2Xij X ·· + X ·· )
2
=
i=1 j=1 i=1 j=1
X ni
k X ni
k X
X ni
k X
X
Xij2 − 2X ·· Xij + X ··
2
= 1
i=1 j=1 i=1 j=1 i=1 j=1
ni
k X
X
Xij2 − 2nX ·· + nX ··
2 2
=
i=1 j=1
ni
k X
X
Xij2 − nX ··
2
=
i=1 j=1
ni
k X ni
k X ni
k X
X X X X··2
(Xij − X ·· )2 = Xij2 − nX ·· = Xij2 −
2
n
SQT = (1.13)
i=1 j=1 i=1 j=1 i=1 j=1
6 CAPÍTULO 1. ANÁLISE DE VARIÂNCIA DE UM FATOR
• SQA
k
X k
X
ni (X i· − X ·· )2 ni (X i· − 2X i· X ·· + X ·· )
2 2
=
i=1 i=1
k
X k
X k
X
ni X i· − 2X ·· ni X i· + X ·· ni
2 2
=
i=1 i=1 i=1
k k
X X2 i·
X
− 2X ·· Xi· + nX ··
2
ni
=
i=1 i=1
k
X Xi·2
− 2X ·· nX ·· + nX ··
2
ni
=
i=1
k
X X2 i·
− nX ··
2
ni
=
i=1
Logo,
k k k
X X X2 i·
X X2 i· X··2
ni (X i· − X ·· )2 = − nX ·· = −
2
ni ni n
SQA = (1.14)
i=1 i=1 i=1
• SQE
ni
k X k
X X X2 i·
SQE = SQT − SQA = Xij2 −
ni
(1.15)
i=1 j=1 i=1
Fonte de variação SQ GL MQ
k
X X2 i· X··2
− k −1
SQA
ni n k −1
Fator A SQA = MQA =
i=1
ni
k X
X X··2
Xij2 − n−1
n
Total SQT =
i=1 j=1
EXEMPLO 1.1
Grupo 1 33 27 27 32 27 31 23 26 34
Grupo 2 27 35 32 28 35 39 33
Grupo 3 30 36 33 35 33 28
1.3. ANOVA DE UM FATOR - O MODELO 7
Solução
n1 = 9 n2 = 7 n3 = 6 n = 9 + 7 + 6 = 22
x1· = 33 + 27 + 27 + 32 + 27 + 31 + 23 + 26 + 34 = 260 ⇒ X1·2 = 2602 = 67600
x2· = 27 + 35 + 32 + 28 + 35 + 39 + 33 = 229 ⇒ X2·2 = 2292 = 52441
x3· = 30 + 36 + 33 + 35 + 33 + 28 = 195 ⇒ X3· = 1952 = 38025
x·· = x1· + x2· + x3· = 260 + 229 + 195 = 684 ⇒ X··2 = 6842 = 467856
n1
X
x1j
2
= 332 + 272 + 272 + 322 + 272 + 312 + 232 + 262 + 342 = 7622
j=1
n2
X
x2j
2
= 272 + 352 + 322 + 282 + 352 + 392 + 332 = 7597
j=1
n2
X
x3j
2
= 302 + 362 + 332 + 352 + 332 + 282 = 6383
j=1
ni
3 X
X
xij2 = 7622 + 7597 + 6383 = 21602
i=1 j=1
−
67600 52441 38025 467856
SQA = + + = 74, 0007
9 7 6 22
SQT = 21602 −
467856
= 335, 8182
22
A tabela da ANOVA é
Fonte de variação SQ GL MQ
Fator A 74, 0007 2 37,00035
Erro 261, 8175 19 13,7799
Total 335, 8182 21
Assim como no caso do teste t para comparação de duas médias, o modelo da ANOVA exige que
as populações X1 , X2 , · · · , Xk sejam normais e, além disso, as variâncias devem ser iguais. Assim, Xi ∼
N(µi , σ 2 ), i = 1, 2, · · · , k e amostras aleatórias simples independentes de tamanhos n1 , n2 , · · · , nk são
retiradas dessas populações. Esses pressupostos podem ser resumidos através do seguinte modelo
As hipóteses
H0 : µ1 = µ2 = · · · = µk (1.17)
A estatística de teste
F0 = ∼ Fk−1,n−k
MQA
(1.19)
MQE
A região crítica
Para definir a região crítica, vamos calcular o valor esperado de MQA e MQE.
• MQA
Por (1.14, temos que
k
X
ni E(X i· ) − n E(X ·· )
2 2
E(SQA) =
i=1
k
X
= ni Var(X i· ) + [E(X i· )]2 − n Var(X ·· ) + [E(X ·· )]2
i=1
k 2
X σ2 σ n1 µ1 + n2 µ2 + · · · + nk µk 2
ni + µi − n
2
ni n n
= +
i=1
k
X
= kσ 2 + ni µi2 − σ 2 − nµ·2
i=1
k
X
= (k − 1)σ 2 + ni µi2 − nµ·2
i=1
em que
k
1X
µ· = ni µ i
n
(1.20)
i=1
k
X k
X
(µi − µ· ) =
2
ni µi2 − nµ·2 (1.21)
i=1 i=1
1.3. ANOVA DE UM FATOR - O MODELO 9
Logo,
k
X
E(SQA) = (k − 1)σ 2 + (µi − µ· )2
i=1
e, portanto,
k
1 X
E(MQA) = σ 2 + (µi − µ· )2
k −1
(1.22)
i=1
• MQE
Por (1.15), temos que
X ni
k X k
X
− ni E(X i· )
2
E(SQE) = E(Xij2 )
i=1 j=1 i=1
k
X Xni k
X
= Var(Xij ) + [E(Xij )]2 − ni Var(X i· ) + [E(X i· )]2
i=1 j=1 i=1
ni
k X k
X X σ2
= nσ + 2
µi − ni + µi2
ni
i=1 j=1 i=1
k
X k
X
= nσ 2 + ni µi − kσ 2 − ni µ i
i=1 i=1
= (k − 1)σ 2
e, portanto,
E(MQE) = σ 2 (1.23)
• A região crítica
De (1.23) podemos ver que a média quadrática dos erros é um estimador não viesado para a variância
comum σ 2 . Por outro lado, se H0 for verdadeira, MQA também é um estimador não viesado de σ 2 ,
mas, em geral, E(MQA) > E(MQE) = σ 2 . Logo, sob a hipótese alternativa H1 , o valor esperado do
numerador da estatística de teste será maior que o valor esperado do denominador da estatística
de teste. Sendo assim, rejeitaremos H0 para valores grandes da estatística de teste, ou seja, o teste
F da ANOVA é um teste unilateral à direita cuja região crítica é
F0 = > Fk−1,n−k;α
MQA
(1.24)
MQE
O estimador pontual da média µi é X i· . Para construir o intervalo de confiança, usamos MQE como
estimador da variância σ 2 e a distribuição amostral será a t−Student com n − k graus de liberdade, que
é o número de graus de liberdade da SQE. Assim, o intervalo de confiança de nível 1 − α para µi é
" s s #
x i· − tn−k;α/2 ; x i· + tn−k;α/2
MQE MQE
ni ni
(1.25)
10 CAPÍTULO 1. ANÁLISE DE VARIÂNCIA DE UM FATOR
EXEMPLO 1.2
Vamos completar o Exemplo 1.1, fazendo o teste da hipótese de igualdade das três médias. Para isso,
completamos a tabela da ANOVA acrescentando uma coluna com o valor da estatística F e outra coluna
com o valor P.
F=
37, 00035
= 2685
13, 7799
x 1. = x 2. = x 3. =
260 229 195
= 28, 8889 = 32, 7143 = 32, 5000
9 7 6
Na Figura 1.3 apresenta-se a saída do Minitab para os dados deste exemplo. Com exceção
do Sumário do Modelo, todas as outras informações foram calculadas nos exemplos. O desvio padrão
combinado (última linha) é simplesmente a raiz quadrada da MQE.
1.4. EXERCÍCIOS PROPOSTOS 11
(a) Realize um teste de análise de variância para determinar se há alguma evidência de que os
pesos médios de algum par de tipos de pulseira sejam diferentes. Inclua uma tabela ANOVA.
Use α = 0, 05.
(b) Calcule o peso médio amostral para cada amostra e calcule os intervalos de confiança de 95%
para cada um dos pesos populacionais. Dada sua conclusão na parte (a), quais pares de médias
populacionais você acha que sejam diferentes?
Realize um teste de análise de variância para determinar se há alguma evidência de que a quantidade
populacional média de sal por porção seja diferente para, pelo menos, duas variedades. Use α = 0, 05.
Capítulo 2
2.1 Introdução
Quando o teste F acusa diferença significativa entre as médias dos k tratamentos, não há informação
de qual, ou quais, são diferentes. Sendo assim, é necessária uma análise de acompanhamento (follow up)
para identificar aonde está a diferença. Note que essa análise só faz sentido se o teste F foi significante.
Como estamos comparando várias médias, tal análise envolve múltiplas comparações de pares de
médias. Uma possível solução seria analisar individualmente cada par possível de médias através de um
teste t com nível de significância α. Lembre-se que o nível de significância é a probabilidade do erro tipo
I, ou seja, rejeitar H0 (declarar que o teste é significante) quando H0 é verdadeira (nenhuma diferença
entre as médias, ou seja, as observações vêm de uma única população). Num teste de igualdade de várias
médias, ainda queremos manter pequena a probabilidade do erro tipo I (teste significante quando H0 é
verdadeira). Suponhamos que haja 4 grupos; então, existem (4 · 3)/2 = 6 pares de médias a comparar. Se
fizermos as 6 comparações através de testes t independentes com α = 0, 05, a probabilidade de obtermos
pelo menos um teste significante (dentre os 6) quando H0 é verdadeira será 1 − 0, 956 = 0, 265! Há várias
propostas para tratar a comparação simultânea de várias médias, de forma a controlar o tamanho do erro
tipo I do experimento, que é probabilidade de se obter pelo menos um resultado significante (rejeitar H0 )
quando todas as hipóteses nulas são verdadeiras.
Se cada teste individual tem tamanho α, então a probabilidade de se obter pelo menos um resultado
significante entre m testes quando todas as hipóteses nulas são verdadeiras é 1 − (1 − α)m . Na Figura
2.1 pode-se ver a variação da probabilidade de pelo menos um erro tipo I em função do número de testes
individuais sendo feitos.
14 CAPÍTULO 2. ANOVA DE UM FATOR - ANÁLISE DE ACOMPANHAMENTO
Há vários métodos para comparações múltiplas e não há consenso sobre qual é o “melhor”.
Apresentaremos agora alguns desses métodos.
Os graus de liberdade da t−Student vêm da média quadrática dos erros. O nível de significância de cada
intervalo individual é ajustado para o número de comparações: note que α/(2c) = (α/2)/c.
H0 : x i1 · = x i2 ·
Pulseiras para relógios masculinos são feitas em ouro, prata e titânio. Obteve-se uma amostra
aleatória de cada tipo (em estilos semelhantes), e o peso de cada pulseira (em gramas) foi registrado. Os
dados constam da tabela que segue.
Para um nível de significância global de α = 0, 05, o nível de significância individual deverá ser
0, 05/3 = 0, 01667 e, assim, como a MQ tem 20 graus de liberdade, o valor crítico é1
t20;0,016667/2 = 2, 61444
e, portanto, p p
t20;0,016667/2 · MQE = 2, 61444 · 1, 064 = 0, 927255
Os intervalos de confiança são:
• Ouro − Prata
r
(8, 157 − 7, 975) ± 0, 927255 + = 0, 182 ± 0, 962941 = (−0, 780941 ; 1, 144941)
1 1
7 8
• Ouro − Titânio
r
(8, 157 − 6, 050) ± 0, 927255 + = 2, 107 ± 0, 962941 = (1, 144059 ; 3, 069941)
1 1
7 8
• Prata − Titânio
r
(7, 975 − 6, 050) ± 0, 927255 + = 1, 925 ± 0, 463628 = (1, 461372 ; 2, 388628)
1 1
8 8
Analisando os intervalos, vemos que há diferença significante entre os pesos das pulseiras de ouro e
titânio e das pulseiras de prata e titânio; os pesos das pulseiras de titânio são significantemente diferentes
(menores) que os pesos das pulseiras de ouro ou prata.
1 obtido com o Minitab
16 CAPÍTULO 2. ANOVA DE UM FATOR - ANÁLISE DE ACOMPANHAMENTO
A ideia central subjacente ao teste da diferença mínima significante proposto por Fisher em 1935 é
calcular a menor diferença significante (DMS) como se fosse a única diferença a ser comparada – com um
teste t. Cada diferença, em módulo, será declarada significante se for maior que DMS (em inglês, least
significant difference – LSD). O cálculo de DMS é feito da seguinte forma:
• n1 = n2 = · · · = nk = n∗ r
DMS = tn−k;α/2 · MQE
2
n∗
(2.2)
Note que quando os ni ’s não são todos iguais, é necessário calcular DMS para cada par de médias
sendo comparadas.
t20;0,025 = 2, 08596
Logo, p
p
t20;0,025 MQE = 2, 08596 1, 064 = 2, 151676
• Ouro − Prata
r
(8, 157 − 7, 975) ± 2, 151676 + = 0, 182 ± 1, 113598 = (−0, 931598 ; 1, 295598)
1 1
7 8
• Ouro − Titânio
r
(8, 157 − 6, 050) ± 2, 151676 + = 2, 107 ± 1, 113598 = (0, 993492 ; 3, 220598)
1 1
7 8
• Prata − Titânio
r
(7, 975 − 6, 050) ± 2, 151676 + = 1, 925 ± 1, 075838 = (0, 849162 ; 3, 000838)
1 1
8 8
Na Figura 2.3 temos a saída do Minitab para os intervalos de confiança baseados na DMS de
Fisher; note que as diferenças foram tomadas ao contrário das nossas, daí os sinais invertidos dos limites
dos IC.
2.4. A DIFERENÇA HONESTAMENTE SIGNIFICANTE DE TUKEY 17
Figura 2.3 – Saída do Minitab para o Exemplo 2.1 - Intervalos de confiança da DMS de Fisher
A ideia principal subjacente ao teste da diferença honestamente significante (DHS) proposto por
Tukey é a comparação de todas as diferenças aos pares usando a mesma distribuição amostral utilizada
para a maior diferença, o que torna o teste de Tukey bastante conservador. A distribuição para a maior
diferença se baseia na distribuição da amplitude studentizada descoberta por William Gosset. Essa
distribuição refere-se à estatística
max(x1 , x2 , · · · , xn ) − min(x1 , x2 , · · · , xn
q=
s
e depende do número n de observações (ou grupos) e do número de graus de liberdade do estimador da
variância comum σ 2 .
• n1 = n2 = · · · = nk = n∗ r
DHS = qk,n−k;α
MQE
n∗
(2.4)
O teste de Tukey, ao considerar a maior diferença, preocupa-se apenas com o tamanho da diferença.
Sendo assim, é um teste unilateral à direita.
Embora haja semelhança com a estatística t para duas amostras, note que as médias sendo
comparadas são escolhidas a posteriori, ou seja, depois de observados os dados. Assim, a distribuição não
é mais a t e, sim, a da amplitude studentizada.
18 CAPÍTULO 2. ANOVA DE UM FATOR - ANÁLISE DE ACOMPANHAMENTO
No Exemplo 2.1 temos 3 grupos: ouro com nO = 7, prata com nP = 8 e titânio com nT = 8. Usando
a função qtukey do R, obtemos
• Ouro − Prata
s
1, 064 1 1
DHS = 3, 577935 + = 1, 351
2 7 8
xO − xP = 8, 157 − 7, 975 = 0, 182 < 1, 3506
• Ouro − Titânio
s
1, 064 1 1
DHS = 3, 577935 + = 1, 351
2 7 8
xO − xT = 8, 157 − 6, 050 = 2, 107 > 1, 3506
• Prata − Titânio
s
1, 064 1 1
DHS = 3, 577935 + = 1, 305
2 8 8
xP − xT = 7, 975 − 6, 050 = 1, 925 > 1, 305
Na Figura 2.4 temos a saída do Minitab. Note a forma de apresentar o resultado do teste: médias
que não compartilham uma letra são significantemente diferentes. Vemos, então, que titânio é diferente
tanto do uro quanto da prata. Observe,também, que embora o rótulo seja “IC de 95%”, na nossa notação
usual deveria ser “IC de 90%”. Por ser um teste unilateral superior, o IC bilateral deve levar isso em conta.
Figura 2.4 – Saída do Minitab para o Exemplo 2.1 - Teste e Intervalos de confiança da DHS de Tukey
2.5. TESTE DE DUNCAN 19
As médias dos k tratamentos são arranjadas em ordem crescente e o erro padrão de cada média é
determinado como r
Sx =
MQE
n∗
(2.6)
se n1 = n2 = · · · = nk = n∗ e por s
Sx =
MQE
nH
(2.7)
As diferenças observadas entre as médias são comparadas com valores da tabela de amplitudes
significantes de Duncan. Essa tabela depende de dois parâmetros: 3, o número de graus de liberdade da
MQE, e p, o número de médias no intervalo de comparação. O esquema da sequência geral de comparações
é o seguinte:
• a menor média – p = k − 1
• a segunda menor média – p = k − 2
.
• ..
• a (k − 2)-ésima menor média – p = k − 1 − (k − 2) = 1
k(k − 1)
O processo continua até que os pares de médias tenham sido comparados.
2
Figura 2.5 – Esquema de comparação da maior média com as demais – Teste de Duncan
20 CAPÍTULO 2. ANOVA DE UM FATOR - ANÁLISE DE ACOMPANHAMENTO
Os valores críticos para comparação das diferenças de médias são definidos por
Rp = rp,3;α · Sx (2.9)
com rp,3;α dado na tabela de Duncan.
Por ser um teste bem trabalhoso, o uso de software é absolutamente necessário aqui. O teste de
Duncan não está implementado no Minitab.
Considere as informações de uma análise de variância dadas na Figura 2.6. O teste F é significante
ao nível α = 0, 01. Vamos aplicar o teste de Duncan a esses dados. A média harmônica dos tamanhos
amostrais é
nH = 1 1 1 1 = 5, 6471
4
4 + 8 + 6 + 6
Figura 2.6 – Esquema de comparação da maior média com as demais – Teste de Duncan
C A D B
53,100 55,150 55,533 56,900
Comparações
Na Figura 2.7 ilustram-se essas comparações, com as médias “iguais” unidas por segmentos.
1. Independência
2. Normalidade
3. Homogeneidade de variâncias
3.1 Independência
Essa hipótese estabelece que deve haver independência entre as observações dentro de cada grupo
e entre grupos. No planejamento do experimento é fundamental que a obtenção dos dados seja feita de
forma apropriada, pois a violação da hipótese de independência é um problema sério, difícil de se corrigir.
A aleatorização do experimento é um passo importante para obtenção da independência.
3.2 Normalidade
O teste de Bartlett se baseia em uma estatística que é distribuída aproximadamente como uma
qui-quadrado com k − 1 graus de liberdade. No entanto, esse teste é bastante sensível à hipótese de
normalidade. A estatística de teste é
k
X
(n − k) ln(MQE) − (ni − 1) ln(Si2 )
i=1
X2 = " k # (3.3)
X
−
1 1 1
3(k − 1) ni − 1 n−k
1+
i=1
X 2 > χk−1;α
2
O teste de Levene é mais robusto contra falta de normalidade dos dados e sua estatística segue
uma distribuição F sob H0 :
k
X
ni (Z i· − Z ·· )2
n − k i=1
L= ni
= Fk−1,n−k
k −1X k X |{z} (3.4)
2 sob H0
(Zij − Z i· )
i=1 j=1
em que
Zij = Xij − X i· desvio absoluto dos Xij em relação à média do grupo (3.5)
X n i
L > Fk−1,n−k;α
Apêndice A
Tabelas
25
.
26 APÊNDICE A. TABELAS
ν p
2 3 4 5 6 7 8 9 10 11 12
2 6,080 8,331 9,799 10,881 11,734 12,435 13,028 13,542 13,994 14,396 14,759
3 4,501 5,910 6,825 7,502 8,037 8,478 8,852 9,177 9,462 9,717 9,946
4 3,927 5,040 5,757 6,287 6,706 7,053 7,347 7,602 7,826 8,027 8,208
5 3,635 4,602 5,218 5,673 6,033 6,330 6,582 6,801 6,995 7,167 7,323
6 3,460 4,339 4,896 5,305 5,628 5,895 6,122 6,319 6,493 6,649 6,789
7 3,344 4,165 4,681 5,060 5,359 5,606 5,815 5,997 6,158 6,302 6,431
8 3,261 4,041 4,529 4,886 5,167 5,399 5,596 5,767 5,918 6,053 6,175
9 3,199 3,948 4,415 4,755 5,024 5,244 5,432 5,595 5,738 5,867 5,983
10 3,151 3,877 4,327 4,654 4,912 5,124 5,304 5,460 5,598 5,722 5,833
11 3,113 3,820 4,256 4,574 4,823 5,028 5,202 5,353 5,486 5,605 5,713
12 3,081 3,773 4,199 4,508 4,750 4,950 5,119 5,265 5,395 5,510 5,615
13 3,055 3,734 4,151 4,453 4,690 4,884 5,049 5,192 5,318 5,431 5,533
14 3,033 3,701 4,111 4,407 4,639 4,829 4,990 5,130 5,253 5,364 5,463
15 3,014 3,673 4,076 4,367 4,595 4,782 4,940 5,077 5,198 5,306 5,403
16 2,998 3,649 4,046 4,333 4,557 4,741 4,896 5,031 5,150 5,256 5,352
17 2,984 3,628 4,020 4,303 4,524 4,705 4,858 4,991 5,108 5,212 5,306
18 2,971 3,609 3,997 4,276 4,494 4,673 4,824 4,955 5,071 5,173 5,266
19 2,960 3,593 3,977 4,253 4,468 4,645 4,794 4,924 5,037 5,139 5,231
20 2,950 3,578 3,958 4,232 4,445 4,620 4,768 4,895 5,008 5,108 5,199
21 2,941 3,565 3,942 4,213 4,424 4,597 4,743 4,870 4,981 5,081 5,170
22 2,933 3,553 3,927 4,196 4,405 4,577 4,722 4,847 4,957 5,056 5,144
23 2,926 3,542 3,914 4,180 4,388 4,558 4,702 4,826 4,935 5,033 5,121
24 2,919 3,532 3,901 4,166 4,373 4,541 4,684 4,807 4,915 5,012 5,099
25 2,913 3,523 3,890 4,153 4,358 4,526 4,667 4,789 4,897 4,993 5,079
26 2,907 3,514 3,880 4,141 4,345 4,511 4,652 4,773 4,880 4,975 5,061
27 2,902 3,506 3,870 4,130 4,333 4,498 4,638 4,758 4,864 4,959 5,044
28 2,784 3,332 3,655 3,883 4,058 4,200 4,319 4,421 4,511 4,590 4,662
29 2,892 3,493 3,853 4,111 4,311 4,475 4,613 4,732 4,837 4,930 5,014
30 2,897 3,499 3,861 4,120 4,322 4,486 4,625 4,745 4,850 4,944 5,029
31 2,892 3,493 3,853 4,111 4,311 4,475 4,613 4,732 4,837 4,930 5,014
32 2,888 3,486 3,845 4,102 4,301 4,464 4,601 4,720 4,824 4,917 5,001
33 2,884 3,481 3,838 4,094 4,292 4,454 4,591 4,709 4,812 4,905 4,988
34 2,881 3,475 3,832 4,086 4,284 4,445 4,581 4,698 4,802 4,894 4,976
35 2,871 3,461 3,814 4,066 4,261 4,421 4,555 4,671 4,773 4,863 4,945
36 2,868 3,457 3,809 4,060 4,255 4,414 4,547 4,663 4,764 4,855 4,936
37 2,865 3,453 3,804 4,054 4,249 4,407 4,540 4,655 4,756 4,846 4,927
38 2,863 3,449 3,799 4,049 4,243 4,400 4,533 4,648 4,749 4,838 4,919
39 2,861 3,445 3,795 4,044 4,237 4,394 4,527 4,641 4,741 4,831 4,911
40 2,858 3,442 3,791 4,039 4,232 4,388 4,521 4,634 4,735 4,824 4,904
50 2,841 3,416 3,758 4,002 4,190 4,344 4,473 4,584 4,681 4,768 4,846
60 2,829 3,399 3,737 3,977 4,163 4,314 4,441 4,550 4,646 4,732 4,808
70 2,821 3,386 3,722 3,960 4,144 4,293 4,419 4,527 4,621 4,706 4,781
80 2,814 3,377 3,711 3,947 4,129 4,277 4,402 4,509 4,603 4,686 4,761
90 2,810 3,370 3,702 3,937 4,118 4,265 4,389 4,495 4,588 4,671 4,746
100 2,806 3,365 3,695 3,929 4,109 4,256 4,379 4,484 4,577 4,659 4,733
1 Valores gerados com a função ptukey do R
27
ν p
2 3 4 5 6 7 8 9 10 11 12
2 13,902 19,016 22,564 25,372 27,757 29,856 31,730 33,412 34,926 36,293 37,533
3 8,260 10,620 12,170 13,322 14,239 14,998 15,646 16,212 16,713 17,164 17,573
4 6,511 8,120 9,173 9,958 10,583 11,101 11,542 11,925 12,263 12,565 12,839
5 5,702 6,976 7,804 8,421 8,913 9,321 9,669 9,971 10,239 10,479 10,696
6 5,243 6,331 7,033 7,556 7,972 8,318 8,612 8,869 9,097 9,300 9,485
7 4,949 5,919 6,542 7,005 7,373 7,678 7,939 8,166 8,367 8,548 8,711
8 4,745 5,635 6,204 6,625 6,959 7,237 7,474 7,680 7,863 8,027 8,176
9 4,596 5,428 5,957 6,347 6,657 6,915 7,134 7,325 7,494 7,646 7,784
10 4,482 5,270 5,769 6,136 6,428 6,669 6,875 7,054 7,213 7,356 7,485
11 4,392 5,146 5,621 5,970 6,247 6,476 6,671 6,841 6,992 7,127 7,250
12 4,320 5,046 5,502 5,836 6,101 6,320 6,507 6,670 6,814 6,943 7,060
13 4,260 4,964 5,404 5,726 5,981 6,192 6,372 6,528 6,666 6,791 6,903
14 4,210 4,895 5,322 5,634 5,881 6,085 6,258 6,409 6,543 6,663 6,772
15 4,167 4,836 5,252 5,556 5,796 5,994 6,162 6,309 6,438 6,555 6,660
16 4,131 4,786 5,192 5,489 5,722 5,915 6,079 6,222 6,348 6,461 6,564
17 4,099 4,742 5,140 5,430 5,659 5,847 6,007 6,147 6,270 6,380 6,480
18 4,071 4,703 5,094 5,379 5,603 5,787 5,944 6,081 6,201 6,309 6,407
19 4,046 4,669 5,054 5,334 5,553 5,735 5,889 6,022 6,141 6,246 6,342
20 4,024 4,639 5,018 5,293 5,510 5,688 5,839 5,970 6,086 6,190 6,285
21 4,004 4,612 4,986 5,257 5,470 5,646 5,794 5,924 6,038 6,140 6,233
22 3,986 4,588 4,957 5,225 5,435 5,608 5,754 5,882 5,994 6,095 6,186
23 3,970 4,566 4,931 5,195 5,403 5,573 5,718 5,844 5,955 6,054 6,144
24 3,955 4,546 4,907 5,168 5,373 5,542 5,685 5,809 5,919 6,017 6,105
25 3,942 4,527 4,885 5,144 5,347 5,513 5,655 5,778 5,886 5,983 6,070
26 3,930 4,510 4,865 5,121 5,322 5,487 5,627 5,749 5,856 5,951 6,038
27 3,918 4,495 4,847 5,101 5,300 5,463 5,602 5,722 5,828 5,923 6,008
28 3,908 4,481 4,830 5,082 5,279 5,441 5,578 5,697 5,802 5,896 5,981
29 3,898 4,467 4,814 5,064 5,260 5,420 5,556 5,674 5,778 5,871 5,955
30 3,889 4,455 4,799 5,048 5,242 5,401 5,536 5,653 5,756 5,848 5,932
31 3,881 4,443 4,786 5,032 5,225 5,383 5,517 5,633 5,736 5,827 5,910
32 3,873 4,433 4,773 5,018 5,210 5,367 5,500 5,615 5,716 5,807 5,889
33 3,865 4,423 4,761 5,005 5,195 5,351 5,483 5,598 5,698 5,789 5,870
34 3,859 4,413 4,750 4,992 5,181 5,336 5,468 5,581 5,682 5,771 5,852
35 3,852 4,404 4,739 4,980 5,169 5,323 5,453 5,566 5,666 5,755 5,835
36 3,846 4,396 4,729 4,969 5,156 5,310 5,439 5,552 5,651 5,739 5,819
37 3,840 4,388 4,720 4,959 5,145 5,298 5,427 5,538 5,637 5,725 5,804
38 3,835 4,381 4,711 4,949 5,134 5,286 5,414 5,526 5,623 5,711 5,790
39 3,830 4,374 4,703 4,940 5,124 5,275 5,403 5,513 5,611 5,698 5,776
40 3,825 4,367 4,695 4,931 5,114 5,265 5,392 5,502 5,599 5,685 5,764
50 3,787 4,316 4,634 4,863 5,040 5,185 5,308 5,414 5,507 5,590 5,665
60 3,762 4,282 4,594 4,818 4,991 5,133 5,253 5,356 5,447 5,528 5,601
70 3,745 4,258 4,566 4,786 4,957 5,096 5,214 5,315 5,404 5,483 5,555
80 3,732 4,241 4,545 4,763 4,931 5,069 5,185 5,284 5,372 5,451 5,521
90 3,722 4,227 4,529 4,745 4,911 5,048 5,162 5,261 5,348 5,425 5,495
100 3,714 4,216 4,516 4,730 4,896 5,031 5,144 5,242 5,328 5,405 5,474
2 Valores gerados com a função ptukey do R
MULTIPLE RANGE TEST 677
t- o ~OeO"
m
t- bO
0) N
ca
t-
t- cO O ca 0o
0) 00
-4 oO
00
t-
" M CS ca
o
~Oeoo
eo
o t-
LO
o) 00 t- t- t-
O)U de de +O
t- ks' - 00 N - O
o O
kr 00 cra C" de CS H r r Oo
00 0 e e d
oo
eO eO eO eO eOe Oe e Oe O oeOe eo eOLO LOeOO
.
0 00t_
.
~O
.
~O
.
o
.
ko
.
o
.
ko
.
.
.
.
.
.
.
.
.
.
...
. . . . .
H cO t +X co X X X X X X X X X X X X X X eO X X XXI LO
X 0
o) u0 CO de CO cra cO O r 00eO t- oO t- O LO " " eo C
O O00 ~O~Oo ko o ko . . . . . . . . . . . . . . .
u: cao) 00 M 0)Nr CS CS
N cra cra
0) oo b
00 O uO LO eo csH cra
O O00 OL LO LO k . . . . . . . . . . . . . . .
cn~~~~~~~~~~~0 t- co-4 eo 0 t-
co t_ co crO a, cO Co t- U o o _I oo c) +N
D~~~~~~~~~~~t
O. b O m t- 0)
cr t- O O 00 oo cra LO
Ce cra cra C 00 t- cIO
~~~~~~-
? Hb oU: O 0
O
X Xt- t- tO ) +O o 00 -4 k O 0 . ).
; P
cl ~~~~~~~o)
cra 00 -4 m
00
cr Cl t- d Cl O ca oo t- CO LO LO d" de (
MOCDb
_s
t <o
P tb~~~~~t-
t~~~~~~~~~~~~~~o
-
m O
b X O X
m
+ t- t-
+"
ksl
N C) 0)
oo
t-
t- t-b 0)
O ko
o 0)
m cl cl
XX t-
C) 00 t- LO m
r Q H b o X o mOO
eX
+
X
+
LO o + +
X~~~~~ ~
? u:> b u:
od
C~~~~~~~~~~~O
~~~~~~~~~~~~~~~~~~~
CO X
eo
de b OcO
-4aCS t- d0
M
LO eo m 00
00
CO kO
sH CS
N eoC
S C
0)
U o
t-r
w
r
LO cra oo t-
cl t-
" ut
0C
ksl
Ob
E- oo ) LO 0 0 O ~OLO LO LO . . . . . . m m cl cl c
A M ~~~~~~~~~~~~~~~o
b C! O%
C!
M
O to
b
to
00
"
M
X
"
C) 00
" m
t- O
m m
to
m
M
m m N N N N
h p H C~~~~~~~~~O
de de mm mc M M m CX
m XM CO co CO
X M m CO CO CO
; O b b O e O 00 O O e e de de de de 4 eo eo eo eo eo eo eo~~~~C~
c c'! CS
! S
;~~~~~~~~~~~t b LO O m 0 00 C) 0 t- 0 00 0) cq 00 LO H O CI to
V Af ~~~~~~~~~t-
ksD e t- 0) 00 X
kl O cli m ) 00 0 ko cli Cl M kl t
P; O~~o
b O m00deO) O5 t- r00LO
" O 00 eO m u:
de O cr I Ct "DCr
ro
:
~~~~~~~~~~~~cra
oO
e
?O
t-
-< -O d Cb
. oO CS
eo
??
" co Cf m e de
cra
co
ci
co
c cra oo
co c
c
o co c co co
i
co
-!
co
-N c
-1
co co
! (: C! o
co co co
CD
C+ C+
M. co co coc o o c CtC CO C' Ct CO Ct Ct CO Cli Ct cl Ct CS Cli Cl
Al o
N m
C tCO+C
t- 00 Cd
(M
cra
0
i:
Ct
-4 C
N
oo
ri
CO
"
Ct t4 cri
00
O t,
oo ts
M
cO
"c
r
i oo m "
c
0C)O
O tl
8
CS * oe cra Odq C CS H H O OO O cr cr) ca cr) r) Cr)oo oo o oo
678 BIOMETRICS, DECEMBER 1960
t- " t- -4 V
8 . o X m 3 o > b S X 3 3 m m t t t to
to mm mm c co co co co
o co co co co
Oob sK t- c s t
o -4 t-
C>0 _ |t- e Cs t- qo Cs ,) 0r ca o0 sO gt" s t- oO O Q CSl
o)C oo m
ct 0)
crcs t- cl cra
0) (r o oO t- t- t- t- oO O CtO
m X DbO 0) 0 ko 00 Co .q .q . t- Co d t- O O
_ cD oo O<C Sbd S HC) C 00 00 t- o1 o1 t- 00 0 eo O Cr
cn
X ~ ~~~~~ b e
O L
O X
0X
X
00
b
o
O
LO
o b
LO
O
LO
O
k
c t;
. .
O
. .
- Wo
. .
.Dm
. .
sm
.
t-
.
tC
.
"
LO
t-
L O
tC
~o
C0
tosdqd CO CO CO CO CO CO CO OC OC OC OC O C OC CO COC
O~~~~t b 4
LO o C t- to ) t o o?) 0 Lo -4 00 ~od 4o q t- 00
! R b 4O + 0 O bO m OO O4 00 00 t- t- 00 m
0R O m 0X - O> c t- cl -4 00 00 t-b t- b O m O O
;> o) 00 C O 0 CIt- 4
Cl 4 t 0t o 0 t- t t- t- t- 0 0 cot
O~~~~~~~~~~~~~~c co co co co co co co co m m O
U ux *^ O b o 4 o oo O O 4 4 4 4 t t 00t- t- t- t- 0 O m to
0,
Effl~~~~~~0
V 0r
z _ t
cr oo H
bO 4
oHc
O m O O 4
s 4 4
s 4
Hcr
t t t
oo
t
t- t
t t
t- t-
t t
t 00 0 Cli to b
to to to t
O R m b O 4 O m O O 4 S 4 4 t t t0 0 t- t- t- t- t- t t4
c t- 00 m 1
;~~~~~0 CYO
oo
00 O 44 00 4 t- t- t- 4..
;~~~~~t 0M
10 0b
00 b
00 to
t- wOO4
t-
.
t-
tt>o
.
t-
.
t-
t-
t-
to
00
t-
0t 0
cl
...
t
..
00
X~~~~~t
r~~~~~~o c
t
0) 00
t
- "C
o t-bObo
to
s i
0
t-
ot-
d"
to
"i Cs C) 00
0
t-
to
t- t-
.
t-
.
t-
.
t- 00
c
0) O C
>
to " " m m m m m co co co co co co m m m
o c o o
CO dq CQ w
t- to m t- t- to to -4 00 to . . . t- 1- to cl 0
CO to 0Q - w tO
o l 00 00 t-
0S O 0) O w U) U) U) dq dq dq dq 0q 0q dqd q d I"!
qd q
-ICH:d! ICOICOICOCOC O C O OC OC O OC O C C OC OC
to CO
m O 0OO4 to 1 00 to "
d" q -CO H t- to to
00 m
CO 0) cl r- cl O w w b t- t- <d> bCb
P~~~~~~~~~~~~~~~~~~~'
cl co t- 00 0 0 cl
C:+no CY) to to r- 00 0)
<r
CY)~~~c
C-
cso
0? cli
MULTIPLE RANGE TEST 679
(m oo to to ko L LO LO LO LO
. mt-ot-"m-
. . . . . . . . 0(Mmwwt-
. . . . . t- t- t- O O ko "Ili "IVmcli
mmC14
00 -O O ko ll' U-)
m -4
Cl
to0-v
to .I'-mmoo t-
C)
000 (M"0t-
t- (M 10 LO
-4
ul cli0
"I' t-
00
c! c cr Ntow
10 Mt-oOm mw t- t- 10 kO 10"'114 -14 Co mcli 1-4 1-4 C) 0)
oo ec CO4
t4 t4
" t4
4 14 t4 4 4 4
4"'4
1-4 C) (M0t- tO C) t- CII000 CID -4 CII III)N (M 00 00 -4 10
C Cj --14 1-d4 -O U-) (=I (M (M CII tO0CO CII (M OM. m-O 0m10
,14 t- 0 ko"00) t- to tO ll' 10 -14 14 CY)MMCD cli 1-400m(M
. . . . . . . . . . . . . . . .
k
-4 000 V ko ko 1.14 -d4 ,II "4 14" -,14 14. t4- c CO'
co
(R cl
M10W
t- C)m"moo
-4 (M t-
-4
t-
C.0
t-0
10 10
0)
-I'MMMN
140t- -Ji (M
-4
cli 10
(M
cli
(M
10
00
(M
t-
-4 " m " ko 10 t- w m 0 N M 14 kO D t-
4 -4 -4 -4 -4 -4 -4 -4 1-4 -4 N cli 0 10 cli
1-4
680 BIOMETRICS, DECEMBER 1960
0 00 -o V 104
CO Cj t- CO cli 0 cli 00 co t- 10 t- t-
-4 0 cli t- 0- t- to 14 m t- 1.114 cli 0
m cl 00 00 00 00 00 oo t- t- t- t- t-
00 to U-) -I' 14 .I' 14 .I' -,I' -,I' .Iq .114 .114 'It 'It 'It 'It
M -t m N t- "D "It 0 14 N .t oo w) m .t w) CO 0 14
0 cli C'l 10 t- .t 0- t- U-5 14 m o) -I t- M 00
C C Ci-! o 0
. 0 oo oo oo oo oo t- t- t- -o 10 to
00
00 to to o ul)
to co 00 cli lll
0- t- w) 00 co
00 OD' ,14 14 14 14 14 14 14 14 4
M '1114 -4 10 14 CO Cj t- o 14 cl 0 Cl t- w) -o oo m Cj 0- t- C'l t-
0 CII 10 t- -4 t- 14 -4 00 -O 14 N -4 -4 ul) 0 ll, 0-
4 C t' 14 M 0. 0. 0. 00 00 00 00 00 t- 10 10 It) .14
cli . . . . . . . . . . . . .
-4 00 to to 1-t1-t1-t114
114
m "It 0 m t- -o N 00 (Z) m 111) cli 0 to 1-4 ll, 00
R o to 0 -I 0 t- m 0 00 0 ul) (Z)
't 0- m t-
cli . . . .
0-. 00. 00. 00. 00. w. t- -o -o it) it) 14
-4 00 to ul) I'll I'll I'll I'll I'll .114 .114 -14 1-t 1-t I-t' 114
14 M N t- o -14 0- -o --4 0- 00
N ll, 0 00 -4 0- -o 0
1-4 0 0 0 00 00 00
cli 14 . . . . . . - . . . . . . .
1-4 00 -o -o to ul) to to U-) U-) 14 14 14 14 14 114 114
114