Experimentos e
Análise de Variança
2
Sir Ronald Aylmer
Fisher, (Londres, 17 de
fevereiro de 1890 — Adelaide, 29 de
julho de 1962) foi estatístico, biólogo
evolutivo e geneticista. Um gênio que
criou praticamente sozinho as
fundações para a moderna ciência e o
maior dos sucessores de Darwin"
Statistics for Managers Using Microsoft Excel, 4e © 2004 Prentice-Hall, Inc. Chap 10-5
One-Factor ANOVA Example:
Scatter Diagram
Distance
Club 1 Club 2 Club 3 270
254 234 200 260 •
263 218 222 ••
241 235 197
250 X1
240 •
237 227 206 • ••
251 216 204 230
• X
220
••
X2 •
210
x1 249.2 x 2 226.0 x 3 205.8
•• X3
200 ••
x 227.0 190
1 2 3
Statistics for Managers Using Microsoft Excel, 4e © 2004 Prentice-Hall, Inc. Club Chap 10-6
One-Factor ANOVA
H0 : μ1 μ2 μ3 μc
H1 : Not all μi are the same
μ1 μ2 μ3
Statistics for Managers Using Microsoft Excel, 4e © 2004 Prentice-Hall, Inc. Chap 10-7
One-Factor ANOVA
(continued)
H0 : μ1 μ2 μ3 μc
H1 : Not all μi are the same
At least one mean is different:
The Null Hypothesis is NOT true
(Treatment Effect is present)
or
μ1 μ2 μ3 μ1 μ2 μ3
Statistics for Managers Using Microsoft Excel, 4e © 2004 Prentice-Hall, Inc. Chap 10-8
Partitioning the Variation
Statistics for Managers Using Microsoft Excel, 4e © 2004 Prentice-Hall, Inc. Chap 10-9
Total Variation
(continued)
Statistics for Managers Using Microsoft Excel, 4e © 2004 Prentice-Hall, Inc. Chap 10-10
Among-Group Variation
(continued)
SSA n1 ( x1 x ) n2 ( x 2 x ) ... nc ( x c x )
2 2 2
Response, X
X3
X2 X
X1
Response, X
X3
X2
X1
Source of SS df MS F ratio
Variation (Variance)
Among SSA MSA
SSA c-1 MSA =
Groups c - 1 F = MSW
Within SSW
SSW n-c MSW =
Groups n-c
SST =
Total n-1
SSA+SSW
c = number of groups
n = sum of the sample sizes from all groups
df = degrees of freedom
Statistics for Managers Using Microsoft Excel, 4e © 2004 Prentice-Hall, Inc. Chap 10-13
One-Factor ANOVA
F Test Statistic
H0: μ1= μ2 = … = μc
H1: At least two population means are different
Statistics for Managers Using Microsoft Excel, 4e © 2004 Prentice-Hall, Inc. Chap 10-14
Interpreting One-Factor ANOVA
F Statistic
The F statistic is the ratio of the among
estimate of variance and the within estimate
of variance
The ratio must always be positive
df1 = c -1 will typically be small
df2 = n - c will typically be large
Decision Rule:
Reject H0 if F > FU, = .05
otherwise do not
reject H0 0 Do not Reject H0
reject H0
FU
Statistics for Managers Using Microsoft Excel, 4e © 2004 Prentice-Hall, Inc. Chap 10-15
3-5 Quando pode haver mais de duas populações?
A Análise de Variância
3-5.1 Um exemplo
Observações
Concentração de
Celulose (%) 1 2 3 4 5 6 Totais Médias
5 7 8 15 11 9 10 60 10,00
10 12 17 13 18 19 15 94 15,67
15 14 18 19 17 16 18 102 17,00
20 19 25 22 23 18 20 127 21,17
383 15,96
(Dentro do Grupo)
(Entre Grupos)
(3-73)
(3-75)
15,6 21,16
10 17
Concentração de
Resíduos
Madeira de Lei
5% -3,00 -2,00 5,00 1,00 1,00 0,00
10% -3,37 1,33 -2,67 2,33 -1,33 0,67
15% -3,00 1,00 2,00 0,00 -1,00 1,00
20% -2,17 3,83 0,83 1,83 -3,17 -1,17
2 Tipos de Experimentos
Fatores controláveis a níveis fixos
Ex.: 5 valores de temperatura
Fatores Controláveis a níveis aleatórios
Ex.: 3 fábricas escolhidas ao acaso
EXEMPLO
Deseja investigar se a receita anual (Milhões) da empresa
efetivamente alterou-se ao longo de 5 anos, ou se os valores médios
são resultados da variação natural.
Modelo Estatístico:
xij = + j + ij
onde: Suposição
i – nível; ij N(0,2)
j – observação;
– média geral;
j – efeito do grupo j;
ij – erro aleatório.
Análise de Variância (ANOVA)
• Hipoteses:
– H0: não há diferenças significativas entre os grupos (1=2=3=k=0);
– H1: há diferenças significativas entre os grupos.
• Graus de Liberdade:
(N - 1) = (K - 1) + (N - K)
A Análise de Variância (ANOVA)
• Médias Quadradas:
– MQG = SQG / (K - 1)
– MQR = SQR / (N - K)
Resumindo
Comparar F calculado com F tabelado; se o valor calculado for
maior que o valor tabelado, descartado H0, ou seja, existe
diferenças significativas entre grupos.
A Análise de Variância (ANOVA)
TABELA ANOVA:
EXEMPLO
Deseja investigar se a receita anual da empresa efetivamente alterou-
se ao longo de 5 anos, ou se os valores médios são resultados da
variação natural, ou seja, pode-se dizer que há algum efeito dos anos
na receita?
Cálculos Iniciais:
TC = T..2 / N = (818,7)2 / 60 = 11.171,1
SQT = (xij2) - TC = 11.608,2 - 11.171,1 = 437,1
SQG = (T.j2/nj) - TC = [(206,1)2/12] + ... + [(146,2)2/12] - 11.171,1 =
= 222,3
SQR = SQT - SQG = 437,1 - 222,3 = 214,8
(Anos)
Há diferenças significativas
entre grupos.
Análise de Resíduos para Teste de Suposições
(Xij- X.j)
12,17 12,18 12,47 14,23 17,18
4. Usar barras contínuas sobre as médias que não diferem entre sí.
16
14
12
Mean of Valor
10
0
1 2 3 4 5
Ano
Gráfico com Todos os Meses
Valores vs Meses
22
20
18
16
Valor
14
12
10
0 10 20 30 40 50 60
Meses
Série Temporal dos Valores
20
18
16
Valor
14
12
10
001 001 001 002 002 003 003 004 004 005 005
2 2 2 2 2 2 2 2 2 2 2
a n/ un/ e z/ un/ e z/ un/ e z/ un/ ez/ un/ e z/
j j d j d j d j d j d
Mês/Ano
Estudo da Regressão (Ano x Valores)
Valor = 10,1 + 1,17 Ano
Regressão Valor vs Ano
22
20
18
16
Valor
14
12
10
1 2 3 4 5
Ano
Estudo da Regressão (Ano x Valores)
Analysis of Variance
Source DF SS MS F P
Regression 1 165,67 165,67 35,41 0,000
Residual Error 58 271,37 4,68
Total 59 437,05
(Valor – Média Grupo)
Estudo da Regressão (Valores x Mêses)
Regressão dos Valores vs Meses
22
Valor = 10,8 + 0,0937 Meses
20
18
16
Valor
14
12
10
0 10 20 30 40 50 60
Meses
Projetos Fatoriais com
Dois Fatores
Os Experimentos Fatoriais de Dois Fatores
(Two-way Anova)
•Os experimentos fatoriais mais simples envolvem dois fatores;
•Fator A com “a” níveis e Fator B com “b” níveis.
•Cada repetição completa do experimento envolve “ab” ensaios.
1 2 ... b
: : : :
Total Variation: r c n
SST ( Xijk X) 2
i1 j1 k 1
Factor A Variation: r
SSA cn ( Xi.. X)
2
i1
Factor B Variation: c
SSB rn ( X. j. X)2
j1
Statistics for Managers Using Chap 10-61
Microsoft Excel, 4e © 2004
Prentice-Hall, Inc.
Two Factor ANOVA Equations
(continued)
Interaction Variation:
r c
SSAB n ( Xij. Xi.. X. j. X)2
i1 j1
i1 j1 k 1
where: X
i1 j1 k 1
ijk
X Grand Mean
c n
rcn
X
j1 k 1
ijk
X ijk
X. j. i1 k 1
Mean of jth level of factor B (j 1, 2, ..., c)
rn
n
Xijk
Xij.
r = number of levels of factor A
Mean of cell ij
k 1 n
c = number of levels of factor B
Statistics for Managers Using Chap 10-63 n’ = number of replications in each cell
Microsoft Excel, 4e © 2004
Prentice-Hall, Inc.
Mean Square Calculations
SSA
MSA Mean square factor A
r 1
SSB
MSB Mean square factor B
c 1
SSAB
MSAB Mean square interaction
(r 1)(c 1)
SSE
MSE Mean square error
rc(n'1)
Statistics for Managers Using Chap 10-64
Microsoft Excel, 4e © 2004
Prentice-Hall, Inc.
Two-Way ANOVA:
The F Test Statistic
MSA MSA
Factor A SSA r–1
= SSA /(r – 1) MSE
MSB MSB
Factor B SSB c–1
= SSB /(c – 1) MSE
AB MSAB MSAB
SSAB (r – 1)(c – 1)
(Interaction) = SSAB / (r – 1)(c – 1) MSE
MSE =
Error SSE rc(n’ – 1)
SSE/rc(n’ – 1)
Total SST n–1
Factor B Level 1
Mean Response
Mean Response
Factor B Level 1
Factor B Level 3
Factor B Level 2
Factor B Level 2
Factor B Level 3
Statistics for Managers Using Microsoft Excel, 4e © 2004 Prentice-Hall, Inc. Chap 10-68
Projetos Fatoriais com Dois Fatores
Sem Interação
• Muitos experimentos envolvem o estudo de dois ou mais fatores.
• Se todas as combinações de níveis dos fatores são investigadas,
então temos um projeto fatorial.
• Por exemplo, sejam os dados da tabela a seguir:
Resposta
60
50
40
30
20
10
0
A1 A2
B1 B2
Projetos Fatoriais com Dois Fatores
Com Interação
Em alguns experimentos a diferença na resposta observada quando se
modifica os níveis de um dos fatores irá depender do nível do outro
fator. Por exemplo:
Resposta
60
50
40
30
20
10
0
A1 A2
B1 B2
Modelo Estatístico
Modelo Estatístico:
• Suposições
ijk N(0,)
• Hipoteses:
– Para o Fator A:
• H0: i = 0;
• H1: i 0 para algum i.
– Para o Fator B:
• H0: j = 0;
• H1: j 0 para algum j.
– Para a interação AB:
• H0: ij = 0;
• H1: ij 0 para algum ij.
Formulário para os Cálculos da Significância
de A, B, AB
• TC = (T...)²
abn
Verificação:
• SQA = (Ti..)² - TC
SQT = SQA + SQB + SQAB +SQR
bn
• SQB = (T.j.)² - TC
an
• SQAB = (Tij.)² - TC - SQA - SQB
n
• SQR = (yijk)² - (Ti..)²
n
• SQT = (yijk)² - TC
Análise de Variância para Projetos
Cruzados de 2 Fatores
(A) 50 65 80
180
160 •O efeito da
Pressão 1
Rendimento
140
120 Pressão 2
interação é
100
80 Pressão 3
significativo.
60
40
20
0
50 65 80
Temperatura
Comparação Múltipla de Médias (CMM)
• Limites de decisão
– Ld = 3 Sx = 39,3
• Comparação duas a duas:
ijk N(0,)
Observação Importante
•Tabela Anova
Operador 0 5 10 15 20 Totais
1 4 5 6 5 3 23
2 1 3 4 3 2 13
3 1 1 3 2 1 8
Totais 6 9 13 10 6 44
% de Madeira
0 5 10 15 Totais
Escura
5% 14 13 23 27 32 33 34 38
10% 31 28 38 39 43 40 41 39
Totais 514
Pergunta-se:
a) Qual a variável de resposta?
b) Quais os fatores controláveis e Qual o número de níveis dos fatores controláveis?
c) Faça a análise de variância e indique quais os efeitos significativos?
d) Faça um gráfico de dois fatores
e) O que fazer para assegurar a qualidade? (Resistência maior-é-melhor). O que fazer para
assegurar economia? (Supor que um aumento na % de madeira escura ou na
temperatura dos rolos implica maior custo)
Generalização dos Projetos
Fatoriais
(Multi-factor Anova)
Generalização dos Projetos Fatoriais
-Fator A, a níveis
-Fator B, b níveis
-Fator C, c níveis
:
-n observações por parcela
• Suposições
ijkl N(0,)
• Hipoteses:
• Para o Fator A:
– H0: i = 0;
– H1: i 0 para algum i.
:
• Para o Fator AB:
– H0: ij = 0;
– H1: ij 0 para algum ij.
:
• Para a interação ABC:
– H0: ijk = 0;
– H1: ijk 0 para algum ij.
Formulário para os Cálculos da Significância
de A, B, AB.......
TC = (T...)2 SQAC = (Ti.k.)² - TC - SQA - SQC
abcn bn
SQA = (Ti...)² - TC SQBC = (T.jk.)² - TC - SQB - SQC
bcn an
SQB = (T.j..)² - TC SQR = (yijkl)² - (Tijk.)²
acn n
SQC = (T..k.)² - TC SQT = (yijkl)2 - TC
abn
SQAB = (Tij.)² - TC - SQA - SQB
cn
SQABC = (Tijk.)² - TC - SQA - SQB - SQC - SQAB - SQAC - SQBC
n
Verificação:
SQT = SQA + SQB + SQAB + ... + SQR
Análise de Variância para Projetos
Cruzados de 2 Fatores
Fonte SQ GDL MQ Teste F
A SQA a-1 MQA MQA / MQR
25 psi 30 psi
Total 336,63 23
Tabela Anova com Todos os Efeitos possíveis
Residual
Percent
50 0,0
-0,5
10
-1,0
1
-1 0 1 0 3 6 9 12
Residual Fitted Value
6
Residual 0,0
4
-0,5
2
-1,0
0
-1,0 -0,5 0,0 0,5 1,0 2 4 6 8 10 12 14 16 18 20 22 24
Residual Observation Order
Tabela Anova somente com
Efeitos mais Significativos
Residual
Percent
50 0,0
-0,5
10
-1,0
1
-2 -1 0 1 2 0 3 6 9 12
Residual Fitted Value
Residual
2 0,0
-0,5
1
-1,0
0
-1,2 -0,6 0,0 0,6 1,2 2 4 6 8 10 12 14 16 18 20 22 24
Residual Observation Order
Efeitos Principais
Main Effects Plot for Resposta
Data Means
A B
8
4
2
0
Mean
1 2 3 1 2
C
8
6
4
1 2
Gráficos de Interação Full
Interaction Plot for Resposta
Data Means
1 2
10
A
1
5 2
A 3
0
10
B
1
5 2
B
0
10
C
1
5 2
C
1 2 3 1 2
Interação AxB
Interaction Plot for Resposta
Data Means
10 A
1
2
8 3
6
Mean
1 2
B
Regression Equation
Coefficients
Cálculos Iniciais:
TC = T..² / N = (1099)² / 18 = 67.100,06
SQT = (xij²) - TC = 67.163,00 - 67.100,06 = 62,64
SQG = (T.j²/nj) - TC = [(375)2/6] + ... + [(308)2/5] - 67.100,06 = 32,53
SQR = SQT - SQG = 62,94 - 32,53 = 30,41
Há diferenças significativas
entre grupos.
Exemplo (níveis aleatórios)
E [MQR] = 2
E [MQG] = 2 + nc(2) ____ (2) = (E [MQG] - 2)/nc