Anda di halaman 1dari 103

Controle da Qualidade

Experimentos e
Análise de Variança

Amarildo da Cruz Fernandes


amarildo@ufrj.br
George E. P. Box (October 18, 1919 – March
28, 2013) wasa British mathematician and
professor of statistics at the University of
Wisconsin, and a pioneer in the areas
of quality control, time series analysis, design
of experiments and Bayesian inference. He
was the son-in-law of Sir Ronald Fisher.
Science and Statistics (1976)
Empirical Model-Building and Response
Surfaces (1987)
•Essentially, all models are wrong, but some
are useful, p. 424,
An Accidental Statistician, 2010

2
Sir Ronald Aylmer
Fisher, (Londres, 17 de
fevereiro de 1890 — Adelaide, 29 de
julho de 1962) foi estatístico, biólogo
evolutivo e geneticista. Um gênio que
criou praticamente sozinho as
fundações para a moderna ciência e o
maior dos sucessores de Darwin"

Obras; Vitral comemorativo a


•Statistical Methods for Research Workers (1925) Ronald Fisher
•The Genetical Theory of Natural Selection (1930) representando
•The design of experiments (1935) um quadrado latino
•The use of multiple measurements in taxonomic
problems (in Annals of Eugenics 7/1936)
Um quadrado latino de ordem n é
•Statistical tables for biological, agricultural and medical uma matriz n × n preenchida
research (1938, co-autor:Frank Yates) com n diferentes símbolos de tal
•The theory of inbreeding (1949) maneira que ocorrem no máximo uma
•Contributions to mathematical statistics, John Wiley, vez em cada linha ou coluna.
(1950)
•Statistical methods and statistical inference (1956)
Collected Papers of R.A. Fisher (1971-1974). Cinco
volumes. University of Adelaide.
Suporte do Livro do Montgomery
Capitulo 3.5 – Analise Variança
Capítulo 12 – Experimentos Fatorias
One-Factor ANOVA
F Test Example

You want to see if three Club 1 Club 2 Club 3


different golf clubs yield 254 234 200
different distances. You 263 218 222
randomly select five 241 235 197
measurements from trials on 237 227 206
an automated driving 251 216 204
machine for each club. At the
.05 significance level, is there
a difference in mean
distance?

Statistics for Managers Using Microsoft Excel, 4e © 2004 Prentice-Hall, Inc. Chap 10-5
One-Factor ANOVA Example:
Scatter Diagram
Distance
Club 1 Club 2 Club 3 270
254 234 200 260 •
263 218 222 ••
241 235 197
250 X1
240 •
237 227 206 • ••
251 216 204 230
• X
220
••
X2 •
210
x1  249.2 x 2  226.0 x 3  205.8
•• X3
200 ••
x  227.0 190

1 2 3
Statistics for Managers Using Microsoft Excel, 4e © 2004 Prentice-Hall, Inc. Club Chap 10-6
One-Factor ANOVA
H0 : μ1  μ2  μ3    μc
H1 : Not all μi are the same

All Means are the same:


The Null Hypothesis is True
(No Treatment Effect)

μ1  μ2  μ3
Statistics for Managers Using Microsoft Excel, 4e © 2004 Prentice-Hall, Inc. Chap 10-7
One-Factor ANOVA
(continued)
H0 : μ1  μ2  μ3    μc
H1 : Not all μi are the same
At least one mean is different:
The Null Hypothesis is NOT true
(Treatment Effect is present)

or

μ1  μ2  μ3 μ1  μ2  μ3
Statistics for Managers Using Microsoft Excel, 4e © 2004 Prentice-Hall, Inc. Chap 10-8
Partitioning the Variation

 Total variation can be split into two parts:

SST = SSA + SSW

SST = Total Sum of Squares


(Total variation)
SSA = Sum of Squares Among Groups
(Among-group variation)
SSW = Sum of Squares Within Groups
(Within-group variation)

Statistics for Managers Using Microsoft Excel, 4e © 2004 Prentice-Hall, Inc. Chap 10-9
Total Variation
(continued)

SST  ( X11  X)2  ( X12  X)2  ...  ( Xcnc  X)2


Response, X

Group 1 Group 2 Group 3

Statistics for Managers Using Microsoft Excel, 4e © 2004 Prentice-Hall, Inc. Chap 10-10
Among-Group Variation
(continued)

SSA  n1 ( x1  x )  n2 ( x 2  x )  ...  nc ( x c  x )
2 2 2

Response, X

X3
X2 X
X1

Group 1 Group 2 Group 3


Statistics for Managers Using Microsoft Excel, 4e © 2004 Prentice-Hall, Inc. Chap 10-11
Within-Group Variation
(continued)

SSW  ( x11  X1)  ( X12  X2 )  ...  ( Xcnc  Xc ) 2 2 2

Response, X

X3
X2
X1

Group 1 Group 2 Group 3


Statistics for Managers Using Microsoft Excel, 4e © 2004 Prentice-Hall, Inc. Chap 10-12
One-Way ANOVA Table

Source of SS df MS F ratio
Variation (Variance)
Among SSA MSA
SSA c-1 MSA =
Groups c - 1 F = MSW
Within SSW
SSW n-c MSW =
Groups n-c
SST =
Total n-1
SSA+SSW
c = number of groups
n = sum of the sample sizes from all groups
df = degrees of freedom

Statistics for Managers Using Microsoft Excel, 4e © 2004 Prentice-Hall, Inc. Chap 10-13
One-Factor ANOVA
F Test Statistic
H0: μ1= μ2 = … = μc
H1: At least two population means are different

 Test statistic MSA


F
MSW
MSA is mean squares among variances
MSW is mean squares within variances
 Degrees of freedom
 df1 = c – 1 (c = number of groups)
 df2 = n – c (n = sum of sample sizes from all populations)

Statistics for Managers Using Microsoft Excel, 4e © 2004 Prentice-Hall, Inc. Chap 10-14
Interpreting One-Factor ANOVA
F Statistic
 The F statistic is the ratio of the among
estimate of variance and the within estimate
of variance
 The ratio must always be positive
 df1 = c -1 will typically be small
 df2 = n - c will typically be large

Decision Rule:
 Reject H0 if F > FU,  = .05
otherwise do not
reject H0 0 Do not Reject H0
reject H0
FU
Statistics for Managers Using Microsoft Excel, 4e © 2004 Prentice-Hall, Inc. Chap 10-15
3-5 Quando pode haver mais de duas populações?
A Análise de Variância
 3-5.1 Um exemplo
Observações
Concentração de
Celulose (%) 1 2 3 4 5 6 Totais Médias

5 7 8 15 11 9 10 60 10,00
10 12 17 13 18 19 15 94 15,67
15 14 18 19 17 16 18 102 17,00
20 19 25 22 23 18 20 127 21,17

383 15,96

Tabela 3-4 Força de Resistência do Papel (psi)

Introduction to Statistical Quality Control, 5th Edition by Douglas C. Montgomery.


Copyright (c) 2005 John Wiley & Sons, Inc. 16
3-5 Quando pode haver mais de duas populações?
A Análise de Variância
 3-5.1 Um exemplo

Fig 3-14 (a) Blox Plot para os dados da Concentração


de Celulose

Introduction to Statistical Quality Control, 5th Edition by Douglas C. Montgomery.


Copyright (c) 2005 John Wiley & Sons, Inc. 17
 3-5.2 A Análise de Variância
Tratamento Observações Totais Médias
1 ...
2 ...
. . . ... . . .
. . . ... . . .
. . . ... . . .
a ...

Tabela 3-5 Dados típicos para um experimento de um fator

Introduction to Statistical Quality Control, 5th Edition by Douglas C. Montgomery.


Copyright (c) 2005 John Wiley & Sons, Inc. 18

Introduction to Statistical Quality Control, 5th Edition by Douglas C. Montgomery.


Copyright (c) 2005 John Wiley & Sons, Inc. 19

Introduction to Statistical Quality Control, 5th Edition by Douglas C. Montgomery.


Copyright (c) 2005 John Wiley & Sons, Inc. 20

Introduction to Statistical Quality Control, 5th Edition by Douglas C. Montgomery.


Copyright (c) 2005 John Wiley & Sons, Inc. 21

Introduction to Statistical Quality Control, 5th Edition by Douglas C. Montgomery.


Copyright (c) 2005 John Wiley & Sons, Inc. 22

(Dentro do Grupo)
(Entre Grupos)

Introduction to Statistical Quality Control, 5th Edition by Douglas C. Montgomery.


Copyright (c) 2005 John Wiley & Sons, Inc. 23

Introduction to Statistical Quality Control, 5th Edition by Douglas C. Montgomery.


Copyright (c) 2005 John Wiley & Sons, Inc. 24

Introduction to Statistical Quality Control, 5th Edition by Douglas C. Montgomery.


Copyright (c) 2005 John Wiley & Sons, Inc. 25

Introduction to Statistical Quality Control, 5th Edition by Douglas C. Montgomery.


Copyright (c) 2005 John Wiley & Sons, Inc. 26

Introduction to Statistical Quality Control, 5th Edition by Douglas C. Montgomery.


Copyright (c) 2005 John Wiley & Sons, Inc. 27

Introduction to Statistical Quality Control, 5th Edition by Douglas C. Montgomery.


Copyright (c) 2005 John Wiley & Sons, Inc. 28

(3-73)

Introduction to Statistical Quality Control, 5th Edition by Douglas C. Montgomery.


Copyright (c) 2005 John Wiley & Sons, Inc. 29

(3-74)

(3-75)

Introduction to Statistical Quality Control, 5th Edition by Douglas C. Montgomery.


Copyright (c) 2005 John Wiley & Sons, Inc. 30
Fonte de Soma de Graus de Média
variação quadrados Liberdade Quadrática
Tratamentos
Erro
Total

Tabela 3-6 Análise de Variância para um experimento de um fator

Introduction to Statistical Quality Control, 5th Edition by Douglas C. Montgomery.


Copyright (c) 2005 John Wiley & Sons, Inc. 31
Exemplo 3-12

Introduction to Statistical Quality Control, 5th Edition by Douglas C. Montgomery.


Copyright (c) 2005 John Wiley & Sons, Inc. 32
Exemplo 3-12

Tabela 3-7 Saída do Minitab para a Análise de Variância do Experimento da


força de resistência do papel
Introduction to Statistical Quality Control, 5th Edition by Douglas C. Montgomery.
Copyright (c) 2005 John Wiley & Sons, Inc. 33
Exemplo 3-12

Desvio das Médias

Introduction to Statistical Quality Control, 5th Edition by Douglas C. Montgomery.


Copyright (c) 2005 John Wiley & Sons, Inc. 34
Próximo passo: Comparação Múltipla de Médias

15,6 21,16

10 17

1. Calcular o desvio padrão das médias


Sx = √MQR / √nc = 1,04

2. Calcular o limite de decisão


Ld = 3 x Sx = 3x1,04 = 3,12

3. Avalir as médias (Grupos) que diferem entre sí.


5% Difere de 10%, 20% e 15%  LD> 3,12
10% Difere de 20%  LD> 3,12
15% Difere de 20%  LD> 3,12
Introduction to Statistical Quality Control, 5th Edition by Douglas C. Montgomery.
Copyright (c) 2005 John Wiley & Sons, Inc. 35
3-5.3 Verificando Pressupostos: Análise dos
Resíduos

Concentração de
Resíduos
Madeira de Lei
5% -3,00 -2,00 5,00 1,00 1,00 0,00
10% -3,37 1,33 -2,67 2,33 -1,33 0,67
15% -3,00 1,00 2,00 0,00 -1,00 1,00
20% -2,17 3,83 0,83 1,83 -3,17 -1,17

Tabela 3-8 Resíduos para o experimento da concentração de


Madeira de lei

Introduction to Statistical Quality Control, 5th Edition by Douglas C. Montgomery.


Copyright (c) 2005 John Wiley & Sons, Inc. 36
3-5.3 Verificando Pressupostos: Análise dos Resíduos

Introduction to Statistical Quality Control, 5th Edition by Douglas C. Montgomery.


Copyright (c) 2005 John Wiley & Sons, Inc. 37
Introduction to Statistical Quality Control, 5th Edition by Douglas C. Montgomery.
Copyright (c) 2005 John Wiley & Sons, Inc.
1. Comparação de vários Grupos
(One-way Analysis of Variance)
Experimentos que envolvem:
1 Variável de Resposta
1 Fator Controlável a vários níveis
Objetivo:
Identificar se os valores da variável de resposta medidos nos diversos
níveis diferem entre si.

2 Tipos de Experimentos
Fatores controláveis a níveis fixos
Ex.: 5 valores de temperatura
Fatores Controláveis a níveis aleatórios
Ex.: 3 fábricas escolhidas ao acaso
EXEMPLO
Deseja investigar se a receita anual (Milhões) da empresa
efetivamente alterou-se ao longo de 5 anos, ou se os valores médios
são resultados da variação natural.

Anos 2005 2004 2003 2002 2001


15.0 13,1 12,4 10,4 13,1
15,9 14,1 11,2 13,4 10
18,4 18,2 15,9 11,5 13,9
17,2 11,1 13,4 14,2 11,1
18,6 15,5 9 12,7 13,6
18,7 12,2 10,3 13,8 12,4
16 12,3 10 12,6 11,2
17,1 13 13,2 11,4 12,3
21,5 15,5 11 16,1 13,4
14,2 14,3 13,8 13,7 15,9
18,4 15,9 12,4 9,2 9,1
15,1 15,6 13,4 10,6 10,2
Totais 206,1 170,8 146 149,6 146.20 T..= 818.7
N° Obs. 12 12 12 12 12 N = 60
Médias 17,18 14,23 12,17 12,47 12,18 X.. = 13.65
Exemplo (níveis aleatórios)

Um pesquisador deseja investigar se a permeabilidade das lentes de


uso flexível fabricadas em sua indústria permanece uniforme ou não.
Escolhe-se aleatoriamente três lotes de produção e realizam-se
ensaios:
Disposição dos Dados
A Análise de Variância (ANOVA)

• Formulação matemática do problema:

Modelo Estatístico:

xij =  + j + ij

onde: Suposição
i – nível; ij  N(0,2)
j – observação;
 – média geral;
j – efeito do grupo j;
ij – erro aleatório.
Análise de Variância (ANOVA)

• Hipoteses:
– H0: não há diferenças significativas entre os grupos (1=2=3=k=0);
– H1: há diferenças significativas entre os grupos.

• Decomposição dos resíduos:

(Indivíduo-Media Global)=(Media Grupo - Média Global) + (Indivíduo-Média Grupo)

• (xij - x..) = (x.j - x..) + (xij - x.j)

elevando ao quadrado e somando

(xij - x..)2 = n(x.j - x..)2 + (xij - x.j)2

SQT = SQG + SQR

• Graus de Liberdade:
(N - 1) = (K - 1) + (N - K)
A Análise de Variância (ANOVA)

• Médias Quadradas:
– MQG = SQG / (K - 1)
– MQR = SQR / (N - K)

Para testar a Hipótese do efeito dos grupos divide-se a média


quadrática do Grupo pela média quadrática do erro. Esta
divisão segue uma distribuição F GDL (k-1;N-k). Rejeitamos a
Hipótese nula se o valor F Calculado exceder o Valor F
tabelado em função do nível de significância.

Resumindo
Comparar F calculado com F tabelado; se o valor calculado for
maior que o valor tabelado, descartado H0, ou seja, existe
diferenças significativas entre grupos.
A Análise de Variância (ANOVA)

Fórmulas para os cálculos :


TC = T..2/N
SQT = (xij2) - TC
SQG = (T.j2/nj) - TC
SQR = SQT – SQG

TABELA ANOVA:
EXEMPLO
Deseja investigar se a receita anual da empresa efetivamente alterou-
se ao longo de 5 anos, ou se os valores médios são resultados da
variação natural, ou seja, pode-se dizer que há algum efeito dos anos
na receita?

Anos 2005 2004 2003 2002 2001


15.0 13,1 12,4 10,4 13,1
15,9 14,1 11,2 13,4 10
18,4 18,2 15,9 11,5 13,9
17,2 11,1 13,4 14,2 11,1
18,6 15,5 9 12,7 13,6
18,7 12,2 10,3 13,8 12,4
16 12,3 10 12,6 11,2 2,15295843
17,1 13 13,2 11,4 12,3
21,5 15,5 11 16,1 13,4
14,2 14,3 13,8 13,7 15,9
18,4 15,9 12,4 9,2 9,1
15,1 15,6 13,4 10,6 10,2
Totais 206,1 170,8 146 149,6 146.20 T..= 818.7
N° Obs. 12 12 12 12 12 N = 60
Médias 17,18 14,23 12,17 12,47 12,18 X.. = 13.65
EXEMPLO

Cálculos Iniciais:
TC = T..2 / N = (818,7)2 / 60 = 11.171,1
SQT = (xij2) - TC = 11.608,2 - 11.171,1 = 437,1
SQG = (T.j2/nj) - TC = [(206,1)2/12] + ... + [(146,2)2/12] - 11.171,1 =
= 222,3
SQR = SQT - SQG = 437,1 - 222,3 = 214,8

(Anos)

 Há diferenças significativas
entre grupos.
Análise de Resíduos para Teste de Suposições

(Xij- X.j)
12,17 12,18 12,47 14,23 17,18

RESI1 RESI2 RESI3 RESI4 RESI5


-2.175 -1.13333 0.233333 -2.06667 0.916667
-1.275 -0.13333 -0.96667 0.933333 -2.18333
1.225 3.966667 3.733333 -0.96667 1.716667
0.025 -3.13333 1.233333 1.733333 -1.08333
1.425 1.266667 -3.16667 0.233333 1.416667
1.525 -2.03333 -1.86667 1.333333 0.216667
-1.175 -1.93333 -2.16667 0.133333 -0.98333
-0.075 -1.23333 1.033333 -1.06667 0.116667
4.325 1.266667 -1.16667 3.633333 1.216667
-2.975 0.066667 1.633333 1.233333 3.716667
1.225 1.666667 0.233333 -3.26667 -3.08333
-2.075 1.366667 1.233333 -1.86667 -1.98333

Medias 2005 2004 2003 2002 2001


17,18 14,23 12,17 12,47 12,18 =10,4-12,47
EXEMPLO

Próximo passo: Comparação múltipla de médias


1. Calcular o desvio padrão das médias
Sx = √MQR / √nc = 1,97 / 3,46 = 0,57
onde nc = (n1 +n2 + ... + nk) / k

2. Calcular o limite de decisão


Ld = 3 x Sx = 3x0,57 = 1,71

3. Escrever as médias em ordem crescente ou decrescente e compará-las


duas a duas. A diferença será significativa se for maior que o Ld.

4. Usar barras contínuas sobre as médias que não diferem entre sí.

17,18 14,23 12,17 12,47 12,18


Gráfico de Barras das Médias Anuais

Chart of Mean( Valor )


18

16

14

12
Mean of Valor

10

0
1 2 3 4 5
Ano
Gráfico com Todos os Meses
Valores vs Meses
22

20

18

16
Valor

14

12

10

0 10 20 30 40 50 60
Meses
Série Temporal dos Valores

Serie dos Valores


22

20

18

16
Valor

14

12

10

001 001 001 002 002 003 003 004 004 005 005
2 2 2 2 2 2 2 2 2 2 2
a n/ un/ e z/ un/ e z/ un/ e z/ un/ ez/ un/ e z/
j j d j d j d j d j d
Mês/Ano
Estudo da Regressão (Ano x Valores)
Valor = 10,1 + 1,17 Ano
Regressão Valor vs Ano
22

20

18

16
Valor

14

12

10

1 2 3 4 5
Ano
Estudo da Regressão (Ano x Valores)

The regression equation is


Valor = 10,1 + 1,17 Ano

Predictor Coef SE Coef T P


Constant 10,1200 0,6549 15,45 0,000
Ano 1,1750 0,1975 5,95 0,000

S = 2,16307 R-Sq = 37,9% R-Sq(adj) = 36,8%

Analysis of Variance

Source DF SS MS F P
Regression 1 165,67 165,67 35,41 0,000
Residual Error 58 271,37 4,68
Total 59 437,05
(Valor – Média Grupo)
Estudo da Regressão (Valores x Mêses)
Regressão dos Valores vs Meses
22
Valor = 10,8 + 0,0937 Meses
20

18

16
Valor

14

12

10

0 10 20 30 40 50 60
Meses
Projetos Fatoriais com
Dois Fatores
Os Experimentos Fatoriais de Dois Fatores
(Two-way Anova)
•Os experimentos fatoriais mais simples envolvem dois fatores;
•Fator A com “a” níveis e Fator B com “b” níveis.
•Cada repetição completa do experimento envolve “ab” ensaios.

1 2 ... b

1 Y111, Y112 Y121, Y122 ... Y1b1, Y1b2


, Y11n , Y11n , Y1bn
2 Y211, Y212 Y221, Y222 :
, Y21n , Y22n :
Fator A
: : : :

: : : :

a Ya11, Ya12 ... ... Yab1, Yab2


, Ya1n , Yabn
Two-Way ANOVA
Sources of Variation
(continued)

SST = SSA + SSB + SSAB + SSE Degrees of


Freedom:
SSA r–1
Factor A Variation

SST SSB c–1


Factor B Variation
Total Variation
SSAB
Variation due to interaction (r – 1)(c – 1)
between A and B
n-1
SSE rc(n’ – 1)
Random variation (Error)
Statistics for Managers Using Chap 10-60
Microsoft Excel, 4e © 2004
Prentice-Hall, Inc.
Two Factor ANOVA Equations

Total Variation: r c n
SST   ( Xijk  X) 2

i1 j1 k 1

Factor A Variation: r
SSA  cn  ( Xi..  X)
 2

i1

Factor B Variation: c
SSB  rn ( X. j.  X)2
j1
Statistics for Managers Using Chap 10-61
Microsoft Excel, 4e © 2004
Prentice-Hall, Inc.
Two Factor ANOVA Equations
(continued)

Interaction Variation:
r c
SSAB  n ( Xij.  Xi..  X. j.  X)2
i1 j1

Sum of Squares Error:


r c n
SSE   ( Xijk  Xij. ) 2

i1 j1 k 1

Statistics for Managers Using Chap 10-62


Microsoft Excel, 4e © 2004
Prentice-Hall, Inc.
Two Factor ANOVA Equations
(continued)
r c n

where:  X
i1 j1 k 1
ijk

X  Grand Mean
c n
rcn
 X
j1 k 1
ijk

Xi..   Mean of ith level of factor A (i  1, 2, ..., r)


cn
r n

 X ijk
X. j.  i1 k 1
 Mean of jth level of factor B (j  1, 2, ..., c)
rn
n
Xijk
Xij.  
r = number of levels of factor A
 Mean of cell ij
k 1 n
c = number of levels of factor B
Statistics for Managers Using Chap 10-63 n’ = number of replications in each cell
Microsoft Excel, 4e © 2004
Prentice-Hall, Inc.
Mean Square Calculations

SSA
MSA  Mean square factor A 
r 1

SSB
MSB  Mean square factor B 
c 1

SSAB
MSAB  Mean square interaction 
(r  1)(c  1)

SSE
MSE  Mean square error 
rc(n'1)
Statistics for Managers Using Chap 10-64
Microsoft Excel, 4e © 2004
Prentice-Hall, Inc.
Two-Way ANOVA:
The F Test Statistic

F Test for Factor A Effect


H0: μ1.. = μ2.. = μ3.. = • • •
MSA Reject H0
H1: Not all μi.. are equal F
MSE if F > FU

F Test for Factor B Effect


H0: μ.1. = μ.2. = μ.3. = • • •
MSB Reject H0
H1: Not all μ.j. are equal F
MSE if F > FU

F Test for Interaction Effect


H0: the interaction of A and B is
equal to zero
MSAB
H1: interaction of A and B is not F Reject H0
MSE if F > FU
zero Using
Statistics for Managers Chap 10-65
Microsoft Excel, 4e © 2004
Prentice-Hall, Inc.
Two-Way ANOVA
Summary Table
Source of Sum of Degrees of Mean F
Variation Squares Freedom Squares Statistic

MSA MSA
Factor A SSA r–1
= SSA /(r – 1) MSE
MSB MSB
Factor B SSB c–1
= SSB /(c – 1) MSE

AB MSAB MSAB
SSAB (r – 1)(c – 1)
(Interaction) = SSAB / (r – 1)(c – 1) MSE

MSE =
Error SSE rc(n’ – 1)
SSE/rc(n’ – 1)
Total SST n–1

Statistics for Managers Using Chap 10-66


Microsoft Excel, 4e © 2004
Prentice-Hall, Inc.
Features of Two-Way ANOVA
F Test
• Degrees of freedom always add up

– n-1 = rc(n’-1) + (r-1) + (c-1) + (r-1)(c-1)


– Total = error + factor A + factor B +
interaction
• The denominator of the F Test is always the same but the
numerator is different
• The sums of squares always add up

– SST = SSE + SSA + SSB + SSAB


– Total = error + factor A + factor B +
interaction
Statistics for Managers Using Chap 10-67
Microsoft Excel, 4e © 2004
Prentice-Hall, Inc.
Examples:
Interaction vs. No Interaction
 Interaction is
 No interaction:
present:

Factor B Level 1
Mean Response

Mean Response
Factor B Level 1
Factor B Level 3

Factor B Level 2
Factor B Level 2
Factor B Level 3

Factor A Levels Factor A Levels

Statistics for Managers Using Microsoft Excel, 4e © 2004 Prentice-Hall, Inc. Chap 10-68
Projetos Fatoriais com Dois Fatores
Sem Interação
• Muitos experimentos envolvem o estudo de dois ou mais fatores.
• Se todas as combinações de níveis dos fatores são investigadas,
então temos um projeto fatorial.
• Por exemplo, sejam os dados da tabela a seguir:

Resposta
60
50
40
30
20
10
0
A1 A2
B1 B2
Projetos Fatoriais com Dois Fatores
Com Interação
Em alguns experimentos a diferença na resposta observada quando se
modifica os níveis de um dos fatores irá depender do nível do outro
fator. Por exemplo:

Resposta
60
50
40
30
20
10
0
A1 A2
B1 B2
Modelo Estatístico

Modelo Estatístico:

yijk =  + i + j + ()ij + ijk


onde:
i – 1, a;
j – 1, b;
k – 1, n;
 – média geral;
i – efeito do i-ésimo nível de A;
j – efeito do j-ésimo nível de B;
ij – efeito da interação AB;
ij – erro aleatório.
Modelo Estatístico

• Suposições
ijk  N(0,)

• Hipoteses:

– Para o Fator A:
• H0: i = 0;
• H1: i  0 para algum i.
– Para o Fator B:
• H0: j = 0;
• H1: j  0 para algum j.
– Para a interação AB:
• H0: ij = 0;
• H1: ij  0 para algum ij.
Formulário para os Cálculos da Significância
de A, B, AB

• TC = (T...)²
abn
Verificação:
• SQA = (Ti..)² - TC
SQT = SQA + SQB + SQAB +SQR
bn
• SQB = (T.j.)² - TC
an
• SQAB = (Tij.)² - TC - SQA - SQB
n
• SQR = (yijk)² - (Ti..)²
n
• SQT = (yijk)² - TC
Análise de Variância para Projetos
Cruzados de 2 Fatores

Fonte SQ GDL MQ Teste F

A SQA a-1 MQA MQA / MQR

B SQB b-1 MQB MQB / MQR

AB SQAB (a - 1)(b - 1) MQAB MQAB / MQR

Erro SQR ab(n - 1) MQR

Total SQT abn - 1


Análise de Variância para Projetos
Cruzados de 2 Fatores
Observações importantes:
• O valor esperado da MQR é igual a variância: E(MQR) = 2
• Se um fator ou interação não é significativo, o valor esperado de
sua MQ é igual ao valor esperado MQR.
• Se um fator ou interação é significativo, o valor esperando de MQ
será maior que o valor esperado da MQR.

Se F calculado > F tabelado  Efeito correspondente é significativo


Exemplo

Suspeita-se que a máxima voltagem de saída de um tipo de bateria é


afetada pelo material usado nas placas e pela temperatura. Quatro
repetições completas de um experimento fatorial completo foram
rodadas em laboratório e os seguintes dados foram obtidos:
Material Temperatura (B) Ti..

(A) 50 65 80

130 155 539 34 40 229 20 70 230 998


1
74 180 80 75 82 58
150 188 623 151 137 539 50 100 293 1455
2
159 126 121 130 83 60
138 110 576 174 120 583 96 104 1501
3
168 160 150 139 82 60 342
T.j. 1738 1351 835 3954
Análise de Variância
Exemplo
Fonte SQ GDL MQ Teste F
•O efeito do
Pressão (A) 12888 2 6444 9,3
Material é
Temperatura (B) 31892 2 15946 23,1
significativo;
AB 8187 4 2047 3,0

Erro 18644 27 691


•O efeito da
Total 71611 35 Temperatura é
significativo;

180
160 •O efeito da
Pressão 1
Rendimento

140
120 Pressão 2
interação é
100
80 Pressão 3
significativo.
60
40
20
0
50 65 80

Temperatura
Comparação Múltipla de Médias (CMM)

• Se há efeitos significativos, em geral procede-se a uma CMM.


• Como a interação é significativa, as comparações devem ser feitas
fixando-se o nível de um dos fatores.
• Por exemplo, podemos investigar se há DS entre as médias
obtidas com os três tipos de materiais para a Temperatura de 65°C.

• Médias em ordem crescente:

y12 = 57,25 (material 1)


y22 = 134,75 (material 2)
y32 = 145,75 (material 2)

• Desvio padrão das médias


– Sx = √MQR = 26,2 = 13,1
√n 2
Comparação Múltipla de Médias (CMM)

• Limites de decisão
– Ld = 3 Sx = 39,3
• Comparação duas a duas:

y32 - y22 = 145,75 - 134,75 = 11,0 DNS


y32 - y12 = 145,75 - 57,25 = 88,5 DS
y22 - y12 = 134,75 - 57,25 = 77,5 DS

• Teste das Suposições do Modelo? (Análise de Resíduos)

ijk  N(0,)
Observação Importante

•Experimento sem Repetição

–Lembrando, o número de GDL do termo de erro vem dado por: ab(n – 1)


–Se não há repetições do experimento, isto é, se n = 1, não sobram GDL
para calcular de modo independente a MQR.

•Tabela Anova

Fonte de Variação Soma de GDL Médias Quadradas Teste F


Quadrados
A SQA (a - 1) MQA MQA / MQAB
B SQB (b - 1) MQB MQB / MQAB
Erro (AB) SQAB (a - 1)(b - 1) MQAB

Total SQT abn - 1


Exemplo

Um pesquisador acredita que a resistência à tração de certos corpos de prova de


argamassa depende da % de microssílica utilizada na sua fabricação e do operador
que confecciona os CPs. Os dados revelaram:
% Microssílica

Operador 0 5 10 15 20 Totais
1 4 5 6 5 3 23
2 1 3 4 3 2 13
3 1 1 3 2 1 8
Totais 6 9 13 10 6 44

Análise de Variância: Fonte de Soma de GDL Médias Teste F


Variação Quadrados Quadradas
Operador 23,33 2 11,66 46,66
F tab:
% microssílica 11,60 4 2,90 11,60
- Operador: 4,45 Erro 2,00 8 0,25
- % microssílica: 3,83 Total 36,93 14
Exercite usando o Minitab

3.1) A resistência à tração de um produto de papel (Y) parece estar relacionada à % de


madeira escura (A) presente na polpa e à Temperatura (B) dos rolos de manufatura.
Dados experimentais revelaram:
Temperatura dos Rolos (B)

% de Madeira
0 5 10 15 Totais
Escura
5% 14 13 23 27 32 33 34 38

10% 31 28 38 39 43 40 41 39

Totais 514

Pergunta-se:
a) Qual a variável de resposta?
b) Quais os fatores controláveis e Qual o número de níveis dos fatores controláveis?
c) Faça a análise de variância e indique quais os efeitos significativos?
d) Faça um gráfico de dois fatores
e) O que fazer para assegurar a qualidade? (Resistência maior-é-melhor). O que fazer para
assegurar economia? (Supor que um aumento na % de madeira escura ou na
temperatura dos rolos implica maior custo)
Generalização dos Projetos
Fatoriais
(Multi-factor Anova)
Generalização dos Projetos Fatoriais

• Os resultados do Projeto Fatorial de dois fatores podem ser


estendidos para o caso onde há vários fatores.

-Fator A, a níveis
-Fator B, b níveis
-Fator C, c níveis
:
-n observações por parcela

• O número total de observações é: N = a x b x c x ... x n


Generalização dos Projetos Fatoriais

• Por exemplo, seja um projeto fatorial com três fatores:


• Modelo Estatístico:

yijkl =  + i + j + k + ()ij + ()ik + ()jk + ()ijk + ijk


onde:
i – 1, a;
j – 1, b;
k – 1, c
l – 1,n
 – média geral;
i – efeito do i-ésimo nível de A;
j – efeito do j-ésimo nível de B;
ij – efeito da interação AB;
:
ij – erro aleatório.
Generalização dos Projetos Fatoriais

• Suposições
ijkl  N(0,)
• Hipoteses:
• Para o Fator A:
– H0: i = 0;
– H1: i  0 para algum i.
:
• Para o Fator AB:
– H0: ij = 0;
– H1: ij  0 para algum ij.
:
• Para a interação ABC:
– H0: ijk = 0;
– H1: ijk  0 para algum ij.
Formulário para os Cálculos da Significância
de A, B, AB.......
 TC = (T...)2  SQAC = (Ti.k.)² - TC - SQA - SQC
abcn bn
 SQA = (Ti...)² - TC  SQBC = (T.jk.)² - TC - SQB - SQC
bcn an
 SQB = (T.j..)² - TC  SQR = (yijkl)² - (Tijk.)²
acn n
 SQC = (T..k.)² - TC  SQT = (yijkl)2 - TC
abn
 SQAB = (Tij.)² - TC - SQA - SQB
cn
 SQABC = (Tijk.)² - TC - SQA - SQB - SQC - SQAB - SQAC - SQBC
n

Verificação:
SQT = SQA + SQB + SQAB + ... + SQR
Análise de Variância para Projetos
Cruzados de 2 Fatores
Fonte SQ GDL MQ Teste F
A SQA a-1 MQA MQA / MQR

B SQB b-1 MQB MQB / MQR

C SQC c-1 MQC MQC / MQR

AB SQAB (a - 1)(b - 1) MQAB MQAB / MQR

AC SQAC (a - 1)(c - 1) MQAC MQAC / MQR

BC SQBC (b - 1)(c - 1) MQBC MQBC / MQR

ABC SQABC (a - 1)(b - 1)(c - 1) MQABC MQABC / MQR

Erro SQR Abc(n - 1) MQR

Total SQT Abcn - 1

Se F calculado > F tabelado  Efeito correspondente é significativo


Análise de Variância para Projetos
Cruzados de 2 Fatores
• Observações importantes:
• O valor esperado da MQR é igual a variância: E(MQR) = 2
• Se um fator ou interação não é significativo, o valor esperado de
sua MQ é igual ao valor esperado MQR.
• Se não houver repetições (n = 1) uma possibilidade é usar a MQ da
interação ABC como estimativa da MQR.
Exemplo
Um fabricante de refrigerantes está estudando
o efeito da % de carbonatação (A), pressão de
enchimento (B) e velocidade da linha (C) sobre
o volume do refrigerante. Os dados revelaram:

Pressão de Enchimento (B)

25 psi 30 psi

% Velocidade (C) Velocidade (C)

Carbonatação(A) 100 120 100 120 Ti..


10 -1 0 -3 -1 1 1 -1 0

(-1) (-4) (2) (-1) -4


12 2 1 0 1 6 5 2 3

(3) (1) (11) (5) 20


14 7 6 5 4 10 11 7 9

(13) (9) (21) (16) 59


T.j.. 21 54

T..k. T..1. = 49 : T..2. = 26 T.... = 75


Exemplo

•TC = 752 = 234,375


abcn
•SQA = (-4)2 + (20)2 + (59)2 - TC = 252,750
8
:
•SQAB = (-5)2 + (4)2 + ... + (37)2 - TC - SQA - SQB = 5,250
4
:
•SQABC = (-1)2 + (3)2 +...+ (16)2 - TC - SQA - SQB - SQC - SQAB - SQAC - SQBC
2
•SQABC = 1,083
Exemplo

Tabela Anova com Todos os Efeitos possíveis

Fonte SQ GDL MQ F calc. F tab.


A 252,75 2 126,38 178,4* 3,89

B 45,38 1 45,38 64,1* 4,75

C 22,04 1 22,04 31,1*

AB 5,25 2 2,63 3,7(*)

AC 0,58 2 0,29 0,4

BC 1,04 1 1,04 1,5

ABC 1,08 2 0,54 0,8

Erro 8,50 12 0,71

Total 336,63 23
Tabela Anova com Todos os Efeitos possíveis

Source DF Seq SS Adj SS Adj MS F P


A 2 252,75 252,75 126,375 178,41 0
B 1 45,375 45,375 45,375 64,06 0
C 1 22,042 22,042 22,042 31,12 0
A*B 2 5,25 5,25 2,625 3,71 0,056
A*C 2 0,583 0,583 0,292 0,41 0,671
B*C 1 1,042 1,042 1,042 1,47 0,249
A*B*C 2 1,083 1,083 0,542 0,76 0,487
Error 12 8,5 8,5 0,708
Total 23 336,625
• S = 0,841625 R-Sq = 97,47% R-Sq(adj) = 95,16%
Resíduos com Todos os Efeitos possíveis

Residual Plots for Resposta


Normal Probability Plot Versus Fits
99
1,0
90
0,5

Residual
Percent

50 0,0

-0,5
10
-1,0
1
-1 0 1 0 3 6 9 12
Residual Fitted Value

Histogram Versus Order


1,0
8
0,5
Frequency

6
Residual 0,0
4
-0,5
2
-1,0
0
-1,0 -0,5 0,0 0,5 1,0 2 4 6 8 10 12 14 16 18 20 22 24
Residual Observation Order
Tabela Anova somente com
Efeitos mais Significativos

Source DF Seq SS Adj SS Adj MS F P


A 2 252,75 252,75 126,375 191,68 0
B 1 45,375 45,375 45,375 68,82 0
C 1 22,042 22,042 22,042 33,43 0
A*B 2 5,25 5,25 2,625 3,98 0,038
Error 17 11,208 11,208 0,659
Total 23 336,625

S = 0,811981 R-Sq = 96,67% R-Sq(adj) = 95,50%


Resíduos com os Efeitos mais Significativos
Residual Plots for Resposta
Normal Probability Plot Versus Fits
99
1,0
90
0,5

Residual
Percent

50 0,0
-0,5
10
-1,0
1
-2 -1 0 1 2 0 3 6 9 12
Residual Fitted Value

Histogram Versus Order


4
1,0
3 0,5
Frequency

Residual
2 0,0

-0,5
1
-1,0
0
-1,2 -0,6 0,0 0,6 1,2 2 4 6 8 10 12 14 16 18 20 22 24
Residual Observation Order
Efeitos Principais
Main Effects Plot for Resposta
Data Means

A B
8

4
2

0
Mean

1 2 3 1 2
C
8

6
4

1 2
Gráficos de Interação Full
Interaction Plot for Resposta
Data Means
1 2
10
A
1
5 2
A 3

0
10
B
1
5 2
B

0
10
C
1
5 2
C

1 2 3 1 2
Interação AxB
Interaction Plot for Resposta
Data Means
10 A
1
2
8 3

6
Mean

1 2
B
Regression Equation

Resposta = -2,625 + 2,25 A + 0,5 B - 1,91667 C + 1,125 A*B

Coefficients

Term Coef SE Coef T P


Constant -2,625 1,66924 -1,57257 0,132
A 2,25 0,72736 3,09337 0,006
B 0,5 0,99377 0,50314 0,621
C -1,91667 0,37561 -5,10283 0
A*B 1,125 0,46002 2,44552 0,024
Summary of Model

S = 0,920050 R-Sq = 95,22% R-Sq(adj) = 94,22%


PRESS = 25,1665 R-Sq(pred) = 92,52%
Exemplo (níveis aleatórios)
Um pesquisador deseja investigar se a permeabilidade das lentes de
uso flexível fabricadas em sua indústria permanece uniforme ou não.
Escolhe-se aleatoriamente três lotes de produção e realizam-se
ensaios:

Lotes Lote 1 Lote 2 Lote 3


61 62 60
62 61 63
64 58 59
62 58 64
63 60 62
63 59
60 T..= 1099
Totais 375 416 308
N° Obs. 6 7 5 N=18
Médias 62.5 59.43 61.6 x.. = 61.06
Exemplo (níveis aleatórios)

Cálculos Iniciais:
TC = T..² / N = (1099)² / 18 = 67.100,06
SQT = (xij²) - TC = 67.163,00 - 67.100,06 = 62,64
SQG = (T.j²/nj) - TC = [(375)2/6] + ... + [(308)2/5] - 67.100,06 = 32,53
SQR = SQT - SQG = 62,94 - 32,53 = 30,41

 Há diferenças significativas
entre grupos.
Exemplo (níveis aleatórios)

Próximo passo: Estimar componentes de variação

E [MQR] = 2
E [MQG] = 2 + nc(2) ____ (2) = (E [MQG] - 2)/nc

Assim as estimativas são:


2 = MQR = 2,03
2 = (MQG - MQR)/nc = (16,26-2,03)/6=2,37
T2 = 2 + 2 = 4,40

De forma que 2,37 / 4,40 = 54% da variabilidade total observada nos


valores de permeabilidade das lentes deve-se a diferenças “entre
lotes”.

Anda mungkin juga menyukai