Anlise de Varincia
Prof. Narciso Gonalves da Silva
www.pessoal.utfpr.edu.br/ngsilva
Introduo
Anlise de Varincia A anlise de varincia (Anova) utilizada para comparar mdias de trs ou mais populaes. As hipteses so: Ho: H1: pelo menos uma das mdias diferente das outras Premissas da Anova: As populaes tm a mesma varincia; As amostras so retiradas de populaes com distribuio normal; As amostras so aleatrias e independentes.
A variao entre os grupos tem o objetivo de verificar se as amostras de cada grupo so provenientes de populaes diferentes.
1) Enunciar as hipteses Ho e H1
2) Fixar o nvel de significncia 3) Determinar Fcrit na distribuio F com (k 1) graus de liberdade no numerador e (N k) graus de liberdade no denominador k = no total de grupos
N = no total de observaes
Fcrit
T = Ti
i=1
N = ni
i=1
Entre os grupos
Dentro do grupo (Resduos) Total
k1
Nk N1
SQE
SQR SQT
QME = SQE/(k 1)
QMR = SQR/(N k)
QME/QMR
Exemplo 1
A tabela abaixo apresenta o tempo (em minutos) que 4 mquinas levou para realizar um determinado servio. Supondo que os tempos das mquinas esto normalmente distribudos e que as varincias so iguais, possvel afirmar ao nvel de significncia de 5% que os tempos mdios das mquinas so significativamente diferentes?
repeties 1 2 Mquinas (Grupos) 1 25 26 2 31 25 3 22 26 4 33 29
3
4
20
23
28
27
28
25
31
34
5 No rep.
Mdia
21 115 5
23
24 135 5
27
29 130 5
26
28 155 5
31
535
20
Exemplo 1
Ho: as mdias so iguais H1: pelo menos uma das mdias diferente das demais
Tabela de xij2
repeties
1 2 3 Mquinas (Grupos) 1 625 676 400 2 961 625 784 3 484 676 784 4 1089 841 961
4
5
529
441
729
576
625
841
1156
784
2671
3675
3410
4831
14587
Exemplo 1
Quadro para Anova
Fonte de variao Entre os grupos Graus de liberdade 41=3 Soma quadrtica 163,75 112,00 275,75 Quadrado mdio QME = 54,55 QMR = 7,00
Fcalc
7,79
Com 3 graus de liberdade no numerador, 16 graus de liberdade no denominador e = 5% tem-se Fcrit = 3,24. Como Fcalc > Fcrit, rejeita Ho, ou seja, existe pelo menos um tempo mdio diferente dos demais, ao nvel de 5% de significncia.
Exemplo 2
Uma loja de departamento est interessada em saber se existe diferena entre as quantias mdias faturadas, atravs de trs formas de pagamento: dinheiro (D), cheque (C) e carto de crdito (CC). Um levantamento das vendas (em milhares de reais), em um dado perodo de tempo foi realizado com os resultados apresentados na tabela. Assumindo distribuio normal e que as varincias so iguais para os trs grupos, verifique se existem diferenas significativas entre as mdias, ao nvel de confiana de 95%.
Formas de pagamento
D
56,00
C
80,90
CC
73,25
20,50
37,37
51,29
40,95
56,65
123,21
28,64
72,65
132,47 60,32 60,00
56,50
37,29 44,65 40,64 432,19
142,51
498,58
Exemplo 2
Tabela de xij2
Forma de pagamento D
3136,00
420,25 1396,52 820,25
SQT = 14677,63 SQE = 3273,91 SQR = 11470,71 QME = 1636,96 QMR = 764,71 Fcalc= 2,14 Fcrit = 3,68 ( = 5%)
C
6544,81
2630,66 1676,90 5278,02 17548,30
CC
5365,56
3209,22 15180,70 3192,25 1390,54
3638,50
3600,00 5773,02 40917,19
1993,62
1651,61 31983,50 78673,73
Exemplo 3
Foi utilizado trs lubrificantes diferentes em mquinas para produo de peas. A tabela apresenta as perdas de massa (em miligramas) das peas por atrito para cada lubrificante. Supondo que os dados esto distribuidos normalmente e que as varincias so iguais, ao nvel de significncia de 2,5%, as diferenas entre as mdias so significativas?
A 10 13 12 10 14 8 12 13
Lubrificantes B 9 8 12 9 8 11 7 6 8 11 9 98
C 12 7 7 13 9 8 14 10 6
92
86
276
Exemplo 3
Tabela de xij2
A 100 169 144 100 196 64 144 169 1086 Lubrificantes B 81 64 144 81 64 121 49 36 64 121 81 906 C 144 49 49 169 81 64 196 100 36 888
Exemplo 4
A tabela abaixo apresenta a resistncia de ruptura realizada em amostras de duas marcas diferentes de fio dental.
Marca
A B 1
20,2 22,3
2
23,0 17,4
3
24,2 21,6
4
19,4 18,8
Resistncia (Pa) 5 6 7 8
21,4 22,2 20,8 20,6 16,4 20,4
9
18,0
10
20,8
Mdia
21,5 19,9
Considerando que os dados esto normalmente distribudos e que as varincias so iguais, podese afirmar, ao nvel de 2,5% de significncia, que a resistncia mdia do fio dental da marca A significativamente superior resistncia mdia da marca B?
So considerados, agora, dois tratamentos. Este tipo de experimentos tambm recebe o nome de delineamento de blocos aleatrios, pois as unidades experimentais so obtidas aleatoriamente para cada combinao de tratamentos
Total
A1
Nvel 2
Nvel 3
x21
x31
x22
x32
x23
x33
x2b
x3b
A2
A3
...
Nvel a Total
xa1 B1
xa2 B2
xa3 B3
xab Bb
Aa T
Onde: xij o valor esperado com o efeito do i-simo nvel do fator A e do j-simo nvel do fator B a mdia (constante) i o efeito do i-simo nvel do fator A j o efeito do j-simo nvel do fator B ij o resduo (efeito do erro aleatrio)
As hipteses so:
1) Efeito do Fator A:
Quadrado mdio
Fcalc
Fator A
Fator B Resduos Total
a1
b1 (a 1).(b 1) ab 1
SQA
SQB SQR SQT
QMA= SQA/(a 1)
QMB = SQB/(b 1) QMR = SQR/(a 1).(b 1) -
QMA/QMR
QMB/QMR
T ab
2
sendo : T = A i
i=1
1 a 2 T2 SQA = A j b j=1 ab
1 b 2 T2 SQB = Bi a i=1 ab
SQR = SQT SQA SQB
Exemplo
A tabela abaixo apresenta o nmero de peas defeituosas produzidas por quatro operrios trabalhando em trs mquinas diferentes. Faa uma anlise de varincia considerando os dois fatores (mquinas e operrios) utilizando o nvel de significncia de 5%.
Operrios B1 35 31 36 B2 38 40 35 B3 41 38 43 B4 32 31 25
Mquinas A1 A2 A3
Total
102
113
122
88
425
Exemplo
Tabela de xij2
Mquinas
A1 A2 A3 Total
a b
Operrios B1 1225 961 1296 3482 B2 1444 1600 1225 4269 B3 1681 1444 1849 4974 B4 1024 961 625 2610
Total
5374 4966 4995 15335
Exemplo
Quadro para ANOVA com dois fatores
Fonte de variao Mquinas (Fator A) Operrios (Fator B) Graus de liberdade 31=2 41=3 Soma quadrtica 7,17 214,92 Quadrado mdio 3,58 71,64 Fcalc 3,58/10,14 = 0,35 71,64/10,14 = 7,06 Fcrtico 5,14 4,76
Resduos
Total
2.3 = 6
11
60,83
282,92
10,14
-
Como Fcalc = 0,35 < Fcrit = 5,14 conclui-se que o fator mquina no influenciou ao nvel de significncia de 5% na igualdade das mdias Como Fcalc = 7,06 > Fcrit = 4,76 conclui-se que o fator operrios influenciou ao nvel de significncia de 5% na igualdade das mdias
Onde: xij o valor esperado com o efeito do i-simo nvel do fator A e do j-simo nvel do fator B a mdia (constante) i o efeito do i-simo nvel do fator A j o efeito do j-simo nvel do fator B ()ij o efeito da interao entre i e j ij o resduo (efeito do erro aleatrio)
ij = + i + j +( ) ij
xij = ij + ij
2) Efeito do Fator B:
Ho : 1 = 2 = ... = b = 0 H1 : pelo menosum j 0
3) Efeito da interao:
Nvel 1
x111
Nvel 2
x121
Nvel 3
x131
Nvel b
x1b1
Total
Nvel 1
x11r x211
x1br x2b1
A1
Nvel 2
x21r
x2br
A2
... Nvel a
Total
xa11
xa21
xa31
xab1
Aa
T
xa1r B1
xa2r B2
xa3r B3
xabr Bb
Interao Resduos
Total
(a 1).(b 1) a.b.(r 1)
a.b 1
SQI SQR
SQT
QMI/QMR -
r 1 a b 2 T2 SQI = Sij - SQA - SQB sendo: Sij = xijk r i=1 j=1 abr k=1
Exemplo
A tabela apresenta as resistncias compresso (MPa) para argamassas produzidas com dois tipos de areia e com trs consumos de cimento diferentes. Avaliar a influncia das variveis na mdia das resistncias ao nvel de significncia de 5%.
Consumo de cimento (kg/m3) A Tipo de areia - B Natural 3,62 3,69 260 3,64 Britada 4,23 4,96 4,13 4,24 4,27 1,55 1,44 1,57 1,48 1,58 1,01 1,04 1,13 1,19 1,12 34,94 40,16
3,69
3,69 1,63 1,73 1,66 1,64 1,49 0,57 0,56 0,58 0,55 0,56 29,30
220
15,77
180
8,31
64,24
Exemplo
Tabela de xij2
Consumo de cimento (kg/m3) A Tipo de areia - B Natural Britada 13,10 17,89 24,60 17,06
13,62
260 13,25 13,62 13,62 2,66 2,99 2,76 2,69 2,22 0,32 0,31 0,34 0.30 0,31 81,81
17,98
18,23 2,40 2,07 2,46 2,19 2,50 1,02 1,08 1,28 1,42 1,25 113,43
220
180
195,24
Exemplo
2 2 T 64 , 24 2 SQT = xijk = 195,24 = 57,68 abr 30 i=1 j=1k=1
2 1 a 2 T2 1 64 , 24 SQA = A j = (40,162 + 15,772 + 8,312 ) = 55,50 br j=1 abr 10 30
a b r
2 1 64 , 24 SQI = (18,332 + 21,832 + 8,152 + 7,622 + 2,822 + 5,492 ) - 55,50 - 1,06 = 0,91 5 30
Exemplo
Quadro para ANOVA
Fonte de variao Graus de liberdade Soma quadrtica Quadrado mdio Fcalc Fcrit
Fator A Fator B
Interao Resduos Total
2 1
2 24 29
55,50 1,06
0,91 0,21 57,68
3171,43 121,14
51,43 -
3,40 4,26
3,40
Logo, o tipo de areia, o consumo de cimento e a interao do tipo de areia e consumo de cimento influenciam no resultado da resistncia compresso.