Anda di halaman 1dari 24

Programa de Ps-Graduao em Engenharia Eltrica

Disciplina: Introduo ao Processo Estocstico

ANOVA:
Anlise de Varincia

APLICAO.
Prof. Hani Camille Yehia

Alunos: Augusto Filho


Clia do N. Cavalcante
Roteiro

Modelo de ANOVA

Verificao da suposio do Modelo

Simulao

Exemplo Prtico

Concluso

Bibliografia
Modelo ANOVA
yij i eij i = 1, 2, 3, ...,k
j = 1, 2, ..., n

Yij ; valor da varivel resposta na j-sima observao do i-simo tratamento.


: a a mdia geral de todos os tratamentos;
i : o efeito do i-simo tratamento;
eij: o erro aleatrio.

Pressuposies Bsicas:
As amostra so aleatrias e independentes;
As populaes tm distribuies normais;
As populaes tm a mesma varincia.
Hipteses e modelo subjacente
Sob H0: 1 = 2 =...= k = 0
yij i eij yij eij
Hipteses e modelo subjacente

Sob H1: i 0 para algum i


yij i eij
Tabela de Anlise de Varincia (ANOVA)
Tabela de Anlise de Varincia (ANOVA)

Fonte de Soma de Quadrados


gl F
Variao Quadrados Mdios

k
yi2. y..2
Tratamentos SQTRAT k-1 QM TRAT
SQTRAT
QM TRAT
i 1 ni N k 1 F
QM ERRO

SQERRO
SQERRO = SQTotal - SQTRAT QM ERRO
Erro K(n-1) k (n 1)

k n 2
y
Total SQTotal yij2 .. Kn -1
i 1 j 1 N
Simulao
Simulaes em populaes normais:

Trs populaes;

Tamanho da amostra: n=30, n=50 e n=1000;

Estrutura de Mdia
Critrio 1 - Mdias diferentes com Varincias Iguais.
Critrio 2 Mdias Iguais com Varincias Iguais;
Simulao
Simulao
Simulao
Regra de deciso: Abordagem Clssica
Rejeito Ho se: F > F (k 1; k(n - 1)
No rejeita Ho se: F F (k 1; k(n - 1)

Valor-p
Regra de deciso: Abordagem Valor-p
= nvel de significncia
(probab. tolervel de se rejeitar Ho quando esta for verdadeira)
Usual: = 5%

rejeita H0 (prova-se Valor-p


estatisticamente H1)

No rejeita H0 (os dados no


Valor-p >
mostram evidncia para afirmar
H 1)
Verificao da Adequao do Modelo
Um resduo definido como: eij yij y i

Resduo: A diferena entre uma observao e a mdia do


tratamento correspondente.

As suposies associadas ao modelo, feita atravs da analise dos resduos:


1. Os erros tem mdia zero e a mesma varincia 2;
2. Os erros so independentes, ou seja, um valor de um erro no depende
de qualquer outro erro;
3. Os erros tm distribuio normal.
Logo, os erros so iid N(0, 2).
Verificao da Adequao do Modelo

Suposio de Independncia

Grfico de Resduos vs Ordem

Suposio de Igualdade de Varincia

Grfico de Resduos vs Mdias dos Tratamentos

Suposio de Normalidade

Grfico de Probabilidade Normal


Exemplo:
Um fabricante de papel usado para fabricar sacos de papel pardo est interessado em
melhorar a resistncia do produto tenso. A engenharia de produto pensa que a resistncia
tenso seja uma funo da concentrao de madeira de lei na polpa e que a faixa pratica
de interesse das concentraes de madeira de lei esteja entre 5 e 20%. Um time de
engenheiros responsveis pelo estudo decide investigar quatro nveis de concentrao de
madeira de lei: 5%, 10%, 15% e 20%. Eles decidem fabricar seis corpos de prova, para cada
nvel de concentrao, usando uma planta piloto. Todos os 24 corpos de prova so testados,
em uma ordem aleatria, em um equipamento de teste de laboratrio. Os dados desse
experimento so:
Box-Plot
Boxplot of Madeira vs Concentracao

25

20
Madeira

15

10

5
5 10 15 20
Concentracao
Hipteses:
Continuao do teste de hipteses:
Final do teste
Anlise dos Resduos
Residual Plots for Madeira
Normal Probability Plot of the Residuals Residuals Versus the Fitted Values
99

Standardized Residual
2
90
1
Percent

50 0

10 -1

1 -2
-2 -1 0 1 2 10,0 12,5 15,0 17,5 20,0
Standardized Residual Fitted Value

Histogram of the Residuals Residuals Versus the Order of the Data


2
Standardized Residual
4,8

3,6 1
Frequency

2,4 0

1,2 -1

0,0 -2
-1,5 -1,0 -0,5 0,0 0,5 1,0 1,5 2,0 2 4 6 8 10 12 14 16 18 20 22 24
Standardized Residual Observation Order
Programa usado no Software R.
n<-30
mi1<-19
mi2<-19
mi3<-19
sd<-3
a1<-rnorm(n,mi1,sd)
a2<-rnorm(n,mi2,sd)
a3<-rnorm(n,mi3,sd)
a=c(a1,a2,a3)
n=rep(n,3) #tamanho das amostras
group=rep(1:3,n) #Cuidado aqui.
data = data.frame(a = a, group = factor(group))
fit = lm(a ~ group, data)
anova(fit)
tmpfn = function(x) c(sum = sum(x), mean = mean(x), var = var(x),n = length(x))
tapply(a, group, tmpfn)
tmpfn(a)
Concluso
Logo a analise de varincia pode ser usada para testar a diferena
entre mdias de vrias populaes, mostrando-se que a base usada
para os testes estatisticos em analise de variancia o
desenvolvimento de duas estimativas independentes da variancia da
populao sigma ao quadrado, ao computar a razao destas duas
estimativas, desenvolvemos uma regra de rejeijo para determinar se
rejeitamos a hipotese nula de que as medias das populaes so
iguais.
Referncia:
Analysis of Variance Tables Based on Experimental Structure
C. J. Brien, Biometrics, Vol. 39, No. 1 (Mar., 1983), pp. 53-59
FISHER, R. A. The logic of inductive inference. J. R. Stat. Soc., v.98, p.34-54,
1935.
MONTGOMERY, D.C. 1988. Design and analysis of experiments. 2nd. John Wiley
& Sons, New York, USA.
SNEDECOR, C.W. and W.G. COCHRAN, 1980. Statistical Methods. 7ed. Iowa
State University Press, Amer. Iowa. USA.
FISHER, R.A. Statistical Methods for Research Workers. 11 ed. Oliver & Boyd,
Edinburgo. 1950.
Gamerman, D. & Migon, H. (1993). Inferncia estatstica: uma abordagem
integrada, Textos de mtodos matemticos, UFRJ.
James F. Reed III: Analysis of Variance (ANOVA) Models in Emergency Medicine.
The Internet Journal of Emergency and Intensive Care Medicine. 2004. Volume 7
Number 2. http://www.ispub.com/ostia/index.php?xmlFilePath=journals/ijeicm/vol7n2/anova.xml