Anda di halaman 1dari 35

Analise de Covariancia

Analise de Covariancia - ANCOVA


Combina as tecnicas de ANOVA com as de Analise de Regressao.
Ideia basica: Incorporar `a ANOVA uma ou mais variaveis quan-
titativas correlacionadas com a variavel resposta.
1. Objetivo: Reduzir o erro experimental na comparacao dos
tratamentos.
2. Exemplo 1: Um estudo foi planejado para avaliar os efeitos de 3 lmes
promocionais sobre uma viagem `a Bahia. Quinze indivduos foram escolhidos
ao acaso, sendo que cada um deles preencheu um questionario fornecendo
suas impressoes sobre uma viagem `a Bahia antes de assistir algum dos lmes.
Em seguida, 3 grupos de 5 indivduos foram sorteados para assistir a um dos
lmes cuja dura cao era de 5 minutos. Depois cada indivduo era questionado
sobre o lme, sobre seu desejo de ir `a Bahia, etc. Tanto os resultados do
questionario inicial quanto do nal foram traduzidos em escores.
1
3. Escolha das covariaveis: Devem ser correlacionadas com a
variavel resposta. Nao devem ser afetadas pelos tratamentos.
Exemplo 2: Comparacao de dois metodos de ensino (tratamen-
tos). Metodo 1 usa o computador e Metodo 2 nao usa (padrao).
Variavel resposta: nota em um teste para vericar o aprendizado.
Covariavel: tempo gasto estudando.
Quando a covariavel nao e afetada pelos tratamentos, o intervalo
de deni cao de seus valores e o mesmo para todos os tratamen-
tos, isto e, a distribuicao dos valores da covariavel e similar para
todos os tratamentos, sujeita somente `a uma variacao casual.
Observacao: ANCOVA supoe que a covariavel seja quantitativa.
Se for qualitativa, usamos um modelo em blocos.
2
4. Modelo de ANCOVA para um fator xo
Modelo de ANOVA
y
ij
= +
i
+e
ij
,
i = 1, . . . , r e j = 1, . . . , n.
Modelo de ANCOVA (para uma covariavel e relacao linear)
y
ij
= +
i
+X
ij
+e
ij
,
i = 1, . . . , r e j = 1, . . . , n.
e o coeciente de regressao para a relacao linear entre a v.
resposta Y e a covariavel X; nao e interpretada como a media
geral; centrando X em sua media geral

X
..
=

i,j
X
ij
/(nr), pode-
mos interpretar como a media geral.
3
Modelo de ANCOVA usual
y
ij
= +
i
+(X
ij


X
..
) +e
ij
,
i = 1, . . . , r e j = 1, . . . , n.
y
ij
: valor da v. resposta associada `a unidade experimental j
submetida ao tratamento i;
: media geral (constante);

i
: efeito xo de tratamento i, sujeito `a restri cao

i

i
= 0;
e o coeciente de regressao para a relacao linear entre Y e X;
X
ij
: valor da covariavel X para a unidade experimental j sub-
metida ao tratamento i;
e
ij
: erro aleatorio associado `a unidade experimental j submetida
ao tratamento i. Supomos que e
ij
sao independentes com dis-
tribui cao N(0,
2
).
4
Segue que
E(y
ij
) =
ij
= +
i
+(X
ij

X
..
), Var(y
ij
) =
2
e y
ij
N(
ij
,
2
),
independentes.
Propriedades do modelo de ANCOVA (forma usual)
Comparacoes entre os efeitos dos tratamentos
Para o modelo de ANOVA: E(y
ij
) =
i
= +
i
, para todo
j;
Para o modelo de ANCOVA: E(y
ij
) =
ij
= +
i
+(X
ij

X
..
), ou seja, a resposta media sob cada tratamento e uma
reta de regressao;
5
Interpretacao geometrica: para X
ij
=

X
..
, +
i
e o intercepto
da reta de regressao;
e o coeciente angular de cada reta (retas paralelas).
Fixado um valor qualquer X
ij
temos:

ij

i

j
= +
i
+(X
ij


X
..
)
[ +
i
+(X
ij


X
..
)]
=
i

i
,
ou seja,
i

i
mede a diferen ca entre as resp. medias dos
tratamentos i e i

para qualquer valor de X. Quando todos


os tratamentos tiverem a mesma resp. media para qualquer
valor de X, as retas de regressao devem ser coincidentes, ou
seja,
1
= . . . =
r
.
6
Retas paralelas: se o coeciente angular nao e o mesmo
para todas as retas de regressao, a diferen ca entre os efeitos
dos tratamentos nao e constante para cada valor de X. Neste
caso, a ANCOVA nao e apropriada. Retas de regressao di-
ferentes devem ser ajustadas, uma para cada tratamento, e
entao comparadas.
5. Generalizacoes do modelo de ANCOVA
A covariavel e uma variavel aleatoria. O modelo de ANCOVA
deve ser interpretado como um modelo condicional, aplicavel
para qualquer valor observado de X.
Nao-linearidade de X. A linearidade nao e essencial. No
entanto, nao deve haver efeito de intera cao entre a covariavel
e os tratamentos.
7
Mais de uma covariavel. O uso de uma covariavel apenas
e, em geral, suciente para reduzir a variabilidade do erro
experimental. A extensao do modelo de ANCOVA para mais
de uma covariavel e imediata.
6. Formulacao do modelo de ANCOVA como um modelo
de regressao
r 1 v. indicadoras para representar os r tratamentos
I
1
=
_

_
1, se a observa cao esta sob o tratamento 1;
1, se a observa cao esta sob o tratamento r;
0, caso contrario.
8
I
r1
=
_

_
1, se a observa cao esta sob o tratamento (r-1);
1, se a observa cao esta sob o tratamento r;
0, caso contrario.
X
ij


X
..
= x
ij
y
ij
= +
1
I
1
+. . . +
r1
I
r1
+x
ij
+e
ij
.
7. Inferencias de interesse
H
0
:
1
= . . . =
r
= 0; H
1
: nem todos os
i

s
sao iguais.
Via regressao testar H
0
:
1
= . . . =
r1
= 0 (teste F-parcial).
9
Se H
0
e rejeitada, devem ser realizadas compara coes multiplas
para investigar a natureza destes efeitos. Em geral, nao ha
interesse em vericar a natureza da rela cao entre X e Y . A
covariavel X e usada apenas para reduzir a variabilidade do erro.
8. Analise do ajuste do modelo
Normalidade do erro experimental;
Igualdade de variancias entre os tratamentos;
Igualdade de inclinacoes das diferentes equa coes de regressao;
Erros nao correlacionados
10
9. Exemplo 3.
Uma companhia estudou os efeitos de 3 diferentes tipos de
promocao na vendas de seus biscoitos. 15 lojas foram sele-
cionadas e em plano completamente aleatorizado foi utilizado.
5 lojas foram alocadas ao acaso para cada tipo de promo cao.
Pre co e propaganda foram mantidos constantes durante o es-
tudo nas 15 lojas. A v. resposta Y foi o numero de pacotes
vendidos no perodo e a covariavel X foi o numero de pacotes
vendidos antes da promo cao, num perodo de mesma dura cao.
Loja
Promo. 1 2 3 4 5
Y
i1
X
i1
Y
i1
X
i2
Y
i2
X
i3
Y
i3
X
i4
Y
i5
X
i5
1 38 21 39 26 36 22 45 28 33 19
2 43 34 38 26 38 29 27 18 34 25
3 24 23 32 29 31 30 21 16 18 29
11
35 30 25 20 15
45
40
35
30
25
20
X
Y
1
2
3
Tratamento
Graco 1. Dispersao de Y versus X por tratamento
12
Modelo de regressao
y
ij
= +
1
I
1
+
2
I
2
+(X
ij


X
..
) +e
ij
,
i = 1, 2, 3 e j = 1, 2, 3, 4, 5.
Fazendo x
ij
= X
ij


X
..
= X
ij
25,
I
1
=
_

_
1, se a observa cao esta sob o tratamento 1;
1, se a observa cao esta sob o tratamento 3;
0, caso contrario;
I
2
=
_

_
1, se a observa cao esta sob o tratamento 2;
1, se a observa cao esta sob o tratamento 3;
0, caso contrario,
13
temos
i j y
ij
X
ij
x
ij
I
1
I
2
1 1 38 21 -4 1 0
1 2 39 26 1 1 0
. . . . . . . . . . . . . . . . . . . . .
2 1 43 34 9 0 1
2 2 38 26 1 0 1
. . . . . . . . . . . . . . . . . . . . .
3 4 21 16 -9 -1 -1
3 5 28 29 4 -1 -1
O modelo de regressao ajustado (modelo completo) e dado por
y
ij
= 33, 8 +6, 017I
1
+0, 942I
2
+0, 899x
ij
.
14
Considerando que realizamos uma analise do ajuste do modelo e
que conclumos que este se encontra bem ajustado, temos que
SQR
C
= 38, 571, QMR
C
= 3, 506 e gl
C
= 11. Alem disto, a
matriz de covariancia dos coecientes da regressao e dada por
_
_
_
_
_
0, 2338
0 0, 5016
0 0, 2603 0, 4882
0 0, 0189 0, 0147 0, 0105
_
_
_
_
_
.
Teste para os efeitos dos tratamentos
Para testar H
0
:
1
=
2
=
3
= 0, ou seja, H
0
:
1
=
2
= 0,
contra H
1
: nem todos os
i

s
sao iguais, ajustamos o seguinte
modelo de regressao
y
ij
= +x
ij
+e
ij
,
15
(modelo reduzido) obtendo SQR
R
= 455, 722 e gl
R
= 13.
A estatstica para o teste de H
0
e dada por
F

=
SQR
R
SQR
C
gl
R
gl
C
: QMR
C
=
455, 722 38, 571
13 11
: 3, 506 = 59, 5.
Sob H
0
, F

F[2, 11], o que conduz a um nvel descritivo


P < 0, 001. Assim, ha evidencias para rejeitarmos H
0
, ou seja,
parace haver efeito do fator promocao sobre o numero de bis-
coitos vendidos.
10. Estimacao dos efeitos dos tratamentos.
Suponhamos, para exemplicar, um estudo em que r = 3.
Caso 1. Desejamos estimar o contraste C =

i
a
i

i
,

i
a
i
= 0.
Ja que

i

i
= 0, temos

C =

i

i
= (a
1
a
3
)
1
+(a
2
a
3
)
2
e
var(

C) = (a
1
a
3
)
2
var(
1
) +(a
2
a
3
)
2
var(
2
)
+ 2(a
1
a
3
)(a
2
a
3
)cov(
1
,
2
).
A matriz de covariancias do vetor de coecientes da regressao
(modelo completo) ( ,
1
, . . . ,
r1
, )

e dada por
2
(X

X)
1
16
e estimada por QMR
C
(X

X)
1
, sendo X a matriz de planeja-
mento associada ao modelo completo.
Um intervalo de conanca para C com coeciente de conan ca
1 e dado por
[

C t
[1

2
;nrr1]
_
var(

C],
em que t
[1

2
;nrr1]
e o quantil de ordem 1/2 da distribui cao
t Student com nr r 1 graus de liberdade.
Caso 2. Se quisermos construir uma famlia de intervalos de
conan ca com coeciente de conan ca global 1 , podemos
utilizr o metodo de Schee ou de Bonferroni. Neste caso, os
intervalos de conan ca sao dados por:
17
Schee: [

C
i
S
_
var(

C
i
)], i = 1, 2, . . . , em que
S
2
= (r 1)F
[1;r1;nrr1]
, sendo F
[1;r1;nrr1]
o quantil
de ordem 1 obtido da distribuicao F Snedecor com a 1 e
nrr1 graus de liberdade e

C
i
e var(

C
i
) denidos anteriormente.
Bonferroni: [

C
i
B
_
var(

C
i
)], i = 1, 2, . . . , s, em que
B = t
[1/(2s);nrr1]
, sendo s o numero de intervalos de con-
an ca e t
[1/(2s);nrr1]
o quantil de ordem 1 /(2s) obtido
da distribui cao t Student com nr r 1 graus de liberdade e

C
i
e var(

C
i
) denidos anteriormente.
Caso 3. Queremos estudar a resposta media sob o tratamento i
para um valor X
ij
da covariavel X. Em outras palavras, queremos
estimar a combinacao linear L = +
i
+x
ij
. Temos
18

L = +
i
+x
ij
e
var(

L) = var( ) +var(
i
) +x
2
ij
var()
+ 2x
ij
cov( , ) +2x
ij
cov(
i
, ) +2cov( ,
i
),
com as estimativas das variancias e covariancias envolvidas obti-
das de QMR
C
(X

X)
1
. Um intervalo de conan ca para L com
coeciente de conan ca 1 tem a forma do intervalo de con-
an ca dado no Caso 2 substituindo

C por

L. Em geral, a res-
posta media estimada para o tratamento i em X =

X
..
e deno-
minada media ajustada estimada para o tratamento i. O termo
ajustada refere-se ao fato do efeito da covariavel ser levado em
considera cao na estimacao.
19
11. Teste de paralelismo
Rela cao linear entre Y e X.
Suposicao: Inclina cao e a mesma para todos os tratamentos.
O modelo geral
y
ij
= +
1
I
1
+. . .+
r1
I
r1
+x
ij
+
1
I
1
x
ij
+. . .+
r1
I
r1
x
ij
+e
ij
permite diferentes inclina coes para os tratamentos.
Hip otese de interesse:
H
0
:
1
= . . . =
r1
= 0
contra H
1
: ha pelo menos uma diferen ca.
A hip otese H
0
e testada via um teste F-parcial.
20
12. Algumas observacoes
ANCOVA versus BLOCOS: Em geral, o planejamento em
blocos aleatorizados e prefervel.
Se a relacao entre Y e X e realmente linear, os dois
metodos de analise sao igualmente ecientes. Se a rela cao
entre Y e X nao e linear mas utilizamos a ANCOVA
supondo rela cao linear, a ANCOVA e menos eciente do
que o planejamento em blocos aleatorizados.
No planejamento em blocos aleatorizados nao estabele-
cemos suposi coes sobre a natureza da rela cao entre a
varavel usada para formar os blocos e Y .
21
No planejamento em blocos aleatorizados o numero de
graus de liberdade do resduo e em geral menor do que
na ANCOVA. Somente no caso do estudo envolver pou-
cas observa coes e que essa diferen ca afeta a precisao das
estimativas.
Uso de diferencas: Se = 1, o modelo de ANCOVA e o
de ANOVA para z
ij
= y
ij
x
ij
sao equivalentes. Temos para
= 1
y
ij
= +
i
+x
ij
+e
ij
,
ou seja,
y
ij
x
ij
= +
i
+e
ij
.
Assim, podemos testar no modelo de ANCOVA se = 1. Se
= 1, o modelo de ANCOVA e mais apropriado.
13. ANCOVA para estudos com dois fatores cruzados
Modelo de ANOVA
y
ijk
= +
i
+
j
+()
ij
+e
ijk
,
i = 1, . . . , a, j = 1, . . . , b e k = 1, . . . , n.

i
: efeito do i-esimo nvel do fator A;

j
: efeito do j-esimo nvel do fator B;
(
i

j
) : efeito de intera cao entre o i-esimo nvel do fator A e o
j-esimo nvel do fator B.
22
Modelo de ANCOVA para um estudo com dois fatores
cruzados e uma covariavel (relacao linear)
y
ijk
= +
i
+
j
+()
ij
+(X
ijk


X
...
) +e
ijk
,
i = 1, . . . , r e j = 1, . . . , n.
Modelo de regressao: Exemplo para a = b =2
y
ijk
= +
1
I
ijk1
+
1
I
ijk2
+()
11
I
ijk1
I
ijk2
+x
ijk
+e
ijk
,
x
ijk
= X
ijk


X
...
,
I
1
=
_
_
_
1, se a observa cao esta sob o nvel 1 do fator A;
1, se a observacao esta sob o nvel 2 do fator A;
23
I
2
=
_
_
_
1, se a observa cao esta sob o nvel 1 do fator B;
1, se a observa cao esta sob o nvel 2 do fator B;
Observacao: Por causa das restri coes

i
=

j

j
=

i
()
ij
=

j
()
ij
= 0, temos

2
=
1
,
2
=
1
, ()
12
= ()
11
, ()
21
= ()
11
e
()
22
= ()
12
= ()
11
.
Temos entao:
y
11k
= +
1
+
1
+()
11
+x
11k
+e
11k
y
12k
= +
1

1
()
11
+x
12k
+e
12k
y
21k
=
1
+
1
()
11
+x
21k
+e
21k
y
22k
=
1

1
+()
11
+x
22k
+e
22k
As quatro retas diferem pelo intercepto mas sao paralelas.
24
Se ()
11
= 0,
1
= 0 e
1
= 0, temos um modelo de ANCOVA
com o fator A apenas (duas retas).
Se ()
11
= 0,
1
= 0 e
1
= 0, temos um modelo de ANCOVA
com o fator B apenas (duas retas).
Observar que os coecientes do modelo de regressao sao os
efeitos
1
,
1
e ()
11
do modelo de ANOVA e o coeciente
da covariavel.
Para testar primeiramente
H
01
: ()
11
= 0
e, posteriormente,
H
02
:
1
= 0
25
e
H
03
:
1
= 0,
caso H
01
seja rejeitada, fazemos uso de testes F parciais. Com-
parac oes multiplas sao realizadas por meio dos procedimentos de
Schee e Bonferroni.
14. ANCOVA para planejamentos em blocos completos
casualizados
Modelo de ANCOVA
y
ij
= +
i
+
j
+(X
ij


X
..
) +e
ij
,
i = 1, . . . , b e j = 1, . . . , r.
26
Modelo de regressao: Exemplo para b = 4 e r = 3
y
ij
= +
1
I
1
+
2
I
2
+
3
I3 +
1
I
4
+
2
I
5
+x
ij
+e
ij
,
com x
ijk
= X
ijk


X
...
,
Para testar
H
0
:
1
=
2
=
3
= 0
que equivale a testar
H
0
:
1
=
2
= 0,
no modelo de regressao, ajustamos o modelo reduzido
y
ij
= +
1
I
1
+
2
I
2
+
3
I3 +x
ij
+e
ij
,
e testamos H
0
por meio de um teste F parcial.
27
Qual e o modelo reduzido para testar se as inclina coes sao todas
iguais?
y
ij
= +
1
I
1
+
2
I
2
+
3
I3+
1
I
4
+
2
I
5
+x
ij
+
1
I
4
x
ij
+
2
I
5
x
ij
+e
ij
,
15. Exemplo 4
Um analista deseja estudar o efeito da Idade (Fator A, Jovem
(i = 1), Meia idade (i = 2), Idoso (i = 3)) e do Genero (Fator
B, Homem (j = 1), Mulher (j = 2)) de proprietarios de car-
ros usados sobre o valor oferecido (Y , em centenas de dolares)
por concessionarias a seus carros. Seis homens e seis mulheres
foram selecionados para cada um de tres grupos de idade. Um
determinado carro usado de 6 anos de idade e de pre co medio foi
usado no experimento. O volume de vendas da concessionaria
28
(X, em centenas de milhares de dolares) foi usado como co-
variavel. Temos os seguintes valores:
Y
ijk
Idade (i) Genero (j) Proprietario (k) X
ijk
21.0 1 1 1 3.0
23.0 1 1 2 5.1
19.0 1 1 3 1.0
22.0 1 1 4 4.4
22.0 1 1 5 2.7
23.0 1 1 6 4.9
21.0 1 2 1 3.5
22.0 1 2 2 4.2
20.0 1 2 3 2.2
21.0 1 2 4 3.1
19.0 1 2 5 1.3
25.0 1 2 6 6.6
29
Y
ijk
Idade (i) Genero (j) Proprietario (k) X
ijk
30.0 2 1 1 6.5
29.0 2 1 2 4.1
26.0 2 1 3 2.2
28.0 2 1 4 3.7
27.0 2 1 5 3.4
27.0 2 1 6 3.0
26.0 2 2 1 2.2
29.0 2 2 2 5.4
27.0 2 2 3 3.1
28.0 2 2 4 4.5
27.0 2 2 5 3.6
29.0 2 2 6 5.0
30
Y
ijk
Idade (i) Genero (j) Proprietario (k) X
ijk
25.0 3 1 1 5.0
22.0 3 1 2 3.1
23.0 3 1 3 3.2
21.0 3 1 4 3.2
22.0 3 1 5 3.0
21.0 3 1 6 2.9
23.0 3 2 1 4.0
19.0 3 2 2 0.8
20.0 3 2 3 1.9
21.0 3 2 4 2.8
20.0 3 2 5 2.2
20.0 3 2 6 1.9
31
a) Proponha um modelo de ANCOVA para estes dados.
b) Ajuste o modelo proposto, obtenha os resduos e faca uma
analise de diagnostico.
c) Proponha um modelo para vericar se as retas de regressao
possuem todas a mesma inclina cao. Teste essa hipotese.
d) Teste a inexistencia de efeito de intera cao entre os Fatores
A e B. Se possvel teste o efeito do fator A e do fator B.
e) Quais compara coes entre medias sao de interesse? Construa
intervalos de conan ca.
32