1. Introduo
Suponha que exista um sistema que atue como um filtro (Figura 1), que
estimulado por uma srie de rudos brancos, resultantes de um processo de gerao de
nmeros aleatrios, e que com esse estmulo seja gerada pelo sistema uma seqncia de
valores observados seguindo um padro, que corresponde srie temporal Yt.
rudo srie
Filtro Yt
branco temporal
1
Segundo a sistemtica da metodologia de Box-Jenkins os modelos ARIMA
descrevem tanto o comportamento estacionrio como o no-estacionrio. Dessa forma,
pode-se afirmar que essa uma metodologia de modelagem flexvel em que as
previses com base nesses modelos so feitas a partir dos valores correntes e passados
dessas sries.
2
A anlise das estatsticas bsicas das sries estacionrias permite separar a
estacionariedade em dois grupos:
3
t = 2, ..., n.
Varincia no-constante no tempo.
Figura 5 Srie das 1as diferenas
t = 3, ... , n.
Zt = (Yt Yt-1) (Yt-1 Yt-2) = Yt 2Yt-1 + Yt-2.
Varincia no-constante no tempo.
Figura 6 Srie das 2as diferenas.
Yt = logYt
*
Varincia constante.
Srie pode ser dita estacionria.
A srie original dita homognea de ordem d = 1.
Figura 7 Srie das primeiras diferenas dos dados transformados.
4
Nas figuras 4, 5 e 6 so mostrados os grficos de uma srie original de oferta
monetria ajustada sazonalmente, onde existe clara tendncia, e das respectivas sries
transformadas de primeiras e segundas diferenas. Observa-se que a varincia no-
constante no tempo em todas elas. Nesse caso feita a transformao logartmica nos
dados originais e em seguida obtida a srie das primeiras diferenas da srie Yt* = log Yt
ou seja: Yt* , para a qual pode-se aceitar que a varincia constante e, assim, a srie
5
2. Srie pode ser considerada no-estacionria quando h padro de
decaimento lento para zero (Figura 10).
6
2.1 Um Teste para Verificar a Estacionariedade: O Teste da Raiz Unitria de
Dickey-Fuller
Yt = Yt-1 + t , -1 1,
onde = - 1.
Yt = 1 + Yt-1 + t (2)
Yt = 1 + 2 t + Yt-1 + t (3)
7
Nessas duas variantes [(2) e (3)], = 0 significa que h raiz unitria ou seja, a
srie Yt no-estacionria. A hiptese alternativa que < 0, significando - 1 < 0 ou
seja < 1 (observe que > 1 no aceita por implicar em exploso de valores da srie).
Yt uma srie temporal estacionria com mdia diferente de zero: equao (2)
Yt = + t + Yt-1 + t (4)
O teste pode ser aplicado para uma verso geral da equao (4) ou seja, sob a
suposio de que Yt possa ser descrita por:
Yt = + t + Yt-1 + 1 Yt-1 + t,
Outras defasagens Yt-i podem ser includas na equao, mas o teste seria o
mesmo.
8
O procedimento do teste calcula a estatstica F como a razo:
(N K) (ESS R ESS IR )
F=
q (ESS IR )
onde:
N o nmero de observaes,
Yt = + 1 Yt 1 + 2 Yt 2 + ... + p Yt p + t 1 t 1 ... q t q
O melhor modelo deve ser parcimonioso ou seja, deve-se min {p,q}(o que quer
dizer que se deve tentar utilizar o menor conjunto de parmetros possvel para seu
9
ajustamento srie de dados observados). Os parmetros p e q representam o nmero
de parmetros relativos aos comprimentos de defasagem em que observa-se valores
significativos das autocorrelaes e que correspondem a particularidades do sistema de
gerao das sries que devem ser explicadas pelo modelo (pois correspondem a um
padro de gerao). O processo gerador dos dados da srie dito aleatrio linear se o
modelo ajustado Yt pode ser descrito como uma combinao linear de valores defasados
de Yt e t.
10
Figura 12 Exemplo de processo de mdias mveis MA(1) com 1 = 0,25
(Levenbach e Cleary, 1984).
Yt = + 1 Yt 1 + t , cujos parmetros so , 1, 2 .
11
Figura 14 Exemplo de processo autoregressivo AR(1) com 1 = -0,9
Yt = + 1 Yt 1 + 2 Yt 2 + ... + p Yt p + t .
12
Existe um princpio de dualidade entre os modelos do tipo MA e AR de forma
que existe a seguinte correspondncia entre eles:
13
Assim, como tarefa inicial preciso determinar p e q para a identificao de
modelos tentativos. Para isso, procede-se ao exame dos coeficientes de autocorrelao e
dos coeficientes de autocorrelao parcial, que permitem medir a fora relativa de
interao entre as variveis Yt defasadas.
5. A Autocorrelao Parcial
Xt = 1 Xt-1 + t (7)
Xt = 1Xt-1 + 2 Xt-2 + t (8)
Equaes Xt = 1Xt-1 + 2Xt-2 + 3 Xt-3 + t (9)
...
Xt = 1Xt-1 + 2Xt-2 + ... + m-1 Xt-m+1 + t (10)
Xt = 1Xt-1 + 2Xt-2 + ... + m Xt-m + t (11)
14
Multiplicando o primeiro e segundo termos da equao por Xt-1, obtm-se:
onde:
1 0 0
1
1 = 1 0, = 1 1 = 1 , ou melhor, que: 1 = 1 = r1, sendo 1 a
0
r1 , se k =1
k 1
(rk rk 1, j rk j )
1) j=1 se k = 2, 3, ...
rkk = k 1
(1 rk 1, j r j )
j=1
1
Srkk =
(n b + 1)1/2
rkk
3) t rkk =
Srkk
15
4) Na prtica, se t rkk > 2, significa que autocorrelaes parciais so
significativas.
BkYt = Yt-k
AR(1) (1 - 1B)Yt = + t
p(p 1) 2
(1 + x)p = 1 + px + x +... ,
2!
1
o termo = (1 - 1B)-1 = 1 + 1B + 12 B2 + ... , onde -1 < 1 < 1.
1 1 B
coef. 1 coef. 2 ...coef. n
Dessa forma, escreve-se o modelo AR(1): Yt = t + 1 t-1 + 12 t-2 + ... , ou
seja, ele expresso como um processo MA de ordem infinita (valores dos coeficientes
1n decrescentes exponencialmente).
16
De forma similar, MA(1) Yt = (1 - 1B) t pode ser visto como AR de ordem
infinita, pela mesma propriedade da dualidade ou melhor, se as condies de
invertibilidade e estacionariedade forem obedecidas (sero apresentados mais frente).
(1 1 B 2 B 2 ... q B q )
Assim, Yt = t
(1 1 B 2 B 2 ... p B p )
sendo:
q (B)
H(B) = pode ser denominada funo de transferncia.
p (B)
wt = (1 B) Yt 1 diferena
p(B)(1-B)dYt = q(B) t
(1 - 1B)(1 B) Yt = (1 - 1B) t
1) Unicidade de representao
O que garante:
17
2) Equilbrio em torno do valor de uma mdia fixa, so as condies de
estacionariedade de wt.
Z t = + 1 Z t 1 + 2 Z t 2 +...+ p Z t p
= + 1 + 2 + ... + p,
ou seja: = .
(1 1 2 ... p )
Zt = + t - 1t-1 Nenhuma
2 - 1 < 1
18
No processo ARIMA (ou ARMA) a condio de invertibilidade significa que
sua parte MA pode ser invertida em AR (puro). Os pesos aplicados aos valores
passados de Zt so decrescentes, na medida em que a defasagem aumenta. Para o
conjunto de modelos abaixo, so condies de invertibilidade:
2 - 1 < 1
Zt = + 1Zt-1 + t Nenhuma
8. O Termo Constante
19
(1 - 1B - 2B2 - ... - pBp) Zt =
onde
Assim,
p(B) Zt = + q(B) t
onde = p(B)=
Assim,
p(B)Zt = + q(B) t
onde
= p(B)
= - 1 - 2 - ... - p
= (1 - 1 - 2 - ... - p)
20
3) Ambos p(B) e q(B) podem ser includos
0 hiptese razovel.
21
O correlograma tem picos nas defasagens 1, 2, ..., q e truncamento aps, e o
correlograma parcial apresenta padro de decaimento.
Yt = + 1Yt-1 + t.
22
3. Se ambos os correlogramas parecem truncar-se igualmente abruptamente,
os modelos tentativos podem ser:
1) MA(q) e no AR(p)
2) AR(p) e no MA(q)
Como regra prtica, em geral MA(q) leva ao melhor modelo e deve ser tentado
em primeiro lugar.
D) ARMA (p,q)
Yt = + 1Yt-1 - 1t-1 + t.
23
Para avaliar a significncia estatstica dos valores finais dos parmetros, devem
ser construdos intervalos de confiana, realizados testes de hipteses e verificadas as
condies de estacionariedade e invertibilidade (para a unicidade de representao).
So eles:
24
Obtm-se a estimativa amostral da varincia dos resduos 2 ajustada para os
S(, , )
Para isso, obtm-se a estimativa de 2 por 2 = ,
npq
sendo:
m
Q = n(n + 2) (n k) 1 rk2 ,
k =1
25
3) Anlise do periodograma
O uso do modelo ARMA (ou ARIMA) para a previso ser apresentado por
meio de um exemplo (Bowerman & OConnel, 1987).
26
Figura 18 Grfico da srie de primeiras diferenas
27
Figura 20 Correlograma da srie de primeiras diferenas
1,6 com truncamento aps essa defasagem (pode ser observado que os valores
sucessivos das autocorrelaes so no significativos e prximos de zero com t rk < 1,6
28
Figura 21 Correlograma parcial da srie de primeiras diferenas
k > 1, aps essa defasagem. Entretanto os valores em mdulo da estatstica t rkk para
29
120
Zt
Z= t =2
= 0,005423
120 2 + 1
1
120 (Z t Z) 2
2
t
S Z = =2 = 1,104
(120 2 + 1) 1
0,005423
t= , logo: |t| = 0,0536 < 2
1,104 / (120 2 + 1) 2
1
Com esse modelo tentativo pode-se obter as estimativas dos valores das vendas
para, ento, prever-se vendas futuras. Assim, obtm-se a estimativa Y1 ou seja:
Y1 = Y0 + 1 + 0,3545 0 .
30
Nesse caso, Y0 Y0 no pode ser obtida pois Y0 no pode ser calculado,
Y120 - Y120 = 15,6453 14,9553 = 0,6900 . A partir desse ponto, pode-se utilizar o
modelo para previso de valores futuros.
perodos frente de t.
Pode-se afirmar que, uma vez conhecida, se a observao das vendas Y121
pertencer ao intervalo, a previso foi bem sucedida. De estudos anteriores, sabe-se que
a metodologia de Box-Jenkins precisa para o curto-prazo.
O uso do modelo a partir desse ponto permite obter: Y122 = Y121 + 122 1 121 ,
sendo usado no lugar do valor observado Y121 (supondo-se no conhecido) a sua
estimativa conhecida ou seja: Y121 (120) .
31
Da mesma forma, o valor Y122 corresponde na verdade a Y122 (120) =
Y121 (120) + 122 1 121 = 15,8899 + 0 + 0, sendo 121 = 0 pois Y121 no foi observado.
De forma geral, Y120+ (120) = Y120 + 1 + 120+ 1 120+ 1 , o que significa que,
para 2, 120+ = 120+ 1 =0 e Y120+ (120) = Y120+ -1 (120) + 120+ 1 120+ 1 =15,8899 .
Seja:
t = 1 (B) (B) w t
32
A estimativa amostral dos parmetros d origem minimizao do somatrio
do quadrado dos resduos do modelo:
S( 1 ,... p , 1 ,..., q ) = 2t
t
33
13.1 A Estimao No-Linear dos Parmetros do Modelo
T
S = [ t | 1 ,... p , 1 ,..., q ] 2
t =1
A estimao no-linear pode ser obtida pelo mtodo iterativo que se baseia na
aproximao linear dos dois primeiros termos da expanso da funo
[ t | 1 ,... p , 1 ,..., q ] em srie de Taylor em torno de um ponto correspondente ao
conjunto de valores iniciais dos parmetros e , cujo vetor pode ser representado por
0. Representa-se w o vetor dos valores da varivel wt, t = 1, ..., T. Assim, a
aproximao linear corresponde aos dois primeiros termos de:
p+q [ t ]
[ t ] = [ t | w, 0 ] + ( i - i,0 ) = 0 +
i =1 i
34
2 [ t ]
2
1 p+q
+ i i,0
( - ) = 0 + ...
2 i =1 i2
[ t ]
Fazendo-se x i, t = = 0 e considerando que xi,t e [t|w, 0] correspondem
i
simplificao.
Novas estimativas dos i podem, ento, ser obtidas por regresso linear.
35
variao desse conjunto inicial de estimadores. A estimativa final ser aquela que
corresponder menor soma do quadrado dos erros (mnimo global).
1 1 B
t = w t , onde wt a srie estacionria.
1 1 B
t B
x1, t = 1 , 0 , 1 , 0 = wt
1 1 1,0 B
B - 1,0 B 2
x 2, t = t 1, 0 ,1, 0 = wt
1 (1 1,0 B) 2
x 2, t = 21,0 x 2, t 1 1,0
2
x 2, t - 2 - w t 1 + 1,0 w t 2 .
Esses valores so funo dos valores defasados: x1,t-1, wt-1, x2,t-1, x2,t-2 e wt-2,
assim preciso estimar valores defasados preliminares. Logo, considerando que o nvel
mdio da srie original = 0,
x2,2 = - w1
36
O mesmo procedimento se aplica srie de valores x1,t.
1 - 1,0 B
Uma srie de valores deve ser gerada para t,0 = w t , t = 1,..., T,
1 - 1,0 B
sendo:
Com essas trs series de valores (x1,t, x2,t e t,0) pode-se estimar novos
parmetros do seguinte modelo de regresso linear:
2. Quais dos operadores p(B), P(BL), q(B) e Q(BL) devem ser includos no
modelo, e
Considerando que
1/ 2
n
Zt ( n
(Z t Z t ) 2 )
t =b
Z= t =b
e SZ =
n b +1 (n b + 1) - 1
37
so a mdia e o desvio padro da srie temporal Zb, Zb+1, ... , Zn, o procedimento
aproximado para decidir se Z estatisticamente diferente de zero, e decidir pela
incluso do termo constante: = p (B) P (B L ) no modelo geral de Box-Jenkins,
Z
verificar se o valor absoluto do termo: maior que 2, sendo Z a
S z /(n b + 1)1/2
Da mesma forma que para sries no-sazonais, se a srie de valores Zb, ..., Zn
a srie original, a mdia ser zero significa que os valores da srie original flutuam em
torno de uma mdia zero. Se, por outro lado, Zb, ... , Zn representam a srie
diferenciada, afirmar que a mdia da populao zero equivale a dizer que a srie
original no tem tendncia determinstica. Ao contrrio, diz-se que existe essa
tendncia nos valores da srie. Se a srie no exibe tendncia determinstica, qualquer
outra tendncia ser estocstica.
Alm disso, para determinar quais dos operadores p(B), P(BL), q(B) e
Q(BL) devem ser includos no modelo de Box-Jenkins geral:
38
TABELA 1
Zt = (1 BL)D (1 B)d Yt
transformou a srie temporal original Y1, Y2, ..., Yn, que apresentou variao sazonal,
numa srie estacionria Zb, Zb+1, ..., Zn.
39
b1. Define-se as defasagens L, 2L, 3L e 4L como defasagens sazonais exatas.
Um pico existe numa defasagem sazonal exata k do correlogama se: t rk > 1,25 e um
pico existe numa defasagem exata k do correlograma parcial se: t rkk > 2.
b2. Define-se as defasagens L-2, L-1, L+1, L+2, 2L-2, 2L-1, 2L+1, 2L+2, 3L-
2, 3L-1, 3L+1, 3L+2, 4L-2, 4L-1, 4L+1 e 4L+2 como defasagens sazonais aproximadas.
Um pico existe numa defasagem sazonal aproximada k do correlograma se: t rk > 1,6.
ento essa srie tem valores que podem ser considerados estacionrios.
40
15. Estimativas Preliminares dos Parmetros do Modelo Geral
onde Z a mdia amostral da srie temporal estacionria Zb, Zb+1, ... , Zn.
41
Tabela 2 - Condies de estacionariedade e de invertibilidade sobre os parmetros de
primeira e segunda ordem dos operadores p(B), P(BL), q(B) e Q(BL).
Operador Condies de Condies de
estacionariedade invertibilidade
1(B) = (1 - 1B) Nenhuma |1| < 1
2(B) = (1 - 1B - 2B2) Nenhuma 1 + 2 < 1
2 - 1 < 1
|2| < 1
1(BL) = (1 - 1,LBL) Nenhuma |1,L| < 1
2(BL) = (1 - 1,LBL - 2,LB2L) Nenhuma 1,L + 2,L < 1
2,L - 1,L < 1
|2,L| < 1
1(B) = (1 - 1B) |1| < 1 Nenhuma
2(B) = (1 - 1B - 2B2) 1 + 2 < 1 Nenhuma
2 - 1 < 1
|2| < 1
1(BL) = (1 - 1,LBL) |1,L| < 1 Nenhuma
2(BL) = (1 - 1,LBL - 2,LB2L) 1,L + 2,L < 1 Nenhuma
2,L - 1,L < 1
|2,L| < 1
42
Tabela 3 Valores absolutos crticos da estatstica t para identificar picos no
correlograma da srie e no correlograma da srie de resduos
Valores Crticos Valores Crticos no
Defasagens no Correlograma Correlograma dos
Resduos
No-sazonais
Baixas (1,2 e talvez 3) 1,6 1,25
Outras defasagens no-sazonais 2,0* 1,6
Sazonais
Exatas (L, 2L, 3L, 4L) 1,25 1,25
Aproximadas (L-2, L-1, L+2, L+1, ...) 1,6 1,25
Semi-peridicas sazonais (0,5L, 1,5L, 2,5L, 3,5L) 1,6 1,25
Outras 2,0* 1,6
(Bowerman & OConnel, 1993, pg. 582)
Conforme discutido por Levenbach e Cleary (1984, pgs. 457-458), devem ser
feitas as seguintes verificaes nas etapas de ajustamento de modelos ARIMA uma
srie temporal:
43
4. As estimativas dos parmetros e seus desvios padro devem ser
examinados. Testes de hiptese devem ser feitos para avaliar a incluso
do parmetro no modelo.
44
Diferenas sazonais e parmetros autoregressivos sazonais.
Seja a equao:
onde:
45
1) Busca Direta
2) Otimizao Direta
S
Define-se o sistema de equaes normais: = 0, i = 1, ... , p ou seja:
i
T f
2[Yt f(X1t ...X kt , 1 ,..., p )] = 0, i = 1, ..., p,
t =1 i
46
f 6
p 47i4 8 1 p p 2f
Y = f (X1, ... , Xk, 1,0, ... , p,0) + ( i i,0 ) + ( i . j ) + ... +
i =1 i 2 i =1 j=1 i j
0 0
p f
Y - f (X1, ... , Xk, 1,0, ... , p,0) + i,0 =
i =1 i 0
p f
= i +
i =1 i 0
p variveis independentes
p f f
Y - f (X1, ... , Xk, 1,1, ... , p,1) + i,1 e , i = 1, ..., p.
i =1 i 1 i 1
47
19. Exemplo de Aplicao da Metodologia a Srie Temporal Sazonal
Para isto, foi analisada a srie histrica do nmero de quartos ocupados por dia
durante 15 anos, entre 1973 e 1987. Como o planejamento necessrio mensal, o
conjunto de dados da srie histrica foi reduzido a mdias mensais pela diviso do total
mensal pelo nmero de dias do ms. A Figura 22 apresenta o grfico dessa srie
temporal.
Foi decidido realizar a anlise da srie temporal com os dados entre 1973 e
1986, de forma que o ano de 1987 fosse usado para verificar a adequao do modelo.
48
correlogramas Figura 24 (a) e (b) confirma a no-estacionariedade da srie
transformada.
49
Figura 24 (b) Correlograma parcial da srie transformada y *t = ln y t
50
Figura 25 (a) Correlograma da srie transformada z t = y *t y *t -1
51
feita a transformao z t = y *t y *t -12 . A Figura 26 (a) e (b) apresenta os
correlogramas relativos essa transformao. No nvel no-sazonal, no correlograma
simples, observa-se picos nos perodos 1, 3 e 5, mas que parecem fazer parte de um
padro de decaimento rpido. No correlograma parcial observa-se picos nos perodos 1,
3 e 5 e h indicao de trucamento aps o perodo 5.
52
Figura 26 (b) Correlograma parcial da srie transformada z t = y *t y *t -12
funo decai razoavelmente rpido, com picos decrescentes nas defasagens sazonais
53
Figura 27 (a) Correlograma da srie z t = y*t y*t -1 y*t 12 + y*t 13
54
A anlise do correlograma (Figura 27(a)) dessa srie feita. Observa-se
truncamento no nvel sazonal (aps defasagem de perodo 18) e decaimento
razoavelmente rpido no nvel no-sazonal. Entretanto, comparando com os padres
observados no correlograma da Figura 26(a), conclui-se que obter as diferenas de
primeira ordem no acelerou o truncamento ou o decaimento, implicando em dizer que
a transformao z t = y *t y *t -12 parece o bastante para garantir a estacionariedade e a
(b) (1 - 1B - 3B3)
1(B12) = (1 - 1,12B12)
55
Para concluir se a constante deve ser includa no modelo (significando que a
srie varia em torno de mdia 0), deve-se obter o valor amostral da mdia e avaliar
sua significncia estatstica.
Obtm-se:
168
zt
z= t =13
= 0,0333
168 13 + 1
1/2
168 (z t z) 2
t
S z = =13 = 0,02319
(168 13 + 1) 1
z 0,033
t= = = 17,7951
Sz 0,02319
n b +1 168 - 13 + 1
z estatisticamente 0 e
= p (B) P(BL).
56
As estimativas preliminares dos parmetros do modelo obedecem s condies
de invertibilidade e estacionariedade:
|1,12| < 1
2
Observa-se que o valor tabulado de crtico :
2
(0,05) [(m np) = 20 graus de liberdade] = 31,4104
57
2
Q = 26,712 < 31,4104 = (0,05) (20 graus de liberdade) e, assim, a adequao do
t =1
padro S = indica o melhor ajuste e deve conduzir a
n np
previses mais precisas dos intervalos de predio.
58
Anexo 1
onde:
onde:
N
L = p(Yi ) referida como a funo de verossimilhana,
i=1
= log[f(Yi , X i , )] =
N
log L
i =1
N N
= log 2 - log 2
2 2
2 i =1 2
59
Dessa forma, maximizar log L corresponde minimizao de:
N
S = (Yi f(X1i ,..., X ki , 1 ,..., p )) 2
i =1
(log L) 1
= 2 (Yi - - Xi) = 0
(log L) 1
= 2 [Xi (Yi - - Xi) = 0
(log L) -N 1
= + 4 (Yi - - Xi)2 = 0
2
2 2
2
' = Y ' X
(X i X) (Yi Y)
' =
(X i X) 2
60
Referncias
Granger e Newbold (1977), Forecasting Economic Time Series, Academic Press, NY.
Levenbach e Cleary (1984), The Modern Forecaster: The Forecasting Process Through
Data Analysis, Lifetime Learning Publications, Califrnia.
Pindyck, R.S. e Rubinfeld, P.L. (1991), Econometric Models & Economic Forecasts,
McGraw-Hill International Editions.
VERSO EM REVISAO
61