Anda di halaman 1dari 6

Universidade Federal do Rio Grande do Sul

Instituto de Matemática e Estatística


Departamento de Estatística
Econometria – MAT02208

Modelagem ARIMA
Análise e previsão econométrica de série temporal de vendas

Guilherme Ziebell de Oliveira

2017
1 – Introdução e identificação do modelo a ser utilizado

Temos como objetivo elaborar um modelo de previsão para os dados fornecidos por
uma empresa que vende baterias. Os dados refletem a venda mensal de baterias a partir de
janeiro de 2001, e apresenta 200 entradas. A empresa informou que uma vez por ano uma
grande empresa compra uma quantidade expressiva de baterias, o que pode gerar algumas
inconsistências nos dados fornecidos. A empresa gostaria de realizar uma previsão de vendas
no atacado para os três meses subsequentes aos informados.
Busca-se, nesse contexto, fornecer uma previsão pontual e intervalar para as vendas de
baterias para os próximos 3 meses, bem como um relatório final com detalhes da análise para
que esta possa ser reproduzida pelos profissionais da empresa.
Os dados informados podem ser verificados na série temporal abaixo:

A partir de uma breve observação do gráfico, percebe-se que a série tem tendência
temporal quadrática, ao mesmo tempo em que apresenta sazonalidade nos dados, conforme a
suspeita levantada pela empresa. Para testar a hipótese, de tendência temporal, foi realizado o
Teste de Dickey-Fuller Aumentado, que apresentou os seguintes resultados:
Teste Aumentado de Dickey-Fuller para v1
testar para baixo a partir de 14 defasagens, critério AIC
tamanho da amostra: 185
hipótese nula de raiz unitária: a = 1

teste sem constante


incluindo 14 defasagens de (1-L)v1
modelo: (1-L)y = (a-1)*y(-1) + ... + e
valor estimado de (a - 1): -0.0029369
estatística de teste: tau_nc(1) = -1.23459
p-valor assintótico 0.1998
coeficiente de 1ª ordem para e: -0.207
diferenças defasadas: F(14, 170) = 136.627 [0.0000]

Dado que o p-valor de 0,1998 não permite a rejeição da hipótese nula (Ho = há a
presença de raiz unitária), confirma-se a presença de tendência temporal. Para testarmos a
informação de que há uma sazonalidade anual nas vendas, foi realizada uma regressão através

1
do modelo MQO, utilizando uma variável time (que representa a temporalidade da série), uma
variável sq_time (o quarado do tempo, de forma a retirar a tendência quadrática) e uma variável
dummy dm2 (representando a sazonalidade, percebida nos meses de fevereiro).

Modelo 1: MQO, usando as observações 2001:01-2017:08 (T = 200)


Variável dependente: v1

coeficiente erro padrão razão-t p-valor


-----------------------------------------------------------
const 1342.63 6.87643 195.3 1.67e-226 ***
time 8.71387 0.156896 55.54 7.02e-122 ***
dm2 404.600 8.08229 50.06 1.28e-113 ***
sq_time −0.0511029 0.000755996 −67.60 8.96e-138 ***

Média var. dependente 1566.276 D.P. var. dependente 212.2887


Soma resíd. quadrados 199087.1 E.P. da regressão 31.87084
R-quadrado 0.977801 R-quadrado ajustado 0.977461
F(3, 196) 2877.723 P-valor(F) 9.7e-162
Log da verossimilhança −974.1058 Critério de Akaike 1956.212
Critério de Schwarz 1969.405 Critério Hannan-Quinn 1961.551
rô −0.191595 Durbin-Watson 2.374218

Visto que todas as variáveis resultaram significativas, confirmam-se as hipóteses de


existência de tendência temporal e sazonalidade

2. Remoção de tendência e sazonalidade

Para a remoção da tendência temporal e da sazonalidade e tentativa de transformação


da série temporal em uma série estacionária, foram utilizados os resíduos do MQO (ResMqo)
realizado anteriormente. O gráfico resultante segue abaixo:

Para confirmar a estacionariedade da série acima, foi realizado uma vez mais o Teste
de Dickey-Fuller Aumentado. O resultado, desta vez, rejeita a hipótese nula (p-valor = 8.176e-
37), confirmando a estacionariedade da série

2
Teste Aumentado de Dickey-Fuller para ResMqo
testar para baixo a partir de d 14efasagens, critério AIC
tamanho da amostra: 198
hipótese nula de raiz unitária: a = 1

teste sem constante


incluindo 1 defasagem de (1-L)ResMqo
modelo: (1-L)y = (a-1)*y(-1) + ... + e
valor estimado de (a - 1): -1.71752
estatística de teste: tau_nc(1) = -17.3771
p-valor assintótico 8.176e-37
coeficiente de 1ª ordem para e: 0.000

3. Estimação do modelo através da análise do correlograma

O correlograma para os resíduos ResMqo apresentado abaixo, com defasagem de 20,


determinará o modelo ARMA(p,q) a ser utilizado na previsão:

Nota-se que, ao observar as signatures da FAC e FACP, parece haver uma convergência
suave para a FAC e um corte brusco para a FACP. Destarte, é provável que o modelo AR seja
mais adequado nessa situação. A despeito disso, testamos outras possibilidades, para garantir
que todos os resultados possíveis serão cobertos. Os resultados são apresentados na tabela
abaixo. Utilizou-se o teste de Ljung-box (defasagem de 20) para verificar a existência de
autocorrelação, procurando aceitar a hipótese nula de que os resíduos são ruído branco:

Modelo Coeficientes Teste Ljung-Box AIC


AR(1) Significativos NÃO PASSOU (1.902e-06) 1944.735
AR(2) Significativos PASSOU (0.9281) 1903.777
AR(3) Significativos PASSOU (0.8989) 1905.777
MA(1) Significativos NÃO PASSOU (0.004048) 1929.689
MA (2) Significativos PASSOU (0.2988) 1915.988
ARMA(1,1) Não Significativos -------- ------
ARMA(1,2) Não Significativos -------- ------

3
ARMA(2,1) Não Significativos -------- ------
Funções calculadas: 17
Cálculos de gradientes: 5

Modelo 13: ARMA, usando as observações 2001:01-2017:08 (T = 200)


Estimado usando o filtro de Kalman (Máxima verossimilhança exata)
Variável dependente: ResMqo
Erros padrão baseados na hessiana

coeficiente erro padrão z p-valor


--------------------------------------------------------
phi_1 −0.276119 0.0636120 −4.341 1.42e-05 ***
phi_2 −0.439225 0.0632636 −6.943 3.84e-12 ***

Média var. dependente −4.89e-13 D.P. var. dependente 31.62970


Média de inovações 0.050783 D.P. das inovações 27.78062
Log da verossimilhança −948.8885 Critério de Akaike 1903.777
Critério de Schwarz 1913.672 Critério Hannan-Quinn 1907.781

Real Imaginária Módulo Frequência


-----------------------------------------------------------
AR
Raiz 1 -0.3143 -1.4758 1.5089 -0.2834
Raiz 2 -0.3143 1.4758 1.5089 0.2834
-----------------------------------------------------------

Teste para autocorrelação até a ordem 20

Ljung-Box Q' = 10.1134,


com p-valor = P(Qui-quadrado(18) > 10.1134) = 0.9281

O modelo mais adequado, portanto, é o AR(2).

4 – Modelo Final e Previsão

Uma vez que o modelo encontrado que se mostrou mais adequado foi o AR(2), a
equação de previsão de vendas foi elaborada a partir dos parâmetros do modelo final ajustado,
incluindo como variável dependente v1 (a série temporal original) adicionadas as
sazonalidades, a variável tempo (time) e uma constante (const). Assim, temos:

𝑋𝑡 = 𝑌𝑡 − (1344.03 + 8.7𝑡 + 403.154𝛿2(𝑡) ) (1)


𝑋𝑡 = −0.276𝑋𝑡−1 − 0.439𝑋𝑡−2 + 𝜀𝑡 (2)

Substituindo (1) em (2) temos,

𝑋𝑡 = 2294,97 + 14,92𝑡 + 403.15𝛿2(𝑡) + 111,27𝛿2(𝑡−1) + 176,98𝛿2(𝑡−2)


− 0,276𝑌𝑡−1 − 0,439𝑌𝑡−2 + 𝜀𝑡

Analisando o modelo final, podemos afirmar que existe uma tendência temporal de
acréscimo de R$1492 nas vendas, bem como redução de 27,6% de vendas do mês anterior (t-
1), menos 43,9% do mês retrasado (t-2), acrescido de 40,315% nos meses de fevereiro. Existe
ainda a tendência temporal da constante 2294.97 (229.497%).

4
Funções calculadas: 20
Cálculos de gradientes: 1

Modelo 14: ARMAX, usando as observações 2001:01-2017:08 (T = 200)


Estimado usando o filtro de Kalman (Máxima verossimilhança exata)
Variável dependente: v1
Erros padrão baseados na hessiana

coeficiente erro padrão z p-valor


-----------------------------------------------------------
const 1344.03 3.57768 375.7 0.0000 ***
phi_1 −0.276179 0.0637679 −4.331 1.48e-05 ***
phi_2 −0.441526 0.0633007 −6.975 3.06e-12 ***
time 8.68698 0.0809326 107.3 0.0000 ***
dm2 403.154 6.71427 60.04 0.0000 ***
sq_time −0.0509855 0.000390133 −130.7 0.0000 ***

Média var. dependente 1566.276 D.P. var. dependente 212.2887


Média de inovações −0.208000 D.P. das inovações 27.77513
Log da verossimilhança −948.8514 Critério de Akaike 1911.703
Critério de Schwarz 1934.791 Critério Hannan-Quinn 1921.046

Real Imaginária Módulo Frequência


-----------------------------------------------------------
AR
Raiz 1 -0.3128 -1.4721 1.5049 -0.2833
Raiz 2 -0.3128 1.4721 1.5049 0.2833
-----------------------------------------------------------

Assim sendo, seguem, abaixo, os dados de previsão pontual e intervalar, para um


intervalo de confiança de 95%, para os três meses subsequentes da série temporal informada
pela empresa. O gráfico com os dados pode ser verificado abaixo.

v1 Previsão Intervalo a 95%


2017:09 1029.32 974.883 - 1083.76
2017:10 1027.58 971.105 - 1084.06
2017:11 1004.30 944.428 - 1064.18

Anda mungkin juga menyukai