Anda di halaman 1dari 45

Penerapan Model ARIMA

(Bagian I)

Dr. Kusman Sadik, M.Si


Departemen Statistika IPB, 2016

1
Ada tiga tahapan iterasi dalam pemodelan data deret waktu,
yaitu:
1. Penentuan model tentatif (spesifikasi model) berdasarkan
data contoh untuk mengidentifikasi nilai p, d, dan q.
2. Pendugaan parameter model ARIMA(p, d, q) yang
diidentifikasi, yaitu penduga nilai , , dan σ2𝑒 .
3. Analisis diagnostik untuk melihat kelayakan model.

2
 Prosedur iterasi ini sering disebut ”Metode Box-
Jenkins”.
 Untuk model ARIMA(p, d, q), spesifikasi dilakukan
untuk menentukan nilai p, d, dan q.
 Alat yang digunakan pada tahap identifikasi ini adalah
fungsi autokorelasi.
 Fungsi autokorelasi ini diduga dari data contoh atau
disebut fungsi autokorelasi contoh (sample of
autocorrelation function atau SACF atau ACF saja).
 Disamping itu ada pula fungsi autokorelasi parsial
(sample of partial autocorrelation function atau SPACF
atau PACF saja)

3
a. ACF
nk

 (Y  Y )(Y
t t k Y )
 rk  t 1
n
, k  1, 2, ....
 t
(Y
t 1
 Y ) 2

Y t
 Y  t 1
n
 rk merupakan penduga bagi k

4
a. PACF
 PACF : kk = Corr(Yt, Yt-k | Yt-1, Yt-2, …, Yt-k+1)
 Berdasarkan persamaan Yule-Walker:
j = k1j-1 + k2j-2 + ... + kkj-k
j = 1, 2, ..., k; Catatan: j = -j dan 0 = 1
k  ACF; kk  PACF
ˆkk  penduga bagi kk

5
Contoh:
Misal diketahui data : 4, 2, 5, 1. Tentukan ACF (r1, r2) dan
PACF (𝜙11 , 𝜙22 )

nk

 (Y  Y )(Y
t t k Y )
Melalui persamaan rk  t 1
n
, k  1, 2, ....
 t
(Y
t 1
 Y ) 2

Dapat diperoleh penduga ACF : r1 = -0.7 dan r2 = 0.4

6
Berdasarkan persamaan Yule-Walker dapat diperoleh
penduga PACF kk:
j = k1j-1 + k2j-2 + ... + kkj-k

Untuk k =1  j = 1
1 = 110  1 = 11(1)  r1 = 𝜙11 = -0.7

Untuk k = 2  j = 1, 2
1 = 210 + 221  1 = 21 + 221
2 = 211 + 220  2 = 211 + 22

7
1 = 210 + 221  1 = 21 + 221
2 = 211 + 220  2 = 211 + 22

(1)2 = 211 + 22(1)2 ...... Pers(1)


2 = 211 + 22 …….. Pers(2)

Berdasarkan Pers(1) dan Pers(2) diperoleh:


(1)2 - 2 = 22(1)2 - 22
22 = {(1)2 - 2}/{(1)2 - 1}
𝜙22 = {(r1)2 - r2}/{(r1)2 - 1} = 0.09/(-0.51) = -0.176

8
Pengidentifikasian Model

Model MA: Misal MA(1) : Yt = et - et-1


 
1   2 ; k  1

ACF : k  
 0 ; k 1

1.0
1.0
0.8
0.8

k 0.6
rk 0.6

0.4
0.4

0.2 0.2

0.0
k 0.0
k
1 2 3 4 5 1 2 3 4 5 6
ACF
Sample of ACF

9
 Karena rk berasal dari data contoh maka diperlukan galat
baku bagi rk yaitu Srk.
 Sebagai nilai pendekatan : Srk = 1 / n , dimana n adalah
banyaknya data.
 Sehingga hipotesis H0 : k = 0 ditolak jika | rk | > 2Srk

atau | rk | > 2 / n .

 Misalnya, jika | r1 | > 2 / n dan | rk | < 2 / n untuk k =


2, 3, …, maka model tentatifnya adalah MA(1).

10
Model AR : Misalkan AR(1) : Yt = Yt-1 + et
 ACF : k = k ; k = 1, 2, …
 Untuk model AR, ACF merupakan fungsi eksponensial
sehingga ACF tidak dapat digunakan untuk menentukan
nilai p dalam AR(p).
 PACF : untuk k = 1  1 = 11
untuk k = 2  1 = 21 + 221 .... (1)
2 = 211 + 22 .... (2)

11
Berdasarkan persamaan (1) dan (2)  22 = 0.
Demikian juga 33 = 44 = ... = 0.

 1 ; k 1

Sehingga PACF AR(1): kk  
 0 ; k 1

 Dengan demikian PACF dapat digunakan sebagai
penentu nilai p dalam model AR(p).

1.0
1.0
0.8
0.8

kk 0.6
ˆ
kk
0.6

0.4 0.4

0.2 0.2

0.0 0.0
1 2 3 4 5 1 2 3 4 5 6

PACF Sample of PACF

 Hipotesis H0 : kk = 0 ditolak jika | ˆkk |  2 / n .

12
Pengidentifikasian nilai p dan q

1.0

0.8 tails off


0.6

0.4

0.2

0.0
1 2 3 4 5 6 7 8 9

Sample of ACF

1.0
cuts off after lag q
0.8

0.6

0.4

0.2

0.0
1 2 3 4 5 6 7 8 9

Sample of ACF

13
14
Contoh (1)

15
Contoh (2)

16
Contoh (3)

d=1

d=1

17
Pendugaan Parameter Model

Apabila nilai p, d, dan q sudah dapat diidentifikasi, maka


selanjutnya dilakukan pendugaan terhadap parameter model,
yaitu 1, 2, ..., p untuk model AR(p) dan 1, 2, ..., q untuk
model MA(q) berdasarkan data terobservasi Y1, Y2, ..., Yn.

Metode pendugaan parameter :


 Metode momen,
 Metode kuadrat terkecil (least-square),
 Metode kemungkinan maksimum (maximum likelihood).

18
1. Metode Momen
Metode ini didasarkan pada persamaan momen contoh dan
momen teoritis, kemudian memecahkan persamaan-persamaan
tersebut untuk mendapatkan penduga bagi parameter model.
Misalnya, menduga rataan populasi (teoritis)  dengan rataan
contoh Y .

Model AR
a. AR(1) : Yt = Yt-1 + et
 k = k ; k = 1, 2, …
 1 =   ˆ1  ˆ  r1 = ˆ
 Jadi pada AR(1) penduga bagi parameter model, ,
adalah r1 yang dapat dihitung dari data.
19
b. AR(1) : Yt =  + Yt-1 + et
 Bagaimana menduga  ?
 Perhatikan model : (Yt - 𝑌)= (Yt-1 - 𝑌) + et
↔ (Yt - 𝑌)= (Yt-1 - 𝑌) + et
↔ Yt = (1 - )𝑌 + Yt-1 + et
↔ Yt =  + Yt-1 + et
Sehingga :  = (1 - )𝑌

20
c. AR(2) : Yt = 1Yt-1 + 2Yt-2 + et
Berdasarkan persamaan Yule-Walker :
k = 1k-1 + 2k-2 + ... + pk-p
maka diperoleh
1 = 1 + 21 dan 2 = 11 + 2
dengan metode momen diperoleh:
r1 = ˆ1 + ˆ2 r1 dan r2 = r1 ˆ1 + ˆ2
penyelesaian terhadap dua persamaan ini diperoleh:

r1 (1  r2 ) r2  r1
2
ˆ
1  ˆ
dan 2 
1  r1 1  r1
2 2

21
Model MA
MA(1) : Yt = et - et-1

 ˆ
1    r1  
1 2 1  ˆ 2

 1  1  4r1
2

sehingga diperoleh : ˆ 
2r1

 Sebagai catatan untuk persamaan ini, apabila | r1 | > 0.5


maka metode momen gagal untuk menduga parameter .
 Untuk MA(2), MA(3), dst, metode momen menjadi
sangat kompleks, sehingga harus menggunakan metode
pendugaan lainnya.

22
Model ARMA
ARMA(1, 1) : Yt = Yt-1 - et-1 + et
(1   )(   ) k 1
k  
1  2   2

2 r
  sehingga penduga bagi  adalah : ˆ  2
1 r1

Untuk menduga  dapat digunakan persamaan pertama


dengan cara mengganti 1 dengan r1 dan  dengan ˆ , yaitu

(1  ˆˆ)(ˆ  ˆ)
r1 
1  2ˆˆ  ˆ 2

23
Contoh Kasus (Latihan):
Misalnya diketahui model AR(2) : Yt =  + 1Yt-1 + 2Yt-2 + et.
Berdasarkan data diketahui bahwa r1 = 0.75, r2 = 0.61, dan
Y = 4.5. Tentukan ̂ , ˆ1 , dan ˆ2 dengan metode momen.

24
2. Metode Kuadrat Terkecil
Metode ini dilakukan dengan cara meminimumkan komponen
n

 et .
2
pada galat, yaitu
t 1

AR(1) : Yt = Yt-1 + et  et = Yt - Yt-1


n n
S() =  et =  (Y  Y
2 2
t t 1 )
t 1 t 1

Penduga bagi parameter model, , dapat diperoleh


dengan cara meminimumkan S().

25
MA(1) : Yt = et - et-1  et = Yt + et-1
et = Yt + ( Yt-1 + et-2)
et = Yt + Yt-1 + 2Yt-2 + 3Yt-3 + ….

n
S() =  et
2

t 1

Meminimumkan S() tidak dapat dilakukan secara


analitik / kalkulus karena bersifat non-linear, sehingga
harus diselesaikan secara numerik / iteratif, salah
satunya melalui algoritma Gauss-Newton.

26
3. Metode Kemungkinan Maksimum
Metode ini dilakukan dengan cara memaksimumkan fungsi
kemungkinan (likelihood), berdasarkan fungsi sebaran galat (e t).

bsi
AR(1) : Yt = Yt-1 + et, misal et ~ N(0, e2)
n
1
f(e1, e2, …., en) = (2 ) 2 ( n 1) / 2
e . exp(
2 e2
 t)
e 2

t 1

n
1
L(, e2) = (2 )
2  ( n 1) / 2
e . exp(
2 e2
 (Y  Y ) )
t 1
t t
2

Penduga  dan e2 dapat diperoleh dengan cara


memaksimumkan fungsi kemungkinan L(, e2).

27
MA(1) : Yt = et - et-1
Fungsi kemungkinannya, L(, e2), bersifat non-linear
sehingga pemaksimumannya harus dilakukan secara
numerik / iteratif.

Catatan : SAS dan Minitab menggunakan metode iterasi


Gauss-Newton untuk menduga parameter AR(p),
MA(q), dan ARIMA(p, d, q).

28
Studi Kasus :
Tentukan model terbaik untuk data bulanan penjualan suatu
produk (Zt) sebagai berikut:

10

0
Zt

-10

Index 10 20 30 40

Zt : Data Asal

29
2

0
Zt(lag1)

-1

-2

-3
Index 10 20 30 40

Zt(lag1) : Data Zt setelah differencing ordo-1

30
3

1
Zt(lag2)

-1

-2

Index 10 20 30 40

Zt(lag2) : Data Zt setelah differencing ordo-2

31
Autocorrelation Function for Zt
(with 5% significance limits for the autocorrelations)

1.0
0.8
0.6
0.4
Autocorrelation

0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0

1 2 3 4 5 6 7 8 9 10 11
Lag

Ada indikasi tidak stasioner. Mengapa?


32
Autocorrelation Function for Zt(lag1)
(with 5% significance limits for the autocorrelations)

1.0
0.8
0.6
0.4
Autocorrelation

0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0

1 2 3 4 5 6 7 8 9 10 11
Lag

Ada indikasi tidak stasioner. Mengapa?


33
ACF
Autocorrelation Function for Zt(lag2)
(with 5% significance limits for the autocorrelations)

1.0
0.8
0.6
0.4
Autocorrelation

0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0

1 2 3 4 5 6 7 8 9 10 11
Lag

Ada indikasi sudah stasioner. Mengapa?


34
PACF

Partial Autocorrelation Function for Zt(lag2)


(with 5% significance limits for the partial autocorrelations)

1.0
0.8
0.6
Partial Autocorrelation

0.4
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0

1 2 3 4 5 6 7 8 9 10 11
Lag

35
Autocorrelation Function for Zt(lag2)
(with 5% significance limits for the autocorrelations)

1.0
0.8
0.6
0.4
Autocorrelation

0.2
0.0
-0.2
-0.4
-0.6
Partial Autocorrelation Function for Zt(lag2)
-0.8
(with 5% significance limits for the partial autocorrelations)
-1.0
1.0
1 2 3 4 5 6 7 8 9 10 11
Lag 0.8
0.6

Partial Autocorrelation
0.4
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0

1 2 3 4 5 6 7 8 9 10 11
Lag

Kandidat Model : ARIMA(0,2,1)dan ARIMA(1,2,0)

36
ARIMA(0,2,1)
ARIMA model for Yt

Estimates at each iteration


Iteration SSE Parameters
0 66.1073 0.100 0.031
1 57.5810 -0.050 -0.011
2 51.8387 -0.200 -0.048
3 48.8500 -0.350 -0.083
4 48.3704 -0.435 -0.099
5 48.3691 -0.439 -0.099
6 48.3691 -0.439 -0.099
Relative change in each estimate less than 0.0010

Final Estimates of Parameters


Type Coef SE Coef T P
MA 1 -0.4393 0.1371 -3.20 0.003
Constant -0.0995 0.1581 -0.63 0.533

Differencing: 2 regular differences


Number of observations: Original series 47, after
differencing 45
Residuals: SS = 48.3592
(backforecasts excluded)
MSE = 1.1246 DF = 43

37
ARIMA(1,2,0)
ARIMA model for Yt
Estimates at each iteration
Iteration SSE Parameters
0 55.9021 0.100 0.035
1 50.7183 0.250 -0.022
2 47.5927 0.400 -0.056
3 46.1186 0.543 -0.069
4 45.9902 0.582 -0.067
5 45.9806 0.592 -0.067
6 45.9799 0.595 -0.067
7 45.9799 0.596 -0.067
8 45.9799 0.596 -0.067

Relative change in each estimate less than 0.0010

Final Estimates of Parameters


Type Coef SE Coef T P
AR 1 0.5958 0.1225 4.86 0.000
Constant -0.06673 0.06299 -1.06 0.295

Differencing: 2 regular differences


Number of observations: Original series 47, after
differencing 45
Residuals: SS = 45.9799
(backforecasts excluded)
MSE = 1.0693 DF = 43

38
Pemilihan Model Terbaik Berdasarkan MSE Terkecil

Berdasarkan hasil di atas:

ARIMA(0, 2, 1)  MSE : 1.1246

ARIMA(1, 2, 0)  MSE : 1.0693

Sehingga model terbaik berdasarkan nilai MSE terkecil adalah


ARIMA(1, 2, 0).

Model terbaik yang diperoleh dapat digunakan untuk melakukan


peramalan.

39
1. Melalui Minitab, bangkitkan data yt, (n = 225), berupa
model ARIMA(1, 2, 0) dengan  = 0.5, Φ = 0.8 serta
et ~ Normal(0,1). Gunakan 200 data terakhir dan lakukan
proses berikut:
a. Berdasarkan ACF dan PACF untuk data yt tersebut,
identifikasilah kandidat model yang sesuai.
b. Berdasarkan kandidat model tersebut, tentukan model
terbaik berdasarkan nilai MSE-nya.
c. Bandingkan penduga parameter yang diperoleh untuk
model terbaik pada poin (b) tersebut dengan nilai
parameter yang sesungguhnya. Apa kesimpulan Anda?
40
2. Melalui Minitab, bangkitkan data yt, (n = 225), berupa
model ARIMA(1, 1, 2) dengan  = 1.0, Φ = 0.8, θ1 = - 0.9,
dan θ2 = 0.7 serta et ~ Normal(0,1). Gunakan 200 data
terakhir dan lakukan proses berikut:
a. Berdasarkan ACF dan PACF untuk data yt tersebut,
identifikasilah kandidat model yang sesuai.
b. Berdasarkan kandidat model tersebut, tentukan model
terbaik berdasarkan nilai MSE-nya.
c. Bandingkan penduga parameter yang diperoleh untuk
model terbaik pada poin (b) tersebut dengan nilai
parameter yang sesungguhnya. Apa kesimpulan Anda?

41
Lihat Montgomery : Exercise 5.11, hlm. 290

42
 Cryer, J.D. and Chan, K.S. 2008. Time Series Analysis with
Application in R. Springer.
 Montgomery, D.C., et.al. 2008. Forecasting Time Series Analysis
2nd. John Wiley.
 Wei, William, W.S. 1990. Time Series Analysis, Univariate and
Multivariate Methods. Adison-Wesley Publishing Company Inc,
Canada.
 Abraham, B. and Ledolter, J. 2005. Statistical Methods for
Forecasting. John Wiley.

43
Bisa di-download di
http://www.stat.ipb.ac.id/en/index.php?page=dr-kusman-sadik

44
45

Anda mungkin juga menyukai