Anda di halaman 1dari 23

Konsep Dasar:

Model BoxJenkins/ARIMA
Lembaga Penelitian dan Pemberdayaan Masyarakat Institut Pertanian Bogor 2006

ARIMA
n

Metodologi ARIMA merupakan suatu pendekatan pembentukan model yang sangat akurat untuk analisis deret waktu. Metode ini memberikan kajian yang teliti dan dapat digunakan dalam berbagai situasi dimana terdapat data dalam periode yang wajar dan di mana peramalan yang seksama merupakan bagian pokok dari suatu perencanaan yang lebih besar Kelemahannya, metode ini cukup sukar dipahami terlebih untuk orang-orang yang sama sekali tidak memiliki latar belakang ilmu statistika dan prosesnya yang iteratif dapat memakan waktu cukup lama. Namun saat ini sudah tersedia program-program paket komputer dalam berbagai bentuk, sehingga metode ini dapat diterapkan dalam berbagai sistem tanpa membutuhkan waktu lama.

Empat Langkah Pembuatan Model ARIMA:


n

Identifikasi model tentatif (sementara) dengan memanfaatkan plot ACF dan PACF dari data asli yang sudah distasionerkan. Pendugaan parameter dari model tentatif yang telah teridentifikasi. Cek diagnostik untuk memeriksa apakah model tentatif sudah cukup memadai, jika belum, dicari model baru untuk memperbaikinya. Peramalan nilai-nilai yang akan datang berdasarkan model akhir.

Kestasioneran
Berbicara mengenai kestasioneran, hal pertama yang perlu diperhatikan dalam membangun model time series, seperti ARIMA adalah kestasioneran dari data. Kenyatannya kebanyakan deret waktu bersifat non-stasioner. Aspek-aspek AR dan MA dari model ARIMA hanya berkenaan dengan deret waktu yang stasioner (Makridakis et al., 1991)

Untuk mengatasi data yang tidak stasioner dilakukan differencing/pembedaan yang dirumuskan sebagai: Pembedaan orde d= (1 B )d X t ,
BX
t

= X

t 1

Kestasioneran (contd)
3100 3000 2900 2800 HB-2 2700 2600 2500 2400 2300 Index 10 20 30 40 50 60

0.2

data tidak stasioner, maka dilakukan pembedaan satu data menjadi lebih stasioner

0.1 diff1 0.0 -0.1 Index 10 20 30 40 50 60

Plot ACF dan PACF


Plot ACF dan PACF sangat berguna dalam memprediksikan orde p, q, P dan Q dalam model, dengan melihat dua kernungkinan bentuk dasar: cuts off (terpotong) atau dies down (menurun dengan cepat) dengan pola sinus/eksponensial. Petunjuk selengkapnya untuk tahap identifikasi model tentatif ini dapat dilihat pada tabel berikut ini:

Tabel Petunjuk untuk Pendugaan Orde Model Non-musiman maupun Musiman Berdasarkan Plot ACF dan PACF
No 1. 2. 3. Kemungkinan Plot ACF dan PACF ACF nyata pada lag ke-1,2,..,q dan terpotong pada lag-q (cuts off) PACF menurun cepat membentuk pola eksponensial atau sinus (dies down) ACF dies down PACF nyata pada lag -p dan cuts off setelah lag ke-p ACF nyata pada lag -q dan cuts off setelah lag ke-q PACF nyata pada lag -p dan cuts off setelah lag ke-p Model Tentatif ARMA MA(q) AR(p) MA(q) jika ACF cuts off lebih tajam, AR(p) jika PACF cuts off lebih tajam ARMA(0,0) ARMA(p,q) MA(Q) AR(P) MA(q) jika ACF cuts off lebih tajam, AR(p) jika PACF cuts off lebih tajam ARMA(0,0) ARMA(P,Q)

4. 5. 6. 7. 8.

Tidak ada autokorelasi yang nyata pada plot ACF dan PACF ACF dies down PACF dies down ACF nyata pada lag ke-S,2S,..,QS dan cuts off setelah lag-QS PACF dies down ACF dies down PACF nyata pada lag S, 2S,...PS dan cuts off setelah lag ke-PS ACF nyata pada lag ke-S,2S,..,QS dan cuts off setelah lag-QS PACF nyata pada lag -S, 2S,...PS dan cuts off setelah lag ke-PS

9. 10.

Tidak ada autokorelasi yang nyata pada level musiman dalam plot ACF dan PACF ACF dies down pada level musiman PACF dies down pada level musiman

Analisis Sisaan Model


n n

Sebuah model dapat dikatakan baik jika sisaannya sudah tidak mengandung pola. Untuk maksud ini, plot ACF dan atau PACF dapat dimanfaatkan lagi. Sisaan dapat disimpulkan tidak berpola, atau bersifat acak, jika tidak lagi terdapat autokorelasi dan parsial autokorelasi yang signifikan pada plot ACF dan PACF-nya. Untuk uji terhadap sekumpulan nilai-nilai autokorelasi sisaan dapat digunakan statistik Q Box-Pierce. Uji Q mampu menetapkan apakah sekumpulan autokorelasi secara keseluruhan berbeda dari himpunan kosong . m 2 Statistik Q dihitung sebagai berikut: Q = n rk
k =1

dengan m adalah lag maksimum dan n adalah jumlah pengamatan asli dikurangi derajat pembedaan (n=N-d).

Analisis Sisaan Model (contd)


n n

Statistik Q akan mengikuti sebaran dengan derajat bebas m-p-q-P-Q. Kaidah pengambilan keputusannya ialah jika Q< maka himpunan 2 X autokorelasi yang dimaksud dapat dianggap sebanding dengan himpunan kosong, dan diputuskan sebaliknya jika Q> X 2 Selain sifat acak, sifat lain yang perlu diuji dari sisaan adalah kenormalannya. Salah satu uji yang dapat digunakan untuk memeriksa kenormalan sisaan adalah uji Anderson Darling Dan yang terakhir adalah menguji adanya heteroskedastisitas atau error memiliki variance yang tidak konstan dengan uji LM.

Analisis Sisaan Model (contd)


n n

Uji LM merupakan prosedur pengujian keheterogenan ragam galat dalam deret waktu. Hipotesis yang diuji adalah hipotesis galat adalah konstan lawan adanya heteroscedastisitas. Jika ada heteroskedastisitas maka galat merupakan proses ARCH (Autoregressive Conditional Heteroscedasticity) atau GARCH (Generalized Autoregressive Conditional Heteroscedasticity). Prosedur pengujian hipotesis: - Pendugaan model bagi deret xt menggunakan metode kuadrat terkecil (MKT) untuk mendapatkan model AR(p) dari: yt =ao +a1yt +...+an ytn +t
2 t . Regresikan kuadrat sisaan tersebut untuk menduga - Hitung sisaan ,

paramater persamaan berikut: t 2 = o + 1t 1 2 + ... + q t q 2 - Apabila tidak ada pengaruh ARCH atau GARCH, maka dugaan bagi 1 sampai q haruslah sama dengan nol.2Dengan sample sebanyak T buah sisaan, TR2 konvergen ke sebaran q Apabila TR2 cukup besar, maka hipotesis nol ditolak, dan sebaliknya

Overfitting Model
n

Jika model tentatif yang memenuhi ketentuan-ketentuan tadi telah berhasil diperoleh, maka usaha berikutnya adalah melakukan overfitting, yaitu menambah orde model. Kadang-kadang usaha ini dapat memberikan alternatif model yang lebih baik, dalam arti penyimpangannya lebih kecil, namun tetap memenuhi syarat signifikansi dan stasioneritas parameter serta kebebasan dan kenormalan sisaan. Setelah semua tahapan ini dikerjakan barulah dapat ditentukan model finalnya, yaitu model terbaik yang (idealnya) "lolos" dari seluruh batasan asumsi. Dengan model akhir ini dapat dilakukan peramalan nilai-nilai variabel dimaksud untuk beberapa periode yang akan datang.

Proses Moving Average (MA)


Proses moving average berorde q menyatakan hubungan ketergantungan antara nilai pengamatan Yt, dengan nilai-nilai kesalahan yang berurutan dari periode t sampai periode t-q, diformulasikan sebagai:
Z t = a t 1 a t 1 2 a t 2 ..... q a t q

Contoh Kasus: Proses Moving Average (MA)


Autocorrelation Function for Xt
(with 5% significance limits for the autocorrelations) 1.0 0.8 0.6 A utocorrelation 0.4 0.2 0.0 -0.2 -0.4 -0.6 -0.8 -1.0 1 5 10 15 20 Lag 25 30 35

PACF menurun cepat membentuk pola eksponensial atau sinus (dies down)

Partial Autocorrelation Function for Xt


(with 5% significance limits for the partial autocorrelations) 1.0 0.8 Partial Autocorrelation 0.6 0.4 0.2 0.0 -0.2 -0.4 -0.6 -0.8 -1.0 1 5 10 15 20 Lag 25 30 35

ACF terpotong pada lag-1 (cuts off)

Proses Autoregresif (AR)


Proses autoregresif berorde-p menyatakan bahwa nilai pengamatan pada periode ke-1, Y,, merupakan hasil regresi dari nilai-nilai pengamatan sebelumnya selama p periode. Model AR(p) biasa diformulasikan dalam tiga bentuk sebagai berikut:
Z t = 1 Z t 1 2 Z t 2 ..... p Z p + a t

Contoh Kasus: Proses Autoregresif (AR)


Autocorrelation Function for Zt
(with 5% significance limits for the autocorrelations) 1.0 0.8 0.6 A utocorrelation 0.4 0.2 0.0 -0.2 -0.4 -0.6 -0.8 -1.0 1 5 10 15 20 Lag 25 30 35

ACF dies down

Partial Autocorrelation Function for Zt


(with 5% significance limits for the partial autocorrelations) 1.0 0.8 Partial A utocorrelation 0.6 0.4 0.2 0.0 -0.2 -0.4 -0.6 -0.8 -1.0 1 5 10 15 20 Lag 25 30 35

PACF nyata pada lag -1 dan cuts off setelah lag ke-1

ARIMA BOX-JENKINS
Pada model ARIMA (p,d,q) terjadi proses autofregresif berorde-p atau proses moving average berorde-q atau kombinasi dari keduanya. Pembedaan berorde-d dilakukan jika deret tidak stasioner. Model teoritis adalah sebagai berikut:

dimana Xt p B d q t
p

( B )

= +

( B )

=Nilai pengamatan saat t =autoregressive polynomial operator =backshift operator = d differencing operator =a constant (setara dengan ()) =moving average polynomial parameter =random error component

ARIMA Multiplikatif
ARIMA(p,d,q)(P,D,Q)s

Kerumitan terakhir yang dapat & tambahkan pada model ARIMA adalah faktor musim. Adanya faktor musiman pada model ARIMA dapat teridentifikasi jika deret data memperlihatkan bahwa pada satu musim penuh terdapat sifat-sifat ARIMA tertentu, kemudian sifat yang sama muncul lagi pada musim-musim. berikutnya. Fenomena musiman, sering terjadi Pada data bulanan atau kuartalan (triwulanan). Bentuk umum model multiplikatif non-musiman dan musiman ARIMA (p,d,q) (P,D,Q)s adalah:
dengan :

p ( B ) p ( B s )(1 B s ) D X t = + q ( B ) q ( B s ) t
= operator polinomial AR faktor non- musiman = operator polinomial MA faktor non musiman = konstanta = operator polinomial AR faktor musiman = operator polinomial MA faktor musiman = jumlah periode per musim = operator pembedaan factor musiman. = operator pembedaan factor musiman. = operator shift mundur faktor non-musiman = operator shift mundur faktor musiman

p q

p
q

S
= (1 B) d
d

s = (1 B s ) D
D

B =
s

Contoh Kasus: ARIMA Multiplikatif


Step 1: Check kestasioneran data
18 16 14 12 penjualan 10 8 6 4 2 0 1 7 14 21 28 35 42 Index 49 56 63 70

Autocorrelation

Pola autokorelasi bernilai besar pada jarak Pola autokorelasi bernilai besar pada jarak 12 indikasi adanya seasonal 12 indikasi adanya seasonal 1.0 Autokorelasi pada lag 12, 24, 36 menurun 0.8 Autokorelasi pada lag 12, 24, 36 menurun 0.6 lambat indikasi seasonal tidak stasioner lambat indikasi seasonal tidak stasioner 0.4
0.2 0.0 -0.2 -0.4 -0.6 -0.8 -1.0 1 5

Autocorrelation Function for C2


(with 5% significance limits for the autocorrelations)

Time Series Plot of penjualan

Plot ACF upaya menstasionerkan data

10

15

20 Lag

25

30

35

Lag=12
(with 5% significance limits for the autocorrelations) 1.0 0.8 0.6 Autocorrelation 0.4 0.2 0.0 -0.2 -0.4 -0.6 -0.8 -1.0 1 5 10 15 20 Lag 25 30 35

Autocorrelation Function for penjualan

Autokorelasi pada lag regular sudah menurun Autokorelasi pada lag regular sudah menurun dengan cepat stasioner dengan cepat stasioner Autokorelasi pada lag seasonal sudah menurun Autokorelasi pada lag seasonal sudah menurun dengan cepat stasioner dengan cepat stasioner

Step 2: Membangun model ARIMA

Contoh Kasus: ARIMA Multiplikatif (Contd)


Autocorrelation Function for C2

(with 5% significance limits for the autocorrelations) 1.0 0.8 0.6 A utocorrelation 0.4 0.2 0.0 -0.2 -0.4 -0.6 -0.8 -1.0 1 5 10 15 20 Lag 25 30 35

Identifikasi dilakukan pada series yang Identifikasi dilakukan pada series yang sudah stasioner. sudah stasioner. Ordo Regular AR 1 Ordo Regular AR 1 Ordo Seasonal AR 1 Ordo Seasonal AR 1

(with 5% significance limits for the partial autocorrelations) 1.0 0.8 Partial Autocorrelation 0.6 0.4 0.2 0.0 -0.2 -0.4 -0.6 -0.8 -1.0 1 5 10 15 20 Lag 25 30 35

Partial Autocorrelation Function for C2

Ordo Regular MA 1 Ordo Regular MA 1 Ordo Seasonal MA 1 Ordo Seasonal MA 1 Jangan lupa, kita telah melakukan Jangan lupa, kita telah melakukan differencing dengan lag 12 sebanyak 1 kali. differencing dengan lag 12 sebanyak 1 kali.

ARIMA Specification
Final Estimates of Parameters Type Coef SE Coef T P AR 1 0.1747 0.4583 0.38 0.704 SAR 12 -0.5421 0.1335 -4.06 0.000 MA 1 0.4528 0.4115 1.10 0.276 SMA 12 0.8249 0.1324 6.23 0.000 Constant 0.50910 0.02992 17.01 0.000 seasonal AR seasonal AR seasonal Differencing seasonal Differencing seasonal MA seasonal MA

Hasil identifikasi ordo: ARIMA (1,0,1) (1,1,1)12


Regular AR Regular AR Regular Differencing Regular Differencing Regular MA Regular MA Periode Periode seasonal seasonal

Differencing: 0 regular, 1 seasonal of order 12 Number of observations: Original series 72, a fter differencing 60 Residuals: SS = 216.328 (backforecasts excluded) MS = 3.933 DF = 55

Modified Box-Pierce (Ljung-Box) Chi-Square statistic Lag 12 24 36 48 Chi-Square 8.9 17.3 37.1 48.2 DF 7 19 31 43 P-Value 0.263 0.569 0.209 0.271

Step 3: Cek Diagnostic

Hasil Output Diagnostic


Final Estimates of Parameters Type Coef SE Coef T P SAR 12 -0.5335 0.1317 -4.05 0.000 MA 1 0.2719 0.1350 2.01 0.049 SMA 12 0.8278 0.1269 6.53 0.000 Constant 0.62902 0.03913 16.07 0.000

Parameter yang tidak significant Dihilangkan

Differencing: 0 regular, 1 seasonal of order 12 Number of observations: Original series 72, after differencing 60 Residuals: SS = 217.053 (backforecasts excluded) MS = 3.876 DF = 56 Modified Box-Pierce (Ljung-Box) Chi-Square statistic Lag 12 24 36 48 Chi-Square 7.5 15.5 35.4 45.3 DF 8 20 32 44 P-Value 0.480 0.748 0.311 0.419

Step 3: Cek Diagnostic (Contd)

Hasil Output Forecasting


Step 4: Forecasting
20

Time Series Plot for penjualan


(with forecasts and their 95% confidence limits)

15 penjualan

10

Peramalan 1 tahun kedepan

0 1 6 12 18 24 30 36 42 48 Time 54 60 66 72 78 84

Sekian dan Terima Kasih