Anda di halaman 1dari 10

PEMODELAN DAN PERAMALAN DATA DERET

WAKTU DENGAN METODE SEASONAL ARIMA


Abdussamad (1207015033), Andini Juita Sari (1207015065), Musmirani (1207015018)
Program Studi Statistika
Fakultas Matematika dan Ilmu Pengetahuan Alam
Universitas Mulawarman

Abstrak
Penelitian ini mempelajari suatu metode dalam meramalkan data time series yang berupa data
musiman. Metode yang dipakai dalam penelitian ini adalah Seasonal Autoregressive Integrated
Moving Average (SARIMA). Metode ini merupakan gabungan dari proses Autoregressive (AR)
Musiman dan Moving Average (MA) Musiman. Metode ini diaplikasikan pada data data tingkat
hunian hotel rata-rata wisatawan mancanegara di Propinsi DIY dari tahun 1991 2003.
Sehingga diperoleh ramalan tingkat hunian hotel rata-rata wisatawan mancanegara di Propinsi
DIY untuk tahun berikutnya. Hasil tersebut dibandingkan dengan data aktual dimana data yang
diperoleh tidak jauh berbeda dengan data aktual.
Kata Kunci: Metode SARIMA, AR Musiman, MA Musiman
1. Pendahuluan
Analisis deret waktu pada dasarnya digunakan untuk melakukan analisis data yang
mempertimbangkan pengaruh waktu. Data dikumpulkan secara periodik berdasarkan urutan
waktu, bisa dalam jam, hari, minggu, bulan, kuartal dan tahun. Analisis deret waktu dapat
dilakukan untuk membantu dalam menyusun perencanaan ke depan. Sebagai contoh, dalam
kasus peramalan banyaknya penumpang suatu maskapai penerbangan dalam rentang waktu
tertentu, yang diperlukan hanya data jumlah penumpang pada tahun-tahun sebelumnya. Model
deterministik adalah model yang nilai observasi mendatang dapat dihitung atau dapat diramalkan
secara pasti melalui suatu fungsi berdasarkan observasi masa lampau, tetapi peramalan hanya
berlaku untuk data yang ada saja. Untuk menentukan metode peramalan pada data deret waktu
perlu diketahui pola dari data tersebut sehingga peramalan data dapat dilakukan dengan metode
yang sesuai. Pola data dapat dibedakan menjadi empat jenis, yaitu pola musiman, siklis, trend,
dan irregular.
Pola musiman merupakan fluktuasi dari data yang terjadi secara periodik dalam kurun waktu
satu tahun, seperti triwulan, kuartalan, bulanan, mingguan, atau harian. Pola siklis terjadi apabila
datanya dipengaruhi oleh fluktuasi ekonomi jangka panjang, seperti yang berhubungan dengan
siklus bisnis. Pola ini sulit dideteksi dan tidak dapat dipisahkan dari pola trend. Pola trend
merupakan kecenderungan arah data dalam jangka panjang, dapat berupa kenaikan maupun
penurunan. Sedangkan pola irregularmerupakan kejadian yang tidak terduga dan bersifat acak,
tetapi kemunculannya dapat mempengaruhi fluktuasi data time series.
Untuk data model stokastik terdapat beberapa model yang dapat digunakan seperti AR, MA,
ARMA, ARMA, SARIMA dan lainnya. Jika data mempunyai pola musiman, maka metode yang
lebih tepat adalah Seasonal Autoregressive Integreted Moving Average (SARIMA). Metode
inilah yang menjadi pokok bahasan pada paper ini.
2. Metodologi
Langkah-langkah pemodelan Seasonal Autoregressive Integrated Moving Average (SARIMA)
adalah :
(1) Proses identikasi model.
(2) Pendugaan parameter model.
(3) Pemeriksaan residual(sisaan).
1

(4) Mengunakan model untuk peramalan jika model memenuhi syarat.


3. Model Autoregressive Integrated Moving Average (ARIMA)
3.1.
Model Autoregressive (AR)
Model AR(p) adalah model dimana Zt merupakan fungsi dari data di masa yang lalu, yakni t-1, t
-2, , t - p. Persamaan AR diberikan oleh
Z t =+ 1 Z t 1 + 2 Z t 2+ + p Z t p + at

(3.1)

3.2.
Model Moving Average Autoregressive (MA)
Model MA(q) adalah model untuk memprediksi Zt sebagai fungsi dari kesalahan prediksi di
masa lalu (past forecast error) dalam memprediksi Zt . Persamaan MA diberikan oleh:
Z t =+a t 1 a t1+ 1 at2 ++ q atq

(3.2)

3.3.
Model ARIMA
Model ARIMA dilakukan pada data stasioner atau data yang didifferencing sehingga data telah
stasioner. Secara umum, model ARIMA dinotasikan sebagai ARIMA(p,d,q). Model ini
merupakan gabungan dari model ARMA(p; q) dan proses didifferencing, yaitu :
d

1B Z

p ( B)

(3.3)

4. Metode Seasonal Autoregressive Integrated Moving Average (SARIMA)


4.1.
Proses Moving Average (MA) Musiman
Bentuk umum dari proses Moving Average musiman periode S tingkat Q atau MA(Q)S
didefinisikan sebagai berikut.
Z t =at 1 at s +1 a t2 s ++Q a tQs

(4.1)

dimana at bersifat saling bebas terhadap Zt1, Zt2, yang berdistribusi normal dengan mean
0 dan varian 2.
Sebagai contoh dari model MA(Q) S akan dijelaskan dalam model MA(1)12. Suatu proses Zt
dikatakan mengikuti MA(1)12 jika Zt mengikuti model
Z t =at 1 at 12
(4.2)
4.2.
Proses Autoregressive (AR) Musiman
Bentuk umum dari proses Autoregressive musiman periode S tingkat P atau AR(P)S didefinisikan
sebagai :
Z t = 1 Z t s + 2 Zt 2 s ++ P Z t P +at
at

dimana
2

(4.3)

bersifat saling bebas Zt1, Zt2, yang berdistribusi normal dengan mean 0 dan

varian .
Sebagai contoh dari model AR(P)S akan dijelaskan dalam model AR(1)12. Suatu
proses Xt dikatakan mengikuti AR(1)12 jika Xt mengikuti model :
2

Z t = 1 Z t 12+ at

(4.5)

4.3. Model Seasonal ARIMA


Musiman adalah kecenderungan mengulangi pola tingkah gerak dalam periode musim, biasanya
satu tahun untuk data bulanan. Model ARIMA Musiman merupakan model ARIMA yang
digunakan untuk menyelesaikan time series musiman yang terdiri dari dua bagian, yaitu bagian
tidak musiman (non-musiman) dan bagian musiman. Bagian non-musiman dari metode ini
adalah model ARIMA. Secara umum bentuk model ARIMA musiman atau ARIMA(p,d,q)
(P,Q,S)S adalah :
1B s D Z

1B d
(4.6)
p (B) P ( B s)

5. Peramalan Data Deret Waktu Musiman dengan Menggunakan Metode Seasonal


Autoregressive Integreted Moving Average (SARIMA)
Data yang digunakan dalam penerapan metode ini adalah data tingkat hunian hotel rata-rata
di Propinsi DIY Tahun 1991-2003. Langkah pertama yang dilakukan adalah proses identikasi
model. Proses identikasi model pertama kali diuji apakah data stasioner atau tidak yaitu dengan
melihat plot data asli serta ACF dan PACF dari data asli. Time series plot untuk data tersebut
adalah:
Time Series Plot of Data Wisman
40

Data Wisman

35

30

25

20

16

32

48

64

80
Index

96

112

128

144

Gambar 1. Tme Series Plot Data Wisman

Dari Gambar 1 belum bisa dibuktikan stasioner dalam rata-rata atau variansi. Sehingga untuk
mengetahui data stasioner dalam variansi dapat dilihat dari nilai estimate () pada Box-Cox
plot. Data stasioner apabila nilai =1 .

Box-Cox Plot of Data Wisman


Lower CL

10

Upper CL
Lambda
(using 95.0% confidence)

StDev

Estimate

1.60

LowerCL
UpperCL

0.81
2.53

Rounded Value

2.00

7
6
5
Limit
4
-5.0

-2.5

0.0
Lambda

2.5

5.0

Gambar 2. Box-Cox Plot Data Wisman


Box-Cox Plot of Transformasi_
Lower CL

300

Upper CL
Lambda
(using 95.0% confidence)

250

StDev

200

Estimate

1.00

LowerCL
UpperCL

0.46
1.54

Rounded Value

1.00

150

100
Limit

50
-5.0

-2.5

0.0
Lambda

2.5

5.0

Gambar 3. Box-Cox Plot Data Wisman setelah transformasi

Gambar2 merupakan Box-Cox plot data Wisman menunjukkan nilai =1,6 . Yang berarti data
belum stasioner dalam variansi. Untuk menstasionerkannya, maka data ditransformasi dengan
cara memangkatkan data dengan nilai estimatenya ( ).
1,6

Y t =[Z t ]

Gambar3 merupakan Box-Cox plot data Wisman yang sudah ditransformasi. Terlihat nilai
=1 menunjukkan data sudah stasioner dalam variansi. Kemudian untuk melihat data
stasioner dalam rata-rata dapat dilhat dari plot ACF dan PACF
Partial Autocorrelation Function for Data Wisman
(with 5% significance limits for the partial autocorrelations)
1.0

Partial Autocorrelation

0.8
0.6
0.4
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0
1

10

15

20
Lag

25

30

35

Gambar 4. PACF data Wisman (transformasi)

Autocorrelation Function for Data Wisman


(with 5% significance limits for the autocorrelations)
1.0
0.8

Autocorrelation

0.6
0.4
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0
1

10

15

20
Lag

25

30

35

Gambar 5. ACF data Wisman (transformasi)

Dari PACF plot dan ACF plot, terlihat bahwa data sudah stasioner dalam rata-rata, dan dapat
pula diidentifikasikan bahwa data memiliki pola musiman (s=12). Pada Gambar4 PACF plot cut
off pada lag 1 (AR=1) dan lag 12, 24 (SAR =24) dan Gambar5 ACF dies down pada lag 3
(MA=3) dan lag 12 (SMA=12).
5.1 Identifikasi Model ARIMA Box-Jenkins dan Pemeriksaan Parameter
Penaksiran parameter dilakukan dengan tujuan untuk menentukan apakah parameter model
^
sudah layak masuk kedalam model. Secara umum, misal adalah suatu parameter dan
adalah nilai taksiran dari parameter tersebut, maka uji hipotesis uji kesignifikanan parameter
dapat dilakukan sebagai berikut :
Hipotesis :
H0 : = 0 (parameter tidak signifikan)
H1 : 0 (parameter signifikan)
Statistik Uji :

t hitung =

^
SE ( ^ )

Daerah Kritis :
Tolak H0 apabila P-value < atau

|t hitung|

>

( 1 2 );df =nnp

dimana np = banyaknya

parameter
Tabel 1. Tabel Uji Signifikansi Parameter Model Sementara Data Wisman

Model Sementara
ARIMA (0,0,1)
(1,0,0)12
ARIMA (0,0,1)
(0,0,1)12

Signifikans
i
parameter
Ya
Tida
k

Model Sementara
ARIMA (1,0,3)
(0,0,1)12
ARIMA (1,0,3)
(1,0,1)12

Signifikans
i
parameter
Ya Tidak

ARIMA (0,0,1)
(1,0,1)12
ARIMA (1,0,0)
(1,0,0)12
ARIMA (1,0,0)
(0,0,1)12
ARIMA (1,0,0)
(1,0,1)12
ARIMA (1,0,1)
(1,0,0)12
ARIMA (1,0,1)
(0,0,1)12
ARIMA (1,0,1)
(1,0,1)12
ARIMA (1,0,2)
(1,0,0)12
ARIMA (1,0,2)
(0,0,1)12
ARIMA (1,0,2)
(1,0,1)12
ARIMA (1,0,3)
(1,0,0)12

ARIMA (0,0,1)
(2,0,0)12
ARIMA (0,0,1)
(2,0,1)12
ARIMA (1,0,0)
(2,0,0)12
ARIMA (1,0,0)
(2,0,1)12
ARIMA (1,0,1)
(2,0,0)12
ARIMA (1,0,1)
(2,0,1)12
ARIMA (1,0,2)
(2,0,0)12
ARIMA (1,0,2)
(2,0,1)12
ARIMA (1,0,3)
(2,0,0)12
ARIMA (1,0,3)
(2,0,1)12

Dari uji signifikansi parameter diperoleh model sementara yaitu ARIMA (0,0,1) (1,0,0) 12,
ARIMA (0,0,1) (0,0,1)12, , ARIMA (1,0,0) (1,0,0)12, ARIMA (1,0,0) (0,0,1)12, ARIMA (1,0,1)
(1,0,0)12, ARIMA (1,0,1) (1,0,1)12, ARIMA (0,0,1) (2,0,1)12 dan ARIMA (1,0,0) (2,0,1)12
5.2.

Pengujian Asumsi Residual


Untuk mendapatkan model yang baik setelah model memiliki parameter yang signifikan
selanjutnya melakukan pengujian terhadap residualnya yaitu melakukan pengujian apakah
residual white noise dan residual berdistribusi normal.
Residual ( at ) yang white noise (residual independen dan identik) harus berupa variabel
random. Uji yang digunakan untuk asumsi white noise adalah uji Ljung-Box (Wei, 1990).
Dimana uji ini bertujuan untuk menguji residual memenuhi asumsi white noise digunakan uji
sebagai berikut :
Hipotesis :

1=2 = K =0 (residual memenuhi asumsi white noise)


H1 : Minimal ada satu i 0 , untuk i = 1, 2, , K (residual tidak memenuhi asumsi
H0 :

white noise)

Statistik Uji : Ljung-Box statistic (Box-Pierce modified)

nk 1 ^k

Q=n (n+2)
k =1

dimana :
^k adalah taksiran autokorelasiresidual lag k
Daerah Kritis :
Tolak H0 apabila P-value < atau Q >

(1 );df =K p q dimana nilai p dan q adalah

order dari ARMA(p,q)


Tabel 2. Tabel Uji White Noise Model Sementara Data Wisman

Model ARIMA
(0,0,1)
(1,0,0)12

(0,0,1)
(0,0,1)12

(1,0,0)
(0,0,1)12

(1,0,0)
(1,0,0)12

(1,0,1)

La
g
12

Pvalue
0,000

24

0,000

36

0,000

48

0,000

12

0,000

24

0,000

36

0,000

48

0,000

12

0,349

24

0,179

36

0,148

48

0,171

12

0,205

24

0,047

36

0,037

48

0,049

12

0,526

Ket.
<
0.05
<
0.05
<
0.05
<
0.05
<
0.05
<
0.05
<
0.05
<
0.05
>
0.05
>
0.05
>
0.05
>
0.05
>
0.05
<
0.05
<
0.05
<
0.05
>
7

Kesimpulan

MSE

H0 ditolak,
sehingga
residual tidak
memenuhi
asumsi white
noise.

1660

H0 ditolak,
sehingga
residual tidak
memenuhi
asumsi white
noise.

1715

H0 diterima,
sehingga
residual
memenuhi
asumsi white
noise.

1436

H0 ditolak,
sehingga
residual tidak
memenuhi
asumsi white
noise.

1392

H0 diterima,

1349

(1,0,0)12

(1,0,1)
(1,0,1)12

(0,0,1)
(2,0,1)12

(1,0,0)
(2,0,1)12

24

0,417

36

0,120

48

0,175

12

0,383

24

0,028

36

0,007

48

0,002

12

0,000

24

0,000

36

0,000

48

0,000

12

0,009

24

0,000

36

0,000

48

0,000

0.05
>
0.05
>
0.05
>
0.05
>
0.05
<
0.05
<
0.05
<
0.05
<
0.05
<
0.05
<
0.05
<
0.05
<
0.05
<
0.05
<
0.05
<
0.05

sehingga
residual
memenuhi
asumsi white
noise.

H0 ditolak,
sehingga
residual tidak
memenuhi
asumsi white
noise.

1146

H0 ditolak,
sehingga
residual tidak
memenuhi
asumsi white
noise.

1612

H0 ditolak,
sehingga
residual tidak
memenuhi
asumsi white
noise.

1282

Diperoleh model sementara ARIMA (1,0,0) (0,0,1)12 dan ARIMA (1,0,1) (1,0,0)12 Selanjutnya
dilakukan proses diagnostik untuk melihat tingkat kesalahan model, yaitu dengan melihat
kenormalan distribusi residunya.
Normal Probability Plot of the Residuals
(response is Transformasi_)
99.9
99

Percent

95
90
80
70
60
50
40
30
20
10
5
1
0.1

-100

-50

0
Residual

50

100

150

Gambar 6. Normal Probability Plot ARIMA (1,0,0) (0,0,1)12

Normal Probability Plot of the Residuals


(response is Transformasi_)
99.9
99

Percent

95
90
80
70
60
50
40
30
20
10
5
1
0.1

-100

-50

0
Residual

50

100

Gambar 7. Normal Probability Plot ARIMA (1,0,1) (1,0,0)12

Gambar 7 memperlihatkan residual mengikuti garis diagonal, yang berarti residual berdistribusi
normal. Karena residual bersifat random dan berdistribusi normal, maka residual memenuhi
asumsi white noise.
5.3.

Pemilihan Model Terbaik


Untuk memilih model terbaik, akan diambil model dengan nilai MSE paling kecil. Dari Tabel
2 di atas dapat disimpulkan bahwa model SARIMA yang tebaik untuk data tingkat hunian hotel
rata-rata di Propinsi DIY adalah ARIMA(1,0,1)(1,0,0)12 karena memiliki nilai MSE terkecil
yaitu 1349.
Final Estimates of Parameters
Type
AR
1
SAR 12
MA
1
Constant
Mean

Coef
0.8184
0.5245
0.3382
19.217
222.60

SE Coef
0.0722
0.0725
0.1173
1.959
22.69

T
11.33
7.23
2.88
9.81

P
0.000
0.000
0.004
0.000

Number of observations: 156


Residuals:
SS = 204984 (backforecasts
excluded)
MS = 1349 DF = 152

Gambar 8. Nilai koefisien parameter model ARIMA(1,0,1)(1,0,0)12

Jadi model Seasonal ARIMA(1,0,1)(1,0,0)12 untuk data tingkat hunian hotel rata-rata di Propinsi
DIY adalah :
t12 + 1 1 Y t 131 at1 +a t
Y t = 1 Y t 1+ 1 Z

Y t =0,8184 Y t 1 +0,5242 Y t12 +0.4293 Y t130,3382 at 1+ at

dengan Y t
1,6
Y t =Z t

merupakan data transformasi dari Z t

Sehingga untuk mengembalikan data maka :


9

Y
[ t]1 /1,6
Z t =
5.4.

Peramalan
Hasil peramalan tingkat hunian hotel rata-rata di Propinsi DIY tahun 2004 disajikan pada
tabel berikut :
Tabel 3. Hasil Peramalan Berdasarkan Model ARIMA(1,0,1)(1,0,0)12
Bulan
Januari 04
Februari 04
Maret 04
April 04
Mei 04
Juni 04
Juli 04
Agustus 04
September
04
Oktober 04
November
04
Desember
04

Ramalan
Data
Transforma
si (Yt)
163,55
143,516
143,429
156,207
161,233
176,095
193,104
177,879
179,756

Ramalan
Data Asli
(Zt)

Data
Aktual

24,1842
22,2876
22,2792
23,4997
23,9695
25,3275
26,8299
25,4875
25,6553

24,52
21,89
20,18
17,66
22,51
23,90
26,32
23,99
22,69

169,461
153,245

24,7269
23,2202

18,82
20,77

200,403

27,4594

21,89

6. Kesimpulan
Dari penjelasan diatas dapat diambil kesimpulan bahwa metode SARIMA dapat dipakai
untuk data yang bersifat musiman yang dapat memberikan hasil peramalan yang tidak jauh
berbeda dengan data aktual,
Daftar Pustaka
Box, G,E,P,, Jenkins, G,M, and Reinsel, G,C, 1994. Time Series Analysis
Forecasting and Control Third Edition, New Jersey: Pearson Prentice Hall
Brockwell, P,J and Davis, R,A,, 1996. Introduction to Time Series and Forecasting.
Spinger-Verlag New York
Chatfield, C, 2000. Time-Series Forecasting. Boca Raton: Chapman and
Hall/CRC
Cryer, J,D,, 1986. Time Series Analysis. Duxbury Press, Boston,
Hanke, J,E, and Wichern, D,W, (2005), Business Forecasting Eight Edition,
New Jersey: Pearson Prentice Hall
Makridakis, S,, Wheelwright, S,C, and McGee, V,E, 1999. Metode dan Aplikasi
Peramalan Jilid 1 (Ir, Untung Sus Ardiyanto, M,Sc, dan Ir, Abdul Basith, M,Sc,
Terjemahan), Edisi Kedua, Jakarta: Penerbit Erlangga

10