Anda di halaman 1dari 6

1

PERAMALAN JUMLAH PENUMPANG KERETA API DENGAN METODE SARIMA (SEASONAL


AUTOREGRESSIVE INTEGRETED MOVING AVERAGE)
Alvian Imron Rosadi (12611134)
Mahasiswa Program Studi Statistika Universitas Islam Indonesia
Program Studi Statistika Fakultas Matematika dan Ilmu Pengetahuan Alam
Universitas Islam Indonesia
Alvianimron66@gmail.com
ABSTRAK
SARIMA merupakan pengembangan dari model ARIMA pada data runtutan waktu yang memiliki unsur
musiman. Notasi SARIMA adalah: SARIMA (p,d,q) (P,D,Q)S. Dengan p,d,q: bagian yang tidak musiman dari
model; (P,D,Q)S: bagian musiman dari model; S: jumlah periode per musim. Rumus umum SARIMA dapat
S

seasonal;

S D

P B P ( B ) (1B ) ( 1B ) Z t= q ( B)q (B )a t .

dituliskan:

( 1B )d = differencing non-seasonal;

non-seasonal;

Dengan:

P ( B ) =AR non-

( 1B S )

= differencing seasonal;

q ( B ) =MA

q ( BS ) =MA seasonal. Dalam paper ini penulis akan mengaplikasikan metode SARIMA

dengan penyesuaian aditif untuk meramalkan jumlah penumpang kereta api di Indonesia 9 periode kedepan
(April 2015 Desember 2015) karena plot data runtun waktu yang dihasilkan konstan.
Kata kunci: Forecasting, Peramalan Metode SARIMA
1.

Pendahuluan
1.1. Latar Belakang
Salah satu alat transportasi darat yang
umum digunakan untuk jarak jauh adalah
kereta api. Jumlah penumpang kereta api di
Indonesia dari tahun ke tahun cenderung
fluktuatif dan konstan. Menurut data jumlah
penumpang kereta api dari BPS dari tahun
2009 2015, secara grafik menunjukkan
pola bahwa jumlah penumpang meningkat
banyak pada bulan Juli-Agustus, namun
tidak begitu banyak pada awal bulan. Hal ini
masuk akal jika dilihat bahwa antara bulan
Juli-Agustus sering bertepatan dengan hilir
mudik hari raya. Berdasarkan data tersebut,
dapat dipastikan bahwa jumlah penumpang
bergantung pada musiman.
Dalam analisis runtun waktu, salah satu
metode peramalannya adalah metode
SARIMA (Seasonal ARIMA). Dalam
penulisan paper ini, penulis akan
mengaplikasikan
metode
peramalan
SARIMA untuk meramalkan jumlah
penumpang kereta api di Indonesia untuk
periode April 2015 Desember 2015.
Langkah-langkah
pemodelan
data
runtun waktu dengan SARIMA adalah: 1)
tahap
identifikasi
umum,
2)

2.

mengidentifikasi model sementara, 3)


estimasi
parameter,
4)
pemeriksaan
diagnostik dan pemilihan model terbaik, 5)
peramalan.
1.2. Rumusan Masalah
a. Berapakah prediksi jumlah penumpang
kereta api di Indonesia untuk periode
Januari 2010 Maret 2015?
b. Bagaimanakah model SARIMA yang
cocok untuk melakukan peramalan yang
baik?
Kajian Pustaka
2.1. Analisis Runtun Waktu
Analisis runtun waktu merupakan salah
satu prosedur statistika yang diterapkan untuk
meramalkan struktur probabilitas keadaan yang
akan datang dalam rangka pengambilan
keputusan. Dasar pemikiran runtun waktu adalah
pengamatan sekarang (Zt) dipengaruhi oleh satu
atau beberapa pengamatan sebelumnya (Zt-k).
Tujuan analisis runtun waktu antara lain
memahami dan menjelaskan mekanisme
tertentu, meramalkan suatu nilai di masa depan,
dan
mengoptimalkan
sistem
kendali
(Makridakis, dkk, 1999).
2.2. SARIMA
Seasonal Autoregressive Integreted Moving
Average (SARIMA) adalah pengembangan dari

2
model ARIMA pada data runtun waktu yang
memiliki pola musiman. Notasi SARIMA
adalah: SARIMA (p,d,q) (P,D,Q)S. Dengan
p,d,q: bagian yang tidak musiman dari model;
(P,D,Q)S: bagian musiman dari model; S: jumlah
periode per musim. Rumus umum SARIMA
dapat
dituliskan:
S

S D

Oktober
Novemb
er
Desemb
er

P ( B ) =AR

Januari

( 1B )

S D

( 1B )

q ( B ) =MA

3.

differencing

non-seasonal;

differencing

seasonal;

q ( BS )

non-seasonal;

=MA seasonal.
Untuk proses SARIMA yang umum, fungsi
peramalan jangka panjang bergantung pada pola
musiman individual paling akhir dalam data
percobaan, dan peramalan terdiri atas
pertambahan periodik pola dan komponen
modifikasi aditif (pertambahan) yang cenderung
sama dengan nol secara eksponensial secara
cepat karena horizon bertambah besar.
Metodologi Penelitian
Penulis menggunakan software EVIEWS
untuk menyelesaikan studi kasus yang diberikan.
Langkah kerjanya: Pilih New Workfile.
Kemudian pilih Monthly dan isikan 2009:1 pada
Start Date dan 2015:3 pada End Date.
Kemudian pilih Object New Object. Pilih
series pada Type of Object dan beri nama
sarima. Dan selanjutnya inputkan data pada
EVIEWS data berikut:
Tabel 3.1. Jumlah Penumpang Kereta Api Di
Indonesia Januari 2010 Maret 2015
2009

2010

Januari

14494

Januari

17424

Februari

13869

Februari

15207

Maret

17132

Maret

16992

April

16775

April

16832

Mei

17824

Mei

16988

Juni

18143

Juni

17259

Juli

18385

Juli

17680

Agustus

17527

Agustus

16477

Septem
ber

17281

Septem
ber

17301

17581

Novemb
er
Desemb
er

16908
16469
17733

2012

16891

Januari

16283

14890

Februari

15490

Maret

16978

Maret

17090

April

16441

April

16746

Mei

17522

Mei

17771

Juni

17265

Juni

18062

Juli

18132

Juli

18309

Agustus

non-seasonal;

16778

Oktober

2011

P B P ( B ) (1B ) ( 1B ) Z t= q ( B)q (B )aFebruari


t.
Dengan:

17281

14846

Agustus

17056

Septem
ber

16921

Septem
ber

16368

Oktober

16461

Oktober

17127

Novemb
er
Desemb
er

16179
16811

Novemb
er
Desemb
er

2013

15773
16104

2014

Januari

14900

Januari

21092

Februari

14594

Februari

19998

Maret

15826

Maret

22836

April

16000

April

21908

Mei

16113

Mei

22988

Juni

17301

Juni

23840

Juli

20245

Juli

22500

Agustus

19423

Agustus

23199

Septem
ber

19738

Septem
ber

23593

Oktober

20534

Oktober

24923

Novemb
er
Desemb
er

19919
21417

Novemb
er
Desemb
er

24356
26275

2015
Januari

24676

Februari

22790

Maret

27267

Langkah berikutnya adalah membuat plot


data/grafik. Pilih menu View Graph.
Kemudian mengecek stasioneritas data
dalam varians denga pilih menu View
Descriptive Statistics & Tests Histogram and
Stats. Jika data belum stasioner dalam varians,

3
maka selanjutnya melakukan trasnformasi data
ke dalam bentuk ln agar data stasioner terhadap
varians, dengan pilih menu Quick Generate
Series dan tuliskan sintaks lnsarima =
log(sarima).
Kemudian setelah data ditransformasi, atau
dengan kata lain stasioner dalam varians, maka
selanjutnya melihat apakah data stasioner dalam
mean. Buka file lnsarima pilih menu view
unit root test untuk menguji stasioneritas data
dalam mean dengan uji ADF.
Berikutnya adalah melakukan differencing
musiman, yaitu untuk menghilangkan unsur
musiman. Dengan pilih menu Quick Generate
Series

ketikkan
dslogsarima
=
dlog(sarima,0,12). Selain itu melakukan
differencing non-musiman (jika data belum
stasioner dalam mean). Langkahnya klik Quick

Gnereate
Series

ketikkan
dsarima=d(lnsarima) OK. Kemudian
melakukan Unit Root Test kembali untuk
mengecek stasioneritasnya. Kemudian melihat
ACF dan PACF dengan pilih menu view
correlogram.
Langkah berikutnya adalah melakukan
overfitting model, kemudian uji asumsi klasik,
dan yang terakhir melakukan peramalan.
4.

Gambar 4.2 Histogram and Stats


berdasarkan hasil diatas dapat dilakukan uji
hipotesis sebagai berikut:
Hipotesis:
H0 : data berdistribusi normal
H1 : data tidak berdistribusi normal
Tingkat signifikansi: = 5%
Daerah kritis: tolak H0 jika sig. <
Statistik uji: sig. = 0,000
Keputusan: sig. < maka tolak H0
Kesimpulan: dengan menggunakan tingkat
kepercayaan 95% dapat disimpulkan bahwa
data tidak berdsitribusi normal. Maka dari itu
perlu dilakukan transformasi data ke bentuk
logaritma.
Karena data telah ditransformasi dalam bentuk
ln, cek kembali stasioneritasnya (dalam varians),
hasilnya adalah sebagai berikut

Hasil dan Pembahasan

Gambar 4.2 Histogram and Stats ln

Gambar 4.1 Plot Data Awal


Dapat diketahui bahwa data tersebut
mengandung unsur musiman tiap 12 periode.
Stasioneritas dalam varians dapat dilihat sebagai
berikut

dengan menggunakan tingkat signifikansi 5%,


dapat diketahui bahwa hasil data yang telah
ditransformasi ke bentuk logaritma menghasilkan
nilai probabilitas 0,007. Artinya data masih belum
stasioner dalam varians, atau dengan kata lain
data belum normal. Maka langkah selanjutnya
adalah menstasionerkan data dalam mean dengan
cara differencing. Yang pertama differencing
musiman, didapat output sbb

Gambar 4.3 Unit Root Test dslogsarima


Karena nilai statistik ADF > t-tabel pada
tingkat signifikansi 5%, maka dapat dikatakan
bahwa data tidak stasioner. Maka dari itu perlu
dicoba
differencing
non-musiman.
Dari
differencing non-musiman, didapat output berikut

Gambar 4.5 Correlogram dsarima


Gambar 4.4 Unit Root Test dsarima
Hipotesis:
H0 : data mengandung unit root (tidak
stasioner)
H1 : data tidak mengandung unit root (data
stasioner)
Tingkat signifikansi: = 5%
Daerah kritis: tolak H0 jika ADF < t-tabel
Statistik uji: ADF = -12,793 ; t-tabel = -2,901
Keputusan: ADF < t-tabel, maka tolak H0
Kesimpulan: dengan menggunakan tingkat
kepercayaan 95% dapat disimpulkan bahwa
data tidak mengandung unit root atau data
stasioner dalam mean.
Selanjutnya adalah melihat nilai ACF dan
PACF dari correlogram berikut

berdasarkan correlogram diatas, nilai p dilihat


dari PACF, q dilihat dari ACF. Diketahui bahwa
pada ACF terdapat 1 lag pertama (q=1), begitu
juga dengan PACF terdapat 1 lag pertama (p=1).
Kemudian nilai P dilihat dari nilai ACF yang
terdapat musiman dan kelipatannya, maka dalam
hal ini adalah lag 24 dan lag 12 (P=2). Sedangkan
nilai Q didapat dari nilai PACF yang terdapat
musiman dan kelipatannya, maka dalam hal ini
adalah lag 12 (Q=1). Berdasarkan informasi
tersebut, didapatkan model SARIMA (1,1,1)
(2,1,1)12. Model yang mungkin adalah:
Tabel 4.1. Model SARIMA yang Mungkin
Model
Signifikan
SARIMA (1,1,1) (2,1,1)12 + C
Tidak
SARIMA (1,1,1) (2,1,1)12
Tidak
SARIMA (1,1,0) (1,1,1)12
Ya
Berdasarkan model-model diatas, dipilih model
yang signifikan, maka model yang dipilih SARIMA
(1,1,0) (1,1,1)12. Untuk melihat modelnya pilih menu
Quick Estimate Equation. Dihasilkan output sbb:

Gambar 4.6 Estimate Equation


Dapat dilihat pada output diatas, bahwa semua
nilainya sudah signifikan semua. Maka model ini
yang digunakan untuk peramalan. Sebelum
melakukan peramalan, perlu dilakukan uji asumsi
terlebih dahulu.
4.1. Uji Asumsi Klasik
a. Uji Normalitas Residual

b.

c.

Gambar 4.6 Normality Test


berdasarkan histogram diatas, dapat dilihat
bahwa residual cenderung normal.
Uji Autokorelasi

Gambar 4.7 Correlogram-Q-Statistics


berdasarkan correlogram diatas, dapat
dilihat bahwa tidak terdapat lag yang
memiliki nilai probabilitas < 0,05. Maka
dapat disimpulkan bahwa residual tidak
mengandung autokorelasi.
Uji Heteroskedastisitas

Gambar 4.8 Correlogram Squared


Residuals
berdasarkan correlogram diatas, dapat
dilihat bahwa nilai probabilitas tidak ada
yang < 0,05. Maka dapat disimpulkan
bahwa data homoskedastisitas.
Setelah semua memenuhi asumsi,
maka dapat dipastikan bahwa model
SARIMA (1,1,0) (1,1,1)12 adalah model
yang cocok digunakan untuk peramalan.
Hasil peramalan yang didapatkan
adalah sbb:

Gambar 4.9 Hasil Peramalan


berdasarkan output diatas, didapatkan hasil
peramalan untuk periode April 2015
Desember 2015 (9 periode kedepan) sbb:
Tabel 4.2. Hasil Peramlaan
Periode 2015
April
Mei
Juni
Juli
Agustus

Jumlah Prediksi
Penumpang
25924,48
26652,15
27008,61
27224,14
26400,33

6
September
Oktober
November
Desember
5.

26776,4
27044,98
26543,32
27468,8

Kesimpulan
Berdasarkan hasil pembahasan diatas, praktikan
dapat menarik kesimpulan sebagai berikut:
1. Hasil peramalan jumlah penumpang kereta
api di Indonesia untuk 6 bulan kedepan
(April-Desember) 2015 berturut-turut adalah:

2.

3.

April
25924,48
Mei
26652,15
Juni
27008,61
Juli
27224,14
Agustus
26400,33
September
26776,4
Oktober
27044,98
November
26543,32
Desember
27468,8
Berdasarkan uji asumsi klasik, diperoleh
informasi bahwa data memenuhi asumsi
normalitas, homoskedastisitas dan nonautokorelasi.
Model terbaik yang didapat adalah SARIMA
(1,1,0) (1,1,1)12

DAFTAR PUSTAKA
Ulwan, M Nasihun. 2014. Peramalan Data Runtun
Waktu Metode SARIMA dengan Eviews.
http://www.portalstatistik.com/2014/10/peramalan-data-runtunwaktu-metode.html (diakses pada tanggal 5
Juni 2015)
Sitepu, Robinson. 2008. Pemodelan dan Peramalan
Deret Waktu Musiman dengan Pendekatan
Filter Bank. Medan: Universitas Sumatera
Utara
Muhajir, Muhamad dan Primandari, Arum. 2015.
Modul Praktikum Analisis Runtun Waktu.
Yogyakarta: Universitas Islam Indonesia