LAPORAN PRAKTIKUM
Analisis Runtun Waktu
Modul 5 : SARIMA
Arum Handini
Primandari
JURUSAN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS ISLAM INDONESIA
YOGYAKARTA
2017
i
Daftar Isi
1 Pendahuluan .................................................................................................... 5
2 Deskripsi Kerja................................................................................................ 7
2.1 Studi Kasus ............................................................................................. 7
2.2 Langkah Kerja ......................................................................................... 7
3 Pembahasan ................................................................................................... 11
4 Penutup.......................................................................................................... 20
5 Daftar Pustaka ............................................................................................... 21
ii
Daftar Tabel
iii
Daftar Gambar
iv
1 Pendahuluan
5
Musiman mengartikan bahwa data memiliki kecenderungan mengulangi
pola tingkah gerak dalam periode musim. Biasanya dapat berupa mingguan,
bulanan, triwulan, dan semesteran. Oleh karena itu runtun waktu musiman
mempunyai karakteristik yang ditunjukan oleh adanya korelasi beruntun yang kuat
pada jarak semusim (periode musim), yaitu waktu yang berkaitan dengan banyak
observasi pada per periode musim (Muhajir, 2015).
Notasi umum untuk ARIMA yang diperluas untuk menangani aspek
musiman atau seasonal adalah :
ARIMA (p,d,q) (P,D,Q)S
dengan, p,d,q : bagian yang tidak musiman dari model
(P,D,Q)S : bagian musiman dari model
S : jumlah periode per musim.
Pada dasarnya SARIMA sama dengan ARIMA hanya ditambah awalnya
dengan kata seasonal. ARIMA dan SARIMA ini merupakan metode analisis time
series, sama seperti analisis trend, moving average atau naive. Adapun tahapan
analisis yang harus dilalui dalam analisis ARIMA dan SARIMA ini adalah :
1. Identifikasi
Identifikasi data yang akan diproses apakah mengandung tren atau seasonal.
ARIMA dan SARIMA mensyaratkan data yang diproses harus stasioner. Jika
ternyata data menunjukkan adanya tren maka yang dapat dilakukan ialah
diferencing atau pembeda.
2. Estimasi
Dalam melakukan estimasi yang dilakukan ialah dengan mengamati ACF dan
PACF.
3. Evaluasi Model
Evaluasi model sama dengan tekhik time series lainnya yakni MSE yang
dikeluarkan. Selain itu dalam analisis ARIMA juga mengevaluasi iteration yang
mengharuskan untuk convergence, residual peramalan harus bersifat acak, model
harus paling sederhana, parameter yang diestimasi berbeda nyata dengan nol, dan
kondisi stasioneritas harus terpenuhi.
4. Peramalan
6
2 Deskripsi Kerja
7
Gambar 2.2 Pengubahan data time series
4. Kemudian gambarkan grafik dari data turis menggunakan syntax
“ts.plot(data, col=’nama warna’, main = ‘judul grafik’)”. Atau
untuk lebih jelasnya dapat melihat gambar dibawah ini :
8
8. Kemudian setelah dilakukan diferensi maka selanjutnya membuat plotnya
kembali dan dilihat hasil plot musiman nya dengan syntax sebagai berikut :
9
Gambar 2.12 Uji diagnostic
13. Kemudian dilakukan prediksi menggunakan model Seasonal ARIMA yang
telah didapatkan sebelumnya dengan syntax sebagai berikut :
10
3 Pembahasan
11
dalam cerita yang disusun sebagai urutan bagian-bagian dalam keseluruhan fiksi.
Atau dengan kata lain plot merupakan perpaduan unsur-unsur yang membangun
cerita sehingga menjadi kerangka utama cerita. Plot diatas mampu menggambarkan
keadaan data apakah data tersebut stasioner atau tidak. Secara umum sekumpulan
data dinyatakan stasioner jika nilai rata-rata dan varian dari data time series tersebut
tidak mengalami perubahan secara sistematik sepanjang waktu, atau sebagian ahli
menyatakan rata-rata dan variannya konstan. Jika pada grafik terdapat cara untuk
melihat adanya stasioneritas atau tidak yaitu dengan cara melihat pada bagian plot.
Dimana grafik tersebut dibuat plot antara observasi dengan waktu. Jika terihat
memiliki rata-rata dan varians konstan, maka data tersebut dapat disimpulkan
stasioner. Berdasalkan hasil plot diatas terlihat bahwa pada hasil plot diatas
menunjukkan bahwa data tersebut terlihat tidak stasioner dikarenakan pada data
tersebut terlihat data yang semakin lama semakin mengalami kenaikan. Selain itu,
pada plot tersebut juga terlihat bahwa pada data terjadi plot musiman. Dimana
musiman tersebut berulang setiap 5 tahun sekali. Untuk membuktikannya dibuat
plot ACF dan PACF nya sebagai berikut :
12
diferensi adalah suatu proses mencari perbedaan antara data satu periode dengan
periode yang lainnya secara berurutan. Data yang dihasilkan disebut data diferensi
tingkat pertama. Jika praktikan kemudian melakukan diferensi data tingkat pertama
dan data diferensi tersebut masih belum menghasilkan data yang stasioner maka
dapat dilanjutkan melakukan diferensi kembali dan akan menghasilkan data
diferensi tingkat kedua, ketiga, dan seterusnya.
Penganalogian proses diferensi ini yaitu seandainya data time series tidak
stasioner dalam level, maka data tersebut kemungkinan menjadi stasioner melalui
proses diferensi atau jika data tidak stasioner pada level maka perlu dibuat stasioner
pada tingkat diferensi. Perlu diketahui sebelumnya dikarenakan niai data pada studi
kasus ini cukup besar maka perlu ditambahkan syntax log. Dimana syntax log ini
bertujuan untuk mengecilkan data, jika data yang ada berbentuk triliunan atau
miliaran tentu akan menyulitkan jika diolah. Oleh sebab itu data perlu ditambahkan
syntax log. Namun jika data tersebut berbentuk kecil atau dengan kata lain tidak
triliunan atau miliaran maka data tersebut pada saat proses diferensing tidak pelu
ditambahkan syntax log. Dimana hasil plot musiman setelah di diferensing yaitu
sebagai berikut :
13
Gambar 3.4 Hasil uji ADF pola non-musiman
Berdasarkan hasil output diatas maka dapat dilakukan pengujian yaitu
sebagai berikut :
Uji Hipotesis
H0 : ϕ = 1 (Data tidak stasioner)
H1 : ϕ < 1 (Data stasioner)
Tingkat Signifikansi
𝛼 = 0,05
Daerah Kritis
Tolak H0 jika p-value < 𝛼
Statistik Uji :
p-value (0,08154) > 𝛼 (0,05)
Keputusan
p-value (0,08154) > 𝛼 (0,05) => Gagal Tolak H0
Kesimpulan
Berdasarkan hasil output dan pengujian diatas maka didapatkan kesimpulan
bahwa data gagal tolak H0 yang artinya ialah data tersebut tidak stasioner.
Berdasarkan kesimpulan pengujian diatas selanjutnya dibuat plot untuk
membuktikan hipotesis tersebut apakah benar tidak stasioner atau tidak. Berikut
hasil plotnya :
14
Berdasarkan hasil plot ACF/PACF diatas didapatkan bahwa grafik plot
tersebut menyeluruh secara perlahan dan nilai p-value yang didapatkan pada hasil
uji ADF juga lebih besar dari alpha yang artinya data non-musiman tersebut tidak
stasioner sehingga perlu dilakukan diferensing untuk bagian non-musiman tersebut.
Berikut hasil diferensing untuk non-musiman tersebut :
Gambar 3.6 Hasil output ACF dan PACF non-musiman setelah diferensing
Berdasarkan hasil output diatas maka dapat dilakukan pengujian yaitu
sebagai berikut :
Uji Hipotesis
H0 : ϕ = 1 (Data tidak stasioner)
H1 : ϕ < 1 (Data stasioner)
Tingkat Signifikansi
𝛼 = 0,05
Daerah Kritis
Tolak H0 jika p-value < 𝛼
Statistik Uji :
p-value (0,01) < 𝛼 (0,05)
Keputusan
p-value (0,01) < 𝛼 (0,05) => Tolak H0
Kesimpulan
Berdasarkan hasil output dan pengujian diatas maka didapatkan kesimpulan
bahwa data tolak H0 yang artinya ialah data tersebut stasioner.
Dikarenakan hasil output uji ADF menunjukkan data berbentuk stasioner
selanjutnya dibuat plot ACF dan PACF nya sebagai berikut :
15
Gambar 3.7 Plot ACF dan PACF yang stasioner
Berdasarkan hasil diatas diketahui terdapat dua plot yaitu plot ACF dan plot
PACF. Plot ACF dan PACF merupakan salah satu alat utama untuk identifikasi
model ARIMA. Plot ACF berfungsi sebagai alat ukur autokorelasi korelogramnya.
ACF mengukur korelasi antar pengamatan sedangkan PACF mengukur korelasi
antar pengamatan dengan jeda k dan dengan mengontrol korelasi antar dua
pengamatan dengan jeda kurang dari l. ketika plot ACF dan PACF nya telah
didapatkan maka selanjutnya ialah menentukan kemungkinan model yang
dihasilkan. Berdasarkan hal tersebut didapatkan model utamanya yaitu ARIMA
(0,1,1)(2,1,3). Dan rincian kemungkinan modelnya yaitu :
Tabel 3.1 Rincian model
Nomor Rincian
Model Model
ARIMA
1
(0,1,1)(2,1,3)
ARIMA
2
(0,1,1)(2,1,2)
ARIMA
3
(0,1,1)(2,1,1)
ARIMA
4
(0,1,1)(2,1,0)
16
ARIMA
5
(0,1,1)(1,1,2)
ARIMA
6
(0,1,1)(1,1,1)
ARIMA
7
(0,1,1)(1,1,0)
ARIMA
8
(0,1,1)(0,1,1)
Setelah diketahui kemungkinan model yang akan digunakan pada data
tersebut selanjutnya dilakukan overfitting. Dimana overfitting model ini dilakukan
untuk mencari model terbaik dengan melihat nilai AICC terkecil pada data. Dimana
nilai AICC terkecil terdapat pada model ke-5 dan model ke-8 dengan masing-
masing nilai AICC sebesar -345,17 dan -344,92. Selanjutnya dicari model manakah
yang semua komponen nya signifikan. Dalam hal ini model yang memiliki
komponen keseluruhannya sigifikan yaitu model ke-8 dengan persamaan model
nya yaitu ARIMA(0,1,1)(0,1,1).
Setelah melakukan estimasi dan mendapatkan penduga parameter, agar
model sementara dapat digunakan untuk peramalan maka perlu dilakukan uji
kelayakan terhadap model tersebut. Tahap ini disebut diagnostic checking dimana
pada tahap ini diuji apakah spesifikasi model sudah benar atau belum. Berikut hasil
output pengujian tersebut :
17
dalam model prediksi dengan perubahan waktu. Oleh karena itu, apabia asumsi
autokorelasi terjadi pada sebuah model prediksi, maka nilai disturbance tidak lagi
berpasangan secara bebas, melainkan berpasangan secara autokorelasi.
Dalam pengujian autokorelasi diatas dapat dilakukan dengan membaca plot
data nya saja. Pada bagian plot ACF of Residuals cukup lihat pada bagian garis
lurus putus-putus. Dimana pada bagian plot ACF of Residuals data tidak akan
terjadi autokrelasi jika tidak keluar dari garis putus-putus. Lalu, plot yang dilihat
selanjutnya yaitu plot pada p-values for Ljung Box statistic. Pada plot ini yang
dilihat pun sama yaitu cukup lihat pada bagian garis lurus putus-putus. Dimana
pada bagian plot ini data tidak akan terjadi autokorelasi jika data tidak berada
dibawah garis putus-putus. Berdasarkan penyataan tersebut didapatkan bahwa data
tidak terjadi autokorelasi. Kemudian pada bagian standardized residuals
menunjukkan bahwa apakah data tersebut berdistribusi normal atau tidak.
Diketahui bahwa hasil pada plot standardized residuals menunjukkan bahwa data
tersebut tidak berdistribusi normal. Perlu diketahui bahwa pada model ARIMA jika
data tidak berdistribusi normal tidak menjadi masalah seperti pada model regresi
biasanya.
Ketika uji diagnostic telah dilakukan selanjutnya yaitu melakukan
peramalan untuk 9 orde kedepan yaitu peramalan untuk bulan April hingga
Desember. Dimana didapatkan untuk nilai peramalan nya yaitu sebagai berikut :
18
Gambar 3.10 Hasil output perbandingan data asli dengan peramalan
Berdasarkan hasil output diatas garis merah menunjukkan data prediksi
sementara garis biru menunjukkan data asli yang dimiliki oleh praktikan. Dapat
dilihat bahwa data asli dengan data peramalan menunjukkan pola yang hampir
sama. Hal ini menunjukkan bahwa pola data peramalan hampir mendekati atau
hampi sesuai dengan data asli yang ada.
19
4 Penutup
20
5 Daftar Pustaka
Karunilla, Acika. 2017. Analisis Deret Waktu. Diakses pada tanggal 26 November
2017 dari https://www.slideshare.net/ChikaGidyfa/metode-dekomposisi-
klasik-dengan-rasio-rata-rata-bergerak.
Pradhana, Faried. 2012. FORECASTING (PERAMALAN). Diakses pada tanggal 26
November 2017 dari https://fariedpradhana.wordpress.com/tag/metode-
peramalan/.
Primandari, Arum Handini, dkk. 2016. Modul Praktikum Analisis Runtun Waktu.
Yogyakarta: Jurusan Statistika Fakultas Matematika dan Ilmu Pengetahuan
Alam Universitas Islam Indonesia.
Rosadi, D. (2011). Analisis Ekonometrika & Runtun Waktu Terapan dengan R.
Yogyakarta:ANDI
21