LAPORAN PRAKTIKUM
ANALISIS RUNTUN WAKTU
Modul 3 : Dekomposisi dan SARIMA
JURUSAN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS ISLAM INDONESIA
YOGYAKARTA
2021
Daftar Isi
Daftar Isi.................................................................................................................. ii
Daftar Gambar ........................................................................................................ iii
1 Pendahuluan .................................................................................................... 1
1.1 Metode Dekomposisi ................................................................................ 1
1.1.1 Dekomposisi Additive....................................................................... 1
1.1.2 Dekomposisi Multiplicative .............................................................. 1
1.2 ARIMA ..................................................................................................... 2
1.3 The Akaike Information Criterion (AIC).................................................. 2
1.4 Mean Absolute Percentage Error (MAPE) .............................................. 3
2 Deskripsi Kerja................................................................................................ 4
2.1 Studi Kasus ............................................................................................... 4
2.2 Langkah Kerja .......................................................................................... 4
3 Pembahasan ................................................................................................... 10
3.1 Data Tingkat Hunian Hotel di DI Yogyakarta ....................................... 10
3.2 Dekomposisi + ARIMA ......................................................................... 11
3.3 Peramalan 5 Periode ke Depan ............................................................... 20
4 Penutup.......................................................................................................... 22
4.1 Kesimpulan ............................................................................................. 22
Daftar Pustaka ....................................................................................................... 24
ii
Daftar Gambar
iii
1 Pendahuluan
1
1.2 ARIMA
ARIMA sering juga disebut metode Box-Jenkins. ARIMA sangat baik
ketepatannya untuk peramalan jangka pendek, sedangkan untuk peramalan jangka
panjang ketepatan peramalannya kurang baik. Biasanya akan cenderung flat
(mendatar /konstan) untuk periode yang cukup panjang. Model Autoregresiive
Integrated Moving Average (ARIMA) adalah model yang secara penuh
mengabaikan independen variabel dalam membuat peramalan. ARIMA
menggunakan nilai masa lalu dan sekarang dari variabel dependen untuk
menghasilkan peramalan jangka pendek yang akurat. ARIMA cocok jika observasi
dari deret waktu (timeseries) secara statistik berhubungan satu sama lain
(dependent). Tujuan model ARIMA adalah untuk menentukan hubungan statistik
yang baik antar variabel yang diramal dengan nilai historis variabel tersebut
sehingga peramalan dapat dilakukan dengan model tersebut.
Model ARIMA sendiri hanya menggunakan suatu variabel (univariate) deret
waktu. Hal yang perlu diperhatikan adalah bahwa kebanyakan deret berkala bersifat
non-stasioner dan bahwa aspek-aspek AR dan MA dari model ARIMA hanya
berkenaan dengan deret berkala yang stasioner. Stasioneritas berarti tidak terdapat
pertumbuhan atau penurunan pada data. Data secara kasarnya harus horizontal
sepanjang sumbu waktu. Dengan kata lain, fluktuasi data berada di sekitar suatu
nilai rata-rata yang konstan, tidak tergantung pada waktu dan varians dari fluktuasi
tersebut pada pokoknya tetap konstan setiap waktu. Suatu deret waktu yang tidak
stasioner harus diubah menjadi data stasioner dengan melakukan differencing.
Yang dimaksud dengan differencing adalah menghitung perubahan atau selisih
nilai observasi. Nilai selisih yang diperoleh dicek lagi apakah stasioner atau tidak.
Jika belum stasioner maka dilakukan differencing lagi. Jika varians tidak stasioner,
maka dilakukan transformasi logaritma. (Hendrawan, 2013)
1.3 The Akaike Information Criterion (AIC)
The Akaike Information Criterion (sering disebut hanya sebagai AIC ) adalah
kriteria untuk memilih antara model statistik atau ekonometrik bersarang. AIC pada
dasarnya adalah perkiraan ukuran kualitas setiap model ekonometrik yang tersedia
2
karena terkait satu sama lain untuk kumpulan data tertentu, menjadikannya metode
yang ideal untuk pemilihan model.
Kriteria Informasi Akaike (AIC) dikembangkan dengan dasar dalam teori
informasi. Teori informasi adalah cabang matematika terapan tentang kuantifikasi
(proses penghitungan dan pengukuran) informasi. Dalam menggunakan AIC untuk
mencoba mengukur kualitas relatif model ekonometrik untuk kumpulan data
tertentu, AIC memberikan perkiraan informasi yang akan hilang jika model tertentu
akan digunakan untuk menampilkan proses yang menghasilkan data kepada
peneliti. Dengan demikian, AIC bekerja untuk menyeimbangkan trade-off antara
kompleksitas model tertentu dan kesesuaiannya , yang merupakan istilah statistik
untuk menggambarkan seberapa baik model "sesuai" dengan data atau kumpulan
pengamatan. (Greelane, 2019)
1.4 Mean Absolute Percentage Error (MAPE)
Mean Absolute Percentage Error (MAPE) merupakan ukuran kesalahan
relatif, merupakan ukuran ketepan relatif yang digunakan untuk mengetahui
persentase penyimpangan hasil pendugaan. Pendekatan ini berguna ketika ukuran
atau besar variabel ramalan itu penting dalam mengevaluasi ketepatan ramalan.
MAPE mengindikasi seberapa besar kesalahan dalam menduga yang dibandingkan
dengan nilai nyata.
𝑛
𝑦𝑖 − ŷ𝑖
𝑀𝐴𝑃𝐸 = ∑ | | × 100%
ŷ𝑖
𝑡=1
Dimana ;
MAPE = Mean Absolute Percentage Error
n = Jumlah data
y = Nilai hasil aktual
ŷ = Nilai hasil pendugaan
(Aindhae, 2019)
3
2 Deskripsi Kerja
4
3. Lalu, praktikan menimpor data tingkat hunian kamar hotel di DI Yogyakarta
ke dalam R dengan syntax read_csv() seperti pada Gambar 2. 3.
5
9. Langkah selanjutnya, praktikan melakukan peramalan indeks musiman.
Untuk melakukan peramalan ini, diperlukan packages “forecast” sehingga
praktikan perlu mengaktifkan packages tersebut dengan syntax library().
Sedangkan, untuk melakukan peramalan indeks musiman digunakan syntax
sindexf() seperti pada Gambar 2. 9.
6
13. Lalu, praktikan melakukan uji ADF ulang dengan data yang sudah
didiferensikan dengan syntax seperti pada Gambar 2. 13.
7
17. Karena terdapat nilai yang tidak signifikan, maka praktikan membuat 2 model
ARIMA yang lain yaitu model ARIMA(1,1,1) dan model ARIMA(0,1,2).
Kemudian, menampilkan statistik dari masing-masing model yang dibuat.
Syntax yang digunakan seperti Gambar 2. 17.
8
21. Kemudian, praktikan mencari fitted value dari peramalan dengan metode
terbaik. Syntax yang digunakan seperti Gambar 2. 21.
9
3 Pembahasan
10
Dari Gambar 3. 2. tersebut, dapat dilihat bahwa data tingkat hunian hotel
memiliki komponen musiman sehingga data ini cocok untuk dianalisis dengan
metode dekomposisi + ARIMA.
11
Gambar 3. 4. Nilai Komponen Dekomposisi “Additive”
Dari Gambar 3. 3. dan Gambar 3. 4. dapat diketahui, berdasarkan komponen
tren, data hunian kamar hotel dari tahun 2016 hingga 2019 stasioner sedangkan dari
tahun 2019 mengalami penurunan hingga tahun 2021. Kemudian jika dilihat
berdasarkan komponen musiman menunjukkan bahwa jumlah produksi tertinggi
terjadi pada bulan November, sedangkan jumlah produksi terendah pada bulan
April tiap tahunnya. Pada komponen random terlihat pada pertengahan tahun 2016
mengalami penurunan drastis dan mencapai puncaknya pada bulan Januari 2017,
namun mengalami penurunan kembali sampai bulan Juni 2017.
Langkah selanjutnya, praktikan melakukan peramalan indeks musiman.
Untuk melakukan peramalan ini, diperlukan packages “forecast” sehingga
praktikan perlu mengaktifkan packages tersebut dengan syntax library().
Sedangkan, untuk melakukan peramalan indeks musiman digunakan syntax
sindexf() seperti pada Gambar 2. 9. Maka, akan didapat hasil seperti pada
Gambar 3. 5.
12
Gambar 3. 5. Hasil Peramalan Indeks Musiman “Additive”
Dari Gambar 3. 5. dapat diketahui didapatkan hasil permalan indeks
musiman untuk 5 periode ke depan dimana periode yang dimaksud adalah bulan
November 2021, Desember 2021, Januari 2022, Februari 2022, dan Maret 2022.
Pada bulan November 2021 didapatkan tingkat hunian kamar hotel meningkat
sebesar 7.2652604, Desember 2021 meningkat sebesar 14.65359338, Januari 2022
menurun sebesar 3.0574062, Februari 2022 menurun sebesar 0.3579896, dan Maret
2022 menurun sebesar 1.8323229.
Kemudian, praktikan membuat data non-musiman dengan syntax seasadj()
dan membuat visualisasinya dengan syntax autoplot() seperti Gambar 2. 10.
Maka, akan didapat hasil visualisasi seperti pada Gambar 3. 6.
13
melakukan peramalan uji ADF digunakan syntax adf.test()seperti Gambar 2.
11. Maka, akan didapatkan hasil sebagai berikut.
Karena data tidak stasioner, maka perlu dilakukan diferensiasi. Dalam hal ini,
praktikan melakukan diferensi sebanyak 1 kali pada data tingkat hunian kamar hotel
dengan tujuan agar data tersebut menjadi stasioner. Untuk melakukan diferensiasi
digunakan syntax diff() lalu praktikan membuat plot dari data yang sudah
didiferensikan dengan syntax autoplot() seperti Gambar 2. 12. Maka, didapat
hasil seperti pada Gambar 3. 8.
14
Gambar 3. 8. Plot Hasil Diferensiasi
Dari plot pada Gambar 3. 8. Dapat dilihat bahwa data tingkat hunian kamar
hotel sudah stasioner.
Selanjutnya, praktikan melakukan uji ADF ulang untuk memastikan apakah
data tingkat hunian kamar hotel sudah stasioner dengan syntax seperti pada
Gambar 2. 13. Maka, didapat hasil seperti pada Gambar 3. 9.
15
4. Statistik Uji
𝑝 − 𝑣𝑎𝑙𝑢𝑒 = 0.01
5. Keputusan
Tolak H0 karena p-value = 0.01 < 𝛼 = 0.05
6. Kesimpulan
Dengan tingkat kepercayaan 95%, data yang ada menolak H0 yang artinya
data tingkat hunian kamar hotel sudah stasioner
16
merupakan banyaknya diferensi, dan q merupakan orde MA. Oleh karena itu,
didapat model hasil identifikasi model yaitu ARIMA(2,1,2).
Kemudian, praktikan membuat fungsi untuk memunculkan statistik dari
model ARIMA. Syntax yang digunakan seperti Gambar 2. 15. Lalu, praktikan
membuat model ARIMA yang didapat dari hasil identifikasi model yaitu model
ARIMA(2,1,2) dan melihat statistik dari model ARIMA tersebut. Syntax yang
digunakan seperti Gambar 2. 16. Maka, didapat hasil seperti pada Gambar 3. 11.
17
Gambar 3. 12. Model ARIMA(1,1,1)
Sedangkan, untuk model ARIMA(0,1,2) dihasilkan output seperti pada
Gambar 3. 13.
18
Untuk melihat nilai AIC dan MAPE, dapat dilihat dari output syntax
summary(model). Praktikan akan membuatnya ke dalam dataframe agar lebih
mudah dibaca. Syntax yang digunakan seperti Gambar 2. 18. Maka didapat hasil
sebagai berikut.
19
Dari Gambar 3. 15. dapat dilihat bahwa nilai ACF residual tidak ada yang
keluar sehingga dapat disimpulkan bahwa tidak ada autokorelasi antar residual.
Selanjutnya, dapat dilihat dari p-value Ljung Box bahwa semua nilai p-value sudah
melebihi 0.05 yang artinya data bersifat white noise.
20
Kemudian, praktikan mencari akan nilai MAPE dari peramalan dengan
metode terbaik. Syntax yang digunakan seperti Gambar 2. 22. Maka akan didapat
hasil seperti Gambar 3. 18.
21
4 Penutup
4.1 Kesimpulan
Dari studi kasus dan percobaan yang telah praktikan lakukan, praktikan dapat
menarik beberapa kesimpulan, yaitu:
1. Berdasarkan plot yang telah dibuat, dapat diketahui bahwa data tingkat hunian
hotel memiliki komponen musiman sehingga data ini cocok untuk dianalisis
dengan metode dekomposisi + ARIMA.
2. Berdasarkan komponen tren, data hunian kamar hotel dari tahun 2016 hingga
2019 stasioner sedangkan dari tahun 2019 mengalami penurunan hingga
tahun 2021. Kemudian jika dilihat berdasarkan komponen musiman
menunjukkan bahwa jumlah produksi tertinggi terjadi pada bulan November,
sedangkan jumlah produksi terendah pada bulan April tiap tahunnya. Pada
komponen random terlihat pada pertengahan tahun 2016 mengalami
penurunan drastis dan mencapai puncaknya pada bulan Januari 2017, namun
mengalami penurunan kembali sampai bulan Juni 2017.
3. Untuk membuat plot ACF gunakan syntax Acf() sedangkan untuk membuat
plot PACF gunakan syntax Pacf(). Untuk melihat orde AR(p) dilihat dari
plot PACF sedangkan orde MA(q) dapat dilihat dari plot ACF. Dari output
pada Gambar 3. 10. tersebut dapat diketahui bahwa pada plot PACF terdapat
batang PACF yang keluar pada lag ke-2, sehingga orde AR yaitu 2. Secara
umum, model ARIMA dituliskan dengan ARIMA(p,d,q) dengan p
merupakan orde AR, d merupakan banyaknya diferensi, dan q merupakan
orde MA. Oleh karena itu, dari hasil plot ACF dan PACF didapat model yaitu
ARIMA(2,1,2).
4. Karena masih terdapat koefisien model yang belum signifikan sehingga perlu
menurunkan orde pada model ARIMA tersebut. Maka dari itu, praktikan
membuat 2 model ARIMA yang lain yaitu model ARIMA(1,1,1) dan model
ARIMA(0,1,2).
22
5. Dapat diketahui bahwa baik model ARIMA(1,1,1) maupun model
ARIMA(0,1,2) memiliki koefisien yang signifikan. Oleh karena itu, untuk
melihat model yang terbaik dapat dilihat dari ukuran error-nya, model terbaik
adalah model yang memiliki ukuran error terkecil. Dalam hal ini, praktikan
akan melihat dari nilai AIC dan nilai MAPE. Model ARIMA(1,1,1) memiliki
nilai AIC sebesar 511.4929 dan nilai MAPE sebesar 21.32733. Sedangkan,
model ARIMA(0,1,2) memiliki nilai AIC sebesar 509.8090 dan nilai MAPE
sebesar 20.87948. Dari hasil tersebut dapat dilihat bahwa model
ARIMA(0,1,2) memiliki nilai AIC dan MAPE yang lebih kecil. Sehingga
model terbaik yang didapat adalah model ARIMA(0,1,2).
6. Dari hasil uji diagnostk dapat dilihat bahwa nilai ACF residual tidak ada yang
keluar sehingga dapat disimpulkan bahwa tidak ada autokorelasi antar
residual. Selanjutnya, dapat dilihat dari p-value Ljung Box bahwa semua nilai
p-value sudah melebihi 0.05 yang artinya data bersifat white noise.
7. Didapat hasil peramalan untuk tingkat hunian kamar hotel 5 periode ke depan,
tingkat hunian kamar hotel pada bulan November 2021 sebesar 43.73672,
bulan Desember 2021 sebesar 49.92273, bulan Januari 2022 sebesar
32.21173, bulan Februari 2022 sebesar 34.91114, dan bulan Maret 2022
sebesar 33.43681. Dari hasil tersebut dapat disimpulkan bahwa peramalan
pada awal tahun 2022, tingkat hunian kamar hotel akan mengalami penurunan
yang cukup drastis.
8. Didapat nilai MAPE sebesar 25.37509 yang artinya persentase kesalahan dari
peramalan dengan metode ARIMA(0,1,2) adalah sebesar 25.37509%. Hal ini
menunjukkan bahwa model ARIMA(0,1,2) merupakan model yang cukup
baik untuk melakukan peramalan.
9. Dai plot hasil peramalan, terlihat bahwa data actual dan data fitted value
memiliki pola yang mirip hal ini menunjukkan bahwa model cukup baik untuk
melakukan peramalan. Dari hasil peramalan 5 perode ke depan data diketahui
bahwa tingkat hunian kamar hotel akan mengalami peningkatan terlebih
dahulu lalu disusul dengan penurunan yang cukup drastis.
23
Daftar Pustaka
24