Dengan ini saya menyatakan bahwa tesis berjudul Simulasi dan Penerapan
Model Seasonal Autoregressive pada Peramalan Harga Cabai Merah Besar di Lima
Provinsi di Pulau Jawa adalah benar karya saya dengan arahan dari komisi pembimbing
dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber
informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak
diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar
Pustaka di bagian akhir tesis ini.
Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut
Pertanian Bogor.
Kata kunci : data deret waktu musiman, pencilan, seasonal AR, simulasi, anova
tiga faktor.
SUMMARY
RATNA NUR MUSTIKA SANUSI. Simulation and Application of the Seasonal
Autoregressive Model in Forecasting Big Red Chili Prices in Five Provinces on
Java Island. Supervised by Mr. BUDI SUSETYO and Mrs. UTAMI DYAH
SYAFITRI.
Keywords: seasonal time series data, outliers, seasonal AR, simulation, three-
factor ANOVA.
© Hak Cipta milik IPB, tahun 2023
Hak Cipta dilindungi Undang-Undang
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa
mencantumkan atau menyebutkan sumbernya. Pengutipan hanya untuk
kepentingan pendidikan, penelitian, penulisan karya ilmiah, penyusunan laporan,
penulisan kritik, atau tinjauan suatu masalah, dan pengutipan tersebut tidak
merugikan kepentingan IPB.
Dilarang mengumumkan dan memperbanyak sebagian atau seluruh karya
tulis ini dalam bentuk apa pun tanpa izin IPB.
SIMULASI DAN PENERAPAN MODEL SEASONAL
AUTOREGRESSIVE PADA PERAMALAN HARGA CABAI
MERAH BESAR DI LIMA PROVINSI DI PULAU JAWA
Tesis
sebagai salah satu syarat untuk memperoleh gelar
Magister pada Sains pada
Program Studi Statistika dan Sains Data
Puji dan syukur penulis panjatkan kepada Allah subhanaahu wa ta’ala atas
segala karunia-Nya sehingga karya ilmiah ini berhasil diselesaikan dengan judul
“Simulasi dan Penerapan Model Seasonal Autoregressive pada Peramalan Harga
Cabai Merah Besar di Lima Provinsi di Pulau Jawa”.
Karya ilmiah ini tidak lepas dari bantuan dan dukungan berbagai pihak, untuk
itu penulis menyampaikan rasa terima kasih kepada:
1. Dr. Ir. Budi Susetyo, M.S. dan Dr. Utami Dyah Syafitri, S.Si., M.Si. selaku
Dosen Pembimbing yang telah memberikan bimbingan, saran, dan arahan
dalam menyelesaikan karya ilmiah ini.
2. Moderator seminar dan penguji luar komisi pembimbing yang telah membantu
lancarnya proses penyelesaian tugas akhir penulis.
3. Seluruh jajaran dosen dan karyawan Jurusan Statistika Pascasarjana IPB yang
telah membantu proses terkait penyelesaian karya ilmiah ini.
4. Papah Sanusi, Mamah Siti Yulikah, Mas Vian, dan Mbak Alya serta segenap
keluarga yang selalu memberikan dukungan, doa, dan kasih sayang.
5. Teman-teman Statistika Pascasarjana IPB angkatan 2020 yang telah
memberikan semangat dan bantuan.
Semoga karya ilmiah ini bermanfaat bagi pihak yang membutuhkan dan bagi
kemajuan ilmu pengetahuan.
DAFTAR TABEL x
DAFTAR GAMBAR x
DAFTAR LAMPIRAN xi
I PENDAHULUAN 1
1.1 Latar Belakang 1
1.2 Tujuan 2
1.3 Ruang Lingkup 3
II TINJAUAN PUSTAKA 4
2.1 Autoregressive Integrated Moving Average (ARIMA) 4
2.2 Seasonal ARIMA (SARIMA) 4
2.3 Uji Asumsi 5
2.4 Identifikasi Model 7
2.5 Akaike’s Information Criterion (AIC) 8
2.6 Estimasi dan Uji Signifikansi Parameter 8
2.7 Diagnostik Sisaan 8
2.8 Overfitting Model 9
2.9 Peramalan 10
2.10 Pencilan pada Data Deret Waktu 11
III METODOLOGI PENELITIAN 12
3.1 Data 12
3.2 Prosedur Analisis Data 12
3.3 Diagram Alir 16
IV HASIL DAN PEMBAHASAN 17
4.1 Hasil Simulasi 17
4.2 Penerapan Model Seasonal AR 21
4.3 Pemodelan Seasonal AR 22
4.4 Evaluasi Model dan Hasil Peramalan 29
V SIMPULAN DAN SARAN 32
5.1 Simpulan 32
5.2 Saran 32
DAFTAR PUSTAKA 33
LAMPIRAN 36
RIWAYAT HIDUP 38
DAFTAR TABEL
DAFTAR GAMBAR
I PENDAHULUAN
Peramalan harga cabai merah besar dapat dilakukan dengan metode SARIMA,
dikarenakan terdapat pola musiman pada data dan memiliki tingkat akurasi hasil
ramalan yang baik. Metode SARIMA dapat digunakan di berbagai bidang seperti
bidang kesehatan (Duangchaemkarn et al. 2022), lalu lintas (Deretić et al. 2022),
kelautan (Xu et al. 2021), perdagangan (Divisekara et al. 2021), ekonomi (Rizki
dan Taqiyyuddin 2021), pariwisata (Msofe dan Mbago 2019) dan berbagai bidang
lainnya. Berdasarkan manfaat yang diberikan oleh metode SARIMA terhadap
penelitian-penelitian yang telah dilakukan, perlu adanya kajian lebih lanjut,
khususnya yang berkaitan dengan permasalahan yang dapat mempengaruhi tingkat
akurasi peramalan dari metode SARIMA.
Pada data harga cabai merah besar terdapat permasalahan yaitu adanya
pencilan yang disebabkan karena terjadinya gejolak harga dan minimnya
ketersediaan data bulanan. Kedua masalah tersebut dapat menjadi faktor yang dapat
mempengaruhi hasil peramalan. Faktor pencilan pada data deret waktu dapat
mengurangi keakuratan hasil peramalan dan bias dalam pendugaan parameter
model (Blázquez-García et al. 2021). Pencilan pada data deret waktu terbagi
menjadi empat tipe. Tipe pencilan yang dimungkinkan terdapat pada data harga
cabai merah besar yaitu tipe pencilan aditif, karena merupakan suatu tipe pencilan
yang memberikan pengaruh pada satu periode saja dalam data deret waktu. Seperti
halnya pada data harga cabai. Ketika terdapat lonjakan harga, pemerintah pasti
langsung menangani masalah tersebut supaya tidak terjadi berlarut-larut.
Faktor kedua yang menjadi masalah yaitu ukuran contoh yang kecil, karena
dapat menimbulkan masalah bias dalam pendugaan parameter (Kim dan Durmaz
2012), sehingga faktor ukuran contoh dapat menjadi pengaruh pada hasil peramalan.
Selain itu, penerapan metode pada data yang berbeda-beda dapat menghasilkan
tingkat akurasi yang berbeda-beda pula. Perbedaan data tersebut menyebabkan
suatu data memiliki parameter yang berbeda-beda, sehingga faktor variasi
parameter juga dapat menjadi pengaruh pada hasil peramalan. Pengaruh dari faktor-
faktor tersebut dapat lebih terlihat, apabila dilakukan simulasi yang dirancang
dengan pendekatan rancangan faktorial. Hal tersebut dikarenakan rancangan
factorial dapat memberikan kesimpulan terkait dengan faktor yang paling
berpengaruh terhadap respon (Mattjik dan Sumertajaya 2013). Dengan demikian
penelitian ini terbagi menjadi dua bagian yaitu melakukan simulasi dan melakukan
analisis data empirik.
Simulasi dilakukan dengan pendekatan rancangan faktorial tiga faktor yaitu
faktor pencilan, ukuran contoh dan variasi parameter. Masing-masing faktor
tersebut memiliki level yang berbeda-beda. Faktor persentase pencilan memiliki
empat level yaitu 0%, 2,5%, 5%, dan 7,5%, faktor ukuran contoh memiliki tiga
level yaitu 84, 204, dan 504, dan faktor variasi parameter memiliki empat level
yaitu pp,np,pn, dan nn. Hasil dari simulasi tersebut dapat digunakan sebagai dasar
keputusan untuk melakukan analisis data aktual terhadap peramalan harga cabai
merah besar di lima Provinsi di Pulau Jawa, dimana karakteristik datanya
mengandung pencilan aditif dan jumlah data yang kecil (N=84).
1.2 Tujuan
Tujuan dari penelitian ini adalah
1. Melakukan kajian kinerja metode seasonal AR dengan pengaruh
persentase pencilan, ukuran contoh, dan variasi parameter.
3
II TINJAUAN PUSTAKA
Model ARIMA merupakan salah satu model yang sederhana dalam pemodelan
data deret waktu. Kesederhanaan model ARIMA tentunya tidak selalu bisa
memenuhi kebutuhan pemodelan. Hal ini dikarenakan terdapat beberapa macam
pola data deret waktu seperti pola acak, tren, musiman dan gabungan (Montgomery
et al. 2015). Keempat pola tersebut memiliki karakteristik yang berbeda-beda.
Perbedaan karakteristik yang dimiliki oleh masing-masing pola, menjadikan
kebutuhan terhadap pengembangan model ARIMA. Salah satu kebutuhannya
adalah model yang dapat mengakomodasi pola data musiman yang sering disebut
dengan ARIMA Musiman (SARIMA).
dimana :
𝑝 : ordo AR non- musiman
𝑑 : banyaknya proses pembedaan yang dilakukan pada
model non-musiman
𝑞 : ordo MA non-musiman
5
𝑃 : ordo AR musiman
𝐷 : banyaknya proses pembedaan yang dilakukan pada
model musiman
𝑄 : ordo MA musiman
𝑆 : jumlah periode musiman
dimana :
𝐵 : operator Backshift
𝜙𝑝 : koefisien AR nonmusiman pada ordo ke-𝑝
Φ𝑃 : koefisien AR musiman pada ordo ke-𝑃
𝜃𝑞 : koefisien MA nonmusiman pada ordo ke-𝑞
Θ𝑄 : koefisien MA musiman pada ordo ke-𝑄
(1 − 𝐵 )𝑑 : deret pembedaan nonmusiman ordo ke-𝑑
(1 − 𝐵 𝑆)𝐷 : deret pembedaan musiman ordo ke-𝑑
𝜀𝑡 : sisaan waktu ke-𝑡
𝑌𝑡 = 𝑎𝑌𝑡−1 + 𝜀𝑡 (4)
dimana :
𝑌𝑡 : amatan pada waktu ke-𝑡
𝑎 : konstanta
𝜀𝑡 : sisaan amatan pada waktu ke-𝑡.
Berdasarkan Persamaan (4), hipotesis yang digunakan dalam uji ADF adalah
sebagai berikut :
𝐻0 ∶ 𝑎 = 1 , data tidak stasioner
𝐻1 ∶ |𝑎| < 1, data stasioner
Statistik uji yang digunakan yaitu :
𝑎̂ − 1 (5)
𝑡ℎ𝑖𝑡 =
𝑠𝑒(𝑎̂)
dimana :
𝑎̂ : penduga kuadrat terkecil
𝑠𝑒(𝑎̂) : standar error dari (𝑎̂)
Kriteria pengambilan keputusan adalah tolak 𝐻0 apabila nilai statistik 𝑄ℎ𝑖𝑡 lebih
2
kecil dari 𝑋𝛼(ℎ−1) atau apabila nilai p-value lebih kecil dari taraf nyata (𝛼 = 0,05)
artinya data tidak stasioner dalam ragam. Sebaliknya terima 𝐻0 apabila nilai
2
statistik 𝑄ℎ𝑖𝑡 lebih besar dari 𝑋𝛼(ℎ−1) atau apabila nilai p-value lebih besar dari taraf
nyata (𝛼 = 0,05) artinya data stasioner dalam ragam. Data yang tidak stasioner
dalam ragam dapat diatasi dengan transformasi Box-Cox (Box 1953).
Transformasi Box-Cox dilakukan dengan berdasarkan pada nilai estimasi (𝜆)
yang tercantum pada Box-Cox Plot. Berikut merupakan bentuk transformasi sesuai
dengan nilai estimasi.
Berdasarkan Tabel 2, pola ACF adalah dies down atau menurun secara eksponensial
dan pola PACF cuts off setelah lag p maka kesimpulan model yang sesuai adalah
AR(𝑝) (Chuang dan Wei 1991).
Proses identifikasi model menghasilkan beberapa kandidat model. Beberapa
kandidat model tersebut selanjutnya dipilih berdasarkan dengan nilai Akaike’s
Information Criterion (AIC) terkecil dan signifikansi parameter.
8
𝐻0 ∶ 𝜙 = 0
𝐻1 ∶ 𝜙 ≠ 0
𝜙̂ (9)
𝑡ℎ𝑖𝑡 =
𝑠𝑒(𝜙̂ )
dimana :
𝑛 : banyaknya residual
𝑘 : lag ke-𝑘
𝐾 : lag maksimum yang diamati
𝑝̂ 𝑘 : nilai dugaan autokorelasi sisaan pada lag ke-𝑘
Kriteria pengambilan keputusan adalah terima 𝐻0 apabila < 𝒳𝛼2 (𝑑𝐵=𝐾−𝑝−𝑞)
dengan 𝑝 adalah ordo dari AR dan 𝑞 adalah ordo dari MA yang berarti antar sisaan
tidak terdapat autokorelasi.
Uji Kenormalan
Pengujian kenormalan dari sisaan dapat dilihat berdasarkan plot kuantil-
kuantil. Sisaan dikatakan menyebar normal apabila mengikuti garis referensi
sebaran normal. Selain itu, uji kenormalan juga dapat diperiksa melalui uji Saphiro-
Wilk (Shapiro dan Wilk 1965) dengan hipotesis sebagai berikut :
𝐻0 : sisaan menyebar normal
𝐻1 : sisaan tidak menyebar normal
(∑𝑛𝑖=1 𝑎𝑖 𝑦𝑖 )2 (11)
𝑊= 𝑛
∑𝑖=1(𝑦𝑖 − 𝑦̅)2
Kriteria pengambilan keputusan adalah terima 𝐻0 apabila nilai 𝑊 lebih besar dari
nilai tabel Saphiro Wilk atau apabila nilai p-value lebih besar dari taraf nyata
(𝛼=0.05) yang berarti bahwa sisaan menyebar mengikuti sebaran normal.
Model yang telah memenuhi asumsi sisaan kemudian dapat diproses
kembali dengan melakukan overfitting untuk memastikan bahwa model yang
terpilih merupakan model terbaik.
menambah ordo 𝑝, 𝑞, 𝑃, dan 𝑄 dari model awal secara bergantian. Sebagai contoh,
apabila terpilih model yang cocok adalah AR(2), dapat dilakukan overfitting dengan
model AR(3). Selanjutnya, model AR(2) dapat dikonfirmasi menjadi model terbaik
apabila estimasi parameter pada model AR(3) tidak signifikan (Cryer dan Chan
1985). Model terbaik yang telah terpilih selanjutnya digunakan sebagai alat untuk
memprediksi nilai pada beberapa periode kedepan.
2.9 Peramalan
Peramalan dilakukan untuk mengetahui nilai atau kejadian yang akan terjadi
di beberapa periode mendatang. Kemampuan dalam meramal sangat bergantung
pada performa model yang dibentuk. Dengan kata lain, tingkat keakuratan hasil
ramalan sangat dipengaruhi oleh performa model. Oleh karena itu proses validasi
diperlukan untuk penerimaan model (Mayer dan Butler 1993).
Proses validasi tersebut dapat dilakukan dengan mengukur performa model
dengan dengan menghitung tingkat kesalahan dari hasil ramalan model tersebut.
Salah satu alat yang dapat digunakan untuk mengetahui tingkat kesalahan dari hasil
ramalan adalah berdasarkan nilai Root Mean Square Error (RMSE) dan Mean
Absolute Percentage Error (MAPE). RMSE merupakan salah satu metode evaluasi
yang dapat digunakan untuk mengevaluasi suatu metode peramalan. RMSE dapat
digunakan apabila data peramalan berada pada skala yang sama (Hyndman dan
Koehler 2006). Nilai RMSE baik apabila mendekati nilai nol, sehingga model yang
memiliki nilai RMSE terkecil merupakan model yang terbaik. Berikut rumus untuk
menentukan nilai RMSE :
𝑛𝑖
∑𝑡=1 (𝑦𝑖𝑡 − 𝑦̂𝑖𝑡 )2
𝑅𝑀𝑆𝐸 = √ (12)
𝑛𝑖
Dimana 𝑛𝑖 adalah jumlah data pada kelompok ke-𝑖 atau, 𝑦𝑖𝑡 adalah nilai aktual
pada periode ke-𝑡 dan kelompok ke-𝑖 serta 𝑦̂𝑖𝑡 adalah nilai peramalan pada periode
ke-𝑡 dan kelompok ke-𝑖.
Selain nilai RMSE, nilai MAPE juga dapat digunakan sebagai acuan untuk
memilih model terbaik dari beberapa model yang terbentuk. Nilai MAPE diperoleh
berdasarkan persamaan berikut (Shaeffer 1980) :
𝑛𝑖
1 𝑦𝑖𝑡 − 𝑦̂𝑖𝑡
𝑀𝐴𝑃𝐸 = ∑| | × 100% (13)
𝑛𝑖 𝑦𝑖𝑡
𝑡=1
Nilai MAPE diperoleh dengan menentukan kesalahan mutlak pada setiap periode
dengan membagi dengan nilai aktual pada setiap periode dan mengalikannya
dengan 100% agar berada pada bentuk persen. Nilai MAPE dapat memberikan
gambaran terkait besarnya kesalahan peramalan pada suatu model dalam persen.
Batas atas nilai MAPE pada suatu model supaya dapat hasil peramalan dapat
diterima yaitu sebesar 10% (Kleijnen 1987).
Hasil peramalan yang baik tentunya sangat diharapkan oleh semua peneliti.
Namun, tidak menutup kemungkinan hasil peramalan tidak sesuai dengan harapan.
11
Hal ini dapat disebabkan oleh beberapa faktor. Faktor pencilan pada data deret
waktu dapat mengurangi keakuratan hasil peramalan dan bias dalam pendugaan
parameter model (Chen dan Liu 1993). Bias dalam pendugaan parameter dapat
terjadi juga apabila menggunakan ukuran contoh yang kecil (Kim 2003), sehingga
faktor ukuran contoh dapat menjadi pengaruh pada hasil peramalan.
𝑋𝑡 ,𝑡 ≠ 𝑇
𝑍𝑡 = {
𝑋𝑡 + 𝜔, 𝑡 = 𝑇
(𝑇)
𝑍𝑡 = 𝑋𝑡 𝜔𝐴𝑂 𝐼𝑡
𝜃𝑞 (𝐵 )ΘQ(𝐵 𝑆) (𝑇)
𝑍𝑡 = 𝜀 + 𝜔𝐴𝑂 𝐼𝑡
𝜙𝑝(𝐵 )Φ𝑃 (𝐵 )𝑆(1 − 𝐵 )𝑑 (1 − 𝐵 𝑆)𝐷 𝑡 (14)
dengan 𝑋𝑡 merupakan data pengamatan pada waktu ke-𝑡, 𝜔𝐴𝑂 merupakan besaran
(𝑇) 0, 𝑡 ≠ 𝑇
pencilan AO, dan 𝐼𝑡 = { merupakan peubah indikator yang mewakili ada
1, 𝑡 = 𝑇
atau tidaknya pencilan pada waktu T
12
3.1 Data
Penelitian ini menggunakan data bangkitan untuk proses simulasi model
seasonal AR dan data sekunder sebagai penerapan metode tersebut pada data aktual.
Data Simulasi
Data simulasi diperoleh dengan proses pembangkitan data yang di desain
sedemikian rupa berdasarkan skenario yang telah ditetapkan. Proses simulasi
dilakukan untuk dua tujuan yaitu mengetahui pengaruh dari tiga faktor terhadap
pendugaan parameter dan mengetahui pengaruh dari tiga faktor terhadap tingkat
konsistensi akurasi model. Pengaruh tiga faktor dapat diketahui dengan melihat
tabel analisis ragam (Montgomery 2013), sedangkan tingkat konsistensi akurasi
model dapat diketahui dengan melihat nilai Root Mean Square Error (RMSE).
Pada penelitian ini proses simulasi dilakukan berdasarkan model
ARIMA(1,0,0)(1,0,0)[12] dengan menggunakan panjang data deret waktu ( 𝑛 )
sebanyak 84, 204, dan 504 data. Menurut Hyndman dan Kostenko (2007), ukuran
contoh yang dibutuhkan bergantung pada jenis model statistik yang digunakan dan
variasi pada data. Semakin banyak data yang digunakan, semakin dapat
mengidentifikasi struktur dan polanya. Pada metode ARIMA, Box dan Jenkins
merekomendasikan minimal 50 pengamatan yang digunakan (Hassouna dan Al-
Sahili 2020). Oleh karena itu untuk dipilih 84 pengamatan untuk menggambarkan
ukuran contoh kecil, 204 pengamatan untuk menggambarkan ukuran contoh sedang
dan 504 pengamatan untuk menggambarkan ukuran contoh besar. Masing-masing
ukuran dibangkitkan pada empat variasi parameter dan diberi pengaruh pencilan
pada data pengamatan yang ditentukan.
Data Aktual
Data aktual yang digunakan dalam penelitian ini berupa data bulanan yang
mencakup peubah harga di provinsi Banten, Jawa Barat, Jawa Tengah, DI
Yogyakarta, Jawa Timur. Sumber data dalam penelitian ini diperoleh dari Sistem
Pemantauan Pasar Kebutuhan Pokok (SP2KP) Kementerian Perdagangan pada
periode Januari 2015 sampai Desember 2021 sehingga ukuran data yang digunakan
sebesar 84 data. Data dibagi menjadi dua bagian yaitu data training dan data testing.
Data training digunakan untuk membuat model tentatif yang terdiri atas periode
Januari 2015 sampai Desember 2020, sedangkan data testing digunakan untuk
validasi model terbaik yang terdiri atas periode Januari 2021 sampai Desember
2021. Data harga cabai merah besar pada lima Provinsi memiliki nilai pencilan
sebesar 3,5% untuk Provinsi Banten, Jawa Barat, Jawa Tengah dan Jawa Timur,
sedangkan nilai pencilan pada Provinsi DI Yogyakarta sebesar 1%.
ada dua yaitu simulasi dan analisis data aktual. Berikut adalah rincian dari masing-
masing tahapan.
Perbedaan dari keempat variasi parameter terletak pada nilai positif dan
negatif dari masing-masing parameter. Pembangkitan dengan empat variasi
parameter tersebut ditujukan untuk mendapatkan empat variasi data yang
berbeda.
2. Melakukan pembangkitan data berdasarkan nilai awal yang telah ditentukan
dan dibangkitkan pada tiga variasi ukuran contoh, 84, 204, dan 504.
3. Pembangkitan pada tiga variasi ukuran contoh dilakukan ulangan sebanyak
100 kali pada masing-masing ukuran contoh. Ulangan tersebut dilakukan
untuk mendapatkan data deret waktu dalam jumlah yang banyak, supaya
dapat digunakan sebagai pembanding dan memperkuat kesimpulan yang
diperoleh.
4. Pembangkitan yang dilakukan, diasumsikan sebagai data deret waktu
dengan persentase pencilan sebesar 0%. Oleh karena itu, setelah diperoleh
dua belas data deret waktu, selanjutnya dilakukan modifikasi untuk
memeroleh data deret waktu yang memuat nilai pencilan. Modikasi pada
dua belas data deret waktu dengan menyisipkan 2,5%, 5%, dan 7,5%
pencilan baik untuk N=84, N=204, maupun N=504, menghasilkan 48
kombinasi data deret waktu. Masing-masing data pada 48 kombinasi
tersebut memiliki 100 deret sebagai hasil dari pembangkitan sebanyak 100
kali. Berikut merupakan contoh dari hasil modifikasi untuk N=84.
14
Kombinasi P N VP Kombinasi P N VP
1 0 84 pp 25 5 84 pp
2 np 26 np
3 pn 27 pn
4 nn 28 nn
5 0 204 pp 29 5 204 pp
6 np 30 np
7 pn 31 pn
8 nn 32 nn
9 0 504 pp 33 5 504 pp
10 np 34 np
11 pn 35 pn
12 nn 36 nn
13 2,5 84 pp 37 7,5 84 pp
14 np 38 np
15 pn 39 pn
16 nn 40 nn
17 2,5 204 pp 41 7,5 204 pp
18 np 42 np
19 pn 43 pn
20 nn 44 nn
21 2,5 504 pp 45 7,5 504 pp
22 np 46 np
23 pn 47 pn
24 nn 48 nn
7.
Berdasarkan Tabel 4 terdapat 48 kombinasi, yang diperoleh dari kombinasi tiga
faktor. Respon dari percobaan ini adalah selisih (bias) antara rata-rata penduga
parameter autoregressive (𝜙̂ ) dan seasonal autoregressive (Φ ̂ ) dari 100 kali
simulasi dengan 𝜙 dan Φ.
8. Menghitung rataan dari 100 penduga parameter autoregressive (𝜙̂𝑚𝑒𝑎𝑛) dan
̂ 𝑚𝑒𝑎𝑛 ).
seasonal autoregressive (Φ
9. Menghitung selisih antara parameter autoregressive (𝜙) dengan nilai rataan
( 𝜙̂𝑚𝑒𝑎𝑛 ) dan parameter seasonal autoregressive ( Φ) dengan nilai rataan
(Φ̂ 𝑚𝑒𝑎𝑛 ).
10. Membuat kesimpulan berdasarkan hasil analisis ragam dan nilai akurasi model.
Bagian ini terdiri atas hasil simulasi peramalan data deret waktu musiman
dengan beberapa macam karakteristik data yang telah ditentukan skenarionya
dengan menggunakan metode seasonal AR. Selanjutnya akurasi peramalan kedua
metode tersebut dibandingkan berdasarkan nilai RMSE dan MAPE sehingga
diperoleh metode terbaik dalam meramalkan data deret waktu musiman yang
memuat data pencilan. Metode tersebut juga diaplikasikan pada peramalan data
harga cabai merah besar di lima Provinsi di Pulau Jawa.
autoregressive (Φ̂ 𝑚𝑒𝑎𝑛 ). Sebagai contoh, pada Gambar 4 (a), kombinasi 1 (N=84)
memiliki rata-rata bias lebih besar dibandingkan kombinasi 5 (N=204) dan
kombinasi 9 (N=504). Selain itu, kombinasi 2 (N=84) juga memiliki nilai tengah
lebih besar dibandingkan dengan kombinasi 6 (N=204) dan kombinasi 10 (N=504).
Tabel 5 adalah hasil pengujian hipotesis terhadap pengaruh tiga faktor (P,
N, dan VP) terhadap bias pendugaan parameter autoregressive (𝜙̂ ) menggunakan
analisis ragam. Hasil pengujian dapat disimpulkan bahwa, pengaruh dari ketiga
faktor tersebut tidak saling bebas. Artinya 𝜙̂ dipengaruhi oleh faktor persentase
pencilan, ukuran contoh dan variasi parameter.
Tabel 5 Analisis ragam untuk pendugaan parameter autoregressive (𝜙̂ )
Kesimpulan yang sama juga terlihat pada pengaruh interaksi hasil uji
analisis ragam untuk pendugaan parameter seasonal autoregressive (Φ̂ ) yang
ditampilkan pada Gambar 6. Pengaruh dari persentase pencilan, tidak sama
untuk setiap ukuran contoh atau memiliki pengaruh yang berbeda-beda
20
tergantung dengan besaran ukuran contoh. Begitu pula dengan faktor ukuran
contoh. Pengaruh dari ukuran contoh, tidak sama untuk setiap persentase
pencilan.
Berdasarkan Gambar 8, harga pada lima Provinsi cenderung berpola sama pada
tujuh tahun terakhir. Pada awal tahun, harga cenderung melambung tinggi,
sedangkan pada akhir tahun harga cenderung turun. Harga cabai pada Provinsi
Jawa Barat cenderung lebih tinggi daripada Provinsi lainnya, sedangkan Provinsi
DI Yogyakarta cenderung berada pada posisi terendah. Harga cabai tertinggi terjadi
pada bulan Februari 2020 yaitu sebesar Rp 75.200/kg di Provinsi Jawa Barat,
sedangkan harga cabai terendah terjadi pada November 2015 yaitu sebesar
Rp10.100/kg di Provinsi DI Yogyakarta. Kenaikan harga cabai pada Ferbruari 2020
disebabkan karena hasil panen yang rusak di beberapa daerah sentra produksi
karena meningkatnya penyakit pada tanaman cabai dan faktor hujan yang
menyebabkan buruh petik tidak optimal dalam melakukan pemetikan cabai.
Gambar 8 menunjukkan bahwa, karakteristik harga cabai merah besar
cenderung naik menjelang akhir tahun dan awal tahun. Hal ini diduga ada kaitannya
dengan cuaca. Hal ini dikarenakan, musim pada bulan-bulan menjelang akhir tahun
dan awal tahun adalah musim hujan, dimana pada musim hujan, tanaman cabai
sangat rentan terserang penyakit.
Berdasarkan simulasi yang telah dilakukan, perlu diperhatikan persentase
pencilan dan besaran ukuran contoh pada masing-masing data. Persentase pencilan
pada data harga cabai merah besar dapat terlihat dengan memperhatikan Gambar 9.
22
Gambar 9 Boxplot data harga cabai merah besar pada lima provinsi
(a) (b)
23
(d)
(c)
(e)
Gambar 10 Plot harga cabai lima provinsi dari 2015-2021 (a) Banten, (b) Jawa
Barat, (c) Jawa Tengah, (d) DIY, (e) Jawa Timur
Supaya mendapatkan hasil yang akurat, diperlukan pengujian secara formal yang
dapat dilakukan dengan menggunakan uji kestasioneran dalam ragam dengan uji
Bartlett dan kestasioneran dalam rataan dengan menggunakan stastistik uji
Augmented Dickey-Fuller (ADF). Keputusan pengujian dari uji Bartlett adalah
tolak H0 apabila p-value kurang dari (𝛼=0.05), sedangkan untuk keputusan uji ADF
adalah tolak H0 apabila p-value lebih dari (𝛼=0.05). Berikut ditampilkan hasil uji
ADF pada Tabel 7.
Berdasarkan Tabel 7, seluruh p-value lebih kecil dari taraf nyata 0,05 sehingga data
harga cabai pada setiap lokasi sudah stasioner dalam rataan. Sedangkan untuk
pengujian kestasioneran dalam ragam dilakukan dengan uji Bartlett. Hasil dari
pengujian kestarioneran tersebut disajikan pada Tabel 8.
24
Berdasarkan Tabel 8 seluruh nilai p-value lebih kecil dari taraf nyata 0,05 sehingga
tidak stasioner dalam ragam. Masalah tersebut dapat diatasi dengan melakukan
transformasi pada data. Transformasi yang dilakukan menggunakan transformasi
Box-Cox dimana harus melalui tahapan penentuan nilai estimasi ( 𝜆 ) sebelum
melakukan transformasi. Penentuan nilai estimasi tersebut berdasarkan Box-Cox
Plot. Berikut merupakan salah satu Box-Cox Plot yang dihasilkan oleh Provinsi
Banten.
Berdasarkan Tabel 9, hasil uji Bartlett pada data transformasi menunjukkan bahwa
seluruh lokasi telah stasioner dalam ragam. Hal ini ditunjukkan dengan nilai p-value
25
> 0,05. Berdasarkan hasil transformasi tersebut mengakibatkan data telah stasioner
baik dalam rataan maupun ragam. Hal tersebut dapat dibuktikkan berdasarkan plot
ACF musiman dan non musiman pada Gambar 12. Terlihat bahwa tidak ada pola
eksponensial pada plot ACF baik musiman maupun non musiman. Artinya
komponen integrated tidak diperlukan dalam model sehingga proses dapat
dilanjutkan ke tahap selanjutnya yaitu identifikasi model dengan plot ACF dan
PACF.
Identifikasi model
Identifikasi model dilakukan untuk memeroleh kandidat model berdasarkan
plot ACF dan PACF.
(a)
(b)
(c)
(d)
(e)
Gambar 12 Plot ACF non musiman (kiri), musiman (kanan) (a) Banten, (b) Jawa
Barat, (c) Jawa Tengah, (d) DIY, (e) Jawa Timur
26
Plot ACF merupakan indikator dari komponen MA sehingga lag yang cuts off pada
plot ACF menunjukkan besaran ordo untuk komponen MA. Apabila diperhatikan
plot ACF Provinsi Banten pada Gambar 12, terlihat cuts off pada lag kedua untuk
komponen non musiman, sedangkan untuk komponen musiman terlihat cuts off
pada lag pertama untuk periode musiman 12 sehingga berdasarkan identifikasi
tersebut diperoleh kandidat model yaitu ARIMA(0,0,2)(0,0,1)[12]. Proses
identifikasi yang sama juga diterapkan pada provinsi lainnya.
Selanjutnya, untuk proses identifikasi model komponen AR, diperlukan plot
PACF baik untuk non musiman maupun musiman.
(a)
(b)
(c)
(d)
(e)
Gambar 13 Plot PACF non musiman (kiri), musiman (kanan) (a) Banten, (b) Jawa
Barat, (c) Jawa Tengah, (d) DIY, (e) Jawa Timur
27
Berdasarkan Tabel 10 dapat diketahui bahwa model terbaik untuk Provinsi Banten
dan Jawa Barat adalah ARIMA(1,0,0)(1,0,0)[12], model terbaik untuk Provinsi
Jawa Tengah adalah ARIMA(0,0,2)(0,0,1)[12], model terbaik untuk Provinsi DIY
adalah ARIMA(2,0,0)(0,0,1)[12], dan model terbaik untuk Provinsi Jawa Timur
adalah ARIMA(2,0,0)(0,0,1)[12].
Pendugaan Parameter
Tahapan pendugaan parameter dilakukan pada model seasonal AR karena
sesuai dengan kajian simulasi yang dilakukan. Hasil pendugaan parameter
ditunjukkan pada Tabel berikut.
28
Tabel 13 menunjukkan bahwa nilai RMSE dan MAPE cenderung kecil. Nilai
MAPE 2,65% mengartikan bahwa terdapat kesalahan ramalan sebesar 2,65% atau
sebesar 0,31 berdasarkan nilai RMSE. Berdasarkan rekomendasi yang diberikan
oleh peneliti sebelumnya, batas penerimaan model berdasarkan nilai MAPE adalah
30
10%, sehingga dapat disimpulkan bahwa seluruh model yang dihasilkan pada
masing-masing provinsi, dapat diterima dengan baik hasil ramalannya.
Selain itu, hasil tersebut dapat menunjukkan bahwa tingkat keakuratan
model seasonal AR baik dan model dapat digunakan untuk meramalkan data harga
cabai merah besar pada beberapa periode kedepan. Kesimpulan ini sejalan dengan
hasil simulasi, bahwa model seasonal AR masih memiliki performa yang baik
ketika terdapat pencilan aditif sebesar 5% dengan ambang batas minimal yaitu 1,5𝑘
dimana 𝑘 = 𝑚𝑎𝑥 − 𝑚𝑖𝑛.
Selanjutnya dilakukan peramalan harga cabai merah besar di Indonesia
untuk periode Januari 2021 - Desember 2022. Hasil peramalan harga cabai merah
besar di Indonesia disajikan pada Gambar 14.
Gambar 14 Plot harga prediksi dan harga aktual (Rupiah/Kg) (a) Banten, (b)
Jawa Barat, (c) Jawa Tengah, (d) DI Yogyakarta, (e) Jawa Timur
Berdasarkan Gambar 14, hasil peramalan pada periode Januari 2021 – Mei
2022 mendekati data aktual. Terlihat bahwa rata-rata selisih antara harga ramalan
dengan harga aktual pada periode Januari 2021 – Mei 2022 adalah Rp 8.891/Kg.
Selisih ramalan tersebut masih tergolong rendah apabila dinilai berdasarkan nilai
MAPE yaitu sebesar 2,8%. Artinya terdapat kesalahan ramalan sebesar 2,8% pada
ramalan harga periode Januari 2021 – Mei 2022. Namun setelah bulan ke-16 atau
31
mulai Juni 2022 – September 2022 harga aktual melonjak naik dan memiliki selisih
yang terbilang jauh dari harga ramalan. Hal tersebut menyebabkan nilai MAPE
pada periode Juni 2022 – September 2022 menjadi besar sehingga dapat menjadi
catatan bahwa metode SARIMA tidak memiliki performa yang baik ketika
digunakan untuk melakukan peramalan jangka panjang, hal ini sesuai dengan
kesimpulan yang dinyatakan oleh Liu et al (2023) bahwa metode SARIMA
meruapakan suatu model yang memiliki tingkat akurasi yang tinggi untuk prediksi
jangka pendek.
Menurut Volantina et al. (2021) salah satu faktor terjadinya fluktuasi harga
adalah ketidakseimbangan penawaran dan permintaan cabai. Kenaikan harga pada
data aktual terjadi pada bulan Juli, dimana pada bulan Juli terdapat hari raya idul
adha yang dimungkinkan terdapat lonjakan permintaan. Di sisi lain terdapat
permasalahan pasokan yang berkurang akibat curah hujan yang tinggi, serangan
hama penyakit dan perubahan pola atau jadwal tanam, sehingga terjadi
ketidakseimbangan antara penawaran dan permintaan.
Oleh adanya permasalahan dan hasil dari penelitian yang telah dilakukan,
pemerintah melakukan berbagai program dan kegiatan stabilisasi baik pasokan
maupun harga. Program yang dibuat yaitu dengan menggunakan Early Warning
System (EWS). EWS ini merupakan suatu sistem yang dapat memberi acuan untuk
pola tanam. Selain itu pemerintah telah melakukan usaha pengendalian Organisme
Pengganggu Tanaman (OPT) ramah lingkungan, penetapan irigasi hemat air,
penggunaan mulsa dan pemberdayaan petani unggulan, serta disediakan bantuan
biaya untuk mendistribusikan cabai dari daerah yang sedang panen ke titik-titik
pasar yang membutuhkan (Kepmentan 2021). Dari sisi pengolahan dan pemasaran
pascapanen, Ditjen Hortikultura juga turut menfasilitasi rumah produksi, alat-alat
pengering (dome drying), alat pengolahan pasta cabai (Kemendag 2020).
32
5.1 Simpulan
Hasil simulasi pada data bangkitan memberikan kesimpulan bahwa, faktor
variasi parameter, persentase pencilan dan ukuran contoh berpengaruh nyata
terhadap bias parameter, sehingga ketika menerapkan model seasonal AR pada
data aktual, perlu diperhatikan ketiga faktor tersebut. Selanjutnya, berdasarkan
tingkat akurasi model diperoleh kesimpulan bahwa model seasonal AR dapat
digunakan dengan baik pada berbagai data dengan ukuran contoh sebesar 84, 204,
dan 504, serta memiliki persentase pencilan aditif maksimal sebesar 5% dengan
besaran pencilan sama dengan ambang batas minimal yaitu 1,5 𝑘 dimana 𝑘 =
𝑚𝑎𝑥 − 𝑚𝑖𝑛 sehingga dapat diterapkan pada data empirik.
Hasil pemodelan data empirik menunjukkan bahwa, model seasonal AR tidak
selalu unggul pada setiap provinsi sehingga model terbaik pada setiap provinsi
menyesuaikan dengan hasil identifikasi model beserta pengujian asumsi yang
menyertai. Hasil peramalan menunjukkan bahwa pada periode Januari 2021 – Mei
2022 harga ramalan mendekati harga aktual. Rata-rata selisih antara harga ramalan
dengan harga aktual pada periode Januari 2021 – Mei 2022 adalah Rp 8.891/Kg.
Selisih ramalan tersebut masih tergolong rendah apabila dinilai berdasarkan nilai
MAPE yaitu sebesar 2,8%. Namun setelah bulan ke-16 atau mulai Juni 2022 –
September 2022 harga aktual melonjak naik dan memiliki selisih yang terbilang
jauh dari harga ramalan. Hal tersebut menyebabkan nilai MAPE pada periode Juni
2022 – September 2022 menjadi besar sehingga dapat menjadi catatan bahwa
metode SARIMA tidak memiliki performa yang baik ketika digunakan untuk
melakukan peramalan jangka panjang.
5.2 Saran
Pada setiap penelitian memiliki temuan baru yang harus diikuti dengan
penelitian selanjutnya supaya ilmu pengetahuan terus berkembang. Oleh adanya
hasil penelitian ini, terdapat saran yaitu dilakukannya kajian simulasi pengaruh
persentase pencilan dengan besaran pencilan yang lebih ekstrim untuk model dasar
ARIMA(1,1,1)(1,1,1)[s].
33
DAFTAR PUSTAKA
LAMPIRAN
37
Jawa Timur
38
RIWAYAT HIDUP
Penulis dilahirkan di kota Ngawi pada tanggal 26 Januari 1998 sebagai anak
kedua dari pasangan bapak Sanusi dan ibu Siti Yulikah. Pendidikan sarjana
ditempuh di Program Studi Matematika, Fakultas Matematika dan Ilmu
Pengetahuan Alam Universitas Sebelas Maret, dan lulus pada tahun 2020. Pada
tahun 2020, penulis diterima sebagai mahasiswa program magister (S-2) di Program
Studi Statistika dan Sains Data pada Sekolah Pascasarjana IPB University dan
menamatkannya pada tahun 2023.