Ratna Nur Sarima

SIMULASI DAN PENERAPAN MODEL SEASONAL
AUTOREGRESSIVE PADA PERAMALAN HARGA CABAI

MERAH BESAR DI LIMA PROVINSI DI PULAU JAWA
RATNA NUR MUSTIKA SANUSI
PROGRAM STUDI STATISTIKA DAN SAINS DATA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2023
PERNYATAAN MENGENAI TESIS DAN
SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA
Dengan ini saya menyatakan bahwa tesis berjudul Simulasi dan Penerapan
Model Seasonal Autoregressive pada Peramalan Harga Cabai Merah Besar di Lima
Provinsi di Pulau Jawa adalah benar karya saya dengan arahan dari komisi pembimbing
dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber
informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak
diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar
Pustaka di bagian akhir tesis ini.
Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut
Pertanian Bogor.
Bogor, Januari 2023
Ratna Nur Mustika Sanusi

NIM G1501202048
RINGKASAN
RATNA NUR MUSTIKA SANUSI. Simulasi dan Penerapan Model Seasonal
Autoregressive pada Peramalan Harga Cabai Merah Besar di Lima Provinsi di
Pulau Jawa. Dibimbing oleh Bapak BUDI SUSETYO dan Ibu UTAMI DYAH
SYAFITRI
Komoditas cabai merah besar merupakan komoditas yang perlu mendapatkan

penanganan serius karena menjadi salah satu penyumbang inflasi. Salah satu upaya
penanganan dari sudut pandang statistika adalah dengan melakukan peramalan.
Peramalan harga cabai merah besar dapat dilakukan dengan metode Seasonal
Autoregressive Integrated Moving Average (SARIMA), dikarenakan terdapat pola
musiman pada data. Metode SARIMA merupakan gabungan dari berbagai macam
model, salah satunya adalah model seasonal autoregressive (seasonal AR).
Pada data harga cabai merah besar terdapat permasalahan yaitu adanya
pencilan aditif dan minimnya ketersediaan data bulanan. Pencilan aditif merupakan
suatu tipe pencilan yang memberikan pengaruh pada satu periode saja dalam data
deret waktu. Pengaruh dari faktor-faktor tersebut dapat lebih terlihat, apabila
dilakukan simulasi yang dirancang dengan pendekatan rancangan faktorial.
Simulasi dilakukan dengan pendekatan rancangan faktorial tiga faktor yaitu faktor
pencilan, ukuran contoh dan variasi parameter. Masing-masing faktor tersebut
memiliki level yang berbeda-beda. Faktor persentase pencilan memiliki empat level
yaitu 0%, 2,5%, 5%, dan 7,5%, faktor ukuran contoh memiliki tiga level yaitu 84,
204, dan 504, dan faktor variasi parameter memiliki empat level yaitu pp,np,pn, dan
nn. Dengan demikian penelitian ini terbagi menjadi dua bagian yaitu melakukan
simulasi dan melakukan analisis data empirik. Tujuan simulasi untuk mengetahui
kinerja metode seasonal AR sehingga dapat digunakan sebagai dasar keputusan
untuk melakukan analisis data aktual dimana karakteristik datanya mengandung
pencilan aditif hingga sebesar 3,5% dan jumlah data yang kecil (N=84).
Hasil simulasi memberikan kesimpulan bahwa, ketiga faktor berpengaruh
nyata terhadap bias parameter sehingga perlu diperhatikan ketiga faktor tersebut
ketika melakukan penerapan pada data empirik. Selanjutnya, berdasarkan tingkat
akurasi model diperoleh kesimpulan bahwa model seasonal AR dapat digunakan
dengan baik pada berbagai data dengan ukuran contoh sebesar 84, 204, dan 504,
serta memiliki persentase pencilan aditif maksimal sebesar 5% dengan besaran
pencilan sama dengan ambang batas minimal yaitu 1,5𝑘.
Hasil pemodelan data empirik menunjukkan bahwa, model seasonal AR tidak
selalu unggul pada setiap provinsi sehingga model terbaik pada setiap provinsi
menyesuaikan dengan hasil identifikasi model beserta pengujian asumsi yang
menyertai. Hasil peramalan model terbaik menunjukkan bahwa pada periode
Januari 2021 – Mei 2022 harga ramalan mendekati harga aktual dengan rata-rata
nilai MAPE menunjukkan angka 2,8%. Namun mulai Juni 2022 – September 2022
harga aktual melonjak naik dan memiliki selisih yang terbilang jauh dari harga
ramalan sehingga dapat menjadi catatan bahwa metode SARIMA tidak memiliki
performa yang baik ketika digunakan untuk melakukan peramalan jangka panjang.
Kata kunci : data deret waktu musiman, pencilan, seasonal AR, simulasi, anova
tiga faktor.
SUMMARY
RATNA NUR MUSTIKA SANUSI. Simulation and Application of the Seasonal
Autoregressive Model in Forecasting Big Red Chili Prices in Five Provinces on
Java Island. Supervised by Mr. BUDI SUSETYO and Mrs. UTAMI DYAH
SYAFITRI.
Big red chilli commodity is a commodity that needs serious handling

because it is one of the contributors to inflation. One of the handling efforts from a
statistical point of view is forecasting. Forecasting the price of big red chillies can
be done using the Seasonal Autoregressive Integrated Moving Average (SARIMA)
method because there is a seasonal pattern in the data. The SARIMA method
combines various models, including the seasonal autoregressive (AR).
There are problems with the big red chilli price data, namely the presence
of additive outliers and the need for more availability of monthly data. An additive
outlier is an outlier that gives effect to only one period in time series data. The
influence of these factors can be seen more clearly if a simulation is carried out
using a factorial design approach. The simulation was carried out using a three-
factor factorial design approach: the outlier factor, sample size and parameter
variation. Each of these factors has a different level. The percentage outlier factor
has four levels, namely 0%, 2.5%, 5%, and 7.5%, the sample size factor has three
levels, namely 84, 204, and 504, and the parameter variation factor has four levels,
namely pp, np, pn, and nn. Thus, this research is divided into two parts: conducting
simulations and conducting empirical data analysis. The purpose of the simulation
is to determine the performance of the seasonal AR method so that it can be used
as a basis for decisions to carry out actual data analysis where the characteristics of
the data contain additive outliers of up to 3.5% and the amount of data are small
(N=84).
The simulation results conclude that the three factors significantly affect
parameter bias, so it is necessary to pay attention to these three factors when
applying them to empirical data. Furthermore, based on the level of accuracy of the
model, it can be concluded that the seasonal AR model can be used well on a variety
of data with sample sizes of 84, 204, and 504 and has a maximum additive outlier
percentage of 5% with an outlier size equal to the minimum threshold of 1, 5k.
The results of empirical data modelling show that the seasonal AR model is
only sometimes superior in some provinces. Hence, the best model in each province
adjusts to model identification results along with the accompanying assumption
tests. The best model forecasting results show that in the period January 2021 –
May 2022, the forecast price is close to the actual price, with an average MAPE
value showing 2.8%. However, from June 2022 – September 2022, the actual price
increased. It has a relatively large difference from the forecast price, so it can be
noted that the SARIMA method does not perform well when used for long-term
forecasting.
Keywords: seasonal time series data, outliers, seasonal AR, simulation, three-
factor ANOVA.
© Hak Cipta milik IPB, tahun 2023
Hak Cipta dilindungi Undang-Undang
Dilarang mengutip sebagian atau seluruh karya tulis ini tanpa
mencantumkan atau menyebutkan sumbernya. Pengutipan hanya untuk
kepentingan pendidikan, penelitian, penulisan karya ilmiah, penyusunan laporan,
penulisan kritik, atau tinjauan suatu masalah, dan pengutipan tersebut tidak
merugikan kepentingan IPB.
Dilarang mengumumkan dan memperbanyak sebagian atau seluruh karya
tulis ini dalam bentuk apa pun tanpa izin IPB.
SIMULASI DAN PENERAPAN MODEL SEASONAL
AUTOREGRESSIVE PADA PERAMALAN HARGA CABAI
MERAH BESAR DI LIMA PROVINSI DI PULAU JAWA
RATNA NUR MUSTIKA SANUSI
Tesis
sebagai salah satu syarat untuk memperoleh gelar
Magister pada Sains pada
Program Studi Statistika dan Sains Data
PROGRAM STUDI STATISTIKA DAN SAINS DATA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT PERTANIAN BOGOR
BOGOR
2023
Penguji Luar Komisi Pembimbing pada Ujian Tesis:
Dr. Kusman Sadik, S.Si., M.Si.
PRAKATA
Puji dan syukur penulis panjatkan kepada Allah subhanaahu wa ta’ala atas
segala karunia-Nya sehingga karya ilmiah ini berhasil diselesaikan dengan judul
“Simulasi dan Penerapan Model Seasonal Autoregressive pada Peramalan Harga
Cabai Merah Besar di Lima Provinsi di Pulau Jawa”.
Karya ilmiah ini tidak lepas dari bantuan dan dukungan berbagai pihak, untuk
itu penulis menyampaikan rasa terima kasih kepada:
1. Dr. Ir. Budi Susetyo, M.S. dan Dr. Utami Dyah Syafitri, S.Si., M.Si. selaku
Dosen Pembimbing yang telah memberikan bimbingan, saran, dan arahan
dalam menyelesaikan karya ilmiah ini.
2. Moderator seminar dan penguji luar komisi pembimbing yang telah membantu
lancarnya proses penyelesaian tugas akhir penulis.
3. Seluruh jajaran dosen dan karyawan Jurusan Statistika Pascasarjana IPB yang
telah membantu proses terkait penyelesaian karya ilmiah ini.
4. Papah Sanusi, Mamah Siti Yulikah, Mas Vian, dan Mbak Alya serta segenap
keluarga yang selalu memberikan dukungan, doa, dan kasih sayang.
5. Teman-teman Statistika Pascasarjana IPB angkatan 2020 yang telah
memberikan semangat dan bantuan.
Semoga karya ilmiah ini bermanfaat bagi pihak yang membutuhkan dan bagi
kemajuan ilmu pengetahuan.
Bogor, Januari 2023
Ratna Nur Mustika Sanusi

DAFTAR ISI
DAFTAR TABEL x
DAFTAR GAMBAR x
DAFTAR LAMPIRAN xi
I PENDAHULUAN 1
1.1 Latar Belakang 1
1.2 Tujuan 2
1.3 Ruang Lingkup 3
II TINJAUAN PUSTAKA 4
2.1 Autoregressive Integrated Moving Average (ARIMA) 4
2.2 Seasonal ARIMA (SARIMA) 4
2.3 Uji Asumsi 5
2.4 Identifikasi Model 7
2.5 Akaike’s Information Criterion (AIC) 8
2.6 Estimasi dan Uji Signifikansi Parameter 8
2.7 Diagnostik Sisaan 8
2.8 Overfitting Model 9
2.9 Peramalan 10
2.10 Pencilan pada Data Deret Waktu 11
III METODOLOGI PENELITIAN 12
3.1 Data 12
3.2 Prosedur Analisis Data 12
3.3 Diagram Alir 16
IV HASIL DAN PEMBAHASAN 17
4.1 Hasil Simulasi 17
4.2 Penerapan Model Seasonal AR 21
4.3 Pemodelan Seasonal AR 22
4.4 Evaluasi Model dan Hasil Peramalan 29
V SIMPULAN DAN SARAN 32
5.1 Simpulan 32
5.2 Saran 32
DAFTAR PUSTAKA 33
LAMPIRAN 36
RIWAYAT HIDUP 38
DAFTAR TABEL
1 Tabel 1 Transformasi Box-Cox 7

2 Tabel 2 Identifikasi ordo menggunakan plot ACF dan PACF 7
3 Tabel 3 Variasi parameter 13
4 Tabel 4 Kombinasi faktor 15
5 Tabel 5 Analisis ragam untuk pendugaan parameter autoregressive (𝜙) 18
6 Tabel 6 Analisis ragam untuk pendugaan parameter seasonal
autoregressive (Φ) 19
7 Tabel 7 Hasil uji ADF 23
8 Tabel 8 Hasil uji Bartlett 24
9 Tabel 9 Hasil uji Bartlett setelah transformasi 24
10 Tabel 10 Kandidat model seasonal AR data harga cabai merah besar 27
11 Tabel 11 Hasil pendugaan parameter model seasonal AR 28
12 Tabel 12 Nilai p-value uji Ljung-Box dan Saphiro-Wilk 28
13 Tabel 13 Evaluasi model dengan nilai RMSE dan MAPE 29
DAFTAR GAMBAR
1 Gambar 1 Plot data hasil modifikasi nilai pencilan 14

2 Gambar 2 Flowchart Prosedur Analisis Data 16
3 Gambar 3 Boxplot sebaran data bias penduga parameter autoregressive 17
4 Gambar 4 Boxplot sebaran data bias penduga parameter seasonal
autoregressive 18
5 Gambar 5 Plot interaksi faktor pendugaan parameter autoregressive (𝜙)
19
6 Gambar 6 Plot interaksi faktor pendugaan parameter seasonal
autoregressive (Φ) 20
7 Gambar 7 Boxplot RMSE (a) sampai (d) Boxplot untuk N = 84, (e)
sampai (h) Boxplot untuk N = 204, dan (i) sampai (l) Boxplot untuk N
= 504 20
8 Gambar 8 Grafik harga cabai merah besar pada lima provinsi 21
9 Gambar 9 Boxplot data harga cabai merah besar pada lima provinsi 22
10 Gambar 10 Plot harga cabai lima provinsi dari 2015-2021 (a) Banten, (b)
Jawa Barat, (c) Jawa Tengah, (d) DIY, (e) Jawa Timur 23
11 Gambar 11 Box-Cox Plot Provinsi Banten 24
12 Gambar 12 Plot ACF non musiman (kiri), musiman (kanan) (a) Banten,
(b) Jawa Barat, (c) Jawa Tengah, (d) DIY, (e) Jawa Timur 25
13 Gambar 13 Plot PACF non musiman (kiri), musiman (kanan) (a) Banten,
(b) Jawa Barat, (c) Jawa Tengah, (d) DIY, (e) Jawa Timur 26
14 Gambar 14 Plot harga prediksi dan harga aktual (Rupiah/Kg) (a) Banten,
(b) Jawa Barat, (c) Jawa Tengah, (d) DI Yogyakarta, (e) Jawa Timur 30
DAFTAR LAMPIRAN
1 Lampiran 1 Box-Cox Plot 37
1
I PENDAHULUAN
1.1 Latar Belakang

Komoditas cabai merah besar merupakan komoditas yang perlu mendapatkan
penanganan serius karena menjadi salah satu penyumbang inflasi (BPS 2021). Hal
ini dikarenakan cabai merah besar termasuk dalam barang yang harganya
bergejolak (Saptana et al. 2018). Gejolak harga cabai terus terjadi pada beberapa
tahun terakhir (Nauly 2016). Tentunya hal ini masih menjadi masalah yang harus
ditangani oleh pemerintah, khususnya di harga di Pulau Jawa, karena harga di Pulau
Jawa dapat memengaruhi harga di wilayah lain (Supriadi dan Sejati 2018). Salah
satu upaya penanganan dari sudut pandang statistika adalah dengan melakukan
peramalan. Metode statistika yang membahas terkait dengan peramalan adalah
analisis deret waktu. Analisis deret waktu dapat dimanfaatkan untuk meramalkan
nilai pada masa mendatang (Ghysels dan Marcellino 2018). Metode peramalan
yang sering digunakan dikenal dengan metode Autoregressive Integrated Moving
Average (ARIMA). Metode ARIMA memiliki kelemahan yaitu tidak bisa
mengatasi pengaruh musiman, sehingga terdapat pengembangan metode ARIMA
yang dapat mengakomodasi pola data musiman yang sering disebut dengan
Seasonal ARIMA (SARIMA) (Petropoulos et al. 2022). Model SARIMA
merupakan suatu model yang umum, namun sebagian besar model yang digunakan
adalah model seasonal AR (Hakim et al. 2020). Adapun terdapat metode lain yang
dapat mengakomodasi pola data musiman yaitu metode Eksponensial Holt-Winter
(Lima et al. 2019).
Metode SARIMA dan Eksponensial Holt-Winter telah digunakan pada
berbagai macam penelitian. Selain untuk mendapatkan hasil ramalan, para peneliti
ini juga membandingkan tingkat keakuratan ramalan kedua metode tersebut.
Penelitian tersebut telah dilakukan pada peramalan hasil produksi ikan di Kuta
Selatan yang menghasilkan kesimpulan bahwa tingkat kesalahan akurasi ramalan
dengan menggunakan metode SARIMA sebesar 0,81% sedangkan tingkat
kesalahan akurasi ramalan dengan menggunakan metode Eksponensial Holt-
Winter sebesar 1,14% (Rahman et al. 2018). Selanjutnya yaitu pada peramalan
jumlah produksi ikan di Kota Sibolga menghasilkan kesimpulan bahwa tingkat
kesalahan akurasi ramalan dengan menggunakan metode SARIMA sebesar 5,92%
sedangkan tingkat kesalahan akurasi ramalan dengan menggunakan metode
Eksponensial Holt-Winter sebesar 6,39% (Putra et al. 2019). Selanjutnya yaitu
pada peramalan jumlah penumpang kapal di pelabuhan Pantai Baru menghasilkan
kesimpulan bahwa tingkat kesalahan akurasi ramalan dengan menggunakan metode
SARIMA sebesar 191,127 sedangkan tingkat kesalahan akurasi ramalan dengan
menggunakan metode Eksponensial Holt-Winter sebesar 169,208 (Negara 2021).
Terakhir yaitu pada peramalan produksi domestik bruto triwulan atas dasar harga
berlaku menurut pengeluaran konsumsi rumah tangga menghasilkan kesimpulan
bahwa tingkat kesalahan akurasi ramalan dengan menggunakan metode SARIMA
sebesar 0,3895 sedangkan tingkat kesalahan akurasi ramalan dengan menggunakan
metode Eksponensial Holt-Winter sebesar 0,455 (Khaulasari et al. 2022).
Berdasarkan hasil perbandingan dari beberapa penelitian, dapat disimpulkan bahwa
metode SARIMA memiliki kinerja yang lebih baik dibandingkan dengan metode
Eksponensial Holt-Winter.
2
Peramalan harga cabai merah besar dapat dilakukan dengan metode SARIMA,
dikarenakan terdapat pola musiman pada data dan memiliki tingkat akurasi hasil
ramalan yang baik. Metode SARIMA dapat digunakan di berbagai bidang seperti
bidang kesehatan (Duangchaemkarn et al. 2022), lalu lintas (Deretić et al. 2022),
kelautan (Xu et al. 2021), perdagangan (Divisekara et al. 2021), ekonomi (Rizki
dan Taqiyyuddin 2021), pariwisata (Msofe dan Mbago 2019) dan berbagai bidang
lainnya. Berdasarkan manfaat yang diberikan oleh metode SARIMA terhadap
penelitian-penelitian yang telah dilakukan, perlu adanya kajian lebih lanjut,
khususnya yang berkaitan dengan permasalahan yang dapat mempengaruhi tingkat
akurasi peramalan dari metode SARIMA.
Pada data harga cabai merah besar terdapat permasalahan yaitu adanya
pencilan yang disebabkan karena terjadinya gejolak harga dan minimnya
ketersediaan data bulanan. Kedua masalah tersebut dapat menjadi faktor yang dapat
mempengaruhi hasil peramalan. Faktor pencilan pada data deret waktu dapat
mengurangi keakuratan hasil peramalan dan bias dalam pendugaan parameter
model (Blázquez-García et al. 2021). Pencilan pada data deret waktu terbagi
menjadi empat tipe. Tipe pencilan yang dimungkinkan terdapat pada data harga
cabai merah besar yaitu tipe pencilan aditif, karena merupakan suatu tipe pencilan
yang memberikan pengaruh pada satu periode saja dalam data deret waktu. Seperti
halnya pada data harga cabai. Ketika terdapat lonjakan harga, pemerintah pasti
langsung menangani masalah tersebut supaya tidak terjadi berlarut-larut.
Faktor kedua yang menjadi masalah yaitu ukuran contoh yang kecil, karena
dapat menimbulkan masalah bias dalam pendugaan parameter (Kim dan Durmaz
2012), sehingga faktor ukuran contoh dapat menjadi pengaruh pada hasil peramalan.
Selain itu, penerapan metode pada data yang berbeda-beda dapat menghasilkan
tingkat akurasi yang berbeda-beda pula. Perbedaan data tersebut menyebabkan
suatu data memiliki parameter yang berbeda-beda, sehingga faktor variasi
parameter juga dapat menjadi pengaruh pada hasil peramalan. Pengaruh dari faktor-
faktor tersebut dapat lebih terlihat, apabila dilakukan simulasi yang dirancang
dengan pendekatan rancangan faktorial. Hal tersebut dikarenakan rancangan
factorial dapat memberikan kesimpulan terkait dengan faktor yang paling
berpengaruh terhadap respon (Mattjik dan Sumertajaya 2013). Dengan demikian
penelitian ini terbagi menjadi dua bagian yaitu melakukan simulasi dan melakukan
analisis data empirik.
Simulasi dilakukan dengan pendekatan rancangan faktorial tiga faktor yaitu
faktor pencilan, ukuran contoh dan variasi parameter. Masing-masing faktor
tersebut memiliki level yang berbeda-beda. Faktor persentase pencilan memiliki
empat level yaitu 0%, 2,5%, 5%, dan 7,5%, faktor ukuran contoh memiliki tiga
level yaitu 84, 204, dan 504, dan faktor variasi parameter memiliki empat level
yaitu pp,np,pn, dan nn. Hasil dari simulasi tersebut dapat digunakan sebagai dasar
keputusan untuk melakukan analisis data aktual terhadap peramalan harga cabai
merah besar di lima Provinsi di Pulau Jawa, dimana karakteristik datanya
mengandung pencilan aditif dan jumlah data yang kecil (N=84).
1.2 Tujuan
Tujuan dari penelitian ini adalah
1. Melakukan kajian kinerja metode seasonal AR dengan pengaruh
persentase pencilan, ukuran contoh, dan variasi parameter.
3
2. Menerapkan model seasonal AR dalam meramalkan harga cabai merah

besar di lima Provinsi yaitu Banten, Jawa Barat, Jawa Tengah, DI
Yogyakarta, dan Jawa Timur.
1.3 Ruang Lingkup

Ruang lingkup pada penelitian ini terbatas pada data deret waktu musiman
yang mengandung pencilan aditif dengan ambang batas minimal yaitu 1,5𝑘 dimana
𝑘 = 𝑚𝑎𝑥 − 𝑚𝑖𝑛. Model dasar yang digunakan pada penelitan ini terbatas hanya
pada model seasonal AR dengan notasi ARIMA(1,0,0)(1,0,0)[12].
4
II TINJAUAN PUSTAKA
2.1 Autoregressive Integrated Moving Average (ARIMA)

ARIMA merupakan metode peramalan data deret waktu univariat. Model
ARIMA merupakan perpaduan dari model Autoregressive (AR) dengan ordo
𝑝, model Moving Average (MA) dengan ordo 𝑞 dan proses pembedaan dengan ordo
𝑑. Bentuk umum dari model ARIMA adalah sebagai berikut (Montgomery et al.
2015):
𝜙𝑝(𝐵 )(1 − 𝐵 )𝑑 𝑌𝑡 = 𝛿 + 𝜃𝑞 (𝐵 )𝜀𝑡 (1)

dimana :
𝑝 : ordo AR
𝑑 : ordo pembedaan
𝑞 : ordo MA
𝐵 : operator Backshift
𝑌𝑡 : nilai amatan pada waktu ke-𝑡
𝜙𝑝 : koefisien AR pada ordo ke-𝑝
𝜃𝑞 : koefisien MA pada ordo ke-𝑞
(1 − 𝐵 )𝑑 : deret pembeda ordo ke-𝑑
𝜀𝑡 : sisaan waktu ke-𝑡
𝛿 : konstanta.
Model ARIMA merupakan salah satu model yang sederhana dalam pemodelan
data deret waktu. Kesederhanaan model ARIMA tentunya tidak selalu bisa
memenuhi kebutuhan pemodelan. Hal ini dikarenakan terdapat beberapa macam
pola data deret waktu seperti pola acak, tren, musiman dan gabungan (Montgomery
et al. 2015). Keempat pola tersebut memiliki karakteristik yang berbeda-beda.
Perbedaan karakteristik yang dimiliki oleh masing-masing pola, menjadikan
kebutuhan terhadap pengembangan model ARIMA. Salah satu kebutuhannya
adalah model yang dapat mengakomodasi pola data musiman yang sering disebut
dengan ARIMA Musiman (SARIMA).
2.2 Seasonal ARIMA (SARIMA)

Metode SARIMA dikembangkan atas dasar pengaruh musiman yang belum
bisa diatasi oleh metode ARIMA. Menurut (Box et al. 1978), pola musiman
merupakan pola yang berulang-ulang dalam selang waktu tetap. Metode SARIMA
ini memiliki akurasi jangka pendek yang tinggi (Liu et al. 2023). Secara umum
notasi model SARIMA yaitu :
𝐴𝑅𝐼𝑀𝐴 (𝑝, 𝑑, 𝑞 )(𝑃, 𝐷, 𝑄)𝑆 (2)
dimana :
𝑝 : ordo AR nonmusiman
𝑑 : banyaknya proses pembedaan yang dilakukan pada
model non-musiman
𝑞 : ordo MA non-musiman
5
𝑃 : ordo AR musiman
𝐷 : banyaknya proses pembedaan yang dilakukan pada
model musiman
𝑄 : ordo MA musiman
𝑆 : jumlah periode musiman
Penambahan pengaruh musiman pada metode SARIMA ditandai dengan

adanya ordo AR model musiman yaitu 𝑃 , ordo pembedaan model musiman
yaitu 𝐷, dan ordo MA model musiman yaitu 𝑄 . Bentuk matematis dari model
SARIMA adalah sebagai berikut (Montgomery et al. 2015):
𝜙𝑝(𝐵 )Φ𝑃 (𝐵 ) 𝑆(1 − 𝐵 )𝑑 (1 − 𝐵 𝑆)𝐷 𝑌𝑡 = 𝛿 + 𝜃𝑞 (𝐵 )ΘQ (𝐵 𝑆)𝜀𝑡 (3)
dimana :
𝐵 : operator Backshift
𝜙𝑝 : koefisien AR nonmusiman pada ordo ke-𝑝
Φ𝑃 : koefisien AR musiman pada ordo ke-𝑃
𝜃𝑞 : koefisien MA nonmusiman pada ordo ke-𝑞
Θ𝑄 : koefisien MA musiman pada ordo ke-𝑄
(1 − 𝐵 )𝑑 : deret pembedaan nonmusiman ordo ke-𝑑
(1 − 𝐵 𝑆)𝐷 : deret pembedaan musiman ordo ke-𝑑
𝜀𝑡 : sisaan waktu ke-𝑡
Data deret waktu mempunyai pengaruh musiman, karena deret tersebut

memperlihatkan suatu pola tertentu secara konsisten. Data yang berpola musiman
biasanya berkaitan dengan jadwal panen suatu komoditas, peristiwa besar, cuaca,
ataupun wilayah lain.
Model SARIMA merupakan gabungan dari model seasonal AR, model
seasonal MA, dan proses integrated. Model seasonal AR dan seasonal MA
termasuk dalam model stasioner, sedangkan penambahan proses integrated
mengindikasikan bahwa model tidak stasioner. Model seasonal AR dinotasikan
dengan ARIMA(1,0,0)(1,0,0)[12], sedangkan model seasonal MA dinotasikan
dengan ARIMA(0,0,1)(0,0,1)[12]. Tahap awal pemodelan baik itu SARIMA
maupun seasonal AR dan seasonal MA, harus melewati uji asumsi kestasioneran
data pada rataan dan ragam.
2.3 Uji Asumsi
Uji Kestasioneran Data pada Rataan

Kestasioneran pada data deret waktu merupakan asumsi mutlak yang harus
dipenuhi sebelum melakukan peramalan. Data deret waktu dapat dikatakan sudah
stasioner apabila pola data berfluktuasi di sekitar nilai tengah dan ragamnya
cenderung konstan. Kestasioneran dapat dilihat dari pola data, plot Autocorrelation
Function (ACF), dan hasil pengujian formal. Pengujian formal untuk menguji
kestasioneran dalam rataan dapat menggunakan uji Augmented Dickey Fuller
(ADF). Persamaan yang digunakan dalam uji ADF sebagai berikut (Dickey dan
Fuller 1979):
6
𝑌𝑡 = 𝑎𝑌𝑡−1 + 𝜀𝑡 (4)
dimana :
𝑌𝑡 : amatan pada waktu ke-𝑡
𝑎 : konstanta
𝜀𝑡 : sisaan amatan pada waktu ke-𝑡.
Berdasarkan Persamaan (4), hipotesis yang digunakan dalam uji ADF adalah
sebagai berikut :
𝐻0 ∶ 𝑎 = 1 , data tidak stasioner
𝐻1 ∶ |𝑎| < 1, data stasioner
Statistik uji yang digunakan yaitu :
𝑎̂ − 1 (5)
𝑡ℎ𝑖𝑡 =
𝑠𝑒(𝑎̂)
dimana :
𝑎̂ : penduga kuadrat terkecil
𝑠𝑒(𝑎̂) : standar error dari (𝑎̂)
Kriteria pengambilan keputusan adalah tolak 𝐻0 apabila nilai kritis statistik- 𝑡

kurang dari nilai 𝑡ℎ𝑖𝑡 yang berarti data stasioner dan terima 𝐻0 apabila nilai kristis
statistik-𝑡 lebih besar dari nilai 𝑡ℎ𝑖𝑡 yang berarti data tidak stasioner. Data deret
waktu yang tidak stasioner dalam rataan dapat diatasi dengan melakukan
pembedaan.
Uji Kestasioneran Data pada Ragam

Pengujian formal untuk menguji kestasioneran ragam dapat dilakukan
dengan uji kehomogenan ragam Bartlett test. Bartlett test diperkenalkan oleh
Maurice Bartlett pada tahun 1937 yang merupakan pengujian untuk menilai
kestasioneran ragam dalam populasi yang berbeda. Pada Bartlett test, hipotesis
yang digunakan adalah sebagai berikut (Hossein Arsham, Lovric 2011) :
𝐻0 ∶ 𝜎12 = 𝜎22 = ⋯ = 𝜎𝑘2 , data stasioner dalam ragam

𝐻1 ∶ minimal terdapat 2 ragam populasi tidak sama, data tidak
stasioner dalam ragam
Statistik uji yang digunakan sebagai berikut :
𝑓 ln 𝑠 2 − ∑ℎ𝑖=1(𝑓𝑖 ln 𝑠𝑖2 ) (6)

𝑄ℎ𝑖𝑡 = 1 1 1
1+ [∑ℎ𝑖=1 ( ) − ]
3(𝑘−1) 𝑓𝑖 𝑓
𝑓𝑖 = (𝑛𝑖 − 1) (7)
dimana :
𝑛𝑖 : jumlah data pada kelompok ke-𝑖
ℎ : banyaknya kelompok yang dibentuk
𝑠𝑖2 : ragam untuk kelompok ke-𝑖
7
𝑠2 : ragam gabungan dari seluruh kelompok
Kriteria pengambilan keputusan adalah tolak 𝐻0 apabila nilai statistik 𝑄ℎ𝑖𝑡 lebih
2
kecil dari 𝑋𝛼(ℎ−1) atau apabila nilai p-value lebih kecil dari taraf nyata (𝛼 = 0,05)
artinya data tidak stasioner dalam ragam. Sebaliknya terima 𝐻0 apabila nilai
2
statistik 𝑄ℎ𝑖𝑡 lebih besar dari 𝑋𝛼(ℎ−1) atau apabila nilai p-value lebih besar dari taraf
nyata (𝛼 = 0,05) artinya data stasioner dalam ragam. Data yang tidak stasioner
dalam ragam dapat diatasi dengan transformasi Box-Cox (Box 1953).
Transformasi Box-Cox dilakukan dengan berdasarkan pada nilai estimasi (𝜆)
yang tercantum pada Box-Cox Plot. Berikut merupakan bentuk transformasi sesuai
dengan nilai estimasi.
Tabel 1 Transformasi Box-Cox

Nilai estimasi Transformasi
1
-1,0
𝑍𝑡
1
-0,5
√𝑍𝑡
0,0 Ln 𝑍𝑡
0,5 √𝑍𝑡
1 𝑍𝑡
2.4 Identifikasi Model

Identifikasi model diawali dari penentuan ordo yang dapat dilakukan dengan
melihat plot ACF dan Partial Autocorrelation Function (PACF). Plot ACF dan
PACF dapat memberikan informasi terkait dengan kandidat model yang sesuai.
Kandidat model yang dapat dipilih adalah model AR, MA, ARMA, dan ARIMA.
Hasil identifikasi pola ACF dan PACF dapat disesuaikan dengan Tabel 2.
Tabel 2 Identifikasi ordo menggunakan plot ACF dan PACF

Model Tentatif Pola ACF Pola PACF
AR(𝑝) Menurun secara Terpotong setelah lag p
eksponensial (dies down) (Cuts off)
MA(𝑞) Terpotong setelah lag q Menurun secara
(Cuts off) eksponensial (dies down)
ARMA(𝑝, 𝑞) Menurun secara Menurun secara
eksponensial (dies down) eksponensial (dies down)
setelah lag (q-p) setelah lag (p-q)
Berdasarkan Tabel 2, pola ACF adalah dies down atau menurun secara eksponensial
dan pola PACF cuts off setelah lag p maka kesimpulan model yang sesuai adalah
AR(𝑝) (Chuang dan Wei 1991).
Proses identifikasi model menghasilkan beberapa kandidat model. Beberapa
kandidat model tersebut selanjutnya dipilih berdasarkan dengan nilai Akaike’s
Information Criterion (AIC) terkecil dan signifikansi parameter.
8
2.5 Akaike’s Information Criterion (AIC)

Salah satu kriteria dalam memilih model yaitu melalui Akaike’s Information
Criterion (AIC). AIC dapat digunakan sebagai acuan dalam pemilihan model
terbaik dari model tentatif yang sudah ditentukan sebelumnya (Hurvich dan Tsai
1989). Model terbaik merupakan model yang memiliki nilai AIC terkecil. Nilai AIC
diperoleh berdasarkan persamaan berikut (Chuang dan Wei 1991) :
𝐴𝐼𝐶 = 2𝑛𝑝 − 2 ln(𝐿̂ ) (8)

dimana :
𝑛𝑝 : banyaknya parameter model
𝐿̂ : Log-likelihood estimator
2.6 Estimasi dan Uji Signifikansi Parameter

Tahap pengestimasian parameter disesuaikan dengan model yang
digunakan. Terdapat beberapa macam metode estimasi, seperti ordinary least
square (OLS) dan maksimum likelihood (ML) (Cryer dan Chan 1985). Metode
estimasi yang digunakan dalam penelitian ini adalah ML untuk model SARIMA.
Tahap selanjutnya adalah melakukan pengujian kelayakan kandidat model
SARIMA. Jika pengujian terhadap seluruh parameter adalah signifikan, maka
model tersebur dianggap layak untuk digunakan. Hipotesis yang digunakan dalam
uji signifikansi parameter adalah sebagai berikut :
𝐻0 ∶ 𝜙 = 0
𝐻1 ∶ 𝜙 ≠ 0
dengan statistik uji yang digunakan yaitu :
𝜙̂ (9)
𝑡ℎ𝑖𝑡 =
𝑠𝑒(𝜙̂ )
Kriteria pengambilan keputusan adalah tolak 𝐻0 apabila nilai kritis statistik- 𝑡

kurang dari nilai 𝑡ℎ𝑖𝑡 yang berarti parameter berpengaruh terhadap 𝑌 dan terima 𝐻0
apabila nilai kristis statistik-𝑡 lebih besar dari nilai 𝑡ℎ𝑖𝑡 yang berarti parameter tidak
berpengaruh terhadap 𝑌.
Tahap pengujian parameter digunakan untuk memilih model terbaik yang
dapat digunakan untuk memprediksi. Namun, setelah diperoleh model terbaik,
terdapat tahapan pengujian sisaan yang harus dipenuhi yaitu tidak terdapat
autokorelasi pada sisaan dan sisaan menyebar normal.
2.7 Diagnostik Sisaan

Diagnostik sisaan pada model penting untuk dilakukan karena berkaitan
dengan asumsi sisaan model. Apabila terdapat pelanggaran terhadap beberapa
asumsi model, model baru harus ditentukan atau dilakukan modifikasi yang sesuai.
Diagnostik model dapat dilakukan dengan melakukan uji autokorelasi dengan
menggunakan uji Ljung-Box dan uji kenormalan pada sisaan dengan menggunakan
uji Saphiro-Wilk (Cryer dan Chan 1985).
9
Uji Autokorelasi Sisaan

Pengujian autokorelasi sisaan dapat dilakukan dengan menggunakan uji
Ljung-Box. Uji Ljung-Box merupakan pengujian secara group (sekaligus) sampai
lag-K dengan hipotesis sebagai berikut (Cryer dan Chan 1985):
𝐻0 ∶ tidak terdapat autokorelasi pada sisaan
𝐻1 ∶ terdapat autokorelasi pada sisaan
dengan statistik uji yang digunakan yaitu :

𝐾 (10)
𝑄 = 𝑛(𝑛 + 2) ∑(𝑛 − 𝑘)−1 𝑝̂ 𝑘2
𝑘=1
dimana :
𝑛 : banyaknya residual
𝑘 : lag ke-𝑘
𝐾 : lag maksimum yang diamati
𝑝̂ 𝑘 : nilai dugaan autokorelasi sisaan pada lag ke-𝑘
Kriteria pengambilan keputusan adalah terima 𝐻0 apabila < 𝒳𝛼2 (𝑑𝐵=𝐾−𝑝−𝑞)
dengan 𝑝 adalah ordo dari AR dan 𝑞 adalah ordo dari MA yang berarti antar sisaan
tidak terdapat autokorelasi.
Uji Kenormalan
Pengujian kenormalan dari sisaan dapat dilihat berdasarkan plot kuantil-
kuantil. Sisaan dikatakan menyebar normal apabila mengikuti garis referensi
sebaran normal. Selain itu, uji kenormalan juga dapat diperiksa melalui uji Saphiro-
Wilk (Shapiro dan Wilk 1965) dengan hipotesis sebagai berikut :
𝐻0 : sisaan menyebar normal
𝐻1 : sisaan tidak menyebar normal
dengan statistik uji yang digunakan :
(∑𝑛𝑖=1 𝑎𝑖 𝑦𝑖 )2 (11)
𝑊= 𝑛
∑𝑖=1(𝑦𝑖 − 𝑦̅)2
Kriteria pengambilan keputusan adalah terima 𝐻0 apabila nilai 𝑊 lebih besar dari
nilai tabel Saphiro Wilk atau apabila nilai p-value lebih besar dari taraf nyata
(𝛼=0.05) yang berarti bahwa sisaan menyebar mengikuti sebaran normal.
Model yang telah memenuhi asumsi sisaan kemudian dapat diproses
kembali dengan melakukan overfitting untuk memastikan bahwa model yang
terpilih merupakan model terbaik.
2.8 Overfitting Model

Overfitting merupakan cara diagnostik model kedua setelah diagnostik
sisaan. Prosedur ini dilakukan untuk mencari kemungkinan model yang lebih baik
dari model hasil identifikasi. Overfitting model SARIMA dilakukan dengan
10
menambah ordo 𝑝, 𝑞, 𝑃, dan 𝑄 dari model awal secara bergantian. Sebagai contoh,
apabila terpilih model yang cocok adalah AR(2), dapat dilakukan overfitting dengan
model AR(3). Selanjutnya, model AR(2) dapat dikonfirmasi menjadi model terbaik
apabila estimasi parameter pada model AR(3) tidak signifikan (Cryer dan Chan
1985). Model terbaik yang telah terpilih selanjutnya digunakan sebagai alat untuk
memprediksi nilai pada beberapa periode kedepan.
2.9 Peramalan
Peramalan dilakukan untuk mengetahui nilai atau kejadian yang akan terjadi
di beberapa periode mendatang. Kemampuan dalam meramal sangat bergantung
pada performa model yang dibentuk. Dengan kata lain, tingkat keakuratan hasil
ramalan sangat dipengaruhi oleh performa model. Oleh karena itu proses validasi
diperlukan untuk penerimaan model (Mayer dan Butler 1993).
Proses validasi tersebut dapat dilakukan dengan mengukur performa model
dengan dengan menghitung tingkat kesalahan dari hasil ramalan model tersebut.
Salah satu alat yang dapat digunakan untuk mengetahui tingkat kesalahan dari hasil
ramalan adalah berdasarkan nilai Root Mean Square Error (RMSE) dan Mean
Absolute Percentage Error (MAPE). RMSE merupakan salah satu metode evaluasi
yang dapat digunakan untuk mengevaluasi suatu metode peramalan. RMSE dapat
digunakan apabila data peramalan berada pada skala yang sama (Hyndman dan
Koehler 2006). Nilai RMSE baik apabila mendekati nilai nol, sehingga model yang
memiliki nilai RMSE terkecil merupakan model yang terbaik. Berikut rumus untuk
menentukan nilai RMSE :
𝑛𝑖
∑𝑡=1 (𝑦𝑖𝑡 − 𝑦̂𝑖𝑡 )2
𝑅𝑀𝑆𝐸 = √ (12)
𝑛𝑖
Dimana 𝑛𝑖 adalah jumlah data pada kelompok ke-𝑖 atau, 𝑦𝑖𝑡 adalah nilai aktual
pada periode ke-𝑡 dan kelompok ke-𝑖 serta 𝑦̂𝑖𝑡 adalah nilai peramalan pada periode
ke-𝑡 dan kelompok ke-𝑖.
Selain nilai RMSE, nilai MAPE juga dapat digunakan sebagai acuan untuk
memilih model terbaik dari beberapa model yang terbentuk. Nilai MAPE diperoleh
berdasarkan persamaan berikut (Shaeffer 1980) :
𝑛𝑖
1 𝑦𝑖𝑡 − 𝑦̂𝑖𝑡
𝑀𝐴𝑃𝐸 = ∑| | × 100% (13)
𝑛𝑖 𝑦𝑖𝑡
𝑡=1
Nilai MAPE diperoleh dengan menentukan kesalahan mutlak pada setiap periode
dengan membagi dengan nilai aktual pada setiap periode dan mengalikannya
dengan 100% agar berada pada bentuk persen. Nilai MAPE dapat memberikan
gambaran terkait besarnya kesalahan peramalan pada suatu model dalam persen.
Batas atas nilai MAPE pada suatu model supaya dapat hasil peramalan dapat
diterima yaitu sebesar 10% (Kleijnen 1987).
Hasil peramalan yang baik tentunya sangat diharapkan oleh semua peneliti.
Namun, tidak menutup kemungkinan hasil peramalan tidak sesuai dengan harapan.
11
Hal ini dapat disebabkan oleh beberapa faktor. Faktor pencilan pada data deret
waktu dapat mengurangi keakuratan hasil peramalan dan bias dalam pendugaan
parameter model (Chen dan Liu 1993). Bias dalam pendugaan parameter dapat
terjadi juga apabila menggunakan ukuran contoh yang kecil (Kim 2003), sehingga
faktor ukuran contoh dapat menjadi pengaruh pada hasil peramalan.
2.10 Pencilan pada Data Deret Waktu

Pencilan merupakan pengamatan tidak biasa dari sebagian besar
pengamatan dalam suatu kumpulan data (Chang et al. 2016). Data deret waktu
sering terkontaminasi oleh pencilan. Adanya pencilan dapat berdampak pada
pendugaan parameter model (Chen dan Liu 1993). Terdapat empat tipe pencilan
menurut Wei (2006) yaitu additive outlier (AO), innovational outlier (IO),
temporary change (TC), level shift (LS). Masing-masing tipe pencilan memiliki
karakteristik yang berbeda. Tipe pencilan yang difokuskan pada penelitian ini
adalah tipe AO. Pencilan tipe AO merupakan suatu tipe pencilan yang memberikan
pengaruh pada satu periode saja dalam data deret waktu. Misalkan 𝑋𝑡 diasumsikan
mengikuti proses ARIMA(1,1,1)(1,1,1)[12] maka bentuk umum sebuah AO
diuraikan sebagai berikut
𝑋𝑡 ,𝑡 ≠ 𝑇
𝑍𝑡 = {
𝑋𝑡 + 𝜔, 𝑡 = 𝑇
(𝑇)
𝑍𝑡 = 𝑋𝑡 𝜔𝐴𝑂 𝐼𝑡
𝜃𝑞 (𝐵 )ΘQ(𝐵 𝑆) (𝑇)
𝑍𝑡 = 𝜀 + 𝜔𝐴𝑂 𝐼𝑡
𝜙𝑝(𝐵 )Φ𝑃 (𝐵 )𝑆(1 − 𝐵 )𝑑 (1 − 𝐵 𝑆)𝐷 𝑡 (14)
dengan 𝑋𝑡 merupakan data pengamatan pada waktu ke-𝑡, 𝜔𝐴𝑂 merupakan besaran
(𝑇) 0, 𝑡 ≠ 𝑇
pencilan AO, dan 𝐼𝑡 = { merupakan peubah indikator yang mewakili ada
1, 𝑡 = 𝑇
atau tidaknya pencilan pada waktu T
12
III METODOLOGI PENELITIAN
3.1 Data
Penelitian ini menggunakan data bangkitan untuk proses simulasi model
seasonal AR dan data sekunder sebagai penerapan metode tersebut pada data aktual.
Data Simulasi
Data simulasi diperoleh dengan proses pembangkitan data yang di desain
sedemikian rupa berdasarkan skenario yang telah ditetapkan. Proses simulasi
dilakukan untuk dua tujuan yaitu mengetahui pengaruh dari tiga faktor terhadap
pendugaan parameter dan mengetahui pengaruh dari tiga faktor terhadap tingkat
konsistensi akurasi model. Pengaruh tiga faktor dapat diketahui dengan melihat
tabel analisis ragam (Montgomery 2013), sedangkan tingkat konsistensi akurasi
model dapat diketahui dengan melihat nilai Root Mean Square Error (RMSE).
Pada penelitian ini proses simulasi dilakukan berdasarkan model
ARIMA(1,0,0)(1,0,0)[12] dengan menggunakan panjang data deret waktu ( 𝑛 )
sebanyak 84, 204, dan 504 data. Menurut Hyndman dan Kostenko (2007), ukuran
contoh yang dibutuhkan bergantung pada jenis model statistik yang digunakan dan
variasi pada data. Semakin banyak data yang digunakan, semakin dapat
mengidentifikasi struktur dan polanya. Pada metode ARIMA, Box dan Jenkins
merekomendasikan minimal 50 pengamatan yang digunakan (Hassouna dan Al-
Sahili 2020). Oleh karena itu untuk dipilih 84 pengamatan untuk menggambarkan
ukuran contoh kecil, 204 pengamatan untuk menggambarkan ukuran contoh sedang
dan 504 pengamatan untuk menggambarkan ukuran contoh besar. Masing-masing
ukuran dibangkitkan pada empat variasi parameter dan diberi pengaruh pencilan
pada data pengamatan yang ditentukan.
Data Aktual
Data aktual yang digunakan dalam penelitian ini berupa data bulanan yang
mencakup peubah harga di provinsi Banten, Jawa Barat, Jawa Tengah, DI
Yogyakarta, Jawa Timur. Sumber data dalam penelitian ini diperoleh dari Sistem
Pemantauan Pasar Kebutuhan Pokok (SP2KP) Kementerian Perdagangan pada
periode Januari 2015 sampai Desember 2021 sehingga ukuran data yang digunakan
sebesar 84 data. Data dibagi menjadi dua bagian yaitu data training dan data testing.
Data training digunakan untuk membuat model tentatif yang terdiri atas periode
Januari 2015 sampai Desember 2020, sedangkan data testing digunakan untuk
validasi model terbaik yang terdiri atas periode Januari 2021 sampai Desember
2021. Data harga cabai merah besar pada lima Provinsi memiliki nilai pencilan
sebesar 3,5% untuk Provinsi Banten, Jawa Barat, Jawa Tengah dan Jawa Timur,
sedangkan nilai pencilan pada Provinsi DI Yogyakarta sebesar 1%.
3.2 Prosedur Analisis Data

Tahapan analisis data pada penelitian ini menggunakan bantuan aplikasi RStudio
dengan beberapa package yang digunakan diantaranya adalah sim.ssarima, Arima,
dan beberapa package lainnya. Proses tahapan yang dilakukan dalam penelitian ini
13
ada dua yaitu simulasi dan analisis data aktual. Berikut adalah rincian dari masing-
masing tahapan.
Prosedur Analisis Data Simulasi

1. Menentukan delapan nilai awal sebagai parameter dari empat model yang
dibangkitkan yaitu 𝜙1 , 𝜙2 , 𝜙3 , 𝜙4 , Φ1 , Φ2 , Φ3 , Φ4 . Pembangkitan yang
dilakukan berdasarkan pada model ARIMA(1,0,0)(1,0,0)[12]. Nilai
parameter dibangkitkan secara acak dengan ketentuan nilai berkisar antara
-1 hingga 1 (Chuang dan Wei 1991). Hasil pembangkitan kedelapan nilai
tersebut disajikan pada Tabel 3.
Tabel 3 Variasi parameter
Variasi autoregressive seasonal autoregressive

Parameter (𝜙) (Φ)
pp 0,63 0,29
np -0,21 0,23
pn 0,47 -0,12
nn -0,72 -0,16
Perbedaan dari keempat variasi parameter terletak pada nilai positif dan
negatif dari masing-masing parameter. Pembangkitan dengan empat variasi
parameter tersebut ditujukan untuk mendapatkan empat variasi data yang
berbeda.
2. Melakukan pembangkitan data berdasarkan nilai awal yang telah ditentukan
dan dibangkitkan pada tiga variasi ukuran contoh, 84, 204, dan 504.
3. Pembangkitan pada tiga variasi ukuran contoh dilakukan ulangan sebanyak
100 kali pada masing-masing ukuran contoh. Ulangan tersebut dilakukan
untuk mendapatkan data deret waktu dalam jumlah yang banyak, supaya
dapat digunakan sebagai pembanding dan memperkuat kesimpulan yang
diperoleh.
4. Pembangkitan yang dilakukan, diasumsikan sebagai data deret waktu
dengan persentase pencilan sebesar 0%. Oleh karena itu, setelah diperoleh
dua belas data deret waktu, selanjutnya dilakukan modifikasi untuk
memeroleh data deret waktu yang memuat nilai pencilan. Modikasi pada
dua belas data deret waktu dengan menyisipkan 2,5%, 5%, dan 7,5%
pencilan baik untuk N=84, N=204, maupun N=504, menghasilkan 48
kombinasi data deret waktu. Masing-masing data pada 48 kombinasi
tersebut memiliki 100 deret sebagai hasil dari pembangkitan sebanyak 100
kali. Berikut merupakan contoh dari hasil modifikasi untuk N=84.
14
(a) Persentase Pencilan 0% (b) Persentase Pencilan 2,5%
(c) Persentase Pencilan 5% (d) Persentase Pencilan 7,5%
Gambar 1 Plot data hasil modifikasi nilai pencilan
Gambar 1 menunjukkan data deret waktu dengan persentase pencilan yang

berbeda-beda. Pada Gambar 1(a) data deret waktu tidak memuat pencilan
atau persentase pencilan sebesar 0%. Data deret waktu tersebut digunakan
kembali untuk selanjutnya dimodifikasi dengan pencilan 2,5%, 5%, dan
7,5% sehingga jumlah nilai pencilan pada masing-masing data
menyesuaikan persentase pencilan yang telah ditentukan. Jumlah nilai
pencilan untuk N = 84 pada persentase pencilan 0%, 2,5%, 5%, dan 7,5%
adalah 0, 2, 4, dan 6, untuk N = 204 adalah 0, 5, 10, dan 15, sedangkan
untuk N = 504 adalah 0, 13, 25, dan 38.
Modifikasi pencilan tersebut dilakukan dengan cara mengganti nilai
pada suatu titik dengan nilai pencilan. Perhitungan nilai pencilan tersebut
diambil berdasarkan rumus 𝑤 = 1,5𝑘 dengan 𝑘 = max – min (Sadik et al.
2008). Nilai yang diperoleh tersebut selnjutnya disisipkan pada titik-titik
yang telah ditentukan. Penentuan titik pencilan tersebut menggunakan
1
perhitungan rumus 𝑇1 = × 𝑁 dengan 𝑣 adalah banyaknya pencilan
𝑣+1
yang telah ditentukan. Hasil perhitungan tersebut selanjutnya dianggap
sebagai titik pertama pencilan. Titik selanjutnya yaitu 𝑇2 = 𝑇1 + 𝑇1 , 𝑇3 =
𝑇1 + 𝑇2 begitupun seterusnya hingga diperoleh semua titik yang dianggap
sebagai pencilan (Chang et al. 2016). Setelah proses pembangkitan dan
modifikasi data dilakukan, kemudian dilakukan perancangan percobaan
dengan kombinasi dari tiga faktor tersebut.
5. Menerapkan model seasonal AR pada data yang telah dimodifikasi dengan 48
kombinasi perlakuan.
6. Pada penelitian ini terdapat 20 kali ulangan dalam percobaan untuk masing-
masing 48 kombinasi perlakuan sehingga terdapat 960 unit percobaan pada
penelitian ini. Berikut merupakan 48 kombinasi perlakuan pada percobaan yang
dilakukan.
15
Tabel 4 Kombinasi faktor
Kombinasi P N VP Kombinasi P N VP
1 0 84 pp 25 5 84 pp
2 np 26 np
3 pn 27 pn
4 nn 28 nn
5 0 204 pp 29 5 204 pp
6 np 30 np
7 pn 31 pn
8 nn 32 nn
9 0 504 pp 33 5 504 pp
10 np 34 np
11 pn 35 pn
12 nn 36 nn
13 2,5 84 pp 37 7,5 84 pp
14 np 38 np
15 pn 39 pn
16 nn 40 nn
17 2,5 204 pp 41 7,5 204 pp
18 np 42 np
19 pn 43 pn
20 nn 44 nn
21 2,5 504 pp 45 7,5 504 pp
22 np 46 np
23 pn 47 pn
24 nn 48 nn
7.
Berdasarkan Tabel 4 terdapat 48 kombinasi, yang diperoleh dari kombinasi tiga
faktor. Respon dari percobaan ini adalah selisih (bias) antara rata-rata penduga
parameter autoregressive (𝜙̂ ) dan seasonal autoregressive (Φ ̂ ) dari 100 kali
simulasi dengan 𝜙 dan Φ.
8. Menghitung rataan dari 100 penduga parameter autoregressive (𝜙̂𝑚𝑒𝑎𝑛) dan
̂ 𝑚𝑒𝑎𝑛 ).
seasonal autoregressive (Φ
9. Menghitung selisih antara parameter autoregressive (𝜙) dengan nilai rataan
( 𝜙̂𝑚𝑒𝑎𝑛 ) dan parameter seasonal autoregressive ( Φ) dengan nilai rataan
(Φ̂ 𝑚𝑒𝑎𝑛 ).
10. Membuat kesimpulan berdasarkan hasil analisis ragam dan nilai akurasi model.
Prosedur Analisis Data Aktual

1. Melakukan eksplorasi data harga cabai merah besar untuk melihat indikasi
adanya pengaruh musiman dan pencilan.
2. Membagi data menjadi dua bagian, yaitu data training dan data testing.
3. Melakukan pengujian kestasioneran dalam rataan dan ragam.
4. Melakukan identifikasi model.
5. Melakukan pendugaan parameter model.
16
6. Melakukan seleksi untuk mendapatkan model terbaik dengan pengujian

parameter.
7. Melakukan pengujian model pada data testing dengan model terbaik.
8. Membandingkan nilai RMSE dan Mean Absolute Percentage Error
(MAPE).
9. Melakukan peramalan beberapa periode ke depan.
3.3 Diagram Alir

Proses pembangkitan data simulasi dan analisis data deret waktu pada penelitian
ini ditunjukkan dalam diagram alir berikut
Gambar 2 Flowchart Prosedur Analisis Data

17
IV HASIL DAN PEMBAHASAN
Bagian ini terdiri atas hasil simulasi peramalan data deret waktu musiman
dengan beberapa macam karakteristik data yang telah ditentukan skenarionya
dengan menggunakan metode seasonal AR. Selanjutnya akurasi peramalan kedua
metode tersebut dibandingkan berdasarkan nilai RMSE dan MAPE sehingga
diperoleh metode terbaik dalam meramalkan data deret waktu musiman yang
memuat data pencilan. Metode tersebut juga diaplikasikan pada peramalan data
harga cabai merah besar di lima Provinsi di Pulau Jawa.
4.1 Hasil Simulasi

Hasil dari penerapan model seasonal AR pada seluruh data deret waktu
menghasilkan penduga parameter baik untuk penduga parameter autoregressive
(𝜙̂𝑚𝑒𝑎𝑛 ) maupun seasonal autoregressive (Φ̂ 𝑚𝑒𝑎𝑛 ). Berdasarkan nilai penduga
tersebut dapat diperoleh nilai selisih atau bias pendugaan parameter yang
selanjutnya disebut dengan respon.
Gambar 3 menunjukkan sebaran respon hasil simulasi percobaan dengan 48
kombinasi. Pada Gambar 3 menunjukkan bahwa bias pendugaan semakin besar
ketika persentase pencilan semakin besar. Selain daripada itu, pada Gambar 3
terlihat bahwa semakin besar ukuran contoh maka semakin kecil bias pendugaan.
Sebagai contoh, pada Gambar 3(a), kombinasi 1 (N=84) memiliki rata-rata bias
lebih besar dibandingkan kombinasi 5 (N=204) dan kombinasi 9 (N=504). Selain
itu, kombinasi 2 (N=84) juga memiliki nilai tengah lebih besar dibandingkan
dengan kombinasi 6 (N=204) dan kombinasi 10 (N=504).
(a) Persentase Pencilan 0% (b) Persentase Pencilan 2,5%
(c) Persentase Pencilan 5% (d) Persentase Pencilan 7,5%
Gambar 3 Boxplot sebaran data bias penduga parameter autoregressive

Pengaruh terhadap bias pendugaan tersebut tidak hanya terjadi pada
pendugaan parameter autoregressive ( 𝜙̂𝑚𝑒𝑎𝑛) melainkan pada seasonal
18
autoregressive (Φ̂ 𝑚𝑒𝑎𝑛 ). Sebagai contoh, pada Gambar 4 (a), kombinasi 1 (N=84)
memiliki rata-rata bias lebih besar dibandingkan kombinasi 5 (N=204) dan
kombinasi 9 (N=504). Selain itu, kombinasi 2 (N=84) juga memiliki nilai tengah
lebih besar dibandingkan dengan kombinasi 6 (N=204) dan kombinasi 10 (N=504).
(b) Persentase Pencilan 0% (b) Persentase Pencilan 2,5%
(d) Persentase Pencilan 5% (d) Persentase Pencilan 7,5%
Gambar 4 Boxplot sebaran data bias penduga parameter seasonal

autoregressive
Tabel 5 adalah hasil pengujian hipotesis terhadap pengaruh tiga faktor (P,
N, dan VP) terhadap bias pendugaan parameter autoregressive (𝜙̂ ) menggunakan
analisis ragam. Hasil pengujian dapat disimpulkan bahwa, pengaruh dari ketiga
faktor tersebut tidak saling bebas. Artinya 𝜙̂ dipengaruhi oleh faktor persentase
pencilan, ukuran contoh dan variasi parameter.
Tabel 5 Analisis ragam untuk pendugaan parameter autoregressive (𝜙̂ )
Sumber Derajat Jumlah Kuadrat

Fhit Nilai P
Keragaman Bebas Kuadrat Tengah
P 3 4,683 1,560 5233,61 <0,001
N 2 0,297 0,149 498,75 <0,001
VP 3 6,757 2,252 7551,94 <0,001
PN 6 0,358 0,059 200,23 <0,001
PVP 9 2,952 0,328 1099,84 <0,001
NVP 6 0,969 0,162 541,84 <0,001
PNVP 18 0,629 0,035 117,32 <0,001
Galat 912 0,272 0,0002
Total 959 47,05
Kesimpulan yang sama juga diberikan oleh analisis ragam untuk pendugaan
parameter seasonal autoregressive ( Φ ̂ ). Artinya Φ̂ dipengaruhi oleh faktor
persentase pencilan, ukuran contoh dan variasi parameter. Oleh karena itu, ketika
19
menerapkan model seasonal AR pada data aktual, perlu diperhatikan persentase

pencilan pada data dan besarnya ukuran contoh.
Tabel 6 Analisis ragam untuk pendugaan parameter seasonal autoregressive

̂)
(Φ
Sumber Derajat Jumlah Kuadrat
Fhit Nilai P
Keragaman Bebas Kuadrat Tengah
P 3 4,683 1,560 5233,61 <0,001
N 2 0,297 0,149 498,75 <0,001
VP 3 6,757 2,252 7551,94 <0,001
PN 6 0,358 0,059 200,23 <0,001
PVP 9 2,952 0,328 1099,84 <0,001
NVP 6 0,969 0,162 541,84 <0,001
PNVP 18 0,629 0,035 117,32 <0,001
Galat 912 0,272 0,0002
Total 959 47,05
Gambar 5 memperjelas makna dari pengaruh interaksi hasil uji analisis

ragam untuk pendugaan parameter autoregressive (𝜙̂ ). Pengaruh dari persentase
pencilan, tidak sama untuk setiap ukuran contoh atau memiliki pengaruh yang
berbeda-beda tergantung dengan besaran ukuran contoh. Begitu pula dengan
faktor ukuran contoh. Pengaruh dari ukuran contoh, tidak sama untuk setiap
persentase pencilan.
(a) VPpp (b) VPnp
(c) VPpn (d) VPnn
Gambar 5 Plot interaksi faktor

pendugaan parameter autoregressive (𝜙̂ )
Kesimpulan yang sama juga terlihat pada pengaruh interaksi hasil uji
analisis ragam untuk pendugaan parameter seasonal autoregressive (Φ̂ ) yang
ditampilkan pada Gambar 6. Pengaruh dari persentase pencilan, tidak sama
untuk setiap ukuran contoh atau memiliki pengaruh yang berbeda-beda
20
tergantung dengan besaran ukuran contoh. Begitu pula dengan faktor ukuran
contoh. Pengaruh dari ukuran contoh, tidak sama untuk setiap persentase
pencilan.
(a) VPpp (b) VPnp
(c) VPpn (d) VPnn
Gambar 6 Plot interaksi faktor pendugaan

parameter seasonal autoregressive (Φ̂)
Setelah memperhatikan pengaruh dari ketiga faktor, selanjutnya perlu diperhatikan

juga kekonsistenan akurasi model untuk setiap perlakuan. Tingkat konsistensi
akurasi model untuk setiap perlakuan dapat diketahui dengan melihat sebaran nilai
RMSE dari 100 model yang ditampilkan pada Gambar 7.
(a) VPpp (b) VPnp (c) VPpn (d) VPnn
(e) VPpp (f) VPnp (g) VPpn (h) VPnn
(i) VPpp (j) VPnp (k) VPpn (l) VPnn
Gambar 7 Boxplot RMSE (a) sampai (d) Boxplot untuk N = 84,

(e) sampai (h) Boxplot untuk N = 204, dan (i) sampai (l) Boxplot untuk N = 504
21
Berdasarkan Gambar 7, persentase pencilan 0%, 2,5%, dan 5% masih

cenderung memiliki nilai RMSE yang kecil, baik pada ukuran contoh 84, 204, dan
504. Hal tersebut terjadi pada semua variasi parameter baik itu pp, np, pn, maupun
nn. Berdasarkan hal tersebut, dapat disimpulkan bahwa model seasonal AR dapat
digunakan dengan baik pada berbagai macam variasi data dengan ukuran contoh
sebesar 84, 204, dan 504, serta memiliki persentase pencilan maksimal sebesar 5%
dengan ambang batas 1,5𝑘.
4.2 Penerapan Model Seasonal AR

Pergerakan harga cabai merah besar pada lima Provinsi di Pulau Jawa dari
tahun ke tahun berfluktuatif. Perkembangan harga cabai merah besar tahunan dari
2015 hingga 2021 pada lima Provinsi di tunjukkan pada Gambar 8.
Gambar 8 Grafik harga cabai merah besar pada lima provinsi
Berdasarkan Gambar 8, harga pada lima Provinsi cenderung berpola sama pada
tujuh tahun terakhir. Pada awal tahun, harga cenderung melambung tinggi,
sedangkan pada akhir tahun harga cenderung turun. Harga cabai pada Provinsi
Jawa Barat cenderung lebih tinggi daripada Provinsi lainnya, sedangkan Provinsi
DI Yogyakarta cenderung berada pada posisi terendah. Harga cabai tertinggi terjadi
pada bulan Februari 2020 yaitu sebesar Rp 75.200/kg di Provinsi Jawa Barat,
sedangkan harga cabai terendah terjadi pada November 2015 yaitu sebesar
Rp10.100/kg di Provinsi DI Yogyakarta. Kenaikan harga cabai pada Ferbruari 2020
disebabkan karena hasil panen yang rusak di beberapa daerah sentra produksi
karena meningkatnya penyakit pada tanaman cabai dan faktor hujan yang
menyebabkan buruh petik tidak optimal dalam melakukan pemetikan cabai.
Gambar 8 menunjukkan bahwa, karakteristik harga cabai merah besar
cenderung naik menjelang akhir tahun dan awal tahun. Hal ini diduga ada kaitannya
dengan cuaca. Hal ini dikarenakan, musim pada bulan-bulan menjelang akhir tahun
dan awal tahun adalah musim hujan, dimana pada musim hujan, tanaman cabai
sangat rentan terserang penyakit.
Berdasarkan simulasi yang telah dilakukan, perlu diperhatikan persentase
pencilan dan besaran ukuran contoh pada masing-masing data. Persentase pencilan
pada data harga cabai merah besar dapat terlihat dengan memperhatikan Gambar 9.
22
Gambar 9 Boxplot data harga cabai merah besar pada lima provinsi
Gambar 9 menunjukkan bahwa, pada masing-masing provinsi terdapat

pencilan yang masing-masing memiliki persentase yaitu sebesar 3,5% untuk
Provinsi Banten, Jawa Barat, Jawa Tengah dan Jawa Timur dan 1% untuk Provinsi
DI Yogyakarta. Artinya persentase pencilan pada masing-masing provinsi masih
tergolong kecil, sedangkan ukuran contoh yang dapat digunakan adalah sebesar 84
data sehingga berdasarkan kesimpulan pada simulasi, model seasonal AR dapat
digunakan pada data ini.
4.3 Pemodelan Seasonal AR

Pemodelan dilakukan dengan menggunakan model seasonal AR pada data
harga cabai merah besar. Data yang digunakan mempunyai beberapa pencilan pada
setiap lokasi. Berdasarkan hasil dari simulasi, model seasonal AR masih memiliki
performa yang baik ketika terdapat pencilan aditif sebesar 5% dengan ambang batas
minimal yaitu 1,5𝑘 dimana 𝑘 = 𝑚𝑎𝑥 − 𝑚𝑖𝑛. Kesimpulan yang diperoleh dari data
aktual, dapat membuktikan konsistensi performa metode tersebut.
Identifikasi Kestasioneran Data

Kestasioneran data ditunjukkan dengan rataan dan ragam yang konstan dari
waktu ke waktu. Gambar 10 menunjukkan bahwa data harga cabai pada lima
Provinsi berfluktuasi di sekitar nilai tengah dengan ragam yang tidak konstan.
Selain menggunakan plot time series dari data aktual, ketidakstasioneran data juga
dapat dilihat dari uji formal yaitu menggunakan uji ADF dan Uji Bartlett. Pengujian
formal ini dapat memberikan hasil yang lebih pasti karena kesimpulan dilihat
berdasarkan nilai p-value.
(a) (b)
23
(d)
(c)
(e)
Gambar 10 Plot harga cabai lima provinsi dari 2015-2021 (a) Banten, (b) Jawa
Barat, (c) Jawa Tengah, (d) DIY, (e) Jawa Timur
Supaya mendapatkan hasil yang akurat, diperlukan pengujian secara formal yang
dapat dilakukan dengan menggunakan uji kestasioneran dalam ragam dengan uji
Bartlett dan kestasioneran dalam rataan dengan menggunakan stastistik uji
Augmented Dickey-Fuller (ADF). Keputusan pengujian dari uji Bartlett adalah
tolak H0 apabila p-value kurang dari (𝛼=0.05), sedangkan untuk keputusan uji ADF
adalah tolak H0 apabila p-value lebih dari (𝛼=0.05). Berikut ditampilkan hasil uji
ADF pada Tabel 7.
Tabel 7 Hasil uji ADF
Lokasi Non musiman Musiman

p-value Keputusan p-value Keputusan
Banten 0,01 Stasioner 0,08 Tidak stasioner
Jawa Barat 0,02 Stasioner 0,44 Tidak stasioner
Jawa Tengah 0,02 Stasioner 0,03 Stasioner
DIY 0,03 Stasioner 0,01 Stasioner
Jawa Timur 0,03 Stasioner 0,17 Tidak stasioner
*stasioner apabila p-value < 0,05
Berdasarkan Tabel 7, seluruh p-value lebih kecil dari taraf nyata 0,05 sehingga data
harga cabai pada setiap lokasi sudah stasioner dalam rataan. Sedangkan untuk
pengujian kestasioneran dalam ragam dilakukan dengan uji Bartlett. Hasil dari
pengujian kestarioneran tersebut disajikan pada Tabel 8.
24
Tabel 8 Hasil uji Bartlett
Lokasi p-value Keputusan

Banten 0,0311 Tidak Stasioner
Jawa Barat 0,0084 Tidak Stasioner
Jawa Tengah 0,0212 Tidak Stasioner
DIY 0,0362 Tidak Stasioner
Jawa Timur 0,0291 Tidak Stasioner
*stasioner apabila p-value > 0,05
Berdasarkan Tabel 8 seluruh nilai p-value lebih kecil dari taraf nyata 0,05 sehingga
tidak stasioner dalam ragam. Masalah tersebut dapat diatasi dengan melakukan
transformasi pada data. Transformasi yang dilakukan menggunakan transformasi
Box-Cox dimana harus melalui tahapan penentuan nilai estimasi ( 𝜆 ) sebelum
melakukan transformasi. Penentuan nilai estimasi tersebut berdasarkan Box-Cox
Plot. Berikut merupakan salah satu Box-Cox Plot yang dihasilkan oleh Provinsi
Banten.
Gambar 11 Box-Cox Plot Provinsi Banten
Gambar 11 menunjukkan bahwa Provinsi Banten memiliki nilai 𝜆 sebesar 0.

Berdasarkan nilai tersebut dapat disimpulkan bahwa data dapat dilakukan
transformasi dalam bentuk ln. Hal yang sama juga dilakukan pada provinsi lain
yang mana Box-Cox Plot tertera pada Lampiran 1. Berikut hasil pengujian
kestasioneran dalam ragam setelah dilakukan transformasi.
Tabel 9 Hasil uji Bartlett setelah transformasi
Lokasi p-value Keputusan

Banten 0,209 Stasioner
Jawa Barat 0,126 Stasioner
Jawa Tengah 0,103 Stasioner
DIY 0,172 Stasioner
Jawa Timur 0,428 Stasioner
Berdasarkan Tabel 9, hasil uji Bartlett pada data transformasi menunjukkan bahwa
seluruh lokasi telah stasioner dalam ragam. Hal ini ditunjukkan dengan nilai p-value
25
> 0,05. Berdasarkan hasil transformasi tersebut mengakibatkan data telah stasioner
baik dalam rataan maupun ragam. Hal tersebut dapat dibuktikkan berdasarkan plot
ACF musiman dan non musiman pada Gambar 12. Terlihat bahwa tidak ada pola
eksponensial pada plot ACF baik musiman maupun non musiman. Artinya
komponen integrated tidak diperlukan dalam model sehingga proses dapat
dilanjutkan ke tahap selanjutnya yaitu identifikasi model dengan plot ACF dan
PACF.
Identifikasi model
Identifikasi model dilakukan untuk memeroleh kandidat model berdasarkan
plot ACF dan PACF.
(a)
(b)
(c)
(d)
(e)
Gambar 12 Plot ACF non musiman (kiri), musiman (kanan) (a) Banten, (b) Jawa
26
Plot ACF merupakan indikator dari komponen MA sehingga lag yang cuts off pada
plot ACF menunjukkan besaran ordo untuk komponen MA. Apabila diperhatikan
plot ACF Provinsi Banten pada Gambar 12, terlihat cuts off pada lag kedua untuk
komponen non musiman, sedangkan untuk komponen musiman terlihat cuts off
pada lag pertama untuk periode musiman 12 sehingga berdasarkan identifikasi
tersebut diperoleh kandidat model yaitu ARIMA(0,0,2)(0,0,1)[12]. Proses
identifikasi yang sama juga diterapkan pada provinsi lainnya.
Selanjutnya, untuk proses identifikasi model komponen AR, diperlukan plot
PACF baik untuk non musiman maupun musiman.
(a)
(b)
(c)
(d)
(e)
Gambar 13 Plot PACF non musiman (kiri), musiman (kanan) (a) Banten, (b) Jawa
27
Berdasarkan plot PACF pada Gambar 13 dapat diidentifikasi komponen AR lag

yang cuts off pada plot PACF menunjukkan besaran ordo untuk komponen AR.
Pada Provinsi Banten terdapat cuts off pada lag pertama untuk komponen non
musiman dan tidak terdapat lag yang signifikan pada komponen musiman sehingga
diperoleh kandidat model yaitu ARIMA(1,0,0). Proses identifikasi yang sama juga
diterapkan pada provinsi lainnya.
Seleksi Kandidat model

Setelah dilakukan identifikasi model untuk mendapatkan kandidat model
dari masing-masing provinsi, selanjutnya dilakukan seleksi untuk memeroleh
model terbaik tentatif. Seleksi model dilakukan berdasarkan nilai AIC yang
dihasilkan oleh masing-masing model. Semakin kecil nilai AIC menunjukkan
model semakin baik sehingga model terbaik dipilih berdasarkan nilai AIC terkecil.
Tabel 10 Kandidat model seasonal AR data harga cabai merah besar
Lokasi Model AIC

ARIMA(1,0,0)(1,0,0)[12] 1,33
Banten ARIMA(0,0,2)(0,0,1)[12] 2,79
ARIMA(1,0,2)(0,0,1)[12] 1,94
ARIMA(1,0,0)(1,0,0)[12] 1,72
Jawa Barat ARIMA(0,0,1)(1,0,0)[12] 3,92
ARIMA(1,0,1)(1,0,0)[12] 3,08
ARIMA(1,0,0)(1,0,0)[12] 24,03
Jawa Tengah ARIMA(0,0,2)(0,0,1)[12] 23,73
ARIMA(1,0,2)(0,0,1)[12] 24,22
ARIMA(1,0,0)(1,0,0)[12] 33,65
DIY ARIMA(0,0,2)(0,0,1)[12] 32,36
ARIMA(2,0,0)(0,0,1)[12] 28,12
ARIMA(1,0,0)(1,0,0)[12] 30,92
Jawa Timur ARIMA(0,0,1)(0,0,1)[12] 35,08
ARIMA(2,0,0)(0,0,1)[12] 25,64
Berdasarkan Tabel 10 dapat diketahui bahwa model terbaik untuk Provinsi Banten
dan Jawa Barat adalah ARIMA(1,0,0)(1,0,0)[12], model terbaik untuk Provinsi
Jawa Tengah adalah ARIMA(0,0,2)(0,0,1)[12], model terbaik untuk Provinsi DIY
adalah ARIMA(2,0,0)(0,0,1)[12], dan model terbaik untuk Provinsi Jawa Timur
adalah ARIMA(2,0,0)(0,0,1)[12].
Pendugaan Parameter
Tahapan pendugaan parameter dilakukan pada model seasonal AR karena
sesuai dengan kajian simulasi yang dilakukan. Hasil pendugaan parameter
ditunjukkan pada Tabel berikut.
28
Tabel 11 Hasil pendugaan parameter model seasonal AR
Lokasi Parameter Estimasi Standard Error t-value

Banten ar1 0,686 0,089 7,680
sar1 -0,388 0,138 -2,812
intercept 10,440 0,063 165,458
Jawa Barat ar1 0,582 0,103 5,028
sar1 -0,461 0,150 -1,056
intercept 10,54 0,049 213,360
Jawa Tengah ar1 0,638 0,096 6,668
sar1 -0,359 0,140 -2,563
intercept 10,178 0,066 154,917
DIY ar1 0,699 0,087 7,973
sar1 -0,277 0,149 -1,853
intercept 10,241 0,088 115,323
Jawa Timur ar1 0,635 0,095 6,633
sar1 -0,263 0,145 -1,805
intercept 10,156 0,073 139,135
Langkah selanjutnya adalah melakukan pengecekan terhadap diagnostik sisaan
untuk menguji kelayakan dari model. Asumsi sisaan pada metode ARIMA
Musiman adalah sisaan menyebar berdasarkan distribusi normal dan antar sisaan
tidak saling berkorelasi. Asumsi sebaran normal sisaan diuji berdasarkan uji
Saphiro-Wilk dan asumsi autokorelasi sisaan diuji berdasarkan uji Ljung-Box.
Uji Diagnostik Sisaan Model Seasonal AR

Model terbaik pada masing-masing provinsi selanjutnya diperiksa asumsi
kebebasan dan kenormalan sisaan pada data dengan menggunakan uji Ljung-Box
dan Saphiro-Wilk. Model dikatakan memiliki sisaan p-value saling bebas dan
normal apabila nilai hasil uji lebih besar dari 0,05. Model dari masing-masing lokasi
beserta hasil pengujian asumsi sisaan disajikan pada Tabel 12.
Tabel 12 Nilai p-value uji Ljung-Box dan Saphiro-Wilk
Lokasi Model Ljung Saphiro- Keputusan

-Box Wilk
Banten ARIMA(1,0,0)(1,0,0)[12] 0,393 0,392 Asumsi terpenuhi
Jawa Barat ARIMA(1,0,0)(1,0,0)[12] 0,596 0,611 Asumsi terpenuhi
Jawa Tengah ARIMA(0,0,2)(0,0,1)[12] 0,911 0,144 Asumsi terpenuhi
Asumsi tidak
DIY ARIMA(2,0,0)(0,0,1)[12] 0,343 0,008
terpenuhi
Jawa Timur ARIMA(2,0,0)(0,0,1)[12] 0,366 0,871 Asumsi terpenuhi
29
Tabel 12 menunjukkan bahwa hasil diagnostik sisaan model terbaik memenuhi

asumsi sisaan kecuali Provinsi DIY. Asumsi sisaan pada keempat model terpenuhi
dikarenakan nilai p-value dari pengujian Ljung-Box dan Saphiro-Wilk pada
masing-masing lokasi lebih besar dari 0,05 sehingga gagal tolak 𝐻0 atau dengan
kata lain sisaan masing-masing lokasi menyebar berdasarkan distribusi normal dan
antar sisaan tidak saling berkorelasi. Pada Provinsi DIY, terdapat asumsi yang tidak
terpenuhi yaitu sisan tidak menyebar normal karena hasil uji Shapiro-Wilk
menunjukkan p-value sebesar 0,008 < 0,05. Oleh karena itu, dipilih model kandidat
kedua yaitu ARIMA(0,0,2)(0,0,1)[12] karena memiliki nilai AIC yang lebih kecil
daripada kandidat pertama. Hasil pengujian Ljung-Box pada model tersebut
menghasilkan p-value sebesar 0,816 yang menunjukkan bahwa asumsi antar sisaan
tidak saling berkorelasi terpenuhi. Selanjutnya untuk hasil pengujian Saphiro-Wilk
menghasilkan p-value sebesar 0,024 yang menunjuukan bahwa asumsi sisaan
menyebar normal tidak terpenuhi. Oleh karena itu dipilih kandidat pertama yaitu
ARIMA(1,0,0)(1,0,0)[12] untuk dilakukan uji diagnostik sisaan. Hasil pengujian
Ljung-Box pada model tersebut menghasilkan p-value sebesar 0,164 yang
menunjukkan bahwa asumsi antar sisaan tidak saling berkorelasi terpenuhi.
Selanjutnya untuk hasil pengujian Saphiro-Wilk menghasilkan p-value sebesar
0,073 yang menunjuukan bahwa asumsi sisaan menyebar normal terpenuhi. Dengan
demikian model terbaik untuk Provinsi DIY adalah ARIMA(1,0,0)(1,0,0)[12]
Selanjutnya, dilakukan overfitting untuk memastikan model terbaik yang
dipilih. Hasil overfitting menunjukkan bahwa, tidak ada model yang lebih baik.
Oleh karena itu, model terbaik yang diperoleh untuk Provinsi Banten, Jawa Barat,
dan DIY adalah ARIMA(1,0,0)(1,0,0)[12], model terbaik untuk Provinsi Jawa
Tengah adalah ARIMA(0,0,2)(0,0,1)[12, dan model terbaik untuk Provinsi Jawa
Timur adalah ARIMA(2,0,0)(0,0,1)[12].
4.4 Evaluasi Model dan Hasil Peramalan

Evaluasi model peramalan dari masing-masing Provinsi ditunjukkan dengan
nilai RMSE dan MAPE untuk mengetahui tingkat keakuratan model. Semakin kecil
nilai RMSE dan MAPE semakin baik tingkat keakuratan model. Pengujian tingkat
keakuratan dilakukan dengan membandingan hasil ramalan dengan data testing
dengan hasil sebagai berikut.
Tabel 13 Evaluasi model dengan nilai RMSE dan MAPE

Provinsi MAPE RMSE
Banten 2,65 0,31
Jawa Barat 1,87 0,21
Jawa Tengah 2,96 0,34
DIY 3,46 0,42
Jawa Timur 3,06 0,35
Tabel 13 menunjukkan bahwa nilai RMSE dan MAPE cenderung kecil. Nilai
MAPE 2,65% mengartikan bahwa terdapat kesalahan ramalan sebesar 2,65% atau
sebesar 0,31 berdasarkan nilai RMSE. Berdasarkan rekomendasi yang diberikan
oleh peneliti sebelumnya, batas penerimaan model berdasarkan nilai MAPE adalah
30
10%, sehingga dapat disimpulkan bahwa seluruh model yang dihasilkan pada
masing-masing provinsi, dapat diterima dengan baik hasil ramalannya.
Selain itu, hasil tersebut dapat menunjukkan bahwa tingkat keakuratan
model seasonal AR baik dan model dapat digunakan untuk meramalkan data harga
cabai merah besar pada beberapa periode kedepan. Kesimpulan ini sejalan dengan
hasil simulasi, bahwa model seasonal AR masih memiliki performa yang baik
ketika terdapat pencilan aditif sebesar 5% dengan ambang batas minimal yaitu 1,5𝑘
dimana 𝑘 = 𝑚𝑎𝑥 − 𝑚𝑖𝑛.
Selanjutnya dilakukan peramalan harga cabai merah besar di Indonesia
untuk periode Januari 2021 - Desember 2022. Hasil peramalan harga cabai merah
besar di Indonesia disajikan pada Gambar 14.
(a) Banten (b) Jawa Barat
(c) Jawa Tengah (d) DI Yogyakarta
(e) Jawa Timur
Gambar 14 Plot harga prediksi dan harga aktual (Rupiah/Kg) (a) Banten, (b)
Jawa Barat, (c) Jawa Tengah, (d) DI Yogyakarta, (e) Jawa Timur
Berdasarkan Gambar 14, hasil peramalan pada periode Januari 2021 – Mei
2022 mendekati data aktual. Terlihat bahwa rata-rata selisih antara harga ramalan
dengan harga aktual pada periode Januari 2021 – Mei 2022 adalah Rp 8.891/Kg.
Selisih ramalan tersebut masih tergolong rendah apabila dinilai berdasarkan nilai
MAPE yaitu sebesar 2,8%. Artinya terdapat kesalahan ramalan sebesar 2,8% pada
ramalan harga periode Januari 2021 – Mei 2022. Namun setelah bulan ke-16 atau
31
mulai Juni 2022 – September 2022 harga aktual melonjak naik dan memiliki selisih
yang terbilang jauh dari harga ramalan. Hal tersebut menyebabkan nilai MAPE
pada periode Juni 2022 – September 2022 menjadi besar sehingga dapat menjadi
catatan bahwa metode SARIMA tidak memiliki performa yang baik ketika
digunakan untuk melakukan peramalan jangka panjang, hal ini sesuai dengan
kesimpulan yang dinyatakan oleh Liu et al (2023) bahwa metode SARIMA
meruapakan suatu model yang memiliki tingkat akurasi yang tinggi untuk prediksi
jangka pendek.
Menurut Volantina et al. (2021) salah satu faktor terjadinya fluktuasi harga
adalah ketidakseimbangan penawaran dan permintaan cabai. Kenaikan harga pada
data aktual terjadi pada bulan Juli, dimana pada bulan Juli terdapat hari raya idul
adha yang dimungkinkan terdapat lonjakan permintaan. Di sisi lain terdapat
permasalahan pasokan yang berkurang akibat curah hujan yang tinggi, serangan
hama penyakit dan perubahan pola atau jadwal tanam, sehingga terjadi
ketidakseimbangan antara penawaran dan permintaan.
Oleh adanya permasalahan dan hasil dari penelitian yang telah dilakukan,
pemerintah melakukan berbagai program dan kegiatan stabilisasi baik pasokan
maupun harga. Program yang dibuat yaitu dengan menggunakan Early Warning
System (EWS). EWS ini merupakan suatu sistem yang dapat memberi acuan untuk
pola tanam. Selain itu pemerintah telah melakukan usaha pengendalian Organisme
Pengganggu Tanaman (OPT) ramah lingkungan, penetapan irigasi hemat air,
penggunaan mulsa dan pemberdayaan petani unggulan, serta disediakan bantuan
biaya untuk mendistribusikan cabai dari daerah yang sedang panen ke titik-titik
pasar yang membutuhkan (Kepmentan 2021). Dari sisi pengolahan dan pemasaran
pascapanen, Ditjen Hortikultura juga turut menfasilitasi rumah produksi, alat-alat
pengering (dome drying), alat pengolahan pasta cabai (Kemendag 2020).
32
V SIMPULAN DAN SARAN
5.1 Simpulan
Hasil simulasi pada data bangkitan memberikan kesimpulan bahwa, faktor
variasi parameter, persentase pencilan dan ukuran contoh berpengaruh nyata
terhadap bias parameter, sehingga ketika menerapkan model seasonal AR pada
data aktual, perlu diperhatikan ketiga faktor tersebut. Selanjutnya, berdasarkan
tingkat akurasi model diperoleh kesimpulan bahwa model seasonal AR dapat
digunakan dengan baik pada berbagai data dengan ukuran contoh sebesar 84, 204,
dan 504, serta memiliki persentase pencilan aditif maksimal sebesar 5% dengan
besaran pencilan sama dengan ambang batas minimal yaitu 1,5 𝑘 dimana 𝑘 =
𝑚𝑎𝑥 − 𝑚𝑖𝑛 sehingga dapat diterapkan pada data empirik.
Hasil pemodelan data empirik menunjukkan bahwa, model seasonal AR tidak
selalu unggul pada setiap provinsi sehingga model terbaik pada setiap provinsi
menyesuaikan dengan hasil identifikasi model beserta pengujian asumsi yang
menyertai. Hasil peramalan menunjukkan bahwa pada periode Januari 2021 – Mei
2022 harga ramalan mendekati harga aktual. Rata-rata selisih antara harga ramalan
dengan harga aktual pada periode Januari 2021 – Mei 2022 adalah Rp 8.891/Kg.
Selisih ramalan tersebut masih tergolong rendah apabila dinilai berdasarkan nilai
MAPE yaitu sebesar 2,8%. Namun setelah bulan ke-16 atau mulai Juni 2022 –
September 2022 harga aktual melonjak naik dan memiliki selisih yang terbilang
jauh dari harga ramalan. Hal tersebut menyebabkan nilai MAPE pada periode Juni
2022 – September 2022 menjadi besar sehingga dapat menjadi catatan bahwa
metode SARIMA tidak memiliki performa yang baik ketika digunakan untuk
melakukan peramalan jangka panjang.
5.2 Saran
Pada setiap penelitian memiliki temuan baru yang harus diikuti dengan
penelitian selanjutnya supaya ilmu pengetahuan terus berkembang. Oleh adanya
hasil penelitian ini, terdapat saran yaitu dilakukannya kajian simulasi pengaruh
persentase pencilan dengan besaran pencilan yang lebih ekstrim untuk model dasar
ARIMA(1,1,1)(1,1,1)[s].
33
DAFTAR PUSTAKA
Blázquez-García A, Conde A, Mori U, Lozano JA. 2021. A Review on

Outlier/Anomaly Detection in Time Series Data. ACM Comput Surv. 54(3).
doi:10.1145/3444690.
Box GEP. 1953. Non-Normality and Tests on Variances. Biometrika. 40 3/4:318.
doi:10.2307/2333350.
Box GEP, Hillmer SC, Tiao GC. 1978. ANALYSIS AND MODELING OF
SEASONAL TIME SERIES.
BPS. 2021. Laporan Perekonomian Indonesia (Dampak adanya Program Pemulihan
Ekonomi Nasional (PEN) terhadap perekonomian Indonesia di masa pandemi).
Badan Pus Stat Indones., siap terbit.
Chang I, Tiao GC, Chen C. 2016. Time Series Model Specification in the Presence
of Outliers. 81(393):132–141.
Chen C, Liu L ‐M. 1993. Forecasting time series with outliers. J Forecast.
12(1):13–35. doi:10.1002/for.3980120103.
Chuang A, Wei WWS. 1991. Time Series Analysis: Univariate and Multivariate
Methods. Technometrics. 33(1):108. doi:10.2307/1269015.
Cryer JD, Chan K-S. 1985. Time series analysis. Volume ke-20.
Deretić N, Stanimirović D, Al Awadh M, Vujanović N, Djukić A. 2022. SARIMA
Modelling Approach for Forecasting of Traffic Accidents. Sustain. 14(8).
doi:10.3390/su14084403.
Dickey DA, Fuller WA. 1979. Distribution of the Estimators for Autoregressive
Time Series With a Unit Root. J Am Stat Assoc. 74(366):427.
doi:10.2307/2286348.
Divisekara RW, Jayasinghe GJMSR, Kumari KWSN. 2021. Forecasting the red
lentils commodity market price using SARIMA models. SN Bus Econ. 1(1).
doi:10.1007/s43546-020-00020-x.
Duangchaemkarn K, Boonchieng W, Wiwatanadate P, Chouvatut V. 2022.
SARIMA Model Forecasting Performance of the COVID-19 Daily Statistics
in Thailand during the Omicron Variant Epidemic. Healthc. 10(7).
doi:10.3390/healthcare10071310.
Ghysels E, Marcellino M. 2018. Applied economic forecasting using time series
methods. Oxford University Press.
Hakim L, Kartomo K, Nursalam N. 2020. Dynamics of Price Growth of Curly Red
Chili and Red Chili in Kolaka District. Agribus J. December 2020:19–26.
http://www.usnsj.com/index.php/AJ/article/view/1367.
Hassouna FMA, Al-Sahili K. 2020. Practical Minimum Sample Size for Road
Crash Time-Series Prediction Models. Adv Civ Eng. 2020.
doi:10.1155/2020/6672612.
Hossein Arsham, Lovric M. 2011. Bartlett ’ S Test Bartlett ’ S Test. Int J Ecol Econ
Stat.(10).
Hurvich CM, Tsai CL. 1989. Regression and time series model selection in small
samples. Biometrika. 76(2):297–307. doi:10.1093/biomet/76.2.297.
Hyndman RJ, Koehler AB. 2006. Another look at measures of forecast accuracy.
Int J Forecast. 22(4):679–688. doi:10.1016/j.ijforecast.2006.03.001.
Hyndman RJ, Kostenko A V. 2007. Minimum sample size requirements for
34
seasonal forecasting models. Foresight Int J Appl Forecast. 6(6):12–15.

Kemendag. 2020. Analisis Perkembangan Harga Bahan Pangan Pokok di Pasar
Domestik dan Internasional. Volume ke-1. Pusat Pengkajian Perdagangan
Dalam Negeri.
Kepmentan. 2021. Keputusan Menteri Pertanian Republik Indonesia tentang
Rencana Strategis Kementerian Pertanian Tahun 2020-2024.
Khaulasari H, Sari SK, Qomaru ISN, D EL, A OFCA. 2022. Prediksi Produk
Domestik Bruto Triwulan Atas Dasar Harga Berlaku Menurut Pengeluaran
Konsumsi Rumah Tangga Menggunakan SARIMA dan Winter Exponential.
ResearchgateNet. 02 June:96–104.
Kim H, Durmaz N. 2012. Bias correction and out-of-sample forecast accuracy. Int
J Forecast. 28(3):575–586. doi:10.1016/j.ijforecast.2012.02.009.
Kim JH. 2003. Forecasting autoregressive time series with bias-corrected parameter
estimators. Int J Forecast. 19(3):493–502. doi:10.1016/S0169-
2070(02)00062-6.
Kleijnen JPC. 1987. Statistical tools for simulation practitioners. Marcel Dekker.
Lima S, Gonçalves AM, Costa M. 2019. Time series forecasting using Holt-Winters
exponential smoothing: An application to economic data. AIP Conf Proc. 2186
December. doi:10.1063/1.5137999.
Liu J, Yu F, Song H. 2023. Application of SARIMA model in forecasting and
analyzing inpatient cases of acute mountain sickness. BMC Public Health.
23(1):56. doi:10.1186/s12889-023-14994-4.
Mattjik AA, Sumertajaya IM. 2013. Perancangan percobaan dengan aplikasi SAS
dan Minitab. PT Penerbit IPB Press.
Mayer DG, Butler DG. 1993. Statistical validation. Ecol Modell. 68(1–2):21–32.
doi:10.1016/0304-3800(93)90105-2.
Montgomery DC. 2013. Design and Analysis of Experiments Eighth Edition.
Arizona State University. Volume ke-2009.
Montgomery DC, Jennings CL, Kulahci M. 2015. Introduction Time Series
Analysis and Forecasting.
Msofe ZA, Mbago MC. 2019. Forecasting international tourist arrivals in zanzibar
using box – jenkins SARIMA model. Gen Lett Math. 7(2):19–25.
doi:10.31559/glm2019.7.2.6.
Nauly D. 2016. Fluktuasi dan Disparitas Harga Cabai di Indonesia. J Agrosains dan
Teknol. 1(1):57–69.
Negara RIP. 2021. Peramalan Jumlah Penumpang Kapal di Pelabuhan Pantai Baru
dengan Metode Sarima Dan Winter ’ s Exponential Smoothing. Jstar. 1(1):63–
78.
Petropoulos F, Apiletti D, Assimakopoulos V, Babai MZ, Barrow DK, Ben Taieb
S, Bergmeir C, Bessa RJ, Bijak J, Boylan JE, et al. 2022. Forecasting: theory
and practice. Int J Forecast. 38(3):705–871.
doi:10.1016/j.ijforecast.2021.11.001.
Putra EF, Asdi Y, Maiyastri M. 2019. PERAMALAN DENGAN METODE
PEMULUSAN EKSPONENSIAL HOLT-WINTER DAN SARIMA (Studi
Kasus: Jumlah Produksi Ikan (Ton) di Kota Sibolga Tahun 2000-2017). J Mat
UNAND. 8(1):75. doi:10.25077/jmu.8.1.75-83.2019.
Rahman D, Sumarjaya IW, Sukarsa IKG. 2018. Perbandingan Peramalan Hasil
Produksi Ikan Menggunakan Metode Permulusan Eksponensial Holt-Winters
35
Dan Arima. E-Jurnal Mat. 7(4):371. doi:10.24843/mtk.2018.v07.i04.p227.

Rizki MI, Taqiyyuddin TA. 2021. Penerapan Model SARIMA untuk Memprediksi
Tingkat Inflasi di Indonesia. J Sains Mat dan Stat. 7(2).
doi:10.24014/jsms.v7i2.13168.
Sadik K, Erfiani, Noviyanita W. 2008. Pendeteksian Pencilan Aditif Dan Inovatif
Dalam Data Deret Waktu Melalui Metode Iteratif.
Saptana, Muslim C, Susilowati SH. 2018. MANAJEMEN RANTAI PASOK
KOMODITAS CABAI PADA AGROEKOSISTEM LAHAN KERING DI
JAWA TIMUR (Chili Supply Chain Management in Dryland Agroecosystem
in East Java). Anal Kebijak Pertan. 16(1):19–41.
Shaeffer DL. 1980. A model evaluation methodology applicable to environmental
assessment models. Ecol Modell. 8 C:275–295. doi:10.1016/0304-
3800(80)90042-3.
Shapiro SS, Wilk MB. 1965. An Analysis of Variance Test for Normality
(Complete Samples). Biometrika. 52 3/4:591. doi:10.2307/2333709.
Supriadi H, Sejati WK. 2018. Perdagangan Antarpulau Komoditas Cabai di
Indonesia: Dinamika Produksi dan Stabilitas Harga. Anal Kebijak Pertan.
16(2):111. doi:10.21082/akp.v16n2.2018.111-129.
Volantina N, Fitriadi BW, Hidayati R. 2021. Tingkat Risiko Harga Cabai Merah
Besar Di Provinsi Jawa Barat. J Hexagro. 5(2):102–114.
doi:10.36423/hexagro.v5i2.855.
Xu F, Du YA, Chen H, Zhu JM. 2021. Prediction of fish migration caused by ocean
warming based on SARIMA model. Complexity. 2021:13–16.
doi:10.1155/2021/5553935.
36
LAMPIRAN
37
Lampiran 1 Box-Cox Plot
Banten Jawa Barat
Jawa Tengah DIY
Jawa Timur
38
RIWAYAT HIDUP
Penulis dilahirkan di kota Ngawi pada tanggal 26 Januari 1998 sebagai anak
kedua dari pasangan bapak Sanusi dan ibu Siti Yulikah. Pendidikan sarjana
ditempuh di Program Studi Matematika, Fakultas Matematika dan Ilmu
Pengetahuan Alam Universitas Sebelas Maret, dan lulus pada tahun 2020. Pada
tahun 2020, penulis diterima sebagai mahasiswa program magister (S-2) di Program
Studi Statistika dan Sains Data pada Sekolah Pascasarjana IPB University dan
menamatkannya pada tahun 2023.

Ratna Nur Sarima

Diunggah oleh

Informasi Dokumen

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Ratna Nur Sarima

Diunggah oleh

Hak Cipta:

Format Tersedia

SIMULASI DAN PENERAPAN MODEL SEASONAL

AUTOREGRESSIVE PADA PERAMALAN HARGA CABAI

RATNA NUR MUSTIKA SANUSI

PROGRAM STUDI STATISTIKA DAN SAINS DATA

Bogor, Januari 2023

Ratna Nur Mustika Sanusi

Komoditas cabai merah besar merupakan komoditas yang perlu mendapatkan

Big red chilli commodity is a commodity that needs serious handling

RATNA NUR MUSTIKA SANUSI

PROGRAM STUDI STATISTIKA DAN SAINS DATA

Bogor, Januari 2023

Ratna Nur Mustika Sanusi

1 Tabel 1 Transformasi Box-Cox 7

1 Gambar 1 Plot data hasil modifikasi nilai pencilan 14

1.1 Latar Belakang

2. Menerapkan model seasonal AR dalam meramalkan harga cabai merah

1.3 Ruang Lingkup

2.1 Autoregressive Integrated Moving Average (ARIMA)

𝜙𝑝(𝐵 )(1 − 𝐵 )𝑑 𝑌𝑡 = 𝛿 + 𝜃𝑞 (𝐵 )𝜀𝑡 (1)

2.2 Seasonal ARIMA (SARIMA)

𝐴𝑅𝐼𝑀𝐴 (𝑝, 𝑑, 𝑞 )(𝑃, 𝐷, 𝑄)𝑆 (2)

Penambahan pengaruh musiman pada metode SARIMA ditandai dengan

𝜙𝑝(𝐵 )Φ𝑃 (𝐵 ) 𝑆(1 − 𝐵 )𝑑 (1 − 𝐵 𝑆)𝐷 𝑌𝑡 = 𝛿 + 𝜃𝑞 (𝐵 )ΘQ (𝐵 𝑆)𝜀𝑡 (3)

Data deret waktu mempunyai pengaruh musiman, karena deret tersebut

2.3 Uji Asumsi

Uji Kestasioneran Data pada Rataan

Kriteria pengambilan keputusan adalah tolak 𝐻0 apabila nilai kritis statistik- 𝑡

Uji Kestasioneran Data pada Ragam

𝐻0 ∶ 𝜎12 = 𝜎22 = ⋯ = 𝜎𝑘2 , data stasioner dalam ragam

Statistik uji yang digunakan sebagai berikut :

𝑓 ln 𝑠 2 − ∑ℎ𝑖=1(𝑓𝑖 ln 𝑠𝑖2 ) (6)

𝑠2 : ragam gabungan dari seluruh kelompok

Tabel 1 Transformasi Box-Cox

2.4 Identifikasi Model

Tabel 2 Identifikasi ordo menggunakan plot ACF dan PACF

2.5 Akaike’s Information Criterion (AIC)

𝐴𝐼𝐶 = 2𝑛𝑝 − 2 ln(𝐿̂ ) (8)

2.6 Estimasi dan Uji Signifikansi Parameter

dengan statistik uji yang digunakan yaitu :

Kriteria pengambilan keputusan adalah tolak 𝐻0 apabila nilai kritis statistik- 𝑡

2.7 Diagnostik Sisaan

Uji Autokorelasi Sisaan

dengan statistik uji yang digunakan yaitu :

dengan statistik uji yang digunakan :

2.8 Overfitting Model

2.10 Pencilan pada Data Deret Waktu

III METODOLOGI PENELITIAN

3.2 Prosedur Analisis Data

Prosedur Analisis Data Simulasi

Tabel 3 Variasi parameter

Variasi autoregressive seasonal autoregressive

(a) Persentase Pencilan 0% (b) Persentase Pencilan 2,5%

(c) Persentase Pencilan 5% (d) Persentase Pencilan 7,5%

Gambar 1 Plot data hasil modifikasi nilai pencilan

Gambar 1 menunjukkan data deret waktu dengan persentase pencilan yang

Tabel 4 Kombinasi faktor

Prosedur Analisis Data Aktual

6. Melakukan seleksi untuk mendapatkan model terbaik dengan pengujian

3.3 Diagram Alir

Gambar 2 Flowchart Prosedur Analisis Data

IV HASIL DAN PEMBAHASAN

4.1 Hasil Simulasi

(a) Persentase Pencilan 0% (b) Persentase Pencilan 2,5%

(c) Persentase Pencilan 5% (d) Persentase Pencilan 7,5%