Full Tesis - Drajat Indra Purnama (140720187008) Scan

MODEL HYBRID SEASONAL AUTOREGRESSIVE INTEGRATED MOVING
AVERAGE (SARIMA) - SUPPORT VECTOR REGRESSION (SVR)

DAN PENERAPANNYA PADA HARGA GABAH NASIONAL
Oleh
DRAJAT INDRA PURNAMA
140720187008
TESIS
Untuk memenuhi salah satu syarat ujian

Guna memperoleh gelar Magister Statistika Terapan
Program Pendidikan Magister Program Studi Statistika Terapan
UNIVERSITAS PADJADJARAN
BANDUNG
2020
Scanned by CamScanner
ABSTRAK
1. Judul Tesis : Model Hybrid Seasonal Autoregressive

Integrated Moving Average (SARIMA)-Support
Vector Regression (SVR) Dan Penerapannya
Pada Harga Gabah Nasional
2. Kata Kunci : 1. SARIMA

2. SVR
3. Harga Gabah
4. Hybrid SARIMA-SVR
3. Abstrak :
Komoditi gabah memiliki peran penting bagi masyarakat karena

merupakan cikal bakal beras yang merupakan makanan pokok bagi penduduk
Indonesia. Stabilitas harga gabah merupakan salah satu tujuan pembangunan yang
dilakukan oleh pemerintah Indonesia. Untuk mencapai stabilitas harga gabah
dibutuhkan perencanaan yang tepat dari pemerintah berkaitan dengan fluktuasi
harga gabah. Perkiraan harga gabah setiap bulan sangat dibutuhkan dalam
perencanaan dan pengambilan keputusan. Oleh karena itu dibutuhkan teknik
peramalan harga gabah yang tepat. Karena pola data harga gabah yang tidak
stasioner, memiliki pola musiman serta memiliki pola data linear dan nonlinear,
maka diperlukan metode peramalan yang dapat mengatasi permasalahan tersebut,
dimana dalam penelitian ini menggunakan model hybrid SARIMA-SVR. Dalam
model ini, model SARIMA digunakan untuk membentuk komponen linear.
Sedangkan model SVR digunakan untuk membentuk komponen nonlinear. Oleh
karena itu, kombinasi kedua model ini (SARIMA-SVR) akan digunakan untuk
memodelkan dan meramalkan harga gabah yang memiliki pola data linear dan
nonlinear. Ketepatan atau akurasi pemodelan dan peramalan model hybrid
SARIMA-SVR dibandingkan dengan model SARIMA melalui perbandingan
MAPE. Sebagai hasilnya, model hybrid SARIMA-SVR menunjukkan ketepatan
atau akurasi yang lebih baik dibandingkan model SARIMA.
iv
4. Abstract :
The commodity of paddy holds an important role as it is the embryo of rice

which is a staple food for Indonesian. The stability price of paddy is one of the
development goals conducted by Indonesian government. To achieve the stable
price of the paddy, a proper planning from the government is needed in case of
the paddy price fluctuation.A monthly predicted price of the paddy should be
provided for planning and decision making. Therefore, the precise price
forecasting technique needs to be undergone. Because the fact that the trend of
paddy price is not stationer as well as having seasonal trend and also having both
linear and nonlinear data trend, the hybrid SARIMA-SVR is used in this research
as the best forecasting method to fix those problems. In this model, SARIMA
model is used to form linear components, meanwhile SVR model is in charge to
form nonlinear components. The combination of the two models (SARIMA-SVR),
thus, is conducted to model and forecast the paddy price which has the linear and
nonlinear data trend. The accuracy of modeling and the hybrid model forecasting
of SARIMA-SVR is being compared to SARIMA model through the MAPE
comparison. As the result, the hybrid SARIMA-SVR shows a better accuracy
compared to the SARIMA model.
v
KATA PENGANTAR
Alhamdulillaah, segala puji dan syukur penulis panjatkan ke hadirat Allah
SWT, karena atas izin, taufik, hidayah, limpahan rahmat serta karunia-Nya
sehingga tesis dengan judul “Model Hybrid Seasonal Autoregressive Integrated
Moving Average (SARIMA) - Support Vector Regression (SVR) Dan
Penerapannya Pada Harga Gabah Nasional” ini dapat diselesaikan. Penyusunan
tesis ini tidak terlepas dari bantuan, motivasi, dukungan serta doa dari berbagai
pihak. Dalam kesempatan ini penulis mengucapkan terima kasih kepada :
1. Ibu Prof. Dr. Budi Nurani Ruchjana, MS selaku Ketua Tim Pembimbing dan
Ibu Dra. Enny Supartini, MS selaku Anggota Tim Pembimbing, yang telah
memberikan bimbingan, masukan, arahan serta meluangkan waktu untuk
berkonsultasi selama penyusunan tesis ini.
2. Ibu Dr. Siti Muchlisoh dan Bapak Yudhie Andriyana, M.Sc, Ph.D selaku Tim
Penguji yang telah memberikan saran dan koreksi dalam penyempurnaan tesis
ini.
3. Dosen-dosen pengajar pada Program Studi Magister Statistika Terapan
Universitas Padjadjaran yang telah memberikan ilmu selama penulis
mengikuti perkuliahan.
4. Kepala BPS RI, Kepala Pusdiklat BPS, Kepala BPS Propinsi Sulawesi
Tengah, Kepala BPS Kabupaten Parigi Moutong yang telah memberikan
kesempatan kepada penulis untuk mengikuti studi di Program Studi Magister
Statistika Terapan Universitas Padjadjaran.
vi
5. Kedua orang tua, Mamak dan Bapak mertua, Istriku tercinta Yuni Setyawati
serta kedua anak sholehahku Annisa Ayatul Husna dan Khansa Kamila
Shalihah atas doa, motivasi, dan dukungan selama penulis menjalani studi dan
penyusunan tesis ini.
6. Teman-teman seperjuangan pada Program Studi Magister Statistika Terapan
Universitas Padjadjaran angkatan 2018 atas bantuan dan kerjasamanya selama
perkuliahan sampai penyusunan tesis ini.
7. Semua pihak yang turut membantu proses penyelesaian tesis ini
Penulis menyadari bahwa penulisan tesis ini masih banyak kekurangan
dan jauh dari kesempurnaan. Oleh karena itu, kritik dan saran yang membangun
sangat penulis harapkan demi perbaikan tesis ini. Semoga tesis ini dapat
bermanfaat bagi banyak pihak.
Bandung, 13 Januari 2020
Drajat Indra Purnama
vii
DAFTAR ISI
PENGESAHAN ............................................................................................ ii
PERNYATAAN ........................................................................................... iii
ABSTRAK ....................................................................................................iv
KATA PENGANTAR ...................................................................................vi
DAFTAR ISI .............................................................................................. viii
DAFTAR TABEL .........................................................................................xi
DAFTAR GAMBAR .................................................................................. xii
DAFTAR LAMPIRAN .............................................................................. xiii
BAB I PENDAHULUAN............................................................................... 1
1.1 Latar Belakang Masalah ................................................................... 1
1.2 Rumusan Masalah ............................................................................ 6
1.3 Tujuan Penelitian ............................................................................. 6
1.4 Manfaat Penelitian ........................................................................... 6
1.5 Batasan Masalah .............................................................................. 7
BAB II TINJAUAN PUSTAKA..................................................................... 8
2.1 Harga Gabah. ................................................................................... 8
2.2 Uji Linearitas. .................................................................................. 9
2.3 Stasioneritas Data .......................................................................... 11
2.4 Differencing. .................................................................................. 13
2.5 Pola Musiman Data Deret Waktu ................................................... 15
2.6 Model Autoregressive Integrated Moving Average (ARIMA).. ...... 19
viii
2.7 Support Vector Machine (SVM)..................................................... 22
2.8 Pemrograman Kuadratis (Quadratic Programming) ....................... 27
2.9 Pengali Lagrange ........................................................................... 27
2.10 Kondisi Karush-Kuhn-Tucker ........................................................ 28
BAB III MODEL HYBRID SARIMA-SVR .................................................. 30
3.1 Sumber Data .................................................................................. 30
3.2 Variabel Penelitian ......................................................................... 30
3.3 Model Seasonal Autoregressive Integrated Moving Average
(SARIMA). .................................................................................... 30
3.3.1 Identifikasi Model SARIMA .............................................. 33
3.3.2 Estimasi Parameter Model SARIMA .................................. 35
3.3.3 Pengujian Signifikansi Parameter ....................................... 39
3.3.4 Pengujian Diagnostik Model SARIMA............................... 40
3.4 Model Support Vector Regression (SVR) ....................................... 41
3.4.1 Support Vector Regression (SVR) untuk Kasus Linear ....... 43
3.4.2 Support Vector Regression (SVR) untuk Kasus Nonlinear .. 49
3.4.3 Metode Grid Search ........................................................... 50
3.5 Model Hybrid SARIMA-SVR ........................................................ 52
3.6 Kriteria Pemilihan Model Terbaik .................................................. 53
3.7 Tahapan Penelitian ......................................................................... 54
BAB IV HASIL DAN PEMBAHASAN ....................................................... 58
4.1 Analisis Deskriptif Data Harga Gabah ........................................... 58
4.2 Pengujian Linearitas....................................................................... 59
ix
4.3 Identifikasi Plot Data Harga Gabah ................................................ 60
4.4 Stasioneritas Data .......................................................................... 61
4.5 Identifikasi Pola Musiman ............................................................. 61
4.6 Peramalan Harga Gabah Menggunakan Model SARIMA ............... 62
4.6.1 Identifikasi Model SARIMA .............................................. 62
4.6.2 Estimasi Parameter Model SARIMA .................................. 64
4.6.3 Pengujian Diagnostik dan Pemilihan Model SARIMA
Terbaik ............................................................................... 65
4.7 Peramalan Residual SARIMA Terbaik Menggunakan Model
SVR ............................................................................................... 67
4.8 Peramalan Harga Gabah Menggunakan Model Hybrid SARIMA-
SVR ............................................................................................... 70
4.9 Peramalan Harga Gabah Pada Oktober 2019 – September 2020 ..... 71
BAB V KESIMPULAN DAN SARAN ........................................................ 73
5.1 Kesimpulan.................................................................................... 73
5.2 Saran ............................................................................................. 74
DAFTAR PUSTAKA................................................................................... 75
LAMPIRAN ................................................................................................. 78
x
DAFTAR TABEL
Tabel 2.1 Nilai Kritis Perbandingan Ordinat Maksimum dari
Periodogram dengan jumlah Periodgram (α = 0,05)..................... 19
Tabel 3.1 Kriteria MAPE ............................................................................ 54
Tabel 4.1 Statistik Deskriptif Data Harga Gabah......................................... 58
Tabel 4.2 Uji Ramsey RESET Pada Data Harga Gabah ............................... 59
Tabel 4.3 Uji ADF Data Harga Gabah Sebelum dan Sesudah Differencing ... 61
Tabel 4.4 Identifikasi Pola Musiman Pada Data Harga Gabah Menggunakan
Regresi Spektral .......................................................................... 62
Tabel 4.5 Hasil Uji Parsial Model SARIMA ............................................... 64
Tabel 4.6 Pengujian Asumsi Residual White Noise .................................... 66
Tabel 4.7 Pengujian Diagnostik Model SARIMA ...................................... 67
Tabel 4.8 Rentang Nilai Parameter Metode Grid Search Tahapan Loose
Grid ............................................................................................ 69
Tabel 4.9 Rentang Nilai Parameter Metode Grid Search Tahapan Finer
Grid ........................................................................................... 69
Tabel 4.10 Perbandingan MAPE Model SARIMA dan Hybrid SARIMA-
SVR ............................................................................................ 71
Tabel 4.11 Peramalan Harga Gabah Oktober 2019 – September 2020........... 72
xi
DAFTAR GAMBAR
Gambar 1.1 Grafik Pergerakan Data Gabah .................................................. 3
Gambar 2.1 Pola Data Musiman ................................................................. 16
Gambar 2.2 Kemungkinan Hyperplane Dalam Model Klasifikasi dan
Hyperplane Optimal dengan Margin Optimal .......................... 23
Gambar 2.3 Transformasi 𝜑 dari Input Space ke Feature Space.................. 26
Gambar 3.1 Ilustrasi model SVR dan Plot 𝜀-insensitive loss function .......... 43
Gambar 3.2 Diagram Alur Penelitian .......................................................... 57
Gambar 4.1 Plot Data Harga Gabah Januari 2009 – Agustus 2018 .............. 60
Gambar 4.2 Plot ACF dan PACF Data Harga Gabah Diferencing
pertama dan Diferencing musiman lag 6 ................................... 63
xii
DAFTAR LAMPIRAN
Lampiran 1 Data Bulanan Rata-rata Harga Gabah Kering Giling (GKG)
Nasional Tingkat Petani Periode Januari 2009 sampai dengan
September 2019 ....................................................................... 78
Lampiran 2 Uji Linearitas ............................................................................ 80
Lampiran 3 Syntax Software R Identifikasi Musiman ................................... 81
Lampiran 4 Plot ACF dan PACF ................................................................ 83
Lampiran 5 Syntax Software R Model Hybrid SARIMA-SVR ..................... 84
Lampiran 6 Hasil Uji Parsial Model SARIMA ............................................. 89
Lampiran 7 Trial and Error Pemilihan Jumlah Lag Input Data Model
SVR ......................................................................................... 90
xiii
BAB I
PENDAHULUAN
1.1. Latar Belakang Masalah
Ketahanan pangan dapat diartikan sebagai kondisi terpenuhinya pangan bagi
negara sampai dengan perseorangan, yang tercermin dari tersedianya pangan yang
cukup, baik jumlah maupun mutunya, aman, beragam, bergizi, merata, dan
terjangkau serta tidak bertentangan dengan agama, keyakinan, dan budaya
masyarakat, untuk dapat hidup sehat, aktif, dan produktif secara berkelanjutan
(UU No. 18 Tahun 2012). Definisi ketahanan pangan tersebut mengisyaratkan
empat aspek yang harus terpenuhi yaitu tersedia, dapat diakses, dapat
dimanfaatkan, dan stabil.
Indonesia merupakan negara agraris sebagian besar penduduknya
mengkonsumsi beras sebagai makanan pokok. Beras bagi Indonesia merupakan
komoditi yang sangat strategis, baik dari aspek ekonomi, sosial, lingkungan dan
politik. Dalam kaitannya dengan ketahanan pangan salah satu unsur penting
dalam pencapaian ketahanan pangan sebagai salah satu prioritas pembangunan
nasional adalah pasokan dan stabilisasi harga beras (Bappenas, 2010). Stabilitas
harga beras diperlukan untuk mencegah fluktuasi harga beras. Menurut BPS
(2018), fluktuasi harga beras muncul akibat makin merosotnya tingkat
produktivitas lahan sehingga terus menggerus jumlah produksi gabah.
Gabah merupakan cikal bakal beras sehingga ketersediaan dan harga beras
dapat dipengaruhi ketersediaan gabah maupun harga gabah. Salah satu faktor
1
yang mempengaruhi harga dan ketersediaan gabah adalah pola penanaman padi
yang dilakukan hampir secara serentak pada musim tertentu sehingga berakibat
pada berlebihnya pasokan saat panen dan langkanya pasokan saat paceklik (BPS,
2018). Fenomena musim panen raya selalu menyebabkan anjloknya harga gabah
karena terjadi lonjakan volume hasil panen. Akibatnya, tingkat harga relatif
rendah sepanjang musim panen dan merangkak naik sampai musim panen
berikutnya.
Data harga gabah merupakan data berkala yang disajikan dalam kurun
waktu bulanan dan dikategorikan sebagai data deret waktu sehingga peramalan
data harga gabah dapat menggunakan analisis deret waktu univariat. Analisis
deret waktu univariat memiliki kelebihan yaitu hanya menggunakan data variabel
yang akan diteliti perilakunya saja dengan melihat data historis tanpa perlu
melibatkan variabel lain yang mempengaruhi (Makridakis dan Wheelwright,
1999). Pendekatan ini digunakan untuk menganalisis data dengan mengamati
perubahan dan pola pergerakan data, serta mempertimbangkan data historis
sehingga pola pergerakan masa lalu dapat menjadi informasi yang akurat untuk
meramalkan pergerakan pada masa yang akan datang.
Pergerakan data harga gabah dapat dilihat dalam Gambar 1.1. Berdasarkan
Gambar 1.1 dapat dilihat bahwa data harga gabah cenderung tidak stasioner dalam
rata-rata karena dalam beberapa waktu tertentu pergerakannya membentuk pola
tren naik. Selain itu, harga gabah memiliki pola yang tidak teratur dengan besaran
kenaikan dan penurunan yang bervariatif. Hal ini membuat pergerakan harga
gabah memiliki hubungan yang sangat kompleks dan nonlinear.
2
Plot Data Harga Gabah
3000 3500 4000 4500 5000 5500 6000

Harga Gabah (Rupiah)
0 20 40 60 80 100 120
Bulan (Januari 2009 - September 2019)
Gambar 1.1 Grafik Pergerakan Data Harga Gabah
Model univariat yang umum digunakan dalam peramalan data deret waktu
adalah model Autoregressive Integrated Moving Average (ARIMA) yang
diperkenalkan pertama kali oleh Box dan Jenkins (1976). Model ini melakukan
differencing data terlebih dahulu untuk menghasilkan data runtun waktu yang
stasioner, dan selanjutnya melakukan proses ARMA pada data hasil differencing
tersebut. ARIMA sangat baik ketepatannya untuk peramalan jangka pendek dan
untuk data runtun waktu non stasioner pada saat linear karena prinsip utama
dalam model ARIMA adalah bahwa model ini dibangun oleh proses linear. Akan
tetapi, ARIMA memiliki kekurangan untuk sebagian besar permasalahan yang
bersifat nonlinear. ARIMA cenderung mengalami penurunan tingkat keakuratan
apabila digunakan pada data yang mengandung pola nonlinear (Zhang, 2003).
Apabila model ARIMA tetap digunakan untuk memodelkan pada data nonlinear,
maka kemungkinan akan menghasilkan varian residual yang tidak konstan sebagai
akibat dari karakteristik data dengan volatilitas yang tinggi serta memiliki
3
fluktuasi data yang besar. Metode ARIMA sendiri memiliki beberapa model
alternatif yang dikembangkan sesuai dengan pola dan karakteristik data salah
satunya untuk deret waktu musiman dikenal dengan model Seasonal
Autoregressive Integrated Moving Average (SARIMA).
Berbeda dengan model ARIMA atau SARIMA, model Support Vector
Regression (SVR) merupakan model peramalan yang dapat digunakan untuk
memprediksi data deret waktu nonlinear. SVR adalah modifikasi Support Vector
Machine (SVM) yang digunakan untuk pendekatan regresi (Boser et al, 1992).
Menurut Ding (2012), keunggulan SVR adalah kemampuan untuk mengatasi
masalah data nonlinear dengan trik kernel dan dapat mengatasi masalah
overfitting dimana model yang dihasilkan hanya menghasilkan model yang baik
untuk data training dan tidak untuk data testing. Namun demikian, SVR memiliki
kekurangan dalam hal penentuan parameter model yang optimal untuk
menghasilkan model terbaik. Peneliti harus menentukan rentang nilai parameter
SVR seperti epsilon (𝜀), cost (C), dan gamma (𝛾), kemudian memilih parameter
optimal pada rentang tersebut. Untuk mengatasai masalah tersebut, salah satu cara
yang dapat digunakan dalam menentukan parameter dalam SVR adalah dengan
metode grid search. Grid search merupakan kombinasi parameter yang diujikan
pada suatu model SVR untuk mencari nilai error dalam klasifikasi (Hsu et al.,
2016).
Dalam kehidupan nyata masalah deret waktu tidak selalu linear atau
nonlinear. Namun terkadang mengandung keduanya (linear dan nonlinear) secara
sekaligus yaitu data mengandung pola nonlinear secara keseluruhan tetapi secara
4
parsial mengandung pola linear. Oleh karena itu, banyak penelitian yang telah
menggunakan model hybrid yang merupakan kombinasi model linear dengan
model nonlinear. Model hybrid digunakan karena model tunggal tidak dapat
secara total mengidentifikasi semua karakteristik data deret waktu (Terui dan Van
Dijk, 2002). Salah satu model hybrid adalah model hybrid SARIMA-SVR yang
merupakan kombinasi model SARIMA dan model SVR. Model hybrid ini
membentuk komponen linear menggunakan model SARIMA dan membentuk
komponen nonlinear menggunakan model SVR sehingga kombinasi komponen
linear dan komponen nonlinear membentuk model hybrid SARIMA-SVR.
Beberapa penelitian terdahulu yang menggunakan model hybrid diantaranya
adalah Pai dan Lin (2005) menggunakan hybrid ARIMA-SVM pada data harga
saham, Chen dan Wang (2007) menggunakan hybrid SARIMA-SVM pada nilai
produksi industri mesin, Aguilar et al (2011) menggunakan hybrid SARIMA-SVR
pada data volume inspeksi di pelabuhan, Alwee et al (2013) menggunakan hybrid
SVR-ARIMA pada data tingkat kejahatan, Pramudhitasari (2016) menggunakan
hybrid ARIMA-SVR pada data saham IHSG.
Dalam penelitian ini, penulis menggunakan model hybrid SARIMA-SVR
dengan tujuan untuk memodelkan dan meramalkan data harga gabah nasional di
tingkat petani. Hal ini didasarkan pada uraian sebelumnya bahwa data harga
gabah merupakan data yang tidak stasioner, terdapat pola musiman dan memiliki
pola data linear dan nonlinear sekaligus.
5
1.2. Rumusan Masalah
Berdasarkan latar belakang masalah yang diuraikan di atas maka rumusan
masalah dalam penelitian ini adalah
1. Bagaimana prosedur membangun model hybrid SARIMA-SVR pada kondisi
data deret waktu yang tidak stasioner, terdapat pola musiman serta
mempunyai pola data linear dan nonlinear?
2. Bagaimana menerapkan model hybrid SARIMA-SVR untuk peramalan
harga gabah nasional di tingkat petani?
1.3. Tujuan Penelitian
Berdasarkan uraian pada rumusan masalah maka tujuan yang ingin dicapai
dalam penelitian ini adalah
1. Menggambarkan prosedur membangun model hybrid SARIMA-SVR pada
kondisi data deret waktu yang tidak stasioner, terdapat pola musiman serta
mempunyai pola data linear dan nonlinear.
2. Menerapkan model hybrid SARIMA-SVR untuk peramalan harga gabah
nasional di tingkat petani.
1.4. Manfaat Penelitian
Penelitian ini diharapkan dapat menambah pengetahuan dan wawasan
keilmuan mengenai analisis data deret waktu, khususnya model hybrid SARIMA-
SVR untuk peramalan harga gabah nasional di tingkat petani. Hasil peramalan
diharapkan dapat memberikan informasi dini dan acuan empiris baik bagi
6
pemerintah, dunia usaha, maupun para peneliti lainnya. Khusus bagi pemerintah,
penelitian ini diharapkan dapat menjadi masukan dalam mengevaluasi,
merencanakan dan mengimplementasikan kebijakan dalam mengontrol harga
gabah nasional di tingkat petani.
1.5. Batasan Masalah
Batasan masalah dalam penelitian diperlukan untuk membatasi penelitian
ini, sehingga fokus pada suatu topik tertentu. Adapun batasan masalah dalam
penelitian ini, adalah sebagai berikut:
1. Data yang digunakan dalam penelitian ini adalah data bulanan berupa data
harga gabah nasional dengan kualitas gabah kering giling (GKG) di tingkat
petani pada rentang waktu Januari 2009 sampai dengan September 2019.
2. Penelitian ini menggunakan model SVR dengan fungsi kernel Radial Basic
Function (RBF).
3. Pengolahan data pada penelitian ini menggunakan Software R 3.6.1.
7
BAB II
TINJAUAN PUSTAKA
2.1. Harga Gabah
Komoditi gabah merupakan cikal bakal dari beras yang merupakan makanan
pokok bagi penduduk Indonesia. Ketersediaan komoditi gabah dapat
mempengaruhi harga gabah maupun beras. Sehingga kebijakan jangka pendek
terkait dengan manajemen stok, penetapan harga domestik, dan kuota impor
sangat diperlukan agar tidak menimbulkan gejolak harga gabah. Berkaitan dengan
upaya stabilisasi harga gabah di tingkat petani, pemerintah melalui Badan Pusat
Statistik (BPS) melakukan pemantauan harga di tingkat petani dan penggilingan
secara rutin melalui Survei Monitoring Harga Produsen Gabah bulanan.
Upaya lain pemerintah untuk menjaga stabilitas harga gabah adalah melalui
penetapan Harga Pembelian Pemerintah (HPP) untuk mengatur mekanisme
penetapan harga transaksi baik di tingkat petani maupun penggilingan. HPP
adalah harga minimal yang harus dibayarkan pihak penggilingan atau pembeli
kepada petani sesuai dengan kualitas gabah sebagaimana yang telah ditetapkan
Pemerintah dalam SK Inpres. Penetapan harga transaksi ini dibedakan menjadi
dua sebagai berikut
1) Harga di tingkat petani adalah harga yang disepakati pada waktu terjadinya
transaksi antara petani dengan pedagang pengumpul/tengkulak/pihak
penggilingan yang ditemukan pada hari dilaksanakannya observasi dengan
kualitas apa adanya, sebelum dikenakan ongkos angkut pasca panen.
8
2) Harga di tingkat penggilingan adalah harga di tingkat petani ditambah dengan
besarnya biaya ke penggilingan terdekat.
Pemantauan yang dilakukan BPS selain mencakup harga juga mencakup
komponen mutu gabah. Berdasarkan kualitas gabah menurut hasil pengukuran
komponen mutunya (kadar air dan kadar hampa), gabah dikelompokkan menjadi
1) Gabah Kering Giling (GKG) adalah gabah dengan kadar air < 14 % dan kadar
hampa/kotoran < 3 %.
2) Gabah Kering Panen (GKP) adala gabah dengan kadar air 14 % sampai 25 %
dan kadar hampa/kotoran 3,01 % sampai 10 %.
3) Gabah kualitas rendah adalah gabah dengan kadar air > 25 % dan kadar
hampa/kotoran > 10 %.
Menurut BPS (2018), perhitungan rata-rata harga gabah untuk masing-
masing kualitas gabah setiap bulannya menggunakan rumus sebagai berikut
∑𝑚
𝑗=1 P𝑛𝑖𝑗
̅
P𝑛𝑖 =
𝑚
dengan
̅𝑛𝑖
P : Rata-rata harga gabah kualitas 𝑖 pada bulan ke-𝑛.
P𝑛𝑖𝑗 : Harga gabah kualitas 𝑖 pada bulan ke-𝑛 observasi ke-𝑗.
𝑚 : Jumlah observasi.
2.2. Uji Linearitas
Suatu model peramalan dalam analisis data deret waktu disebut linear jika
tidak memuat fungsi nonlinear dari lag atau variabel prediktor (Chatfield, 2004).
Berdasarkan definisi tersebut dapat diperoleh bahwa yang dimaksud hubungan
9
nonlinear dalam deret waktu adalah hubungan nonlinear antara variabel respon
dengan lag-lag atau variabel prediktornya. Salah satu uji untuk mengetahui linear
atau nonlinear suatu data deret waktu dapat menggunakan uji Ramsey RESET
yang pertama kali diperkenalkan oleh Ramsey (1969).
Jika terdapat variabel bebas 𝑋𝑡 dan variabel prediktor 𝑌𝑡 . Uji Ramsey
RESET berawal dari ide bahwa jika tidak terdapat nonlinearitas maka berbagai
transformasi nonlinear dari 𝑓𝑡 = 𝑋𝑡 𝜃𝑡 tidak memberikan manfaat untuk
menyatakan 𝑌𝑡 (Kim et al., 2004). Prosedur uji Ramsey RESET dapat dijelaskan
sebagai
1) Melakukan regresi 𝑌𝑡 pada 𝑋𝑡 sehingga diperoleh model linear
𝑌𝑡 = 𝑓𝑡 + 𝑒𝑡 , dengan 𝑓𝑡 = 𝑋𝑡 𝜃𝑡 (2.1)
2) Melakukan regresi 𝑒𝑡 pada 𝑓𝑡𝑘 dengan 𝑓𝑡𝑘 adalah transformasi nonlinear dari
𝑓𝑡 , sehingga diperoleh bentuk
𝑒𝑡 = 𝑎2 𝑓𝑡2 + ⋯ + 𝑎𝑘 𝑓𝑡𝑘 + 𝑣𝑡 , untuk 𝑘 ≥ 2 (2.2)
Kemudian dengan memasukkan persamaan (2.2) ke persamaan (2.1) diperoleh
model alternatif
𝑌𝑡 = 𝑋𝑡 𝜃𝑡 + 𝑎2 𝑓𝑡2 + ⋯ + 𝑎𝑘 𝑓𝑡𝑘 + 𝑣𝑡 , untuk 𝑘 ≥ 2 (2.3)
Langkah-langkah pengujian linearitas menggunakan uji Ramsey RESET
adalah sebagai berikut
1) Hipotesis
𝐻0 : 𝑎2 = ⋯ = 𝑎𝑘 = 0 (Data deret waktu tidak mengandung pola nonlinear)
𝐻1 : 𝑎𝑘 ≠ 0 (Data deret waktu mengandung pola nonlinear)
2) Statistik uji
10
[(𝐞𝑇𝑡 𝐞𝑡 − 𝐯𝑡𝑇 𝐯𝑡 )⁄(𝑘 − 1)]
𝑅𝐸𝑆𝐸𝑇 = (2.4)
[(𝐯𝑡𝑇 𝐯𝑡 )⁄(𝑛 − 𝑘)]
dengan
𝐞𝑡 = (𝑒1 , … , 𝑒𝑛 ) : vektor residual model linear pada persamaan (2.1)
𝐯𝑡 = (𝑣1 , … , 𝑣𝑛 ) : vektor residual model alternatif pada persamaan (2.3)
n : banyaknya pengamatan
k : banyaknya variabel prediktor dan respon
3) Kriteria uji
Tolak 𝐻0 jika 𝑅𝐸𝑆𝐸𝑇 > 𝐹(𝑘−1,𝑛−𝑘) , artinya data deret waktu mengandung
pola nonlinear.
2.3. Stasioneritas Data
Data stasioner adalah data deret waktu yang tidak memiliki tren, pola
musiman serta nilai rata-rata dan variansnya konstan atau homogen dari waktu ke
waktu (Cryer, 1986). Data yang stasioner adalah data yang variansnya tidak
terlalu besar dan mempunyai kecenderungan untuk mendekati nilai rata-ratanya.
Suatu data {𝑍𝑡 } dikatakan stasioner apabila
1) 𝐸 [𝑍𝑡 ] = 𝜇, rata-rata dari 𝑍𝑡 konstan.
2) 𝑉𝑎𝑟[𝑍𝑡 ] = 𝐸 [𝑍𝑡 − 𝜇]2 = 𝜎 2 , varians dari 𝑍𝑡 konstan.
3) 𝐶𝑜𝑣[𝑍𝑡 , 𝑍𝑡+𝑘 ] = 𝐸 [(𝑍𝑡 − 𝜇)(𝑍𝑡+𝑘 − 𝜇)] = 𝛾𝑘 , kovarians antara dua data deret
waktu hanya bergantung pada selang waktu k antara dua periode waktu
tersebut. Selang waktu antara 𝑍𝑡 dan 𝑍𝑡+𝑘 disebut lag.
11
Stasioneritas dalam rata-rata data deret waktu dapat dilihat melalui plot
Autocorrelation Function (ACF), jika plot ACF turun dengan lambat diduga data
deret waktu belum stasioner dalam rata-rata. Selain itu, uji stasioneritas dalam
rata-rata juga dapat dilihat dari terdapat atau tidaknya akar unit (unit root).
Pengujian akar unit dapat dilakukan menggunakan uji Augmented Dickey Fuller
(ADF). Statistik uji ADF merupakan perluasan dari model Autoregressive orde 1
atau AR(1) dengan metode estimasi parameter menggunakan Ordinary Least
Square (OLS). Uji ADF diestimasi ke dalam tiga bentuk pendekatan model AR(1)
sebagai berikut:
1) Model AR(1) dengan rata-rata nol,
𝑍𝑡 = 𝛾𝑍𝑡−1 + 𝜀𝑡 .
2) Model AR(1) dengan rata-rata tidak sama dengan nol,
𝑍𝑡 = 𝛽1 + 𝛾𝑍𝑡−1 + 𝜀𝑡 .
3) Model AR(1) dengan tren deterministik,
𝑍𝑡 = 𝛽1 + 𝛽2 𝑡 + 𝛾𝑍𝑡−1 + 𝜀𝑡 .
Langkah-langkah pengujian akar unit dengan uji ADF adalah sebagai
berikut
1) Hipotesis
𝐻0 ∶ 𝛾 = 1 (Data tidak stasioner dalam rata-rata)
𝐻1 ∶ 𝛾 < 1 (Data stasioner dalam rata-rata)
2) Statistik uji
𝛾̂ − 1
𝑇= ~𝑡
𝑠𝑒(𝛾̂) (𝑛−𝑝−1)
dengan 𝑠𝑒(𝛾̂) adalah standar error dari 𝛾̂ dan p adalah banyaknya parameter
12
3) Kriteria uji
Tolak 𝐻0 jika nilai 𝑇 > 𝑡𝑡𝑎𝑏𝑒𝑙 , artinya data stasioner dalam rata-rata. Jika data
tidak stasioner, maka untuk menstasionerkan data perlu dilakukan proses
pembedaan (differencing) data.
2.4. Differencing
Ketidakstasioneran data dalam rata-rata dapat diatasi dengan proses
pembedaan (differencing). Proses differencing dapat dilakukan beberapa periode
sampai data stasioner yaitu dengan cara mengurangi nilai data pada suatu periode
dengan nilai data periode sebelumnya. Apabila data deret waktu tidak stasioner
dalam rata-rata, maka data tersebut dapat dibuat lebih mendekati stasioner dengan
melakukan proses differencing pertama yang dirumuskan sebagai
𝑍𝑡′ = 𝑍𝑡 − 𝑍𝑡−1 (2.5)
dengan
𝑍𝑡 : observasi waktu t
𝑍𝑡−1 : observasi waktu t-1.
Menggunakan operator Backshift (B), persamaan (2.5) dapat ditulis kembali
menjadi
𝑍𝑡′ = 𝑍𝑡 − 𝐵𝑍𝑡
= (1 − 𝐵)𝑍𝑡
dengan (1 − 𝐵) adalah differencing pertama.
Jika dengan proses differencing pertama data belum stasioner, maka
dilakukan proses differencing kedua yang dirumuskan
13
𝑍𝑡′′ = 𝑍𝑡′ − 𝑍𝑡−1
′
= 𝑍𝑡′ − 𝑍𝑡−1
′
= 𝑍𝑡 − 𝑍𝑡−1 − (𝑍𝑡−1 − 𝑍𝑡−2 )
= 𝑍𝑡 − 2𝑍𝑡−1 + 𝑍𝑡−2
= (1 − 2𝐵 + 𝐵2 )𝑍𝑡
= (1 − 𝐵)2 𝑍𝑡
dengan (1 − 𝐵)2 adalah differencing kedua. Sehingga secara umum proses
differencing orde ke-d dirumuskan sebagai
𝑍𝑡′ = (1 − 𝐵)𝑑 𝑍𝑡
dengan
𝑍𝑡′ : variabel hasil differencing 𝑍𝑡
𝑑 : orde differencing.
Untuk data deret waktu yang mengandung pola musiman, dilakukan
differencing musiman untuk menghilangkan pola musimannya (Pankratz, 1983).
Differencing musiman berarti menghitung pergeseran data secara musiman
berdasarkan periode waktu tertentu. Sebagai contoh untuk data kuartalan S = 4,
data bulanan S = 12 dan seterusnya. Misalkan data deret waktu mengandung pola
musiman dengan periode S, maka untuk menghilangkan pola musiman dilakukan
differencing musiman pertama (D=1) dirumuskan sebagai
𝑍𝑡∗ = 𝑍𝑡 − 𝑍𝑡−𝑆 (2.6)
dengan
𝑍𝑡 : observasi waktu t
𝑍𝑡−𝑆 : observasi waktu t-S.
14
Menggunakan operator Backshift musiman (BS), persamaan (2.6) dapat
ditulis kembali menjadi
𝑍𝑡∗ = 𝑍𝑡 − 𝐵 𝑆 𝑍𝑡−𝑆
= (1 − 𝐵 𝑆 )𝑍𝑡
dengan (1 − 𝐵 𝑆 ) adalah differencing musiman pertama.
Langkah differencing musiman untuk orde berikutnya sama seperti langkah
differencing biasa, sehingga secara umum differencing musiman orde ke-D
dirumuskan sebagai
𝑍𝑡∗ = (1 − 𝐵 𝑆 )𝐷 𝑍𝑡
dengan
𝑍𝑡∗ : variabel hasil differencing musiman 𝑍𝑡
𝐷 : orde differencing musiman.
2.5. Pola Musiman Data Deret Waktu
Data deret waktu sering menunjukkan suatu pola yang musiman. Pola
musiman terjadi jika suatu deret dipengaruhi oleh faktor musiman (misalnya
kuartal, bulanan, atau hari-hari pada minggu tertentu), sehingga memunculkan
pola identik yang berulang secara periodik (Darmawan dkk, 2012). Beberapa
contoh pola musiman disajikan pada Gambar 2.1. Pada Gambar 2.1, gambar (a)
menunjukkan pola musiman yang stasioner, gambar (b) menunjukkan pola
musiman aditif tren, dan gambar (c) menunjukkan pola musiman multiplikatif
tren.
15
(a) (b)
(c)
Gambar 2.1. Pola Data Musiman
Untuk mengidentifikasi komponen musiman dapat dilihat secara visual
melalui plot data per periodenya (Buys-Ballot) dan melalui grafik ACF. Namun,
jika data tidak hanya dipengaruhi pola musiman, tetapi juga dipengaruhi pola tren,
maka pola musiman tidak mudah untuk diidentifikasi. Untuk mengatasi hal itu,
pengujian adanya pola musiman pada data deret waktu dapat dilakukan dengan
menggunakan regresi spektral (Darmawan dkk, 2012). Regresi spektral
merupakan suatu metode yang digunakan untuk menelaah periodesitas
tersembunyi (periodesitas yang sulit ditemukan) dalam kawasan waktu.
Identifikasi pola musiman menggunakan regresi spektral hanya bisa dilakukan
16
pada data stasioner sehingga untuk data nonstasioner perlu dilakukan proses
differencing agar diperoleh data stasioner. Persamaan regresi spektral berbentuk
sebagai berikut
𝑍𝑡 = 𝛼 cos 𝜔𝑡 + 𝛽 sin 𝜔𝑡 + 𝜀𝑡 (2.7)
dengan
𝛼 dan 𝛽 : parameter (koefisien fourier)
cos 𝜔𝑡 dan sin 𝜔𝑡 : fungsi kontinu yang tidak berkorelasi
𝜀𝑡 : residual pada periode waktu ke-t
𝜔𝑡 : frekuensi fourier
Tahapan-tahapan untuk melakukan pengujian musiman dengan metode
regresi spektral adalah sebagai berikut
1) Tentukan data yang akan diuji musiman
2) Karena persamaan (2.7) pada dasarnya secara esensi koefisien fourier sama
dengan koefisien pada regresi standar maka bila diimplementasikan pada data
dapat dituliskan menjadi persamaan fourier sebagai berikut
𝑛 ⁄2
𝑍𝑡 = ∑ (𝑎𝑘 cos 𝜔𝑘 𝑡 + 𝑏𝑘 sin 𝜔𝑘 𝑡)

𝑘=0
dengan 𝜔𝑘 merupakan frekuensi fourier yang dapat dihitung dengan rumusan
𝜔𝑘 = 2𝜋𝑘⁄𝑛
3) Hitung 𝑎𝑘 dan 𝑏𝑘 dengan rumusan sebagai berikut

𝑛
1 𝑛
∑ 𝑍𝑘 cos 𝜔𝑘 𝑡 , 𝑘 = 0 dan 𝑘 = jika 𝑛 genap
𝑛 2
𝑡=1
𝑎𝑘 = 𝑛
2 (𝑛 − 1)
∑ 𝑍𝑘 cos 𝜔𝑘 𝑡 , 𝑘 = 1,2, … ,
{𝑛 𝑡=1
2
17
𝑛
2 (𝑛 − 1 )
𝑏𝑘 = ∑ 𝑍𝑘 sin 𝜔𝑘 𝑡 , 𝑘 = 1,2, … ,
𝑛 2
𝑡=1
4) Hitung nilai ordinat 𝐼(𝜔𝑘 ) dengan rumusan sebagai berikut
𝑛𝑎02 , 𝑘=0
𝑛 2 (𝑛 − 1)
𝐼 (𝜔𝑘 ) = (𝑎 + 𝑏𝑘2 ), 𝑘 = 1,2, … ,
2 𝑘 2
2
𝑛
{𝑛𝑎𝑘 , 𝑘 = jika 𝑛 genap
2
5) Uji keberartian terhadap masing-masing frekuensi fourier dengan hipotesis
statistik sebagai berikut
a. Hipotesis
𝐻0 ∶ 𝛼 = 𝛽 = 0 (data tidak dipengaruhi faktor musiman)
𝐻1 ∶ 𝛼 ≠ 0 atau 𝛽 ≠ 0 (data dipengaruhi faktor musiman)
b. Statistik uji
𝐼 (1) (𝜔(1) )
𝑇= (2.8)
∑[𝑛 ⁄2]
( )
𝑘=1 𝐼 𝜔𝑘
dengan
𝐼 (1) (𝜔(1) ) : ordinat maksimum dari periodogram pada frekuensi
fourier
I(ωk ) : nilai ordinat periodogram pada fekuensi fourier ke-k
c. Kriteria uji
Tolak 𝐻0 jika 𝑇 > 𝑔𝛼 , artinya data dipengaruhi faktor musiman. Nilai 𝑔𝛼
diperoleh dari Tabel 2.1.
18
Tabel 2.1. Nilai Kritis Perbandingan Ordinat Maksimum dari
Periodogram dengan jumlah Periodegram (α = 0,05)
N* gα( by exact formula ) gα(by first term only )

5 0,68377 0,68377
10 0,44495 0,44495
15 0,33462 0,33643
20 0,27040 0,27046
25 0,22805 0,22813
30 0,19784 0,19794
35 0,17513 0,17525
40 0,15738 0,15752
45 0,14310 0,14324
50 0,13135 0,13149
*N = ( n – 1 ) / 2 if n is odd and N = ( n/2 -1 ) if n is even
Sumber : Darmawan, 2012.
2.6. Model Autoregressive Integrated Moving Average (ARIMA)
Model Autoregressive Integrated Moving Average (ARIMA) adalah model
univariat yang umum digunakan dalam peramalan data deret waktu (Box dan
Jenkins, 1976). Model ARIMA berasal dari model Autoregressive Moving
Average (ARMA) yang merupakan gabungan antara model Autoregressive (AR)
dan model Moving Average (MA) pada data yang sudah di lakukan diferencing.
Prosedur ARIMA adalah melakukan differencing pada data deret waktu
nonstasioner terlebih dahulu untuk menghasilkan data deret waktu yang stasioner,
dan selanjutnya melakukan proses ARMA pada data hasil differencing tersebut.
Model AR menyatakan bahwa pengamatan waktu sekarang (𝑍𝑡 ) dipengaruhi
oleh pengamatan waktu sebelumnya (𝑍𝑡−𝑝 ) dan kesalahan sekarang (𝜀𝑡 ).
19
Menurut Makridakis (1999), model AR orde p yang biasa disebut AR(p)
dimodelkan sebagai
𝑍𝑡 = 𝜙1 𝑍𝑡−1 + 𝜙2 𝑍𝑡−2 + 𝜙3 𝑍𝑡−3 + ⋯ + 𝜙𝑝 𝑍𝑡−𝑝 + 𝜀𝑡
atau
(1 − 𝜙1 𝐵 − 𝜙2 𝐵2 − ⋯ − 𝜙𝑝 𝐵𝑝 )𝑍𝑡 = 𝜀𝑡
iid
dengan 𝜀𝑡 merupakan unsur residual yang menyebar normal dan independen 𝜀𝑡 ~
N(0,2) dan 𝜙1 , 𝜙2 , … , 𝜙𝑝 adalah parameter AR.
Sebagai contoh, model AR dengan orde 1 atau disebut model AR(1)
menyatakan pengamatan waktu sekarang dipengaruhi pengamatan satu waktu
sebelumnya dan unsur kesalahan. Model AR(1) dimodelkan sebagai berikut
𝑍𝑡 = 𝜙1 𝑍𝑡−1 + 𝜀𝑡
Model MA menyatakan bahwa pengamatan waktu sekarang
(𝑍𝑡 ) dipengaruhi oleh kesalahan sekarang (𝜀𝑡 ) dan kesalahan waktu sebelumnya
(𝜀𝑡−𝑞 ) . Menurut Makridakis (1999), model MA orde q yang biasa disebut MA(q)
dimodelkan sebagai
𝑍𝑡 = 𝜀𝑡 − 𝜃1 𝜀𝑡−1 − 𝜃2 𝜀𝑡−2 − ⋯ − 𝜃𝑞 𝜀𝑡−𝑞
atau
𝑍𝑡 = (1 − 𝜃1 𝐵−𝜃2 𝐵2 − ⋯ −𝜃𝑞 𝐵𝑞 )𝜀𝑡
iid
N(0,2) dan 𝜃1 , 𝜃2 , … , 𝜃𝑞 adalah parameter MA.
20
Sebagai contoh, model MA dengan orde 1 atau disebut model MA(1)
menyatakan pengamatan waktu sekarang dipengaruhi kesalahan waktu sekarang
dan kesalahan satu waktu sebelumnya. Model MA(1) dimodelkan sebagai berikut
𝑍𝑡 = 𝜀𝑡 − 𝜃1 𝜀𝑡−1
Model ARMA merupakan campuran dari proses AR dan MA. Model
ARMA digunakan untuk menggambarkan pengamatan waktu sekarang
(𝑍𝑡 ) dipengaruhi oleh pengamatan waktu sebelumnya (𝑍𝑡−𝑝 ), kesalahan
sekarang (𝜀𝑡 ) dan kesalahan waktu sebelumnya (𝜀𝑡−𝑞 ). Menurut Makridakis
(1999), model ARMA(p,q) merupakan model umum untuk campuran proses
AR(p) dan MA(q) dituliskan sebagai berikut
𝑍𝑡 = 𝜙1 𝑍𝑡−1 + ⋯ + 𝜙𝑝 𝑍𝑡−𝑝 + 𝜀𝑡 − 𝜃1 𝜀𝑡−1 − ⋯ − 𝜃𝑞 𝜀𝑡−𝑞 (2.9)
atau
𝜙𝑝 (𝐵)𝑍𝑡 = 𝜃𝑞 (𝐵)𝜀𝑡
dengan
𝜙𝑝 (𝐵) = 1 − 𝜙1 𝐵 − 𝜙2 𝐵2 − ⋯ − 𝜙𝑝 𝐵𝑝
𝜃𝑞 (𝐵) = 1 − 𝜃1 𝐵 − 𝜃2 𝐵2 − ⋯ − 𝜃𝑞 𝐵𝑞
Sebagai contoh, model ARMA (1,1) merupakan model campuran proses
AR(1) dan MA(1) yang menyatakan pengamatan waktu sekarang dipengaruhi
pengamatan satu waktu sebelumnya, kesalahan waktu sekarang dan kesalahan
satu waktu sebelumnya. Model ARMA(1,1) dimodelkan sebagai berikut
𝑍𝑡 = 𝜙1 𝑍𝑡−1 + 𝜀𝑡 − 𝜃1 𝜀𝑡−1
21
Jika data stasioner pada proses diferencing sebanyak d kali, dengan model
dasar ARMA (p,q) , maka model yang terbentuk menjadi ARIMA (p,d,q).
Menurut Wei (2006), model ARIMA (p,d,q) dituliskan sebagai
𝜙𝑝 (𝐵)(1 − 𝐵)𝑑 𝑍𝑡 = 𝜃𝑞 (𝐵)𝜀𝑡
dengan
𝜙𝑝 : parameter AR
𝜃𝑞 : parameter MA
B : operator Backshift
(1 − 𝐵)𝑑 : differencing dengan orde d
iid
𝜀𝑡 : residual yang menyebar normal dan independen 𝜀𝑡 ~ N(0,2)
Apabila differencing pertama dilakukan terhadap model agar menjadi
stasioner, maka dengan model dasar ARMA(1,1) model akan membentuk model
ARIMA (1,1,1) dituliskan sebagai
𝜙1 (𝐵)(1 − 𝐵) 𝑍𝑡 = 𝜃1 (𝐵)𝜀𝑡
atau dapat diuraikan sebagai
𝑍𝑡 = 𝑍𝑡−1 + 𝜙1 𝑍𝑡−1 − 𝜙1 𝑍𝑡−2 + 𝜀𝑡 − 𝜃1 𝜀𝑡−1
2.7. Support Vector Machine (SVM)
Support Vector Machine (SVM) adalah suatu teknik yang dikembangkaan
pertama kali oleh Boser, Guyon dan Vapnik pada tahun 1992 untuk melakukan
prediksi dalam kasus klasifikasi maupun regresi. Selanjutnya, SVM untuk kasus
regresi dikenal sebagai SVR. SVM merupakan salah satu algoritma untuk
mengatasi masalah pengenalan pada dua pola dengan menetapkan vector space.
22
Penetapan vector space tersebut bertujuan untuk mencari decision surface terbaik
dalam membagi data kedalam dua kelas dan margin antar dua kelas tersebut.
Decision surface dalam kasus data yang terbagi linear (linearly separable) adalah
hyperplane.
Konsep SVM dapat dijelaskan secara sederhana sebagai usaha mencari
hyperplane terbaik yang berfungsi sebagai pemisah dua buah kelas secara
linear pada input space (Vapnik, 1995). Gambar 2.2 memperlihatkan beberapa
pattern yang merupakan anggota dari dua buah kelas +1 dan –1. Pattern yang
tergabung pada kelas –1 disimbolkan dengan warna merah (kotak), sedangkan
pattern pada kelas +1, disimbolkan dengan warna kuning (lingkaran).
(a) (b)
Gambar 2.2. (a). Kemungkinan Hyperplane Dalam Model Klasifikasi.
(b). Hyperplane Optimal dengan Margin Optimal
Pada Gambar 2.2 (a) terdapat banyak kemungkinan untuk mendapat
hyperplane optimal sebagai pemisah dua kelas secara linear pada input space.
Hyperplane pemisah terbaik antara kedua kelas dapat ditemukan dengan
mengukur margin hyperplane tersebut dan mencari titik maksimalnya. Margin
23
adalah jarak antara hyperplane tersebut dengan pattern terdekat dari masing-
masing kelas. Pattern yang paling dekat ini disebut sebagai support vector. Pada
Gambar 2.2 (b), garis solid menunjukkan hyperplane yang terbaik, yaitu yang
terletak tepat pada tengah-tengah kedua kelas. Jarak antara garis solid dengan
garis putus-putus disebut margin, sedangkan sedangkan titik merah dan kuning
yang berada dalam lingkaran hitam adalah support vector.
Misalnya terdapat n set data training, (𝐱 𝑖 , 𝑦𝑖 ) dengan 𝑖 = 1,2, … , 𝑛 dengan

𝑇
𝐱 𝑖 = {𝑥1 , 𝑥2 , … , 𝑥𝑝 } ∈ 𝑅𝑛 merupakan atribut set untuk data ke-i dan 𝑦𝑖 ∈
{−1, +1} menyatakan label kelas. Hyperplane klasifikasi linear SVM dinotasikan
sebagai
𝐰. 𝐱 𝑖 + 𝑏 = 0
dengan 𝐰 adalah vektor parameter (bobot) dan b adalah konstanta (bias). Data 𝑥𝑖
yang masuk ke dalam kelas (-1) adalah data yang memenuhi pertidaksamaan
𝐰. 𝐱 𝑖 + 𝑏 ≤ −1 untuk 𝑦𝑖 = −1. (2.10)
Data 𝑥𝑖 yang masuk ke dalam kelas (+1) adalah data yang memenuhi
pertidaksamaan
𝐰. 𝐱 𝑖 + 𝑏 ≥ +1 untuk 𝑦𝑖 = +1. (2.11)
Misalkan 𝑥𝑎 berada di kelas -1 adalah data pada support vector sehingga
memenuhi persamaan
𝐰. 𝐱 𝑎 + 𝑏 = −1 (2.12)
dan 𝑥𝑏 berada di kelas +1 adalah data pada support vector sehingga memenuhi
persamaan
𝐰. 𝐱 𝑏 + 𝑏 = +1. (2.13)
24
Margin dapat dihitung dengan mengurangkan persamaan (2.13) dengan
persamaan (2.12) sehingga diperoleh
𝐰(𝐱 𝑏 − 𝐱 𝑎 ) = 2 (2.14)
Margin hyperplane diberikan oleh jarak antara dua hyperplane dari dua kelas
tersebut. Notasi pada persamaan (2.14) diringkas menjadi
2
‖𝐰‖ . 𝑑 = 2 atau 𝑑 = (2.15)
‖𝐰‖
dengan 𝑑 adalah margin. Untuk mendapatkan margin hyperplane yang optimal
ekuivalen dengan meminimumkan jarak (norm) dari 𝐰 sehingga persamaan (2.15)
dapat diselesaikan dengan metode quadratic programming dengan meminimalkan
invers persamaan (2.15) yaitu
1
min ‖𝐰‖ 2
𝑤 2
dengan kendala persamaan (2.10) dan (2.11) persamaan yang dituliskan kembali
sebagai
𝑦𝑖 (𝐰. 𝐱 𝑖 + 𝑏) ≥ 1, 𝑖 = 1,2, … , 𝑛.
Metode quadratic programming dapat menjadi solusi masalah tersebut karena
merupakan metode optimasi. Optimasi berarti memaksimumkan atau
meminimumkan sebuah fungsi yang diberikan untuk beberapa macam kendala
(Licker, 2003).
Pada kenyataanya, data training tidak selalu terpisah secara linear (linearly
separable), adakalanya data terpisah secara nonlinear (nonlinearly separable).
Algoritma SVM untuk mengatasi kasus data terpisah secara linear juga mampu
untuk mengatasi kasus data terpisah secara nonlinear menggunakan Soft Margin
25
Hyperplane, atau dengan memetakan vektor pada data asli di input space ke ruang
berdimensi lebih tinggi feature space, dimana fitur baru yang mengandung
interaksi terms dari data asli dan titik data pada feature space tersebut akan
terbagi secara linear (Vapnik, 1995). Gambar 2.3 menunjukkan contoh pemetaan
dari input space ke feature space dengan dimensi yang lebih tinggi. Jika terdapat
data x dengan fungsi pemetaan dinotasikan sebagai 𝜑(𝐱), diharapkan hyperplane
pada feature space mampu memisahkan kedua kelas yang pada dimensi
sebelumnya tidak dapat dipisahkan secara optimal.
Gambar 2.3. Transformasi 𝜑 dari Input Space ke Feature Space
Selanjutnya proses pada SVM untuk menemukan titik-titik support vector,
bergantung pada perkalian skalar (dot product) dari data yang sudah
ditransformasikan pada feature space, 𝜑(𝐱 𝑖 ). 𝜑(𝐱). Pada umumnya transformasi
𝜑 tidak diketahui dan sulit dipahami secara mudah sehingga dapat digantikan
dengan metode kernel. Hal ini disebut sebagai kernel trick (Pratama, 2018).
Kernel trick memberikan berbagai kemudahan pada SVM karena untuk
menentukan support vector, kita hanya cukup mengetahui fungsi kernel yang
dipakai dan tidak perlu mengetahui wujud dari fungsi nonlinear 𝜑.
26
2.8. Pemrograman Kuadratis (Quadratic Programming)
Pemrograman kuadratis (quadratic programming) adalah masalah optimasi
dimana memaksimumkan atau meminimumkan fungsi tujuan yang berbentuk
kuadratis dengan fungsi kendalanya berbentuk persamaan atau pertidaksamaan
linier (Pramudhitasari, 2016). Bentuk umum dari quadratic programming dengan
variabel 𝐱 = {𝑥1 , 𝑥2 , … , 𝑥𝑛 }𝑇 adalah sebagai berikut

𝑛 𝑛 𝑛
1
𝑓 (𝐱) = ∑ 𝑐𝑖 𝑥𝑖 + ∑ ∑ 𝑞𝑘𝑖 𝑥𝑘 𝑥𝑖. (2.16)
2
𝑖=1 𝑘=1 𝑖=1
Persamaan (2.16) dapat disederhanakan menggunakan notasi matriks
sebagai berikut
1
𝑓(𝐱) = 𝐜 𝑇 𝐱 + 𝐱 𝑇 𝐐𝐱
2
dengan 𝑓 (𝐱) adalah fungsi tujuan, kendala 𝐀𝐱 ≤ 𝐛 dan 𝐱 ≥ 0. 𝐐 merupakan
matriks simetris berukuran 𝑛 × 𝑛 yang dikenal sebagai matriks Hessian, 𝐀
merupakan matriks kendala berukuran 𝑛 × 𝑛, c merupakan vektor dari fungsi
tujuan berukuran 𝑛 × 1 dan 𝐛 merupakan vektor dari kendala bagian kanan
berukuran 𝑛 × 1.
2.9. Pengali Lagrange
Pengali lagrange digunakan untuk menyelesaikan masalah optimasi
dengan pembatas (constraint optimization) dimana pembatasan berupa persamaan
yang ditandai dengan =, bukan ≤ atau ≥. Dengan pengali lagrange, masalah
optimasi dengan pembatas akan dikonversi menjadi masalah optimasi tanpa
pembatas (unconstraint optimization). Prinsip metode ini adalah mencari nilai
27
optimal suatu fungsi tujuan dengan kendala-kendala tertentu yang harus dipenuhi.
Sebagai contoh diberikan suatu fungsi tujuan sebagai masalah optimasi dengan
kendala berupa persamaan sebagai berikut
Fungsi tujuan : min𝑓 (𝐱) dengan 𝐱 = {𝑥1 , 𝑥2 , … , 𝑥𝑛 }𝑇 (2.17)
Kendala : ℎ𝑗 (𝐱) = 0 dengan 𝑗 = 1,2, … , 𝑚
Pengali lagrange akan mengubah masalah pada persamaan (2.17) menjadi
masalah tanpa pembatas sebagai berikut

𝑚
min𝐿(𝐱, 𝛼 ) = 𝑓 (𝐱) − ∑ 𝛼𝑗 ℎ𝑗 (𝐱)

𝑗=1
dengan fungsi 𝐿(𝐱, 𝛼 ) merupakan fungsi lagrange dan 𝛼 merupakan pengali
lagrange. Selanjutnya untuk mencari nilai 𝐱 dan 𝛼 yang optimal dilakukan
penurunan fungsi lagrange (Santosa, 2007). Sehingga persamaan fungsi lagrange
dipecahkan menjadi n+m persamaan sebagai berikut
𝜕𝐿(𝐱,𝛼)
= 0 dengan 𝑖 = 1,2, … , 𝑛
𝜕𝑥𝑖
𝜕𝐿(𝐱,𝛼)
= 0 dengan 𝑗 = 1,2, … , 𝑚
𝜕𝛼𝑗
2.10. Kondisi Karush-Kuhn-Tucker
Pada Tahun 1951 Kuhn Tucker mengemukakan suatu teknik optimisasi
yang dapat digunakan untuk pencarian titik optimum dari suatu fungsi yang
berkendala yaitu metode Karush-Kuhn-Tucker (KKT). Metode ini dapat
digunakan untuk mencari solusi yang optimum dari suatu fungsi tanpa
memandang sifat dari fungsi tersebut apakah linear atau nonlinear. Sehingga
28
metode KKT dapat digunakan untuk memecahkan persoalan baik linear maupun
nonlinear.
Pada umumnya fungsi tujuan suatu masalah optimasi memiliki kendala
berupa persamaan. Akan tetapi, terdapat masalah optimasi yang memiliki kendala
berupa pertidaksamaan. Misalkan terdapat masalah optimasi sebagai berikut
Fungsi tujuan : min𝑓 (𝐱) dengan 𝐱 = {𝑥1 , 𝑥2 , … , 𝑥𝑛 }𝑇
Kendala : ℎ𝑗 (𝐱) ≥ 0, dengan 𝑗 = 1,2, … , 𝑚.
Menurut De Klerk (2005) dalam Amalia (2009), prosedur menggunakan
kondisi KKT untuk memecahkan suatu masalah optimasi dalam pemrograman
kuadratis dengan kendala berupa suatu pertidaksamaan secara essensial
melibatkan langkah-langkah yang sama seperti halnya dalam menggunakan
pengali lagrange untuk memecahkan masalah optimasi dengan kedala berupa
persamaan yaitu membentuk lagrangian sebagai berikut
1
𝐿(𝐱, 𝐲) = 𝐱 𝑇 𝐐𝐱 + 𝐜 𝑇 𝐱 + 𝛼 (𝑨𝐱 − 𝐛 )
2
dengan 𝛼 adalah pengali lagrange. Maka kondisi KKT dari persoalan persamaan
terpenuhi jika
𝜕𝐿
1) ≥ 0 atau 𝐱 𝑇 𝐐 + 𝐜 𝑇 + 𝛼𝐀 ≥ 0
𝜕𝑥𝑖
𝜕𝐿
2) ≥ 0 atau 𝐀𝐱 − 𝐛 ≥ 0
𝜕𝛼𝑗
𝜕𝐿
3) 𝑥𝑖 𝜕𝑥 = 0 atau 𝐱 𝑇 (𝐐𝐱 + 𝐜 + 𝐀𝑇 𝛼 ) = 0
𝑖
4) 𝛼𝑗 ℎ𝑗 (𝐱) = 0 atau 𝛼(𝐀𝐱 − 𝐛 ) = 0
5) 𝑥𝑖 ≥ 0
6) 𝛼𝑗 ≥ 0
29
BAB III
MODEL HYBRID SARIMA-SVR
3.1. Sumber Data
Data yang digunakan dalam penelitian ini adalah data sekunder yang
diperoleh dari Badan Pusat Statistik (BPS). Data dalam penelitian ini merupakan
data harga gabah di tingkat petani yang bersumber dari survei monitoring harga
produsen gabah bulanan yang dilakukan oleh BPS. Survei harga beras tersebut
didasarkan pada transaksi penjualan gabah oleh petani di seluruh provinsi di
Indonesia. Data merupakan data deret waktu periode Januari 2009 sampai dengan
September 2019 atau sebanyak 129 data deret waktu.
3.2. Variabel Penelitian
Model deret waktu yang digunakan adalah model deret waktu univariat,
sehingga hanya terdapat satu variabel yang digunakan dalam penelitian, yaitu data
harga gabah di tingkat petani. Harga gabah tersebut merupakan rata-rata harga
bulanan. Menurut kualitas gabahnya, data yang digunakan pada penelitian ini
adalah gabah dengan kualitas gabah kering giling (GKG).
3.3. Model Seasonal Autoregressive Integrated Moving Average (SARIMA).
Musiman merupakan fenomena dalam kehidupan sehari-hari yang berarti
kecenderungan mengulangi pola tingkah gerak dalam periode musim, biasanya
satu tahun untuk data bulanan namun tidak menutup kemungkinan untuk periode
30
musim yang lain. Model ARIMA yang melibatkan efek musiman didalamnya
disebut juga dengan model SARIMA. Model SARIMA terdiri dari dua bagian,
yaitu bagian tidak musiman dan bagian musiman. Bagian tidak musiman dari
model SARIMA merupakan model ARIMA yang dijelaskan pada Subbab 2.6.
Sedangkan bagian musiman model SARIMA merupakan model AR musiman,
MA musiman atau campuran AR musiman dan MA musiman.
Bentuk umum dari proses AR musiman untuk periode S dan orde P atau
AR(P)S didefinisikan sebagai
𝑍𝑡 = Φ1 𝑍𝑡−𝑆 + Φ2 𝑍𝑡−2𝑆 + Φ3 𝑍𝑡−3𝑆 + ⋯ + Φ𝑃 𝑍𝑡−𝑃𝑆 + 𝜀𝑡
atau
(1 − Φ1 𝐵 𝑠 − Φ2 𝐵2𝑠 − ⋯ − Φ𝑃 𝐵𝑃𝑠 )𝑍𝑡 = 𝜀𝑡

iid
N(0,2) dan Φ1, Φ2 , … , Φ𝑃 adalah parameter AR musiman.
Sebagai contoh untuk model AR(P)S akan diperlihakan AR(1)12 yaitu suatu
proses 𝑍𝑡 dikatakan mengikuti model AR(1)12, jika 𝑍𝑡 mengikuti model
𝑍𝑡 = Φ1 𝑍𝑡−12 + 𝜀𝑡
Bentuk umum dari proses MA musiman periode S dan orde Q atau MA(Q)S
didefinisikan sebagai
𝑍𝑡 = 𝜀𝑡 − Θ1 𝜀𝑡−𝑆 − Θ2 𝜀𝑡−2𝑆 − ⋯ − −Θ𝑄 𝜀𝑡−𝑄𝑆
atau
𝑍𝑡 = (1 − Θ1 𝐵 𝑆 − Θ2 𝐵2𝑆 − ⋯ − Θ𝑄 𝐵𝑄𝑆 )𝜀𝑡
iid
N(0,2) dan Θ1 , Θ2 , … , Θ𝑄 adalah parameter MA musiman
31
Sebagai contoh untuk model MA(Q)S akan diperlihakan MA(1)12 yaitu suatu
proses 𝑍𝑡 dikatakan mengikuti model MA(1)12, jika 𝑍𝑡 mengikuti model
𝑍𝑡 = 𝜀𝑡 − Θ1 𝜀𝑡−12
Secara umum, model SARIMA(p,d,q) (P,D,Q)S dengan p menunjukkan
orde AR, d adalah orde proses differencing, q menunjukkan orde MA, P
menunjukkan orde AR musiman, D adalah orde proses differencing musiman ,Q
menunjukkan orde MA musiman dan S menunjukkan periode musiman dituliskan
sebagai berikut (Wei, 2006)
𝜙𝑝 (𝐵)Φ𝑃 (𝐵 𝑠 )(1 − 𝐵)𝑑 (1 − 𝐵 𝑆 )𝐷 𝑍𝑡 = 𝜃𝑞 (𝐵)Θ𝑄 (𝐵 𝑆 )𝜀𝑡
dengan
𝜙𝑝 : parameter AR
𝜙𝑝 (𝐵) : 1 − 𝜙1 𝐵 − 𝜙2 𝐵2 − ⋯ − 𝜙𝑝 𝐵𝑝
Φ𝑃 : parameter AR musiman
Φ𝑃 (𝐵 𝑆 ) : 1 − Φ1 𝐵 𝑠 − Φ2 𝐵2𝑠 − ⋯ − Φ𝑃 𝐵𝑃𝑠
𝜃𝑞 : parameter MA
𝜃𝑞 (𝐵) : 1 − 𝜃1 𝐵 − 𝜃2 𝐵2 − ⋯ − 𝜃𝑞 𝐵𝑞
Θ𝑄 : parameter MA musiman
Θ 𝑄 (𝐵 ) : 1 − Θ1 𝐵 𝑠 − Θ2 𝐵2𝑠 − ⋯ − Θ𝑄 𝐵𝑄𝑠
(1 − 𝐵 𝑆 )𝐷 : differencing musiman dengan orde D
(1 − 𝐵 )𝑑 : differencing dengan orde d

iid
𝜀𝑡 : residual yang menyebar normal dan independen 𝜀𝑡 ~ N(0,2)
32
Sebagai contoh untuk model SARIMA(p,d,q)(P,D,Q)S akan diperlihakan
SARIMA(1,1,0) (0,1,1)12 yaitu suatu proses 𝑍𝑡 dikatakan mengikuti model
SARIMA(1,1,0) (0,1,1)12, jika 𝑍𝑡 mengikuti model
𝜙1 (𝐵)(1 − 𝐵) (1 − 𝐵12 ) 𝑍𝑡 = Θ1 (𝐵12 )𝜀𝑡
Atau dapat diuraikan ke dalam bentuk sebagai berikut
𝜙1 (𝐵)(1 − 𝐵) (1 − 𝐵12 ) 𝑍𝑡 = Θ1 (𝐵12 )𝜀𝑡
𝜙1 (𝐵)(1 − 𝐵) (𝑍𝑡 − 𝑍𝑡−12 ) = 𝜀𝑡 − Θ1 𝜀𝑡−12
𝜙1 (𝐵)((𝑍𝑡 − 𝑍𝑡−12 ) − (𝐵𝑍𝑡 − 𝐵𝑍𝑡−12 )) = 𝜀𝑡 − Θ1 𝜀𝑡−12
𝜙1 (𝐵)((𝑍𝑡 − 𝑍𝑡−12 ) − (𝑍𝑡−1 − 𝑍𝑡−13 )) = 𝜀𝑡 − Θ1 𝜀𝑡−12
𝜙1 (𝐵)(𝑍𝑡 − 𝑍𝑡−1 − 𝑍𝑡−12 + 𝑍𝑡−13 ) = 𝜀𝑡 − Θ1 𝜀𝑡−12
𝑍𝑡 − 𝜙1 𝑍𝑡−1 − 𝑍𝑡−1 + 𝜙1 𝑍𝑡−2 − 𝑍𝑡−12 + 𝜙1 𝑍𝑡−13 + 𝑍𝑡−13 − 𝜙1 𝑍𝑡−14 = 𝜀𝑡 − Θ1 𝜀𝑡−12
𝑍𝑡 = 𝑍𝑡−1 + 𝑍𝑡−12 − 𝑍𝑡−13 + 𝜙1 𝑍𝑡−1 − 𝜙1 𝑍𝑡−2 − 𝜙1 𝑍𝑡−13 + 𝜙1 𝑍𝑡−14 + 𝜀𝑡 − Θ1 𝜀𝑡−12
3.3.1. Identifikasi Model SARIMA
Sebagai langkah identifikasi awal model SARIMA adalah asumsi
kestasioneran dan pola musiman. Jika data tidak memenuhi asumsi kestasioneran,
maka dilakukan differencing (bila diperlukan dilakukan differencing musiman)
apabila tidak stasioner dalam rata-rata dan dilakukan transformasi jika tidak
stasioner dalam varian. Setelah asumsi kestasioneran terpenuhi, penentuan orde
AR, MA, AR musiman, dan MA musiman pada model SARIMA dilihat dengan
menggunakan plot Autocorrelation Function (ACF) dan Partial Autocorrelation
Function (PACF).
33
Estimasi nilai ACF dan PACF pada dasarnya digunakan untuk menjelaskan
pola yang ada di dalam suatu data deret waktu, baik secara grafik maupun
numerik. Nilai ACF dan PACF sering digunakan untuk menemukan model terbaik
secara cepat (Pankratz, 1983). Nilai estimasinya menunjukkan bagaimana suatu
observasi data deret waktu univariat berkorelasi. Plot estimasi ACF (𝜌̂𝑘 ) dan
PACF (𝜙̂𝑘,𝑘 ) dengan lag k dinamakan correlogram.
Dasar dalam analisis ACF adalah menghitung koefisien korelasi pada
masing-masing pasangan variabel (𝑍𝑡 , 𝑍𝑡+𝑘 ). Menurut Wei (2006), rumus ACF
𝛾̂𝑘 ∑𝑛−𝑘 ̅ ̅
𝑡=1 (𝑍𝑡 − 𝑍 )(𝑍𝑡+𝑘 − 𝑍 )
𝜌̂𝑘 = = , 𝑘 = 1,2, … (3.1)
𝛾̂0 ∑𝑛−𝑘 ̅ 2
𝑡=1 (𝑍𝑡 − 𝑍 )
dengan Z̅ = ∑n−k
t=1 Zt ⁄n, nilai korelasi berada antara −1 < ρ
̂ k < 1, autokovarians
𝛾̂𝑘 = 𝛾̂−𝑘 , autokorelasi 𝜌̂𝑘 = 𝜌̂−𝑘 , dan 𝛾̂0 = 𝑣𝑎𝑟(𝑍𝑡 ), serta 𝜌̂0 = 1. Apabila nilai
ACF membentuk pola turun secara perlahan (dies down), maka data deret waktu
tidak stasioner (Pankratz, 1983).
Dasar dalam analisis PACF adalah menghitung koefisien korelasi pada
masing-masing pasangan variabel (𝑍𝑡 , 𝑍𝑡+𝑘 ) dengan memperhitungkan efek dari
intervensi diantara pasangan variabel tersebut (𝑍𝑡+1 , 𝑍𝑡+2 , … , 𝑍𝑡+𝑘−1 ). Misalnya,
untuk menghitung autokorelasi pada 𝑍𝑡 dan 𝑍𝑡+3 , juga harus memperhitungkan
korelasi 𝑍𝑡+1 dan 𝑍𝑡+2 terhadap 𝑍𝑡+3 . Nilai korelasi pada PACF menggunakan
nilai estimasi koefisien regresi secara OLS karena koefisien regresi
menginterpretasikan hubungan antara variabel respon dengan variabel prediktor
34
dengan mempertimbangkan efek terhadap variabel lain. Rumus PACF menurut
Wei (2006) adalah sebagai berikut
𝜌̂𝑘+1 − ∑𝑘𝑗=1 𝜙̂𝑘,𝑗 𝜌̂𝑘+1−𝑗

𝜙̂𝑘+1,𝑘+1 = , 𝑗 = 1,2, … , 𝑘 (3.2)
1 − ∑𝑘𝑗=1 𝜙̂𝑘,𝑗 𝜌̂𝑗
dengan 𝜙̂11 = 𝜌̂1 , dan 𝜙̂𝑘+1,𝑗 = 𝜙̂𝑘,𝑗 − 𝜙̂𝑘+1,𝑘+1 𝜙̂𝑘,𝑘+1−𝑗 . Apabila nilai PACF
membentuk pola turun secara perlahan (dies down), maka data deret waktu tidak
stasioner.
Orde waktu untuk model AR dan AR musiman ditentukan dengan melihat
pola memotong dalam plot PACF, sedangkan orde waktu untuk model MA dan
MA musiman ditentukan dengan melihat pola memotong dalam plot ACF. Jika
plot PACF membentuk pola memotong atau cut off pada lag p, maka model yang
tepat adalah AR orde p. Jika plot ACF membentuk pola memotong atau cut off
pada lag q, maka model yang tepat adalah MA ored q atau MA(q). Sedangkan
untuk pola musiman, jika plot PACF membentuk pola memotong atau cut off pada
lag musiman P, maka model yang tepat adalah AR musiman orde P. Jika plot
ACF membentuk pola memotong atau cut off pada lag musiman Q, maka model
yang tepat adalah MA musiman orde Q.
3.3.2. Estimasi Parameter Model SARIMA
Salah satu metode yang dapat digunakan untuk estimasi parameter model
SARIMA adalah Maximum Likelihood Estimation (MLE). Menurut Wei (2006),
pada prinsipnya semua model ARIMA atau SARIMA dapat dikembalikan ke
bentuk ARMA (p,q). Oleh karena itu, proses estimasi parameter model SARIMA
35
dapat mengikuti proses pendugaan untuk model ini. Bentuk umum model
ARMA (p,q) pada persamaan (2.9) dapat ditulis dalam persamaan
𝜀𝑡 = 𝑍𝑡 − 𝜙1 𝑍𝑡−1 − 𝜙2 𝑍𝑡−2 − ⋯ − 𝜙𝑝 𝑍𝑡−𝑝 + 𝜃1 𝜀𝑡−1 + 𝜃2 𝜀𝑡−2 + ⋯ +
𝜃𝑞 𝜀𝑡−𝑞 (3.3)
Untuk memudahkan persamaan (3.3) dapat ditulis dengan

𝑝 𝑞
𝜀𝑡 = 𝑍𝑡 − ∑ 𝜙𝑖 𝑍𝑡−𝑖 + ∑ 𝜃𝑗 𝜀𝑡−𝑗 (3.4)

𝑖=1 𝑗=1
iid
Dengan asumsi bahwa 𝜀𝑡 adalah sebuah proses white noise dan independen 𝜀𝑡 ~
N(0,2), maka fungsi kepadatan gabungan dari 𝜀 = (𝜀1 , 𝜀2 , … , 𝜀𝑛 ) adalah

𝑛
1
𝑃(𝜀|𝜙, 𝜇, 𝜃, 𝜎𝜀2 ) = (2𝜋𝜎𝜀2 )−𝑛⁄2 exp (− 2 ∑ 𝜀𝑡2 ) (3.5)
2𝜎𝜀
𝑡=1
Dengan memasukkan persamaan (3.4) ke dalam persamaan (3.5) sehingga
diperoleh fungsi parameter model ARMA (p,q) :
𝑛 𝑝
1
𝑃(𝜙, 𝜇, 𝜃, 𝜎𝜀2 ) = (2𝜋𝜎𝜀2 )−𝑛⁄2 exp (− 2 ∑ (𝑍𝑡 − ∑ 𝜙𝑖 𝑍𝑡−𝑖
2𝜎𝜀
𝑡=1 𝑖=1
𝑞 2
+ ∑ 𝜃𝑗 𝜀𝑡−𝑗 ) ) (3.6)
𝑗=1
dengan mengambil log natural dari persamaan (3.6) diperoleh persamaan berikut
𝐿 = ln 𝑃 (𝜙, 𝜇, 𝜃, 𝜎𝜀2 )
𝑝 𝑞 2
𝑛
𝑛 1
= − ln(2𝜋𝜎𝜀2 ) − 2 ∑ (𝑍𝑡 − ∑ 𝜙𝑖 𝑍𝑡−𝑖 + ∑ 𝜃𝑗 𝜀𝑡−𝑗 ) (3.7)
2 2𝜎𝜀
𝑡=1 𝑖=1 𝑗=1
36
Estimasi parameter 𝜙𝑝 dan 𝜃𝑞 dari model ARMA(p,q) dapat diperoleh dengan
menyelesaikan 𝜕𝐿⁄𝜕𝜙𝑝 = 0 dan 𝜕𝐿⁄𝜕𝜃𝑞 = 0.
Sebagai gambaran dilakukan estimasi parameter 𝜙1 dan 𝜃1 pada model
ARMA(1,1). Dengan memasukkan nilai p=1 dan q=1 pada persamaan (3.7)
diperoleh persamaan sebagai berikut
𝐿 = ln 𝑃(𝜙, 𝜇, 𝜃, 𝜎𝜀2 )
2
𝑛 1 1
𝑛 1
= − ln(2𝜋𝜎𝜀2 ) − 2 ∑ (𝑍𝑡 − ∑ 𝜙𝑖 𝑍𝑡−𝑖 + ∑ 𝜃𝑗 𝜀𝑡−𝑗 )
2 2𝜎𝜀
𝑡=1 𝑖=1 𝑗=1
𝑛
𝑛 1
= ln(2𝜋𝜎𝜀2 ) − 2 ∑(𝑍𝑡 − 𝜙1 𝑍𝑡−1 + 𝜃1 𝜀𝑡−1 )2 .
2 2𝜎𝜀
𝑡=1
Sehingga estimasi parameter AR(1) adalah

𝑛 𝑛
𝜕𝐿 2
= (− 2 ∑(𝑍𝑡 − 𝜙1 𝑍𝑡−1 + 𝜃1 𝜀𝑡−1 )) (∑ −(𝑍𝑡−1 ))
𝜕𝜙1 2𝜎𝜀
𝑡=1 𝑡=1
𝑛
1
= − 2 ∑[(𝑍𝑡 − 𝜙1 𝑍𝑡−1 + 𝜃1 𝜀𝑡−1 )(−(𝑍𝑡−1 ))]
𝜎𝜀
𝑡=1
𝑛 𝑛 𝑛
𝑍𝑡 𝑍𝑡−1 𝜙1 (𝑍𝑡−1 )2 𝜃1 𝜀𝑡−1 𝑍𝑡−1
=∑ 2
− ∑ 2
−∑ .
𝜎𝜀 𝜎𝜀 𝜎𝜀2
𝑡=1 𝑡=1 𝑡=1
𝜕𝐿
Dengan menyamakan 𝜕𝜙 = 0 diperoleh
1
𝑛 𝑛 𝑛
𝜙̂1 (𝑍𝑡−1 )2 𝑍𝑡 𝑍𝑡−1 𝜃1 𝜀𝑡−1 𝑍𝑡−1
∑ = ∑ − ∑
𝜎𝜀2 𝜎𝜀2 𝜎𝜀2
𝑡=1 𝑡=1 𝑡=1
𝑛 𝑛 𝑛
(𝑍𝑡−1 )2 𝑍𝑡 𝑍𝑡−1 𝜃1 𝜀𝑡−1 𝑍𝑡−1
𝜙̂1 ∑ 2
=∑ 2
−∑
𝑡=1 𝑡=1 𝑡=1
37
𝑛 𝑛 𝑛
𝑍𝑡 𝑍𝑡−1 𝜃1 𝜀𝑡−1 𝑍𝑡−1 𝜎𝜀2
̂
𝜙1 = (∑ −∑ ) (∑ )
𝜎𝜀2 𝜎𝜀2 (𝑍𝑡−1 )2
𝑡=1 𝑡=1 𝑡=1
𝑛 𝑛
𝑍𝑡 𝑍𝑡−1 𝜃1 𝜀𝑡−1 𝑍𝑡−1
𝜙̂1 = ∑ 2
−∑
(𝑍𝑡−1 ) (𝑍𝑡−1 )2
𝑡=1 𝑡=1
𝑛 𝑛
𝑍𝑡 𝜃1 𝜀𝑡−1
𝜙̂1 = ∑ −∑ .
𝑍𝑡−1 𝑍𝑡−1
𝑡=1 𝑡=1
Sedangkan estimasi parameter MA(1) adalah

𝑛 𝑛
𝜕𝐿 2
= (− 2 ∑(𝑍𝑡 − 𝜙1 𝑍𝑡−1 + 𝜃1 𝜀𝑡−1 )) (∑ 𝜀𝑡−1 )
𝜕𝜃1 2𝜎𝜀
𝑡=1 𝑡=1
𝑛
1
= − 2 ∑[(𝑍𝑡 − 𝜙1 𝑍𝑡−1 + 𝜃1 𝜀𝑡−1 )(𝜀𝑡−1 )]
𝜎𝜀
𝑡=1
𝑛 𝑛 𝑛
𝑍𝑡 𝜀𝑡−1 𝜙1 𝑍𝑡−1 𝜀𝑡−1 𝜃1 (𝜀𝑡−1 )2
=∑ − ∑ − ∑ .
𝜎𝜀2 𝜎𝜀2 𝜎𝜀2
𝑡=1 𝑡=1 𝑡=1
𝜕𝐿
Dengan menyamakan 𝜕𝜃 = 0 diperoleh
1
𝑛 𝑛 𝑛
𝜃̂1 (𝜀𝑡−1 )2 𝑍𝑡 𝜀𝑡−1 𝜙1 𝑍𝑡−1 𝜀𝑡−1
∑ 2
=∑ 2
−∑
𝑡=1 𝑡=1 𝑡=1
𝑛 𝑛 𝑛
(𝜀𝑡−1 )2 𝑍𝑡 𝜀𝑡−1 𝜙1 𝑍𝑡−1 𝜀𝑡−1
𝜃̂1 ∑ 2
=∑ 2
−∑
𝑡=1 𝑡=1 𝑡=1
𝑛 𝑛 𝑛
𝑍𝑡 𝜀𝑡−1 𝜙1 𝑍𝑡−1 𝜀𝑡−1 𝜎𝜀2
̂
𝜃1 = (∑ −∑ ) (∑ )
𝜎𝜀2 𝜎𝜀2 (𝜀𝑡−1 )2
𝑡=1 𝑡=1 𝑡=1
𝑛 𝑛
𝑍𝑡 𝜀𝑡−1 𝜙1 𝑍𝑡−1 𝜀𝑡−1
𝜃̂1 = ∑ 2
−∑
(𝜀𝑡−1 ) (𝜀𝑡−1 )2
𝑡=1 𝑡=1
𝑛 𝑛
𝑍𝑡 𝜙1 𝑍𝑡−1
𝜃̂1 = ∑ −∑ .
𝜀𝑡−1 𝜀𝑡−1
𝑡=1 𝑡=1
38
3.3.3. Pengujian Signifikansi Parameter
Suatu model dikatakan model yang baik apabila parameter yang diestimasi
signifikan atau nilai parameternya tidak sama dengan nol. Pengujian signifikansi
parameter dilakukan untuk melihat apakah parameter yang digunakan layak
masuk ke dalam model atau tidak. Misalkan 𝜙̂𝑖 adalah nilai estimasi dari
parameter AR pada model SARIMA dan 𝑠𝑒(𝜙̂𝑖 ) adalah standar error dari nilai
estimasi 𝜙𝑖 , maka uji signifikansi parameter AR pada model SARIMA dapat
dilakukan dengan tahapan sebagai berikut
1. Hipotesis
𝐻0 ∶ 𝜙̂𝑖 = 0, 𝑖 = 1, … , 𝑝 (Koefisien parameter tidak signifikan)
𝐻1 ∶ 𝜙̂𝑖 ≠ 0 𝑖 = 1, … , 𝑝 (Koefisien parameter signifikan)
2. Statistik uji
𝜙̂𝑖
𝑡ℎ𝑖𝑡𝑢𝑛𝑔 =
𝑠𝑒(𝜙̂𝑖 )
3. Kriteria uji
Tolak 𝐻0 jika nilai |𝑡ℎ𝑖𝑡𝑢𝑛𝑔 | > 𝑡(𝛼;𝑛−𝑝−1) atau 𝑝𝑣𝑎𝑙𝑢𝑒 < 𝛼, artinya parameter
2
signifikan terhadap model. Dengan p adalah banyaknya parameter yang
ditaksir dan n adalah banyaknya pengamatan.
Jika terdapat koefisien yang tidak signifikan, maka koefisien atau order lag
tersebut dapat dibuang dari model dan model dapat diestimasi kembali tanpa
mengikutkan order yang tidak signifikan.
39
3.3.4. Pengujian Diagnostik Model SARIMA
Uji kelayakan model digunakan untuk mengetahui apakah model dugaan
sudah memenuhi syarat suatu model layak atau tidak untuk melakukan peramalan.
Suatu model dikatakan layak jika parameter model sudah signifikan dan residual
dari model memenuhi asumsi white noise dan kenormalan.
Asumsi residual bersifat white noise maksudnya barisan variabel acak tidak
berkorelasi dengan rata-rata dan varians konstan (𝜎𝜀2 ), sehingga residual dari
masing-masing data saling independen antara satu dengan yang lainnya. Menurut
Pankratz (1983), uji white noise dilakukan dengan cara memodelkan ulang
residual yang didapatkan dari model. Untuk mendapatkan autokorelasi dari
residual, digunakan rumus
∑𝑛−𝑘
𝑡=1 (𝜀̂𝑡 − 𝜀̅)(𝜀̂𝑡+𝑘 − 𝜀̅)
𝜌𝑘 (𝜀̂) =
∑𝑛−𝑘
𝑡=1 (𝜀̂𝑡 − 𝜀̅)
2
dengan 𝜌𝑘 (𝜀̂) adalah estimasi ACF residual, k adalah orde waktu, dan n adalah
banyaknya residual. Menurut Ljung-Box (1978), mengembangkan uji
Portmanteau untuk menguji asumsi residual bersifat white noise adalah
menggunakan nilai autokorelasi yang telah distandarisasi dengan langkah
pengujian sebagai berikut
1) Hipotesis
𝐻0 ∶ 𝜌1 (𝜀̂) = 𝜌2 (𝜀̂) = ⋯ = 𝜌𝑘 (𝜀̂) = 0 (residual bersifat white noise)
𝐻1 : minimal ada satu 𝜌𝑘 (𝜀̂) ≠ 0 , 𝑘 = 1,2, … , 𝑚 (residual tidak bersifat white
noise)
2) Statistik uji
40
𝑚
𝜌𝑘2
𝑄 = 𝑛 (𝑛 + 2) ∑ ,𝑛 > 𝑘 (3.8)
𝑛−𝑘
𝑘=1
3) Kriteria uji
2
Tolak 𝐻0 jika 𝑄 > 𝜒(𝛼,𝑚−𝑝−𝑞) atau 𝑝𝑣𝑎𝑙𝑢𝑒 < 𝛼, artinya residual tidak bersifat
white noise.
Pengujian asumsi normalitas residual dilakukan dengan menggunakan
Kolmogorov Smirnov. Langkah-langkah pengujian asumsi normalitas residual
1) Hipotesis
𝐻0 ∶ 𝐹𝑛 (𝑥) = 𝐹0 (𝑥 ) (residual berdistribusi normal)
𝐻1 ∶ 𝐹𝑛 (𝑥) ≠ 𝐹0 (𝑥 ) (residual tidak berdistribusi normal)
2) Statistik uji
𝐷ℎ𝑖𝑡𝑢𝑛𝑔 = sup|𝐹𝑛 (𝑥) − 𝐹0 (𝑥 )| (3.9)

𝑥
dengan
𝐹𝑛 (𝑥 ) : fungsi distribusi kumulatif dari data asal
𝐹0 (𝑥 ) : fungsi yang dihipotesiskan berdistribusi normal
3) Kriteria uji
Tolak 𝐻0 jika 𝐷ℎ𝑖𝑡𝑢𝑛𝑔 > 𝐷(1−𝛼),𝑛 , artinya residual tidak berdistribusi normal.
𝐷(1−𝛼),𝑛 diperoleh dari tabel Kolmogorov Smirnov.
3.4. Model Support Vector Regression (SVR)
Sebelum melakukan analisis data deret waktu univariat menggunakan model
SVR, data training dikonversikan ke dalam bentuk time lag yang nantinya sebagai
41
data input dalam model SVR. Untuk menentukan banyaknya lag untuk input data
pada SVR didasarkan pada penelitian Balkin (2000). Menurut Balkin (2000)
banyaknya lag untuk input SVR untuk data deret waktu bulanan adalah 1 lag
sampai 15 lag. Prosedurnya adalah dengan melakukan trial and error pada jumlah
1 lag sampai 15 lag, dipilih jumlah lag yang memiliki error terkecil.
SVR pada awalnya diusulkan oleh Vapnik (1995). SVR merupakan
penerapan SVM yang digunakan untuk kasus regresi yang outputnya berupa
bilangan riil atau kontinu. Ide dasar dari SVR yaitu dengan menentukan set data
yang dibagi menjadi data training dan data testing. Kemudian dari data training
tersebut ditentukan suatu fungsi regresi dengan batasan deviasi tertentu sehingga
dapat menghasilkan prediksi yang mendekati nilai aktual. Konsep SVR
didasarkan pada structural risk minimization (SRM), yaitu untuk mengestimasi
suatu fungsi resiko (risk function) dengan cara meminimalkan batas atas dari
generalization error.
Menurut Smola dan Scholkopf (2004), SVR menggunakan 𝜀-insensitive loss
function pada fungsi optimisasinya yang digambarkan melalui notasi 𝜀 yang
mencerminkan besaran deviasi dari nilai aktual untuk semua data training. Nilai 𝜀
menunjukkan batas dari rentang data aktual yang bisa diestimasi oleh fungsi.
Secara visual, model SVR membentuk semacam tabung (tube) yang lebarnya
masing-masing 𝜀 atau sering disebut 𝜀-tube .Ilustrasi model SVR disajikan pada
Gambar 3.1. Konsep SRM pada SVR ini menyebabkan SVR mampu mengatasi
overfitting. Overfitting merupakan kondisi dimana suatu model tidak
menggambarkan hubungan utama antara training dan testing melainkan
42
menggambarkan random error atau noise, kondisi ini akan mengakibatkan hasil
prediksi yang buruk.
(a) (b)
Gambar 3.1. (a). Ilustrasi model SVR, (b). Plot 𝜀-insensitive loss function
3.4.1. Support Vector Regression (SVR) untuk Kasus Linear
Misalkan terdapat n set data training, (𝐱 𝑖 , 𝑦𝑖 ) dengan 𝑖 = 1,2, … , 𝑛.

𝑇
Sedangkan 𝐱 𝑖 = {𝑥1 , 𝑥2 , … , 𝑥𝑝 } ∈ 𝑅𝑛 merupakan vektor dalam input space dan
𝑦𝑖 = {𝑦1 , 𝑦2 , … , 𝑦𝑛 } ∈ 𝑅 merupakan nilai output berdasarkan 𝐱 𝑖 yang bersesuaian.
Dengan SVR, akan ditemukan suatu fungsi 𝑓(𝐱 𝑖 ) yang mempunyai deviasi paling
besar 𝜀 dari nilai aktual 𝑦𝑖 untuk semua data training maka dengan SVR ketika 𝜀
sama dengan 0 akan didapatkan regresi yang sempurna. Fungsi regresi yang
sempurna dari metode SVR linear dapat dituliskan sebagai berikut
𝑓(𝐱 𝑖 ) = 𝐰. 𝐱 𝑖 + 𝑏 (3.10)
dengan w merupakan vektor bobot dan b merupakan bias. Koefisien w dan b di
sini berfungsi untuk meminimalkan fungsi resiko. Fungsi resiko minimal akan
43
membuat suatu fungsi menjadi setipis (flat) mungkin sehingga kapasitas fungsi
dapat terkontrol, hal ini dinamakan regularisasi.
Menurut Haykin (2009), koefisien w dan b pada persamaan (3.10) diestimasi
dengan cara meminimalkan fungsi resiko (risk function) sebagai berikut

𝑛
1
𝑅(𝑓 (𝐱 𝑖 )) = ‖𝐰‖ 2 + 𝐶 ∑ 𝐸𝜀 (𝑦𝑖 − 𝑓(𝐱 𝑖 ))
2
𝑖=1
atau dituliskan
𝑛
1
min ‖𝐰‖ 2 + 𝐶 ∑ 𝐸𝜀 (𝑦𝑖 − 𝑓(𝐱 𝑖 )) (3.11)
𝐰 2
𝑖=1
dengan ‖𝐰‖ adalah reguralisasi yang merupakan fungsi yang diminimumkan agar
membuat fungsi setipis (flat) mugkin. Konstanta 𝐶 (𝐶𝑜𝑠𝑡) > 0 adalah nilai tawar
(trade off) antara ketipisan fungsi 𝑓 dan batas atas deviasi lebih dari 𝜀 yang masih
bisa ditoleransi (Smola dan Scholkopf, 2004). Nilai C kemudian menjadi nilai
penalti dari data training yang memiliki deviasi lebih besar ɛ dari nilai aktual.
Jika nilai C terlalu kecil, maka fungsi akan semakin toleran terhadap kesalahan
tersebut. Sedangkan jika nilai C terlalu besar,maka fungsi akan semakin tidak
toleran terhadap kesalahan. Sedangkan 𝐸𝜀 adalah 𝜀-insensitive loss function yang
didefinisikan sebagai
|𝑦𝑖 − 𝑓 (𝐱 𝑖 )| − 𝜀, untuk |𝑦𝑖 − 𝑓 (𝐱 𝑖 )| ≥ 𝜀

𝐸𝜀 (𝑦𝑖 − 𝑓 (𝐱 𝑖 )) = {
0, lainnya .
dengan kendala
𝑦𝑖 ≤ 𝑓(𝐱 𝑖 ) + 𝜀
𝑦𝑖 ≥ 𝑓(𝐱 𝑖 ) − 𝜀
44
Fungsi regresi 𝑓 diasumsikan merupakan fungsi yang dapat
mengaproksimasi semua titik (𝐱 𝑖 , 𝑦𝑖 ) dengan presisi 𝜀. Semua titik yang berada
dalam rentang 𝑓 ± 𝜀 atau berada di dalam 𝜀-tube disebut feasible. Sedangkan titik
yang berada diluar rentang 𝑓 ± 𝜀 atau di luar 𝜀-tube disebut infeasible. Titik
infeasible ini ditambahkan dengan variabel slack positif 𝜉𝑖 , 𝜉𝑖∗ untuk mengatasi
masalah pembatas yang tidak layak (infeasible constrain) dalam masalah
optimasi. Sehingga persamaan (3.11) dapat ditranformasikan ke dalam bentuk

𝑛
1
min∗ ‖𝐰‖2 + 𝐶 ∑(𝜉𝑖 + 𝜉𝑖∗ ) (3.12)
𝑤,𝜉𝑖 ,𝜉𝑖 2
𝑖=1
dengan kendala
𝑦𝑖 ≤ 𝑓(𝐱 𝑖 ) + 𝜀 + 𝜉𝑖
𝑦𝑖 ≥ 𝑓(𝐱 𝑖 ) − 𝜀 − 𝜉𝑖∗ (3.13)
𝜉𝑖 , 𝜉𝑖∗ ≥ 0
Persamaan (3.12) menunjukkan bahwa penentuan parameter w dan b
menjadi masalah optimasi quadratic programming. Menurut Smola dan
Scholkopf (2004), untuk mendapatkan solusi masalah quadratic programming
persamaan (3.12) adalah menggunakan lagrangian dengan satu koefisien
lagrange untuk setiap kendala pada persamaan (3.13) yang dituliskan sebagai
𝑛 𝑛
1
𝐿𝑝 (𝐰, 𝑏, 𝜉𝑖 , 𝜉𝑖∗ , 𝛼𝑖 , 𝛼𝑖∗ , 𝜂𝑖 , 𝜂𝑖∗ ) = ‖𝐰‖ 2 + 𝐶 ∑(𝜉𝑖 + 𝜉𝑖∗ ) − ∑(𝜂𝑖 𝜉𝑖 + 𝜂𝑖∗ 𝜉𝑖∗ )
2
𝑖=1 𝑖=1
𝑛 𝑛
− ∑ 𝛼𝑖 (𝜀 + 𝜉𝑖 + 𝑓(𝐱 𝑖 ) − 𝑦𝑖 ) − ∑ 𝛼𝑖∗ (𝜀 + 𝜉𝑖∗ − 𝑓(𝐱 𝑖 ) + 𝑦𝑖 ) (3.14)

𝑖=1 𝑖=1
45
dengan 𝛼𝑖 , 𝛼𝑖∗ , 𝜂𝑖 , 𝜂𝑖∗ ≥ 0 adalah koefisisien lagrange. Untuk meminimualkan
lagrangian persamaan (3.14) maka dilakukan turunan parsial 𝐿𝑝 terhadap
𝐰, 𝑏, 𝜉𝑖 , dan 𝜉𝑖∗ untuk kendala optimasi sebagai berikut

𝑛
𝜕𝐿𝑝
= 0 ⇒ 𝐰 = ∑(𝛼𝑖 − 𝛼𝑖∗ ) 𝐱 𝑖 (3.15)
𝜕𝐰
𝑖=1
𝑛
𝜕𝐿𝑝
= 0 ⇒ ∑(𝛼𝑖 − 𝛼𝑖∗ ) = 0 (3.16)
𝜕𝑏
𝑖=1
𝜕𝐿𝑝
= 0 ⇒ 𝛼𝑖 + 𝜂𝑖 = 𝐶 (3.17)
𝜕𝜉𝑖
𝜕𝐿𝑝
= 0 ⇒ 𝛼𝑖∗ + 𝜂𝑖∗ = 𝐶 (3.18)
𝜕𝜉𝑖∗
dengan n merupakan banyaknya data yang menjadi support vector.
Menurut Pratama (2018), karena koefisien langrange 𝛼𝑖 dan 𝛼𝑖∗ yang tidak
diketahui dan vektor w yang bernilai besar, 𝐿𝑝 (persamaan primal) pada
persamaan (3.14) harus diubah kedalam bentuk 𝐿𝑑 (persamaan dual). Modifikasi
𝐿𝑝 menjadi 𝐿𝑑 berarti memodifikasi persamaan (3.14), yang asalnya
meminimumkan menjadi memaksimumkan. Melalui subtitusi persamaan (3.15),
(3.16), (3.17), dan (3.18) ke dalam persamaan (3.14) menghasilkan persamaan
dual untuk problem optimisasi dari SVR sebagai berikut

𝑛 𝑛 𝑛
1
𝐿𝑑 (𝛼𝑖 , 𝛼𝑖∗ ) = ∑ 𝑦𝑖 (𝛼𝑖 −𝛼𝑖∗ ) − 𝜀 ∑(𝛼𝑖 +𝛼𝑖∗ ) − ∑ (𝛼𝑖 −𝛼𝑖∗ )(𝛼𝑗 −𝛼𝑗∗ )𝐱 𝑖 𝐱𝑗
2
𝑖=1 𝑖=1 𝑖,𝑗=1
dengan 𝐱 𝑖 𝐱𝑗 merupakan perkalian skalar (dot-product) dua data dalam data
training. Sehingga optimasi lagrangian pada persamaan (3.14) dapat dituliskan
kembali sebagai berikut
46
𝑛 𝑛 𝑛
1
max∗ ∑ 𝑦𝑖 (𝛼𝑖 −𝛼𝑖∗ ) − 𝜀 ∑(𝛼𝑖 +𝛼𝑖∗ ) − ∑ (𝛼𝑖 −𝛼𝑖∗ )(𝛼𝑗 −𝛼𝑗∗ )𝐱 𝑖 𝐱𝑗
𝛼𝑖 𝛼𝑖 2
𝑖=1 𝑖=1 𝑖,𝑗=1
dengan kendala
𝑛
∑(𝛼𝑖 − 𝛼𝑖∗ ) = 0
𝑖=1
0 ≤ 𝛼𝑖 , 𝛼𝑖∗ ≤ 𝐶. (3.19)
Solusi optimal diperoleh dari kendala (3.15) yang merupakan estimasi
parameter w dalam bentuk koefisien lagrange 𝛼𝑖 dan 𝛼𝑖∗ yang dapat ditulis
kembali sebagai
𝑛
𝐰 = ∑(𝛼𝑖 − 𝛼𝑖∗ ) 𝐱 𝑖 (3.20)

𝑖=1
sehingga fungsi regresi pada persamaan (3.10) dapat dituliskan sebagai berikut
𝑛
𝑓 (𝐱 𝑖 ) = ∑(𝛼𝑖 − 𝛼𝑖∗ ) (𝐱 𝑖 , 𝐱) + 𝑏 (3.21)

𝑖=1
Pada persamaan (3.20), 𝐰 digambarkan sebagai kombinasi linear dari data
training 𝐱 𝑖 atau disebut sebagai ekspansi support vector. Hal ini berarti bahwa
untuk membentuk fungsi regresi tidak tergantung pada data 𝐱 𝑖 di input space
tetapi tergantung pada jumlah support vector. Support vector pada SVR
merupakan data training yang berada tepat pada 𝜀-tube atau berada di luar 𝜀-tube
dengan nilai 𝛼𝑖 , 𝛼𝑖∗ > 0 (Smola dan Scholkopf , 2004)
Menurut Smola dan Scholkopf (2004), solusi optimal untuk bias (b) dapat
dihitung menggunakan kondisi KKT (Karush-Kuhn-Tucker). KKT adalah kondisi
yang menyatakan bahwa solusi yang diperoleh adalah optimal atau pada solusi
47
tersebut variabel dan kendala dari bentuk dualitas lagrange bertemu. Untuk
estimasi 𝑏 diperoleh menggunakan kondisi KKT sebagai berikut
𝛼𝑖 (𝜀 + 𝜉𝑖 − 𝑦𝑖 + 𝑓(𝐱 𝑖 )) = 0 (3.22)
𝛼𝑖∗ (𝜀 + 𝜉𝑖∗ + 𝑦𝑖 − 𝑓(𝐱 𝑖 )) = 0 (3.23)
(𝐶 − 𝛼𝑖 )𝜉𝑖 = 0 (3.24)
(𝐶 − 𝛼𝑖∗ )𝜉𝑖∗ = 0 (3.25)
Dari Persamaan (3.24) dan (3.25), nilai (𝐶 − 𝛼𝑖 ), (𝐶 − 𝛼𝑖∗ ) > 0 didapat saat
𝜉𝑖, 𝜉𝑖∗ = 0. Saat (𝐶 − 𝛼𝑖 ), (𝐶 − 𝛼𝑖∗ ) > 0, batasan awal nilai 𝛼𝑖 dan 𝛼𝑖∗ dari
persamaan (3.17) dan (3.18) berubah menjadi 𝛼𝑖 , 𝛼𝑖∗ < 𝐶. Sementara itu dari
persamaan (3.22) dan (3.23), 𝛼𝑖 , 𝛼𝑖∗ > 0 saat 𝜀 + 𝜉𝑖 − 𝑦𝑖 + 𝑓(𝐱 𝑖 ) dan 𝜀 + 𝜉𝑖∗ +
𝑦𝑖 − 𝑓 (𝐱 𝑖 ) bernilai sama dengan nol. Sehingga didapat batasan nilai 𝛼𝑖 , 𝛼𝑖∗
menjadi 0 < 𝛼𝑖 < 𝐶 dan 0 < 𝛼𝑖∗ < 𝐶. Pada saat nilai 𝛼𝑖 dan 𝛼𝑖∗ berada dalam
rentang ini, maka nilai 𝜉𝑖 dan 𝜉𝑖∗ akan sama dengan nol, sehingga Persamaan
(3.22) dan (3.23) dapat ditulis kembali menjadi
𝜀 − 𝑦𝑖 + 𝑓 (𝐱 𝑖 ) = 0 untuk 0 ≤ 𝛼𝑖 ≤ 𝐶 (3.26)
𝜀 + 𝑦𝑖 − 𝑓 (𝐱 𝑖 ) = 0 untuk 0 ≤ 𝛼𝑖∗ ≤ 𝐶 (3.27)
Misalkan terdapat data 𝐱 𝑖 sebagai data input sehingga persamaan regresi
SVR untuk data 𝐱 𝑖 dituliskan sabagai
𝑓 (𝐱 𝑖 ) = 𝐰. 𝐱 𝑖 + 𝑏 (3.28)
Nilai estimasi dari b diperoleh dengan mensubstitusikan persamaan (3.28)
ke dalam persamaan (3.26) dan persamaan (3.27), sehingga diperoleh
𝑏 = 𝑦𝑖 − 𝐰. 𝐱 𝑖 − 𝜀 untuk 0 ≤ 𝛼𝑖 ≤ 𝐶
dan
48
𝑏 = 𝑦𝑖 − 𝐰. 𝐱 𝑖 + 𝜀 untuk 0 ≤ 𝛼𝑖∗ ≤ 𝐶
3.4.2. Support Vector Regression (SVR) untuk Kasus Nonlinear
Pada umumnya data dalam dunia nyata jarang yang bersifat linear
separable, kebanyakan bersifat nonlinear. SVR untuk kasus nonlinear
memberikan pendekatan alternatif dengan cara melakukan pemetaan data x dari
input space ke feature space dengan dimensi yang lebih tinggi melalui suatu
fungsi 𝜑 sehingga φ: 𝐱 ⟼ 𝜑(𝐱) (Santosa, 2007). Sehingga fungsi regresi SVR
nonlinear dituliskan sebagai

𝑛
𝑓(𝐱 𝑖 ) = ∑(𝛼𝑖 − 𝛼𝑖∗ )𝜑(𝐱 𝑖 ). 𝜑(𝐱) + 𝑏 (3.29)

𝑖=1
Akan tetapi, kesulitan dalam pemetaannya adalah bahwa transformasi 𝜑
pada umumnya tidak diketahui dan sulit dipahami. Menurut Vapnik (1995),
masalah ini dapat diatasi dengan kernel trick yaitu perkalian skalar (dot product)
𝜑(𝐱 𝑖 ). 𝜑(𝐱) dalam feature space dapat digantikan dengan fungsi kernel
𝐾(𝐱 𝑖 , 𝐱) = 𝜑(𝐱 𝑖 ). 𝜑(𝐱)
dengan fungsi kernel tersebut mampu mendefinisikan secara implisit transformasi
𝜑. Menurut Nomleni (2015) dalam Pratama (2018), dengan mengetahui fungsi
kernel maka support vector bisa ditentukan tanpa perlu mengetahui wujud fungsi
nonlinear 𝜑. Sehingga fungsi regresi pada persamaan (3.29) dituliskan menjadi

𝑛
𝑓 (𝐱 𝑖 ) = ∑(𝛼𝑖 − 𝛼𝑖∗ ) 𝐾(𝐱 𝑖 , 𝐱) + 𝑏

𝑖=1
49
Perbedaan utama antara kasus linear dan nonlinear adalah bahwa dalam kasus
nonlinear, 𝐰 tidak diberikan secara eksplisit lagi. Selain itu, dalam kasus
nonlinear, masalah optimasi menemukan fungsi setipis mungkin dalam feature
space, tidak di input space (Smola dan Scholkopf, 2004).
Jenis fungsi kernel mempengaruhi parameter kernel SVR. Fungsi kernel
harus diatur dengan benar karena dapat mempengaruhi akurasi regresi. Parameter
yang tidak tepat dapat menyebabkan untuk overfitting atau underfitting. Dalam
penelitian ini, kernel yang digunakan pada model SVR adalah kernel Radial Basis
Function (RBF) yaitu
𝐾(𝐱 𝑖 , 𝐱) = 𝑒𝑥𝑝(−𝛾 ‖𝐱 𝑖 − 𝐱‖2 )
Sehingga fungsi regresi SVR nonlinear dengan kernel RBF adalah sebagai berikut
𝑛
𝑓(𝐱 𝑖 ) = ∑(𝛼𝑖 − 𝛼𝑖∗ ) 𝑒𝑥𝑝(−𝛾‖𝐱 𝑖 − 𝐱‖2 ) + 𝑏

𝑖=1
dengan 𝛾 > 0. SVR dengan fungsi kernel RBF memiliki tiga parameter yang
harus ditentukan yaitu C (cost), 𝛾 (gamma) dan 𝜀 (epsilon). Permasalahan yang
sering dihadapi SVR menggunakan fungsi kernel adalah menentukan parameter
yang optimal untuk menghasilkan model terbaik. Metode yang digunakan untuk
mencari parameter optimal pada penelitian ini adalah metode grid search.
3.4.3. Metode Grid Search
Secara umum, grid search merupakan kombinasi parameter yang diujikan
pada suatu model SVM untuk mencari nilai error dalam klasifikasi (Hsu et al.,
2016). Tujuannya adalah mengidentifikasi parameter optimal dalam data training,
50
sehingga model tersebut mampu secara akurat memprediksi data testing. Salah
satu pendekatan dalam grid search adalah prosedur cross validation. Prosedur
cross validation adalah membagi secara acak data training menjadi n subset yang
berukuran sama. Satu subset digunakan sebagai data testing dan n-1 subset
digunakan sebagai data training (Santosa, 2007).
Terdapat beberapa model dalam cross validation, pada penelitian ini akan
digunakan metode 10-fold cross validation. Pada 10-fold cross validation data
training set dipartisi secara acak menjadi 10 subset berukuran sama. Pada subset
1, subset 1 digunakan sebagai data testing dan sisanya (9 subset) digunakan
sebagai data training. Proses validasi silang dilakukan sebanyak 10 kali. Hasil
dari setiap proses validasi kemudian dirata-ratakan untuk mendapatkan nilai error
klasifikasi tunggal. Keuntungan dari metode ini adalah setiap data pada penelitian
ini digunakan baik untuk validasi dan training tepat satu kali pada setiap proses
validasi.
Proses untuk melakukan grid search secara lengkap memerlukan waktu
yang sangat lama sehingga Hsu et al. (2016), menyarankan untuk melakukakan
grid search dengan dua tahap yaitu loose grid dan finer grid. Loose grid adalah
tahapan dimana pemilihan nilai C dan 𝛾 dengan pangkat bilangan bulat,
sedangkan finer grid adalah tahapan selanjutnya dari loose grid dimana saat
didapat nilai C dan 𝛾 dengan error terendah, maka finer grid menggunakan nilai
di sekitaran C dan 𝛾 tersebut. Sejalan dengan hal tersebut, pada penelitian ini akan
digunakan grid search dengan dua tahapan yaitu loose grid dan finer grid untuk
menemukan nilai parameter optimal.
51
3.5. Model Hybrid SARIMA-SVR
Model SARIMA maupun SVR telah memperoleh kesuksesan pada ruang
lingkup linear maupun nonlinear masing-masing. Akan tetapi, tidak satupun dari
model tersebut yang merupakan model universal yang sesuai untuk setiap kondisi
data. Sering ditemukan kesulitan dalam penerapan model pada kasus data deret
waktu yang mengandung pola linear dan nonlinear sekaligus, sehingga kombinasi
model SARIMA dan SVR dapat menjadi alternatif permasalahan tersebut.
Kombinasi model ini mengeksploitasi keunggulan dari masing-masing model
SARIMA maupun SVR untuk menangkap karakteristik pola linear maupun
nonlinear.
Model hybrid SARIMA-SVR merupakan kombinasi model SARIMA dan
model SVR. Dalam model hybrid ini, data deret waktu diasumsikan terdiri dari
komponen linear dan koponen linear. Menurut Zhang (2003), secara umum model
data deret waktu yang merupakan kombinasi komponen linear dan nonlinear
secara sistematis dituliskan sabagai
𝑍𝑡 = 𝐿𝑡 + 𝑁𝑡
dengan 𝑍𝑡 merupakan data deret waktu pada waktu ke-t, 𝐿𝑡 merupakan komponen
linear waktu ke-t dan 𝑁𝑡 merupakan komponen nonlinear waktu ke-t.
Tahap pertama dalam membentuk model hybrid SARIMA-SVR adalah
membentuk komponen linear. Komponen linear dimodelkan dengan
menggunakan model SARIMA dengan input data yang digunakan merupakan
input data deret waktu asli. Hasil estimasi dari model SARIMA selanjutnya
disebut sebagai komponen linear. Kemudian residual dari model SARIMA
52
diasumsikan mengandung hubungan nonlinier. Residual dari model komponen
linear menggunakan model SARIMA dituliskan sebagai
𝜀𝑡 = 𝑍𝑡 − 𝐿̂𝑡
dengan 𝜀𝑡 merupakan residual model SARIMA waktu ke-t dan 𝐿̂𝑡 merupakan
komponen linear waktu ke-t hasil ramalan dari model SARIMA..
Setelah komponen linear terbentuk, langkah selanjutnya adalah membentuk
komponen nonlinear. Komponen nonlinear dimodelkan menggunakan model SVR
dengan input data merupakan residual dari model SARIMA. Model SVR dari
residual SARIMA dituliskan sebagai
𝜀𝑡 = 𝑓(𝜀𝑡−1 , 𝜀𝑡−2 , … , 𝜀𝑡−𝑛 ) + 𝑟𝑡 (3.30)
dengan n merupakan jumlah lag berpengaruh, f merupakan fungsi nonlinear yang
ditentukan oleh SVR dan 𝑟𝑡 merupakan residual model SVR pada waktu ke-t.
Selanjutnya 𝜀𝑡 menjadi komponen nonlinear waktu ke-t. Sehingga model hybrid
SARIMA-SVR dapat dinyatakan sebagai
𝑍̂𝑡 = 𝐿̂𝑡 + 𝑁
̂𝑡
dengan 𝑍̂𝑡 merupakan model peramalan hybrid SARIMA-SVR, 𝐿̂𝑡 merupakan
̂𝑡 komponen
komponen linear waktu ke-t hasil ramalan dari model SARIMA dan 𝑁
nonlinear waktu ke-t hasil peramalan 𝜀̂𝑡 pada persamaan (3.30).
3.6. Kriteria Pemilihan Model Terbaik
Pemilihan model terbaik pada penelitian ini menggunakan nilai Mean
Absolute Percentage Error (MAPE). MAPE merupakan gambaran ukuran
ketepatan estimasi model maupun ramalan. Nilai MAPE pada data training
53
digunakan untuk melihat ketepatan estimasi model sedangkan nilai MAPE pada
data testing menggambarkan ketepatan ramalan model. MAPE dihitung dengan
membagi persentase dari rata-rata harga mutlak residual pada tiap periode dengan
nilai aktual. Menurut Wei (2006), MAPE dirumuskan sebagai

𝑛
1 𝑍𝑡 − 𝑍̂𝑡
𝑀𝐴𝑃𝐸 = ∑ | | × 100%
𝑛 𝑍𝑡
𝑡=1
dengan 𝑍𝑡 adalah nilai observasi pada waktu ke-t, 𝑍̂𝑡 adalah nilai peramalan pada
waku ke-t dan n adalah banyaknya observasi. Model yang baik memiliki nilai
MAPE sesuai kriteria pada Tabel 3.1 (Chang, et al dalam Qomariyah, 2017).
Tabel 3.1 Kriteria MAPE
Nilai MAPE (%) Kriteria

< 10 Kemampuan peramalan sangat baik
10 – 20 Kemampuan peramalan baik
20 – 50 Kemampuan peramalan cukup
> 50 Kemampuan peramalan buruk
Sumber: Chang, Wang dan Liu dalam Qomariyah, 2017.
3.7. Tahapan Penelitian
Tahap awal dalam penelitian ini melakukan uji linearitas menggunakan uji
ramsey RESET. Data yang dikehendaki dalam peneltian ini adalah data yang
memiliki pola linear dan nonlinear sekaligus. Tahapan selanjutnya adalah
penentuan jumlah data training yang akan digunakan sebagai in sample dan
penentuan jumlah data testing sebagai out sample pada data harga gabah. Dasar
pembagian data ini berdasarkan kriteria Woschnagg dan Cipan (2004) bahwa
54
untuk data testing dapat sejumlah 10 persen dari total keseluruhan data.
Berdasarkan kriteria tersebut, sampel yang digunakan sejumlah 129 data (Januari
2009 - September 2019) dibagi menjadi dua bagian, yaitu sebanyak 116 data
training (Januari 2009 - Agustus 2018) dan 13 data testing (September 2018-
September 2019).
Tahapan penelitian untuk memperoleh model hybrid SARIMA-SVR adalah
sebagai berikut
1) Melakukan identifikasi pola data dengan plot deret waktu.
2) Malakukan pemeriksaan kestasioneran data. Jika data tidak stasioner dalam
rata-rata maka dilakukan differencing.
3) Melakukan identifikasi pola musiman pada data menggunakan regresi
spektral.
4) Identifikasi model SARIMA.
5) Estimasi parameter model SARIMA menggunakan metode Maximum
Likelihood Estimation (MLE).
6) Melakukan uji signifikansi parameter SARIMA.
7) Melakukan pemeriksaan diagnostik model SARIMA.
8) Melakukan pemilihan model SARIMA terbaik menggunakan kriteria MAPE.
9) Melakukan perhitungan residual model SARIMA terbaik.
10) Menggunakan residual SARIMA terbaik untuk input data SVR, diawali
dengan menentukan banyaknya time lag.
11) Menentukan fungsi kernel yang digunakan yaitu kernel Radial Basis
Function (RBF).
55
12) Menentukan rentang nilai parameter 𝐶, 𝛾 dan 𝜀
13) Menentukan nilai optimal parameter 𝐶, 𝛾 dan 𝜀 menggunakan metode grid
search dengan tahapan loose grid.
14) Menentukan nilai optimal parameter 𝐶, 𝛾 dan 𝜀 menggunakan metode grid
search dengan tahapan finer grid
15) Memperoleh nilai optimal dari parameter untuk model SVR sehingga didapat
model SVR untuk residual SARIMA.
16) Menggabungkan model pada langkah (8) dan (15) sehingga diperoleh model
hybrid SARIMA-SVR.
17) Melakukan validasi model SARIMA-SVR untuk mengukur ketepatan model
dan peramalan dengan menggunakan kriteria MAPE pada data training dan
testing.
18) Melakukan peramalan harga gabah menggunakan model hybrid SARIMA-
SVR.
56
Mulai
Data Training Data Testing
Plot Data
Model SARIMA
Ya Tidak Terbaik
ARIMA Stasioner ? Differencing
Residual Model
SARIMA Terbaik
Tidak
Musiman ?
Penentuan Banyaknya
Time Lag Residual
SARIMA
Ya
Identifikasi Model SARIMA
Penentuan Kernel
RBF
Estimasi Parameter SARIMA
Penentuan Rentang
Uji Parameter (𝐶, 𝛾 dan 𝜀)
Signifikansi Tidak
Parameter
Metode Grid Search
Ya Tahapan Loose Grid
Uji
Diagnostik Metode Grid Search
Tidak Tahapan Finer Grid
Ya
Pemilihan Model Model SVR
SARIMA Terbaik Terbaik
Model Hybrid Evaluasi Model

SARIMA-SVR Berdasarkan MAPE
Peramalan Harga
Gabah
Selesai
Gambar 3.2 Diagram Alur Penelitian
57
BAB IV
HASIL DAN PEMBAHASAN
Dalam bab ini akan dijelaskan analisis dan hasil pemodelan hybrid
SARIMA-SVR serta peramalan harga gabah. Hasil pemodelan tersebut akan
diukur ketepatan pemodelannya dengan menggunakan nilai MAPE pada data
training, sedangkan untuk mengukur ketepatan peramalannya digunakan nilai
MAPE pada data testing.
4.1. Analisis Deskriptif Data Harga Gabah
Penelitian ini menggunakan data harga gabah pada periode Januari 2009
sampai September 2019 (129 Data). Data harga gabah pada periode Januari 2009
sampai Agustus 2018 (116 Data) digunakan sebagai data training sedangkan data
pada periode September 2018 sampai September 2019 (13 Data) digunakan
sebagai data testing. Hasil analisis deskriptif data harga gabah pada periode
Januari 2009 sampai September 2019 dapat dilihat pada Tabel 4.1.
Tabel 4.1 Statistik Deskriptif Data Harga Gabah
Data Rata-rata Minimum Maksimum

Harga Gabah 4.665,38 2.638,09 6.001,87
Berdasarkan Tabel 4.1 dapat ditunjukkan bahwa nilai rata-rata harga gabah
periode Januari 2009 sampai dengan September 2019 adalah 4.665,38 rupiah.
Selanjutnya, harga gabah tertinggi adalah pada Januari 2018 yaitu sebesar
6.001,87 rupiah. Sedangkan harga gabah terendah adalah pada April 2009 yaitu
58
sebesar 2.638,09 rupiah. Data harga gabah secara lengkap dapat dilihat pada
Lampiran 1.
Harga gabah minimum sebesar 2.638,09 rupiah dan maksimum sebesar
6.001,87 menunjukkan rentang harga gabah selama Januari 2009 sampai
September 2019 mengalami kenaikan yang cukup signifikan. Dengan harga rata-
rata gabah sebesar 4.665,38 rupiah diindikasikan bahwa data harga gabah tidak
stasioner dalam rata-rata. Untuk membuktikan hal tersebut, maka dilakukan uji
stasioneritas data harga gabah.
4.2. Pengujian Linearitas
Pengujian linearitas data harga gabah pada penelitian ini adalah
menggunakan uji Ramsey RESET dengan statistik uji mengikuti persamaan (2.4).
Hasil uji Ramsey RESET pada data harga gabah selama periode Januari 2009
sampai dengan Agustus 2018 disajikan pada Tabel 4.2.
Tabel 4.2 Uji Ramsey RESET Pada Data Harga Gabah
Data Statistik Uji (RESET) p-value

Harga Gabah 267,2 2,2e-16
Berdasarkan Tabel 4.2 menunjukkan bahwa nilai statistik uji Ramsey RESET
yang lebih besar dari F(0,05;1;113) = 3,9251 atau nilai p-value yang lebih kecil dari
𝛼 = 5 % maka dapat disimpulkan 𝐻0 ditolak yang berarti bahwa data harga gabah
mengandung pola nonlinear. Pengujian Ramsey RESET dapat dilihat pada
Lampiran 2.
59
4.3. Identifikasi Plot Data Harga Gabah
Langkah awal dalam analisis deret waktu adalah dengan membuat plot data
secara visual. Plot data deret waktu mengenai pergerakan harga gabah dari
periode Januari 2009 sampai dengan Agustus 2018 dapat dilihat pada Gambar 4.1.
Plot Data Harga Gabah

6000
5000 5500
Harga Gabah (Rupiah)
3000 3500 4000 4500
0 20 40 60 80 100 120
Bulan (Januari 2009 - Agustus 2018)
Gambar 4.1 Plot Data Harga Gabah Januari 2009 – Agustus 2018
Berdasarkan Gambar 4.1 dapat ditunjukkan bahwa pergerakan harga gabah
pada Januari 2009 sampai Agustus 2018 menunjukkan pola tren naik dan juga
terjadi fluktuasi harga gabah. Fenomena ini mengindikasikan bahwa harga gabah
sepanjang Januari 2009 sampai Agustus 2018 cenderung terus meningkat serta
terjadi kenaikan dan penurunan harga setiap tahun. Fluktuasi harga tersebut
diduga disebabkan oleh adanya adanya efek musiman seperti musim panen yang
bersamaan sebagai akibat dari musim tanam yang hampir bersamaan. Sehingga,
60
akan dilakukan pengujian stasioneritas dan identifikasi pola musiman pada data
harga gabah.
4.4. Stasioneritas Data
Syarat yang harus dipenuhi sebelum melakukan analisis data deret waktu
adalah kestasioneran data. Dalam penelitian ini dilakukan uji stasioneritas data
menggunakan uji Augmented Dickey Fuller (ADF) untuk data harga gabah. Hasil
uji ADF pada data harga gabah disajikan pada Tabel 4.3.
Tabel 4.3 Uji ADF Data Harga Gabah Sebelum dan Sesudah Differencing
Sebelum Differencing Sesudah Differencing Pertama

Data
p-value Kesimpulan p-value Kesimpulan
Harga Gabah 0,6495 Data Tidak Stasioner 0,01 Data Stasioner
Berdasarkan Tabel 4.3, hasil uji ADF pada data harga gabah menunjukkan
nilai p-value lebih besar dari 𝛼 = 5 %, sehingga 𝐻0 diterima sehingga dapat
disimpulkan data harga gabah tidak stasioner. Oleh karena itu, salah satu cara
yang dilakukan untuk membuat data stasioner adalah dengan differencing. Setelah
differencing orde satu, hasil uji ADF pada data harga gabah hasil differencing
pertama memiliki p-value lebih kecil dari 𝛼 = 5 %, sehingga 𝐻0 ditolak sehingga
dapat disimpulkan data harga gabah sudah stasioner.
4.5. Identifikasi Pola Musiman
Identifikasi pola musiman pada data deret waktu dapat dilakukan
menggunakan metode regresi spektral dengan statistik uji mengikuti persamaan
61
(2.8). Selain untuk melihat ada tidaknya pola musiman pada data deret waktu,
regresi spektral juga digunakan untuk menentukan periode dari musiman. Hasil
pengujian efek musiman pada data harga gabah dengan menggunakan regresi
spektral dapat dilihat pada Tabel 4.4.
Tabel 4.4 Identifikasi Pola Musiman Pada Data Harga Gabah Menggunakan
Regresi Spektral
Data Statistik Uji (T) gα Kesimpulan

Harga Gabah 0,2043092 0,13135 Terdapat Pola Musiman
Berdasarkan Tabel 4.4, hasil identifikasi pola musiman pada data harga
gabah menunjukkan nilai statistik uji regresi spektral 𝑇 = 0,2043092 yang lebih
besar dari g 𝛼 = 0,13135, sehingga 𝐻0 ditolak, artinya data harga gabah
mengandung pola musiman atau dipengaruhi oleh faktor musiman. Selanjutnya,
mengunakan regresi spektral juga diperoleh bahwa data harga gabah mempunyai
nilai periodesitas musiman 6,052632. Artinya data harga gabah mempunyai pola
musiman berulang dengan periode ulangan setiap 6 bulan. Hasil lengkap
perhitungan identifikasi pola musiman deret waktu dengan menggunakan regresi
spektral disajikan pada Lampiran 3.
4.6. Peramalan Harga Gabah Menggunakan Model SARIMA
4.6.1. Identifikasi Model SARIMA
Identifikasi model deret waktu dilakukan untuk menentukan orde waktu
untuk model SARIMA yang akan dibangun. Identifikasi awal orde waktu pada
62
penelitian ini dilakukan berdasarkan plot ACF dan PACF yang dibangun
berdasarkan persamaan (3.1) dan persamaan (3.2) dengan menggunakan data
training yang sudah stasioner. Berdasarkan pengujian stasioneritas data harga
gabah merupakan data yang tidak stasioner sehingga perlu dilakukan differencing
pertama. Plot ACF dan PACF data asli dan data hasil differencing pertama
terdapat pada Lampiran 4. Selain itu, identifikasi pola musiman pada data harga
gabah menunjukkan bahwa data harga gabah mengandung pola musiman dengan
periode 6 sehingga dilakukan differencing musiman pertama lag 6. Grafik ACF
dan PACF data harga gabah setelah dilakukan diferencing pertama dan
differencing musiman lag 6 dapat dilihat pada Gambar 4.2.
Series GABAHmus.diff1 Series GABAHmus.diff1

0.2
1.0
0.0
0.5
Partial ACF
-0.2
ACF
0.0
-0.4
-0.6
-0.5
0 10 20 30 40 50 0 10 20 30 40 50
Lag Lag
Gambar 4.2 Plot ACF dan PACF Data Harga Gabah Diferencing Pertama
dan Diferencing Musiman lag 6
Selanjutnya akan dilakukan identifikasi dari model yang tepat untuk
menggambarkan data hasil diferencing pertama dan diferencing musiman lag 6
menggunakan plot ACF dan PACF pada Gambar 4.2. Berdasarkan Gambar 4.2
63
terlihat bahwa ACF maupun PACF signifikan pada lag 6 sehingga ditetapkan
model sementara adalah SARIMA(0,1,0)(1,1,1)6.
4.6.2. Estimasi Parameter Model SARIMA
Tahap selanjutnya setelah diperoleh model SARIMA sementara adalah
melakukan estimasi parameter model SARIMA yang mungkin untuk
menggambarkan sifat data. Menurut prinsip parsimony dari pemodelan (model
yang baik adalah model yang memiliki parameter yang sedikit) dapat digunakan
beberapa alternatif selain model SARIMA(0,1,0)(1,1,1)6 seperti terdapat pada
Lampiran 6.
Tabel 4.5. Hasil Uji Parsial Model SARIMA
Estimasi Standar
No Model Parameter t-hitung Kesimpulan
Parameter Error
SARIMA AR Musiman (1) -0,5437 0,1205 -4,51 Signifikan
1
(0,1,0)(1,1,1)6 MA Musiman (1) -0,7558 0,1771 -4,27 Signifikan
AR (1) -0,6121 0,2151 -2,85 Signifikan
AR (2) -0,2463 0,0964 -2,56 Signifikan
SARIMA
2 MA(1) 0,5148 0,2111 2,44 Signifikan
(2,1,1)(1,1,1)6
AR Musiman (1) -0,5459 0,1068 -5,11 Signifikan
MA Musiman (1) -0,8073 0,1361 -5,93 Signifikan
AR (1) -0,9564 0,1332 -7,18 Signifikan
AR(2) -0,8367 0,1747 -4,79 Signifikan
SARIMA MA(1) 0,8581 0,1845 4,65 Signifikan
3
(2,1,2)(1,1,1)6 MA(2) 0,6319 0,2256 2,80 Signifikan
AR Musiman (1) -0,5781 0,0933 -6,20 Signifikan
MA Musiman (1) -0,9152 0,1572 -5,82 Signifikan
64
Berdasarkan Lampiran 6 terdapat sembilan kemungkinan model SARIMA.
Berdasarkan nilai t-hitung masing-masing parameter model SARIMA dan
menggunakan nilai t-tabel sebesar 1,98 maka dari sembilan kemungkinan model
SARIMA hanya tiga model yang memiliki hasil uji parsial semua parameternya
signifikan yaitu model SARIMA(0,1,0)(1,1,1)6, SARIMA(2,1,1)(1,1,1)6 dan
SARIMA(2,1,2)(1,1,1)6. Hasil uji parsial ketiga model tersebut dapat dilihat pada
Tabel 4.5. Tahap selanjutnya dilakukan uji diagnostik dari ketiga model tersebut
dengan melakukan uji residual white noise dan uji residual normal untuk
mendapatkan model terbaik yang dapat menggambarkan karakteristik data secara
keseluruhan.
4.6.3. Pengujian Diagnostik dan Pemilihan Model SARIMA Terbaik
Pengujian diagnostik model merupakan pemeriksaan apakah asumsi dasar
model deret waktu sudah terpenuhi. Dalam penelitian ini, uji asumsi yang
dilakukan adalah uji residual white noise dengan statistik uji menggunakan
persamaan (3.8). Hasil pengujian residual white noise dari model SARIMA yang
memungkinkan ditunjukkan pada Tabel 4.6.
Hasil uji asumsi white noise pada Tabel 4.6 menunjukkan bahwa pada
model SARIMA(2,1,1)(1,1,1)6 dan SARIMA(2,1,2)(1,1,1)6 nilai uji Portmanteau
untuk setiap lag mempunyai nilai p-value lebih besar dari 𝛼 = 5 %, maka dapat
disimpulkan 𝐻0 diterima yang berarti bahwa tidak ada korelasi antar residual
sehingga asumsi white noise pada residual model SARIMA(2,1,1)(1,1,1)6 dan
SARIMA(2,1,2)(1,1,1)6 telah terpenuhi. Sedangkan pada model SARIMA(0,1,0)
(1,1,1)6 pada nilai uji Portmanteau terdapat lag yang mempunyai nilai p-value
65
lebih kecil dari 𝛼 = 5 %, maka dapat disimpulkan 𝐻0 ditolak yang berarti bahwa
terdapat korelasi antar residual sehingga asumsi residual white noise pada model
SARIMA(0,1,0) (1,1,1)6 tidak terpenuhi.
Tabel 4.6 Pengujian Asumsi Residual White Noise
MODEL
Lag SARIMA(0,1,0)(1,1,1)6 SARIMA(2,1,1)(1,1,1)6 SARIMA(2,1,2)(1,1,1)6
Statistik p-value Statistik p-value Statistik p-value
1 1,2597 0,2617 0,0052 0,9426 4,5681e-04 0,9829
3 7,4340 0,0593 0,0747 0,9947 0,31323 0,9575
5 11,5021 0,0423 3,1163 0,6821 1,2217 0,9428
7 14,2707 0,0466 5,4803 0,6016 2,3129 0,9405
9 14,6142 0,1021 5,8340 0,7564 3,1758 0,9569
… … … … … … …
59 82,0763 0,0252 58,8144 0,4823 46,1963 0,8876
60 82,1183 0,0305 58,8630 0,5173 46,4685 0,8998
Selain asumsi white noise, dilakukan pengujian asumsi residual normal
menggunakan uji Kolmogorov Smirnov dengan statistik uji pada persamaan (3.9).
Hasil uji asumsi residual normal dengan uji Kolmogorov Smirnov menunjukkan
bahwa nilai p-value untuk model SARIMA(0,1,0)(1,1,1)6, SARIMA(2,1,1)
(1,1,1)6 dan SARIMA(2,1,2)(1,1,1)6 masing-masing sebesar 2,2e-16 atau lebih
kecil dari 𝛼 = 5 %. Hal ini berarti bahwa 𝐻0 ditolak sehingga dapat disimpulkan
bahwa residual model SARIMA(0,1,0)(1,1,1)6, SARIMA(2,1,1)(1,1,1)6 dan
SARIMA(2,1,2) (1,1,1)6 tidak memenuhi asumsi residual normal. Dalam
beberapa literatur, dalam pemodelan ARIMA atau SARIMA asumsi residual
66
berdistribusi normal dapat diabaikan. Secara lengkap, hasil pengujian diagnostik
model SARIMA dapat dilihat pada Tabel 4.7.
Tabel 4.7 Pengujian Diagnostik Model SARIMA
Uji White Uji Kenormalan

No Model MAPE
Noise Residual
Tidak White Residual Tidak
1 SARIMA(0,1,0)(1,1,1)6 2,0971
Noise Normal
Residual Tidak
2 SARIMA(2,1,1)(1,1,1)6 White Noise 2,0880
Normal
Residual Tidak
3 SARIMA(2,1,2)(1,1,1)6 White Noise 2,0117
Normal
Pemilihan model SARIMA terbaik dapat dilakukan dengan melihat nilai
MAPE pada model SARIMA(2,1,1)(1,1,1)6 dan SARIMA(2,1,2)(1,1,1)6. Hasil
perhitungan MAPE dari model SARIMA(2,1,1)(1,1,1)6 dan SARIMA(2,1,2)
(1,1,1)6 masing-masing 2,0880 dan 2,0117. Sehingga dapat disimpulkan bahwa
model SARIMA terbaik yang diperoleh adalah SARIMA(2,1,2)(1,1,1)6. Model
SARIMA (2,1,2)(1,1,1)6 ini digunakan untuk melakukan peramalan harga gabah.
Hasil peramalan harga gabah menngunakan model SARIMA(2,1,2)(1,1,1)6
merupakan komponen linear dari model hybrid SARIMA-SVR. Setelah diperoleh
model SARIMA terbaik dan komponen linear, langkah selanjutnya adalah
melakukan perhitungan residual model SARIMA(2,1,2) (1,1,1)6.
4.7. Peramalan Residual SARIMA Terbaik Menggunakan Model SVR
Residual dari model SARIMA(2,1,2)(1,1,1)6 digunakan untuk input data
pada model SVR Residual SARIMA(2,1,2)(1,1,1)6 tersebut diasumsikan berisi
hubungan nonlinear sehingga dimodelkan menggunakan SVR dengan fungsi
67
kernel. Sebelum masuk ke pemodelan menggunakan SVR, langkah pertama yang
dilakukan adalah mengkonversikan residual model SARIMA terbaik ke dalam
bentuk time lag yang nantinya sebagai data input dalam model SVR. Penentuan
banyaknya time lag sesuai penjelasan pada Subbab 3.4.
Penelitian ini menggunakan data deret waktu bulanan sehingga penentuan
banyak time lag adalah dengan melakukan percobaan (trial and error) yaitu
mencoba segala kemungkinan banyaknya time lag (antara 1 lag sampai 15 lag)
dan memilih jumlah time lag yang memberikan nilai error terkecil. Dari proses
trial and error seperti pada Lampiran 7, didapat nilai error terkecil adalah pada
input dua lag. Sehingga untuk memodelkan residual SARIMA(2,1,2)(1,1,1)6
digunakan SVR adalah dengan input data residual sebanyak dua lag.
Langkah awal dalam melakukan pemodelan dengan menggunakan SVR
untuk kasus nonlinear adalah menentukan fungsi kernel. Pada penelitian ini
dibatasi hanya menggunakan fungsi kernel Radial Basic Function (RBF). Pada
kernel RBF terdapat parameter 𝐶, 𝛾 dan 𝜀 yang harus ditentukan. Untuk
mendapatkan nilai parameter yang optimal maka pada penelitian ini digunakan
metode grid search menggunakan prosedur 10-fold cross validation dengan dua
tahapan yaitu loose grid dan finer grid.
Tahapan awal metode grid search adalah menentukan rentang nilai
parameter. Pada tahapan loose grid digunakan nilai parameter C dan 𝛾 dengan
pangkat bilangan bulat. Sedangkan nilai 𝜀 ditentukan terlebih dahulu. Pada
penelitian ini rentang nilai parameter yang digunakan pada metode grid search
tahapan loose grid dapat dilihat pada Tabel 4.8.
68
Tabel 4.8 Rentang Nilai Parameter Metode Grid Search Tahapan Loose Grid
Parameter Rentang Nilai

C 2−7 , 2−5 , … , 27
𝛾 2−7 , 2−5 , … , 27
𝜀 0,01; 0,02; … ; 0,1
Rentang nilai parameter pada Tabel 4.8 digunakan untuk proses penentuan
parameter model SVR. Melalui proses grid search pada tahapan loose grid
diperoleh nilai optimal dari parameter model SVR adalah 𝐶 = 2−1 , 𝛾 = 27 dan
𝜀 = 0,02. Setelah diperoleh parameter optimal model SVR pada tahapan loose
grid, maka langkah selanjutnya dilakukan grid search menggunakan metode grid
search tahapan finer grid. Finer grid merupakan tahapan grid search
menggunakan sekitaran nilai C, 𝛾 dan 𝜀 yang diperoleh pada tahapan loose grid.
Tabel 4.9. Rentang Nilai Parameter Metode Grid Search Tahapan Finer Grid
Parameter Rentang Nilai

C 2−1,75 , 2−1,5 , 2−1,25 , 2−1 , 2−0,75 , 2−0,5 , 2−0,25
𝛾 26,25 , 26,5 , 26,75 , 27
𝜀 0,02
Rentang nilai parameter yang digunakan pada tahapan finer grid dapat
dilihat pada Tabel 4.9. Melalui proses grid search pada tahapan finer grid
diperoleh nilai optimal dari parameter model SVR adalah 𝐶 = 2−1,25 , 𝛾 = 27 dan
𝜀 = 0,02. Nilai parameter yang diperoleh menggunakan metode grid search
tahapan finer grid merupakan parameter optimal yang digunakan pada model
SVR. Sehingga diperoleh model SVR terbaik adalah model SVR menggunakan
69
kernel Radial Basic Function (RBF) dengan nilai parameternya adalah 𝐶 =
2−1,25 , 𝛾 = 27 dan 𝜀 = 0,02.
Analisis yang dilakukan selanjutnya adalah melakukan peramalan residual
model SARIMA(2,1,2)(1,1,1)6 menggunakan model SVR dengan parameter
optimal. Hasil peramalan residual model SARIMA(2,1,2)(1,1,1)6 menggunakan
model SVR disebut sebagai komponen nonlinear dari model hybrid SARIMA-
SVR. Setelah diperoleh komponen nonlinear, langkah selanjutnya adalah
menggabungkan komponen linear dan komponen nonlinear sehingga sehingga
diperoleh model hybrid SARIMA-SVR.
4.8. Peramalan Harga Gabah Menggunakan Model Hybrid SARIMA-SVR
Tahapan analisis selanjutnya adalah mmbentuk model hybrid SARIMA-
SVR dengan menggabungkan komponen linear dan komponen nonlinear.
Komponen linear merupakan hasil peramalan model SARIMA terbaik sedangkan
komponen nonlinear merupakan hasil peramalan residual SARIMA terbaik
menggunakan model SVR terbaik. Pada penelitian ini diperoleh model hybrid
SARIMA-SVR merupakan kombinasi model SARIMA(2,1,2)(1,1,1,)6 dan model
SVR menggunakan kernel Radial Basic Function (RBF) dengan nilai
parameternya adalah 𝐶 = 2−1,25 , 𝛾 = 27 dan 𝜀 = 0,02.
Langkah selanjutnya adalah melihat sejauh mana akurasi atau ketepatan
model hybrid SARIMA-SVR untuk peramalan harga gabah dengan
membandingkan akurasi peramalan menggunakan model SARIMA sebagai tolak
ukur. Penentuan keakuratan model dan peramalan dilakukan dengan
70
membandingan nilai MAPE. Hasil perhitungan nilai MAPE pada data training
dan testing pada model SARIMA dan hybrid SARIMA-SVR dapat dilihat pada
Tabel 4.10.
Tabel 4.10. Perbandingan MAPE Model SARIMA dan Hybrid SARIMA-SVR

MAPE (%)
Model
Training Testing
SARIMA 2,0117 3,8635
Hybrid SARIMA-SVR 1,1976 3,6840
Tabel 4.10 menunjukkan bahwa nilai MAPE model hybrid SARIMA-SVR
lebih kecil dibandingkan nilai MAPE model SARIMA. Hal tersebut
menunjukkan bahwa hybrid SARIMA-SVR secara signifikan mampu
memberikan nilai peramalan yang lebih akurat dibandingkan model SARIMA.
Karenanya dalam peramalan harga gabah selama satu tahun kedepan (Oktober
2019 sampai September 2020) akan digunakan model hybrid SARIMA-SVR.
4.9. Peramalan Harga Gabah Pada Oktober 2019 – September 2020
Berdasarkan hasil yang didapat pada tahapan sebelumnya, terbukti bahwa
model hybrid SARIMA-SVR sudah tepat digunakan sebagai model untuk
meramalkan harga gabah pada Oktober 2019 – September 2020. Hasil peramalan
harga gabah pada Oktober 2019 – September 2020 yang dapat dilihat pada Tabel
4.11.
71
Tabel 4.11. Peramalan Harga Gabah Oktober 2019 – September 2020
Bulan Harga Gabah (Rupiah)

Oktober 2019 5.442,92
November 2019 5.602,15
Desember 2019 5.706,48
Januari 2020 5.785,50
Februari 2020 5.79121
Maret 2020 5.596,86
April 2020 5.400,77
Mei 2020 5.483,19
Juni 2020 5.574,99
Juli 2020 5.627,22
Agustus 2020 5.646,97
September 2020 5.609,77
72
BAB V
KESIMPULAN DAN SARAN
5.1. Kesimpulan
Model Hybrid Seasonal Autoregressive Integrated Moving Average
(SARIMA)-Support Vector Regression (SVR) merupakan pengembangan model
deret waktu univariat untuk data deret waktu yang tidak stasioner, terdapat pola
musimam dan memiliki pola data linear dan nonlinear sekaligus. Penelitian ini
menerapkan model hybrid SARIMA-SVR pada data harga gabah. Beberapa
kesimpulan yang dapat diperoleh dari penelitian ini adalah
1. Prosedur membangun model hybrid SARIMA-SVR dalam penelitian ini
didasarkan pada fenomena kondisi data deret waktu yang tidak stasioner dan
terdapat pola musiman, sehingga dilakukan proses differencing biasa dan
differencing musiman untuk memperoleh data yang stasioner. Selain itu,
data yang dianalisis dalam penelitian ini juga memiliki pola data yang linear
dan nonlinear sekaligus. Proses pemodelan hybrid SARIMA-SVR dalam
penelitian ini menggunakan model SARIMA untuk membentuk komponen
linear. Residual dari model SARIMA dijadikan input untuk model SVR.
Hasil pemodelan residual SARIMA menggunakan model SVR membentuk
komponen nonlinear. Model hybrid SARIMA-SVR merupakan kombinasi
dari komponen linear dan komponen linear tersebut.
2. Model hybrid SARIMA-SVR terbaik untuk peramalan data harga gabah
nasional adalah kombinasi model SARIMA(2,1,2)(1,1,1,)6 dan model SVR
73
menggunakan kernel RBF dengan nilai parameternya adalah 𝐶 =
2−1,25 , 𝛾 = 27 dan 𝜀 = 0,02. Model hybrid SARIMA-SVR ini dipilih
karena memiliki nilai peramalan yang lebih akurat dibandingkan dengan
model SARIMA dan model SVR, yang ditunjukkan dari nilai MAPE paling
minimum baik untuk data training maupun testing.
5.2. Saran
Berdasarkan hasil penelitian yang telah dilakukan, maka saran yang dapat
diberikan adalah
1. Model hybrid SARIMA-SVR adalah salah satu alternatif model yang dapat
digunakan untuk memodelkan data yang tidak stasioner, terdapat pola
musiman dan memiliki pola data linear dan nonlinear sekaligus. Penelitian
selanjutnya dapat digunakan model lain seperti model hybrid SARIMA-
ANFIS, hybrid SARIMA-GEP dan model alternatif lain dalam mengatasai
data yang tidak stasioner, terdapat pola musiman dan memiliki pola data
linear dan nonlinear sekaligus.
2. Model SVR pada penelitian ini menggunakan fungsi kernel RBF. Untuk
kepentingan penelitian ke depan, dapat menggunakan beberapa fungsi kernel
lain seperti kernel linear, polinomial atau sigmoid.
3. Penerapan model hybrid SARIMA-SVR pada penelitian ini adalah pada data
harga gabah yang merupakan data deret waktu bulanan. Untuk penelitian
selanjutnya perlu penerapan model hybrid SARIMA-SVR pada data deret
waktu harian dengan jumlah pengamatan selama lebih dari satu tahun.
74
DAFTAR PUSTAKA
Aguilar, J.J.R, Turias, I.J, Come, M.J.J and Cerbán, M.M. 2011. Hybrid
Approaches of Support Vector Regression and SARIMA Models to
Forecast the Inspections Volume. Intelligent Modelling of Systems
Research Group, University of Cádiz.
Alwee, R., Shamsuddin, S.M and Sallehuddin, R. 2013. Hybrid Support
Vector Regression and Autoregressive Integrated Moving Average
Models Improved by Particle Swarm Optimization for Property
Crime Rates Forecasting with Economic Indicators. The Scientific
World Journal Volume 2013.
Amalia. 2009. Peranan Persyaratan Karush-Kuhn-Tucker Dalam
Menyelesaikan Pemrograman Kuadratis. Skripsi. Medan:
Universitas Sumatera Utara.
Balkin, S.D., and Ord, J.K. 2000. Automatic neural network modeling for
univariate time series. International Journal of Forecasting, Vol. 16
: 509-515.
Bappenas. 2010. Rencana Pembangunan Jangka Menengah (RPJHMN)
2010-2014 (Peraturan Pemerintah Nomor 5 Tahun 2010).
Jakarta : Bappenas.
Boser, B.E., Guyon, I., and Vapnik, V. 1992. A Training Algorithm for
Optimal Margin Classifiers. Proceedings of the fifth annual
workshop on Computational learning theory (COLT) : 144-152.
Box, G.E., and Jenkins, G.M. 1976. Time Series Analysis Forecasting and
Control. California : Holden Day.
BPS. 2018. Statistik Harga Produsen Gabah di Indonesia. Jakarta: BPS.
Chatfield, C. 2004. The Analysis of Time Series An Indtroduction Sixth
Edition. United States of America : Chapman & Hall/CRC.
Chen, K. Y. dan Wang, C. H. 2007. A hybrid SARIMA and support vector
machines in forecasting the production values of the machinery
industry in Taiwan. Expert Systems with Applications 32, 254–264.
75
Cryer, J.D. 1986. Time Series Analysis. Boston : PWS-KENT Publishing
Company
Darmawan, G., Mulyani, S., dan Sudartianto. 2012. Pengujian Pola Musiman
Pada Data Deret Waktu Dengan Menggunakan Regresi Spektral.
Prosiding Seminar Nasional Statistika FMIPA Universitas
Padjajaran : 63-72.
Ding, Z. 2012. Application od Support Vector Machine Regression in Stock
Price Forecasting. Business, Economics, and Financial Sci.,
Manag., AISC 143, 359-365.
Haykin, S. 2009. Neural Networks and Learning Machines, Third Edition.
New Jersey : Pearson Education, Inc.
Hsu, C. W., Chang, C.C., and Lin, C.J. 2016. A Practical Guide to Support
Vector Classificaton. Taipei : Department of Computer Science
National Taiwan University.
Kim, T.H., Lee., Y.S., and Newbold, P. 2004. Spurious Nonlinear Regressions
in Econometrics. Nottingham: University of Nottingham.
Licker, M. D. 2003. Dictionary of Mathematics: Second Edition. New York :
McGraw-Hill.
Makridakis, S and Wheelwright, S.C. 1999. Metode dan aplikasi peramalan.
Jakarta : Binarupa Aksara.
Mulyaningsih, T. 2015. Model Generalized Space Time Autoregressive
Integrated untuk Peramalan Indeks Harga Konsumen Beberapa
Kota di Jawa Tengah. Tesis. Bandung: Universitas Padjajaran.
Pai, P. F dan Lin, C. S. 2005. A hybrid ARIMA and support vector machines
model in stock price forecasting. The International Journal of
Management Science Omega 33, 497-505.
Pankratz, A. 1983. Forecasting With Univariate Box-Jenkins Models Concept
and Cases. New York : John Wiley and Sons.
Pramudhitasari, L. 2016. Model Hybrid ARIMA-SVR untuk Peramalan Data
Runtun Waktu. Tesis. Yogyakarta : Universitas Gajah Mada.
76
Pratama, J.A. 2018. Sentiment Analysis Menggunakan Algoritma Support
Vector Machines Pada Layanan Jejaring Sosial Twitter (Studi
Kasus Elektabilitas Bakal Calon Gubernur dan Bakal Calon Wakil
Gubernur PILKADA Jawa Barat Tahun 2018). Tesis. Bandung:
Universitas Padjadjaran.
Qomariyah, L. 2017. Penerapan Model Generalized Space Time
Autoregressive Integrated Moving Average (GSTARIMA) untuk
Peramalan Volume Ekspor Perikanan dan Komoditas Laut
Lainnya. Tesis. Bandung: Universitas Padjadjaran.
Ramsey, J. B. 1969. Tests for Specification Errors in Classical Linear Least
Squares Regression Analysis. Journal of the Royal Statistical
Society, Series B. 31 (2): 350–371.
Santosa, B. 2007. Data Mining: Teknik Pemanfaatan Data untuk Keperluan
Bisnis, Teori dan Aplikasi. Yogyakarta : Graha Ilmu.
Smola, A.J. dan Scholkopf, B. 2004. A Tutorial On Support Vector
Regression. Statistic and Computing 14, 199-222.
Terui, N dan Van Dijk, H. K. 2002. Combined forecasts from linear and non
linear time series models. International Journal of Forecasting 18.
421-438.
Vapnik, V.N. 1995. The Nature of Statistical Learning Theory. New York:
Springer
Woschnagg, E dan Cipan, J. 2004. Evaluating Forecast Accuracy. University
of Vienna: Austria.
Wei, W.W.S. 2006. Time Series Analysis: Univariate and Multivariate
Methods, Second Edition. New York : Pearson Education.
Zhang, G.P. 2003. Time Series Forecasting using a Hybrid ARIMA dan
Neural Network Model. Neurocomputing 50,159-175.
77
LAMPIRAN
Lampiran 1. Data Bulanan Rata-rata Harga Gabah Kering Giling (GKG) Nasional
Tingkat Petani Periode Januari 2009 sampai dengan September 2019
Harga Harga
No Bulan No Bulan
Gabah Gabah
1 Januari 2009 3035.53 33 September 2011 4190.09
2 Februari 2009 3128.5 34 Oktober 2011 4291.77
3 Maret 2009 3006.1 35 November 2011 4371.45
4 April 2009 2638.09 36 Desember 2011 4550.31
5 Mei 2009 2984.03 37 Januari 2012 4708.08
6 Juni 2009 3019.01 38 Februari 2012 4640.1
7 Juli 2009 2947.03 39 Maret 2012 4266.05
8 Agustus 2009 2970.75 40 April 2012 4265.04
9 September 2009 3019.95 41 Mei 2012 4258.67
10 Oktober 2009 3117.39 42 Juni 2012 4305.13
11 November 2009 3020.89 43 Juli 2012 4428.95
12 Desember 2009 3079.79 44 Agustus 2012 4380.32
15 Maret 2010 3516.07 47 November 2012 4585.89
16 April 2010 3186.38 48 Desember 2012 4773.62
17 Mei 2010 3358.29 49 Januari 2013 4812.16
18 Juni 2010 3412.52 50 Februari 2013 4724.86
19 Juli 2010 3463.2 51 Maret 2013 4437.56
20 Agustus 2010 3548.33 52 April 2013 4232.08
21 September 2010 3533.86 53 Mei 2013 4448.57
22 Oktober 2010 3681.24 54 Juni 2013 4503.1
23 November 2010 3791.32 55 Juli 2013 4587.16
24 Desember 2010 3868.86 56 Agustus 2013 4581.08
27 Maret 2011 3742.33 59 November 2013 4704.82
28 April 2011 3663.81 60 Desember 2013 4805.64
29 Mei 2011 3577.62 61 Januari 2014 4776.26
30 Juni 2011 3859.65 62 Februari 2014 4791.95
31 Juli 2011 3990.07 63 Maret 2014 4790.71
32 Agustus 2011 3988.54 64 April 2014 4528.88
78
Harga Harga
No Bulan No Bulan
Gabah Gabah
65 Mei 2014 4572.07 98 Februari 2017 5524.85
66 Juni 2014 4664.43 99 Maret 2017 5451.71
67 Juli 2014 4597.59 100 April 2017 5219.96
68 Agustus 2014 4630.94 101 Mei 2017 5531.22
69 September 2014 4643.25 102 Juni 2017 5564.34
70 Oktober 2014 4782.74 103 Juli 2017 5457.41
71 November 2014 4936.49 104 Agustus 2017 5470.63
72 Desember 2014 5264.16 105 September 2017 5502.49
73 Januari 2015 5447.14 106 Oktober 2017 5531.88
74 Februari 2015 5357 107 November 2017 5593.36
75 Maret 2015 5264.01 108 Desember 2017 5605.6
76 April 2015 4842.69 109 Januari 2018 6001.87
77 Mei 2015 4885.75 110 Februari 2018 5960.91
78 Juni 2015 5234.51 111 Maret 2018 5441.81
79 Juli 2015 5237.8 112 April 2018 5242.38
80 Agustus 2015 5247.92 113 Mei 2018 5266.89
81 September 2015 5330.12 114 Juni 2018 5360.66
82 Oktober 2015 5355.76 115 Juli 2018 5206.27
85 Januari 2016 5689.13 118 Oktober 2018 5467.2
86 Februari 2016 5753.18 119 November 2018 5646.37
87 Maret 2016 5500.77 120 Desember 2018 5713.71
88 April 2016 5473.99 121 Januari 2019 5779.84
89 Mei 2016 5509.78 122 Februari 2019 5827.67
90 Juni 2016 5430.07 123 Maret 2019 5529.65
91 Juli 2016 5380.28 124 April 2019 5126.59
92 Agustus 2016 5404.89 125 Mei 2019 5171.89
93 September 2016 5284.58 126 Juni 2019 5246
94 Oktober 2016 5311.7 127 Juli 2019 5277.23
97 Januari 2017 5542.32
79
Lampiran 2. Uji Linearitas
1. Hipotesis
𝐻0 : 𝑎2 = ⋯ = 𝑎𝑘 = 0 (Data harga gabah tidak mengandung pola nonlinear)
𝐻1 : 𝑎𝑘 ≠ 0 (Data harga gabah mengandung pola nonlinear)
2. Statistik uji
3. Kriteria uji
Tolak 𝐻0 jika 𝑅𝐸𝑆𝐸𝑇 > 𝐹(𝑘−1,𝑛−𝑘) atau p-value <𝛼, artinya data harga gabah
mengandung pola nonlinear. Hasil pengujian menunjukkan p-value uji RESET
sebesar 2.2e − 16 < 𝛼 = 5 %, maka 𝐻0 ditolak, artinya bahwa data harga
gabah mengandung pola nonlinear.
80
Lampiran 3. Syntax Software R Identifikasi Musiman
#INPUT DATA HARGA GABAH

data <- read.table(file.choose(), header=T, sep=",")
data
OLAH=data[,2]
OLAH
#DATA TRAINING
GABAH<-OLAH[1:116]
#ADF TEST DATA HARGA GABAH

adf.test(GABAH)
#DIFFERENCING PERTAMA
GABAH.diff1<-diff(GABAH, diff=1)
#ADF TEST DATA DIFFERENCING PERTAMA

adf.test(GABAH.diff1)
#IDENTIFIKASI POLA MUSIMAN

n<-length(GABAH.diff1)
k<-round((n-1)/2)
omega<-c()
t<-c(1:n)
md=matrix(0,nrow=k,ncol=n)
mt=matrix(0,nrow=k,n)
mdata=matrix(0,nrow=k,ncol=n)
cosomega=matrix(0,nrow=k,ncol=n)
md1=matrix(0,nrow=k,ncol=n)
mt1=matrix(0,nrow=k,ncol=n)
mdata=matrix(0,nrow=k,ncol=n)
sinomega=matrix(0,nrow=k,ncol=n)
for (i in 1:k)
{
omega[i]<-(2*pi*i)/n
md[i,]<-omega[i]
mt[i,]<-t
mdata[i,]<-GABAH.diff1[t]
}
cosomega<-mdata*cos(md*mt)
sinomega<-mdata*sin(md*mt)
a<-c()
b<-c()
periodogram<-c()
for (i in 1:k)
{
a[i]<-(2/n)*sum(cosomega[i,])
b[i]<-(2/n)*sum(sinomega[i,])
periodogram[i]<-(a[i]^2+b[i]^2)
}
81
k<-which.max(periodogram)
omega<-(2*pi*k)/n
Periode<-(2*pi)/omega
Thitung<-(max(periodogram))/sum(periodogram)
Nbintang<-c(seq(5,50,by=5))
galpha<-c(0.68377,0.44495,0.33462,0.27040,0.22805,0.19784,
0.17513,0.15738,0.14310,0.13135)
Tabel<-cbind(Nbintang,galpha)
Ttabel<-Tabel[10,2]
> Thitung
[1] 0.2043092
> Ttabel
galpha
0.13135
> Periode
[1] 6.052632
82
Lampiran 4. Plot ACF dan PACF
Series GABAH Series GABAH
1.0
1.0
0.8
0.8
0.6
0.6
Partial ACF
ACF
0.4
0.4
0.2
0.2
0.0
0.0
-0.2
-0.2
0 10 20 30 40 50 0 10 20 30 40 50
Lag Lag
DATA GABAH ASLI
Series GABAH.diff1 Series GABAH.diff1

1.0
0.3
0.8
0.2
0.6
0.1
Partial ACF
0.4
ACF
0.0
0.2
-0.1
0.0
-0.2
-0.2
-0.3
0 10 20 30 40 50 0 10 20 30 40 50
Lag Lag
DATA GABAH Differencing Pertama
83
Lampiran 5. Syntax Software R Model Hybrid SARIMA-SVR
rm(list=ls())
library(tseries)
library(forecast)
library(fGarch)
library(lmtest)
library(tidyverse)
library(FinTS)
library("portes")
#INPUT DATA HARGA GABAH
data <- read.table(file.choose(), header=T, sep=",")
data
OLAH=data[,2]
OLAH
#PEMBAGIAN DATA TRAINING DAN TESTING

GABAH<-OLAH[1:116] #DATA TRAINING
GABAH_TEST<-OLAH[117:129] #DATA TESTING
#UJI LINEARITAS DATA HARGA GABAH

resettest(GABAH~row_number(GABAH), power=2,
type="regressor")
#DATA HARGA GABAH

#ADF TEST- UJI STASIONERITAS
adf.test(GABAH)
#PLOT ACF & PACF DATA HARGA GABAH
win.graph()
par(mfrow=c(3,1))
ts.plot(GABAH, col = "blue", xlab="Bulan (Januari 2009 -
Agustus 2018)",ylab="Harga Gabah (Rupiah)",main = "Plot Data
Harga Gabah")
acf(GABAH, lag=50)
pacf(GABAH, lag=50)
# DATA DIFFERENCING PERTAMA

GABAH.diff1<-diff(GABAH, diff=1)
#ADF TEST DATA DIFFERENCING PERTAMA - UJI STASIONERITAS
adf.test(GABAH.diff1)
#PLOT ACF & PACF DIFFERENCING PERTAMA
win.graph()
par(mfrow=c(3,1))
ts.plot(GABAH.diff1, col = "red", main = "Plot Data Gabah
Differencing Pertama")
acf(GABAH.diff1,lag=50)
pacf(GABAH.diff1,lag=50)
#DIFFERENCING MUSIMAN PERTAMA (PERIODE=6)

GABAHmus.diff1<-diff(GABAH.diff1,lag=6, diff=1)
84
#ADF TEST DATA DIFFERENCING PERTAMA (PERIODE=6)- UJI
STASIONERITAS
adf.test(GABAHmus.diff1)
#PLOT ACF & PACF DIFFERENCING PERTAMA (PERIODE=6)
win.graph()
par(mfrow=c(3,1))
ts.plot(GABAHmus.diff1, col = "green", main = "Plot Data
Gabah Diffencing Pertama dan Differencing Musiman Pertama ")
acf(GABAHmus.diff1,lag=50)
pacf(GABAHmus.diff1,lag=50)
#IDENTIFIKASI MODEL SARIMA

#MODEL SARIMA(0,1,0)(1,1,1)6– SARIMA_MODEL1
Sarima_Model1<-Arima(GABAH, order=c(0,1,0),
seasonal=list(order=c(1,1,1), period=6), include.mean=FALSE)
summary(Sarima_Model1)
#MODEL SARIMA(1,1,0)(1,1,1)6 – SARIMA_MODEL2
#STATISTIK UJI T
n<-length(GABAH)
85
qt(c(0.025), df=n-1, lower.tail=F)
#UJI DIAGNOSTIK
#MODEL SARIMA(0,1,0)(1,1,1)6– SARIMA_MODEL1
residu1<-Sarima_Model1$residuals
portest(residu1,lags=seq(1,60,1),test=c("Ljung"),
MonteCarlo=FALSE)
ks.test(residu1,"pnorm")
MonteCarlo=FALSE)
MonteCarlo=FALSE)
#PERAMALAN HARGA GABAH MODEL SARIMA TERBAIK

GABAH_ramalan=fitted(Sarima_Model9)
GABAH_ramalan
#MAPE DATA TRAINING SARIMA
accuracy(GABAH_ramalan, GABAH)
#MENGHITUNG RESIDUAL MODEL SARIMA TERBAIK
residu_sarima<-Sarima_Model9$residual
#EVALUASI MODEL SARIMA DENGAN DATA TESTING

#PREDIKSI GABAH SARIMA TESTING
pred.GABAH_TEST<-predict(Sarima_Model9,13)$pred
pred.GABAH_TEST
#MAPE SARIMA TESTING
accuracy(pred.GABAH_TEST, GABAH_TEST)
#MEMULAI SVR DENGAN INPUT DATA RESIDUAL SARIMA

library(kknn)
library(rminer)
library(e1071)
#MASUK KE SVR
#DATA TIME LAG
residu_train<-window(residu_sarima)
#TIME LAG = 2
d1=CasesSeries(residu_train, c(1,2))
d1
train_Y<-d1[3]
train_X<-d1[1:2]
train_Y
train_X
#GRID SEARCH
86
#LOOSE GRID
set.seed(1000)
tc <- tune.control(cross = 10)
tune.model1<-tune.svm(y~., data=d1, scale=T, type="eps-
regression",
kernel="radial",cost=list(2^-7,2^-5,2^-3,2^-
1,2^1,2^3,2^5,2^7), epsilon=seq(0.01,0.1,0.01),
gamma=list(2^-7,2^-5,2^-3,2^-1,2^1,2^3,2^5,2^7),
tolerance=0.001, shrinking=T, fitted=T, tunecontrol = tc)
summary(tune.model1)
model.svm1<-tune.model1$best.model
model.svm1
#FINER GRID
set.seed(1000)
tc <- tune.control(cross = 10)
tune.model2<-tune.svm(y~., data=d1, scale=T, type="eps-
regression",
kernel="radial", cost=list(2^-1.75, 2^-1.5, 2^-1.25, 2^-1,
2^-0.75, 2^-0.5, 2^-0.25), epsilon=0.02,
gamma=list(2^6.25, 2^6.5, 2^6.75, 2^7),
tolerance=0.001, shrinking=T, fitted=T, tunecontrol = tc)
summary(tune.model2)
model.svm2<-tune.model2$best.model
model.svm2
#PERAMALAN RESIDUAL SARIMA DENGAN SVR

#DATA TRAINING
pred_train<-predict(model.svm2)
pred_train
#PERAMALAN HARGA GABAH HYBRID SARIMA-SVR

#GABAH TRAINING SVR ASLI
GABAH_trainsvr<-GABAH[-1:-2]
GABAH_trainsvr
#DATA TRAINING PERAMALAN SVR
GABAH_ramalan_svr<-window(GABAH_ramalan, start=3, end=116)
GABAH_ramalan_svr
#PERAMALAN HARGA GABAH HYBRID SARIMA-SVR
GABAH_hybrid_train<- GABAH_ramalan_svr+pred_train
GABAH_hybrid_train
#MAPE DATA TRAINING SARIMA-SVR
accuracy(GABAH_hybrid_train,GABAH_trainsvr)
#EVALUASI MODEL HYBRID SARIMA-SVR DENGAN DATA TESTING

#PERAMALAN RESIDUAL SARIMA TESTING
pred_test1<-predict(model.svm2, newdata=data.frame(lag2=-
103.382, lag1=63.196))
pred_test2<-predict(model.svm2,
newdata=data.frame(lag2=63.196,lag1=pred_test1))
newdata=data.frame(lag2=pred_test1,lag1=pred_test2))
87
pred_test<-
c(pred_test1,pred_test2,pred_test3,pred_test4,pred_test5,pre
d_test6,pred_test7,
pred_test8,pred_test9,pred_test10,pred_test11,pred_tes
t12,pred_test13)
pred_test
#GABAH HYBRID SARIMA-SVR TESTING

GABAH_hybrid_test<-pred.GABAH_TEST+pred_test
GABAH_hybrid_test
#MAPE SARIMA-SVR DATA TESTING

accuracy(GABAH_hybrid_test, GABAH_TEST)
88
Lampiran 6. Hasil Uji Parsial Model SARIMA
Estimasi Standar
No Model Parameter t-hitung Kesimpulan
Parameter Error
SARIMA AR Musiman (1) -0.5437 0.1205 -4.5120 Signifikan
1
(0,1,0)(1,1,1)6 MA Musiman (1) -0.7558 0.1771 -4.2676 Signifikan
AR (1) -0.1011 0.0973 -1.0391 Tidak Signifikan
SARIMA
2 AR Musiman (1) -0.5649 0.1162 -4.8614 Signifikan
(1,1,0)(1,1,1)6
MA Musiman (1) -0.7516 0.1693 -4.4395 Signifikan
MA (1) -0.1415 0.1104 -1.2817 Tidak Signifikan
SARIMA
3 AR Musiman (1) -0.5727 0.1133 -5.0547 Signifikan
(0,1,1)(1,1,1)6
AR (1) 0.5248 0.3610 1.4537 Tidak Signifikan
SARIMA MA (1) -0.6625 0.3203 -2.0684 Signifikan
4
(1,1,1)(1,1,1)6 AR Musiman (1) -0.5761 0.1127 -5.1118 Signifikan
SARIMA AR (2) -0.1656 0.0932 -1.7768 Signifikan
5
MA (1) -0.0779 0.1027 -0.7585 Tidak Signifikan
SARIMA MA (2) -0.1880 0.1098 -1.7122 Tidak Signifikan
6
AR (1) -0.6121 0.2151 -2.8457 Signifikan
AR (2) -0.2463 0.0964 -2.5550 Signifikan
SARIMA
7 MA(1) 0.5148 0.2111 2.4387 Signifikan
(2,1,1)(1,1,1)6
AR Musiman (1) -0.5459 0.1068 -5.1114 Signifikan
MA(1) 0.3137 0.2884 1.0877 Tidak Signifikan
SARIMA
8 MA(2) -0.2135 0.0913 -2.3384 Signifikan
(1,1,2)(1,1,1)6
AR (1) -0.9564 0.1332 -7.1802 Signifikan
AR(2) -0.8367 0.1747 -4.7894 Signifikan
SARIMA MA(1) 0.8581 0.1845 4.6509 Signifikan
9
(2,1,2)(1,1,1)6 MA(2) 0.6319 0.2256 2.8010 Signifikan
89
Lampiran 7. Trial and Error Pemilihan Jumlah Lag Input Data Model SVR
Jumlah Lag RMSE

1 110,24
2 84,25
3 99,74
4 104,39
5 110,57
6 118,31
7 110,08
8 121,33
9 121,68
10 117,04
11 111,35
12 110,30
13 115,19
14 107,70
15 101,53
90

Full Tesis - Drajat Indra Purnama (140720187008) Scan

Diunggah oleh

Informasi Dokumen

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Full Tesis - Drajat Indra Purnama (140720187008) Scan

Diunggah oleh

Hak Cipta:

Format Tersedia

MODEL HYBRID SEASONAL AUTOREGRESSIVE INTEGRATED MOVING

AVERAGE (SARIMA) - SUPPORT VECTOR REGRESSION (SVR)

Untuk memenuhi salah satu syarat ujian

1. Judul Tesis : Model Hybrid Seasonal Autoregressive

2. Kata Kunci : 1. SARIMA

Komoditi gabah memiliki peran penting bagi masyarakat karena

The commodity of paddy holds an important role as it is the embryo of rice

Alhamdulillaah, segala puji dan syukur penulis panjatkan ke hadirat Allah

sehingga tesis dengan judul “Model Hybrid Seasonal Autoregressive Integrated

Moving Average (SARIMA) - Support Vector Regression (SVR) Dan

Penerapannya Pada Harga Gabah Nasional” ini dapat diselesaikan. Penyusunan

pihak. Dalam kesempatan ini penulis mengucapkan terima kasih kepada :

memberikan bimbingan, masukan, arahan serta meluangkan waktu untuk

berkonsultasi selama penyusunan tesis ini.

3. Dosen-dosen pengajar pada Program Studi Magister Statistika Terapan

Universitas Padjadjaran yang telah memberikan ilmu selama penulis

Tengah, Kepala BPS Kabupaten Parigi Moutong yang telah memberikan

kesempatan kepada penulis untuk mengikuti studi di Program Studi Magister

Statistika Terapan Universitas Padjadjaran.

penyusunan tesis ini.

6. Teman-teman seperjuangan pada Program Studi Magister Statistika Terapan

Universitas Padjadjaran angkatan 2018 atas bantuan dan kerjasamanya selama

perkuliahan sampai penyusunan tesis ini.

7. Semua pihak yang turut membantu proses penyelesaian tesis ini

Penulis menyadari bahwa penulisan tesis ini masih banyak kekurangan

bermanfaat bagi banyak pihak.

Bandung, 13 Januari 2020

Drajat Indra Purnama

PERNYATAAN ........................................................................................... iii

KATA PENGANTAR ...................................................................................vi

DAFTAR ISI .............................................................................................. viii

DAFTAR TABEL .........................................................................................xi

DAFTAR GAMBAR .................................................................................. xii

DAFTAR LAMPIRAN .............................................................................. xiii

1.1 Latar Belakang Masalah ................................................................... 1

1.2 Rumusan Masalah ............................................................................ 6

1.3 Tujuan Penelitian ............................................................................. 6

1.4 Manfaat Penelitian ........................................................................... 6

1.5 Batasan Masalah .............................................................................. 7

BAB II TINJAUAN PUSTAKA..................................................................... 8

2.1 Harga Gabah. ................................................................................... 8

2.2 Uji Linearitas. .................................................................................. 9

2.3 Stasioneritas Data .......................................................................... 11

2.4 Differencing. .................................................................................. 13

2.5 Pola Musiman Data Deret Waktu ................................................... 15

2.6 Model Autoregressive Integrated Moving Average (ARIMA).. ...... 19

2.8 Pemrograman Kuadratis (Quadratic Programming) ....................... 27

2.9 Pengali Lagrange ........................................................................... 27

2.10 Kondisi Karush-Kuhn-Tucker ........................................................ 28

BAB III MODEL HYBRID SARIMA-SVR .................................................. 30

3.1 Sumber Data .................................................................................. 30

3.2 Variabel Penelitian ......................................................................... 30

3.3 Model Seasonal Autoregressive Integrated Moving Average

3.3.1 Identifikasi Model SARIMA .............................................. 33

3.3.2 Estimasi Parameter Model SARIMA .................................. 35

3.3.3 Pengujian Signifikansi Parameter ....................................... 39

3.3.4 Pengujian Diagnostik Model SARIMA............................... 40

3.4 Model Support Vector Regression (SVR) ....................................... 41

3.4.1 Support Vector Regression (SVR) untuk Kasus Linear ....... 43

3.4.2 Support Vector Regression (SVR) untuk Kasus Nonlinear .. 49

3.4.3 Metode Grid Search ........................................................... 50

3.5 Model Hybrid SARIMA-SVR ........................................................ 52

3.6 Kriteria Pemilihan Model Terbaik .................................................. 53

3.7 Tahapan Penelitian ......................................................................... 54