Anda di halaman 1dari 103

MODEL HYBRID SEASONAL AUTOREGRESSIVE INTEGRATED MOVING

AVERAGE (SARIMA) - SUPPORT VECTOR REGRESSION (SVR)


DAN PENERAPANNYA PADA HARGA GABAH NASIONAL

Oleh
DRAJAT INDRA PURNAMA
140720187008

TESIS

Untuk memenuhi salah satu syarat ujian


Guna memperoleh gelar Magister Statistika Terapan
Program Pendidikan Magister Program Studi Statistika Terapan

UNIVERSITAS PADJADJARAN
BANDUNG
2020
Scanned by CamScanner
ABSTRAK

1. Judul Tesis : Model Hybrid Seasonal Autoregressive


Integrated Moving Average (SARIMA)-Support
Vector Regression (SVR) Dan Penerapannya
Pada Harga Gabah Nasional

2. Kata Kunci : 1. SARIMA


2. SVR
3. Harga Gabah
4. Hybrid SARIMA-SVR
3. Abstrak :

Komoditi gabah memiliki peran penting bagi masyarakat karena


merupakan cikal bakal beras yang merupakan makanan pokok bagi penduduk
Indonesia. Stabilitas harga gabah merupakan salah satu tujuan pembangunan yang
dilakukan oleh pemerintah Indonesia. Untuk mencapai stabilitas harga gabah
dibutuhkan perencanaan yang tepat dari pemerintah berkaitan dengan fluktuasi
harga gabah. Perkiraan harga gabah setiap bulan sangat dibutuhkan dalam
perencanaan dan pengambilan keputusan. Oleh karena itu dibutuhkan teknik
peramalan harga gabah yang tepat. Karena pola data harga gabah yang tidak
stasioner, memiliki pola musiman serta memiliki pola data linear dan nonlinear,
maka diperlukan metode peramalan yang dapat mengatasi permasalahan tersebut,
dimana dalam penelitian ini menggunakan model hybrid SARIMA-SVR. Dalam
model ini, model SARIMA digunakan untuk membentuk komponen linear.
Sedangkan model SVR digunakan untuk membentuk komponen nonlinear. Oleh
karena itu, kombinasi kedua model ini (SARIMA-SVR) akan digunakan untuk
memodelkan dan meramalkan harga gabah yang memiliki pola data linear dan
nonlinear. Ketepatan atau akurasi pemodelan dan peramalan model hybrid
SARIMA-SVR dibandingkan dengan model SARIMA melalui perbandingan
MAPE. Sebagai hasilnya, model hybrid SARIMA-SVR menunjukkan ketepatan
atau akurasi yang lebih baik dibandingkan model SARIMA.

iv
4. Abstract :

The commodity of paddy holds an important role as it is the embryo of rice


which is a staple food for Indonesian. The stability price of paddy is one of the
development goals conducted by Indonesian government. To achieve the stable
price of the paddy, a proper planning from the government is needed in case of
the paddy price fluctuation.A monthly predicted price of the paddy should be
provided for planning and decision making. Therefore, the precise price
forecasting technique needs to be undergone. Because the fact that the trend of
paddy price is not stationer as well as having seasonal trend and also having both
linear and nonlinear data trend, the hybrid SARIMA-SVR is used in this research
as the best forecasting method to fix those problems. In this model, SARIMA
model is used to form linear components, meanwhile SVR model is in charge to
form nonlinear components. The combination of the two models (SARIMA-SVR),
thus, is conducted to model and forecast the paddy price which has the linear and
nonlinear data trend. The accuracy of modeling and the hybrid model forecasting
of SARIMA-SVR is being compared to SARIMA model through the MAPE
comparison. As the result, the hybrid SARIMA-SVR shows a better accuracy
compared to the SARIMA model.

v
KATA PENGANTAR

Alhamdulillaah, segala puji dan syukur penulis panjatkan ke hadirat Allah

SWT, karena atas izin, taufik, hidayah, limpahan rahmat serta karunia-Nya

sehingga tesis dengan judul “Model Hybrid Seasonal Autoregressive Integrated

Moving Average (SARIMA) - Support Vector Regression (SVR) Dan

Penerapannya Pada Harga Gabah Nasional” ini dapat diselesaikan. Penyusunan

tesis ini tidak terlepas dari bantuan, motivasi, dukungan serta doa dari berbagai

pihak. Dalam kesempatan ini penulis mengucapkan terima kasih kepada :

1. Ibu Prof. Dr. Budi Nurani Ruchjana, MS selaku Ketua Tim Pembimbing dan

Ibu Dra. Enny Supartini, MS selaku Anggota Tim Pembimbing, yang telah

memberikan bimbingan, masukan, arahan serta meluangkan waktu untuk

berkonsultasi selama penyusunan tesis ini.

2. Ibu Dr. Siti Muchlisoh dan Bapak Yudhie Andriyana, M.Sc, Ph.D selaku Tim

Penguji yang telah memberikan saran dan koreksi dalam penyempurnaan tesis

ini.

3. Dosen-dosen pengajar pada Program Studi Magister Statistika Terapan

Universitas Padjadjaran yang telah memberikan ilmu selama penulis

mengikuti perkuliahan.

4. Kepala BPS RI, Kepala Pusdiklat BPS, Kepala BPS Propinsi Sulawesi

Tengah, Kepala BPS Kabupaten Parigi Moutong yang telah memberikan

kesempatan kepada penulis untuk mengikuti studi di Program Studi Magister

Statistika Terapan Universitas Padjadjaran.

vi
5. Kedua orang tua, Mamak dan Bapak mertua, Istriku tercinta Yuni Setyawati

serta kedua anak sholehahku Annisa Ayatul Husna dan Khansa Kamila

Shalihah atas doa, motivasi, dan dukungan selama penulis menjalani studi dan

penyusunan tesis ini.

6. Teman-teman seperjuangan pada Program Studi Magister Statistika Terapan

Universitas Padjadjaran angkatan 2018 atas bantuan dan kerjasamanya selama

perkuliahan sampai penyusunan tesis ini.

7. Semua pihak yang turut membantu proses penyelesaian tesis ini

Penulis menyadari bahwa penulisan tesis ini masih banyak kekurangan

dan jauh dari kesempurnaan. Oleh karena itu, kritik dan saran yang membangun

sangat penulis harapkan demi perbaikan tesis ini. Semoga tesis ini dapat

bermanfaat bagi banyak pihak.

Bandung, 13 Januari 2020

Drajat Indra Purnama

vii
DAFTAR ISI

PENGESAHAN ............................................................................................ ii

PERNYATAAN ........................................................................................... iii

ABSTRAK ....................................................................................................iv

KATA PENGANTAR ...................................................................................vi

DAFTAR ISI .............................................................................................. viii

DAFTAR TABEL .........................................................................................xi

DAFTAR GAMBAR .................................................................................. xii

DAFTAR LAMPIRAN .............................................................................. xiii

BAB I PENDAHULUAN............................................................................... 1

1.1 Latar Belakang Masalah ................................................................... 1

1.2 Rumusan Masalah ............................................................................ 6

1.3 Tujuan Penelitian ............................................................................. 6

1.4 Manfaat Penelitian ........................................................................... 6

1.5 Batasan Masalah .............................................................................. 7

BAB II TINJAUAN PUSTAKA..................................................................... 8

2.1 Harga Gabah. ................................................................................... 8

2.2 Uji Linearitas. .................................................................................. 9

2.3 Stasioneritas Data .......................................................................... 11

2.4 Differencing. .................................................................................. 13

2.5 Pola Musiman Data Deret Waktu ................................................... 15

2.6 Model Autoregressive Integrated Moving Average (ARIMA).. ...... 19

viii
2.7 Support Vector Machine (SVM)..................................................... 22

2.8 Pemrograman Kuadratis (Quadratic Programming) ....................... 27

2.9 Pengali Lagrange ........................................................................... 27

2.10 Kondisi Karush-Kuhn-Tucker ........................................................ 28

BAB III MODEL HYBRID SARIMA-SVR .................................................. 30

3.1 Sumber Data .................................................................................. 30

3.2 Variabel Penelitian ......................................................................... 30

3.3 Model Seasonal Autoregressive Integrated Moving Average

(SARIMA). .................................................................................... 30

3.3.1 Identifikasi Model SARIMA .............................................. 33

3.3.2 Estimasi Parameter Model SARIMA .................................. 35

3.3.3 Pengujian Signifikansi Parameter ....................................... 39

3.3.4 Pengujian Diagnostik Model SARIMA............................... 40

3.4 Model Support Vector Regression (SVR) ....................................... 41

3.4.1 Support Vector Regression (SVR) untuk Kasus Linear ....... 43

3.4.2 Support Vector Regression (SVR) untuk Kasus Nonlinear .. 49

3.4.3 Metode Grid Search ........................................................... 50

3.5 Model Hybrid SARIMA-SVR ........................................................ 52

3.6 Kriteria Pemilihan Model Terbaik .................................................. 53

3.7 Tahapan Penelitian ......................................................................... 54

BAB IV HASIL DAN PEMBAHASAN ....................................................... 58

4.1 Analisis Deskriptif Data Harga Gabah ........................................... 58

4.2 Pengujian Linearitas....................................................................... 59

ix
4.3 Identifikasi Plot Data Harga Gabah ................................................ 60

4.4 Stasioneritas Data .......................................................................... 61

4.5 Identifikasi Pola Musiman ............................................................. 61

4.6 Peramalan Harga Gabah Menggunakan Model SARIMA ............... 62

4.6.1 Identifikasi Model SARIMA .............................................. 62

4.6.2 Estimasi Parameter Model SARIMA .................................. 64

4.6.3 Pengujian Diagnostik dan Pemilihan Model SARIMA

Terbaik ............................................................................... 65

4.7 Peramalan Residual SARIMA Terbaik Menggunakan Model

SVR ............................................................................................... 67

4.8 Peramalan Harga Gabah Menggunakan Model Hybrid SARIMA-

SVR ............................................................................................... 70

4.9 Peramalan Harga Gabah Pada Oktober 2019 – September 2020 ..... 71

BAB V KESIMPULAN DAN SARAN ........................................................ 73

5.1 Kesimpulan.................................................................................... 73

5.2 Saran ............................................................................................. 74

DAFTAR PUSTAKA................................................................................... 75

LAMPIRAN ................................................................................................. 78

x
DAFTAR TABEL

Tabel 2.1 Nilai Kritis Perbandingan Ordinat Maksimum dari

Periodogram dengan jumlah Periodgram (α = 0,05)..................... 19

Tabel 3.1 Kriteria MAPE ............................................................................ 54

Tabel 4.1 Statistik Deskriptif Data Harga Gabah......................................... 58

Tabel 4.2 Uji Ramsey RESET Pada Data Harga Gabah ............................... 59

Tabel 4.3 Uji ADF Data Harga Gabah Sebelum dan Sesudah Differencing ... 61

Tabel 4.4 Identifikasi Pola Musiman Pada Data Harga Gabah Menggunakan

Regresi Spektral .......................................................................... 62

Tabel 4.5 Hasil Uji Parsial Model SARIMA ............................................... 64

Tabel 4.6 Pengujian Asumsi Residual White Noise .................................... 66

Tabel 4.7 Pengujian Diagnostik Model SARIMA ...................................... 67

Tabel 4.8 Rentang Nilai Parameter Metode Grid Search Tahapan Loose

Grid ............................................................................................ 69

Tabel 4.9 Rentang Nilai Parameter Metode Grid Search Tahapan Finer

Grid ........................................................................................... 69

Tabel 4.10 Perbandingan MAPE Model SARIMA dan Hybrid SARIMA-

SVR ............................................................................................ 71

Tabel 4.11 Peramalan Harga Gabah Oktober 2019 – September 2020........... 72

xi
DAFTAR GAMBAR

Gambar 1.1 Grafik Pergerakan Data Gabah .................................................. 3

Gambar 2.1 Pola Data Musiman ................................................................. 16

Gambar 2.2 Kemungkinan Hyperplane Dalam Model Klasifikasi dan

Hyperplane Optimal dengan Margin Optimal .......................... 23

Gambar 2.3 Transformasi 𝜑 dari Input Space ke Feature Space.................. 26

Gambar 3.1 Ilustrasi model SVR dan Plot 𝜀-insensitive loss function .......... 43

Gambar 3.2 Diagram Alur Penelitian .......................................................... 57

Gambar 4.1 Plot Data Harga Gabah Januari 2009 – Agustus 2018 .............. 60

Gambar 4.2 Plot ACF dan PACF Data Harga Gabah Diferencing

pertama dan Diferencing musiman lag 6 ................................... 63

xii
DAFTAR LAMPIRAN

Lampiran 1 Data Bulanan Rata-rata Harga Gabah Kering Giling (GKG)

Nasional Tingkat Petani Periode Januari 2009 sampai dengan

September 2019 ....................................................................... 78

Lampiran 2 Uji Linearitas ............................................................................ 80

Lampiran 3 Syntax Software R Identifikasi Musiman ................................... 81

Lampiran 4 Plot ACF dan PACF ................................................................ 83

Lampiran 5 Syntax Software R Model Hybrid SARIMA-SVR ..................... 84

Lampiran 6 Hasil Uji Parsial Model SARIMA ............................................. 89

Lampiran 7 Trial and Error Pemilihan Jumlah Lag Input Data Model

SVR ......................................................................................... 90

xiii
BAB I

PENDAHULUAN

1.1. Latar Belakang Masalah

Ketahanan pangan dapat diartikan sebagai kondisi terpenuhinya pangan bagi

negara sampai dengan perseorangan, yang tercermin dari tersedianya pangan yang

cukup, baik jumlah maupun mutunya, aman, beragam, bergizi, merata, dan

terjangkau serta tidak bertentangan dengan agama, keyakinan, dan budaya

masyarakat, untuk dapat hidup sehat, aktif, dan produktif secara berkelanjutan

(UU No. 18 Tahun 2012). Definisi ketahanan pangan tersebut mengisyaratkan

empat aspek yang harus terpenuhi yaitu tersedia, dapat diakses, dapat

dimanfaatkan, dan stabil.

Indonesia merupakan negara agraris sebagian besar penduduknya

mengkonsumsi beras sebagai makanan pokok. Beras bagi Indonesia merupakan

komoditi yang sangat strategis, baik dari aspek ekonomi, sosial, lingkungan dan

politik. Dalam kaitannya dengan ketahanan pangan salah satu unsur penting

dalam pencapaian ketahanan pangan sebagai salah satu prioritas pembangunan

nasional adalah pasokan dan stabilisasi harga beras (Bappenas, 2010). Stabilitas

harga beras diperlukan untuk mencegah fluktuasi harga beras. Menurut BPS

(2018), fluktuasi harga beras muncul akibat makin merosotnya tingkat

produktivitas lahan sehingga terus menggerus jumlah produksi gabah.

Gabah merupakan cikal bakal beras sehingga ketersediaan dan harga beras

dapat dipengaruhi ketersediaan gabah maupun harga gabah. Salah satu faktor

1
yang mempengaruhi harga dan ketersediaan gabah adalah pola penanaman padi

yang dilakukan hampir secara serentak pada musim tertentu sehingga berakibat

pada berlebihnya pasokan saat panen dan langkanya pasokan saat paceklik (BPS,

2018). Fenomena musim panen raya selalu menyebabkan anjloknya harga gabah

karena terjadi lonjakan volume hasil panen. Akibatnya, tingkat harga relatif

rendah sepanjang musim panen dan merangkak naik sampai musim panen

berikutnya.

Data harga gabah merupakan data berkala yang disajikan dalam kurun

waktu bulanan dan dikategorikan sebagai data deret waktu sehingga peramalan

data harga gabah dapat menggunakan analisis deret waktu univariat. Analisis

deret waktu univariat memiliki kelebihan yaitu hanya menggunakan data variabel

yang akan diteliti perilakunya saja dengan melihat data historis tanpa perlu

melibatkan variabel lain yang mempengaruhi (Makridakis dan Wheelwright,

1999). Pendekatan ini digunakan untuk menganalisis data dengan mengamati

perubahan dan pola pergerakan data, serta mempertimbangkan data historis

sehingga pola pergerakan masa lalu dapat menjadi informasi yang akurat untuk

meramalkan pergerakan pada masa yang akan datang.

Pergerakan data harga gabah dapat dilihat dalam Gambar 1.1. Berdasarkan

Gambar 1.1 dapat dilihat bahwa data harga gabah cenderung tidak stasioner dalam

rata-rata karena dalam beberapa waktu tertentu pergerakannya membentuk pola

tren naik. Selain itu, harga gabah memiliki pola yang tidak teratur dengan besaran

kenaikan dan penurunan yang bervariatif. Hal ini membuat pergerakan harga

gabah memiliki hubungan yang sangat kompleks dan nonlinear.

2
Plot Data Harga Gabah

3000 3500 4000 4500 5000 5500 6000


Harga Gabah (Rupiah)

0 20 40 60 80 100 120

Bulan (Januari 2009 - September 2019)

Gambar 1.1 Grafik Pergerakan Data Harga Gabah

Model univariat yang umum digunakan dalam peramalan data deret waktu

adalah model Autoregressive Integrated Moving Average (ARIMA) yang

diperkenalkan pertama kali oleh Box dan Jenkins (1976). Model ini melakukan

differencing data terlebih dahulu untuk menghasilkan data runtun waktu yang

stasioner, dan selanjutnya melakukan proses ARMA pada data hasil differencing

tersebut. ARIMA sangat baik ketepatannya untuk peramalan jangka pendek dan

untuk data runtun waktu non stasioner pada saat linear karena prinsip utama

dalam model ARIMA adalah bahwa model ini dibangun oleh proses linear. Akan

tetapi, ARIMA memiliki kekurangan untuk sebagian besar permasalahan yang

bersifat nonlinear. ARIMA cenderung mengalami penurunan tingkat keakuratan

apabila digunakan pada data yang mengandung pola nonlinear (Zhang, 2003).

Apabila model ARIMA tetap digunakan untuk memodelkan pada data nonlinear,

maka kemungkinan akan menghasilkan varian residual yang tidak konstan sebagai

akibat dari karakteristik data dengan volatilitas yang tinggi serta memiliki

3
fluktuasi data yang besar. Metode ARIMA sendiri memiliki beberapa model

alternatif yang dikembangkan sesuai dengan pola dan karakteristik data salah

satunya untuk deret waktu musiman dikenal dengan model Seasonal

Autoregressive Integrated Moving Average (SARIMA).

Berbeda dengan model ARIMA atau SARIMA, model Support Vector

Regression (SVR) merupakan model peramalan yang dapat digunakan untuk

memprediksi data deret waktu nonlinear. SVR adalah modifikasi Support Vector

Machine (SVM) yang digunakan untuk pendekatan regresi (Boser et al, 1992).

Menurut Ding (2012), keunggulan SVR adalah kemampuan untuk mengatasi

masalah data nonlinear dengan trik kernel dan dapat mengatasi masalah

overfitting dimana model yang dihasilkan hanya menghasilkan model yang baik

untuk data training dan tidak untuk data testing. Namun demikian, SVR memiliki

kekurangan dalam hal penentuan parameter model yang optimal untuk

menghasilkan model terbaik. Peneliti harus menentukan rentang nilai parameter

SVR seperti epsilon (𝜀), cost (C), dan gamma (𝛾), kemudian memilih parameter

optimal pada rentang tersebut. Untuk mengatasai masalah tersebut, salah satu cara

yang dapat digunakan dalam menentukan parameter dalam SVR adalah dengan

metode grid search. Grid search merupakan kombinasi parameter yang diujikan

pada suatu model SVR untuk mencari nilai error dalam klasifikasi (Hsu et al.,

2016).

Dalam kehidupan nyata masalah deret waktu tidak selalu linear atau

nonlinear. Namun terkadang mengandung keduanya (linear dan nonlinear) secara

sekaligus yaitu data mengandung pola nonlinear secara keseluruhan tetapi secara

4
parsial mengandung pola linear. Oleh karena itu, banyak penelitian yang telah

menggunakan model hybrid yang merupakan kombinasi model linear dengan

model nonlinear. Model hybrid digunakan karena model tunggal tidak dapat

secara total mengidentifikasi semua karakteristik data deret waktu (Terui dan Van

Dijk, 2002). Salah satu model hybrid adalah model hybrid SARIMA-SVR yang

merupakan kombinasi model SARIMA dan model SVR. Model hybrid ini

membentuk komponen linear menggunakan model SARIMA dan membentuk

komponen nonlinear menggunakan model SVR sehingga kombinasi komponen

linear dan komponen nonlinear membentuk model hybrid SARIMA-SVR.

Beberapa penelitian terdahulu yang menggunakan model hybrid diantaranya

adalah Pai dan Lin (2005) menggunakan hybrid ARIMA-SVM pada data harga

saham, Chen dan Wang (2007) menggunakan hybrid SARIMA-SVM pada nilai

produksi industri mesin, Aguilar et al (2011) menggunakan hybrid SARIMA-SVR

pada data volume inspeksi di pelabuhan, Alwee et al (2013) menggunakan hybrid

SVR-ARIMA pada data tingkat kejahatan, Pramudhitasari (2016) menggunakan

hybrid ARIMA-SVR pada data saham IHSG.

Dalam penelitian ini, penulis menggunakan model hybrid SARIMA-SVR

dengan tujuan untuk memodelkan dan meramalkan data harga gabah nasional di

tingkat petani. Hal ini didasarkan pada uraian sebelumnya bahwa data harga

gabah merupakan data yang tidak stasioner, terdapat pola musiman dan memiliki

pola data linear dan nonlinear sekaligus.

5
1.2. Rumusan Masalah

Berdasarkan latar belakang masalah yang diuraikan di atas maka rumusan

masalah dalam penelitian ini adalah

1. Bagaimana prosedur membangun model hybrid SARIMA-SVR pada kondisi

data deret waktu yang tidak stasioner, terdapat pola musiman serta

mempunyai pola data linear dan nonlinear?

2. Bagaimana menerapkan model hybrid SARIMA-SVR untuk peramalan

harga gabah nasional di tingkat petani?

1.3. Tujuan Penelitian

Berdasarkan uraian pada rumusan masalah maka tujuan yang ingin dicapai

dalam penelitian ini adalah

1. Menggambarkan prosedur membangun model hybrid SARIMA-SVR pada

kondisi data deret waktu yang tidak stasioner, terdapat pola musiman serta

mempunyai pola data linear dan nonlinear.

2. Menerapkan model hybrid SARIMA-SVR untuk peramalan harga gabah

nasional di tingkat petani.

1.4. Manfaat Penelitian

Penelitian ini diharapkan dapat menambah pengetahuan dan wawasan

keilmuan mengenai analisis data deret waktu, khususnya model hybrid SARIMA-

SVR untuk peramalan harga gabah nasional di tingkat petani. Hasil peramalan

diharapkan dapat memberikan informasi dini dan acuan empiris baik bagi

6
pemerintah, dunia usaha, maupun para peneliti lainnya. Khusus bagi pemerintah,

penelitian ini diharapkan dapat menjadi masukan dalam mengevaluasi,

merencanakan dan mengimplementasikan kebijakan dalam mengontrol harga

gabah nasional di tingkat petani.

1.5. Batasan Masalah

Batasan masalah dalam penelitian diperlukan untuk membatasi penelitian

ini, sehingga fokus pada suatu topik tertentu. Adapun batasan masalah dalam

penelitian ini, adalah sebagai berikut:

1. Data yang digunakan dalam penelitian ini adalah data bulanan berupa data

harga gabah nasional dengan kualitas gabah kering giling (GKG) di tingkat

petani pada rentang waktu Januari 2009 sampai dengan September 2019.

2. Penelitian ini menggunakan model SVR dengan fungsi kernel Radial Basic

Function (RBF).

3. Pengolahan data pada penelitian ini menggunakan Software R 3.6.1.

7
BAB II

TINJAUAN PUSTAKA

2.1. Harga Gabah

Komoditi gabah merupakan cikal bakal dari beras yang merupakan makanan

pokok bagi penduduk Indonesia. Ketersediaan komoditi gabah dapat

mempengaruhi harga gabah maupun beras. Sehingga kebijakan jangka pendek

terkait dengan manajemen stok, penetapan harga domestik, dan kuota impor

sangat diperlukan agar tidak menimbulkan gejolak harga gabah. Berkaitan dengan

upaya stabilisasi harga gabah di tingkat petani, pemerintah melalui Badan Pusat

Statistik (BPS) melakukan pemantauan harga di tingkat petani dan penggilingan

secara rutin melalui Survei Monitoring Harga Produsen Gabah bulanan.

Upaya lain pemerintah untuk menjaga stabilitas harga gabah adalah melalui

penetapan Harga Pembelian Pemerintah (HPP) untuk mengatur mekanisme

penetapan harga transaksi baik di tingkat petani maupun penggilingan. HPP

adalah harga minimal yang harus dibayarkan pihak penggilingan atau pembeli

kepada petani sesuai dengan kualitas gabah sebagaimana yang telah ditetapkan

Pemerintah dalam SK Inpres. Penetapan harga transaksi ini dibedakan menjadi

dua sebagai berikut

1) Harga di tingkat petani adalah harga yang disepakati pada waktu terjadinya

transaksi antara petani dengan pedagang pengumpul/tengkulak/pihak

penggilingan yang ditemukan pada hari dilaksanakannya observasi dengan

kualitas apa adanya, sebelum dikenakan ongkos angkut pasca panen.

8
2) Harga di tingkat penggilingan adalah harga di tingkat petani ditambah dengan

besarnya biaya ke penggilingan terdekat.

Pemantauan yang dilakukan BPS selain mencakup harga juga mencakup

komponen mutu gabah. Berdasarkan kualitas gabah menurut hasil pengukuran

komponen mutunya (kadar air dan kadar hampa), gabah dikelompokkan menjadi

1) Gabah Kering Giling (GKG) adalah gabah dengan kadar air < 14 % dan kadar

hampa/kotoran < 3 %.

2) Gabah Kering Panen (GKP) adala gabah dengan kadar air 14 % sampai 25 %

dan kadar hampa/kotoran 3,01 % sampai 10 %.

3) Gabah kualitas rendah adalah gabah dengan kadar air > 25 % dan kadar

hampa/kotoran > 10 %.

Menurut BPS (2018), perhitungan rata-rata harga gabah untuk masing-

masing kualitas gabah setiap bulannya menggunakan rumus sebagai berikut

∑𝑚
𝑗=1 P𝑛𝑖𝑗
̅
P𝑛𝑖 =
𝑚

dengan

̅𝑛𝑖
P : Rata-rata harga gabah kualitas 𝑖 pada bulan ke-𝑛.

P𝑛𝑖𝑗 : Harga gabah kualitas 𝑖 pada bulan ke-𝑛 observasi ke-𝑗.

𝑚 : Jumlah observasi.

2.2. Uji Linearitas

Suatu model peramalan dalam analisis data deret waktu disebut linear jika

tidak memuat fungsi nonlinear dari lag atau variabel prediktor (Chatfield, 2004).

Berdasarkan definisi tersebut dapat diperoleh bahwa yang dimaksud hubungan

9
nonlinear dalam deret waktu adalah hubungan nonlinear antara variabel respon

dengan lag-lag atau variabel prediktornya. Salah satu uji untuk mengetahui linear

atau nonlinear suatu data deret waktu dapat menggunakan uji Ramsey RESET

yang pertama kali diperkenalkan oleh Ramsey (1969).

Jika terdapat variabel bebas 𝑋𝑡 dan variabel prediktor 𝑌𝑡 . Uji Ramsey

RESET berawal dari ide bahwa jika tidak terdapat nonlinearitas maka berbagai

transformasi nonlinear dari 𝑓𝑡 = 𝑋𝑡 𝜃𝑡 tidak memberikan manfaat untuk

menyatakan 𝑌𝑡 (Kim et al., 2004). Prosedur uji Ramsey RESET dapat dijelaskan

sebagai

1) Melakukan regresi 𝑌𝑡 pada 𝑋𝑡 sehingga diperoleh model linear

𝑌𝑡 = 𝑓𝑡 + 𝑒𝑡 , dengan 𝑓𝑡 = 𝑋𝑡 𝜃𝑡 (2.1)

2) Melakukan regresi 𝑒𝑡 pada 𝑓𝑡𝑘 dengan 𝑓𝑡𝑘 adalah transformasi nonlinear dari

𝑓𝑡 , sehingga diperoleh bentuk

𝑒𝑡 = 𝑎2 𝑓𝑡2 + ⋯ + 𝑎𝑘 𝑓𝑡𝑘 + 𝑣𝑡 , untuk 𝑘 ≥ 2 (2.2)

Kemudian dengan memasukkan persamaan (2.2) ke persamaan (2.1) diperoleh

model alternatif

𝑌𝑡 = 𝑋𝑡 𝜃𝑡 + 𝑎2 𝑓𝑡2 + ⋯ + 𝑎𝑘 𝑓𝑡𝑘 + 𝑣𝑡 , untuk 𝑘 ≥ 2 (2.3)

Langkah-langkah pengujian linearitas menggunakan uji Ramsey RESET

adalah sebagai berikut

1) Hipotesis

𝐻0 : 𝑎2 = ⋯ = 𝑎𝑘 = 0 (Data deret waktu tidak mengandung pola nonlinear)

𝐻1 : 𝑎𝑘 ≠ 0 (Data deret waktu mengandung pola nonlinear)

2) Statistik uji

10
[(𝐞𝑇𝑡 𝐞𝑡 − 𝐯𝑡𝑇 𝐯𝑡 )⁄(𝑘 − 1)]
𝑅𝐸𝑆𝐸𝑇 = (2.4)
[(𝐯𝑡𝑇 𝐯𝑡 )⁄(𝑛 − 𝑘)]

dengan

𝐞𝑡 = (𝑒1 , … , 𝑒𝑛 ) : vektor residual model linear pada persamaan (2.1)

𝐯𝑡 = (𝑣1 , … , 𝑣𝑛 ) : vektor residual model alternatif pada persamaan (2.3)

n : banyaknya pengamatan

k : banyaknya variabel prediktor dan respon

3) Kriteria uji

Tolak 𝐻0 jika 𝑅𝐸𝑆𝐸𝑇 > 𝐹(𝑘−1,𝑛−𝑘) , artinya data deret waktu mengandung

pola nonlinear.

2.3. Stasioneritas Data

Data stasioner adalah data deret waktu yang tidak memiliki tren, pola

musiman serta nilai rata-rata dan variansnya konstan atau homogen dari waktu ke

waktu (Cryer, 1986). Data yang stasioner adalah data yang variansnya tidak

terlalu besar dan mempunyai kecenderungan untuk mendekati nilai rata-ratanya.

Suatu data {𝑍𝑡 } dikatakan stasioner apabila

1) 𝐸 [𝑍𝑡 ] = 𝜇, rata-rata dari 𝑍𝑡 konstan.

2) 𝑉𝑎𝑟[𝑍𝑡 ] = 𝐸 [𝑍𝑡 − 𝜇]2 = 𝜎 2 , varians dari 𝑍𝑡 konstan.

3) 𝐶𝑜𝑣[𝑍𝑡 , 𝑍𝑡+𝑘 ] = 𝐸 [(𝑍𝑡 − 𝜇)(𝑍𝑡+𝑘 − 𝜇)] = 𝛾𝑘 , kovarians antara dua data deret

waktu hanya bergantung pada selang waktu k antara dua periode waktu

tersebut. Selang waktu antara 𝑍𝑡 dan 𝑍𝑡+𝑘 disebut lag.

11
Stasioneritas dalam rata-rata data deret waktu dapat dilihat melalui plot

Autocorrelation Function (ACF), jika plot ACF turun dengan lambat diduga data

deret waktu belum stasioner dalam rata-rata. Selain itu, uji stasioneritas dalam

rata-rata juga dapat dilihat dari terdapat atau tidaknya akar unit (unit root).

Pengujian akar unit dapat dilakukan menggunakan uji Augmented Dickey Fuller

(ADF). Statistik uji ADF merupakan perluasan dari model Autoregressive orde 1

atau AR(1) dengan metode estimasi parameter menggunakan Ordinary Least

Square (OLS). Uji ADF diestimasi ke dalam tiga bentuk pendekatan model AR(1)

sebagai berikut:

1) Model AR(1) dengan rata-rata nol,

𝑍𝑡 = 𝛾𝑍𝑡−1 + 𝜀𝑡 .

2) Model AR(1) dengan rata-rata tidak sama dengan nol,

𝑍𝑡 = 𝛽1 + 𝛾𝑍𝑡−1 + 𝜀𝑡 .

3) Model AR(1) dengan tren deterministik,

𝑍𝑡 = 𝛽1 + 𝛽2 𝑡 + 𝛾𝑍𝑡−1 + 𝜀𝑡 .

Langkah-langkah pengujian akar unit dengan uji ADF adalah sebagai

berikut

1) Hipotesis

𝐻0 ∶ 𝛾 = 1 (Data tidak stasioner dalam rata-rata)

𝐻1 ∶ 𝛾 < 1 (Data stasioner dalam rata-rata)

2) Statistik uji

𝛾̂ − 1
𝑇= ~𝑡
𝑠𝑒(𝛾̂) (𝑛−𝑝−1)

dengan 𝑠𝑒(𝛾̂) adalah standar error dari 𝛾̂ dan p adalah banyaknya parameter

12
3) Kriteria uji

Tolak 𝐻0 jika nilai 𝑇 > 𝑡𝑡𝑎𝑏𝑒𝑙 , artinya data stasioner dalam rata-rata. Jika data

tidak stasioner, maka untuk menstasionerkan data perlu dilakukan proses

pembedaan (differencing) data.

2.4. Differencing

Ketidakstasioneran data dalam rata-rata dapat diatasi dengan proses

pembedaan (differencing). Proses differencing dapat dilakukan beberapa periode

sampai data stasioner yaitu dengan cara mengurangi nilai data pada suatu periode

dengan nilai data periode sebelumnya. Apabila data deret waktu tidak stasioner

dalam rata-rata, maka data tersebut dapat dibuat lebih mendekati stasioner dengan

melakukan proses differencing pertama yang dirumuskan sebagai

𝑍𝑡′ = 𝑍𝑡 − 𝑍𝑡−1 (2.5)

dengan

𝑍𝑡 : observasi waktu t

𝑍𝑡−1 : observasi waktu t-1.

Menggunakan operator Backshift (B), persamaan (2.5) dapat ditulis kembali

menjadi

𝑍𝑡′ = 𝑍𝑡 − 𝐵𝑍𝑡

= (1 − 𝐵)𝑍𝑡

dengan (1 − 𝐵) adalah differencing pertama.

Jika dengan proses differencing pertama data belum stasioner, maka

dilakukan proses differencing kedua yang dirumuskan

13
𝑍𝑡′′ = 𝑍𝑡′ − 𝑍𝑡−1

= 𝑍𝑡′ − 𝑍𝑡−1

= 𝑍𝑡 − 𝑍𝑡−1 − (𝑍𝑡−1 − 𝑍𝑡−2 )

= 𝑍𝑡 − 2𝑍𝑡−1 + 𝑍𝑡−2

= (1 − 2𝐵 + 𝐵2 )𝑍𝑡

= (1 − 𝐵)2 𝑍𝑡

dengan (1 − 𝐵)2 adalah differencing kedua. Sehingga secara umum proses

differencing orde ke-d dirumuskan sebagai

𝑍𝑡′ = (1 − 𝐵)𝑑 𝑍𝑡

dengan

𝑍𝑡′ : variabel hasil differencing 𝑍𝑡

𝑑 : orde differencing.

Untuk data deret waktu yang mengandung pola musiman, dilakukan

differencing musiman untuk menghilangkan pola musimannya (Pankratz, 1983).

Differencing musiman berarti menghitung pergeseran data secara musiman

berdasarkan periode waktu tertentu. Sebagai contoh untuk data kuartalan S = 4,

data bulanan S = 12 dan seterusnya. Misalkan data deret waktu mengandung pola

musiman dengan periode S, maka untuk menghilangkan pola musiman dilakukan

differencing musiman pertama (D=1) dirumuskan sebagai

𝑍𝑡∗ = 𝑍𝑡 − 𝑍𝑡−𝑆 (2.6)

dengan

𝑍𝑡 : observasi waktu t

𝑍𝑡−𝑆 : observasi waktu t-S.

14
Menggunakan operator Backshift musiman (BS), persamaan (2.6) dapat

ditulis kembali menjadi

𝑍𝑡∗ = 𝑍𝑡 − 𝐵 𝑆 𝑍𝑡−𝑆

= (1 − 𝐵 𝑆 )𝑍𝑡

dengan (1 − 𝐵 𝑆 ) adalah differencing musiman pertama.

Langkah differencing musiman untuk orde berikutnya sama seperti langkah

differencing biasa, sehingga secara umum differencing musiman orde ke-D

dirumuskan sebagai

𝑍𝑡∗ = (1 − 𝐵 𝑆 )𝐷 𝑍𝑡

dengan

𝑍𝑡∗ : variabel hasil differencing musiman 𝑍𝑡

𝐷 : orde differencing musiman.

2.5. Pola Musiman Data Deret Waktu

Data deret waktu sering menunjukkan suatu pola yang musiman. Pola

musiman terjadi jika suatu deret dipengaruhi oleh faktor musiman (misalnya

kuartal, bulanan, atau hari-hari pada minggu tertentu), sehingga memunculkan

pola identik yang berulang secara periodik (Darmawan dkk, 2012). Beberapa

contoh pola musiman disajikan pada Gambar 2.1. Pada Gambar 2.1, gambar (a)

menunjukkan pola musiman yang stasioner, gambar (b) menunjukkan pola

musiman aditif tren, dan gambar (c) menunjukkan pola musiman multiplikatif

tren.

15
(a) (b)

(c)
Gambar 2.1. Pola Data Musiman

Untuk mengidentifikasi komponen musiman dapat dilihat secara visual

melalui plot data per periodenya (Buys-Ballot) dan melalui grafik ACF. Namun,

jika data tidak hanya dipengaruhi pola musiman, tetapi juga dipengaruhi pola tren,

maka pola musiman tidak mudah untuk diidentifikasi. Untuk mengatasi hal itu,

pengujian adanya pola musiman pada data deret waktu dapat dilakukan dengan

menggunakan regresi spektral (Darmawan dkk, 2012). Regresi spektral

merupakan suatu metode yang digunakan untuk menelaah periodesitas

tersembunyi (periodesitas yang sulit ditemukan) dalam kawasan waktu.

Identifikasi pola musiman menggunakan regresi spektral hanya bisa dilakukan

16
pada data stasioner sehingga untuk data nonstasioner perlu dilakukan proses

differencing agar diperoleh data stasioner. Persamaan regresi spektral berbentuk

sebagai berikut

𝑍𝑡 = 𝛼 cos 𝜔𝑡 + 𝛽 sin 𝜔𝑡 + 𝜀𝑡 (2.7)

dengan

𝛼 dan 𝛽 : parameter (koefisien fourier)

cos 𝜔𝑡 dan sin 𝜔𝑡 : fungsi kontinu yang tidak berkorelasi

𝜀𝑡 : residual pada periode waktu ke-t

𝜔𝑡 : frekuensi fourier

Tahapan-tahapan untuk melakukan pengujian musiman dengan metode

regresi spektral adalah sebagai berikut

1) Tentukan data yang akan diuji musiman

2) Karena persamaan (2.7) pada dasarnya secara esensi koefisien fourier sama

dengan koefisien pada regresi standar maka bila diimplementasikan pada data

dapat dituliskan menjadi persamaan fourier sebagai berikut

𝑛 ⁄2

𝑍𝑡 = ∑ (𝑎𝑘 cos 𝜔𝑘 𝑡 + 𝑏𝑘 sin 𝜔𝑘 𝑡)


𝑘=0

dengan 𝜔𝑘 merupakan frekuensi fourier yang dapat dihitung dengan rumusan

𝜔𝑘 = 2𝜋𝑘⁄𝑛

3) Hitung 𝑎𝑘 dan 𝑏𝑘 dengan rumusan sebagai berikut


𝑛
1 𝑛
∑ 𝑍𝑘 cos 𝜔𝑘 𝑡 , 𝑘 = 0 dan 𝑘 = jika 𝑛 genap
𝑛 2
𝑡=1
𝑎𝑘 = 𝑛
2 (𝑛 − 1)
∑ 𝑍𝑘 cos 𝜔𝑘 𝑡 , 𝑘 = 1,2, … ,
{𝑛 𝑡=1
2

17
𝑛
2 (𝑛 − 1 )
𝑏𝑘 = ∑ 𝑍𝑘 sin 𝜔𝑘 𝑡 , 𝑘 = 1,2, … ,
𝑛 2
𝑡=1

4) Hitung nilai ordinat 𝐼(𝜔𝑘 ) dengan rumusan sebagai berikut

𝑛𝑎02 , 𝑘=0
𝑛 2 (𝑛 − 1)
𝐼 (𝜔𝑘 ) = (𝑎 + 𝑏𝑘2 ), 𝑘 = 1,2, … ,
2 𝑘 2
2
𝑛
{𝑛𝑎𝑘 , 𝑘 = jika 𝑛 genap
2

5) Uji keberartian terhadap masing-masing frekuensi fourier dengan hipotesis

statistik sebagai berikut

a. Hipotesis

𝐻0 ∶ 𝛼 = 𝛽 = 0 (data tidak dipengaruhi faktor musiman)

𝐻1 ∶ 𝛼 ≠ 0 atau 𝛽 ≠ 0 (data dipengaruhi faktor musiman)

b. Statistik uji

𝐼 (1) (𝜔(1) )
𝑇= (2.8)
∑[𝑛 ⁄2]
( )
𝑘=1 𝐼 𝜔𝑘

dengan

𝐼 (1) (𝜔(1) ) : ordinat maksimum dari periodogram pada frekuensi

fourier

I(ωk ) : nilai ordinat periodogram pada fekuensi fourier ke-k

c. Kriteria uji

Tolak 𝐻0 jika 𝑇 > 𝑔𝛼 , artinya data dipengaruhi faktor musiman. Nilai 𝑔𝛼

diperoleh dari Tabel 2.1.

18
Tabel 2.1. Nilai Kritis Perbandingan Ordinat Maksimum dari
Periodogram dengan jumlah Periodegram (α = 0,05)

N* gα( by exact formula ) gα(by first term only )


5 0,68377 0,68377
10 0,44495 0,44495
15 0,33462 0,33643
20 0,27040 0,27046
25 0,22805 0,22813
30 0,19784 0,19794
35 0,17513 0,17525
40 0,15738 0,15752
45 0,14310 0,14324
50 0,13135 0,13149
*N = ( n – 1 ) / 2 if n is odd and N = ( n/2 -1 ) if n is even
Sumber : Darmawan, 2012.

2.6. Model Autoregressive Integrated Moving Average (ARIMA)

Model Autoregressive Integrated Moving Average (ARIMA) adalah model

univariat yang umum digunakan dalam peramalan data deret waktu (Box dan

Jenkins, 1976). Model ARIMA berasal dari model Autoregressive Moving

Average (ARMA) yang merupakan gabungan antara model Autoregressive (AR)

dan model Moving Average (MA) pada data yang sudah di lakukan diferencing.

Prosedur ARIMA adalah melakukan differencing pada data deret waktu

nonstasioner terlebih dahulu untuk menghasilkan data deret waktu yang stasioner,

dan selanjutnya melakukan proses ARMA pada data hasil differencing tersebut.

Model AR menyatakan bahwa pengamatan waktu sekarang (𝑍𝑡 ) dipengaruhi

oleh pengamatan waktu sebelumnya (𝑍𝑡−𝑝 ) dan kesalahan sekarang (𝜀𝑡 ).

19
Menurut Makridakis (1999), model AR orde p yang biasa disebut AR(p)

dimodelkan sebagai

𝑍𝑡 = 𝜙1 𝑍𝑡−1 + 𝜙2 𝑍𝑡−2 + 𝜙3 𝑍𝑡−3 + ⋯ + 𝜙𝑝 𝑍𝑡−𝑝 + 𝜀𝑡

atau

(1 − 𝜙1 𝐵 − 𝜙2 𝐵2 − ⋯ − 𝜙𝑝 𝐵𝑝 )𝑍𝑡 = 𝜀𝑡

iid
dengan 𝜀𝑡 merupakan unsur residual yang menyebar normal dan independen 𝜀𝑡 ~

N(0,2) dan 𝜙1 , 𝜙2 , … , 𝜙𝑝 adalah parameter AR.

Sebagai contoh, model AR dengan orde 1 atau disebut model AR(1)

menyatakan pengamatan waktu sekarang dipengaruhi pengamatan satu waktu

sebelumnya dan unsur kesalahan. Model AR(1) dimodelkan sebagai berikut

𝑍𝑡 = 𝜙1 𝑍𝑡−1 + 𝜀𝑡

Model MA menyatakan bahwa pengamatan waktu sekarang

(𝑍𝑡 ) dipengaruhi oleh kesalahan sekarang (𝜀𝑡 ) dan kesalahan waktu sebelumnya

(𝜀𝑡−𝑞 ) . Menurut Makridakis (1999), model MA orde q yang biasa disebut MA(q)

dimodelkan sebagai

𝑍𝑡 = 𝜀𝑡 − 𝜃1 𝜀𝑡−1 − 𝜃2 𝜀𝑡−2 − ⋯ − 𝜃𝑞 𝜀𝑡−𝑞

atau

𝑍𝑡 = (1 − 𝜃1 𝐵−𝜃2 𝐵2 − ⋯ −𝜃𝑞 𝐵𝑞 )𝜀𝑡

iid
dengan 𝜀𝑡 merupakan unsur residual yang menyebar normal dan independen 𝜀𝑡 ~

N(0,2) dan 𝜃1 , 𝜃2 , … , 𝜃𝑞 adalah parameter MA.

20
Sebagai contoh, model MA dengan orde 1 atau disebut model MA(1)

menyatakan pengamatan waktu sekarang dipengaruhi kesalahan waktu sekarang

dan kesalahan satu waktu sebelumnya. Model MA(1) dimodelkan sebagai berikut

𝑍𝑡 = 𝜀𝑡 − 𝜃1 𝜀𝑡−1

Model ARMA merupakan campuran dari proses AR dan MA. Model

ARMA digunakan untuk menggambarkan pengamatan waktu sekarang

(𝑍𝑡 ) dipengaruhi oleh pengamatan waktu sebelumnya (𝑍𝑡−𝑝 ), kesalahan

sekarang (𝜀𝑡 ) dan kesalahan waktu sebelumnya (𝜀𝑡−𝑞 ). Menurut Makridakis

(1999), model ARMA(p,q) merupakan model umum untuk campuran proses

AR(p) dan MA(q) dituliskan sebagai berikut

𝑍𝑡 = 𝜙1 𝑍𝑡−1 + ⋯ + 𝜙𝑝 𝑍𝑡−𝑝 + 𝜀𝑡 − 𝜃1 𝜀𝑡−1 − ⋯ − 𝜃𝑞 𝜀𝑡−𝑞 (2.9)

atau

𝜙𝑝 (𝐵)𝑍𝑡 = 𝜃𝑞 (𝐵)𝜀𝑡

dengan

𝜙𝑝 (𝐵) = 1 − 𝜙1 𝐵 − 𝜙2 𝐵2 − ⋯ − 𝜙𝑝 𝐵𝑝

𝜃𝑞 (𝐵) = 1 − 𝜃1 𝐵 − 𝜃2 𝐵2 − ⋯ − 𝜃𝑞 𝐵𝑞

Sebagai contoh, model ARMA (1,1) merupakan model campuran proses

AR(1) dan MA(1) yang menyatakan pengamatan waktu sekarang dipengaruhi

pengamatan satu waktu sebelumnya, kesalahan waktu sekarang dan kesalahan

satu waktu sebelumnya. Model ARMA(1,1) dimodelkan sebagai berikut

𝑍𝑡 = 𝜙1 𝑍𝑡−1 + 𝜀𝑡 − 𝜃1 𝜀𝑡−1

21
Jika data stasioner pada proses diferencing sebanyak d kali, dengan model

dasar ARMA (p,q) , maka model yang terbentuk menjadi ARIMA (p,d,q).

Menurut Wei (2006), model ARIMA (p,d,q) dituliskan sebagai

𝜙𝑝 (𝐵)(1 − 𝐵)𝑑 𝑍𝑡 = 𝜃𝑞 (𝐵)𝜀𝑡

dengan

𝜙𝑝 : parameter AR

𝜃𝑞 : parameter MA

B : operator Backshift

(1 − 𝐵)𝑑 : differencing dengan orde d

iid
𝜀𝑡 : residual yang menyebar normal dan independen 𝜀𝑡 ~ N(0,2)

Apabila differencing pertama dilakukan terhadap model agar menjadi

stasioner, maka dengan model dasar ARMA(1,1) model akan membentuk model

ARIMA (1,1,1) dituliskan sebagai

𝜙1 (𝐵)(1 − 𝐵) 𝑍𝑡 = 𝜃1 (𝐵)𝜀𝑡

atau dapat diuraikan sebagai

𝑍𝑡 = 𝑍𝑡−1 + 𝜙1 𝑍𝑡−1 − 𝜙1 𝑍𝑡−2 + 𝜀𝑡 − 𝜃1 𝜀𝑡−1

2.7. Support Vector Machine (SVM)

Support Vector Machine (SVM) adalah suatu teknik yang dikembangkaan

pertama kali oleh Boser, Guyon dan Vapnik pada tahun 1992 untuk melakukan

prediksi dalam kasus klasifikasi maupun regresi. Selanjutnya, SVM untuk kasus

regresi dikenal sebagai SVR. SVM merupakan salah satu algoritma untuk

mengatasi masalah pengenalan pada dua pola dengan menetapkan vector space.

22
Penetapan vector space tersebut bertujuan untuk mencari decision surface terbaik

dalam membagi data kedalam dua kelas dan margin antar dua kelas tersebut.

Decision surface dalam kasus data yang terbagi linear (linearly separable) adalah

hyperplane.

Konsep SVM dapat dijelaskan secara sederhana sebagai usaha mencari

hyperplane terbaik yang berfungsi sebagai pemisah dua buah kelas secara

linear pada input space (Vapnik, 1995). Gambar 2.2 memperlihatkan beberapa

pattern yang merupakan anggota dari dua buah kelas +1 dan –1. Pattern yang

tergabung pada kelas –1 disimbolkan dengan warna merah (kotak), sedangkan

pattern pada kelas +1, disimbolkan dengan warna kuning (lingkaran).

(a) (b)

Gambar 2.2. (a). Kemungkinan Hyperplane Dalam Model Klasifikasi.

(b). Hyperplane Optimal dengan Margin Optimal

Pada Gambar 2.2 (a) terdapat banyak kemungkinan untuk mendapat

hyperplane optimal sebagai pemisah dua kelas secara linear pada input space.

Hyperplane pemisah terbaik antara kedua kelas dapat ditemukan dengan

mengukur margin hyperplane tersebut dan mencari titik maksimalnya. Margin

23
adalah jarak antara hyperplane tersebut dengan pattern terdekat dari masing-

masing kelas. Pattern yang paling dekat ini disebut sebagai support vector. Pada

Gambar 2.2 (b), garis solid menunjukkan hyperplane yang terbaik, yaitu yang

terletak tepat pada tengah-tengah kedua kelas. Jarak antara garis solid dengan

garis putus-putus disebut margin, sedangkan sedangkan titik merah dan kuning

yang berada dalam lingkaran hitam adalah support vector.

Misalnya terdapat n set data training, (𝐱 𝑖 , 𝑦𝑖 ) dengan 𝑖 = 1,2, … , 𝑛 dengan


𝑇
𝐱 𝑖 = {𝑥1 , 𝑥2 , … , 𝑥𝑝 } ∈ 𝑅𝑛 merupakan atribut set untuk data ke-i dan 𝑦𝑖 ∈

{−1, +1} menyatakan label kelas. Hyperplane klasifikasi linear SVM dinotasikan

sebagai

𝐰. 𝐱 𝑖 + 𝑏 = 0

dengan 𝐰 adalah vektor parameter (bobot) dan b adalah konstanta (bias). Data 𝑥𝑖

yang masuk ke dalam kelas (-1) adalah data yang memenuhi pertidaksamaan

𝐰. 𝐱 𝑖 + 𝑏 ≤ −1 untuk 𝑦𝑖 = −1. (2.10)

Data 𝑥𝑖 yang masuk ke dalam kelas (+1) adalah data yang memenuhi

pertidaksamaan

𝐰. 𝐱 𝑖 + 𝑏 ≥ +1 untuk 𝑦𝑖 = +1. (2.11)

Misalkan 𝑥𝑎 berada di kelas -1 adalah data pada support vector sehingga

memenuhi persamaan

𝐰. 𝐱 𝑎 + 𝑏 = −1 (2.12)

dan 𝑥𝑏 berada di kelas +1 adalah data pada support vector sehingga memenuhi

persamaan

𝐰. 𝐱 𝑏 + 𝑏 = +1. (2.13)

24
Margin dapat dihitung dengan mengurangkan persamaan (2.13) dengan

persamaan (2.12) sehingga diperoleh

𝐰(𝐱 𝑏 − 𝐱 𝑎 ) = 2 (2.14)

Margin hyperplane diberikan oleh jarak antara dua hyperplane dari dua kelas

tersebut. Notasi pada persamaan (2.14) diringkas menjadi

2
‖𝐰‖ . 𝑑 = 2 atau 𝑑 = (2.15)
‖𝐰‖

dengan 𝑑 adalah margin. Untuk mendapatkan margin hyperplane yang optimal

ekuivalen dengan meminimumkan jarak (norm) dari 𝐰 sehingga persamaan (2.15)

dapat diselesaikan dengan metode quadratic programming dengan meminimalkan

invers persamaan (2.15) yaitu

1
min ‖𝐰‖ 2
𝑤 2

dengan kendala persamaan (2.10) dan (2.11) persamaan yang dituliskan kembali

sebagai

𝑦𝑖 (𝐰. 𝐱 𝑖 + 𝑏) ≥ 1, 𝑖 = 1,2, … , 𝑛.

Metode quadratic programming dapat menjadi solusi masalah tersebut karena

merupakan metode optimasi. Optimasi berarti memaksimumkan atau

meminimumkan sebuah fungsi yang diberikan untuk beberapa macam kendala

(Licker, 2003).

Pada kenyataanya, data training tidak selalu terpisah secara linear (linearly

separable), adakalanya data terpisah secara nonlinear (nonlinearly separable).

Algoritma SVM untuk mengatasi kasus data terpisah secara linear juga mampu

untuk mengatasi kasus data terpisah secara nonlinear menggunakan Soft Margin

25
Hyperplane, atau dengan memetakan vektor pada data asli di input space ke ruang

berdimensi lebih tinggi feature space, dimana fitur baru yang mengandung

interaksi terms dari data asli dan titik data pada feature space tersebut akan

terbagi secara linear (Vapnik, 1995). Gambar 2.3 menunjukkan contoh pemetaan

dari input space ke feature space dengan dimensi yang lebih tinggi. Jika terdapat

data x dengan fungsi pemetaan dinotasikan sebagai 𝜑(𝐱), diharapkan hyperplane

pada feature space mampu memisahkan kedua kelas yang pada dimensi

sebelumnya tidak dapat dipisahkan secara optimal.

Gambar 2.3. Transformasi 𝜑 dari Input Space ke Feature Space

Selanjutnya proses pada SVM untuk menemukan titik-titik support vector,

bergantung pada perkalian skalar (dot product) dari data yang sudah

ditransformasikan pada feature space, 𝜑(𝐱 𝑖 ). 𝜑(𝐱). Pada umumnya transformasi

𝜑 tidak diketahui dan sulit dipahami secara mudah sehingga dapat digantikan

dengan metode kernel. Hal ini disebut sebagai kernel trick (Pratama, 2018).

Kernel trick memberikan berbagai kemudahan pada SVM karena untuk

menentukan support vector, kita hanya cukup mengetahui fungsi kernel yang

dipakai dan tidak perlu mengetahui wujud dari fungsi nonlinear 𝜑.

26
2.8. Pemrograman Kuadratis (Quadratic Programming)

Pemrograman kuadratis (quadratic programming) adalah masalah optimasi

dimana memaksimumkan atau meminimumkan fungsi tujuan yang berbentuk

kuadratis dengan fungsi kendalanya berbentuk persamaan atau pertidaksamaan

linier (Pramudhitasari, 2016). Bentuk umum dari quadratic programming dengan

variabel 𝐱 = {𝑥1 , 𝑥2 , … , 𝑥𝑛 }𝑇 adalah sebagai berikut


𝑛 𝑛 𝑛
1
𝑓 (𝐱) = ∑ 𝑐𝑖 𝑥𝑖 + ∑ ∑ 𝑞𝑘𝑖 𝑥𝑘 𝑥𝑖. (2.16)
2
𝑖=1 𝑘=1 𝑖=1

Persamaan (2.16) dapat disederhanakan menggunakan notasi matriks

sebagai berikut

1
𝑓(𝐱) = 𝐜 𝑇 𝐱 + 𝐱 𝑇 𝐐𝐱
2

dengan 𝑓 (𝐱) adalah fungsi tujuan, kendala 𝐀𝐱 ≤ 𝐛 dan 𝐱 ≥ 0. 𝐐 merupakan

matriks simetris berukuran 𝑛 × 𝑛 yang dikenal sebagai matriks Hessian, 𝐀

merupakan matriks kendala berukuran 𝑛 × 𝑛, c merupakan vektor dari fungsi

tujuan berukuran 𝑛 × 1 dan 𝐛 merupakan vektor dari kendala bagian kanan

berukuran 𝑛 × 1.

2.9. Pengali Lagrange

Pengali lagrange digunakan untuk menyelesaikan masalah optimasi

dengan pembatas (constraint optimization) dimana pembatasan berupa persamaan

yang ditandai dengan =, bukan ≤ atau ≥. Dengan pengali lagrange, masalah

optimasi dengan pembatas akan dikonversi menjadi masalah optimasi tanpa

pembatas (unconstraint optimization). Prinsip metode ini adalah mencari nilai

27
optimal suatu fungsi tujuan dengan kendala-kendala tertentu yang harus dipenuhi.

Sebagai contoh diberikan suatu fungsi tujuan sebagai masalah optimasi dengan

kendala berupa persamaan sebagai berikut

Fungsi tujuan : min𝑓 (𝐱) dengan 𝐱 = {𝑥1 , 𝑥2 , … , 𝑥𝑛 }𝑇 (2.17)

Kendala : ℎ𝑗 (𝐱) = 0 dengan 𝑗 = 1,2, … , 𝑚

Pengali lagrange akan mengubah masalah pada persamaan (2.17) menjadi

masalah tanpa pembatas sebagai berikut


𝑚

min𝐿(𝐱, 𝛼 ) = 𝑓 (𝐱) − ∑ 𝛼𝑗 ℎ𝑗 (𝐱)


𝑗=1

dengan fungsi 𝐿(𝐱, 𝛼 ) merupakan fungsi lagrange dan 𝛼 merupakan pengali

lagrange. Selanjutnya untuk mencari nilai 𝐱 dan 𝛼 yang optimal dilakukan

penurunan fungsi lagrange (Santosa, 2007). Sehingga persamaan fungsi lagrange

dipecahkan menjadi n+m persamaan sebagai berikut

𝜕𝐿(𝐱,𝛼)
= 0 dengan 𝑖 = 1,2, … , 𝑛
𝜕𝑥𝑖

𝜕𝐿(𝐱,𝛼)
= 0 dengan 𝑗 = 1,2, … , 𝑚
𝜕𝛼𝑗

2.10. Kondisi Karush-Kuhn-Tucker

Pada Tahun 1951 Kuhn Tucker mengemukakan suatu teknik optimisasi

yang dapat digunakan untuk pencarian titik optimum dari suatu fungsi yang

berkendala yaitu metode Karush-Kuhn-Tucker (KKT). Metode ini dapat

digunakan untuk mencari solusi yang optimum dari suatu fungsi tanpa

memandang sifat dari fungsi tersebut apakah linear atau nonlinear. Sehingga

28
metode KKT dapat digunakan untuk memecahkan persoalan baik linear maupun

nonlinear.

Pada umumnya fungsi tujuan suatu masalah optimasi memiliki kendala

berupa persamaan. Akan tetapi, terdapat masalah optimasi yang memiliki kendala

berupa pertidaksamaan. Misalkan terdapat masalah optimasi sebagai berikut

Fungsi tujuan : min𝑓 (𝐱) dengan 𝐱 = {𝑥1 , 𝑥2 , … , 𝑥𝑛 }𝑇

Kendala : ℎ𝑗 (𝐱) ≥ 0, dengan 𝑗 = 1,2, … , 𝑚.

Menurut De Klerk (2005) dalam Amalia (2009), prosedur menggunakan

kondisi KKT untuk memecahkan suatu masalah optimasi dalam pemrograman

kuadratis dengan kendala berupa suatu pertidaksamaan secara essensial

melibatkan langkah-langkah yang sama seperti halnya dalam menggunakan

pengali lagrange untuk memecahkan masalah optimasi dengan kedala berupa

persamaan yaitu membentuk lagrangian sebagai berikut

1
𝐿(𝐱, 𝐲) = 𝐱 𝑇 𝐐𝐱 + 𝐜 𝑇 𝐱 + 𝛼 (𝑨𝐱 − 𝐛 )
2

dengan 𝛼 adalah pengali lagrange. Maka kondisi KKT dari persoalan persamaan

terpenuhi jika

𝜕𝐿
1) ≥ 0 atau 𝐱 𝑇 𝐐 + 𝐜 𝑇 + 𝛼𝐀 ≥ 0
𝜕𝑥𝑖

𝜕𝐿
2) ≥ 0 atau 𝐀𝐱 − 𝐛 ≥ 0
𝜕𝛼𝑗

𝜕𝐿
3) 𝑥𝑖 𝜕𝑥 = 0 atau 𝐱 𝑇 (𝐐𝐱 + 𝐜 + 𝐀𝑇 𝛼 ) = 0
𝑖

4) 𝛼𝑗 ℎ𝑗 (𝐱) = 0 atau 𝛼(𝐀𝐱 − 𝐛 ) = 0

5) 𝑥𝑖 ≥ 0

6) 𝛼𝑗 ≥ 0

29
BAB III

MODEL HYBRID SARIMA-SVR

3.1. Sumber Data

Data yang digunakan dalam penelitian ini adalah data sekunder yang

diperoleh dari Badan Pusat Statistik (BPS). Data dalam penelitian ini merupakan

data harga gabah di tingkat petani yang bersumber dari survei monitoring harga

produsen gabah bulanan yang dilakukan oleh BPS. Survei harga beras tersebut

didasarkan pada transaksi penjualan gabah oleh petani di seluruh provinsi di

Indonesia. Data merupakan data deret waktu periode Januari 2009 sampai dengan

September 2019 atau sebanyak 129 data deret waktu.

3.2. Variabel Penelitian

Model deret waktu yang digunakan adalah model deret waktu univariat,

sehingga hanya terdapat satu variabel yang digunakan dalam penelitian, yaitu data

harga gabah di tingkat petani. Harga gabah tersebut merupakan rata-rata harga

bulanan. Menurut kualitas gabahnya, data yang digunakan pada penelitian ini

adalah gabah dengan kualitas gabah kering giling (GKG).

3.3. Model Seasonal Autoregressive Integrated Moving Average (SARIMA).

Musiman merupakan fenomena dalam kehidupan sehari-hari yang berarti

kecenderungan mengulangi pola tingkah gerak dalam periode musim, biasanya

satu tahun untuk data bulanan namun tidak menutup kemungkinan untuk periode

30
musim yang lain. Model ARIMA yang melibatkan efek musiman didalamnya

disebut juga dengan model SARIMA. Model SARIMA terdiri dari dua bagian,

yaitu bagian tidak musiman dan bagian musiman. Bagian tidak musiman dari

model SARIMA merupakan model ARIMA yang dijelaskan pada Subbab 2.6.

Sedangkan bagian musiman model SARIMA merupakan model AR musiman,

MA musiman atau campuran AR musiman dan MA musiman.

Bentuk umum dari proses AR musiman untuk periode S dan orde P atau

AR(P)S didefinisikan sebagai

𝑍𝑡 = Φ1 𝑍𝑡−𝑆 + Φ2 𝑍𝑡−2𝑆 + Φ3 𝑍𝑡−3𝑆 + ⋯ + Φ𝑃 𝑍𝑡−𝑃𝑆 + 𝜀𝑡

atau

(1 − Φ1 𝐵 𝑠 − Φ2 𝐵2𝑠 − ⋯ − Φ𝑃 𝐵𝑃𝑠 )𝑍𝑡 = 𝜀𝑡


iid
dengan 𝜀𝑡 merupakan unsur residual yang menyebar normal dan independen 𝜀𝑡 ~

N(0,2) dan Φ1, Φ2 , … , Φ𝑃 adalah parameter AR musiman.

Sebagai contoh untuk model AR(P)S akan diperlihakan AR(1)12 yaitu suatu

proses 𝑍𝑡 dikatakan mengikuti model AR(1)12, jika 𝑍𝑡 mengikuti model

𝑍𝑡 = Φ1 𝑍𝑡−12 + 𝜀𝑡

Bentuk umum dari proses MA musiman periode S dan orde Q atau MA(Q)S

didefinisikan sebagai

𝑍𝑡 = 𝜀𝑡 − Θ1 𝜀𝑡−𝑆 − Θ2 𝜀𝑡−2𝑆 − ⋯ − −Θ𝑄 𝜀𝑡−𝑄𝑆

atau

𝑍𝑡 = (1 − Θ1 𝐵 𝑆 − Θ2 𝐵2𝑆 − ⋯ − Θ𝑄 𝐵𝑄𝑆 )𝜀𝑡

iid
dengan 𝜀𝑡 merupakan unsur residual yang menyebar normal dan independen 𝜀𝑡 ~

N(0,2) dan Θ1 , Θ2 , … , Θ𝑄 adalah parameter MA musiman

31
Sebagai contoh untuk model MA(Q)S akan diperlihakan MA(1)12 yaitu suatu

proses 𝑍𝑡 dikatakan mengikuti model MA(1)12, jika 𝑍𝑡 mengikuti model

𝑍𝑡 = 𝜀𝑡 − Θ1 𝜀𝑡−12

Secara umum, model SARIMA(p,d,q) (P,D,Q)S dengan p menunjukkan

orde AR, d adalah orde proses differencing, q menunjukkan orde MA, P

menunjukkan orde AR musiman, D adalah orde proses differencing musiman ,Q

menunjukkan orde MA musiman dan S menunjukkan periode musiman dituliskan

sebagai berikut (Wei, 2006)

𝜙𝑝 (𝐵)Φ𝑃 (𝐵 𝑠 )(1 − 𝐵)𝑑 (1 − 𝐵 𝑆 )𝐷 𝑍𝑡 = 𝜃𝑞 (𝐵)Θ𝑄 (𝐵 𝑆 )𝜀𝑡

dengan

𝜙𝑝 : parameter AR

𝜙𝑝 (𝐵) : 1 − 𝜙1 𝐵 − 𝜙2 𝐵2 − ⋯ − 𝜙𝑝 𝐵𝑝

Φ𝑃 : parameter AR musiman

Φ𝑃 (𝐵 𝑆 ) : 1 − Φ1 𝐵 𝑠 − Φ2 𝐵2𝑠 − ⋯ − Φ𝑃 𝐵𝑃𝑠

𝜃𝑞 : parameter MA

𝜃𝑞 (𝐵) : 1 − 𝜃1 𝐵 − 𝜃2 𝐵2 − ⋯ − 𝜃𝑞 𝐵𝑞

Θ𝑄 : parameter MA musiman

Θ 𝑄 (𝐵 ) : 1 − Θ1 𝐵 𝑠 − Θ2 𝐵2𝑠 − ⋯ − Θ𝑄 𝐵𝑄𝑠

(1 − 𝐵 𝑆 )𝐷 : differencing musiman dengan orde D

(1 − 𝐵 )𝑑 : differencing dengan orde d


iid
𝜀𝑡 : residual yang menyebar normal dan independen 𝜀𝑡 ~ N(0,2)

32
Sebagai contoh untuk model SARIMA(p,d,q)(P,D,Q)S akan diperlihakan

SARIMA(1,1,0) (0,1,1)12 yaitu suatu proses 𝑍𝑡 dikatakan mengikuti model

SARIMA(1,1,0) (0,1,1)12, jika 𝑍𝑡 mengikuti model

𝜙1 (𝐵)(1 − 𝐵) (1 − 𝐵12 ) 𝑍𝑡 = Θ1 (𝐵12 )𝜀𝑡

Atau dapat diuraikan ke dalam bentuk sebagai berikut

𝜙1 (𝐵)(1 − 𝐵) (1 − 𝐵12 ) 𝑍𝑡 = Θ1 (𝐵12 )𝜀𝑡

𝜙1 (𝐵)(1 − 𝐵) (𝑍𝑡 − 𝑍𝑡−12 ) = 𝜀𝑡 − Θ1 𝜀𝑡−12

𝜙1 (𝐵)((𝑍𝑡 − 𝑍𝑡−12 ) − (𝐵𝑍𝑡 − 𝐵𝑍𝑡−12 )) = 𝜀𝑡 − Θ1 𝜀𝑡−12

𝜙1 (𝐵)((𝑍𝑡 − 𝑍𝑡−12 ) − (𝑍𝑡−1 − 𝑍𝑡−13 )) = 𝜀𝑡 − Θ1 𝜀𝑡−12

𝜙1 (𝐵)(𝑍𝑡 − 𝑍𝑡−1 − 𝑍𝑡−12 + 𝑍𝑡−13 ) = 𝜀𝑡 − Θ1 𝜀𝑡−12

𝑍𝑡 − 𝜙1 𝑍𝑡−1 − 𝑍𝑡−1 + 𝜙1 𝑍𝑡−2 − 𝑍𝑡−12 + 𝜙1 𝑍𝑡−13 + 𝑍𝑡−13 − 𝜙1 𝑍𝑡−14 = 𝜀𝑡 − Θ1 𝜀𝑡−12

𝑍𝑡 = 𝑍𝑡−1 + 𝑍𝑡−12 − 𝑍𝑡−13 + 𝜙1 𝑍𝑡−1 − 𝜙1 𝑍𝑡−2 − 𝜙1 𝑍𝑡−13 + 𝜙1 𝑍𝑡−14 + 𝜀𝑡 − Θ1 𝜀𝑡−12

3.3.1. Identifikasi Model SARIMA

Sebagai langkah identifikasi awal model SARIMA adalah asumsi

kestasioneran dan pola musiman. Jika data tidak memenuhi asumsi kestasioneran,

maka dilakukan differencing (bila diperlukan dilakukan differencing musiman)

apabila tidak stasioner dalam rata-rata dan dilakukan transformasi jika tidak

stasioner dalam varian. Setelah asumsi kestasioneran terpenuhi, penentuan orde

AR, MA, AR musiman, dan MA musiman pada model SARIMA dilihat dengan

menggunakan plot Autocorrelation Function (ACF) dan Partial Autocorrelation

Function (PACF).

33
Estimasi nilai ACF dan PACF pada dasarnya digunakan untuk menjelaskan

pola yang ada di dalam suatu data deret waktu, baik secara grafik maupun

numerik. Nilai ACF dan PACF sering digunakan untuk menemukan model terbaik

secara cepat (Pankratz, 1983). Nilai estimasinya menunjukkan bagaimana suatu

observasi data deret waktu univariat berkorelasi. Plot estimasi ACF (𝜌̂𝑘 ) dan

PACF (𝜙̂𝑘,𝑘 ) dengan lag k dinamakan correlogram.

Dasar dalam analisis ACF adalah menghitung koefisien korelasi pada

masing-masing pasangan variabel (𝑍𝑡 , 𝑍𝑡+𝑘 ). Menurut Wei (2006), rumus ACF

adalah sebagai berikut

𝛾̂𝑘 ∑𝑛−𝑘 ̅ ̅
𝑡=1 (𝑍𝑡 − 𝑍 )(𝑍𝑡+𝑘 − 𝑍 )
𝜌̂𝑘 = = , 𝑘 = 1,2, … (3.1)
𝛾̂0 ∑𝑛−𝑘 ̅ 2
𝑡=1 (𝑍𝑡 − 𝑍 )

dengan Z̅ = ∑n−k
t=1 Zt ⁄n, nilai korelasi berada antara −1 < ρ
̂ k < 1, autokovarians

𝛾̂𝑘 = 𝛾̂−𝑘 , autokorelasi 𝜌̂𝑘 = 𝜌̂−𝑘 , dan 𝛾̂0 = 𝑣𝑎𝑟(𝑍𝑡 ), serta 𝜌̂0 = 1. Apabila nilai

ACF membentuk pola turun secara perlahan (dies down), maka data deret waktu

tidak stasioner (Pankratz, 1983).

Dasar dalam analisis PACF adalah menghitung koefisien korelasi pada

masing-masing pasangan variabel (𝑍𝑡 , 𝑍𝑡+𝑘 ) dengan memperhitungkan efek dari

intervensi diantara pasangan variabel tersebut (𝑍𝑡+1 , 𝑍𝑡+2 , … , 𝑍𝑡+𝑘−1 ). Misalnya,

untuk menghitung autokorelasi pada 𝑍𝑡 dan 𝑍𝑡+3 , juga harus memperhitungkan

korelasi 𝑍𝑡+1 dan 𝑍𝑡+2 terhadap 𝑍𝑡+3 . Nilai korelasi pada PACF menggunakan

nilai estimasi koefisien regresi secara OLS karena koefisien regresi

menginterpretasikan hubungan antara variabel respon dengan variabel prediktor

34
dengan mempertimbangkan efek terhadap variabel lain. Rumus PACF menurut

Wei (2006) adalah sebagai berikut

𝜌̂𝑘+1 − ∑𝑘𝑗=1 𝜙̂𝑘,𝑗 𝜌̂𝑘+1−𝑗


𝜙̂𝑘+1,𝑘+1 = , 𝑗 = 1,2, … , 𝑘 (3.2)
1 − ∑𝑘𝑗=1 𝜙̂𝑘,𝑗 𝜌̂𝑗

dengan 𝜙̂11 = 𝜌̂1 , dan 𝜙̂𝑘+1,𝑗 = 𝜙̂𝑘,𝑗 − 𝜙̂𝑘+1,𝑘+1 𝜙̂𝑘,𝑘+1−𝑗 . Apabila nilai PACF

membentuk pola turun secara perlahan (dies down), maka data deret waktu tidak

stasioner.

Orde waktu untuk model AR dan AR musiman ditentukan dengan melihat

pola memotong dalam plot PACF, sedangkan orde waktu untuk model MA dan

MA musiman ditentukan dengan melihat pola memotong dalam plot ACF. Jika

plot PACF membentuk pola memotong atau cut off pada lag p, maka model yang

tepat adalah AR orde p. Jika plot ACF membentuk pola memotong atau cut off

pada lag q, maka model yang tepat adalah MA ored q atau MA(q). Sedangkan

untuk pola musiman, jika plot PACF membentuk pola memotong atau cut off pada

lag musiman P, maka model yang tepat adalah AR musiman orde P. Jika plot

ACF membentuk pola memotong atau cut off pada lag musiman Q, maka model

yang tepat adalah MA musiman orde Q.

3.3.2. Estimasi Parameter Model SARIMA

Salah satu metode yang dapat digunakan untuk estimasi parameter model

SARIMA adalah Maximum Likelihood Estimation (MLE). Menurut Wei (2006),

pada prinsipnya semua model ARIMA atau SARIMA dapat dikembalikan ke

bentuk ARMA (p,q). Oleh karena itu, proses estimasi parameter model SARIMA

35
dapat mengikuti proses pendugaan untuk model ini. Bentuk umum model

ARMA (p,q) pada persamaan (2.9) dapat ditulis dalam persamaan

𝜀𝑡 = 𝑍𝑡 − 𝜙1 𝑍𝑡−1 − 𝜙2 𝑍𝑡−2 − ⋯ − 𝜙𝑝 𝑍𝑡−𝑝 + 𝜃1 𝜀𝑡−1 + 𝜃2 𝜀𝑡−2 + ⋯ +

𝜃𝑞 𝜀𝑡−𝑞 (3.3)

Untuk memudahkan persamaan (3.3) dapat ditulis dengan


𝑝 𝑞

𝜀𝑡 = 𝑍𝑡 − ∑ 𝜙𝑖 𝑍𝑡−𝑖 + ∑ 𝜃𝑗 𝜀𝑡−𝑗 (3.4)


𝑖=1 𝑗=1

iid
Dengan asumsi bahwa 𝜀𝑡 adalah sebuah proses white noise dan independen 𝜀𝑡 ~

N(0,2), maka fungsi kepadatan gabungan dari 𝜀 = (𝜀1 , 𝜀2 , … , 𝜀𝑛 ) adalah


𝑛
1
𝑃(𝜀|𝜙, 𝜇, 𝜃, 𝜎𝜀2 ) = (2𝜋𝜎𝜀2 )−𝑛⁄2 exp (− 2 ∑ 𝜀𝑡2 ) (3.5)
2𝜎𝜀
𝑡=1

Dengan memasukkan persamaan (3.4) ke dalam persamaan (3.5) sehingga

diperoleh fungsi parameter model ARMA (p,q) :

𝑛 𝑝
1
𝑃(𝜙, 𝜇, 𝜃, 𝜎𝜀2 ) = (2𝜋𝜎𝜀2 )−𝑛⁄2 exp (− 2 ∑ (𝑍𝑡 − ∑ 𝜙𝑖 𝑍𝑡−𝑖
2𝜎𝜀
𝑡=1 𝑖=1

𝑞 2

+ ∑ 𝜃𝑗 𝜀𝑡−𝑗 ) ) (3.6)
𝑗=1

dengan mengambil log natural dari persamaan (3.6) diperoleh persamaan berikut

𝐿 = ln 𝑃 (𝜙, 𝜇, 𝜃, 𝜎𝜀2 )

𝑝 𝑞 2
𝑛
𝑛 1
= − ln(2𝜋𝜎𝜀2 ) − 2 ∑ (𝑍𝑡 − ∑ 𝜙𝑖 𝑍𝑡−𝑖 + ∑ 𝜃𝑗 𝜀𝑡−𝑗 ) (3.7)
2 2𝜎𝜀
𝑡=1 𝑖=1 𝑗=1

36
Estimasi parameter 𝜙𝑝 dan 𝜃𝑞 dari model ARMA(p,q) dapat diperoleh dengan

menyelesaikan 𝜕𝐿⁄𝜕𝜙𝑝 = 0 dan 𝜕𝐿⁄𝜕𝜃𝑞 = 0.

Sebagai gambaran dilakukan estimasi parameter 𝜙1 dan 𝜃1 pada model

ARMA(1,1). Dengan memasukkan nilai p=1 dan q=1 pada persamaan (3.7)

diperoleh persamaan sebagai berikut

𝐿 = ln 𝑃(𝜙, 𝜇, 𝜃, 𝜎𝜀2 )
2
𝑛 1 1
𝑛 1
= − ln(2𝜋𝜎𝜀2 ) − 2 ∑ (𝑍𝑡 − ∑ 𝜙𝑖 𝑍𝑡−𝑖 + ∑ 𝜃𝑗 𝜀𝑡−𝑗 )
2 2𝜎𝜀
𝑡=1 𝑖=1 𝑗=1

𝑛
𝑛 1
= ln(2𝜋𝜎𝜀2 ) − 2 ∑(𝑍𝑡 − 𝜙1 𝑍𝑡−1 + 𝜃1 𝜀𝑡−1 )2 .
2 2𝜎𝜀
𝑡=1

Sehingga estimasi parameter AR(1) adalah


𝑛 𝑛
𝜕𝐿 2
= (− 2 ∑(𝑍𝑡 − 𝜙1 𝑍𝑡−1 + 𝜃1 𝜀𝑡−1 )) (∑ −(𝑍𝑡−1 ))
𝜕𝜙1 2𝜎𝜀
𝑡=1 𝑡=1

𝑛
1
= − 2 ∑[(𝑍𝑡 − 𝜙1 𝑍𝑡−1 + 𝜃1 𝜀𝑡−1 )(−(𝑍𝑡−1 ))]
𝜎𝜀
𝑡=1

𝑛 𝑛 𝑛
𝑍𝑡 𝑍𝑡−1 𝜙1 (𝑍𝑡−1 )2 𝜃1 𝜀𝑡−1 𝑍𝑡−1
=∑ 2
− ∑ 2
−∑ .
𝜎𝜀 𝜎𝜀 𝜎𝜀2
𝑡=1 𝑡=1 𝑡=1

𝜕𝐿
Dengan menyamakan 𝜕𝜙 = 0 diperoleh
1

𝑛 𝑛 𝑛
𝜙̂1 (𝑍𝑡−1 )2 𝑍𝑡 𝑍𝑡−1 𝜃1 𝜀𝑡−1 𝑍𝑡−1
∑ = ∑ − ∑
𝜎𝜀2 𝜎𝜀2 𝜎𝜀2
𝑡=1 𝑡=1 𝑡=1

𝑛 𝑛 𝑛
(𝑍𝑡−1 )2 𝑍𝑡 𝑍𝑡−1 𝜃1 𝜀𝑡−1 𝑍𝑡−1
𝜙̂1 ∑ 2
=∑ 2
−∑
𝜎𝜀 𝜎𝜀 𝜎𝜀2
𝑡=1 𝑡=1 𝑡=1

37
𝑛 𝑛 𝑛
𝑍𝑡 𝑍𝑡−1 𝜃1 𝜀𝑡−1 𝑍𝑡−1 𝜎𝜀2
̂
𝜙1 = (∑ −∑ ) (∑ )
𝜎𝜀2 𝜎𝜀2 (𝑍𝑡−1 )2
𝑡=1 𝑡=1 𝑡=1

𝑛 𝑛
𝑍𝑡 𝑍𝑡−1 𝜃1 𝜀𝑡−1 𝑍𝑡−1
𝜙̂1 = ∑ 2
−∑
(𝑍𝑡−1 ) (𝑍𝑡−1 )2
𝑡=1 𝑡=1

𝑛 𝑛
𝑍𝑡 𝜃1 𝜀𝑡−1
𝜙̂1 = ∑ −∑ .
𝑍𝑡−1 𝑍𝑡−1
𝑡=1 𝑡=1

Sedangkan estimasi parameter MA(1) adalah


𝑛 𝑛
𝜕𝐿 2
= (− 2 ∑(𝑍𝑡 − 𝜙1 𝑍𝑡−1 + 𝜃1 𝜀𝑡−1 )) (∑ 𝜀𝑡−1 )
𝜕𝜃1 2𝜎𝜀
𝑡=1 𝑡=1

𝑛
1
= − 2 ∑[(𝑍𝑡 − 𝜙1 𝑍𝑡−1 + 𝜃1 𝜀𝑡−1 )(𝜀𝑡−1 )]
𝜎𝜀
𝑡=1

𝑛 𝑛 𝑛
𝑍𝑡 𝜀𝑡−1 𝜙1 𝑍𝑡−1 𝜀𝑡−1 𝜃1 (𝜀𝑡−1 )2
=∑ − ∑ − ∑ .
𝜎𝜀2 𝜎𝜀2 𝜎𝜀2
𝑡=1 𝑡=1 𝑡=1

𝜕𝐿
Dengan menyamakan 𝜕𝜃 = 0 diperoleh
1

𝑛 𝑛 𝑛
𝜃̂1 (𝜀𝑡−1 )2 𝑍𝑡 𝜀𝑡−1 𝜙1 𝑍𝑡−1 𝜀𝑡−1
∑ 2
=∑ 2
−∑
𝜎𝜀 𝜎𝜀 𝜎𝜀2
𝑡=1 𝑡=1 𝑡=1

𝑛 𝑛 𝑛
(𝜀𝑡−1 )2 𝑍𝑡 𝜀𝑡−1 𝜙1 𝑍𝑡−1 𝜀𝑡−1
𝜃̂1 ∑ 2
=∑ 2
−∑
𝜎𝜀 𝜎𝜀 𝜎𝜀2
𝑡=1 𝑡=1 𝑡=1

𝑛 𝑛 𝑛
𝑍𝑡 𝜀𝑡−1 𝜙1 𝑍𝑡−1 𝜀𝑡−1 𝜎𝜀2
̂
𝜃1 = (∑ −∑ ) (∑ )
𝜎𝜀2 𝜎𝜀2 (𝜀𝑡−1 )2
𝑡=1 𝑡=1 𝑡=1

𝑛 𝑛
𝑍𝑡 𝜀𝑡−1 𝜙1 𝑍𝑡−1 𝜀𝑡−1
𝜃̂1 = ∑ 2
−∑
(𝜀𝑡−1 ) (𝜀𝑡−1 )2
𝑡=1 𝑡=1

𝑛 𝑛
𝑍𝑡 𝜙1 𝑍𝑡−1
𝜃̂1 = ∑ −∑ .
𝜀𝑡−1 𝜀𝑡−1
𝑡=1 𝑡=1

38
3.3.3. Pengujian Signifikansi Parameter

Suatu model dikatakan model yang baik apabila parameter yang diestimasi

signifikan atau nilai parameternya tidak sama dengan nol. Pengujian signifikansi

parameter dilakukan untuk melihat apakah parameter yang digunakan layak

masuk ke dalam model atau tidak. Misalkan 𝜙̂𝑖 adalah nilai estimasi dari

parameter AR pada model SARIMA dan 𝑠𝑒(𝜙̂𝑖 ) adalah standar error dari nilai

estimasi 𝜙𝑖 , maka uji signifikansi parameter AR pada model SARIMA dapat

dilakukan dengan tahapan sebagai berikut

1. Hipotesis

𝐻0 ∶ 𝜙̂𝑖 = 0, 𝑖 = 1, … , 𝑝 (Koefisien parameter tidak signifikan)

𝐻1 ∶ 𝜙̂𝑖 ≠ 0 𝑖 = 1, … , 𝑝 (Koefisien parameter signifikan)

2. Statistik uji

𝜙̂𝑖
𝑡ℎ𝑖𝑡𝑢𝑛𝑔 =
𝑠𝑒(𝜙̂𝑖 )

3. Kriteria uji

Tolak 𝐻0 jika nilai |𝑡ℎ𝑖𝑡𝑢𝑛𝑔 | > 𝑡(𝛼;𝑛−𝑝−1) atau 𝑝𝑣𝑎𝑙𝑢𝑒 < 𝛼, artinya parameter
2

signifikan terhadap model. Dengan p adalah banyaknya parameter yang

ditaksir dan n adalah banyaknya pengamatan.

Jika terdapat koefisien yang tidak signifikan, maka koefisien atau order lag

tersebut dapat dibuang dari model dan model dapat diestimasi kembali tanpa

mengikutkan order yang tidak signifikan.

39
3.3.4. Pengujian Diagnostik Model SARIMA

Uji kelayakan model digunakan untuk mengetahui apakah model dugaan

sudah memenuhi syarat suatu model layak atau tidak untuk melakukan peramalan.

Suatu model dikatakan layak jika parameter model sudah signifikan dan residual

dari model memenuhi asumsi white noise dan kenormalan.

Asumsi residual bersifat white noise maksudnya barisan variabel acak tidak

berkorelasi dengan rata-rata dan varians konstan (𝜎𝜀2 ), sehingga residual dari

masing-masing data saling independen antara satu dengan yang lainnya. Menurut

Pankratz (1983), uji white noise dilakukan dengan cara memodelkan ulang

residual yang didapatkan dari model. Untuk mendapatkan autokorelasi dari

residual, digunakan rumus

∑𝑛−𝑘
𝑡=1 (𝜀̂𝑡 − 𝜀̅)(𝜀̂𝑡+𝑘 − 𝜀̅)
𝜌𝑘 (𝜀̂) =
∑𝑛−𝑘
𝑡=1 (𝜀̂𝑡 − 𝜀̅)
2

dengan 𝜌𝑘 (𝜀̂) adalah estimasi ACF residual, k adalah orde waktu, dan n adalah

banyaknya residual. Menurut Ljung-Box (1978), mengembangkan uji

Portmanteau untuk menguji asumsi residual bersifat white noise adalah

menggunakan nilai autokorelasi yang telah distandarisasi dengan langkah

pengujian sebagai berikut

1) Hipotesis

𝐻0 ∶ 𝜌1 (𝜀̂) = 𝜌2 (𝜀̂) = ⋯ = 𝜌𝑘 (𝜀̂) = 0 (residual bersifat white noise)

𝐻1 : minimal ada satu 𝜌𝑘 (𝜀̂) ≠ 0 , 𝑘 = 1,2, … , 𝑚 (residual tidak bersifat white

noise)

2) Statistik uji

40
𝑚
𝜌𝑘2
𝑄 = 𝑛 (𝑛 + 2) ∑ ,𝑛 > 𝑘 (3.8)
𝑛−𝑘
𝑘=1

3) Kriteria uji
2
Tolak 𝐻0 jika 𝑄 > 𝜒(𝛼,𝑚−𝑝−𝑞) atau 𝑝𝑣𝑎𝑙𝑢𝑒 < 𝛼, artinya residual tidak bersifat

white noise.

Pengujian asumsi normalitas residual dilakukan dengan menggunakan

Kolmogorov Smirnov. Langkah-langkah pengujian asumsi normalitas residual

adalah sebagai berikut

1) Hipotesis

𝐻0 ∶ 𝐹𝑛 (𝑥) = 𝐹0 (𝑥 ) (residual berdistribusi normal)

𝐻1 ∶ 𝐹𝑛 (𝑥) ≠ 𝐹0 (𝑥 ) (residual tidak berdistribusi normal)

2) Statistik uji

𝐷ℎ𝑖𝑡𝑢𝑛𝑔 = sup|𝐹𝑛 (𝑥) − 𝐹0 (𝑥 )| (3.9)


𝑥

dengan

𝐹𝑛 (𝑥 ) : fungsi distribusi kumulatif dari data asal

𝐹0 (𝑥 ) : fungsi yang dihipotesiskan berdistribusi normal

3) Kriteria uji

Tolak 𝐻0 jika 𝐷ℎ𝑖𝑡𝑢𝑛𝑔 > 𝐷(1−𝛼),𝑛 , artinya residual tidak berdistribusi normal.

𝐷(1−𝛼),𝑛 diperoleh dari tabel Kolmogorov Smirnov.

3.4. Model Support Vector Regression (SVR)

Sebelum melakukan analisis data deret waktu univariat menggunakan model

SVR, data training dikonversikan ke dalam bentuk time lag yang nantinya sebagai

41
data input dalam model SVR. Untuk menentukan banyaknya lag untuk input data

pada SVR didasarkan pada penelitian Balkin (2000). Menurut Balkin (2000)

banyaknya lag untuk input SVR untuk data deret waktu bulanan adalah 1 lag

sampai 15 lag. Prosedurnya adalah dengan melakukan trial and error pada jumlah

1 lag sampai 15 lag, dipilih jumlah lag yang memiliki error terkecil.

SVR pada awalnya diusulkan oleh Vapnik (1995). SVR merupakan

penerapan SVM yang digunakan untuk kasus regresi yang outputnya berupa

bilangan riil atau kontinu. Ide dasar dari SVR yaitu dengan menentukan set data

yang dibagi menjadi data training dan data testing. Kemudian dari data training

tersebut ditentukan suatu fungsi regresi dengan batasan deviasi tertentu sehingga

dapat menghasilkan prediksi yang mendekati nilai aktual. Konsep SVR

didasarkan pada structural risk minimization (SRM), yaitu untuk mengestimasi

suatu fungsi resiko (risk function) dengan cara meminimalkan batas atas dari

generalization error.

Menurut Smola dan Scholkopf (2004), SVR menggunakan 𝜀-insensitive loss

function pada fungsi optimisasinya yang digambarkan melalui notasi 𝜀 yang

mencerminkan besaran deviasi dari nilai aktual untuk semua data training. Nilai 𝜀

menunjukkan batas dari rentang data aktual yang bisa diestimasi oleh fungsi.

Secara visual, model SVR membentuk semacam tabung (tube) yang lebarnya

masing-masing 𝜀 atau sering disebut 𝜀-tube .Ilustrasi model SVR disajikan pada

Gambar 3.1. Konsep SRM pada SVR ini menyebabkan SVR mampu mengatasi

overfitting. Overfitting merupakan kondisi dimana suatu model tidak

menggambarkan hubungan utama antara training dan testing melainkan

42
menggambarkan random error atau noise, kondisi ini akan mengakibatkan hasil

prediksi yang buruk.

(a) (b)

Gambar 3.1. (a). Ilustrasi model SVR, (b). Plot 𝜀-insensitive loss function

3.4.1. Support Vector Regression (SVR) untuk Kasus Linear

Misalkan terdapat n set data training, (𝐱 𝑖 , 𝑦𝑖 ) dengan 𝑖 = 1,2, … , 𝑛.


𝑇
Sedangkan 𝐱 𝑖 = {𝑥1 , 𝑥2 , … , 𝑥𝑝 } ∈ 𝑅𝑛 merupakan vektor dalam input space dan

𝑦𝑖 = {𝑦1 , 𝑦2 , … , 𝑦𝑛 } ∈ 𝑅 merupakan nilai output berdasarkan 𝐱 𝑖 yang bersesuaian.

Dengan SVR, akan ditemukan suatu fungsi 𝑓(𝐱 𝑖 ) yang mempunyai deviasi paling

besar 𝜀 dari nilai aktual 𝑦𝑖 untuk semua data training maka dengan SVR ketika 𝜀

sama dengan 0 akan didapatkan regresi yang sempurna. Fungsi regresi yang

sempurna dari metode SVR linear dapat dituliskan sebagai berikut

𝑓(𝐱 𝑖 ) = 𝐰. 𝐱 𝑖 + 𝑏 (3.10)

dengan w merupakan vektor bobot dan b merupakan bias. Koefisien w dan b di

sini berfungsi untuk meminimalkan fungsi resiko. Fungsi resiko minimal akan

43
membuat suatu fungsi menjadi setipis (flat) mungkin sehingga kapasitas fungsi

dapat terkontrol, hal ini dinamakan regularisasi.

Menurut Haykin (2009), koefisien w dan b pada persamaan (3.10) diestimasi

dengan cara meminimalkan fungsi resiko (risk function) sebagai berikut


𝑛
1
𝑅(𝑓 (𝐱 𝑖 )) = ‖𝐰‖ 2 + 𝐶 ∑ 𝐸𝜀 (𝑦𝑖 − 𝑓(𝐱 𝑖 ))
2
𝑖=1

atau dituliskan
𝑛
1
min ‖𝐰‖ 2 + 𝐶 ∑ 𝐸𝜀 (𝑦𝑖 − 𝑓(𝐱 𝑖 )) (3.11)
𝐰 2
𝑖=1

dengan ‖𝐰‖ adalah reguralisasi yang merupakan fungsi yang diminimumkan agar

membuat fungsi setipis (flat) mugkin. Konstanta 𝐶 (𝐶𝑜𝑠𝑡) > 0 adalah nilai tawar

(trade off) antara ketipisan fungsi 𝑓 dan batas atas deviasi lebih dari 𝜀 yang masih

bisa ditoleransi (Smola dan Scholkopf, 2004). Nilai C kemudian menjadi nilai

penalti dari data training yang memiliki deviasi lebih besar ɛ dari nilai aktual.

Jika nilai C terlalu kecil, maka fungsi akan semakin toleran terhadap kesalahan

tersebut. Sedangkan jika nilai C terlalu besar,maka fungsi akan semakin tidak

toleran terhadap kesalahan. Sedangkan 𝐸𝜀 adalah 𝜀-insensitive loss function yang

didefinisikan sebagai

|𝑦𝑖 − 𝑓 (𝐱 𝑖 )| − 𝜀, untuk |𝑦𝑖 − 𝑓 (𝐱 𝑖 )| ≥ 𝜀


𝐸𝜀 (𝑦𝑖 − 𝑓 (𝐱 𝑖 )) = {
0, lainnya .

dengan kendala

𝑦𝑖 ≤ 𝑓(𝐱 𝑖 ) + 𝜀

𝑦𝑖 ≥ 𝑓(𝐱 𝑖 ) − 𝜀

44
Fungsi regresi 𝑓 diasumsikan merupakan fungsi yang dapat

mengaproksimasi semua titik (𝐱 𝑖 , 𝑦𝑖 ) dengan presisi 𝜀. Semua titik yang berada

dalam rentang 𝑓 ± 𝜀 atau berada di dalam 𝜀-tube disebut feasible. Sedangkan titik

yang berada diluar rentang 𝑓 ± 𝜀 atau di luar 𝜀-tube disebut infeasible. Titik

infeasible ini ditambahkan dengan variabel slack positif 𝜉𝑖 , 𝜉𝑖∗ untuk mengatasi

masalah pembatas yang tidak layak (infeasible constrain) dalam masalah

optimasi. Sehingga persamaan (3.11) dapat ditranformasikan ke dalam bentuk


𝑛
1
min∗ ‖𝐰‖2 + 𝐶 ∑(𝜉𝑖 + 𝜉𝑖∗ ) (3.12)
𝑤,𝜉𝑖 ,𝜉𝑖 2
𝑖=1

dengan kendala

𝑦𝑖 ≤ 𝑓(𝐱 𝑖 ) + 𝜀 + 𝜉𝑖

𝑦𝑖 ≥ 𝑓(𝐱 𝑖 ) − 𝜀 − 𝜉𝑖∗ (3.13)

𝜉𝑖 , 𝜉𝑖∗ ≥ 0

Persamaan (3.12) menunjukkan bahwa penentuan parameter w dan b

menjadi masalah optimasi quadratic programming. Menurut Smola dan

Scholkopf (2004), untuk mendapatkan solusi masalah quadratic programming

persamaan (3.12) adalah menggunakan lagrangian dengan satu koefisien

lagrange untuk setiap kendala pada persamaan (3.13) yang dituliskan sebagai
𝑛 𝑛
1
𝐿𝑝 (𝐰, 𝑏, 𝜉𝑖 , 𝜉𝑖∗ , 𝛼𝑖 , 𝛼𝑖∗ , 𝜂𝑖 , 𝜂𝑖∗ ) = ‖𝐰‖ 2 + 𝐶 ∑(𝜉𝑖 + 𝜉𝑖∗ ) − ∑(𝜂𝑖 𝜉𝑖 + 𝜂𝑖∗ 𝜉𝑖∗ )
2
𝑖=1 𝑖=1

𝑛 𝑛

− ∑ 𝛼𝑖 (𝜀 + 𝜉𝑖 + 𝑓(𝐱 𝑖 ) − 𝑦𝑖 ) − ∑ 𝛼𝑖∗ (𝜀 + 𝜉𝑖∗ − 𝑓(𝐱 𝑖 ) + 𝑦𝑖 ) (3.14)


𝑖=1 𝑖=1

45
dengan 𝛼𝑖 , 𝛼𝑖∗ , 𝜂𝑖 , 𝜂𝑖∗ ≥ 0 adalah koefisisien lagrange. Untuk meminimualkan

lagrangian persamaan (3.14) maka dilakukan turunan parsial 𝐿𝑝 terhadap

𝐰, 𝑏, 𝜉𝑖 , dan 𝜉𝑖∗ untuk kendala optimasi sebagai berikut


𝑛
𝜕𝐿𝑝
= 0 ⇒ 𝐰 = ∑(𝛼𝑖 − 𝛼𝑖∗ ) 𝐱 𝑖 (3.15)
𝜕𝐰
𝑖=1

𝑛
𝜕𝐿𝑝
= 0 ⇒ ∑(𝛼𝑖 − 𝛼𝑖∗ ) = 0 (3.16)
𝜕𝑏
𝑖=1

𝜕𝐿𝑝
= 0 ⇒ 𝛼𝑖 + 𝜂𝑖 = 𝐶 (3.17)
𝜕𝜉𝑖

𝜕𝐿𝑝
= 0 ⇒ 𝛼𝑖∗ + 𝜂𝑖∗ = 𝐶 (3.18)
𝜕𝜉𝑖∗

dengan n merupakan banyaknya data yang menjadi support vector.

Menurut Pratama (2018), karena koefisien langrange 𝛼𝑖 dan 𝛼𝑖∗ yang tidak

diketahui dan vektor w yang bernilai besar, 𝐿𝑝 (persamaan primal) pada

persamaan (3.14) harus diubah kedalam bentuk 𝐿𝑑 (persamaan dual). Modifikasi

𝐿𝑝 menjadi 𝐿𝑑 berarti memodifikasi persamaan (3.14), yang asalnya

meminimumkan menjadi memaksimumkan. Melalui subtitusi persamaan (3.15),

(3.16), (3.17), dan (3.18) ke dalam persamaan (3.14) menghasilkan persamaan

dual untuk problem optimisasi dari SVR sebagai berikut


𝑛 𝑛 𝑛
1
𝐿𝑑 (𝛼𝑖 , 𝛼𝑖∗ ) = ∑ 𝑦𝑖 (𝛼𝑖 −𝛼𝑖∗ ) − 𝜀 ∑(𝛼𝑖 +𝛼𝑖∗ ) − ∑ (𝛼𝑖 −𝛼𝑖∗ )(𝛼𝑗 −𝛼𝑗∗ )𝐱 𝑖 𝐱𝑗
2
𝑖=1 𝑖=1 𝑖,𝑗=1

dengan 𝐱 𝑖 𝐱𝑗 merupakan perkalian skalar (dot-product) dua data dalam data

training. Sehingga optimasi lagrangian pada persamaan (3.14) dapat dituliskan

kembali sebagai berikut

46
𝑛 𝑛 𝑛
1
max∗ ∑ 𝑦𝑖 (𝛼𝑖 −𝛼𝑖∗ ) − 𝜀 ∑(𝛼𝑖 +𝛼𝑖∗ ) − ∑ (𝛼𝑖 −𝛼𝑖∗ )(𝛼𝑗 −𝛼𝑗∗ )𝐱 𝑖 𝐱𝑗
𝛼𝑖 𝛼𝑖 2
𝑖=1 𝑖=1 𝑖,𝑗=1

dengan kendala
𝑛

∑(𝛼𝑖 − 𝛼𝑖∗ ) = 0
𝑖=1

0 ≤ 𝛼𝑖 , 𝛼𝑖∗ ≤ 𝐶. (3.19)

Solusi optimal diperoleh dari kendala (3.15) yang merupakan estimasi

parameter w dalam bentuk koefisien lagrange 𝛼𝑖 dan 𝛼𝑖∗ yang dapat ditulis

kembali sebagai
𝑛

𝐰 = ∑(𝛼𝑖 − 𝛼𝑖∗ ) 𝐱 𝑖 (3.20)


𝑖=1

sehingga fungsi regresi pada persamaan (3.10) dapat dituliskan sebagai berikut
𝑛

𝑓 (𝐱 𝑖 ) = ∑(𝛼𝑖 − 𝛼𝑖∗ ) (𝐱 𝑖 , 𝐱) + 𝑏 (3.21)


𝑖=1

Pada persamaan (3.20), 𝐰 digambarkan sebagai kombinasi linear dari data

training 𝐱 𝑖 atau disebut sebagai ekspansi support vector. Hal ini berarti bahwa

untuk membentuk fungsi regresi tidak tergantung pada data 𝐱 𝑖 di input space

tetapi tergantung pada jumlah support vector. Support vector pada SVR

merupakan data training yang berada tepat pada 𝜀-tube atau berada di luar 𝜀-tube

dengan nilai 𝛼𝑖 , 𝛼𝑖∗ > 0 (Smola dan Scholkopf , 2004)

Menurut Smola dan Scholkopf (2004), solusi optimal untuk bias (b) dapat

dihitung menggunakan kondisi KKT (Karush-Kuhn-Tucker). KKT adalah kondisi

yang menyatakan bahwa solusi yang diperoleh adalah optimal atau pada solusi

47
tersebut variabel dan kendala dari bentuk dualitas lagrange bertemu. Untuk

estimasi 𝑏 diperoleh menggunakan kondisi KKT sebagai berikut

𝛼𝑖 (𝜀 + 𝜉𝑖 − 𝑦𝑖 + 𝑓(𝐱 𝑖 )) = 0 (3.22)

𝛼𝑖∗ (𝜀 + 𝜉𝑖∗ + 𝑦𝑖 − 𝑓(𝐱 𝑖 )) = 0 (3.23)

(𝐶 − 𝛼𝑖 )𝜉𝑖 = 0 (3.24)

(𝐶 − 𝛼𝑖∗ )𝜉𝑖∗ = 0 (3.25)

Dari Persamaan (3.24) dan (3.25), nilai (𝐶 − 𝛼𝑖 ), (𝐶 − 𝛼𝑖∗ ) > 0 didapat saat

𝜉𝑖, 𝜉𝑖∗ = 0. Saat (𝐶 − 𝛼𝑖 ), (𝐶 − 𝛼𝑖∗ ) > 0, batasan awal nilai 𝛼𝑖 dan 𝛼𝑖∗ dari

persamaan (3.17) dan (3.18) berubah menjadi 𝛼𝑖 , 𝛼𝑖∗ < 𝐶. Sementara itu dari

persamaan (3.22) dan (3.23), 𝛼𝑖 , 𝛼𝑖∗ > 0 saat 𝜀 + 𝜉𝑖 − 𝑦𝑖 + 𝑓(𝐱 𝑖 ) dan 𝜀 + 𝜉𝑖∗ +

𝑦𝑖 − 𝑓 (𝐱 𝑖 ) bernilai sama dengan nol. Sehingga didapat batasan nilai 𝛼𝑖 , 𝛼𝑖∗

menjadi 0 < 𝛼𝑖 < 𝐶 dan 0 < 𝛼𝑖∗ < 𝐶. Pada saat nilai 𝛼𝑖 dan 𝛼𝑖∗ berada dalam

rentang ini, maka nilai 𝜉𝑖 dan 𝜉𝑖∗ akan sama dengan nol, sehingga Persamaan

(3.22) dan (3.23) dapat ditulis kembali menjadi

𝜀 − 𝑦𝑖 + 𝑓 (𝐱 𝑖 ) = 0 untuk 0 ≤ 𝛼𝑖 ≤ 𝐶 (3.26)

𝜀 + 𝑦𝑖 − 𝑓 (𝐱 𝑖 ) = 0 untuk 0 ≤ 𝛼𝑖∗ ≤ 𝐶 (3.27)

Misalkan terdapat data 𝐱 𝑖 sebagai data input sehingga persamaan regresi

SVR untuk data 𝐱 𝑖 dituliskan sabagai

𝑓 (𝐱 𝑖 ) = 𝐰. 𝐱 𝑖 + 𝑏 (3.28)

Nilai estimasi dari b diperoleh dengan mensubstitusikan persamaan (3.28)

ke dalam persamaan (3.26) dan persamaan (3.27), sehingga diperoleh

𝑏 = 𝑦𝑖 − 𝐰. 𝐱 𝑖 − 𝜀 untuk 0 ≤ 𝛼𝑖 ≤ 𝐶

dan

48
𝑏 = 𝑦𝑖 − 𝐰. 𝐱 𝑖 + 𝜀 untuk 0 ≤ 𝛼𝑖∗ ≤ 𝐶

3.4.2. Support Vector Regression (SVR) untuk Kasus Nonlinear

Pada umumnya data dalam dunia nyata jarang yang bersifat linear

separable, kebanyakan bersifat nonlinear. SVR untuk kasus nonlinear

memberikan pendekatan alternatif dengan cara melakukan pemetaan data x dari

input space ke feature space dengan dimensi yang lebih tinggi melalui suatu

fungsi 𝜑 sehingga φ: 𝐱 ⟼ 𝜑(𝐱) (Santosa, 2007). Sehingga fungsi regresi SVR

nonlinear dituliskan sebagai


𝑛

𝑓(𝐱 𝑖 ) = ∑(𝛼𝑖 − 𝛼𝑖∗ )𝜑(𝐱 𝑖 ). 𝜑(𝐱) + 𝑏 (3.29)


𝑖=1

Akan tetapi, kesulitan dalam pemetaannya adalah bahwa transformasi 𝜑

pada umumnya tidak diketahui dan sulit dipahami. Menurut Vapnik (1995),

masalah ini dapat diatasi dengan kernel trick yaitu perkalian skalar (dot product)

𝜑(𝐱 𝑖 ). 𝜑(𝐱) dalam feature space dapat digantikan dengan fungsi kernel

𝐾(𝐱 𝑖 , 𝐱) = 𝜑(𝐱 𝑖 ). 𝜑(𝐱)

dengan fungsi kernel tersebut mampu mendefinisikan secara implisit transformasi

𝜑. Menurut Nomleni (2015) dalam Pratama (2018), dengan mengetahui fungsi

kernel maka support vector bisa ditentukan tanpa perlu mengetahui wujud fungsi

nonlinear 𝜑. Sehingga fungsi regresi pada persamaan (3.29) dituliskan menjadi


𝑛

𝑓 (𝐱 𝑖 ) = ∑(𝛼𝑖 − 𝛼𝑖∗ ) 𝐾(𝐱 𝑖 , 𝐱) + 𝑏


𝑖=1

49
Perbedaan utama antara kasus linear dan nonlinear adalah bahwa dalam kasus

nonlinear, 𝐰 tidak diberikan secara eksplisit lagi. Selain itu, dalam kasus

nonlinear, masalah optimasi menemukan fungsi setipis mungkin dalam feature

space, tidak di input space (Smola dan Scholkopf, 2004).

Jenis fungsi kernel mempengaruhi parameter kernel SVR. Fungsi kernel

harus diatur dengan benar karena dapat mempengaruhi akurasi regresi. Parameter

yang tidak tepat dapat menyebabkan untuk overfitting atau underfitting. Dalam

penelitian ini, kernel yang digunakan pada model SVR adalah kernel Radial Basis

Function (RBF) yaitu

𝐾(𝐱 𝑖 , 𝐱) = 𝑒𝑥𝑝(−𝛾 ‖𝐱 𝑖 − 𝐱‖2 )

Sehingga fungsi regresi SVR nonlinear dengan kernel RBF adalah sebagai berikut
𝑛

𝑓(𝐱 𝑖 ) = ∑(𝛼𝑖 − 𝛼𝑖∗ ) 𝑒𝑥𝑝(−𝛾‖𝐱 𝑖 − 𝐱‖2 ) + 𝑏


𝑖=1

dengan 𝛾 > 0. SVR dengan fungsi kernel RBF memiliki tiga parameter yang

harus ditentukan yaitu C (cost), 𝛾 (gamma) dan 𝜀 (epsilon). Permasalahan yang

sering dihadapi SVR menggunakan fungsi kernel adalah menentukan parameter

yang optimal untuk menghasilkan model terbaik. Metode yang digunakan untuk

mencari parameter optimal pada penelitian ini adalah metode grid search.

3.4.3. Metode Grid Search

Secara umum, grid search merupakan kombinasi parameter yang diujikan

pada suatu model SVM untuk mencari nilai error dalam klasifikasi (Hsu et al.,

2016). Tujuannya adalah mengidentifikasi parameter optimal dalam data training,

50
sehingga model tersebut mampu secara akurat memprediksi data testing. Salah

satu pendekatan dalam grid search adalah prosedur cross validation. Prosedur

cross validation adalah membagi secara acak data training menjadi n subset yang

berukuran sama. Satu subset digunakan sebagai data testing dan n-1 subset

digunakan sebagai data training (Santosa, 2007).

Terdapat beberapa model dalam cross validation, pada penelitian ini akan

digunakan metode 10-fold cross validation. Pada 10-fold cross validation data

training set dipartisi secara acak menjadi 10 subset berukuran sama. Pada subset

1, subset 1 digunakan sebagai data testing dan sisanya (9 subset) digunakan

sebagai data training. Proses validasi silang dilakukan sebanyak 10 kali. Hasil

dari setiap proses validasi kemudian dirata-ratakan untuk mendapatkan nilai error

klasifikasi tunggal. Keuntungan dari metode ini adalah setiap data pada penelitian

ini digunakan baik untuk validasi dan training tepat satu kali pada setiap proses

validasi.

Proses untuk melakukan grid search secara lengkap memerlukan waktu

yang sangat lama sehingga Hsu et al. (2016), menyarankan untuk melakukakan

grid search dengan dua tahap yaitu loose grid dan finer grid. Loose grid adalah

tahapan dimana pemilihan nilai C dan 𝛾 dengan pangkat bilangan bulat,

sedangkan finer grid adalah tahapan selanjutnya dari loose grid dimana saat

didapat nilai C dan 𝛾 dengan error terendah, maka finer grid menggunakan nilai

di sekitaran C dan 𝛾 tersebut. Sejalan dengan hal tersebut, pada penelitian ini akan

digunakan grid search dengan dua tahapan yaitu loose grid dan finer grid untuk

menemukan nilai parameter optimal.

51
3.5. Model Hybrid SARIMA-SVR

Model SARIMA maupun SVR telah memperoleh kesuksesan pada ruang

lingkup linear maupun nonlinear masing-masing. Akan tetapi, tidak satupun dari

model tersebut yang merupakan model universal yang sesuai untuk setiap kondisi

data. Sering ditemukan kesulitan dalam penerapan model pada kasus data deret

waktu yang mengandung pola linear dan nonlinear sekaligus, sehingga kombinasi

model SARIMA dan SVR dapat menjadi alternatif permasalahan tersebut.

Kombinasi model ini mengeksploitasi keunggulan dari masing-masing model

SARIMA maupun SVR untuk menangkap karakteristik pola linear maupun

nonlinear.

Model hybrid SARIMA-SVR merupakan kombinasi model SARIMA dan

model SVR. Dalam model hybrid ini, data deret waktu diasumsikan terdiri dari

komponen linear dan koponen linear. Menurut Zhang (2003), secara umum model

data deret waktu yang merupakan kombinasi komponen linear dan nonlinear

secara sistematis dituliskan sabagai

𝑍𝑡 = 𝐿𝑡 + 𝑁𝑡

dengan 𝑍𝑡 merupakan data deret waktu pada waktu ke-t, 𝐿𝑡 merupakan komponen

linear waktu ke-t dan 𝑁𝑡 merupakan komponen nonlinear waktu ke-t.

Tahap pertama dalam membentuk model hybrid SARIMA-SVR adalah

membentuk komponen linear. Komponen linear dimodelkan dengan

menggunakan model SARIMA dengan input data yang digunakan merupakan

input data deret waktu asli. Hasil estimasi dari model SARIMA selanjutnya

disebut sebagai komponen linear. Kemudian residual dari model SARIMA

52
diasumsikan mengandung hubungan nonlinier. Residual dari model komponen

linear menggunakan model SARIMA dituliskan sebagai

𝜀𝑡 = 𝑍𝑡 − 𝐿̂𝑡

dengan 𝜀𝑡 merupakan residual model SARIMA waktu ke-t dan 𝐿̂𝑡 merupakan

komponen linear waktu ke-t hasil ramalan dari model SARIMA..

Setelah komponen linear terbentuk, langkah selanjutnya adalah membentuk

komponen nonlinear. Komponen nonlinear dimodelkan menggunakan model SVR

dengan input data merupakan residual dari model SARIMA. Model SVR dari

residual SARIMA dituliskan sebagai

𝜀𝑡 = 𝑓(𝜀𝑡−1 , 𝜀𝑡−2 , … , 𝜀𝑡−𝑛 ) + 𝑟𝑡 (3.30)

dengan n merupakan jumlah lag berpengaruh, f merupakan fungsi nonlinear yang

ditentukan oleh SVR dan 𝑟𝑡 merupakan residual model SVR pada waktu ke-t.

Selanjutnya 𝜀𝑡 menjadi komponen nonlinear waktu ke-t. Sehingga model hybrid

SARIMA-SVR dapat dinyatakan sebagai

𝑍̂𝑡 = 𝐿̂𝑡 + 𝑁
̂𝑡

dengan 𝑍̂𝑡 merupakan model peramalan hybrid SARIMA-SVR, 𝐿̂𝑡 merupakan

̂𝑡 komponen
komponen linear waktu ke-t hasil ramalan dari model SARIMA dan 𝑁

nonlinear waktu ke-t hasil peramalan 𝜀̂𝑡 pada persamaan (3.30).

3.6. Kriteria Pemilihan Model Terbaik

Pemilihan model terbaik pada penelitian ini menggunakan nilai Mean

Absolute Percentage Error (MAPE). MAPE merupakan gambaran ukuran

ketepatan estimasi model maupun ramalan. Nilai MAPE pada data training

53
digunakan untuk melihat ketepatan estimasi model sedangkan nilai MAPE pada

data testing menggambarkan ketepatan ramalan model. MAPE dihitung dengan

membagi persentase dari rata-rata harga mutlak residual pada tiap periode dengan

nilai aktual. Menurut Wei (2006), MAPE dirumuskan sebagai


𝑛
1 𝑍𝑡 − 𝑍̂𝑡
𝑀𝐴𝑃𝐸 = ∑ | | × 100%
𝑛 𝑍𝑡
𝑡=1

dengan 𝑍𝑡 adalah nilai observasi pada waktu ke-t, 𝑍̂𝑡 adalah nilai peramalan pada

waku ke-t dan n adalah banyaknya observasi. Model yang baik memiliki nilai

MAPE sesuai kriteria pada Tabel 3.1 (Chang, et al dalam Qomariyah, 2017).

Tabel 3.1 Kriteria MAPE

Nilai MAPE (%) Kriteria


< 10 Kemampuan peramalan sangat baik
10 – 20 Kemampuan peramalan baik
20 – 50 Kemampuan peramalan cukup
> 50 Kemampuan peramalan buruk
Sumber: Chang, Wang dan Liu dalam Qomariyah, 2017.

3.7. Tahapan Penelitian

Tahap awal dalam penelitian ini melakukan uji linearitas menggunakan uji

ramsey RESET. Data yang dikehendaki dalam peneltian ini adalah data yang

memiliki pola linear dan nonlinear sekaligus. Tahapan selanjutnya adalah

penentuan jumlah data training yang akan digunakan sebagai in sample dan

penentuan jumlah data testing sebagai out sample pada data harga gabah. Dasar

pembagian data ini berdasarkan kriteria Woschnagg dan Cipan (2004) bahwa

54
untuk data testing dapat sejumlah 10 persen dari total keseluruhan data.

Berdasarkan kriteria tersebut, sampel yang digunakan sejumlah 129 data (Januari

2009 - September 2019) dibagi menjadi dua bagian, yaitu sebanyak 116 data

training (Januari 2009 - Agustus 2018) dan 13 data testing (September 2018-

September 2019).

Tahapan penelitian untuk memperoleh model hybrid SARIMA-SVR adalah

sebagai berikut

1) Melakukan identifikasi pola data dengan plot deret waktu.

2) Malakukan pemeriksaan kestasioneran data. Jika data tidak stasioner dalam

rata-rata maka dilakukan differencing.

3) Melakukan identifikasi pola musiman pada data menggunakan regresi

spektral.

4) Identifikasi model SARIMA.

5) Estimasi parameter model SARIMA menggunakan metode Maximum

Likelihood Estimation (MLE).

6) Melakukan uji signifikansi parameter SARIMA.

7) Melakukan pemeriksaan diagnostik model SARIMA.

8) Melakukan pemilihan model SARIMA terbaik menggunakan kriteria MAPE.

9) Melakukan perhitungan residual model SARIMA terbaik.

10) Menggunakan residual SARIMA terbaik untuk input data SVR, diawali

dengan menentukan banyaknya time lag.

11) Menentukan fungsi kernel yang digunakan yaitu kernel Radial Basis

Function (RBF).

55
12) Menentukan rentang nilai parameter 𝐶, 𝛾 dan 𝜀

13) Menentukan nilai optimal parameter 𝐶, 𝛾 dan 𝜀 menggunakan metode grid

search dengan tahapan loose grid.

14) Menentukan nilai optimal parameter 𝐶, 𝛾 dan 𝜀 menggunakan metode grid

search dengan tahapan finer grid

15) Memperoleh nilai optimal dari parameter untuk model SVR sehingga didapat

model SVR untuk residual SARIMA.

16) Menggabungkan model pada langkah (8) dan (15) sehingga diperoleh model

hybrid SARIMA-SVR.

17) Melakukan validasi model SARIMA-SVR untuk mengukur ketepatan model

dan peramalan dengan menggunakan kriteria MAPE pada data training dan

testing.

18) Melakukan peramalan harga gabah menggunakan model hybrid SARIMA-

SVR.

56
Mulai
Data Training Data Testing

Plot Data

Model SARIMA
Ya Tidak Terbaik
ARIMA Stasioner ? Differencing

Residual Model
SARIMA Terbaik

Tidak
Musiman ?
Penentuan Banyaknya
Time Lag Residual
SARIMA
Ya
Identifikasi Model SARIMA
Penentuan Kernel
RBF

Estimasi Parameter SARIMA

Penentuan Rentang
Uji Parameter (𝐶, 𝛾 dan 𝜀)
Signifikansi Tidak
Parameter
Metode Grid Search
Ya Tahapan Loose Grid

Uji
Diagnostik Metode Grid Search
Tidak Tahapan Finer Grid

Ya
Pemilihan Model Model SVR
SARIMA Terbaik Terbaik

Model Hybrid Evaluasi Model


SARIMA-SVR Berdasarkan MAPE

Peramalan Harga
Gabah

Selesai

Gambar 3.2 Diagram Alur Penelitian

57
BAB IV
HASIL DAN PEMBAHASAN

Dalam bab ini akan dijelaskan analisis dan hasil pemodelan hybrid

SARIMA-SVR serta peramalan harga gabah. Hasil pemodelan tersebut akan

diukur ketepatan pemodelannya dengan menggunakan nilai MAPE pada data

training, sedangkan untuk mengukur ketepatan peramalannya digunakan nilai

MAPE pada data testing.

4.1. Analisis Deskriptif Data Harga Gabah

Penelitian ini menggunakan data harga gabah pada periode Januari 2009

sampai September 2019 (129 Data). Data harga gabah pada periode Januari 2009

sampai Agustus 2018 (116 Data) digunakan sebagai data training sedangkan data

pada periode September 2018 sampai September 2019 (13 Data) digunakan

sebagai data testing. Hasil analisis deskriptif data harga gabah pada periode

Januari 2009 sampai September 2019 dapat dilihat pada Tabel 4.1.

Tabel 4.1 Statistik Deskriptif Data Harga Gabah

Data Rata-rata Minimum Maksimum


Harga Gabah 4.665,38 2.638,09 6.001,87

Berdasarkan Tabel 4.1 dapat ditunjukkan bahwa nilai rata-rata harga gabah

periode Januari 2009 sampai dengan September 2019 adalah 4.665,38 rupiah.

Selanjutnya, harga gabah tertinggi adalah pada Januari 2018 yaitu sebesar

6.001,87 rupiah. Sedangkan harga gabah terendah adalah pada April 2009 yaitu

58
sebesar 2.638,09 rupiah. Data harga gabah secara lengkap dapat dilihat pada

Lampiran 1.

Harga gabah minimum sebesar 2.638,09 rupiah dan maksimum sebesar

6.001,87 menunjukkan rentang harga gabah selama Januari 2009 sampai

September 2019 mengalami kenaikan yang cukup signifikan. Dengan harga rata-

rata gabah sebesar 4.665,38 rupiah diindikasikan bahwa data harga gabah tidak

stasioner dalam rata-rata. Untuk membuktikan hal tersebut, maka dilakukan uji

stasioneritas data harga gabah.

4.2. Pengujian Linearitas

Pengujian linearitas data harga gabah pada penelitian ini adalah

menggunakan uji Ramsey RESET dengan statistik uji mengikuti persamaan (2.4).

Hasil uji Ramsey RESET pada data harga gabah selama periode Januari 2009

sampai dengan Agustus 2018 disajikan pada Tabel 4.2.

Tabel 4.2 Uji Ramsey RESET Pada Data Harga Gabah

Data Statistik Uji (RESET) p-value


Harga Gabah 267,2 2,2e-16

Berdasarkan Tabel 4.2 menunjukkan bahwa nilai statistik uji Ramsey RESET

yang lebih besar dari F(0,05;1;113) = 3,9251 atau nilai p-value yang lebih kecil dari

𝛼 = 5 % maka dapat disimpulkan 𝐻0 ditolak yang berarti bahwa data harga gabah

mengandung pola nonlinear. Pengujian Ramsey RESET dapat dilihat pada

Lampiran 2.

59
4.3. Identifikasi Plot Data Harga Gabah

Langkah awal dalam analisis deret waktu adalah dengan membuat plot data

secara visual. Plot data deret waktu mengenai pergerakan harga gabah dari

periode Januari 2009 sampai dengan Agustus 2018 dapat dilihat pada Gambar 4.1.

Plot Data Harga Gabah


6000
5000 5500
Harga Gabah (Rupiah)

3000 3500 4000 4500

0 20 40 60 80 100 120

Bulan (Januari 2009 - Agustus 2018)

Gambar 4.1 Plot Data Harga Gabah Januari 2009 – Agustus 2018

Berdasarkan Gambar 4.1 dapat ditunjukkan bahwa pergerakan harga gabah

pada Januari 2009 sampai Agustus 2018 menunjukkan pola tren naik dan juga

terjadi fluktuasi harga gabah. Fenomena ini mengindikasikan bahwa harga gabah

sepanjang Januari 2009 sampai Agustus 2018 cenderung terus meningkat serta

terjadi kenaikan dan penurunan harga setiap tahun. Fluktuasi harga tersebut

diduga disebabkan oleh adanya adanya efek musiman seperti musim panen yang

bersamaan sebagai akibat dari musim tanam yang hampir bersamaan. Sehingga,

60
akan dilakukan pengujian stasioneritas dan identifikasi pola musiman pada data

harga gabah.

4.4. Stasioneritas Data

Syarat yang harus dipenuhi sebelum melakukan analisis data deret waktu

adalah kestasioneran data. Dalam penelitian ini dilakukan uji stasioneritas data

menggunakan uji Augmented Dickey Fuller (ADF) untuk data harga gabah. Hasil

uji ADF pada data harga gabah disajikan pada Tabel 4.3.

Tabel 4.3 Uji ADF Data Harga Gabah Sebelum dan Sesudah Differencing

Sebelum Differencing Sesudah Differencing Pertama


Data
p-value Kesimpulan p-value Kesimpulan
Harga Gabah 0,6495 Data Tidak Stasioner 0,01 Data Stasioner

Berdasarkan Tabel 4.3, hasil uji ADF pada data harga gabah menunjukkan

nilai p-value lebih besar dari 𝛼 = 5 %, sehingga 𝐻0 diterima sehingga dapat

disimpulkan data harga gabah tidak stasioner. Oleh karena itu, salah satu cara

yang dilakukan untuk membuat data stasioner adalah dengan differencing. Setelah

differencing orde satu, hasil uji ADF pada data harga gabah hasil differencing

pertama memiliki p-value lebih kecil dari 𝛼 = 5 %, sehingga 𝐻0 ditolak sehingga

dapat disimpulkan data harga gabah sudah stasioner.

4.5. Identifikasi Pola Musiman

Identifikasi pola musiman pada data deret waktu dapat dilakukan

menggunakan metode regresi spektral dengan statistik uji mengikuti persamaan

61
(2.8). Selain untuk melihat ada tidaknya pola musiman pada data deret waktu,

regresi spektral juga digunakan untuk menentukan periode dari musiman. Hasil

pengujian efek musiman pada data harga gabah dengan menggunakan regresi

spektral dapat dilihat pada Tabel 4.4.

Tabel 4.4 Identifikasi Pola Musiman Pada Data Harga Gabah Menggunakan

Regresi Spektral

Data Statistik Uji (T) gα Kesimpulan


Harga Gabah 0,2043092 0,13135 Terdapat Pola Musiman

Berdasarkan Tabel 4.4, hasil identifikasi pola musiman pada data harga

gabah menunjukkan nilai statistik uji regresi spektral 𝑇 = 0,2043092 yang lebih

besar dari g 𝛼 = 0,13135, sehingga 𝐻0 ditolak, artinya data harga gabah

mengandung pola musiman atau dipengaruhi oleh faktor musiman. Selanjutnya,

mengunakan regresi spektral juga diperoleh bahwa data harga gabah mempunyai

nilai periodesitas musiman 6,052632. Artinya data harga gabah mempunyai pola

musiman berulang dengan periode ulangan setiap 6 bulan. Hasil lengkap

perhitungan identifikasi pola musiman deret waktu dengan menggunakan regresi

spektral disajikan pada Lampiran 3.

4.6. Peramalan Harga Gabah Menggunakan Model SARIMA

4.6.1. Identifikasi Model SARIMA

Identifikasi model deret waktu dilakukan untuk menentukan orde waktu

untuk model SARIMA yang akan dibangun. Identifikasi awal orde waktu pada

62
penelitian ini dilakukan berdasarkan plot ACF dan PACF yang dibangun

berdasarkan persamaan (3.1) dan persamaan (3.2) dengan menggunakan data

training yang sudah stasioner. Berdasarkan pengujian stasioneritas data harga

gabah merupakan data yang tidak stasioner sehingga perlu dilakukan differencing

pertama. Plot ACF dan PACF data asli dan data hasil differencing pertama

terdapat pada Lampiran 4. Selain itu, identifikasi pola musiman pada data harga

gabah menunjukkan bahwa data harga gabah mengandung pola musiman dengan

periode 6 sehingga dilakukan differencing musiman pertama lag 6. Grafik ACF

dan PACF data harga gabah setelah dilakukan diferencing pertama dan

differencing musiman lag 6 dapat dilihat pada Gambar 4.2.

Series GABAHmus.diff1 Series GABAHmus.diff1


0.2
1.0

0.0
0.5

Partial ACF

-0.2
ACF

0.0

-0.4
-0.6
-0.5

0 10 20 30 40 50 0 10 20 30 40 50

Lag Lag

Gambar 4.2 Plot ACF dan PACF Data Harga Gabah Diferencing Pertama
dan Diferencing Musiman lag 6

Selanjutnya akan dilakukan identifikasi dari model yang tepat untuk

menggambarkan data hasil diferencing pertama dan diferencing musiman lag 6

menggunakan plot ACF dan PACF pada Gambar 4.2. Berdasarkan Gambar 4.2

63
terlihat bahwa ACF maupun PACF signifikan pada lag 6 sehingga ditetapkan

model sementara adalah SARIMA(0,1,0)(1,1,1)6.

4.6.2. Estimasi Parameter Model SARIMA

Tahap selanjutnya setelah diperoleh model SARIMA sementara adalah

melakukan estimasi parameter model SARIMA yang mungkin untuk

menggambarkan sifat data. Menurut prinsip parsimony dari pemodelan (model

yang baik adalah model yang memiliki parameter yang sedikit) dapat digunakan

beberapa alternatif selain model SARIMA(0,1,0)(1,1,1)6 seperti terdapat pada

Lampiran 6.

Tabel 4.5. Hasil Uji Parsial Model SARIMA

Estimasi Standar
No Model Parameter t-hitung Kesimpulan
Parameter Error
SARIMA AR Musiman (1) -0,5437 0,1205 -4,51 Signifikan
1
(0,1,0)(1,1,1)6 MA Musiman (1) -0,7558 0,1771 -4,27 Signifikan
AR (1) -0,6121 0,2151 -2,85 Signifikan
AR (2) -0,2463 0,0964 -2,56 Signifikan
SARIMA
2 MA(1) 0,5148 0,2111 2,44 Signifikan
(2,1,1)(1,1,1)6
AR Musiman (1) -0,5459 0,1068 -5,11 Signifikan
MA Musiman (1) -0,8073 0,1361 -5,93 Signifikan
AR (1) -0,9564 0,1332 -7,18 Signifikan
AR(2) -0,8367 0,1747 -4,79 Signifikan
SARIMA MA(1) 0,8581 0,1845 4,65 Signifikan
3
(2,1,2)(1,1,1)6 MA(2) 0,6319 0,2256 2,80 Signifikan
AR Musiman (1) -0,5781 0,0933 -6,20 Signifikan
MA Musiman (1) -0,9152 0,1572 -5,82 Signifikan

64
Berdasarkan Lampiran 6 terdapat sembilan kemungkinan model SARIMA.

Berdasarkan nilai t-hitung masing-masing parameter model SARIMA dan

menggunakan nilai t-tabel sebesar 1,98 maka dari sembilan kemungkinan model

SARIMA hanya tiga model yang memiliki hasil uji parsial semua parameternya

signifikan yaitu model SARIMA(0,1,0)(1,1,1)6, SARIMA(2,1,1)(1,1,1)6 dan

SARIMA(2,1,2)(1,1,1)6. Hasil uji parsial ketiga model tersebut dapat dilihat pada

Tabel 4.5. Tahap selanjutnya dilakukan uji diagnostik dari ketiga model tersebut

dengan melakukan uji residual white noise dan uji residual normal untuk

mendapatkan model terbaik yang dapat menggambarkan karakteristik data secara

keseluruhan.

4.6.3. Pengujian Diagnostik dan Pemilihan Model SARIMA Terbaik

Pengujian diagnostik model merupakan pemeriksaan apakah asumsi dasar

model deret waktu sudah terpenuhi. Dalam penelitian ini, uji asumsi yang

dilakukan adalah uji residual white noise dengan statistik uji menggunakan

persamaan (3.8). Hasil pengujian residual white noise dari model SARIMA yang

memungkinkan ditunjukkan pada Tabel 4.6.

Hasil uji asumsi white noise pada Tabel 4.6 menunjukkan bahwa pada

model SARIMA(2,1,1)(1,1,1)6 dan SARIMA(2,1,2)(1,1,1)6 nilai uji Portmanteau

untuk setiap lag mempunyai nilai p-value lebih besar dari 𝛼 = 5 %, maka dapat

disimpulkan 𝐻0 diterima yang berarti bahwa tidak ada korelasi antar residual

sehingga asumsi white noise pada residual model SARIMA(2,1,1)(1,1,1)6 dan

SARIMA(2,1,2)(1,1,1)6 telah terpenuhi. Sedangkan pada model SARIMA(0,1,0)

(1,1,1)6 pada nilai uji Portmanteau terdapat lag yang mempunyai nilai p-value

65
lebih kecil dari 𝛼 = 5 %, maka dapat disimpulkan 𝐻0 ditolak yang berarti bahwa

terdapat korelasi antar residual sehingga asumsi residual white noise pada model

SARIMA(0,1,0) (1,1,1)6 tidak terpenuhi.

Tabel 4.6 Pengujian Asumsi Residual White Noise

MODEL
Lag SARIMA(0,1,0)(1,1,1)6 SARIMA(2,1,1)(1,1,1)6 SARIMA(2,1,2)(1,1,1)6
Statistik p-value Statistik p-value Statistik p-value
1 1,2597 0,2617 0,0052 0,9426 4,5681e-04 0,9829
3 7,4340 0,0593 0,0747 0,9947 0,31323 0,9575
5 11,5021 0,0423 3,1163 0,6821 1,2217 0,9428
7 14,2707 0,0466 5,4803 0,6016 2,3129 0,9405
9 14,6142 0,1021 5,8340 0,7564 3,1758 0,9569
… … … … … … …
59 82,0763 0,0252 58,8144 0,4823 46,1963 0,8876
60 82,1183 0,0305 58,8630 0,5173 46,4685 0,8998

Selain asumsi white noise, dilakukan pengujian asumsi residual normal

menggunakan uji Kolmogorov Smirnov dengan statistik uji pada persamaan (3.9).

Hasil uji asumsi residual normal dengan uji Kolmogorov Smirnov menunjukkan

bahwa nilai p-value untuk model SARIMA(0,1,0)(1,1,1)6, SARIMA(2,1,1)

(1,1,1)6 dan SARIMA(2,1,2)(1,1,1)6 masing-masing sebesar 2,2e-16 atau lebih

kecil dari 𝛼 = 5 %. Hal ini berarti bahwa 𝐻0 ditolak sehingga dapat disimpulkan

bahwa residual model SARIMA(0,1,0)(1,1,1)6, SARIMA(2,1,1)(1,1,1)6 dan

SARIMA(2,1,2) (1,1,1)6 tidak memenuhi asumsi residual normal. Dalam

beberapa literatur, dalam pemodelan ARIMA atau SARIMA asumsi residual

66
berdistribusi normal dapat diabaikan. Secara lengkap, hasil pengujian diagnostik

model SARIMA dapat dilihat pada Tabel 4.7.

Tabel 4.7 Pengujian Diagnostik Model SARIMA

Uji White Uji Kenormalan


No Model MAPE
Noise Residual
Tidak White Residual Tidak
1 SARIMA(0,1,0)(1,1,1)6 2,0971
Noise Normal
Residual Tidak
2 SARIMA(2,1,1)(1,1,1)6 White Noise 2,0880
Normal
Residual Tidak
3 SARIMA(2,1,2)(1,1,1)6 White Noise 2,0117
Normal

Pemilihan model SARIMA terbaik dapat dilakukan dengan melihat nilai

MAPE pada model SARIMA(2,1,1)(1,1,1)6 dan SARIMA(2,1,2)(1,1,1)6. Hasil

perhitungan MAPE dari model SARIMA(2,1,1)(1,1,1)6 dan SARIMA(2,1,2)

(1,1,1)6 masing-masing 2,0880 dan 2,0117. Sehingga dapat disimpulkan bahwa

model SARIMA terbaik yang diperoleh adalah SARIMA(2,1,2)(1,1,1)6. Model

SARIMA (2,1,2)(1,1,1)6 ini digunakan untuk melakukan peramalan harga gabah.

Hasil peramalan harga gabah menngunakan model SARIMA(2,1,2)(1,1,1)6

merupakan komponen linear dari model hybrid SARIMA-SVR. Setelah diperoleh

model SARIMA terbaik dan komponen linear, langkah selanjutnya adalah

melakukan perhitungan residual model SARIMA(2,1,2) (1,1,1)6.

4.7. Peramalan Residual SARIMA Terbaik Menggunakan Model SVR

Residual dari model SARIMA(2,1,2)(1,1,1)6 digunakan untuk input data

pada model SVR Residual SARIMA(2,1,2)(1,1,1)6 tersebut diasumsikan berisi

hubungan nonlinear sehingga dimodelkan menggunakan SVR dengan fungsi

67
kernel. Sebelum masuk ke pemodelan menggunakan SVR, langkah pertama yang

dilakukan adalah mengkonversikan residual model SARIMA terbaik ke dalam

bentuk time lag yang nantinya sebagai data input dalam model SVR. Penentuan

banyaknya time lag sesuai penjelasan pada Subbab 3.4.

Penelitian ini menggunakan data deret waktu bulanan sehingga penentuan

banyak time lag adalah dengan melakukan percobaan (trial and error) yaitu

mencoba segala kemungkinan banyaknya time lag (antara 1 lag sampai 15 lag)

dan memilih jumlah time lag yang memberikan nilai error terkecil. Dari proses

trial and error seperti pada Lampiran 7, didapat nilai error terkecil adalah pada

input dua lag. Sehingga untuk memodelkan residual SARIMA(2,1,2)(1,1,1)6

digunakan SVR adalah dengan input data residual sebanyak dua lag.

Langkah awal dalam melakukan pemodelan dengan menggunakan SVR

untuk kasus nonlinear adalah menentukan fungsi kernel. Pada penelitian ini

dibatasi hanya menggunakan fungsi kernel Radial Basic Function (RBF). Pada

kernel RBF terdapat parameter 𝐶, 𝛾 dan 𝜀 yang harus ditentukan. Untuk

mendapatkan nilai parameter yang optimal maka pada penelitian ini digunakan

metode grid search menggunakan prosedur 10-fold cross validation dengan dua

tahapan yaitu loose grid dan finer grid.

Tahapan awal metode grid search adalah menentukan rentang nilai

parameter. Pada tahapan loose grid digunakan nilai parameter C dan 𝛾 dengan

pangkat bilangan bulat. Sedangkan nilai 𝜀 ditentukan terlebih dahulu. Pada

penelitian ini rentang nilai parameter yang digunakan pada metode grid search

tahapan loose grid dapat dilihat pada Tabel 4.8.

68
Tabel 4.8 Rentang Nilai Parameter Metode Grid Search Tahapan Loose Grid

Parameter Rentang Nilai


C 2−7 , 2−5 , … , 27
𝛾 2−7 , 2−5 , … , 27
𝜀 0,01; 0,02; … ; 0,1

Rentang nilai parameter pada Tabel 4.8 digunakan untuk proses penentuan

parameter model SVR. Melalui proses grid search pada tahapan loose grid

diperoleh nilai optimal dari parameter model SVR adalah 𝐶 = 2−1 , 𝛾 = 27 dan

𝜀 = 0,02. Setelah diperoleh parameter optimal model SVR pada tahapan loose

grid, maka langkah selanjutnya dilakukan grid search menggunakan metode grid

search tahapan finer grid. Finer grid merupakan tahapan grid search

menggunakan sekitaran nilai C, 𝛾 dan 𝜀 yang diperoleh pada tahapan loose grid.

Tabel 4.9. Rentang Nilai Parameter Metode Grid Search Tahapan Finer Grid

Parameter Rentang Nilai


C 2−1,75 , 2−1,5 , 2−1,25 , 2−1 , 2−0,75 , 2−0,5 , 2−0,25
𝛾 26,25 , 26,5 , 26,75 , 27
𝜀 0,02

Rentang nilai parameter yang digunakan pada tahapan finer grid dapat

dilihat pada Tabel 4.9. Melalui proses grid search pada tahapan finer grid

diperoleh nilai optimal dari parameter model SVR adalah 𝐶 = 2−1,25 , 𝛾 = 27 dan

𝜀 = 0,02. Nilai parameter yang diperoleh menggunakan metode grid search

tahapan finer grid merupakan parameter optimal yang digunakan pada model

SVR. Sehingga diperoleh model SVR terbaik adalah model SVR menggunakan

69
kernel Radial Basic Function (RBF) dengan nilai parameternya adalah 𝐶 =

2−1,25 , 𝛾 = 27 dan 𝜀 = 0,02.

Analisis yang dilakukan selanjutnya adalah melakukan peramalan residual

model SARIMA(2,1,2)(1,1,1)6 menggunakan model SVR dengan parameter

optimal. Hasil peramalan residual model SARIMA(2,1,2)(1,1,1)6 menggunakan

model SVR disebut sebagai komponen nonlinear dari model hybrid SARIMA-

SVR. Setelah diperoleh komponen nonlinear, langkah selanjutnya adalah

menggabungkan komponen linear dan komponen nonlinear sehingga sehingga

diperoleh model hybrid SARIMA-SVR.

4.8. Peramalan Harga Gabah Menggunakan Model Hybrid SARIMA-SVR

Tahapan analisis selanjutnya adalah mmbentuk model hybrid SARIMA-

SVR dengan menggabungkan komponen linear dan komponen nonlinear.

Komponen linear merupakan hasil peramalan model SARIMA terbaik sedangkan

komponen nonlinear merupakan hasil peramalan residual SARIMA terbaik

menggunakan model SVR terbaik. Pada penelitian ini diperoleh model hybrid

SARIMA-SVR merupakan kombinasi model SARIMA(2,1,2)(1,1,1,)6 dan model

SVR menggunakan kernel Radial Basic Function (RBF) dengan nilai

parameternya adalah 𝐶 = 2−1,25 , 𝛾 = 27 dan 𝜀 = 0,02.

Langkah selanjutnya adalah melihat sejauh mana akurasi atau ketepatan

model hybrid SARIMA-SVR untuk peramalan harga gabah dengan

membandingkan akurasi peramalan menggunakan model SARIMA sebagai tolak

ukur. Penentuan keakuratan model dan peramalan dilakukan dengan

70
membandingan nilai MAPE. Hasil perhitungan nilai MAPE pada data training

dan testing pada model SARIMA dan hybrid SARIMA-SVR dapat dilihat pada

Tabel 4.10.

Tabel 4.10. Perbandingan MAPE Model SARIMA dan Hybrid SARIMA-SVR


MAPE (%)
Model
Training Testing
SARIMA 2,0117 3,8635
Hybrid SARIMA-SVR 1,1976 3,6840

Tabel 4.10 menunjukkan bahwa nilai MAPE model hybrid SARIMA-SVR

lebih kecil dibandingkan nilai MAPE model SARIMA. Hal tersebut

menunjukkan bahwa hybrid SARIMA-SVR secara signifikan mampu

memberikan nilai peramalan yang lebih akurat dibandingkan model SARIMA.

Karenanya dalam peramalan harga gabah selama satu tahun kedepan (Oktober

2019 sampai September 2020) akan digunakan model hybrid SARIMA-SVR.

4.9. Peramalan Harga Gabah Pada Oktober 2019 – September 2020

Berdasarkan hasil yang didapat pada tahapan sebelumnya, terbukti bahwa

model hybrid SARIMA-SVR sudah tepat digunakan sebagai model untuk

meramalkan harga gabah pada Oktober 2019 – September 2020. Hasil peramalan

harga gabah pada Oktober 2019 – September 2020 yang dapat dilihat pada Tabel

4.11.

71
Tabel 4.11. Peramalan Harga Gabah Oktober 2019 – September 2020

Bulan Harga Gabah (Rupiah)


Oktober 2019 5.442,92
November 2019 5.602,15
Desember 2019 5.706,48
Januari 2020 5.785,50
Februari 2020 5.79121
Maret 2020 5.596,86
April 2020 5.400,77
Mei 2020 5.483,19
Juni 2020 5.574,99
Juli 2020 5.627,22
Agustus 2020 5.646,97
September 2020 5.609,77

72
BAB V

KESIMPULAN DAN SARAN

5.1. Kesimpulan

Model Hybrid Seasonal Autoregressive Integrated Moving Average

(SARIMA)-Support Vector Regression (SVR) merupakan pengembangan model

deret waktu univariat untuk data deret waktu yang tidak stasioner, terdapat pola

musimam dan memiliki pola data linear dan nonlinear sekaligus. Penelitian ini

menerapkan model hybrid SARIMA-SVR pada data harga gabah. Beberapa

kesimpulan yang dapat diperoleh dari penelitian ini adalah

1. Prosedur membangun model hybrid SARIMA-SVR dalam penelitian ini

didasarkan pada fenomena kondisi data deret waktu yang tidak stasioner dan

terdapat pola musiman, sehingga dilakukan proses differencing biasa dan

differencing musiman untuk memperoleh data yang stasioner. Selain itu,

data yang dianalisis dalam penelitian ini juga memiliki pola data yang linear

dan nonlinear sekaligus. Proses pemodelan hybrid SARIMA-SVR dalam

penelitian ini menggunakan model SARIMA untuk membentuk komponen

linear. Residual dari model SARIMA dijadikan input untuk model SVR.

Hasil pemodelan residual SARIMA menggunakan model SVR membentuk

komponen nonlinear. Model hybrid SARIMA-SVR merupakan kombinasi

dari komponen linear dan komponen linear tersebut.

2. Model hybrid SARIMA-SVR terbaik untuk peramalan data harga gabah

nasional adalah kombinasi model SARIMA(2,1,2)(1,1,1,)6 dan model SVR

73
menggunakan kernel RBF dengan nilai parameternya adalah 𝐶 =

2−1,25 , 𝛾 = 27 dan 𝜀 = 0,02. Model hybrid SARIMA-SVR ini dipilih

karena memiliki nilai peramalan yang lebih akurat dibandingkan dengan

model SARIMA dan model SVR, yang ditunjukkan dari nilai MAPE paling

minimum baik untuk data training maupun testing.

5.2. Saran

Berdasarkan hasil penelitian yang telah dilakukan, maka saran yang dapat

diberikan adalah

1. Model hybrid SARIMA-SVR adalah salah satu alternatif model yang dapat

digunakan untuk memodelkan data yang tidak stasioner, terdapat pola

musiman dan memiliki pola data linear dan nonlinear sekaligus. Penelitian

selanjutnya dapat digunakan model lain seperti model hybrid SARIMA-

ANFIS, hybrid SARIMA-GEP dan model alternatif lain dalam mengatasai

data yang tidak stasioner, terdapat pola musiman dan memiliki pola data

linear dan nonlinear sekaligus.

2. Model SVR pada penelitian ini menggunakan fungsi kernel RBF. Untuk

kepentingan penelitian ke depan, dapat menggunakan beberapa fungsi kernel

lain seperti kernel linear, polinomial atau sigmoid.

3. Penerapan model hybrid SARIMA-SVR pada penelitian ini adalah pada data

harga gabah yang merupakan data deret waktu bulanan. Untuk penelitian

selanjutnya perlu penerapan model hybrid SARIMA-SVR pada data deret

waktu harian dengan jumlah pengamatan selama lebih dari satu tahun.

74
DAFTAR PUSTAKA

Aguilar, J.J.R, Turias, I.J, Come, M.J.J and Cerbán, M.M. 2011. Hybrid
Approaches of Support Vector Regression and SARIMA Models to
Forecast the Inspections Volume. Intelligent Modelling of Systems
Research Group, University of Cádiz.
Alwee, R., Shamsuddin, S.M and Sallehuddin, R. 2013. Hybrid Support
Vector Regression and Autoregressive Integrated Moving Average
Models Improved by Particle Swarm Optimization for Property
Crime Rates Forecasting with Economic Indicators. The Scientific
World Journal Volume 2013.
Amalia. 2009. Peranan Persyaratan Karush-Kuhn-Tucker Dalam
Menyelesaikan Pemrograman Kuadratis. Skripsi. Medan:
Universitas Sumatera Utara.
Balkin, S.D., and Ord, J.K. 2000. Automatic neural network modeling for
univariate time series. International Journal of Forecasting, Vol. 16
: 509-515.
Bappenas. 2010. Rencana Pembangunan Jangka Menengah (RPJHMN)
2010-2014 (Peraturan Pemerintah Nomor 5 Tahun 2010).
Jakarta : Bappenas.
Boser, B.E., Guyon, I., and Vapnik, V. 1992. A Training Algorithm for
Optimal Margin Classifiers. Proceedings of the fifth annual
workshop on Computational learning theory (COLT) : 144-152.
Box, G.E., and Jenkins, G.M. 1976. Time Series Analysis Forecasting and
Control. California : Holden Day.
BPS. 2018. Statistik Harga Produsen Gabah di Indonesia. Jakarta: BPS.
Chatfield, C. 2004. The Analysis of Time Series An Indtroduction Sixth
Edition. United States of America : Chapman & Hall/CRC.
Chen, K. Y. dan Wang, C. H. 2007. A hybrid SARIMA and support vector
machines in forecasting the production values of the machinery
industry in Taiwan. Expert Systems with Applications 32, 254–264.

75
Cryer, J.D. 1986. Time Series Analysis. Boston : PWS-KENT Publishing
Company
Darmawan, G., Mulyani, S., dan Sudartianto. 2012. Pengujian Pola Musiman
Pada Data Deret Waktu Dengan Menggunakan Regresi Spektral.
Prosiding Seminar Nasional Statistika FMIPA Universitas
Padjajaran : 63-72.
Ding, Z. 2012. Application od Support Vector Machine Regression in Stock
Price Forecasting. Business, Economics, and Financial Sci.,
Manag., AISC 143, 359-365.
Haykin, S. 2009. Neural Networks and Learning Machines, Third Edition.
New Jersey : Pearson Education, Inc.
Hsu, C. W., Chang, C.C., and Lin, C.J. 2016. A Practical Guide to Support
Vector Classificaton. Taipei : Department of Computer Science
National Taiwan University.
Kim, T.H., Lee., Y.S., and Newbold, P. 2004. Spurious Nonlinear Regressions
in Econometrics. Nottingham: University of Nottingham.
Licker, M. D. 2003. Dictionary of Mathematics: Second Edition. New York :
McGraw-Hill.
Makridakis, S and Wheelwright, S.C. 1999. Metode dan aplikasi peramalan.
Jakarta : Binarupa Aksara.
Mulyaningsih, T. 2015. Model Generalized Space Time Autoregressive
Integrated untuk Peramalan Indeks Harga Konsumen Beberapa
Kota di Jawa Tengah. Tesis. Bandung: Universitas Padjajaran.
Pai, P. F dan Lin, C. S. 2005. A hybrid ARIMA and support vector machines
model in stock price forecasting. The International Journal of
Management Science Omega 33, 497-505.
Pankratz, A. 1983. Forecasting With Univariate Box-Jenkins Models Concept
and Cases. New York : John Wiley and Sons.
Pramudhitasari, L. 2016. Model Hybrid ARIMA-SVR untuk Peramalan Data
Runtun Waktu. Tesis. Yogyakarta : Universitas Gajah Mada.

76
Pratama, J.A. 2018. Sentiment Analysis Menggunakan Algoritma Support
Vector Machines Pada Layanan Jejaring Sosial Twitter (Studi
Kasus Elektabilitas Bakal Calon Gubernur dan Bakal Calon Wakil
Gubernur PILKADA Jawa Barat Tahun 2018). Tesis. Bandung:
Universitas Padjadjaran.
Qomariyah, L. 2017. Penerapan Model Generalized Space Time
Autoregressive Integrated Moving Average (GSTARIMA) untuk
Peramalan Volume Ekspor Perikanan dan Komoditas Laut
Lainnya. Tesis. Bandung: Universitas Padjadjaran.
Ramsey, J. B. 1969. Tests for Specification Errors in Classical Linear Least
Squares Regression Analysis. Journal of the Royal Statistical
Society, Series B. 31 (2): 350–371.
Santosa, B. 2007. Data Mining: Teknik Pemanfaatan Data untuk Keperluan
Bisnis, Teori dan Aplikasi. Yogyakarta : Graha Ilmu.
Smola, A.J. dan Scholkopf, B. 2004. A Tutorial On Support Vector
Regression. Statistic and Computing 14, 199-222.
Terui, N dan Van Dijk, H. K. 2002. Combined forecasts from linear and non
linear time series models. International Journal of Forecasting 18.
421-438.
Vapnik, V.N. 1995. The Nature of Statistical Learning Theory. New York:
Springer
Woschnagg, E dan Cipan, J. 2004. Evaluating Forecast Accuracy. University
of Vienna: Austria.
Wei, W.W.S. 2006. Time Series Analysis: Univariate and Multivariate
Methods, Second Edition. New York : Pearson Education.
Zhang, G.P. 2003. Time Series Forecasting using a Hybrid ARIMA dan
Neural Network Model. Neurocomputing 50,159-175.

77
LAMPIRAN

Lampiran 1. Data Bulanan Rata-rata Harga Gabah Kering Giling (GKG) Nasional
Tingkat Petani Periode Januari 2009 sampai dengan September 2019

Harga Harga
No Bulan No Bulan
Gabah Gabah
1 Januari 2009 3035.53 33 September 2011 4190.09
2 Februari 2009 3128.5 34 Oktober 2011 4291.77
3 Maret 2009 3006.1 35 November 2011 4371.45
4 April 2009 2638.09 36 Desember 2011 4550.31
5 Mei 2009 2984.03 37 Januari 2012 4708.08
6 Juni 2009 3019.01 38 Februari 2012 4640.1
7 Juli 2009 2947.03 39 Maret 2012 4266.05
8 Agustus 2009 2970.75 40 April 2012 4265.04
9 September 2009 3019.95 41 Mei 2012 4258.67
10 Oktober 2009 3117.39 42 Juni 2012 4305.13
11 November 2009 3020.89 43 Juli 2012 4428.95
12 Desember 2009 3079.79 44 Agustus 2012 4380.32
13 Januari 2010 3475.98 45 September 2012 4405.29
14 Februari 2010 3552.97 46 Oktober 2012 4465.66
15 Maret 2010 3516.07 47 November 2012 4585.89
16 April 2010 3186.38 48 Desember 2012 4773.62
17 Mei 2010 3358.29 49 Januari 2013 4812.16
18 Juni 2010 3412.52 50 Februari 2013 4724.86
19 Juli 2010 3463.2 51 Maret 2013 4437.56
20 Agustus 2010 3548.33 52 April 2013 4232.08
21 September 2010 3533.86 53 Mei 2013 4448.57
22 Oktober 2010 3681.24 54 Juni 2013 4503.1
23 November 2010 3791.32 55 Juli 2013 4587.16
24 Desember 2010 3868.86 56 Agustus 2013 4581.08
25 Januari 2011 4144.8 57 September 2013 4627.11
26 Februari 2011 3987.38 58 Oktober 2013 4664.4
27 Maret 2011 3742.33 59 November 2013 4704.82
28 April 2011 3663.81 60 Desember 2013 4805.64
29 Mei 2011 3577.62 61 Januari 2014 4776.26
30 Juni 2011 3859.65 62 Februari 2014 4791.95
31 Juli 2011 3990.07 63 Maret 2014 4790.71
32 Agustus 2011 3988.54 64 April 2014 4528.88

78
Harga Harga
No Bulan No Bulan
Gabah Gabah
65 Mei 2014 4572.07 98 Februari 2017 5524.85
66 Juni 2014 4664.43 99 Maret 2017 5451.71
67 Juli 2014 4597.59 100 April 2017 5219.96
68 Agustus 2014 4630.94 101 Mei 2017 5531.22
69 September 2014 4643.25 102 Juni 2017 5564.34
70 Oktober 2014 4782.74 103 Juli 2017 5457.41
71 November 2014 4936.49 104 Agustus 2017 5470.63
72 Desember 2014 5264.16 105 September 2017 5502.49
73 Januari 2015 5447.14 106 Oktober 2017 5531.88
74 Februari 2015 5357 107 November 2017 5593.36
75 Maret 2015 5264.01 108 Desember 2017 5605.6
76 April 2015 4842.69 109 Januari 2018 6001.87
77 Mei 2015 4885.75 110 Februari 2018 5960.91
78 Juni 2015 5234.51 111 Maret 2018 5441.81
79 Juli 2015 5237.8 112 April 2018 5242.38
80 Agustus 2015 5247.92 113 Mei 2018 5266.89
81 September 2015 5330.12 114 Juni 2018 5360.66
82 Oktober 2015 5355.76 115 Juli 2018 5206.27
83 November 2015 5523.57 116 Agustus 2018 5307.94
84 Desember 2015 5631.66 117 September 2018 5398.92
85 Januari 2016 5689.13 118 Oktober 2018 5467.2
86 Februari 2016 5753.18 119 November 2018 5646.37
87 Maret 2016 5500.77 120 Desember 2018 5713.71
88 April 2016 5473.99 121 Januari 2019 5779.84
89 Mei 2016 5509.78 122 Februari 2019 5827.67
90 Juni 2016 5430.07 123 Maret 2019 5529.65
91 Juli 2016 5380.28 124 April 2019 5126.59
92 Agustus 2016 5404.89 125 Mei 2019 5171.89
93 September 2016 5284.58 126 Juni 2019 5246
94 Oktober 2016 5311.7 127 Juli 2019 5277.23
95 November 2016 5325.28 128 Agustus 2019 5308.74
96 Desember 2016 5438.21 129 September 2019 5391.51
97 Januari 2017 5542.32

79
Lampiran 2. Uji Linearitas

1. Hipotesis

𝐻0 : 𝑎2 = ⋯ = 𝑎𝑘 = 0 (Data harga gabah tidak mengandung pola nonlinear)

𝐻1 : 𝑎𝑘 ≠ 0 (Data harga gabah mengandung pola nonlinear)

2. Statistik uji

3. Kriteria uji

Tolak 𝐻0 jika 𝑅𝐸𝑆𝐸𝑇 > 𝐹(𝑘−1,𝑛−𝑘) atau p-value <𝛼, artinya data harga gabah

mengandung pola nonlinear. Hasil pengujian menunjukkan p-value uji RESET

sebesar 2.2e − 16 < 𝛼 = 5 %, maka 𝐻0 ditolak, artinya bahwa data harga

gabah mengandung pola nonlinear.

80
Lampiran 3. Syntax Software R Identifikasi Musiman

#INPUT DATA HARGA GABAH


data <- read.table(file.choose(), header=T, sep=",")
data
OLAH=data[,2]
OLAH

#DATA TRAINING
GABAH<-OLAH[1:116]

#ADF TEST DATA HARGA GABAH


adf.test(GABAH)

#DIFFERENCING PERTAMA
GABAH.diff1<-diff(GABAH, diff=1)

#ADF TEST DATA DIFFERENCING PERTAMA


adf.test(GABAH.diff1)

#IDENTIFIKASI POLA MUSIMAN


n<-length(GABAH.diff1)
k<-round((n-1)/2)
omega<-c()
t<-c(1:n)
md=matrix(0,nrow=k,ncol=n)
mt=matrix(0,nrow=k,n)
mdata=matrix(0,nrow=k,ncol=n)
cosomega=matrix(0,nrow=k,ncol=n)
md1=matrix(0,nrow=k,ncol=n)
mt1=matrix(0,nrow=k,ncol=n)
mdata=matrix(0,nrow=k,ncol=n)
sinomega=matrix(0,nrow=k,ncol=n)
for (i in 1:k)
{
omega[i]<-(2*pi*i)/n
md[i,]<-omega[i]
mt[i,]<-t
mdata[i,]<-GABAH.diff1[t]
}
cosomega<-mdata*cos(md*mt)
sinomega<-mdata*sin(md*mt)
a<-c()
b<-c()
periodogram<-c()
for (i in 1:k)
{
a[i]<-(2/n)*sum(cosomega[i,])
b[i]<-(2/n)*sum(sinomega[i,])
periodogram[i]<-(a[i]^2+b[i]^2)
}

81
k<-which.max(periodogram)
omega<-(2*pi*k)/n
Periode<-(2*pi)/omega
Thitung<-(max(periodogram))/sum(periodogram)
Nbintang<-c(seq(5,50,by=5))
galpha<-c(0.68377,0.44495,0.33462,0.27040,0.22805,0.19784,
0.17513,0.15738,0.14310,0.13135)
Tabel<-cbind(Nbintang,galpha)
Ttabel<-Tabel[10,2]
> Thitung
[1] 0.2043092
> Ttabel
galpha
0.13135
> Periode
[1] 6.052632

82
Lampiran 4. Plot ACF dan PACF

Series GABAH Series GABAH

1.0
1.0

0.8
0.8

0.6
0.6

Partial ACF
ACF

0.4
0.4

0.2
0.2

0.0
0.0
-0.2

-0.2

0 10 20 30 40 50 0 10 20 30 40 50

Lag Lag

DATA GABAH ASLI

Series GABAH.diff1 Series GABAH.diff1


1.0

0.3
0.8

0.2
0.6

0.1
Partial ACF
0.4
ACF

0.0
0.2

-0.1
0.0

-0.2
-0.2

-0.3

0 10 20 30 40 50 0 10 20 30 40 50

Lag Lag

DATA GABAH Differencing Pertama

83
Lampiran 5. Syntax Software R Model Hybrid SARIMA-SVR

rm(list=ls())
library(tseries)
library(forecast)
library(fGarch)
library(lmtest)
library(tidyverse)
library(FinTS)
library("portes")
#INPUT DATA HARGA GABAH
data <- read.table(file.choose(), header=T, sep=",")
data
OLAH=data[,2]
OLAH

#PEMBAGIAN DATA TRAINING DAN TESTING


GABAH<-OLAH[1:116] #DATA TRAINING
GABAH_TEST<-OLAH[117:129] #DATA TESTING

#UJI LINEARITAS DATA HARGA GABAH


resettest(GABAH~row_number(GABAH), power=2,
type="regressor")

#DATA HARGA GABAH


#ADF TEST- UJI STASIONERITAS
adf.test(GABAH)
#PLOT ACF & PACF DATA HARGA GABAH
win.graph()
par(mfrow=c(3,1))
ts.plot(GABAH, col = "blue", xlab="Bulan (Januari 2009 -
Agustus 2018)",ylab="Harga Gabah (Rupiah)",main = "Plot Data
Harga Gabah")
acf(GABAH, lag=50)
pacf(GABAH, lag=50)

# DATA DIFFERENCING PERTAMA


GABAH.diff1<-diff(GABAH, diff=1)
#ADF TEST DATA DIFFERENCING PERTAMA - UJI STASIONERITAS
adf.test(GABAH.diff1)
#PLOT ACF & PACF DIFFERENCING PERTAMA
win.graph()
par(mfrow=c(3,1))
ts.plot(GABAH.diff1, col = "red", main = "Plot Data Gabah
Differencing Pertama")
acf(GABAH.diff1,lag=50)
pacf(GABAH.diff1,lag=50)

#DIFFERENCING MUSIMAN PERTAMA (PERIODE=6)


GABAHmus.diff1<-diff(GABAH.diff1,lag=6, diff=1)

84
#ADF TEST DATA DIFFERENCING PERTAMA (PERIODE=6)- UJI
STASIONERITAS
adf.test(GABAHmus.diff1)
#PLOT ACF & PACF DIFFERENCING PERTAMA (PERIODE=6)
win.graph()
par(mfrow=c(3,1))
ts.plot(GABAHmus.diff1, col = "green", main = "Plot Data
Gabah Diffencing Pertama dan Differencing Musiman Pertama ")
acf(GABAHmus.diff1,lag=50)
pacf(GABAHmus.diff1,lag=50)

#IDENTIFIKASI MODEL SARIMA


#MODEL SARIMA(0,1,0)(1,1,1)6– SARIMA_MODEL1
Sarima_Model1<-Arima(GABAH, order=c(0,1,0),
seasonal=list(order=c(1,1,1), period=6), include.mean=FALSE)
summary(Sarima_Model1)
#MODEL SARIMA(1,1,0)(1,1,1)6 – SARIMA_MODEL2
Sarima_Model2<-Arima(GABAH, order=c(1,1,0),
seasonal=list(order=c(1,1,1), period=6), include.mean=FALSE)
summary(Sarima_Model2)
#MODEL SARIMA(0,1,1)(1,1,1)6 – SARIMA_MODEL3
Sarima_Model3<-Arima(GABAH, order=c(0,1,1),
seasonal=list(order=c(1,1,1), period=6), include.mean=FALSE)
summary(Sarima_Model3)
#MODEL SARIMA(1,1,1)(1,1,1)6 – SARIMA_MODEL4
Sarima_Model4<-Arima(GABAH, order=c(1,1,1),
seasonal=list(order=c(1,1,1), period=6), include.mean=FALSE)
summary(Sarima_Model4)
#MODEL SARIMA(2,1,0)(1,1,1)6 – SARIMA_MODEL5
Sarima_Model5<-Arima(GABAH, order=c(2,1,0),
seasonal=list(order=c(1,1,1), period=6), include.mean=FALSE)
summary(Sarima_Model5)
#MODEL SARIMA(0,1,2)(1,1,1)6 – SARIMA_MODEL6
Sarima_Model6<-Arima(GABAH, order=c(0,1,2),
seasonal=list(order=c(1,1,1), period=6), include.mean=FALSE)
summary(Sarima_Model6)
#MODEL SARIMA(2,1,1)(1,1,1)6 – SARIMA_MODEL7
Sarima_Model7<-Arima(GABAH, order=c(2,1,1),
seasonal=list(order=c(1,1,1), period=6), include.mean=FALSE)
summary(Sarima_Model7)
#MODEL SARIMA(1,1,2)(1,1,1)6 – SARIMA_MODEL8
Sarima_Model8<-Arima(GABAH, order=c(1,1,2),
seasonal=list(order=c(1,1,1), period=6), include.mean=FALSE)
summary(Sarima_Model8)
#MODEL SARIMA(2,1,2)(1,1,1)6 – SARIMA_MODEL9
Sarima_Model9<-Arima(GABAH, order=c(2,1,2),
seasonal=list(order=c(1,1,1), period=6), include.mean=FALSE)
summary(Sarima_Model9)

#STATISTIK UJI T
n<-length(GABAH)

85
qt(c(0.025), df=n-1, lower.tail=F)

#UJI DIAGNOSTIK
#MODEL SARIMA(0,1,0)(1,1,1)6– SARIMA_MODEL1
residu1<-Sarima_Model1$residuals
portest(residu1,lags=seq(1,60,1),test=c("Ljung"),
MonteCarlo=FALSE)
ks.test(residu1,"pnorm")
#MODEL SARIMA(2,1,1)(1,1,1)6 – SARIMA_MODEL7
residu7<-Sarima_Model7$residuals
portest(residu7,lags=seq(1,60,1),test=c("Ljung"),
MonteCarlo=FALSE)
ks.test(residu7,"pnorm")
#MODEL SARIMA(2,1,2)(1,1,1)6 – SARIMA_MODEL9
residu9<-Sarima_Model9$residuals
portest(residu9,lags=seq(1,60,1),test=c("Ljung"),
MonteCarlo=FALSE)
ks.test(residu9,"pnorm")

#PERAMALAN HARGA GABAH MODEL SARIMA TERBAIK


GABAH_ramalan=fitted(Sarima_Model9)
GABAH_ramalan
#MAPE DATA TRAINING SARIMA
accuracy(GABAH_ramalan, GABAH)
#MENGHITUNG RESIDUAL MODEL SARIMA TERBAIK
residu_sarima<-Sarima_Model9$residual

#EVALUASI MODEL SARIMA DENGAN DATA TESTING


#PREDIKSI GABAH SARIMA TESTING
pred.GABAH_TEST<-predict(Sarima_Model9,13)$pred
pred.GABAH_TEST
#MAPE SARIMA TESTING
accuracy(pred.GABAH_TEST, GABAH_TEST)

#MEMULAI SVR DENGAN INPUT DATA RESIDUAL SARIMA


library(kknn)
library(rminer)
library(e1071)

#MASUK KE SVR
#DATA TIME LAG
residu_train<-window(residu_sarima)
#TIME LAG = 2
d1=CasesSeries(residu_train, c(1,2))
d1
train_Y<-d1[3]
train_X<-d1[1:2]
train_Y
train_X

#GRID SEARCH

86
#LOOSE GRID
set.seed(1000)
tc <- tune.control(cross = 10)
tune.model1<-tune.svm(y~., data=d1, scale=T, type="eps-
regression",
kernel="radial",cost=list(2^-7,2^-5,2^-3,2^-
1,2^1,2^3,2^5,2^7), epsilon=seq(0.01,0.1,0.01),
gamma=list(2^-7,2^-5,2^-3,2^-1,2^1,2^3,2^5,2^7),
tolerance=0.001, shrinking=T, fitted=T, tunecontrol = tc)
summary(tune.model1)
model.svm1<-tune.model1$best.model
model.svm1
#FINER GRID
set.seed(1000)
tc <- tune.control(cross = 10)
tune.model2<-tune.svm(y~., data=d1, scale=T, type="eps-
regression",
kernel="radial", cost=list(2^-1.75, 2^-1.5, 2^-1.25, 2^-1,
2^-0.75, 2^-0.5, 2^-0.25), epsilon=0.02,
gamma=list(2^6.25, 2^6.5, 2^6.75, 2^7),
tolerance=0.001, shrinking=T, fitted=T, tunecontrol = tc)
summary(tune.model2)
model.svm2<-tune.model2$best.model
model.svm2

#PERAMALAN RESIDUAL SARIMA DENGAN SVR


#DATA TRAINING
pred_train<-predict(model.svm2)
pred_train

#PERAMALAN HARGA GABAH HYBRID SARIMA-SVR


#GABAH TRAINING SVR ASLI
GABAH_trainsvr<-GABAH[-1:-2]
GABAH_trainsvr
#DATA TRAINING PERAMALAN SVR
GABAH_ramalan_svr<-window(GABAH_ramalan, start=3, end=116)
GABAH_ramalan_svr
#PERAMALAN HARGA GABAH HYBRID SARIMA-SVR
GABAH_hybrid_train<- GABAH_ramalan_svr+pred_train
GABAH_hybrid_train
#MAPE DATA TRAINING SARIMA-SVR
accuracy(GABAH_hybrid_train,GABAH_trainsvr)

#EVALUASI MODEL HYBRID SARIMA-SVR DENGAN DATA TESTING


#PERAMALAN RESIDUAL SARIMA TESTING
pred_test1<-predict(model.svm2, newdata=data.frame(lag2=-
103.382, lag1=63.196))
pred_test2<-predict(model.svm2,
newdata=data.frame(lag2=63.196,lag1=pred_test1))
pred_test3<-predict(model.svm2,
newdata=data.frame(lag2=pred_test1,lag1=pred_test2))

87
pred_test4<-predict(model.svm2,
newdata=data.frame(lag2=pred_test2,lag1=pred_test3))
pred_test5<-predict(model.svm2,
newdata=data.frame(lag2=pred_test3,lag1=pred_test4))
pred_test6<-predict(model.svm2,
newdata=data.frame(lag2=pred_test4,lag1=pred_test5))
pred_test7<-predict(model.svm2,
newdata=data.frame(lag2=pred_test5,lag1=pred_test6))
pred_test8<-predict(model.svm2,
newdata=data.frame(lag2=pred_test6,lag1=pred_test7))
pred_test9<-predict(model.svm2,
newdata=data.frame(lag2=pred_test7,lag1=pred_test8))
pred_test10<-predict(model.svm2,
newdata=data.frame(lag2=pred_test8,lag1=pred_test9))
pred_test11<-predict(model.svm2,
newdata=data.frame(lag2=pred_test9,lag1=pred_test10))
pred_test12<-predict(model.svm2,
newdata=data.frame(lag2=pred_test10,lag1=pred_test11))
pred_test13<-predict(model.svm2,
newdata=data.frame(lag2=pred_test11,lag1=pred_test12))

pred_test<-
c(pred_test1,pred_test2,pred_test3,pred_test4,pred_test5,pre
d_test6,pred_test7,

pred_test8,pred_test9,pred_test10,pred_test11,pred_tes
t12,pred_test13)
pred_test

#GABAH HYBRID SARIMA-SVR TESTING


GABAH_hybrid_test<-pred.GABAH_TEST+pred_test
GABAH_hybrid_test

#MAPE SARIMA-SVR DATA TESTING


accuracy(GABAH_hybrid_test, GABAH_TEST)

88
Lampiran 6. Hasil Uji Parsial Model SARIMA

Estimasi Standar
No Model Parameter t-hitung Kesimpulan
Parameter Error
SARIMA AR Musiman (1) -0.5437 0.1205 -4.5120 Signifikan
1
(0,1,0)(1,1,1)6 MA Musiman (1) -0.7558 0.1771 -4.2676 Signifikan
AR (1) -0.1011 0.0973 -1.0391 Tidak Signifikan
SARIMA
2 AR Musiman (1) -0.5649 0.1162 -4.8614 Signifikan
(1,1,0)(1,1,1)6
MA Musiman (1) -0.7516 0.1693 -4.4395 Signifikan
MA (1) -0.1415 0.1104 -1.2817 Tidak Signifikan
SARIMA
3 AR Musiman (1) -0.5727 0.1133 -5.0547 Signifikan
(0,1,1)(1,1,1)6
MA Musiman (1) -0.7510 0.1633 -4.5989 Signifikan
AR (1) 0.5248 0.3610 1.4537 Tidak Signifikan
SARIMA MA (1) -0.6625 0.3203 -2.0684 Signifikan
4
(1,1,1)(1,1,1)6 AR Musiman (1) -0.5761 0.1127 -5.1118 Signifikan
MA Musiman (1) -0.7217 0.1626 -4.4385 Signifikan
AR (1) -0.1195 0.0977 -1.2231 Tidak Signifikan
SARIMA AR (2) -0.1656 0.0932 -1.7768 Signifikan
5
(2,1,0)(1,1,1)6 AR Musiman (1) -0.5647 0.1068 -5.2875 Signifikan
MA Musiman (1) -0.7644 0.1437 -5.3194 Signifikan
MA (1) -0.0779 0.1027 -0.7585 Tidak Signifikan
SARIMA MA (2) -0.1880 0.1098 -1.7122 Tidak Signifikan
6
(0,1,2)(1,1,1)6 AR Musiman (1) -0.5613 0.1106 -5.0750 Signifikan
MA Musiman (1) -0.7509 0.1471 -5.1047 Signifikan
AR (1) -0.6121 0.2151 -2.8457 Signifikan
AR (2) -0.2463 0.0964 -2.5550 Signifikan
SARIMA
7 MA(1) 0.5148 0.2111 2.4387 Signifikan
(2,1,1)(1,1,1)6
AR Musiman (1) -0.5459 0.1068 -5.1114 Signifikan
MA Musiman (1) -0.8073 0.1361 -5.9317 Signifikan
AR (1) -0.3979 0.2888 -1.3778 Tidak Signifikan
MA(1) 0.3137 0.2884 1.0877 Tidak Signifikan
SARIMA
8 MA(2) -0.2135 0.0913 -2.3384 Signifikan
(1,1,2)(1,1,1)6
AR Musiman (1) -0.5514 0.1116 -4.9409 Signifikan
MA Musiman (1) -0.7747 0.1468 -5.2772 Signifikan
AR (1) -0.9564 0.1332 -7.1802 Signifikan
AR(2) -0.8367 0.1747 -4.7894 Signifikan
SARIMA MA(1) 0.8581 0.1845 4.6509 Signifikan
9
(2,1,2)(1,1,1)6 MA(2) 0.6319 0.2256 2.8010 Signifikan
AR Musiman (1) -0.5781 0.0933 -6.1961 Signifikan
MA Musiman (1) -0.9152 0.1572 -5.8219 Signifikan

89
Lampiran 7. Trial and Error Pemilihan Jumlah Lag Input Data Model SVR

Jumlah Lag RMSE


1 110,24
2 84,25
3 99,74
4 104,39
5 110,57
6 118,31
7 110,08
8 121,33
9 121,68
10 117,04
11 111,35
12 110,30
13 115,19
14 107,70
15 101,53

90

Anda mungkin juga menyukai