Abstrak
Padi merupakan salah satu sumberdaya penting dalam kehidupan manusia, dalam beberapa survei
didapati bahwa lebih dari 59% penduduk dunia menggunakan Beras yang berasal dari padi sebagai
bahan pokok makanan. Namun dalam suatu teori lain disebutkan bahwa populasi manusia akan terus
berkembang secara eksponensial sedangkan hal itu sulit untuk diikuti oleh pertumbuhan hasil pangan,
terutama dalam hal ini padi. Metode Support Vector Regression (SVR) adalah metode yang akan
digunakan pada penelitian ini, metode ini telah digunakan pada beberapa penelitian sebelumnya
seperti peramalan harga emas dan peramalan konsumsi listrik. Dalam penelitian ini akan difokuskan
untuk menguji apakah metode Support Vector Regression(SVR) ini cocok untuk digunakan dalam
prediksi hasil panen padi, dengan menggunakan beberapa parameter yang telah ditentukan, serta
dengan menerapkan perubahan pada parameter yaitu jumlah iterasi, Complexity, Epsilon, Sigma, cLR,
Lambda. Hasil yang terbaik yang didapatkan pada penelitian ini mencapai error rate MAPE sebesar
10,133%, hasil tersebut dicapai dengan nilai parameter sebagai berikut, Jumlah iterasi : 50, Complexity
: 1, Epsilon : 0,01, Sigma : 1, cLR : 0,1, Lambda : 1.
Kata kunci:Aplikasi, SVR, Peramalan, Padi, Time Series
Abstract
Rice is one of the important resources in human life, in several surveys it was found that more than
59% of the world's population used rice from rice as food staple. But in another theory stated that the
human population will continue to develop exponentially while it is difficult to be followed by the
growth of food products, especially in this case rice. Support Vector Regression (SVR) method is a
method that will be used in this study, this method has been used in several previous studies such as
forecasting gold prices and forecasting electricity consumption. In this study we will focus on testing
whether the Support Vector Regression (SVR) method is suitable for use in predicting rice yields,
using a number of predetermined parameters, and by applying changes to the parameters, namely the
number of iterations, Complexity, Epsilon, Sigma, cLR , Lambda. The best results obtained in this
study reached MAPE error rate of 10.133%, these results were achieved with the following parameter
values, Number of iterations: 50, Complexity: 1, Epsilon: 0.01, Sigma: 1, cLR: 0.1, Lambda: 1.
Keywords: Application, SVR, Prediction, Rice, Time Series
Penelitian ketiga yang dilakukan Syafrudin non-linier dapat dihasilkan lebih cepat dan
(2014) mengambil topik prediksi kebutuhan solusi yang lebih optimal bila dibandingkan
listrik hingga 2030, dengan studi kasus di dengan penggunaan metode lain yang lebih
Provinsi Lampung. Perkiraan baban tanggungan sederhana l (Vijayakumar & Wu, 1999).
listrik oleh sistem merupakan faktor yang
Algoritme ini terdiri dari beberapa tahap :
sangat berpengaruh dalam mengarahkan
rencana pengembangan fasilitas, Sehingga,
Syafrudin melakukan prediksi untuk
merencanakan kebutuhan beban listrik sistem 1. Inisialisasi parameter
melihat beberapa waktu sebelumnya. Jangka Dalam metode SVR menggunakan beberapa
waktu prediksi yang telah dilakukan ada tiga, parameter yaitu ε dan C yang berpengaruh
yakni jangka panjang (lebih dari 1 tahun), dalam menentukan toleransi kesalahan, cLR
jangka menengah (1 bulan sampai 1 tahun), dan sebagai penentu kecepatan proses pembelajaran
jangka pendek (kurang dari 1 minggu). Prediksi
, 𝜎 sebagai konstanta yang berpengaruh
dilakukan secara teratur dan dapat dievaluasi
pesebaran dimensi data , dan 𝜆 sebagai penentu
secara ilmiah, sehingga dapat memberikan
ukuran skala dimensi pemetaan kernel SVR
keyakinan untuk pengguna hasil prediksi
tersebut. Untuk menguji keabsahan model yang
menghasilkan prediksi, dilakukan perbandingan
2. Perhitungan matriks Hessian
nilai prediksi dengan nilai sebenarnya.
Matriks Hessian dihitung sesuai persamaan (2)
2.2. Dasar Teori
[R]ij = K(xi , xj) + λ2 ,
2.2.1. Support Vector Regression
untuk i dan j=1,2,…,n (2)
Support Vector Regression (SVR)
merupakan perkembangan model regresi dari Keterangan :
Support Vector Machines (SVM) yang mulanya
[R]ij = matriks Hessian
digunakan untuk mendeskripsikan masalah
klasifikasi. Dalam penelitian ini SVR akan K(xi , xj )= fungsi kernel
diplikasikan untuk tipe data Time Series, yang
dalam konteks data memiliki arti sebagai data λ2 = variabel skalar
yang berupa serangkaian peristiwa atau
Fungsi kernel berikut digunakan untuk
pengamatan yang diambil secara berurutan dari
memetakan dimensi data menjadi lebih tinggi,
waktu ke waktu, Seperti yang ditampilkan pada
sehingga diharapkan dapat menghasilkan
Gambar 2.1 data dalam penelitian ini berwujud
dimensi data yang lebih tinggi dan terstruktur
Time Series. Tujuan dari SVR adalah membuat
(Rajkumar dan Jaganathan, 2013).
data yang lebih acak untuk dapat menerima
Implementasi Kernel Gaussian (RBF) banyak
regresi yaitu dengan memetakannya pada
digunakan dalam penelitian sebelumnya, yang
dimensi yang lebih tinggi. Persamaan umum
dianggap mampu memberikan hasil yang baik
regresi dapat dilihat seperti persamaan (2.1):
dalam SVR (Li, et al., 2005), fungsinya
dirumuskan sebagai persamaan (3)
4. Proses iterasi
Keterangan :
Tahap Perhitungan nilai kesalahan di atas
Ei = nilai kesalahan pada posisi ke-i kemudian diulang (iterasi) sampai satu dari
syarat ini terpenuhi:
yi = nilai aktual data latih ke-i
a. Iterasi mencapai batas iterasi maksimal yang
α∗j − αj = nilai Lagrange Multiplier
telah ditentukan
terkini
b. Tidak terjadi perubahan nilai pada Lagrange
n = jumlah data latih Multiplier atau dengan kata lain terjadi
konvergensi.
normalisasi()
Tabel 2 Penentuan Fitur
hessian()
Tahun 1 2 3 4
2004 349121 363541 328697 350607 354172
Keterangan :
Nilai MAPE
(double) Y = Data Aktual tahun tersebut
(349121- 328197)
x= = 0.11792 Tabel 3 Hasil Matriks Kernel Data Latih
(505638- 328197)
Tahun k1 k2 k3 k4 k5
0.9853
Pada Tabel 3 berikut ditampilkan hasil latih 2004 1.00000 0.98521 0.99044 0.99324
7
yang telah di normalisasi
0.9916
Tabel 3 Data Latih Setelah Normalisasi 2005 0.98521 1.00000 0.98676 0.99253
7
Tahun 1 2 3 4 0.9916
2006 0.99044 0.98676 1.00000 0.99452
7
0.1179 0.0028 0.1263 0.1463
2004 0.19919
2 2 0 9 0.9982
2007 0.99324 0.99253 0.99452 1.00000
0
0.1991 0.1263 0.1463 0.1332
2005 0.00282
9 0 9 8 1.0000
2008 0.98537 0.99167 0.99167 0.99820
0
0.0028 0.1463 0.1332 0.2145
2006 0.12630
2 9 8 7
Tahun h1 h2 h3 h4 h5
3.5. Proses Sequential Learning 1.6400
2004 1.62521 1.63044 1.63324 1.62537
0
Mula-mula nilai Lagrange Multiplier 𝛼𝑖∗
dan 𝛼𝑖 setiap data latih diinisialisasi sebesar 1.6252
0 karena proses utama SVR bertujuan untuk 2005 1.64000 1.62676 1.63253 1.63167
1
mencari nilai Lagrange Multiplier, pencarian
dilakukan dengan mengulangi proses ini. 1.6304
2006 1.62676 1.64000 1.63452 1.63167
Syarat untuk menghentikannya adalah 4
apabila perulangan atau iterasi sudah
1.6332
maksimal sesuai batas yang ditentukan 2007 1.63253 1.63452 1.64000 1.63820
4
sebelumnya, atau tidak terjadi perubahan
lagi, atau telah memenuhi syarat 1.6253
max(|𝛿𝛼𝑖 |) < 𝜀 dan max(|𝛿𝛼𝑖∗ |) < 𝜀 , atau 2008 1.63167 1.63167 1.63820 1.64000
7
tidak terjadi perubahan nilai pada Lagrange
Multiplier (sudah konvergen). 6. Uji coba nilai parameter 𝜆 (lambda)
i min{max( ( Ei ), C i )} 17
16
Error Rate
15
14
(7) 13
12
11
10
4. PENGUJIAN
Jumlah Iterasi
Pengujian sistem meliputi beberapa analisis
yaitu :
1. Uji coba jumlah iterasi sequential training Gambar 3 Hasil Error Uji Jumlah Iterasi
SVR
Jumlah iterasi pelatihan berpengaruh pada
2. Uji coba nilai k parameter 𝐶 (Complexity) presisi yang dihasilkan, semakin banyak
3. Uji coba nilai parameter 𝜀 (epsilon) iterasi maka bertambah pula kemampuan
SVR dalam mengobservasi pola data.
4. Uji coba nilai parameter 𝜎 (sigma) Kernel Umumnya Iterasi yang bertambah juga
Gaussian RBF
akan mengoptimalkan proses trade-off
5. Uji coba nilai parameter cLR dalam membentuk garis regresi sehingga
Fakultas Ilmu Komputer, Universitas Brawijaya
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer 9410
Error Rate
5.2. Hasil Uji Variasi Parameter 23
26
22 mendapatkan nilai kesalahan terkecil sebesar
18 11.44946 pada parameter 1.E-2(0.01).
14
10
Nilai Complexity
16
merepresentasikan batas penalti kesalahan yang
14
boleh terjadi, atau seberapa toleran, dimana
semakin besar nilai parameter 𝐶 toleransi yang 12
diberikan semakin sedikit sehingga hasil yang 10
didapatkan semakin akurat(Furi, et al., 2015).
Pada uji Coba yang telah dilakukan terlihat Nilai Sigma
bahwa nilai yang besar membuat nilai error
Gambar 6 Hasil Error Uji Variasi Sigma
semakin stabil. Berdasarkan hasil diatas maka
dapat disimpulkan nilai C terbaik dengan hasil
error rate paling kecil dimulai dari 1 dan masih
Berdasarkan Gambar 6, parameter 𝜎
Fakultas Ilmu Komputer, Universitas Brawijaya
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer 9411
Error Rate
et al., 2015). Secara umum hasil dari kurva 20
peramalan dapat menjadi sangat halus dengan 15
nilai 𝜎 yang cenderung sangat kecil, sebaliknya 10
5
dengan nilai 𝜎 yang besar maka hasil kurva
peramalan menjadi sangat kasar (Kurniasih,
2013). Dari Hasil yang ditunjukkan terlihat
Nilai Lambda
bahwa error terkecil ada pada nilai parameter
sigma = 1, yakni sebesar 10,24658. Gambar 8 Hasil Error Uji Variasi Lambda
4. Hasil Uji Parameter cLR Secara umum semakin kecil nilai 𝜆 maka
Parameter 𝑐𝐿𝑅 merupakan nilai konstanta hasil peramalan akan semakin baik, dan
yang menentukan kecepatan proses belajar, di semakin besar nilai 𝜆 maka waktu komputasi
mana secara umum kecepatan tinggi rawan dan proses konvergensi melambat
memberikan hasil buruk sedangkan kecepatan dikarenakan besarnya dimensi (Vijayakumar
rendah memberikan hasil yang lebih baik. & Wu, 1999). Nilai Error rate palingkecil
(Vijayakumar & Wu, 1999). Berdasarkan hasil didapat pada Lambda = 1 yakni sebesar
ujicoba yang di tampillkan pada Gambar 7 10,13378
didapatkan nilai Error Rate paling baik adalah
6. KESIMPULAN DAN SARAN
pada nilai cLR 0,1 dengan error rate 10,20014
6.1. Kesimpulan
Hasil paling optimal dalam pengujian
30 perubahan parameter dan jumlah iterasi
25 sehingga menghasilkan nilai kesalahan paling
Error Rate
6.2. Saran
Saran untuk dipertimbangkan pada
penelitian selanjutnya mengenai metode dan
obyek terkait diantaranya sebagai berikut
1. Jumlah Data untuk pelatihan dan pengujian
Fakultas Ilmu Komputer, Universitas Brawijaya
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer 9412
yang digunakan dapat ditambah atau mungkin and Applications (Third Edition),John
data tahunan yang ada bisa di olah menjadi data Wiley & Sons, Canada, 1998.
dengan kurun waktu setiap 4 bulan Sembiring, R.K. 2003. Analsisis Regresi.
menyesuaikan dengan standar 3 kali masa Bandung : Penerbit ITB
tanam/tahun
Bowerman, B.L, dan O’Connell, R.T.
2. Ditambahkan metode tertentu menentukan Forecasting and Time Series : An
nilai parameter agar hasil yang diberikan lebih Aplied Aproach, Edisi Ketiga, Duxbury
akurat dan mengurangi angka kesalahan. Hal ini Press, California, 1993
dikarenakan nilai-nilai parameter SVR yang Sofyan Assauri. 1984. “Teknik dan Metode
digunakan mudah sekali terjebak pada nilai Peramalan”. Jakarta : Penerbit Fakultas
local optimum, sehingga apabila digunakan Ekonomi Universitas Indonesia
metode optimasi model peramalan Kurniasih, D., 2013. Efisiensi Relatif Estimator
menggunakan algoritma SVR maka diharapkan Fungsi Kernel Gaussian terhadap
dapat mengatasi kekurangan SVR dalam Estimator Polinomial dalam Peramalan
pemilihan nilai parameter. Usd terhadap Jpy, Semarang: s.n.
3. Diujicobakan pada model peramalan semi- Patro, S. G. K. & Sahu, K. K., 2015.
supervised, dimana hanya terdapat 1 dataset Normalization: A Preprocessing Stage.
yang diatur sedemikian hingga membentuk pola 19 Maret.
data fitur dan data aktual. Dari pengaturan Suranart, K., Kiattisin, S. & Leelasantitham, A.,
tersebut nantinya terdapat pola dengan bagian 2014. Analysis of Comparisons for
kosong yang akan diramalkan nilainya Forecasting Gold Price using Neural
berdasarkan pola penuh sebelumnya Network, Radial Basis Function
Network and Support Vector
Regression. Mahidol, IEEE.
7. DAFTAR PUSTAKA Dinas Tanaman Pangan dan HoltiKultura
Kabupaten Malang, 2018 Produksi
Vijayakumar, S. & Wu, S., 1999. Sequential
Padi, Jagung, Dan Kedelai
Support Vector Classiers and
Regression. Genoa, Italy, Saitama: Dodo, J. 2008. Ramalan Penjualan Sepeda
RIKEN Brain Science Institute, The Motor Honda Pada CV. Roda Mitra
Institute for Physical and Chemical Lestari. Jurnal Universitas Gunadarma
Research, pp. 610-619.
Syafruddin, M., 2014. Prediksi Kebutuhan
Energi Listrik Jangka Panjang untuk
Provinsi Lampung hingga Tahun 2030,
Bandar Lampung: Universitas
Lampung.
Bhuana, Hans Ricardo Tirta 2012. Model
Prediksi Produksi Panen Komoditas
Padi Menggunakan Metode Regresi
Linier Berganda.
Butler, William F., Robert A. Kavesh, Robert
B. Platt, Methods and Techniques of
Business Forecasting, Prentice Hall,
New Jersey, First Edition, 1996.
Makridakis, Spyros, Steven C. Wheelwright,
Rob J.Hyndman, Forecasting: Methods