Anda di halaman 1dari 11

Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-ISSN: 2548-964X

Vol. 3, No. 10, Oktober 2019, hlm. 9402-9412 http://j-ptiik.ub.ac.id

Penerapan Algoritma Support Vector Regression Pada Peramalan Hasil


Panen Padi Studi Kasus Kabupaten Malang
Dhan Adhillah Mardhika1, Budi Darma Setiawan2, Randy Cahya Wihandika3
Program Studi Teknik Informatika, Fakultas Ilmu Komputer, Universitas Brawijaya, Malang
Email: 1dhandhika@gmail.com, 2s.budidarma@ub.ac.id, 3rendicahya@ub.ac.id

Abstrak
Padi merupakan salah satu sumberdaya penting dalam kehidupan manusia, dalam beberapa survei
didapati bahwa lebih dari 59% penduduk dunia menggunakan Beras yang berasal dari padi sebagai
bahan pokok makanan. Namun dalam suatu teori lain disebutkan bahwa populasi manusia akan terus
berkembang secara eksponensial sedangkan hal itu sulit untuk diikuti oleh pertumbuhan hasil pangan,
terutama dalam hal ini padi. Metode Support Vector Regression (SVR) adalah metode yang akan
digunakan pada penelitian ini, metode ini telah digunakan pada beberapa penelitian sebelumnya
seperti peramalan harga emas dan peramalan konsumsi listrik. Dalam penelitian ini akan difokuskan
untuk menguji apakah metode Support Vector Regression(SVR) ini cocok untuk digunakan dalam
prediksi hasil panen padi, dengan menggunakan beberapa parameter yang telah ditentukan, serta
dengan menerapkan perubahan pada parameter yaitu jumlah iterasi, Complexity, Epsilon, Sigma, cLR,
Lambda. Hasil yang terbaik yang didapatkan pada penelitian ini mencapai error rate MAPE sebesar
10,133%, hasil tersebut dicapai dengan nilai parameter sebagai berikut, Jumlah iterasi : 50, Complexity
: 1, Epsilon : 0,01, Sigma : 1, cLR : 0,1, Lambda : 1.
Kata kunci:Aplikasi, SVR, Peramalan, Padi, Time Series

Abstract
Rice is one of the important resources in human life, in several surveys it was found that more than
59% of the world's population used rice from rice as food staple. But in another theory stated that the
human population will continue to develop exponentially while it is difficult to be followed by the
growth of food products, especially in this case rice. Support Vector Regression (SVR) method is a
method that will be used in this study, this method has been used in several previous studies such as
forecasting gold prices and forecasting electricity consumption. In this study we will focus on testing
whether the Support Vector Regression (SVR) method is suitable for use in predicting rice yields,
using a number of predetermined parameters, and by applying changes to the parameters, namely the
number of iterations, Complexity, Epsilon, Sigma, cLR , Lambda. The best results obtained in this
study reached MAPE error rate of 10.133%, these results were achieved with the following parameter
values, Number of iterations: 50, Complexity: 1, Epsilon: 0.01, Sigma: 1, cLR: 0.1, Lambda: 1.
Keywords: Application, SVR, Prediction, Rice, Time Series

1. PENDAHULUAN menjadikan beras sebagai sumber kalori utama.


Di Asia, 75% populasi menghasilkan beras
Padi adalah salah satu tanaman terpenting, (beras) sebagai asupan kalori harian yang
karena beras adalah sumber karbohidrat utama mencakup Indonesia (Zulmi, 2011). Di
bagi sebagian besar penduduk dunia. Produksi Indonesia, beras adalah makanan pokok
beras di dunia menempati urutan ketiga dalam penduduk yang memiliki nilai kontribusi 60%
semua tanaman pangan setelah jagung dan hingga 80% kalori dan 45% hingga 55% protein
gandum. Lebih dari 59% populasi dunia (Irawan, 2005).

Fakultas Ilmu Komputer


Universitas Brawijaya 9402
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer 9403

Potensi pertanian padi di Kabupaten Kabupaten Malang. Penelitian ini akan


Malang sangat luar biasa. Salah satunya berada mencoba mencari hubungan variabel parameter
di Kota Kepanjen yang termasuk kawasan terbaik yang diukur dari kriteria MAPE yang
lumbung padi. Hal ini seperti dikemukakan dihasilkan. Dengan begitu, teknik SVR dapat
Kepala Badan Penelitian dan Pengembangan dievaluasi sehingga dapat digunakan untuk
Kementerian Pertanian Republik Indonesia, Dr. meramalkan hasil panen padi per tahun.
Ir. Syakir, saat Safari Panen Raya di Desa Sehingga hasil peramalan yang telah diterapkan
Curungrejo Kepanjen. Namun berdasarkan data nantinya diharapkan membantu analisis
dari BPS, Pertumbuhan penduduk di Kota keputusan yang akan diambil oleh pihak terkait.
Kepanjen merupakan salah satu yang terbesar di
Kabupaten di bawah Kota Dampit. Sehingga
sangat memungkinkan akan terjadi defisit
2. TINJAUAN PUSTAKA
produksi akibat kekurangan lahan yang
disebabkan oleh pertumbuhan penduduk. 2.1. Studi Terkait
Oleh karena itulah diperlukan acuan untuk Penelitian pertama oleh Vijayakumar
menentukan strategi dalam mengatisipasi (1999), membahas pembenaran teoritis Support
kemungkinan fluktuasi pada hal ini, salah satu Vector Machine untuk melakukan regresi yang
acuan yang bisa diperoleh adalah dengan bertujuan untuk menemukan solusi optimal
memprediksi hasil panen untuk tahun secara cepat namun terimplementasi sangat
mendatang. Prediksi dapat dilakukan dengan sederhana walaupun ukuran masalahnya besar.
metode regresi, dan Support Vector Regression Ide dasar dari algoritme SVR pada estimasi
(SVR) adalah salah satunya. regresi adalah untuk menghitung fungsi linear
Salah satu penerapan SVR yang berhasil dalam dimensi fitur yang lebih tinggi (yang
adalah implementasi dalam memprediksi angka memiliki titik produk) dan menghitung fungsi
perekrutan siswa perguruan tinggi tahunan oleh non-linear di ruang input data. Evaluasi
Ying (2012) di Sichuan, Cina. Dalam penelitian penelitian pada masalah klasifikasi benchmark
tersebut, metode ini lebih baik daripada pada data sonar, USPS dan database MNIST
backpropragation neural network (NN). membuktikan kecepatan dan ketahanan dari
Terdapat juga penelitian oleh Suranart (2014) prosedur pembelajaran.
yang memiliki pilihan metode diantaranya yaitu Penelitian kedua oleh Suranart (2014) yaitu
Support Vector Regression (SVR), Neural mempelajari dan menganalisis membandingan
Network (NN), serta Radial Basis Function hasil penerapan Neural Network (NN), Support
Network (RBF-NN). Metode-metode dalam Vector Regression (SVR) dan Radial Basis
penelitian tersebut telah diimplementasikan Function Neural Network (RBF-NN) para
untuk memprediksi harga emas berdasarkan peramalan harga emas. Dari dataset Juni 2008
data rentet waktu (time series) yang dipelajari hingga April 2013 dibuatlah dua bentuk rentang
mulai Juni 2008 hingga April 2013. Hasilnya, waktu peramalan yang berbeda yaitu penerapan
SVR memberikan akurasi terbaik bila data bulanan untuk peramalan 3 bulan
dibandingkan dengan RBF-NN dan NN dari berikutnya, dan data mingguan untuk peramlana
pengukuran beberapa metode uji kesalahan 3 minggu berikutnya. Evaluasi dilakukan
termasuk diantaranya Mean Absolute berdasarkan hasil peramalan yang diukur dari
Percentage Error (MAPE). nilai Mean Forecast Error (MFE), Mean
Berdasarkan beberapa penelitian yang Absolute Deviation (MAD) dan juga Mean
telah disebutkan di atas, peneliti berkeinginan Absolute Percentage Error (MAPE).
untuk menerapkan metode Support Vector Berdasarkan hasil yang didapat, disimpulkan
Regression pada kasus peramalan hasil panen bahwa SVR menghasilkan akurasi yang terbaik
padi atau peramalan hasil panen padi pada dibandingkan RBF dan NN.

Fakultas Ilmu Komputer, Universitas Brawijaya


Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer 9404

Penelitian ketiga yang dilakukan Syafrudin non-linier dapat dihasilkan lebih cepat dan
(2014) mengambil topik prediksi kebutuhan solusi yang lebih optimal bila dibandingkan
listrik hingga 2030, dengan studi kasus di dengan penggunaan metode lain yang lebih
Provinsi Lampung. Perkiraan baban tanggungan sederhana l (Vijayakumar & Wu, 1999).
listrik oleh sistem merupakan faktor yang
Algoritme ini terdiri dari beberapa tahap :
sangat berpengaruh dalam mengarahkan
rencana pengembangan fasilitas, Sehingga,
Syafrudin melakukan prediksi untuk
merencanakan kebutuhan beban listrik sistem 1. Inisialisasi parameter
melihat beberapa waktu sebelumnya. Jangka Dalam metode SVR menggunakan beberapa
waktu prediksi yang telah dilakukan ada tiga, parameter yaitu ε dan C yang berpengaruh
yakni jangka panjang (lebih dari 1 tahun), dalam menentukan toleransi kesalahan, cLR
jangka menengah (1 bulan sampai 1 tahun), dan sebagai penentu kecepatan proses pembelajaran
jangka pendek (kurang dari 1 minggu). Prediksi
, 𝜎 sebagai konstanta yang berpengaruh
dilakukan secara teratur dan dapat dievaluasi
pesebaran dimensi data , dan 𝜆 sebagai penentu
secara ilmiah, sehingga dapat memberikan
ukuran skala dimensi pemetaan kernel SVR
keyakinan untuk pengguna hasil prediksi
tersebut. Untuk menguji keabsahan model yang
menghasilkan prediksi, dilakukan perbandingan
2. Perhitungan matriks Hessian
nilai prediksi dengan nilai sebenarnya.
Matriks Hessian dihitung sesuai persamaan (2)
2.2. Dasar Teori
[R]ij = K(xi , xj) + λ2 ,
2.2.1. Support Vector Regression
untuk i dan j=1,2,…,n (2)
Support Vector Regression (SVR)
merupakan perkembangan model regresi dari Keterangan :
Support Vector Machines (SVM) yang mulanya
[R]ij = matriks Hessian
digunakan untuk mendeskripsikan masalah
klasifikasi. Dalam penelitian ini SVR akan K(xi , xj )= fungsi kernel
diplikasikan untuk tipe data Time Series, yang
dalam konteks data memiliki arti sebagai data λ2 = variabel skalar
yang berupa serangkaian peristiwa atau
Fungsi kernel berikut digunakan untuk
pengamatan yang diambil secara berurutan dari
memetakan dimensi data menjadi lebih tinggi,
waktu ke waktu, Seperti yang ditampilkan pada
sehingga diharapkan dapat menghasilkan
Gambar 2.1 data dalam penelitian ini berwujud
dimensi data yang lebih tinggi dan terstruktur
Time Series. Tujuan dari SVR adalah membuat
(Rajkumar dan Jaganathan, 2013).
data yang lebih acak untuk dapat menerima
Implementasi Kernel Gaussian (RBF) banyak
regresi yaitu dengan memetakannya pada
digunakan dalam penelitian sebelumnya, yang
dimensi yang lebih tinggi. Persamaan umum
dianggap mampu memberikan hasil yang baik
regresi dapat dilihat seperti persamaan (2.1):
dalam SVR (Li, et al., 2005), fungsinya
dirumuskan sebagai persamaan (3)

f(x) = ωφ(x) + b (1)


‖x−xi ‖2
K(x, xi ) = exp (− ) (3)
2σ2
di mana ω adalah bobot dan b adalah koefisien,
Keterangan
φ(x) adalah fungsi pemetaan fitur x pada
dimensi yang lebih tinggi. Solusi untuk regresi x dan xi = Data

Fakultas Ilmu Komputer, Universitas Brawijaya


Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer 9405

σ = Konstanta Dimensi δαi = perubahan pada nilai αi

γ = nilai laju pembelajaran


σ (sigma) sebagai konstanta dimensi perlu
didefinisikan di awal agar hasil dari data latih ε = nilai toleransi kesalahan
tidak terlihat sangat akurat ketika nilainya C = nilai kompleksitas
terlalu kecil, atau terlalu tidak fleksibel untuk
perhitungan kompleks ketika nilainya terlalu
besar(Ren & Bai, 2010). c. Perbaharuan nilaiLagrange Multiplier
Perbaharuan nilai Lagrange Multiplier akan
3. Perhitungan nilai kesalahan , perhitungan didapatkan dari perubahan nilai Lagrange
perubahan nilai Lagrange Multiplier, dan Multiplier dan nilai awal, seperti di gambarkan
perubahannya. Untuk langkah awal perlu pada persamaan 7 dan 8
diinisialisasikan nilai Lagrange Multiplier
αi dan α∗i sebesar 0.
α∗i ′ = δα∗i + α∗i (2.7)
Dan setelah itu urutan langkah berikutnya
sebagai berikut: αi ′ = δαi + αi (2.8)

a. Perhitungan nilai galat (error)


Tahap a, b, dan c di atas diulangi untuk setiap
data latih.
Ei = yi − ∑nj=1(α∗j − αj)R ij (4)

4. Proses iterasi
Keterangan :
Tahap Perhitungan nilai kesalahan di atas
Ei = nilai kesalahan pada posisi ke-i kemudian diulang (iterasi) sampai satu dari
syarat ini terpenuhi:
yi = nilai aktual data latih ke-i
a. Iterasi mencapai batas iterasi maksimal yang
α∗j − αj = nilai Lagrange Multiplier
telah ditentukan
terkini
b. Tidak terjadi perubahan nilai pada Lagrange
n = jumlah data latih Multiplier atau dengan kata lain terjadi
konvergensi.

b. Perhitungan perubahan nilai Lagrange c. Perubahan nilai telah terpenuhinya syarat


Multiplier nilai perubahan Lagrange Multiplier tidak lebih
dari konstanta epsilon ( max(|δαi |) <
ε dan max(|δα∗i |) < ε.
δα∗i = min{max(γ(Ei − ε), −α∗i ), C − α∗i }
(5)

δαi = min{max(γ(−Ei − ε), −αi ), C − αi } 5. Perhitungan hasil peramalan


(6) Angka hasil peramalan didapatkan setelah
Keterangan : dilakukan perhitungan dari persamaan regresi
yang dirumuskan seperti persamaan (9):
δα∗i = perubahan pada nilai α∗i

Fakultas Ilmu Komputer, Universitas Brawijaya


Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer 9406

f(x) = ∑ni=1(α∗i − αi )(K(xi , x) + λ2 ) dengan cara memberikan suatu data ke dalam


(9) model tersebut dan melihat kesesuaian hasil
prediksi model dengan nilai data sesungguhnya.
Keterangan : Semakin kecil perbedaan hasil peramalan atau
f(x) = nilai hasil peramalan prediksi tersebut dengan kebenarannya, dapat
disimpulkan semakin akurat model tersebut.
K(xi , x) = fungsi kernel
Salah satu nilai yang bisa menjadi dasar
λ2 = variabel skalar keakuratan model adalah nilai MAPE yang
merepresentasikan rasio kesalahan (error rate)
2.2.2. Normalisasi Data yang relatif lebih stabil dalam mengukur
Proses ini merupakan proses untuk perbedaan nilai hasil prediksi dengan nilai data
menyamakan standar semua data yang sebenarnya. Persentase nilai tersebut menurut
digunakan biasa disebut Normalisasi (S. Gopal, (Furi, et al., 2015) dihitung dengan persamaan
dkk., 2015). Salah satu cara untuk normalisasi (12):
yaitu Min-Max Normalization, yang dapat n
dijabarkan dengan persamaan (10) 1 yi − yi′
MAPE = (∑ | |) × 100%(2.12)
n yi
i=1
(x − xmin)
x′ = (xmax − xmin )
(10) Keterangan :
Keterangan : yi = nilai data aktual
x′ = nilai data normalisasi yi′ = hasil data prediksi
x = nilai data aktual n = jumlah data
xmin = nilai data terkecil
xmax = nilai data terbesar
3. METODOLOGI
Adapun siklus proses dalam
Persamaan di atas akan menghasilkan nilai memperhitungkan peramalan menggunakan
baru x ′ yang memiliki rentang antara 0 sampai metode SVR yang perlu dilakukan untuk
1, atau dengan kata lain nilai terendah kini menyelesaikan masalah prediksi yang telah
menjadi 0 dan nilai tertinggi menjadi 1. Proses dijabarkan sebelumnya. Urutan tersebut
Denormalisasi akan dibutuhkan untuk dilakukan menjadi suatu siklus yang diulang

mengembalikan nilai x seperti semula, proses untuk mendapatkan hasil model terbaik.
tersebut dapat diselesaikan dengan persamaan Beberapa parameter yang mempengaruhinya
(11): yaitu kompleksitas (C), epsilon (ε), sigma (σ)
untuk konstanta Kernel Gaussian RBF,
constanta learning rate (cLR), dan lambda (λ).
x = xmin + (x ′ (xmax − xmin )) (11) Diagram alir penyelesaian masalah peramalan
hasil panen padi menggunakan algoritme SVR
Perhitungan Nilai Evaluasi secara garis besar digambarkan pada Gambar 2

Dalam melakukan pengukuran pada .


kemampuan model untuk melakukan peramalan
atau prediksi data, dibutuhkan proses evaluasi

Fakultas Ilmu Komputer, Universitas Brawijaya


Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer 9407

3.2. Pemilihan Fitur


Start
Pada studi kasus ini 4 data sekuensial
sebelum data target akan digunakan sebagai
Data Latih (.csv file), sebagai fitur, sebagaimana ditampilkan pada
Data Uj (.csv file),
Nilai Parameter C, ε, σ,
Tabel 2
cLR, λ (double)

normalisasi()
Tabel 2 Penentuan Fitur

hessian()
Tahun 1 2 3 4 
2004 349121 363541 328697 350607 354172

seqTraining() 2005 363541 328697 350607 354172 351847

2006 328697 350607 354172 351847 366271

fx() 2007 350607 354172 351847 366271 368509

2008 354172 351847 366271 368509 409258


mape()

Keterangan :
Nilai MAPE
(double) Y = Data Aktual tahun tersebut

X1 = Data aktual 4 tahun sebelum (Y-4)


End X2 = Data aktual 3 tahun sebelum (Y-3)

X3 = Data aktual 2 tahun sebelum (Y-2)


Gambar 2 Diagram Alir Siklus Proses SVR
X4 = Data aktual 1 tahun sebelum (Y-1)

3.1. Inisialisasi Parameter


Dari data Tabel di atas dapat dilihat bahwa
Langkah pertama sesuai diagram alir di fitur yang digunakan berasal dari data tahun
atas yakni inisialisasi parameter. Penentuan sebelumnya, misalnya untuk data tahun
nilai parameter dilakukan secara manual. Nilai 2004(Y) maka fitur yang digunakan adalah data
yang digunakan untuk perhitungan manual tahun 2000(X1), 2001(X2), 2002(X3) dan
ditunjukkan pada Tabel 1, 2003(X4). Nantinya data dari tahun 2004
hingga tahun 2013 akan digunakan sebagai data
latih, dan data mulai dari tahun 2014 sampai
Tabel 1 Inisiasi Parameter 2017 digunakan sebagai data uji.

C Epsilon Sigma( cLR Lambda


(ε) σ) (λ)
3.3. Normalisasi Data
10 0,0001 0,7 0,08 0,8 Normalisasi/Standarisasi dengan metode
Min-Max Normalisation harus diterapkan untuk
semua data pelatihan dan data uji. Nilai yang
ditemukan dari kinerja keseluruhan adalah
Fakultas Ilmu Komputer, Universitas Brawijaya
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer 9408

maksimum 505138 dan minimum 328697. x  xi  (0.11792  0.19919) 2  (0.19919  0.00282) 2 


Untuk menemukan nilai normal, setiap nilai (0.00282  0.12630) 2  (0.12630  0.14639) 2  0.06082
data akan dihitung sebagai persamaan (2.11).
Untuk mengantisipasi nilai min atau maks yang
kemudian dapat melebihi batas, dalam Setelah didapat nilai jarak tersebut,
penelitian ini dua nilai ditambahkan ke nilai kemudian dihitung nilai kernel-nya,
500 sehingga asumsi data maksimum adalah
0.06082
505638 dan minimum 328697. Misalnya, hasil K ( x  xi )  exp(  )  0.98521
dari Normalisasi data panen untuk data 2(0.7) 2
pelatihan dalam fungsi x1 (349121) diperoleh
dengan sebagai berikut: Selengkapnya matriks kernel untuk data
latih ditunjukkan pada Tabel 4

(349121- 328197)
x= = 0.11792 Tabel 3 Hasil Matriks Kernel Data Latih
(505638- 328197)
Tahun k1 k2 k3 k4 k5

0.9853
Pada Tabel 3 berikut ditampilkan hasil latih 2004 1.00000 0.98521 0.99044 0.99324
7
yang telah di normalisasi
0.9916
Tabel 3 Data Latih Setelah Normalisasi 2005 0.98521 1.00000 0.98676 0.99253
7
Tahun 1 2 3 4  0.9916
2006 0.99044 0.98676 1.00000 0.99452
7
0.1179 0.0028 0.1263 0.1463
2004 0.19919
2 2 0 9 0.9982
2007 0.99324 0.99253 0.99452 1.00000
0
0.1991 0.1263 0.1463 0.1332
2005 0.00282
9 0 9 8 1.0000
2008 0.98537 0.99167 0.99167 0.99820
0
0.0028 0.1463 0.1332 0.2145
2006 0.12630
2 9 8 7

0.1263 0.1332 0.2145 0.2271 Setelah didapatkan nilai kernel-nya maka


2007 0.14639
0 8 7 9 dapat dihitung nilai Hessian-nya sesuai
0.1463 0.2145 0.2271 0.4568 persamaan (2),
2008 0.13328
9 7 9 3
[ R]ij
= 0,98521 + 0,82 = 1,62521
3.4. Perhitungan Matriks Hessian Selengkapnya Matriks Hessian pada data
Sebelum melakukan perhitungan matriks latih ditunjukkan pada Tabel 5
Hessian, perlu didahulukan untuk perhitungan Setelah didapat matriks Hessian maka
matriks kernel. Sesuai persamaan (2.3), nilai diperoleh nilai parameter gamma (γ) sesuai
kernel mula-mula ditemukan dengan dengan persamaan (4) dari data latih sebagai
menghitung jarak antar data yang ada.. Sebagai berikut
contoh, dari nilai kernel data latih pertama bisa
dihitung jarak antara fitur data latih sebelumnya 0,08
dengan sesudahnya yang telah
latih   0,04878
1,61
dinormalisasikan,
Tabel 5 Hasil Matriks Hessian Data Latih

Fakultas Ilmu Komputer, Universitas Brawijaya


Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer 9409

Tahun h1 h2 h3 h4 h5
3.5. Proses Sequential Learning 1.6400
2004 1.62521 1.63044 1.63324 1.62537
0
Mula-mula nilai Lagrange Multiplier 𝛼𝑖∗
dan 𝛼𝑖 setiap data latih diinisialisasi sebesar 1.6252
0 karena proses utama SVR bertujuan untuk 2005 1.64000 1.62676 1.63253 1.63167
1
mencari nilai Lagrange Multiplier, pencarian
dilakukan dengan mengulangi proses ini. 1.6304
2006 1.62676 1.64000 1.63452 1.63167
Syarat untuk menghentikannya adalah 4
apabila perulangan atau iterasi sudah
1.6332
maksimal sesuai batas yang ditentukan 2007 1.63253 1.63452 1.64000 1.63820
4
sebelumnya, atau tidak terjadi perubahan
lagi, atau telah memenuhi syarat 1.6253
max(|𝛿𝛼𝑖 |) < 𝜀 dan max(|𝛿𝛼𝑖∗ |) < 𝜀 , atau 2008 1.63167 1.63167 1.63820 1.64000
7
tidak terjadi perubahan nilai pada Lagrange
Multiplier (sudah konvergen). 6. Uji coba nilai parameter 𝜆 (lambda)

Sebagai contoh untuk indeks pertama


dan iterasi pertama, nilai Error Rate
Tujuan pengujian adalah untuk mengetahui
diperoleh dengan cara,
.jumlah iteraisi dan nilai konstanta parameter
n yang menhasilkan angka kesalahan terkecil.
E1  y1   (a*j  a j ) R1 j
j 1 5. HASIL PENGUJIAN DAN
PEMBAHASAN
 0.14639
5.1. Hasil Uji Iterasi
Sedangkan nilai 𝛿𝛼𝑖∗ sesuai persamaan
(6) dan 𝛿𝛼𝑖 (7) diperoleh dengan cara, Hasil error rate yang didapat dari
berbagai angka iterasi serta dengan
i*  min{max(  ( Ei   ), C   i* )} menggunakan parameter awal ditampilkan
pada Gambar 3
(6)

 i  min{max(  ( Ei   ), C   i )} 17
16
Error Rate

15
14
(7) 13
12
11
10

4. PENGUJIAN
Jumlah Iterasi
Pengujian sistem meliputi beberapa analisis
yaitu :
1. Uji coba jumlah iterasi sequential training Gambar 3 Hasil Error Uji Jumlah Iterasi
SVR
Jumlah iterasi pelatihan berpengaruh pada
2. Uji coba nilai k parameter 𝐶 (Complexity) presisi yang dihasilkan, semakin banyak
3. Uji coba nilai parameter 𝜀 (epsilon) iterasi maka bertambah pula kemampuan
SVR dalam mengobservasi pola data.
4. Uji coba nilai parameter 𝜎 (sigma) Kernel Umumnya Iterasi yang bertambah juga
Gaussian RBF
akan mengoptimalkan proses trade-off
5. Uji coba nilai parameter cLR dalam membentuk garis regresi sehingga
Fakultas Ilmu Komputer, Universitas Brawijaya
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer 9410

lagrange multiplier semakin konvergen berlanjut hingga nilai parameter 1000


pada optimum global dan nilai error rate
membaik. Namun Pada kasus ini seperti
yang ditunjukkan oleh Gambar 3 2. Hasil Uji Parameter 𝜀
peningkatan Iterasi tidak sebanding dengn
perbaikan pada nilai error rate.
28

Error Rate
5.2. Hasil Uji Variasi Parameter 23

Setiap hasil pengujian variasi paramter ini 18


akan digunakan sebagai nilai paramter baru 13
yang akan digunakan dimaksudkan untuk 8
mengeliminasi parameter yang kurang baik
dalam pengujian berikutnya, proses eliminasi
Nilai Epsilon
ini meiliki urutan yaitu C , 𝜀 , 𝜎 , cLR , 𝜆
Gambar 5 Hasil Error Uji Variasi Epsilon

Berdasarkan Gambar 5, parameter 𝜀


(epsilon) menentukan seberapa besar toleransi
kesalahan pada nilai fungsi 𝑓(𝑥). Sifatnya yang
menyelubungi 𝑓(𝑥) membentuk suatu zona
1. Hasil Uji Parameter C yang disebut error-zone. Di mana jika 𝑓(𝑥)
melebihi dari batas toleransi error-zone maka
34
akan dikenakan penalti sebesar C (Furi, et al.,
30
2015). Hasil pengujian yang dilakukan
Error Rate

26
22 mendapatkan nilai kesalahan terkecil sebesar
18 11.44946 pada parameter 1.E-2(0.01).
14
10

Nilai Complexity

Gambar 4 Hasil Error Uji Variasi C


3. Hasil Uji Parameter 𝜎
18
Berdasarkan Gambar 4, parameter 𝐶
Error Rate

16
merepresentasikan batas penalti kesalahan yang
14
boleh terjadi, atau seberapa toleran, dimana
semakin besar nilai parameter 𝐶 toleransi yang 12
diberikan semakin sedikit sehingga hasil yang 10
didapatkan semakin akurat(Furi, et al., 2015).
Pada uji Coba yang telah dilakukan terlihat Nilai Sigma
bahwa nilai yang besar membuat nilai error
Gambar 6 Hasil Error Uji Variasi Sigma
semakin stabil. Berdasarkan hasil diatas maka
dapat disimpulkan nilai C terbaik dengan hasil
error rate paling kecil dimulai dari 1 dan masih
Berdasarkan Gambar 6, parameter 𝜎
Fakultas Ilmu Komputer, Universitas Brawijaya
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer 9411

(sigma) merupakan konstanta yang


30
mempengaruhi persebaran dimensi data (Furi, 25

Error Rate
et al., 2015). Secara umum hasil dari kurva 20
peramalan dapat menjadi sangat halus dengan 15
nilai 𝜎 yang cenderung sangat kecil, sebaliknya 10
5
dengan nilai 𝜎 yang besar maka hasil kurva
peramalan menjadi sangat kasar (Kurniasih,
2013). Dari Hasil yang ditunjukkan terlihat
Nilai Lambda
bahwa error terkecil ada pada nilai parameter
sigma = 1, yakni sebesar 10,24658. Gambar 8 Hasil Error Uji Variasi Lambda

4. Hasil Uji Parameter cLR Secara umum semakin kecil nilai 𝜆 maka
Parameter 𝑐𝐿𝑅 merupakan nilai konstanta hasil peramalan akan semakin baik, dan
yang menentukan kecepatan proses belajar, di semakin besar nilai 𝜆 maka waktu komputasi
mana secara umum kecepatan tinggi rawan dan proses konvergensi melambat
memberikan hasil buruk sedangkan kecepatan dikarenakan besarnya dimensi (Vijayakumar
rendah memberikan hasil yang lebih baik. & Wu, 1999). Nilai Error rate palingkecil
(Vijayakumar & Wu, 1999). Berdasarkan hasil didapat pada Lambda = 1 yakni sebesar
ujicoba yang di tampillkan pada Gambar 7 10,13378
didapatkan nilai Error Rate paling baik adalah
6. KESIMPULAN DAN SARAN
pada nilai cLR 0,1 dengan error rate 10,20014
6.1. Kesimpulan
Hasil paling optimal dalam pengujian
30 perubahan parameter dan jumlah iterasi
25 sehingga menghasilkan nilai kesalahan paling
Error Rate

20 kecil yaitu 10,13378 , adalah dengan


15 menggunakan parameter sebagai berikut:
10

Jumlah Iterasi :50


Nilai cLR
Complexity :1
Gambar 7 Hasil Error Uji Variasi cLR
Epsilon :1E-2
Sigma :1
5. Hasil Uji Parameter 𝜆 cLR :0,1
Gambar 8 menunjukkan bahwa parameter λ Lambda :1
(lambda) berpengaruh pada ukuran penskalaan
ruang pemetaan kernel SVR.

6.2. Saran
Saran untuk dipertimbangkan pada
penelitian selanjutnya mengenai metode dan
obyek terkait diantaranya sebagai berikut
1. Jumlah Data untuk pelatihan dan pengujian
Fakultas Ilmu Komputer, Universitas Brawijaya
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer 9412

yang digunakan dapat ditambah atau mungkin and Applications (Third Edition),John
data tahunan yang ada bisa di olah menjadi data Wiley & Sons, Canada, 1998.
dengan kurun waktu setiap 4 bulan Sembiring, R.K. 2003. Analsisis Regresi.
menyesuaikan dengan standar 3 kali masa Bandung : Penerbit ITB
tanam/tahun
Bowerman, B.L, dan O’Connell, R.T.
2. Ditambahkan metode tertentu menentukan Forecasting and Time Series : An
nilai parameter agar hasil yang diberikan lebih Aplied Aproach, Edisi Ketiga, Duxbury
akurat dan mengurangi angka kesalahan. Hal ini Press, California, 1993
dikarenakan nilai-nilai parameter SVR yang Sofyan Assauri. 1984. “Teknik dan Metode
digunakan mudah sekali terjebak pada nilai Peramalan”. Jakarta : Penerbit Fakultas
local optimum, sehingga apabila digunakan Ekonomi Universitas Indonesia
metode optimasi model peramalan Kurniasih, D., 2013. Efisiensi Relatif Estimator
menggunakan algoritma SVR maka diharapkan Fungsi Kernel Gaussian terhadap
dapat mengatasi kekurangan SVR dalam Estimator Polinomial dalam Peramalan
pemilihan nilai parameter. Usd terhadap Jpy, Semarang: s.n.
3. Diujicobakan pada model peramalan semi- Patro, S. G. K. & Sahu, K. K., 2015.
supervised, dimana hanya terdapat 1 dataset Normalization: A Preprocessing Stage.
yang diatur sedemikian hingga membentuk pola 19 Maret.
data fitur dan data aktual. Dari pengaturan Suranart, K., Kiattisin, S. & Leelasantitham, A.,
tersebut nantinya terdapat pola dengan bagian 2014. Analysis of Comparisons for
kosong yang akan diramalkan nilainya Forecasting Gold Price using Neural
berdasarkan pola penuh sebelumnya Network, Radial Basis Function
Network and Support Vector
Regression. Mahidol, IEEE.
7. DAFTAR PUSTAKA Dinas Tanaman Pangan dan HoltiKultura
Kabupaten Malang, 2018 Produksi
Vijayakumar, S. & Wu, S., 1999. Sequential
Padi, Jagung, Dan Kedelai
Support Vector Classiers and
Regression. Genoa, Italy, Saitama: Dodo, J. 2008. Ramalan Penjualan Sepeda
RIKEN Brain Science Institute, The Motor Honda Pada CV. Roda Mitra
Institute for Physical and Chemical Lestari. Jurnal Universitas Gunadarma
Research, pp. 610-619.
Syafruddin, M., 2014. Prediksi Kebutuhan
Energi Listrik Jangka Panjang untuk
Provinsi Lampung hingga Tahun 2030,
Bandar Lampung: Universitas
Lampung.
Bhuana, Hans Ricardo Tirta 2012. Model
Prediksi Produksi Panen Komoditas
Padi Menggunakan Metode Regresi
Linier Berganda.
Butler, William F., Robert A. Kavesh, Robert
B. Platt, Methods and Techniques of
Business Forecasting, Prentice Hall,
New Jersey, First Edition, 1996.
Makridakis, Spyros, Steven C. Wheelwright,
Rob J.Hyndman, Forecasting: Methods

Fakultas Ilmu Komputer, Universitas Brawijaya

Anda mungkin juga menyukai