417 1 2202 2 10 20170714 PDF
417 1 2202 2 10 20170714 PDF
Abstrak
Perubahan iklim yang terjadi dikarenakan oleh pemanasan global menyebabkan perubahan pola
curah hujan. Mengetahui pola curah hujan sangat penting bagi beberapa aktivitas dan pekerjaan yang
ada. Maka dari itu diperlukan peramalan curah hujan untuk mengetahui pola curah hujan yang akan
mendatang. Salah satu metode peramalan yang sering digunakan adalah Support Vector Regression.
Namun, metode tersebut masih memiliki kekurangan yaitu pada penentuan nilai parameter yang tepat.
Maka diperlukan algoritma optimasi untuk membantu menentukan nilai parameter SVR yang tepat.
Penelitian ini bertujuan untuk melakukan peramalan curah hujan pada daerah Pujon, Malang dengan
menggunakan metode Support Vector Regression yang dioptimasi dengan Improved-Particle Swarm
Optimization. Optimasi metode SVR dilakukan untuk mendapatkan nilai parameter SVR yang paling
optimal. Parameter SVR yang dioptimasi adalah 𝑐𝐿𝑅 (konstanta learning rate), 𝐶 (kompleksitas), 𝜆
(koefisien Hessian), 𝜀 (error rate) dan 𝜎 (koefisien kernel). Peramalan curah hujan bulan Januari
dasarian pertama pada tahun 2007 sampai 2015 yang dilakukan dengan menggunakan IPSO-SVR
menghasilkan nilai RMSE sebesar 0.213389 dibandingkan dengan menggunakan metode SVR yang
menghasilkan RMSE sebesar 25.839085. Hal tersebut menunjukkan bahwa metode SVR yang
dioptimasi dengan menggunakan IPSO lebih baik dibandingkan dengan metode SVR yang belum
dioptimasi.
Kata kunci: Peramalan, curah hujan, Support Vector Regression, Improved-Particle Swarm Optimization.
Abstract
Climate change that happens because of global warming also cause change in rainfall patterns.
Knowing rainfall patterns is really important for some activity and works. So, rainfall forecasting is
needed to understand the rainfall patterns in the future. One of the method used in forecasting is Support
Vector Regression. But, SVR still has weakness in determining the right values for the parameters. So,
an optimization algortithm is needed to help determining the values of the parameters in SVR. The
purpose of this research is to do rainfall forecasting in Pujon area, Malang using Support Vector
Regression that’s been optimized by Improved-Particle Swarm Optimization. Optimization of SVR is
done for getting the optimal values of SVR’s parameters. The optimized SVR’s parameters are 𝑐𝐿𝑅
(learning rate constants), 𝐶 (complexity), 𝜆 (Hessian’s coefficient), 𝜀 (error rate) dan 𝜎 (kernel’s
coefficient). The rainfall forecasting for the first ten days of January from 2007 until 2015 by using
IPSO-SVR resulted value of 0.213389 in RMSE compared to using only SVR which resulted value of
25.839085 in RMSE. This proved that optimization of SVR using IPSO is better compared to using the
unoptimized SVR.
Keywords: Forecasting, rainfall, Support Vector Regression, Improved-Particle Swarm Optimization.
Perencanaan pertanian menjadi kurang optimal peramalan dilakukan dengan SVR yang
dikarenakan kondisi fluktuasi curah hujan yang dioptimasi dengan metode Particle Swarm
tidak menentu dalam beberapa tahun terakhir Optimization (PSO) yang menghasilkan nilai
(Mukid, 2013). Fenomena El-Nino dan La-Nina Root Mean Square Error (RMSE) sebesar 0,902.
juga menjadi salah satu penyebab perubahan Nilai tersebut lebih kecil dibandingkan dengan
iklim di Indonesia. Menurut Boer (2003), nilai RMSE metode SVR sebesar 1,142 dan
Indonesia telah mengalami kekeringan atau metode ANN sebesar 1,307. Penelitian lain
curah hujan di bawah rata-rata sebanyak 43 kali mengenai optimasi Support Vector Regression
sejak tahun 1844. Sebuah inovasi teknologi (SVR) menggunakan Particle Swarm
tentang peramalan curah hujan sangat Optimization (PSO) yaitu dari Hsieh (2011).
dibutuhkan mengingat kondisi curah hujan Penelitian ini menggunakan metode SVR-PSO
Indonesia yang sangat fluktuatif untuk untuk peramalan harga saham dengan hasil
menunjang aktivitas dan pembangunan di keluaran nilai RMSE sebesar 49,10. Sedangkan
berbagai bidang (Mulyana, 2014). jika menggunakan metode SVR, nilai RMSE
Peramalan (forecasting) dapat dilakukan yang dihasilkan sebesar 49,27. Selain nilai
dengan dua pendekatan. Pendekatan yang RMSE yang lebih kecil, waktu komputasi yang
pertama adalah pendekatan statistik dan dibutuhkan untuk metode SVR-PSO pada
pendekatan yang kedua adalah pendekatan penelitian ini yaitu 164 detik lebih cepat
kecerdasan buatan (AI). Peramalan dengan dibandingkan dengan metode SVR yang
pendekatan statistik terdiri dari metode membutuhkan waktu komputasi 1252 detik. Hal
pertimbangan, metode regresi, metode yang menyebabkan waktu komputasi yang lebih
kecenderungan, metode input output, dan cepat adalah ketepatan koefisien yang digunakan
metode ekonometrika (Supranto, 2000). Metode sehingga jumlah iterasi yang dilakukan tidak
regresi adalah salah satu metode peramalan yang terlalu banyak.
sering digunakan karena dapat diaplikasikan Berdasarkan peramalan curah hujan dan
untuk peramalan dengan data yang memiliki penjelasan singkat mengenai Support Vector
variabel yang banyak. Proses komputasi pada Regression (SVR) dan metode Particle Swarm
metode regresi dapat menjadi lama karena Optimization (PSO) yang sudah diuraikan, maka
metode regresi adalah metode yang memiliki dirancang penelitian yang menggabungkan
ketergantungan antara variasi dan relasi dari tiap kedua metode yaitu “Optimasi Support Vector
variabel (Abraham & Ledolter, 2005). Regression (SVR) menggunakan Improved-
Peramalan dengan pendekatan yang kedua Particle Swarm Optimization (IPSO) untuk
adalah pendekatan kecerdasan buatan (AI). Peramalan Curah Hujan”. Implementasi yang
Salah satu teknik peramalan AI adalah dengan dilakukan adalah menggabungkan metode
menggunakan Support Vector Regression Support Vector Regression (SVR) untuk
(SVR). Support Vector Regression (SVR) adalah melakukan peramalan curah hujan, sedangkan
hasil pengembangan Support Vector Machine metode Improved-Particle Swarm Optimization
(SVM) dengan metode regresi sehingga dapat (IPSO) digunakan untuk melakukan optimasi
digunakan untuk peramalan layaknya metode terhadap parameter yang ada pada SVR sehingga
regresi pada pendekatan statistik. Namun, diharapkan hasil peramalan dengan akurasi yang
Support Vector Regression (SVR) memiliki tinggi. Penelitian ini diharapkan dapat
parameter yang tidak ditentukan sehingga susah membantu masyarakat pada umumnya untuk
untuk menentukan parameter yang optimal. membantu mengatasi permasalahan peramalan
Makridakis dan Hibon (2000) menyatakan curah hujan di Indonesia yang fluktuatif.
bahwa menggabungkan beberapa model menjadi
satu dapat meningkatkan hasil akurasi 2. DASAR TEORI
peramalan. Maka, perlu dilakukan
penggabungan metode SVR dengan metode lain 2.1 Penjelasan Dataset
untuk menentukan parameter yang optimal Data yang digunakan pada penelitian ini
(Kavousi-Fard et al., 2014). adalah data curah hujan daerah Pujon Malang
Terdapat beberapa metode optimasi yang yang didapat dari Badan Meteorologi
dapat menyelesaikan permasalahan optimasi. Klimatologi & Geofisika Stasiun Klimatologi
Salah satunya adalah penelitian yang dilakukan Karangploso Malang. Data yang digunakan
oleh Chen et al. (2012) dalam meramalkan suhu dibagi menjadi dua bagian yaitu data training
pada transformer listrik. Pada penelitian ini,
Fakultas Ilmu Komputer, Universitas Brawijaya
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer 1144
dan data testing. Data tersebut tersusun dari 𝑅𝑖𝑗 = Matriks Hessian baris
curah hujan perdasarian dari tahun 2000 sampai ke-
2015 dengan satuan milimeter kubik. i kolom ke-j
𝐾(𝑥, 𝑥𝑖 ) = fungsi kernel
2.2 Peramalan 𝜆 = variabel skalar
Peramalan (forecasting) adalah suatu 𝑙 = jumlah data
proses memprediksikan keadaan pada masa yang Langkah 3:
akan datang dengan menggunakan informasi Melakukan proses sequential learning
yang ada di masa lalu. Peramalan diperlukan yang terdiri dari:
untuk memperkirakan kuantitas, kualitas, waktu 1. Menghitung nilai error (𝐸) yang
dan lokasi yang dibutuhkan pada masa yang ditunjukkan pada Persamaan 3.
akan datang. Dalam melakukan peramalan, hasil 𝐸𝑖 = 𝑦𝑖 − ∑𝑙𝑗=1(𝛼𝑗∗ − 𝛼𝑗 ) 𝑅𝑖𝑗 (3)
yang didapatkan tidak selalu tepat sesuai dengan dimana
kenyataan. Salah satu cara untuk menentukan 𝐸𝑖 = nilai error ke-i
ukuran kesalahan secara statistik yaitu dengan 𝑦𝑖 = nilai aktual
Root Mean Squared Error (RMSE) yang 𝛼𝑗∗ , 𝛼𝑗 = Lagrange Multipliers
ditunjukkan pada Persamaan 1. 𝑅𝑖𝑗 = Matriks Hessian baris
∑𝑛 2
𝑡=1 𝑒𝑡 ke
𝑅𝑀𝑆𝐸 = √𝑀𝑆𝐸 = √ (1)
𝑛 i kolom ke-j
2. Menghitung 𝛿𝛼𝑖∗ dan 𝛿𝛼𝑖 dengan
2.3 Support Vector Regression (SVR) menggunakan Persamaan 4.
Untuk mengatasi permasalahan klasifikasi, 𝛿𝛼𝑖∗ = min {max [𝛾(𝐸𝑖 − 𝜀), −𝛼𝑖∗ ], 𝐶 −
Vladimir Naumovich Vapnik mengenalkan 𝛼𝑖∗ }
metode Support Vector Machine (SVM) pada 𝛿𝛼𝑖 = min {max [𝛾(−𝐸𝑖 − 𝜀), −𝛼𝑖 ], 𝐶 −
tahun 1995 (Cortes & Vapnik, 1995). Kemudian, 𝛼𝑖 }
untuk mengatasi kasus regresi dikembangkan (4)
metode Support Vector Regression (SVR) yang dimana
menghasilkan output data berupa bilangan riil 𝛾 = nilai Learning Rate
atau kontinyu (Ju & Hong, 2013). Metode SVM 𝐸𝑖 = nilai error ke-i
memetakan masukan vektor dengan cara non 𝜀 = nilai kerugian
linier ke dalam ruang fitur berdimensi tinggi 𝐶 = nilai kompleksitas
∗
yang kemudian diterapkan pada SVR (Cortes & 𝛼𝑖 , 𝛼𝑖 = Lagrange Multipliers
Vapnik, 1995). 3. Menghitung nilai Lagrange Multipliers
Untuk menangani kasus regresi, dengan menggunakan Persamaan 5.
Vijayakumar dan Wu (1999) mengenalkan 𝛼𝑖∗ = 𝛼𝑖∗ + 𝛿𝛼𝑖∗
algoritma sekuensial untuk SVR sehingga dapat 𝛼𝑖 = 𝛼𝑖 + 𝛿𝛼𝑖 (5)
memberikan solusi yang optimal dan waktu dimana
komputasi yang lebih cepat dibandingkan 𝛼𝑖∗ , 𝛼𝑖 = Lagrange Multipliers
dengan SVR konvensional. Langkah-langkah Langkah 4:
tersebut adalah sebagai berikut: Mengulang proses sequential learning pada
Langkah 1: langkah ketiga hingga mencapai jumlah iterasi
Inisialisasi parameter SVR yang akan maksimum atau memiliki kondisi berhenti yaitu
digunakan diantaranya 𝑐𝐿𝑅, 𝐶, 𝜀, 𝜆 dan jumlah max (|𝛿𝛼𝑖∗ |) < 𝜀 dan max (|𝛿𝛼𝑖 |) < 𝜀.
iterasi maksimum. Selain itu, inisialisasi 𝛼𝑖 dan Langkah 5:
𝛼𝑖∗ (untuk inisialisasi awal, diberikan nilai 0). Jika data memenuhi persyaratan (𝛼𝑖∗ − 𝛼𝑖 )
Langkah 2: tidak sama dengan 0, maka dapat disebut sebagai
Membentuk Matriks Hessian dengan support vector.
menggunakan Persamaan 2. Langkah 6:
Melakukan pengujian dengan
𝑅𝑖𝑗 = 𝐾(𝑥, 𝑥𝑖 ) + 𝜆2 untuk 𝑖, 𝑗 = 1,2, … , 𝑙 menggunakan Persamaan 5.
(2) 𝑓(𝑥) = ∑𝑙𝑖=1(𝛼𝑖∗ − 𝛼𝑖 )(𝐾(𝑥, 𝑥𝑖 ) + 𝜆2 ) (5)
dimana
dimana 𝛼𝑖∗ , 𝛼𝑖 = Lagrange Multipliers
Normalisasi Data
4. PENGUJIAN DAN ANALISIS
Rata-rata Fitness
didapatkan jumlah iterasi IPSO paling optimal
adalah sejumlah 50 iterasi. 0,15
Dengan menggunakan data dan batas
parameter yang sama, dilakukan pengujian 0,1
jumlah iterasi SVR yang bertujuan untuk
mengetahui jumlah iterasi terbaik dari SVR. 0,05
Hasil pengujian ditunjukkan pada Gambar 3.
0
10 15 20 25 30 40 50 75 100 200
Pengujian Jumlah Iterasi SVR
Jumlah Partikel
0,2
0,18 Gambar 4. Grafik pengujian jumlah partikel IPSO
0,16
Rata-rata Fitness
0,4
percobaan yang dilakukan, parameter 𝐶 sebagai
partikel IPSO akan bergerak sesuai dengan batas
0,3 parameter yang digunakan dan batas parameter
0,2 yang paling optimal adalah 10 - 500.
Pengujian parameter selanjutnya adalah
0,1
parameter 𝜀. Dengan menggunakan parameter
0 dan data yang sama, dilakukan pengujian untuk
mendapatkan batas parameter 𝜀 yang paling
optimal. Hasil pengujian ditunjukkan pada
Gambar 7.
Batas Parameter
0,7
0,6
0,5
0,4 4.4 Pengujian dan Analisis Jumlah Fitur
0,3 SVR
0,2
0,1 Pengujian jumlah fitur SVR ini bertujuan
0 untuk mendapatkan jumlah fitur SVR yang
paling optimal. Data yang digunakan adalah
curah hujan bulan Januari dasarian pertama
tahun 2004 sampai 2015 yang terbagi menjadi
Batas Parameter data latih dan data uji. Hasil pengujian
ditunjukkan pada Gambar 10.
Gambar 8. Grafik pengujian batas parameter 𝜆