Data Manining
Data Manining
1. PENDAHULUAN
Valuta asing (valas) atau foreign exchange (forex) diartikan sebagai mata uang asing dan alat
pembayaran lainnya yang digunakan untuk melakukan atau membiayai transaksi ekonomi keuangan
internasional dan yang mempunyai catatan kurs resmi pada bank sentral (Hadi,1997). Dalam
perkembangannya, perdagangan valas juga digunakan sebagai instrumen investasi untuk mendapatkan
keuntungan. Darmawi (2006) menyatakan bahwa pergerakan harga/nilai valuta asing selalu berubahubah dari waktu ke waktu karena hukum permintaan dan penawaran. Terdapat dua jenis trend menurut
arah pergerakannya yaitu bullish dan bearish. Penelitian ini bertujuan untuk memprediksi arah
pergerakan harga valuta asing menggunakan Support Vector Machines dengan metode kernel trick.
Santosa (2000) menyatakan bahwa Support Vector Machines (SVM) adalah suatu teknik untuk
melakukan prediksi, baik dalam kasus klasifikasi maupun regresi di mana SVM berada dalam satu
kelas dengan Neural Network, keduanya masuk dalam kelas supervised learning. Konsep SVM dapat
dijelaskan secara sederhana sebagai usaha untuk mencari garis pemisah (hyperplane) terbaik dari
berbagi alternatif hyperplane yang mungkin (Christianini,2000). Prinsip dasar SVM adalah linier
classifier dan selanjutnya dikembangkan agar dapat bekerja pada problem nonlinier dengan metode
kernel trick yaitu mencari hyperplane dengan cara mentransformasi dataset ke ruang vektor yang
berdimensi lebih tinggi (feature space) menggunakan fungsi kernel, kemudian proses
pengklasifikasian dilakukan pada feature space tersebut. Penentuan fungsi kernel yang digunakan
akan sangat berpengaruh terhadap hasil prediksi. Menurut Borovikov (1999) pengklasifikasian oleh
SVM dengan fungsi kernel Radial Basis Function memberikan akurasi yang paling baik dibandingkan
dengan fungsi kernel linier maupun polinomial, oleh karena itu penelitian ini menggunakan fungsi
kernel Radial Basis Function sehingga model hyperplane adalah seperti persamaan berikut :
f ( x d ) = i y i exp ( x i x d
N SV
i =1
)+ b
di mana :
Nsv
: Jumlah Support Vector ;
i
: 1,2,3,..., Nsv;
b : bias;
(1)
2. METODOLOGI
Data yang digunakan pada penelitian ini adalah data harga harian perdagangan forex untuk
pasangan mata uang EUR/USD, GBP/USD dan USD/JPY periode 02 Januari 2012 sampai
dengan 29 Juni 2012 yang diperoleh dari www.alpari.com.
2.1 Persiapan input data
Langkah pertama yang dilakukan adalah seleksi fitur untuk menghilangkan variabel yang kurang
penting. Variabel harga forex yang terdiri dari open price, close price, high price dan low price dipilih
terlebih dulu sehingga cukup digunakan dua variabel saja yang memenuhi kondisi bullish dan bearish
yaitu open price dan close price. Kemudian dilakukan pelabelan terhadap data yang telah diseleksi
yaitu +1 untuk mewakili bullish (jika open price < close price) dan -1 untuk mewakili bearish (jika
open price > close price). Agar tidak ada variabel data yang nilainya mendominasi variabel lainnya,
maka data tersebut harus dinormalisasi sehingga seluruh data akan bernilai antara 0 dan 1. Kemudian
dilakukan pembagian data menjadi training set (data bulan Januari sampai Mei 2012) dan testing set
(data bulan Juni 2012).
2.2 Pembelajaran (training)
Pembelajaran bertujuan untuk membentuk model hyperplane, langkah yang dilakukan adalah
mencari support vector pada training set menggunakan quadratic programming dengan metode
Lagrange, outputnya berupa lagrange multiplier (alpha). Training set yang mempunyai nilai alpha
positif disebut dengan support vector. Yang pertama kali dilakukan adalah menduga parameter dari
SVM dan kernel RBF yaitu C (cost) dan (gamma) dengan metode gridsearch. Parameter
digunakan pada fungsi kernel RBF untuk mentransformasi training set ke feature space. Hasil
transformasi inilah yang akan dioptimasi menggunakan metode Lagrange sehingga menghasilkan nilai
alpha yang digunakan untuk menentukan support vector dan menduga koefisien w (weight) maupun b
(bias) pada model klasifikasi (model hyperplane).
2.3 Pengujian (testing)
Pada tahap ini, model hyperplane yang telah dibentuk akan diujikan pada testing set yaitu data
baru yang tidak termasuk dalam tahap pembelajaran.
3. HASIL DAN PEMBAHASAN
3.1 Pendugaan parameter C (cost) dan (gamma)
Kombinasi dari parameter C dan yang menghasilkan akurasi terbaik diduga menggunakan
metode gridsearch, hasilnya dapat dilihat pada pada Tabel 1 berikut :
Tabel 1. Hasil gridsearch
C
Data
Awal Akhir Awal Akhir C
EUR/USD
215
2-3
23
214
25
5
15
-3
3
2
2
2
2
213
GBP/USD
5
15
-3
3
2
2
2
2
215
JPY/USD
Terbaik
Akurasi
23 98.17%
2-3 99.08%
22 93.58%
Tabel 1 menunjukkan kombinasi parameter C dan yang terbaik pada masing-masing training set.
Kombinasi parameter terbaik untuk EUR/USD adalah C=214 =16384 dan = 23=8 dengan akurasi
prediksi mencapai 98.17%, pada GBP/USD adalah C=23=8192 dan = 2-3=0.125 dengan akurasi
99.08% dan pada USD/JPY adalah C=215= 32768 dan =22 =4 dengan akurasi 93.58%.
3.2 Optimasi dengan fungsi lagrange
Nilai pada Tabel 1 adalah parameter dari fungsi kernel RBF yang digunakan untuk
mentransformasi training set ke feature space. Langkah selanjutnya adalah melakukan optimasi
dengan metode Lagrange. Solusi yang diperoleh berupa besaran Lagrange Multiplier seperti yang
ditunjukkan pada Tabel 2 dibawah ini :
26
Bias (b)
7.8118
-3.6468
3.7484
Tabel 3 menunjukkan hasil pendugaan w dan b masing-masing training set sehingga model
hyperplane pada feature space adalah sebagai berikut :
EUR/USD
: -19.7617 (x1) + 54.3241 (x2) + 7.8118
(2)
GBP/USD
: -404.5085 (x1) + 220.2354 (x2) - 3.6468
(3)
USD/JPY
: -106.5735 (x1) + 88.6621 (x2) + 3.7484
(4)
dimana (xi) adalah training set hasil transformasi pada feature space.
3.4 Menyusun model hyperplane
Model klasifikasi linier pada persamaan (2),(3) dan (4) adalah model hyperplane dalam primal
form. Untuk mengatasi masalah ketidaklinieran dengan metode kernel trick diperlukan formulasi SVM
dalam dual form yang hanya mengandung nilai alpha, sehingga model hyperplane pada persamaan (1)
untuk masing-masing training set adalah sebagai berikut :
f ( x d ) = i yi exp 8( xi x d
11
EUR/USD :
i =1
14
GBP/USD:
f ( x d ) = i yi exp 0.125( xi x d
i =1
7
USD/JPY :
) ) + 7.81182
f ( x d ) = i y i exp 4( xi x d
i =1
) ) 3.6467
2
) ) + 3.7484
2
(5)
(6)
(7)
27
Error
Akurasi
1
1
0
95.2381%
95.2381%
100%
Tabel 4 menunjukkan keakuratan hasil prediksi label/kelas masing-masing testing set, dapat dilihat
bahwa pada kelas dari USD/JPY dapat diprediksi dengan sempurna yang ditunjukkan dengan akurasi
prediksi mencapai 100% yang berarti bahwa arah pergerakan harga harian USD/JPY selama bulan
Juni 2012 (21 data) dapat diprediksi dengan benar. Sedangkan pada EUR/USD dan GBP/USD nilai
akurasi prediksinya mencapai 95.2381%, hal ini berarti bahwa arah pergerakan harga harian
EUR/USD dan GBP/USD selama bulan Juni 2012 (20 dari 21 data) dapat diprediksi dengan benar.
4. KESIMPULAN
Berdasarkan hasil penelitian yang dilakukan dapat diambil kesimpulan bahwa SVM dengan
metode kernel trick menggunakan fungsi kernel RBF dapat digunakan untuk memprediksi arah
pergerakan harga harian perdagangan valuta asing dengan akurat. Hal ini ditunjukkan dengan akurasi
prediksi terhadap USD/JPY untuk periode bulan Juni 2012 yang mencapai 100% (21 data dapat
diprediksi dengan benar seluruhnya) dan pada EUR/USD maupun GBP/USD yang mencapai 95.24%
(20 dari 21 data dapat diprediksi dengan benar).
DAFTAR PUSTAKA
Borovikov, E.A., (2005), An evaluation of Support Vector Machines as a pattern recognition tool,
University of Maryland Press, Maryland.
Cristianini, N., (2000), An Introduction to Support Vector Machines, Cambrige University Press,
Cambrige.
Darmawi, H., (2006), Pasar Finansial dan Lembaga-Lembaga Finansial, Bumi Aksara, Jakarta.
Hadi, H., (1997), Valas Untuk Manajer (Forex for Managers), Ghalia Indonesia, Jakarta.
Santosa, B., (2000), Data Mining Teknik Pemanfaatan Data untuk Keperluan Bisnis, Graha Ilmu,
Yogyakarta.
28