Muhammad Athoillah
Pendidikan Matematika, Fakultas Keguruan dan Ilmu Pendidikan, Universitas PGRI Adi
Buana Surabaya
athoillah.muhammad@gmail.com
Abstract
Since October 2017, Electronic automatic payments have been applied in all
Indonesian toll roads. This payment system needes an extra system which is able
to distinguish the types of motor vehicles that will enter the toll road due to the
regulation itself which allow four-wheel or more vehicle to pass the toll road.
This automatic system can be built by a classification algorithm, and one of the
best is Support Vector Machine (SVM), in order to be able to classify non-linear
separable data, SVM must be modified by giving kernel function on it.
Furthermore, determining the approriate kernel for every classification problem
is a fundamental step, and that’s obviously not easy, to solve that problem the
researchers found a method that can make this kernel function more flexible, this
method called Multi Kernel Learning (MKL). Main idea of this method is
formulating some kernel function to be one kernel function. This framework is
built an automatic system to classify the types of motor vehicles using Support
Vector Machine modified using Multi Kernel Learning method. The
experimental result shows that the system has a good average value of accuracy
that is 84.60%, the average value of precision is 84.95% and also average value
of recall is 84.60%
1
Muhammad Athoillah: Klasifikasi Kendaraan Bermotor Dengan Multi Kernel Support
Vector Machine
hanya kendaraan bermotor roda empat atau semua data sesuai dengan fungsi kernel yang
lebih. digunakan. Oleh karenanya, memilih fungsi
Membangun sistem yang mampu kernel yang tepat merupakan hal yang
membedakan jenis kendaraan bermotor fundamental dalam setiap penggunaan
dapat dilakukan dengan mengggunakan SVM, hal ini tentunya tidaklah mudah,
algoritma klasifikasi. Salah satu algoritma untuk mempermudahnya para peneliti
pengklasifikasian yang sangat baik adalah membuat metode yang menjadikan fungsi
Support Vector Machine (SVM) (Athoillah, kernel tersebut menjadi lebih fleksibel,
dkk, 2015). Dengan menemukan hyperplane metode ini biasa disebut dengan Multi
terbaik pada input space, dimana hyperplane Kernel Learning (MKL) (Athoillah, dkk,
tersebut didapatkan dengan menghitung 2015; Rakotomamonjy dkk, 2007).
margin maksimal dari dua garis vektor Beberapa penelitian terbaru menunjukkan
pemisah kedua kelas (support line), maka bahwa pembelajaran multi kernel mampu
hasil pemisahan kelas yang dihasilkan memberikan hasil yang baik dalam hal
menjadi lebih baik daripada algoritma lain mengklasifikasi (Athoillah, dkk, 2015;
yang hanya memanfaatkan satu garis Athoillah, 2017; Shrivastava dkk, 2015; Li
pemisah yang didapat dengan menghitung dkk, 2014). Ide dasar dari MKL adalah
jarak terdekat antar data (Clarke, dkk, 2009; dengan mengkombinasikan beberapa fungsi
Campbell, dkk, 2011 ). kernel menjadi sebuah persamaan,
Meskipun SVM mampu penjelasan lebih lanjut ada pada bab
mengklasifikasikan data dengan sangat baik, berikutnya.
namun ternyata SVM hanya mampu Berdasarkan latar belakang yang telah
mengklasiikasikan data yang bersifat linier dijabarkan, pada penelitian ini dibangun
saja. Untuk dapat mengklasifikasikan data sebuah sistem yang mampu untuk
yang bersifat non-linier maka SVM harus mengklasifikasikan dan mengidentifikasi
dimodifikasi sedemikian rupa, salah satu kendaraan bermotor berupa roda dua
metode yang dapat digunakan adalah dengan maupun roda empat dengan menggunakan
menambahkan fungsi kernel di dalamnya. algoritma SVM yang dimodifikasi dengan
Namun faktanya, dari beberapa fungsi metode Multi Kernel Learning (MKL).
kernel yang dapat digunakan, tidak semua
METODE PENELITIAN
kernel dapat memberikan hasil yang
1. Pra-Proses
maksimal pada tiap permasalahan, hal ini
Penelitian ini diawali dengan pra-
dikarenakan setiap data yang digunakan
proses, yaitu dengan mengubah file-file
memiliki karakteristik sendiri dan tidak
2
Buana Matematika: Jurnal Ilmiah Matematika dan Pendidikan Matematika
Volume 8, Nomor 1, Tahun 2018
p-ISSN 2088-3021
e-ISSN 2598-8077
…
menjadi bentuk data matriks yang kemudian
34 33 33 36 … 36
dilakukan perhitungan untuk mendapatkan
nilai histogram dari citra tersebut. Histogram Dari data tersebut didapatkan histogram
adalah perhitungan frekuensi kemunculan sebagai berikut:
nisbi (relative) dari intesitas sebuah citra.
Secara matematis nilai histogram sebuah
citra dapat dihitung sengan persamaan
berikut:
𝑛𝑖
ℎ𝑖 = , 𝑖 = 0,1,2, … , 𝐿 − 1
𝑛
Dengan, 𝑛𝑖 merupakan jumlah pixel yang
mempunyai derajat keabuan 𝑖, kemudian n
Gambar 2. Contoh histogram
merupakan jumlah seluruh pixel, sedangkan
Gambar 2 menunjukkan histogram dari
𝐿 merupakan nilai dari derajat keabuan
Gambar 1 dimana sumbu horizontal
(Athoillah, 2017). Jadi, misalkan terdapat
menunjukkan nilai grey level sedangkan
sebuah citra input seperti Gambar 1 dibawah
sumbu vertikal menunjukkan nilai jumlah
ini:
dari grey level tersebut. Dari hasil ini maka
didapat vektor input untuk setiap citra
berupa 𝑋 = (𝑥1 , 𝑥2 , 𝑥3 , … , 𝑥256 ) dengan 𝑥𝑖
merupakan feature yang didapat dari jumlah
pada setiap grey level.
2. Proses Klasifikasi
Gambar 1 Contoh citra input
Nilai 𝑋 = (𝑥1 , 𝑥2 , 𝑥3 , … , 𝑥256 ) yang
Kemudian setelah diubah menjadi greyscale telah didapat dari proses sebelumnya,
dan dilakukan resize sehingga menjadi citra kemudian diklasifikasikan dengan
dengan ukuran 50 x 50 maka didapatkan menggunakan algoritma SVM atau lebih
data sebagai berikut. dikenal dengan proses training SVM. Pada
6 5 4 2 … 162 dasarnya SVM merupakan algoritma yang
7 7 4 4 … 173 hanya dapat mengklasifikasikan data yang
7 5 3 2 … 174
bersifat linier. Untuk dapat
21 21 19 19 … 177
mengklasifikasikan data non-linier,
3
Muhammad Athoillah: Klasifikasi Kendaraan Bermotor Dengan Multi Kernel Support
Vector Machine
dari input space ke ruang vektor yang dan memberikan hasil yang maksimal.
berdimensi lebih tinggi (feature space) Untuk itu diperlukan pendekatan lain yang
Dengan demikian, maka pada ruang vektor menjadi lebih fleksibel dan mampu
yang baru ini, hyperplane dapat digunakan pada tiap data yang ada,
dikonstruksikan dan data dapat dipisahkan pendekatan ini disebut dengan metode Multi
(Scholkopf & Smola, 2001). Karena sulitnya Kernel Learning (MKL) (Athoillah, dkk,
maka perhitungan dot product tersebut dapat Jika pada Persamaan (1) fungsi kernel
digantikan dengan fungsi kernel 𝐾(𝑥𝑖, 𝑥𝑗 ) didefinisikan dengan 𝐾(𝑥, 𝑥 ′ ) maka pada
pembelajaran dengan metode multi kernel,
dimana fungsi tersebut mendefinisikan
fungsi tersebut dapat digantikan oleh fungsi
transformasi Φ secara implisit. Inilah yang
kombinasi dari beberapa fungsi kernel
disebut dengan “kernel trick” (Hamel,
dengan 𝐾1 (𝑥, 𝑥 ′ ), 𝐾2 (𝑥, 𝑥 ′ ), … , 𝐾𝑀 (𝑥, 𝑥 ′ )
2009) dirumuskan dengan:
yang dirumuskan sebagai berikut:
𝐾(𝑥𝑖, 𝑥𝑗 ) = 〈Φ(𝑥𝑖 ). Φ(𝑥𝑗 )〉 (1)
𝑀
Dengan penambahan fungsi kernel tersebut, 𝐾(𝑥, 𝑥 ′ ) = ∑ 𝑑𝑚 𝐾𝑚 (𝑥, 𝑥 ′ ) (3)
hasil klasifikasi dari data 𝑥 dapat 𝑚=1
𝑓(𝑥𝑑 ) = ∑ 𝛼𝑖 𝑦𝑖 𝑥𝑖 𝑥𝑑 + 𝑏 𝑑𝑚 ≥ 0, ∑ 𝑑𝑚 = 1
𝑖=1 𝑚=1
𝑛𝑠 Dimana M adalah jumlah dari fungsi kernel
= ∑ 𝛼𝑖 𝑦𝑖 〈Φ(𝑥𝑖 ). Φ(𝑥𝑑 )〉 + 𝑏 (Rakotomamonjy dkk, 2008). Pada
𝑖=1,𝑥𝑖 𝜖𝑆𝑉
𝑛𝑠
penelitian ini fungsi kernel yang digunakan
= ∑ 𝛼𝑖 𝑦𝑖 𝐾(𝑥𝑖 , 𝑥𝑑 ) + 𝑏 (2) dan dikombinasikan diantaranya adalah
𝑖=1,𝑥𝑖 𝜖𝑆𝑉 fungsi kernel Polinomial order tiga, fungsi
Dengan SV = Support Vector ialah subset kernel RBF dan fungsi kernel Linier, berikut
dari training set yang terpilih sebagai ini adalah persamaan dari ketiga fungsi
support vector, dengan kata lain data 𝑥 yang tersebut:
berkorespondensi pada 𝛼𝑖 ≥ 0. Kernel Linier:
4
Buana Matematika: Jurnal Ilmiah Matematika dan Pendidikan Matematika
Volume 8, Nomor 1, Tahun 2018
p-ISSN 2088-3021
e-ISSN 2598-8077
5
Muhammad Athoillah: Klasifikasi Kendaraan Bermotor Dengan Multi Kernel Support
Vector Machine
True False
Benar Positif Negative
Sebena (TP) (FN) 1,2
rnya False True
1
Salah Positive Negative
(FP) (TN) 0,8
0,6
𝑇𝑃 + 𝑇𝑁
Akurasi = × 100% 0,4
Jumlah keseluruhan data
0,2
𝑇𝑃
Presisi = × 100% 0
𝑇𝑃 + 𝐹𝑃
Coba Coba Coba Coba Coba Coba Coba Coba Coba Coba
𝑇𝑃 1 2 3 4 5 6 7 8 9 10
Recall = × 100%
𝑇𝑃 + 𝐹𝑁
Motor Mobil
Berikut adalah tabel yang menunjukkan nilai Gambar 4. Grafik nilai presisi sistem secara
rata-rata dari hasil percobaan pada penelitian keseluruhan
ini:
Tabel 2. Nilai rata-rata hasil klasifikasi
1,2
Kelas Presisi Recall Akurasi 1
Motor 84.02% 85.20% 84.60% 0,8
Mobil 85.88% 84.00% 84.60% 0,6
Rata2 84.95% 84.60% 84.60% 0,4
0,2
Berdasarkan Tabel 2 terlihat bahwa sistem
0
mampu mengklasifikasikan kendaraan Coba Coba Coba Coba Coba Coba Coba Coba Coba Coba
1 2 3 4 5 6 7 8 9 10
bermotor dengan baik. Hal ini dibuktikan
Motor Mobil
dengan nilai akurasi yang mencapai 84.60%,
sedangkan nilai rata-rata presisi dan recall
Gambar 5. Grafik nilai recall sistem secara
yang mencapai 84.95% dan 84.60% keseluruhan
menunjukkan konsistensi dari tingkat
1
ketepatan sistem dalam mengenali
0,8
kendaraan bermotor pada seluruh percobaan
0,6
adalah baik. Sebagai pemahaman lebih
0,4
lanjut bagaimana kemampuan sistem dalam
0,2
mengklasifikasikan kendaraan bermotor
0
dalam penelitian ini, berikut adalah data CobaCobaCobaCobaCobaCobaCobaCobaCobaCoba
1 2 3 4 5 6 7 8 9 10
hasil uji coba sistem secara keseluruhan
pada setiap percobaan.
6
Buana Matematika: Jurnal Ilmiah Matematika dan Pendidikan Matematika
Volume 8, Nomor 1, Tahun 2018
p-ISSN 2088-3021
e-ISSN 2598-8077
Gambar 6. Grafik nilai akurasi sistem menggunakan metode k-fold cross validation
secara keseluruhan dimana data dibagi menjadi 10 bagian (k
Terlihat pada Gambar 4, Gambar 5, dan =10) yang kemudian dilakukan percobaan
Gambar 6, grafik nilai presisi, recall, dan sebanyak 10 kali pula dengan kombinasi data
akurasi sistem secara keseluruhan pada tiap testing dan training yang berbeda tiap
percobaan konsisten menunjukkan nilai di percobaannya.
persekitaran 80%. Hal ini menunjukkan Hasil dari percobaan menunjukkan
bahwa sistem secara stabil mampu bahwa pada penelitian ini, sistem klasifikasi
mengklasifikasikan semua dataset citra yang dibangun dengan menggunakan
kendaraan bermotor dengan sangat baik algoritma SVM multi kernel memiliki
pada tiap percobaannya. performa yang baik dengan rata-rata nilai
akurasi yang mencapai 84.60%, rata-rata
PENUTUP
nilai presisi adalah 84.95% serta rata-rata
Simpulan
nilai recall yang mencapai 84.60%.
Pada penelitian ini dibangun sebuah
sistem yang mampu mengklasifikasikan
Saran
kendaraan bermotor roda dua dan roda empat
Untuk penelitian selanjutnya dapat
dengan menggunakan algoritma Support
dilakukan dengan menggunakan dataset
Vector Machine (SVM) yang dimodifikasi
yang berbeda, misalnya dengan
dengan menambahkan fungsi multi kernel
mengklasifikasikan suara, video, maupun
didalamnya, fungsi kernel tersebut dibentuk
data yang lainnya, atau penelitian dapat
dengan memformulasikan beberapa fungsi
dilakukan dengan mengkombinasikan
kernel diantaranya kernel Polinomial order
fungsi kernel yang lain selain dari fungsi
tiga, kernel RBF dan kernel Linier menjadi
yang telah digunakan dalam penelitian ini.
sebuah fungsi kernel tunggal, metode ini
disebut dengan metode Multi Kernel
DAFTAR PUSTAKA
Learning (MKL). Pada penelitian ini,
Abe, S. (2010), Support Vector Machines for
percobaan dilakukan dengan menggunakan
Pattern Classification, Springer-
dataset berupa citra kendaraan bermotor roda
Verlag, London, UK.
dua dan roda empat sebanyak masing-masing
Athoillah, M. (2017). Pengenalan Wajah
500 citra, yang mana dari jumlah tersebut
Menggunakan SVM Multi Kernel
90% darinya digunakan sebagai data training
dengan Pembelajaran yang
dan 10% menjadi data testing. Validasi dari
Bertambah. Jurnal Online
penelitian ini dilakukan dengan
7
Muhammad Athoillah: Klasifikasi Kendaraan Bermotor Dengan Multi Kernel Support
Vector Machine