Anda di halaman 1dari 10

Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-ISSN: 2548-964X

Vol. 2, No. 3, Maret 2018, hlm. 1170-1178 http://j-ptiik.ub.ac.id

Klasifikasi Aritmia Dari Hasil Elektrokardiogram Menggunakan


Support Vector Machine Dengan Seleksi Fitur Menggunakan Algoritma
Genetika
Reiza Adi Cahya1, Candra Dewi2, Bayu Rahayudi3
Program Studi Teknik Informatika, Fakultas Ilmu Komputer, Universitas Brawijaya
Email: 1reizasine@gmail.com, 2dewi_candra@ub.ac.id, 3ubay1@ub.ac.id

Abstrak
Elektrokardiogram (EKG), atau rekam jantung, dapat digunakan untuk mengenali kelainan detak
jantung atau aritmia. Bantuan komputer dengan teknik machine learning tertentu dapat digunakan
untuk mengenali aritmia secara otomatis. Tetapi data numerik yang belum diproses dari EKG
mempunyai jumlah fitur yang banyak, yang dapat mengurangi kualitas pengenalan otomatis.
Algoritma genetika (genetic algorithm, GA) dapat digunakan untuk menyeleksi fitur sehingga didapat
data dengan jumlah fitur yang lebih rendah. GA akan membuat data set dengan fitur yang sudah
diseleksi, dan data set tersebut digunakan untuk melatih support vector machine (SVM) untuk
mengklasifikasikan aritmia. Untuk pelatihan dan pengujian, digunakan data EKG dari database aritmia
Massachusetts Institute of Technology–Beth Israel Hospital (MIT-BIH). Masing-masing data
merupakan rekam jantung selama 6 detik dan diklasifikasikan ke dalam detak jantung normal dan 3
jenis aritmia. Hasil yang didapat dari penelitian menunjukkan bahwa GA-SVM mempunyai akurasi
rata-rata sebesar 82.5% menggunakan 120 data latih dan 20 data uji. GA-SVM juga dapat menurunkan
jumlah fitur, dari 2160 jumlah fitur awal menjadi rata-rata 406 fitur.
Kata kunci: aritmia, elektrokardiogram, support vector machine, algoritma genetika, seleksi fitur
Abstract
Electrocardiogram (ECG) can be used to recognize abnormal heart beats or arrhythmia. Automatic
arrhythmia recognition can be achieved through the use of machine learning techniques. However,
ECG generates raw numerical data with large amount of features that can reduce the quality of
automatic recognition. Genetic algorithm (GA) can be utilized to perform a feature selection, reducing
the amount of features. Data with reduced features then will be used to train a support vector machine
(SVM) classifier. ECG data from the Massachusetts Institute of Technology–Beth Israel Hospital (MIT-
BIH) arrhythmia database is used as training and testing data. Each data is a six-second ECG
recording, and is classified into normal heartbeat and 3 different kind of arrhythmias. Result shows
that GA-SVM yielded average accuracy of 82.5% with 120 training data and 20 test data, and reduced
the amount of feature from 2160 original features to an average of 406 reduced features.
Keywords: arrhythmia, electrocardiogram, support vector machine, genetic algorithm, feature selection

teratur. Kondisi menyebabkan gejala-gejalan


1. PENDAHULUAN seperti rasa lelah dan rasa sakit di dada. Untuk
mendeteksi aritmia, dokter menggunakan rekam
Aritmia atau kelainan detak jantung telah
jantung atau elektrokardiogram (American
banyak diderita oleh penduduk dunia – salah
Health Association, 2016).
satu jenis aritmia, atrial fibrillation (afib) telah
Elektrokardiogram (EKG) adalah hasil
menyerang 6 juta penduduk Eropa dan 2,3 juta
rekaman aktivitas jantung yang didapat dengan
penduduk Amerika (Kannel & Benjamin, 2008),
menempelkan elektrode ke kulit untuk
sedangkan aritmia jenis ventricular tachycardia
menangkap arus listrik yang dihasilkan jantung.
(vtac) telah menyebabkan 300.000 kematian di
Deretan aktivitas-aktivitas jantung yang
Amerika (Compton, 2015).
direkam oleh EKG dapat digunakan sebagai
Aritmia menyebabkan jantung berdetak
indikator adanya gangguan irama jantung, yang
lebih cepat, lebih lambat, atau menjadi tidak
dapat digunakan oleh dokter atau perawat untuk

Fakultas Ilmu Komputer


Universitas Brawijaya 1170
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer 1171

mengambil tindakan yang tepat (Wilkins, 2011). deteksi penyakit jantung dengan seleksi fitur
Dalam menginterpretasikan hasil EKG, menggunakan genetic algorithm (GA). Penelitian
diperlukan pengetahuan yang luas karena setiap dilakukan dengan 3 jenis teknik klasifikasi yakni
macam aritmia memiliki ciri-ciri yang berbeda, Naïve Bayes, decision tree, dan klasifikasi melalui
seperti bentuk-bentuk gelombang dan jumlah clustering. Dataset terdiri dari 909 data. Setiap
detak jantung permenit (Wilkins, 2011). data memiliki 13 fitur dan 2 kelas, yakni sembuh
Pengenalan manual seperti ini rentan terhadap (tidak mempunyai penyakit jantung) dan sakit
kesalahan diagnosis karena kurangnya ketelitian. (mempunyai penyakit jantung). GA dapat
Praktisi-praktisi non-ahli kardiologi, seperti menyeleksi 6 fitur dari 13 fitur yang ada. Hasil
perawat, juga dapat mengalami kesulitan klasifikasi dari fitur yang sudah diseleksi sangat
mengenali jenis-jenis gelombang. memuaskan, Naïve Bayes memiliki akurasi
Untuk membantu tenaga medis sebesar 96,5% dan decision tree memiliki akurasi
menginterpretasikan hasil EKG, dapat sebesar 99,2%. Klasifikasi melalui klustering
digunakan bantuan sistem komputer dengan memiliki akurasi yang cukup bagus yakni 88,2%.
machine learning. Akan tetapi, kendala dalam
menerapkan pengenalan otomatis dengan sistem Untuk penelitian SVM tanpa seleksi fitur,
komputer adalah EKG menghasilkan data Cholissodin, dkk (2014) melakukan klasifikasi
numerik dengan jumlah besar. Hal ini dokumen komplain elektronik kampus dengan
dikarenakan EKG merupakan rekaman aktivitas directed acyclic graph (DAG) SVM dan analytic
jantung dalam millivolt (mV) yang direkam hierarchy processing (AHP). Data-data
setiap sepersekian detik (Wilkins, 2011). diklasifikaskan ke empat kelas berdasarkan
Contoh, pada database aritmia Massachusetts urgensi dan pentingnya komplain yang diterima.
Institute of Technology–Beth Israel Hospital Data-data kemudian dioleh dengan text
(MIT-BIH) rekam jantung selama 6 detik preprocessing. Kemudian AHP digunakan untuk
menghasilkan titik data sebanyak 2160 buah mendapat bobot setiap kelas, dan akhirnya SVM
(Moody & Mark, 1997). digunakan untuk mengklasifikakan data. Hasil
Dalam mengatasi jumlah fitur yang besar yang diperoleh adalah akurasi selalu lebih tinggi
ini, support vector machine (SVM) adalah salah tanpa penggunaan bobot AHP dengan akurasi
satu algoritma yang dapat digunakan. SVM terbaik senilai 82,61%.
mempunyai keuntungan karena tidak begitu Berdasarkan penjelasan yang telah
dipengaruhi oleh besarnya jumlah fitur pada dipaparkan, akan dilakukan penelitian untuk
data (curse of dimensionality). Selain itu SVM mengklasifikasikan aritmia dari hasil EKG
juga tidak perlu mengetahui distribusi data pada dengan SVM dengan proses seleksi fitur. Data
ruang fitur (Melgani & Bazi, 2008). penelitian diambil dari database aritmia MIT-
Untuk meningkatkan kinerja SVM, jumlah BIH (Moody & Mark, 1997). Setiap data
fitur dapat dikurangi dengan melakukan proses merupakan rekam jantung selama 6 detik kanal
seleksi fitur. Pengurangan jumlah fitur dengan MLII (limb lead II yang dimodifikasi) yang
memiliki keuntungan yakni mempermudah diubah menjadi 2160 fitur dan dinormalisasi
visualisasi dan pemahaman data, mengurangi dengan metode min-max. Setiap data
biaya komputasi, dan meningkatkan kinerja mempunyai kelas yakni detak jantung normal,
algoritma (Guyon & Elisseeff, 2003). atrial fibrillation, PVC bigeminy, dan
Beberapa penelitian tentang SVM dan ventricular tachycardia. Dataset terdiri dari 120
proses seleksi fitur telah dilakukan sebelumnya. data latih dan data uji. Proses seleksi fitur
Melgani dan Bazi (2008) mengembangkan dilakukan menggunakan GA. Pengujian yang
SVM dengan kernel radial basis function dilakukan meliputi melihat pengaruh berbagai
(RBF) untuk mengklasifikasi 5 jenis detak parameter GA dan SVM terhadap hasil
jantung. SVM dioptimasi dengan particle klasifikasi.
swarm optimization (PSO) untuk menentukan
parameter C dan γ. PSO juga digunakan untuk 2. JANTUNG DAN ARITMIA
memilih subset fitur yang digunakan untuk Jantung adalah organ penuh otot yang
melatih SVM. Dengan 500 data latih, SVM- terletak di dada, di belakang sternum di
PSO dapat menentukan dengan benar 90,52% mediastinum, di antara paru-paru, dan di depan
data dari 40.438 total data uji. tulang belakang. Jantung terdiri dari empat
Dalam penelitian lain, Anbarasi, Anupriya, ruang, yang terdiri dari dua atria dan dua
dan Inyengar (2010) melakukan penelitian untuk

Fakultas Ilmu Komputer, Universitas Brawijaya


Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer 1172
( , ) adalah fungsi kernel untuk memetakan data
ventrikel. Atria dan ventrikel masing-masing untuk kasus data yang tidak dapat dipisahkan secara linear.
dibagi menjadi kanan dan kiri. Atria dan Fungsi kernel yang digunakan adalah radial basis function
(RBF) pada persamaan 3.
ventrikel berperan dalam siklus peredaradan
(3)
darah dalam tubuh manusia (Wilkins, 2011). ( , ) = exp (−
‖ − ‖
)
Untuk memompa darah, jantung memerlukan 2
2

impuls listrik. Aktivitas listrik jantung ini dapat


digambarkan dengan elektrokardiogam (EKG). Nilai didapat dengan menyelesaikan
Rekaman EKG berbentuk gelombang yang bidang pemisah. Pencarian bidang pemisah
digambarkan pada kertas dengan kisi. Sumbu tersebut merupakan masalah optimasi dan dapat
horizontal menunjukkan waktu dan sumbu diselesaikan dengan beberapa cara. Pada
vertikal dapat menunjukkan tegangan listrik atau penelitian ini, cara yang digunakan adalah
amplitudo. EKG direkam dengan menempelkan sequential learning (Vijayakumar & Wu, 1999).
elektrode ke kulit pasien. Tempat penempelan Sequential learning dapat menemukan bidang
elektrode mempengaruhi EKG yang dihasilkan, pemisah optimal dengan lebih cepat dibanding
dan terdapat 12 jenis rekaman EKG (Wilkins, dengan metode quadraric programming yang
2011). biasanya digunakan untuk memecahkan
Dalam penelitian ini, jenis-jenis aritmia optimasi.
yang akan dikenali adalah: SVM hanya dapat mengklasifikasikan data
a. Detak jantung normal. secara biner. Untuk klasifikasi lebih dari 2 kelas,
b. Atrial fibrillation. dapat digunakan berbagai strategi memecah
c. Premature ventricular contraction klasifikasi multikelas menjadi beberapa klasifikasi
(PVC) bigeminy. biner. Dalam penelitian ini digunakan strategi
d. Ventricular Tachycardia. binary decision tree (BDT) (Madzarov,
Gjorgjevikj & Chorbev, 2008). BDT mempunyai
3. SUPPORT VECTOR MACHINE prinsip membentuk pohon keputusan
Misalkan terdapat sekumpulan data latih berjumlah dengan berdasarkan jarak masing-masing kelas.
fitur sejumlah ( ∈ ℜ , = 1,2, … , ), support vector machine (SVM)
akan mengklasifikasikan setiap data ke dalam target kelas yang
bernilai ∈ (+1, −1). Dari data latih tersebut, SVM melakukan
4. ALGORITMA GENETIKA
klasifikasi dengan menemukan bidang
(hyperplane) yang dapat memisahkan data-data Algoritma genetika atau Genetic Algorithm
dari kedua kelas dengan margin yang paling (GA) adalah algoritma optimasi (Coley, 1999)
besar (Huang, Kecman & Kopriva, 2006). dan pencarian stokastik (Gen & Cheng, 2000)
Untuk menglasifikasikan data ke dalam kelas ∈ (+1, −1) , yang menggunakan konsep seleksi alam sebagai
digunakan persamaan 1, dengan proses penurunan dasar cara kerjanya. GA merupakan sebuah
persamaan 1 secara keseluruhan dapat dilihat pada metode umum atau framework yang dapat
Bennett & Campbell (2000). digunakan untuk menyelesaikan berbagai
( )= (∑ ( , )+ )
(1) macam masalah (Coley, 1999).
GA bekerja dengan memanipulasi populasi
=1

Dimana adalah Lagrange multiplier untuk


data ke-i dan adalah nilai bias yang didapat dari atau kumpulan individu yang merepresentasikan
persamaan 2. solusi terhadap seuatu masalah. Pada awalnya,
populasi dibangkitkan secara acak pada berbagai
1 ∑ ( , +)
titik di ruang pencarian (Coley, 1999). Kemudian
(2)

dari populasi awal, dibentuk individu-individu


=− ( )

2 +∑ ( −
, )

+

Dimana adalah data dengan nilai terbesar untuk kelas +1 dan data
− baru yang disebut dengan offspring. Offspring
dengan nilai terbesar untuk kelas −1. SV atau support vectors adalah data-data
yang mempunyai nilai lebih dari 0 (Huang, Kecman & Kopriva, 2000).
dibentuk dengan proses reproduksi yang
dilakukan dengan dua cara yaitu crossover
(menggabungkan dua individu untuk membentuk
individu baru) dan mutasi (mengubah bagian dari
sebuah individu untuk membuat individu baru).
Seluruh individu (termasuk offspring) diukur
kemampuannya dalam memecahkan masalah,
yang diukur dengan nilai fitness. Populasi baru
dibentuk

Fakultas Ilmu Komputer, Universitas Brawijaya


Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer 1173

dengan memilih individu-individu yang lebih


baik. Jika proses ini diulang selama beberapa
generasi, akan didapat individu terbaik (gBest)
yang diharapkan dapat menyelesaikan masalah
dengan baik (Gen & Cheng, 2000).
Individu memiliki deretean gen yang
disebut kromosom. Kromosom ini
merepresentasikan solusi untuk permasalahan
yang dihadapi. Proses melakukan pengubahan
dari solusi menjadi urutan gen dinamakan
encoding. Terdapat beberapa macam encoding,
yakni encoding biner, encoding bilangan real,
encoding permutasi integer, dan encoding
struktur data (Gen & Cheng, 2000).

5. SVM DENGAN SELEKSI FITUR


MENGGUNAKAN GA
GA digunakan untuk membentuk subfitur
yang optimal dari 2160 fitur awal. Untuk itu,
digunakan encoding biner. Gen ke-i setiap
kromosom merepresentasikan apakah fitur ke-i
digunakan dalam proses pelatihan SVM (nilai 1
menunjukkan fitur digunakan dan nilai 0
menunjukkan fitur tidak digunakan). Dengan
demikian, kromosom mempunyai 2160 gen.
Setiap gen dievaluasi dengan membentuk model
SVM. Nilai akurasi dan jumlah fitur digunakan
untuk menghitung nilai fitness.
Proses dari GA-SVM dapat dilihat pada
gambar 2. Penjelasan setiap langkah-langkah
GA-SVM adalah sebagai berikut:
Inisialisasi populasi: Inisialisasi populasi awal
dilakukan dengan membangkitakan nilai real Gambar 1 Alur GA-SVM
acak untuk setiap gen pada setiap kromsom. b. Mutasi dilakukan dengan single
Kemudian nilai real tersebut diubah menjadi 0 mutation. Mutasi akan menghasilkan
atau 1 dengan thresholding (1 jika nilai kurang subfitur dengan karakteristik baru yang
dari sama dengan threshold dan 0 jika tidak). tidak dimiliki induk.
Nilai threshold untuk setiap kromosom dibuat (crossover rate) dan (mutation rate)
berbeda. Dengan demikian, populasi awal adalah parameter dalam rentang [0, 1] yang
memiliki jumlah fitur terseleksi yang bervariasi. menentukan jumlah crossover dan mutasi pada
Penggunaan inisialisasi yang sederhana dengan 1 generasi.
langsung membangkitkan nilai 0/1 membuat
semua kromosom memilih sekitar 1080 fitur Evaluasi dengan melatih SVM: Untuk
(probabilitas 0.5×2160 total fitur) sehingga menghitung nilai fitness, dibentuk model SVM
populasi awal kurang bervariasi. menggunakan subfitur yang telah diseleksi.
dalam kromosom.
Reproduksi: Reproduksi dibagi menjadi 2: Model SVM dilatih dengan menggunakan sequential
a. Crossover dilakukan dengan one-cut learning (Vijayakumar &Wu, 1999). Dalam penelitian ini,
sequential learning dikatakan konvergen jika iterasi
point.. Crossover akan menghasilkan maksimal telah tercapai atau perubahan lebih kecil dari
subfitur yang mempunyai karakteristik batas yang telah ditentukan (max(| |) < ).
dari kedua induknya. Fungsi fitness dari GA-SVM dihitung
menggunakan persamaan 7.

Fakultas Ilmu Komputer, Universitas Brawijaya


Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer 1174
(4) c. 0,1
=0.85× 1+0.15× 2

Dimana 1 adalah akurasi dari SVM yang d. σ dari RBF: 2


telah dibentuk dengan fitur yang sudah e. λ: 0,5
terseleksi. 2 adalah persentase dari fitur yang f. γ: 0.01
tidak terpilih. g. C: 1
Seleksi: Untuk seleksi dilakukan dengan binary h. ε: 10-5
i. Iterasi maksimal SVM: 100
tournament. 2 individu acak dipilih dari
populasi, dan individu dengan fitness terbesar 6.1 Hasil dan Pembahasan Pengujian
dinyatakan lolos untuk generasi selanjutnya.
Ukuran Populasi GA
Proses ini diulang sebanyak jumlah populasi.
Pembandingan solusi: Pada setiap generasi, 1

Rata -rata Fitness


kromosom terbaik pada generasi ke- () 0,9
dibandingkan dengan kromosom terbaik pada 0,8
generasi sebelumnya (). Jika fitness 0,7
lebih baik dari, maka 0,6
dinyatakan sebagaiyang baru. 0,5 20 30 40 50 60 70 80 90 100
10
Konvergensi: GA akan berhenti dengan 2 Ukuran Populasi
syarat. Pertama, GA harus dijalankan minimal
25 generasi. Kedua, jika selama 10 generasi Gambar 2 Hasil Pengujian Ukuran Populasi
tidak terjadi perbaikan akurasi dan fitur yang
terseleksi tidak turun lebih dari 10%. Kondisi Hasil dari pengujian ukuran populasi
kedua jika dinyatakan dengan persamaan 4, akan
disajikan pada gambar 3. Dari hasil pengujian
menghasilkan nilai threshold:
didapat bahwa nilai fitness cenderung sebanding
∆ = 0.85 × ∆ 1 + 0.15 × ∆ 2 dengan ukuran populasi. Populasi menunjukkan
= 0.85 × 0 + 0.15 × 0.1
(5) berapa banyak solusi (Gen & Cheng, 2000),
sehingga populasi yang kecil menyebabkan tidak
= 0 + 0.015 = 0.015
banyak solusi yang ditelusuri. Jumlah populasi
6. HASIL DAN PEMBAHASAN 100 dipilih sebagai jumlah populasi yang tepat
pada masalah ini dan digunakan pada pengujian-
Kinerja dari GA-SVM dilihat dengan hasil pengujian selanjutnya.
akurasi, yakni perbandingan antara data uji yang 6.2 Hasil dan Pembahasan Pengujian
diklasifikasikan dengan benar dan jumlah semua
data uji. Dalam penelitian ini, digunakan 120 Crossover Rate dan Mutation Rate
data latih dan 20 data uji, dengan 5 data uji untuk 1
setiap kelas. Kemudian dilihat pengaruh
Rata rata- Fitness

0,9
parameter-parameter GA-SVM terhadap
akurasi. Parameter-parameter yang diuji adalah: 0,8
a. Ukuran populasi GA 0,7
b. Tingkat crossover GA ( ) 0,6
c. Tingkat mutasi GA ( ) 0,5
d. Nilai threshold SVM
e. Augmenting factor SVM
f. Konstanta SVM Cr/Mr
g. Learning rate SVM
h. Nilai dari kernel RBF Gambar 3 Hasil Pengujian Crossover Rate dan
i. Jumlah iterasi SVM
Mutation Rate
Untuk setiap nilai parameter, pengujian
diulang sebanyak 10 kali untuk mendapatkan
nilai fitness rata-rata. Dalam pengujian
digunakan parameter awal sebagai berikut:
a. Ukuran populasi:
50 :
. 0,9
Fakultas Ilmu Komputer, Universitas
Brawijaya
Hasil dari pengujian kombinasi dan disajikan
pada 4. Pengujian menunjukkan bahwa crossover
rate yang lebih besar menghasilkan fitness yang
lebih baik. Hal ini dikarenakan masalah memiliki
ruang pencarian yang besar
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer 1175

(22160), dan crossover memberikan kemampuan pemisah yang didapat dengan menyelesaikan
untuk menjelahi ruang pencarian yang lebih quadratic problem, tetapi juga menyebabkan
luas (Gen & Cheng, 2000). Nilai kombinasi konvergensi lebih lama (Vijayakumar & Wu,
parameter dan yang dipilih untuk pengujian 1999), sehingga nilai yang didapat pada saat
selanjutnya adalah 0.9 dan 0.1. iterasi terakhir tercapai tidak optimal. Oleh
karena itu, nilai 0.5 dipilih sebagai nilai terbaik
6.3 Hasil dan Pembahasan Pengujian dan digunakan pada pengujian-pengujian
Threshold SVM selanjutnya.

1
Rata -rata Fitness

6.5 Hasil dan Pembahasan Pengujian Nilai


0,9 SVM
0,8
0,7 1
0,9

Rata -rata Fitness


0,6
0,5 0,8
0,7

0,6

0,5
Gambar 4 Hasil Pengujian Threshold ε SVM
Hasil dari pengujian nilai threshold ε disajikan
pada 5. Bertambahnya nilai cenderung C
mengakibatkan penurunan nilai fitness. Nilai ε
menunjukkan seberapa besar yang dibutuhkan untuk
melanjutkan pencarian. Dengan demikian, nilai yang Gambar 6 Hasil Pengujian Nilai C SVM
besar akan menyebabkan pencarian mudah terhenti
karena pembaruan tidak cukup besar, walaupun
konvergensi belum tercapai. Nilai 10
−7
digunakan Hasil dari pengujian nilai C dapat dilihat
sebagai nilai ε terbaik dan digunakan pada pada gambar 7. Hasil pengujian menunjukkan
pengujian-pengujian selanjutnya. nilai fitness mengalami peningkatan dengan
bertambahnya nilai C. Nilai C memberikan
6.4 Hasil dan Pembahasan Pengujian Nilai bobot penalti yang lebih besar pada data yang
Augmenting Factor SVM melewati bidang pemisah, sehingga SVM yang
dihasilkan dapat menghindari kesalahan
1
Rata -rata Fitness

klasifikasi (Huang, Kecman & Kopriva, 2006).


0,9
Dengan demikian nilai N = 50 digunakan
0,8
sebagai nilai C terbaik dan digunakan pada
0,7
pengujian-pengujian selanjutnya.
0,6
0,5 6.6 Hasil dan Pembahasan Pengujian Nilai
0,01 0,1 0,5 1 5 10 25 50 100 Learning Rate SVM

1
Fitness

0,8
Gambar 5 Hasil Pengujian Nilai λ SVM
0,6
Rata -rata

Hasil dari pengujian nilai augmenting 0,4


factor λ dapat dilihat pada 6. Hasil yang didapat
adalah pada nilai 0.01 hingga 0.5 nilai fitness 0,2
cenderung stabil, dan nilai yang lebih besar 0
menurunkan nilai fitness. Pada sequential
learning, nilai yang lebih besar memberikan
bidang pemisah yang lebih mirip dengan bidang

Gambar 7 Hasil Pengujian Nilai γ SVM

Hasil dari pengujian nilai dapat dilihat

Fakultas Ilmu Komputer, Universitas Brawijaya


Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer 1176

pada gambar 8. Hasil menunjukkan nilai fitness cenderung stabil dari jumlah iterasi SVM sebesar 100 dipilih sebagai
−7 −4
= 10 hingga = 10 , mencapai titik maksimal pada = 0.01 dan
kemudian mengalami penurunan. Sequential Learning pada dasarnya jumlah iterasi terbaik walaupun terdapat nilai
adalah gradient ascent (Vijayakumar & Wu, 1999) sehingga learning fitness yang lebih tinggi pada jumlah iterasi
rate yang terlalu kecil menyebabkan optimal lama tercapai, dan
learning rate yang terlalu besar menyebabkan optimal terlewati. yang lebih banyak. Selain itu, jumlah iterasi
Berdasarkan hasil pengujian, nilai = 0.01 menjadi nilai yang yang lebih banyak menyebabkan waktu
mempunyai keseimbangan antara kecepetan pencarian dan tidak
melawati hasil optimal. Oleh karena itu, = 0.01 dipilih menjadi nilai komputasi yang lebih lama.
parameter terbaik dan digunakan pada pengujian-pengujia selanjutnya.
Jumlah Iterasi SVM
6.7 Hasil dan Pembahasan Pengujian Nilai 1

Rata -rata Fitness


Kernel RBF 0,9
0,8
1
Rata -rata Fitness

0,7
0,9 0,6
0,8 0,5

900
100

200
300
400
500
600
700
800

1000
0,7
0,6
Jumlah Iterasi SVM
0,5
1 1,5 2 2,5 3 3,5 4 4,5 5
Gambar 9 Hasil Pengujian Jumlah Iterasi SVM

Gambar 8 Hasil Pengujian Nilai σ Kernel RBF


6.9 Validasi Pengujian

Hasil dari pengujian nilai dapat dilihat pada gambar 9.


Setelah dilakukan pengujian, didapat
Nilai fitness naik dari rentang 1 hingga 2, dan setelah itu turun. parameter-parameter optimal sebagai berikut:
Untuk = 1/(−2 ), yang lebih besar menghasilkan kernel yang a. Ukuran populasi: 100
overfit, sedangkan nilai yang lebih kecil menghasilkan kernel
yang underfit (Melgani & Bazi, 2008). Karena berbanding b. Crossover rate: 0,9
terbalik dengan maka nilai yang besar akan menghasilkan kernel c. Mutation rate: 0,1
yang underfit dan nilai yang kecil akan menghasilkan kernel yang
overfit. Dalam pengujian ini, didapat bahwa nilai = 2 adalah nilai d. Threshold ε: 10-7
yang dapat menjaga keseimbangan antara overfit dan underfit e. Augmenting factor λ: 0,5
sehingga mendapat fitness terbaik dan digunakan pada pengujian
selanjutnya. f. Nilai C: 50
g. Learning rate γ: 0.01
6.8 Hasil dan Pembahasan Pengujian h. σ dari RBF: 2
i. Iterasi maksimal SVM: 100
Hasil dari pengujian jumlah iterasi SVM
dapat dilihat pada 10. Hasil pengujian Validasi pengujian dilakukan dengan
menunjukkan fitness tidak mengalami kenaikan menjalankan GA-SVM dengan parameter
atau penurunan yang signifikan dengan optimal selama 10 kali untuk melihat kestabilan
bertambahnya jumlah iterasi. Hal ini hasil GA-SVM. Hasil dapat dilihat pada tabel 1.
menunjukkan bahwa SVM dapat mencapai GA-SVM mampu menghasilkan akurasi rata-
konvergensi pada 100 iterasi. Oleh karena itu, rata sebesar 82.5.5%. GA-SVM juga dapat
menyeleksi rata-rata 406 fitur, penurunan yang
signifikan dari fitur awal yang sebanyak 2160
fitur.
Tabel 1. Hasil Akhir Pengujian
No Akurasi Jumlah Fitur Fitness
Terpilih
1 80% 310 0.808472222
2 80% 695 0.781736111
3 80% 348 0.805833333
4 85% 396 0.845
5 90% 320 0.892777778
6 80% 306 0.80875
7 85% 393 0.845208333
8 85% 297 0.851875
9 85% 254 0.854861111
10 75% 738 0.73625
Rata-rata 82.5% 406 0.823076389

Fakultas Ilmu Komputer, Universitas Brawijaya


Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer 1177

Cholissodin, I., Kurniawati, M., Indriati &


Arwani, I., 2014. Classification of
7. PENUTUP Campus E-Complaint Documents using
Dari hasil yang didapat dalam penelitian Directed Acyclic Graph Multi-Class
klasifikasi aritmia EKG dengan menggunakan SVM Based on Analytic Hierarchy
SVM dengan seleksi fitur menggunakan GA Process. International Conference on
dapata mengklasifikasikan data dengan akurasi Advanced Computer Science and
sebesar 82,5% dan menyeleksi rata-rata 406 dari Information Systems (ICACSIS), 18-29
2160 fitur dengan 120 data latih dan 20 data uji. Oktober, pp. 247-253.
Untuk terus mengembangkan penelitian ini, Compton, S. J., 2015. Ventricular Tachycardia:
terdapat beberapa hal yang dapat Practice Essentials, Background,
dipertimbangkan. Pertama, algoritma genetika Pathophysiology. [Online]
tidak hanya sebagai metode seleksi fitur, tetapi Tersedia pada: http://emedicine.
juga untuk optimasi parameter sehingga dapat medscape.com/article/159075-overview
ditemukan parameter yang optimal secara [Diakses 15 January 2017].
otomatis. Selain itu dapat ditambahkan Gen, M. & Cheng, R., 2000. Genetic Algorithms
mekanisme random injection pada algoritma and Engineering Optimization. New
genetika untuk mencegah kondisi local optima. York: John Wiley & Sons.
Penelitian juga dapat dikembangkan
dengan membandingkan pengaruh kernel lain Guyon, I. & Elisseeff, A., 2003. An Introduction
seperti kernel polinomial, dan strategi to Variable and Feature Selection.
multikelas lain seperti one-against-all dan one- Journal of Machine Learning Research,
against-one terhadap hasil klasifikasi. Volume 3, pp. 1157-1182.
Huang, T.-M., Kecman, V. & Kopriva, I., 2006.
DAFTAR PUSTAKA Kernel Based Algortihms for Mining
Huge Data Sets. Heidelberg: Springer-
Anbarasi, M., Anupriya, E. & Iyengar, N. C. S. Verlag Berlin Heidelberg.
N., 2010. Enhanced Prediction of Heart
Disease with Feature Subset Selection Kannel, W. & Benjamin, E., 2008. Final Draft
Using Genetic Algorithm. International Status of the Epidemiology of Atrial
Journal of Engineering Science and Fibrillation. The Medical clinics of
Technology, 2(10), pp. 5370-5376. North America, 92(1), pp. 17-ix.
American Health Association, 2016. About Madzarov, G., Gjorgjevikj, D. & Chorbev, I.,
Arrhythmia. [Online] Tersedia pada: 2009. A Multi-class SVM Classifier
Utilizing Binary Decision Tree.
http://www.heart.org/
Informatica, 33(2), pp. 233-241.
HEARTORG/Conditions/Arrhythmia/
AboutArrhythmia/About-Arrhythmia Melgani, F. & Bazi, Y., 2008. Classification of
_UCM_002010_Article.jsp#.WHtC Electrocardiogram Signals with Support
wPl97Df [Diakses 15 January 2017]. Vector Machines and Particle Swarm
American Health Association, 2016. Why Optimization. IEEE Transactions on
Information Technology in
Arrhythmia Matters. [Online] Tersedia
Biomedicine, 12(5), pp. 667-677.
pada: http://www.heart.org/
HEARTORG/Conditions/Arrhythmia/ Moody, G. B. & Mark, R. G., 1997. MIT-BIH
Why ArrhythmiaMatters/Why- Arrhythmia Database. [Online]
Arrhythmia-Matters_UCM_002023_ Tersedia pada: https://physionet.org/
Article.jsp#.WHtDUfl97Dc [Diakses physiobank/database/mitdb/ [Diakses
15 January 2017]. 16 January 2016].
Bennett, K. P. & Campbell, C., 2000. Support Pratama, A., Cholissodin, I. & Suprapto, 2016.
Vector Machines: Hype or Hallelujah. Klasifikasi Kondisi Detak Jantung
SIGKDD Explorations, 2(2), pp. 1-13. Berdasarkan Hasil Pemeriksaaan
Coley, D., 1999. An Introduction to Genetic Elektrokardiografi Menggunakan
Algorithms for Scientists and Binary Decision Tree - Support Vector
Engineers. Singapore: World Scientific Machine (BDT-SVM). Repositori
Publishing Co. Pte. Ltd. Jurnal Mahasiswa PTIIK UB, 21(8).

Fakultas Ilmu Komputer, Universitas Brawijaya


Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer 1178

Vijayakumar, S. & Wu, S., 1999. Sequential


Support Vector Classifiers and
Regression. Proceeding International
Conference on Soft Computing (SOCO
'99), 1-4 Juni, pp. 610-619.
Wilkins, L. W., 2011. ECG Interpretation Made
Incredibly Easy. 5th ed. Pennsylvania:
Wolters Kluwer/Lippincott Williams &
Wilkins Health.

Fakultas Ilmu Komputer, Universitas Brawijaya

Anda mungkin juga menyukai