ISSN: 1979 - ..
Klasifikasi Parasit Malaria Plasmodium Vivax Pada Citra Sel Darah Merah Menggunakan Metode Support Vector Machine One Against All
Endi Permata S!" M! Jurusan Teknik Elektro, Fakultas Teknik,Universitas Sultan !en! Tirta"asa Jl. Jen#ral Su#irman $%.& 'ile!on-(anten Tel). *+,-./ &9--+, E-mail: en#i0)ermata1"a2oo.3om
Abstrak Malaria adalah penyakit yang disebabkan oleh protozoa yang disebut Plasmo#ium, yang dalam salah satu tahap perkembang biakannya akan memasuki dan menghancurkan sel-sel darah merah . Ada empat spesies yang menyebabkan malaria pada manusia yaitu: )lasmo#ium 4al3i)arum, )lasmo#ium viva5, )lasmo#ium ovale #an )lasmo#ium malariae. Namun kasus malaria yang banyak ditemukan di indonesia hanya spesies )lasmo#ium viva5 . Masing-masing parasit memerlukan tindakan medis yang berbeda. Pemeriksaan dilaboratorium terkadang terpengaruh faktor su6"ektive petugas.Penelitian ini bertu uan membangun sistem klasifikasi yang lebih o67e3tive dan mengurangi faktor su6"ektive petugas dalam mendiagnosis enis parasit malaria )lasmo#ium viva5 serta fase perkembangannya.!ari hasil percobaan tahap klasifikasi menggunakan metode Su))ort 8e3tor %a32ine 9ne !ainst ll didapatkan hasil akurasi viva5 t2ro)o:oit 91,;7<, viva5 s32i:ont =7,7=< #an viva5 !ameto3"te =.,..<. Kata kunci : parasit malaria )lasmo#ium viva5, su))ort ve3tor ma32ine one a!ainst all, ekstraksi fitur #" Pendahuluan Malaria sebagai salah satu penyakit tropis yang menyebabkan sekitar "#$ uta kasus klinik dan %,%" uta kematian setiap tahun. &ebih dari '( ) populasi dunia *+",% milyar penduduk, diperkirakan beresiko ter angkit penyakit ini -./. 0ekitar %," milyar penduduk atau sekitar 12 ) dari total populasi di Asia 3enggara beresiko terkena penyakit malaria. 0ekitar $( ) penduduk yang beresiko tersebut hidup di daerah endemik sedang sampai endemik tinggi malaria. 0ebagian besar penduduk yang hidup di daerah endemik malaria berada di 4ndia, 4ndonesia, Myanmar dan 3hailand -./. Malaria merupakan penyakit yang diakibatkan oleh parasit yang tergolong dalam filum Apicomple5a, kelas 0porozoa, ordo 6aemosporida, suku Plasmodidae, dan genus Plasmo#ium. !ari "( spesies plasmodium, hanya empat spesies diantaranya yang dapat menginfeksi manusia, yaitu Plasmo#ium 4al3i)arum, Plasmo#ium viva5, Plasmo#ium ovale , dan Plasmo#ium malariae . -%/. Namun kasus malaria yang banyak ditemukan di indonesia hanya spesies Plasmo#ium 4al3i)arum, Plasmo#ium viva5 #an %i5 *Plasmo#ium 4al3i)arum #an Plasmo#ium viva5 berada dalam satu sam)le #ara2/ Malaria merupakan penyakit yang disebabkan oleh parasit )roto:oa dari !enus )lasmo#ium yang menginfeksi sel darah merah penderita. Parasit tersebut masuk ke dalam tubuh manusia melalui gigitan nyamuk ano)2eles betina. 0pesies )lasmo#ium yang menginfeksi manusia yaitu Plasmo#ium 4al3i4arum, Plasmo#ium viva5 , Plasmo#ium ovale , dan Plasmo#ium malariae . Plasmo#ium viva5 menyebabkan malaria tertiana, Plasmo#ium malaria merupakan penyebab malaria kuartana. Plasmo#ium ovale menyebabkan malaria o7ale, sedangkan Plasmo#ium 4al3i)arum menyebabkan malaria tropika. 0pesies terakhir ini paling berbahaya karena malaria yang ditimbulkan dapat men adi berat. 6al ini disebabkan dalam 8aktu singkat dapat menyerang eritrosit dalam umlah besar, sehingga menimbulkan berbagai komplikasi di dalam organ-organ tubuh. !iagnosis malaria secara pasti dapat dilakukan apabila ditemukan parasit malaria dalam darah penderita. Plasmo#ium viva5 dalam darah memiliki beberapa fase penting diantaranya adalah t2ro)o:oit, s32i:ont dan !ameto:it. 9eberapa grup riset telah melakukan pengka ian terhadap citra preparat darah. Penelitian yang dilakukan adalah melakukan segmentasi mengunakan metode k-mean 3lusterin! dan kemudian melakukan ekstraksi ciri terhadap citra data yang akan diu i. :kstraksi ciri yng digunakan sebagai masukan pada sistem yang akan dibangun pada penelitian ini ada dua kelompok ciri, yaitu ciri 8arna dan ciri histogram. &angkah terakhir adalah melakukan u i identifikasi dan mengklasifikasi parasit )lasmo#ium 4al3i)arum kedalam empat kelas dengan menggunakan metode aringan saraf tiruan *;03, >earnin! 8ektor ?uanti:ation -%/. 9eberapa penelitian yang dilakukan melakukan segmentasi dengan pemisahan sel darah merah diantaranya menggunakan representrasi In3usion-
Seminar Nasional
ISSN: 1979 - ..
Tree dan melakukan dua klasifikasi untuk mengidentifikasi sel darah merah yang terinfeksi oleh )lasmo#ium menggunakan 6inar" 3lassi4ier dan menentukan fase )lasmo#ium menggunakan multi3lass 3lassi4ier -"/. Proses segmentasi dan dilan utkan dengan klasifikasi menggunakan pendekatan morphologi dan kesamaan 8arna histogram -$/. Penelitian lainnya menggunakan re!ion 6ase# 3tive 'ontour dan dilan utkan dengan klasifikasi menggunakan Su))ort 8ektor %a32ine -'/. Penelitian ini bertu uan membangun sistem klasifikasi fase parasit malaria )lasmo#ium viva5 . <itur yang digunakan adalah stan#ar# #eviation, mean, ske@ness, entro)", kurtosis dan Ara"s3ale dari 6istogram =arna, 6istogram Ara"s3ale dan 6istogram 3ingkat 0aturasi. 0elan utnya dilakukan proses klasifikasi. Metoda yang digunakan untuk pengenalan pola dalam penelitian ini adalah su))ort ve3tor ma32ine *S8%/. !ata citra parasit malaria yang digunakan dalam penelitian ini diperoleh )u6li3 2ealt2 ima!e li6rar" *P64&, dari phil.cdc.go7. $" !in%auan Pustaka 3erdapat dua tahapan utama yang dilaksanakan pada penelitian ini. 3ahap pertama adalah ekstraksi fitur dengan tu uan untuk mendapatkan fitur-fitur yang akan digunakan untuk melakukan klasifikasi. <itur yang akan digunakan adalah stan#ar# #eviation, mean, ske@ness, entro)", kurtosis dan Ara"s3ale dari 6istogram =arna, 6istogram Ara"s3ale dan 6istogram 3ingkat 0aturasi. 3ahap selan utnya dilakukan proses klasifikasi. Metoda yang digunakan untuk pengenalan pola dalam penelitian ini adalah su))ort ve3tor ma32ine *S8%/. $"# &istogram 'arna (Color Histogram ) 6istogram 8arna dihitung dengan cara mendiskritkan 8arna dalam citra, dan menghitung umlah dari tiap-tiap piksel pada citra. 0ebelum dilakukan penghitungan intensitas 8arna tiap piksel, terlebih dahulu dilakukan normalisasi terhadap ketiga komponen penyusun 8arna pada citra *re#,!reen,6lue ,, proses ini disebut uga dengan Normali:e# BA(. Persamaan yang digunakan untuk normalisasi 8arna tersebut adalah sebagai berikut : *%,
*2, !imana nilai saturasi pada setiap piksel ini digunakan untuk membangun histogram distribusinya. !ari nilai histogram 8arna, grayscale dan tingkat saturasi hasil perhitungan sudah dapat di adikan sebagai 7ektor in)ut, namun untuk mengurangi masalah komputasi yang besar maka nilai-nilai tersbut di8akili oleh nilai mean, standar de7iasi, kurtosis dan ske@ness dari distribusinya histogram tersebut, dimana dapat dihitung dengan persamaan :
*#,
*.,
*1,
*$, $"$ &istogram !ingkat Kea*uan (Grayscale Histogram ) Nilai citra parasit malaria merupakan model 8arna >?9. @ntuk mendapatkan nilai tingkat keabuan dari citra yang terdiri dari komponen 8arna
$", Support Vector Machine (SVM) Su))ort 8e3tor %a32ine *0CM, dikembangkan oleh 9oser, ?uyon, dan Capnik , pertama kali dipresentasikan pada tahun %BB" di nnual Corks2o) on 'om)utational >earnin! T2eor" . Aonsep dasar S8% sebenarnya merupakan kombinasi harmonis dari teori-teori komputasi yang telah ada puluhan tahun sebelumnya, seperti mar!in 2")er)lane *!uda D 6art tahun %B#$, Eo7er tahun %B.2, Capnik %B.', dan sebagainya,, kernel diperkenalkan oleh Aronsza n tahun %B2(, demikian uga dengan konsep-konsep pendukung yang lain. Akan tetapi hingga tahun %BB", belum pernah ada upaya merangkaikan komponen-komponen tersebut. 9erbeda dengan strategi neural net@ork yang berusaha mencari 2")er)lane pemisah antar kelas, 0CM berusaha menemukan 2")er)lane yang terbaik pada in)ut s)a3e . Prinsip dasar 0CM adalah linear 3lassi4ier, dan selan utnya dikembangkan agar dapat beker a pada problem non-linear dengan memasukkan konsep kernel tri3k pada ruang ker a berdimensi tinggi. Perkembangan ini memberikan rangsangan minat penelitian di bidang )attern re3o!nition untuk in7estigasi potensi kemampuan 0CM secara teoritis maupun dari segi aplikasi. 0aat ini 0CM telah berhasil diaplikasikan dalam masalah dunia nyata *real-@orl# )ro6lems,, dan secara umum memberikan solusi yang lebih baik dibandingkan metode kon7ensional seperti misalnya arti4i3ial neural net@ork -2/. Su))ort 8e3tor %a32ine *0CM, adalah salah satu metoda klasifikasi untuk mendapatkan optimal 2")er)lane yang memisahkan dua kelas berbeda pada ruang 7ektor. 9)timal 2")er)lane adalah 2")er)lane dengan arak ter auh dari kedua kelas tersebut. Pada permasalahan pemisahan secara linier, o)timal 2")er)lane dapat memisahkan dua kelas yang berbeda dan 7ektor-7ektor yang terdekat dengan o)timal 2")er)lane. !ata pada ruang in)ut dinotasikan sebagai 5i B # , sedangkan label yang menun ukkan kelas dari masing-masing data tersebut dinotasikan
kelas % dan kelas ". !imana pattern yang tergabung pada kelas % disimbolkan dengan bentuk kotak ber8arna merah, sedangkan )attern pada kelas " disimbolkan dengan bentuk lingkaran ber8arna hi au. Pada gambar % *a, menun ukan adanya beberapa alternatif garis pemisah *#is3rimination 6oun#aries, yang memisahkan )attern yang men adi anggota dari dua kelas yang berbeda. Adapun )attern yang berada pada bidang pembatas ini disebut su))ort ve3tor . Pada gambar % *b, diperlihatkan dua kelas dapat dipisahkan oleh sepasang bidang pembatas yang se a ar. 9idang pembatas pertama membatasi kelas pertama sehingga dihasilkan persamaan berikut: *%%, sedangkan bidang pembatas kedua membatasi kelas kedua sehingga dihasilkan persamaan berikut: (%",
@.5i + 6 % untuk y - -% i
@.5i + 6 +% untuk
yi
.%
!imana 8 adalah koefisien 7ektor @ei!2t dan b adalah bias. ;arak antara 7ektor trainin! 5i dan 2")er)lane disebut margin. !engan mengalikan b dan 8 dengan sebuah konstanta, akan dihasilkan nilai margin yang dikalikan dengan konstanta yang sama. Pada persamaan *%", merupakan s3allin! 3onstraint yang dapat dipenuhi dengan res3allin! b % dan 8. 0elain itu, karena memaksimalkan @
@ dan ika sama dengan meminimumkan kedua bidang pembatas pada persamaan *%", direpresentasikan dalam pertidaksamaan *%$,.
"
" i * 5i .@ + 6, % (, i
*%$, Maka pencarian bidang pemisah terbaik dengan nilai margin terbesar dapat dirumuskan men adi masalah optimasi konstrain, yaitu
min * @, =
@
% @ "
"
*%', dengan *%2, masalah ?ua#rati3 Pro!rammin! *FP, ini dapat dipecahkan dengan berbagai macam teknik komputasi dan salah satu di antaranya adalah menggunakan >a!ran!e %ulti)lier dengan persamaan :
" i * 5i .@ + 6, % (
min >* @, 6, , =
@,6
*a, *b, ?ambar % 0CM menemukan 2")er)lane terbaik yang memisahkan kelas % dan kelas " Pada gambar % diperlihatkan beberapa )attern yang merupakan anggota dari dua buah kelas yaitu
*%., !engan tambahan konstrain, Ei F + *nilai dari koefisien la!ran!e ,. !engan meminimumkan &p terhadap 8 dan b, maka dari
Seminar Nasional
ISSN: 1979 - ..
dengan data pelatihan 5i dipetakan ke ruang dimensi yang lebih tinggi menggunakan fungsi J dan ' sebagai parameter pinalti. Meminimisasi memaksimalkan "
i " i (
i =%
% *@i ,T @i "
berarti
*%#,
@ = i " i 5i
i =%
atau margin antara dua " @ kelompok data .Aetika data tidak terpisah secara linier, maka terdapat pinalti sebesar '
l 7
i 7
*%1, !imana Ei adalah >a!ran!e multi)liers, yang bernilai nol atau positif * Ei F + ,. Nilai optimal dari persamaan *%., dapat dihitung dengan meminimalkan & terhadap @ dan 6, dan memaksimalkan & terhadap Ei . !engan memperhatikan sifat bah8a pada titik optimal gradien & G (, persamaan *%B, dapat dimodifikasi sebagai maksimalisasi problem yang hanya mengandung Ei sa a, sebagaimana persamaan *"(,.
yang dapat mengurangi umlah error pelatihan.4de dari 0CM adalah menyeimbangkan regulasi
% *@i ,T @i "
dan
error
pelatihan.
0etelah
menyelesaikan permasalahan pada minimisasi, maka terdapat se umlah k fungsi keputusan. *"%, Aelas data 5akan ditentukan berdasarkan nilai fungsi keputusan yang tertinggi. @ntuk pencarian solusi minimisasi pada persamaan *"%, menggunakan Gua#rati3 )ro!rammin!. 3abel % Eontoh metode one a!ainst all "i D % "i D -% 6ipotesis 4 1*5/ D *@1/5 H Aelas % 9ukan kelas % 61 , 4 *5/ D *@,/5 H Aelas " 9ukan kelas " 6, & 4 *5/ D *@&/5 H Aelas $ 9ukan kelas $ 6& . 4 *5/ D *@./5 H Aelas ' 9ukan kelas ' 6.
4 % * 5, = *@% , 5 + 6%, . . . , 4 k * 5 , = *@ k , 5 + 6 k
i
i =%
*%B, dengan
i (*i = %,",..., l ,
"
i =% i
*"(, !ari hasil perhitungan tersebut diperoleh Ei dan data yang berkorelasi dengan Ei yang bernilai positif ditentukan sebagai su))ort ve3tor. $","# SVM One Against All untuk Multiclass Metode ini akan membangun se umlah k 0CM biner, dimana k adalah banyaknya kelas *6su, et.al., "((",. 0CM ke-i dilatih dengan seluruh sam)le pada kelas ke-i dengan label kelas positif dan seluruh sam)le lainnya dengan label kelas negatif. ;ika diberikan l data pelatihan *5i,"i,,H, n *5l,"l,, dengan 5 i > , i =%,..., l adalah kelas dari 5i, maka 0CM ke-i akan menyelesaikan permasalahan berikut :
(@ ) min "
%
@ i ,6 i ,
i
i T
@ i I E i7 @ i
7 =%
i
( )
i 7
?ambar " Metode klasifikasi 0CM one a!ainst all Pada gambar " terlihat terdapat empat fungsi keputusan, dari keempat fungsi keputusan diambil fungsi keputusan yang maksimal. +" Metode Penelitian untuk melakukan klasifikasi dari enis dan fase )lasmo#ium 4al3i)arum dan )lasmo#ium viva5 dari
( @ ) ( 5 ) I b
i T
% i7 , i4 y = i
( @ ) ( 5 ) I b
i T
i 7
(, 7 = %,......, l
citra medis preparat darah ditun ukkan dalam ?ambar $ Pada proses pembela aran, citra medis dari preparat darah adalah file-file yang masing-masing berukuran 2(52( )i5el yang diperoleh dari hasil segmentasi secara manual. Artinya, setelah file citra preparat darah terinfeksi parasit malaria yaitu citra ,viva5 t2ro)o:oit,viva5 s32i:ont, viva5 !ameto3"t diperoleh )u6li3 2ealt2 ima!e li6rar" *P64&, dari phil.cdc.go7, proses normalisasi seperti 3ro))in! dan resi:e untuk menyamakan dimensi citra dilakukan secara manual sehingga men adi citra tunggal.
0CM multikelas yang dibangun dengan cara menggabungkan beberapa klasifikasi biner. Metode pendekatan 0CM multikelas yang digunakan dalam penelitian ini adalah 0CM one a!ainst all*9 /. Pada proses klasifikasi pelatihan, 7ariabel 2")er)lane untuk setiap pengklasifikasi *3lassi4ier, yang didapat akan disimpan dan nantinya akan digunakan sebagai data tiap pengklasifikasi dalam proses pengu ian, dengan kata lain proses klasifikasi pelatihan adalah proses untuk mencari su))ort ve3tor, al)2a dan 6ias dari data in)ut pelatihan yang berupa 7ektor fitur dari citra viva5 t2ro)o:oit,viva5 s32i:ont, viva5 !ameto3"t *ti!a kelas/. 0edangkan pada proses pengu ian, data citra yang digunakan adalah data yang tidak diikutsertakan pada proses pelatihan. ;ika kelas yang dihasilkan dari proses klasifikasi pengu ian sama dengan kelas data sebenarnya, maka pengenalan dinyatakan benar.
?ambar $ 9lok diagram desain sistem Pada proses pembela aran, citra medis dari preparat darah adalah file-file yang masing-masing berukuran 2(52( )i5el yang diperoleh dari hasil segmentasi secara manual. Artinya, setelah file citra preparat darah terinfeksi parasit malaria yaitu citra 4m !a viva5 t2ro)o:oit,viva5 s32i:ont, viva5 !ameto3"t diperoleh )u6li3 2ealt2 ima!e li6rar" *P64&, dari phil.cdc.go7, proses normalisasi seperti 3ro))in! dan resi:e untuk menyamakan dimensi citra dilakukan secara manual sehingga men adi citra tunggal.
,"# Perco*aan Pengaruh /ange 0itur &istogram !erhadap &asil Klasifikasi Menggunakan Support Vector Machine One Against All
Seminar Nasional
ISSN: 1979 - ..
Pada gambar 2 ditun ukkan bah8a prosentase akurasi rata-rata terendah untuk kelas 4 sebesar #".#1), Aelas 44 sebesar 2%,.#) dan Aelas 444 sebesar 1(). 0edangkan prosentase akurasi ratarata yang tertinggi untuk @ntuk kelas 4 adalah 1#,#1) didapatkan saat menggunakan umlah ", $, ', 2, ., #, 1, B, %(, %%, %", %$, %', dan %2. @ntuk kelas 44 adalah B( ) didapatkan saat menggunakan umlah ", $, ', 2, ., #, 1, B, %(, %%, %",dan %$. !an @ntuk kelas 444 adalah 1','') didapatkan saat menggunakan umlah ", $, ', 2, ., #, 1, B, %(, %%, %", %$, %', dan %2.
?ambar 2 ?rafik >ata-rata Akurasi per kelas svm one vs all Pada gambar . ditun ukkan bah8a prosentase akurasi multi kelas untuk masing-masing tahap pengu ian *kelompok data pengu ian, yang terendah didapatkan pada saat histogram menggunakan range fitur dua. Prosentase akurasi multi kelas terendah pada pengu ian tahap % sebesar $2), pengu ian tahap " sebesar "2), pengu ian tahap $ sebesar "1,$$), 0edangkan prosentase akurasi multi kelas yang tertinggi pada pengu ian tahap % adalah .2) didapatkan saat menggunakan umlah range fitur ", $, ', 2, ., #, 1, B, %(, %%, %", %$, dan %'. Pada pengu ian tahap " adalah ..,.# ) didapatkan saat menggunakan umlah range fitur ", $, ', 2, ., #, 1, B, %(, %%, %", %$, %' dan %2 . Pada pengu ian tahap $ adalah 1%,$2 ) didapatkan saat menggunakan umlah range fitur ", $, ', 2, ., #, 1, B, %(, %%, %", %$, %' dan %2.
?ambar . ?rafik akurasi multi kelas svm one vs all untuk setiap tahapan pengu ian