Anda di halaman 1dari 10

Journal Speed – Sentra Penelitian Engineering dan Edukasi – Volume 12 No 1 – Februari 2020 speed.web.

id

PENERAPAN PARTICLE SWARM OPTIMIZATION(PSO) DALAMPEMILIHAN


ATRIBUT UNTUK MENINGKATKAN AKURASI PREDIKSI
DIAGNOSISPENYAKIT HEPATITIS
DENGAN METODE NAIVE BAYES

Tya Septiani Nurfauzia Koeswara1) M. Sukrisno Mardiyanto2) Muhamad Abdul


Ghani3)
1,3)
Sistem Informasi, Universitas Bina Sarana Informatika
2)
Teknik Elektro dan Informatika, Institut Teknologi Bandung (ITB)
tya.tsf@bsi.ac.id, sukrisno@informatika.org, muhamad.mag@bsi.ac.id

Abstract-Hepatitis is a major cause of death among all infectious diseases, and become a public health
problem in developing countries in the world, including Indonesia which ranks second among the WHO
South East Asian Region member countries with the number 2 person with Hepatitis B after Myanmar
(WHO, 2017). Hepatitis includes chronic diseases, when the patient is infected, the condition is still
healthy and has not shown typical symptoms and signs, but the transmission continues. Then there
needs to be early treatment to reduce cases of hepatitis, one of them is by making an accurate hepatitis
diagnosis system. In this research, naive bayes optimization was carried out using particle swarm
optimization which was applied to patient data with 2 classes, namely positive hepatitis and negative
hepatitis in Al-Mulk Hospital Sukabumi City. After testing, the accuracy value for the Naive Bayes
algorithm model is 86.52% with AUC value 0.860 and the accuracy value of the Naive Bayes model with
attribute selection using Particle Swarm Optimization is 91.67% with AUC 0.895. Based on this value,
the accuracy difference was 5.15% and the difference in AUC was 0.035.
Keyword: Hepatitis, Naive Bayes, Particle Swarm Optimazation.

Abstrak-Hepatitis adalah penyebab utama kematian di antara semua penyakit menular, dan menjadi
masalah kesehatan masyarakat di negara-negara berkembang di dunia, termasuk Indonesia yang
menempati peringkat kedua di antara negara-negara anggota WHO Kawasan Asia Tenggara dengan
orang nomor 2 dengan Hepatitis B setelah Myanmar ( WHO, 2017). Hepatitis termasuk penyakit kronis,
ketika pasien terinfeksi, kondisinya masih sehat dan belum menunjukkan gejala dan tanda yang khas,
tetapi penularannya berlanjut. Maka perlu ada pendeteksian lebih dini untuk mengurangi kasus
hepatitis, salah satunya adalah dengan membuat sistem diagnosis hepatitis yang akurat. Dalam
penelitian ini, optimasi naive bayes dilakukan dengan menggunakan optimasi partikel swarm yang
diterapkan pada data pasien dengan 2 kelas, yaitu hepatitis positif dan hepatitis negatif di Rumah Sakit
Al-Mulk Kota Sukabumi Kota. Setelah pengujian, nilai akurasi untuk model algoritma Naive Bayes
adalah 86,52% dengan nilai AUC 0,860 dan nilai akurasi model Naive Bayes dengan pemilihan atribut
menggunakan Particle Swarm Optimization adalah 91,67% dengan AUC 0,895. Berdasarkan nilai ini,
perbedaan akurasi adalah 5,15% dan perbedaan dalam AUC adalah 0,035.
Kata Kunci : Hepatitis, Naive Bayes, Particle Swarm Optimazation.

PENDAHULUAN Hati sebagai pusat metabolisme tubuh, berfungsi


Hati merupakan salah satu organ yang cukup menerima semua darah yang datang dari usus
besar dan penting pada tubuh kita.Bagian yang melalui vena porta dan akan menyimpan dan
penting pada hati terdiri dari hepatosit, yang mengubah bahan-bahan makanan yang diterima
merupakan sel epitel dengan konfigurasi yang unik vena porta. Hati juga memproduksi empedu yang
[1].Sebagai organ intestinal terbesar, hati memiliki disimpan dalam kantong empedu dan akan
berat antara 1,2 sampai 1,8 kg atau kurang lebih 25% dikeluarkan bila diperlukan [3]. Hati juga berperan
berat badan orang dewasa yang menempati dalam mempertahankan hidup manusia [2], bila hati
sebagian besar kuadran kanan atas abdomen [2]. terganggu fungsi normalnya maka akan terjadi
gangguan metabolisme tubuh dan timbul berbagai
ISSN : 1979-9330 (Print) - 2088-0154 (Online) 1
Journal Speed – Sentra Penelitian Engineering dan Edukasi – Volume 12 No 1 – Februari 2020 speed.web.id

gejala penyakit [3], salah satu jenis penyakit yang kesehatan berdasarkan gejala-gejala yang ada,
menyerang organ hati adalah hepatitis. menunjukan peningkatan 2 kali lipat apabila
Hepatitis yaitu adanya suatu peradangan yang dibandingkan dari data tahun 2007 dan 2013.
dapat melukai bagian organ hati manusia.Penyakit
ini yang sangat berbahaya karena adanya organ
yang dapat merusak pada kesehatan tubuh secara
menyeluruh [4] disebabkan karena adanya
penolakan darah yang mengalir sehingga tekanan
darah menjadi tinggi dan pecahnya pembuluh darah
[5]. Hepatitis banyak ditemukan di dunia dan
dianggap sebagai persoalan kesehatan
masyarakat yang harus diselesaikan (Infodatin, Sumber: Riskesdas Tahun 2007 dan Riskesdas Tahun 2013,
2014) karena dapat menimbulkan kematian 1-2 juta Balitbangkes, Kemenkes
orang setiap tahunnya [6].Hepatitis biasanya Gambar 1.Prevalensi Hepatitis Menurut Provinsi
berhubungan dengan perilaku hidup bersih dan Tahun 2007 dan 2013
sehat karena disebabkan oleh infeksi (virus, bakteri,
parasit) yang berasal dari lingkungan yang kurang Dari data diatas bisa dilihat bahwa perlu adanya
bersih dan makanan serta minuman yang kurang penanganan dini sebelum penderita penyakit
bersih pula.Selain itu, bisa juga disebabkan oleh hepatitis bertambah parah. Salah satu caranya
obat-obatan, konsumsi alkohol maupun lemak yang adalah dengan melakukan pemeriksaan sejak awal,
berlebih [7].Penyakit hepatitis mudah menular karena itu perlu dibuat sebuah sistem diagnosis
melalui virus yang dapat membuat penderita demam yang dapat membantu penderita dalam melakukan
[4]. pemeriksaan [11].Saat ini perkembangan teknologi
Hepatitis biasanya dikategorikan sebagai informasi telah merambah ke bidang kesehatan dan
penyakit yang akut dan kronis. Masa penderita mengalami kemajuan yang sangat pesat [12].Dunia
penyakit hepatitis akut biasanya sangat singkat tidak kesehatan memerlukan pengambilan keputusan
akan berlangsung dalam waktu yang lama dan bisa yang efektif dan akurat dalam prediksi suatu penyakit
sembuh dalam beberapa minggu tanpa efek yang [1] dengan tantangan yang harus dihadapi adalah
berkelanjutan. Sedangkan penderita penyakit mendiagnosa pasien dengan benar [6]. Melalui
hepatitis kronis akan berlangsung dalam waktu yang pemanfaatan teknologi, sistem diagnosis otomatis
sangat lama [4]. Berkaitan dengan virus yang secara medis akan sangat bermanfaat dan dapat
menyerang dan kondisi penyakit, hepatitis membantu dalam mencapai pengujian klinis
digolongkan sebagai berikut: Hepatitis A (Hepatitis dengan biaya yang terjangkau [8].
Infeksi), Hepatitis B (Hepatitis Serum), Hepatitis C Selain sistem pakar, kehadiran cabang ilmu
(Hepatitis Non-A/NonB), Hepatitis D (Hepatitis baru di bidang komputer data mining tak luput
Delta), Hepatitis E (Hepatitis Enterik), Hepatitis F,
perhatian dalam dunia sistem informasi
Hepatitis G dan Hepatitis Kronis [8]. kesehatan.Data mining merupakan langkah penting
Hepatitis menjadi permasalahan kesehatan dalam penemuan pengetahuan dari serangkaian
masyarakat di negara berkembang di dunia, dataset dalam ukuran yang besar [1].Data Mining
termasuk di Indonesia [9]. Indonesia merupakan adalah serangka dan dihasilkan informasi yang lebih
negara dengan pengidap Hepatitis B nomor 2 berguna, disiplin ilmu ini mengkaji berbagai metode
terbesar sesudah Myanmar diantara negara- yang umum digunakan untuk melakukan pengolahan
negara anggota WHO South East Asian Region data, salah satu metode pengolahan dalam
[10]. Berdasarkan hasil Riset Kesehatan prosesnya adalah klasifikasi data. Klasifikasi data
Dasar(Riskesdas), studi dan uji saring darah donor biasa digunakan pada sejumlah data yang telah di
PMI maka diperkirakan diantara 100 orang ketahui data induknya, untuk kemudian dijadikan
Indonesia, 10 diantaranya telah terinfeksi Hepatitis B data training/data model yang hasilnya akan menjadi
atau C. Sehingga saat ini diperkirakan terdapat 28 keputusan prediksi dari sejumlah data yang serupa
juta penduduk Indonesia yang terinfeksi Hepatitis B namun belum lengkap pada salah satu atributnya
dan C, 14 juta diantaranya berpotensi untuk menjadi [13]. Sudah banyak literatur mengenai pembahasan
kronis, dan dari yang kronis tersebut 1,4 juta orang prediksi hepatitis yang menerapkan beberapa
berpotensi untuk menderita kanker hati. Besaran metode [14], diantaranya:
masalah tersebut tentunya akan berdampak sangat a. T. Karthikeyan dan P. Thangaraju (2013)
besar tehadap masalah kesehatan masyarakat, melakukan komparasi Naive Bayes,
produktifitas, umur harapan hidup, dan dampak Randomforest, JF8 dan Multi Layer Percepton.
sosial ekonomi lainnya[7]. Terbukti dari hasil
b. Wisti Dwi Septiani (2014) menerapkan algoritma
Riskesdas tahun 2013 jumlah orang yang C4.5 kemudian melakukan pengembangan
didiagnosis Hepatitis di fasilitas pelayanan
ISSN : 1979-9330 (Print) - 2088-0154 (Online) 2
Journal Speed – Sentra Penelitian Engineering dan Edukasi – Volume 12 No 1 – Februari 2020 speed.web.id

(2017) dengan komparasi Algoritma C4.5 dan Hepatitis berasal dari dua kata, yaitu hepa
Naive Bayes. (hepair/hati) dan itis (radang).Hepatitis merupakan
c. C. Bharat Kumar dkk (2014) menerapkan radang yang terjadi pada organ hati.Dalam
metode Support Vector Machine. masyarakat, penyakit radang hati juga dikenal
d. Eka Wulansari Fridayanthie (2015) menerapkan dengan istilah lever.Padahal lever berasal dari
metode Naive Bayes dan Support Vector bahasa Belanda yang berarti organ hati bukan
Machine. penyakit hati.Berdasarkan penyebabnya, hepatitis
e. Jefri Latu Handarko dan Alamsyah (2015) dibedakan menjadi dua kelompok, yaitu hepatitis
melakukan implementasi menggunakan Fuzzy virus, peradangan yang disebabkan oleh infeksi virus
Decision Tree. dan hepatitis non-virus, peradangan hati yang
f. Wati Erawati (2015) menggunakan model disebabkan oleh bahan-bahan kimia dan obat-
algoritma Neural Network. obatan [17].Jenis virus penyebab hepatitis mirip
g. Divya Tomar dan Sonali Agarwal (2015) dengan gejala klinis, perbedaannya hanya dalam
menerapkan metode Weight Least Squares Twin kekebalan (imunologi) dan epidemiologi dan
Support Vector Machines (WLTSVM). beberapa gejala atau keluhan yang khas untuk
h. Raudlatul Munawaroh dkk (2016) menerapkan masing-masing jenis hepatitis [21].Tingkat
metode Support Vector Machine. keparahannya pun bervariasi, mulai dari sembuh
i. Lis Saumi Ramdhani (2016) menerapkan sendiri secara total, kondisi mengancam jiwa,
Particle Swarm Optimization (PSO) dengan menjadi penyakit menahun sampai kondisi
Metode Algoritma C4.5. kegagalan hati [20].
Virus hepatitis seperti fenomena gunung es,
Dari beberapa penelitian yang telah dilakukan, dimana pernderita yang tercatat atau yang datang ke
penggunaan metode Naive Bayes dapat layanan kesehatan lebih sedikit dari jumlah penderita
menghasilkan nilai akurasi yang tergolong tinggi sesungguhnya.Hepatitis termasuk penyakit kronis
dengan kecepatan komputasi yang relatif cepat saat yang menahun, dimana pada saat orang tersebut
digunakan data berdimensi besar [15] dan menjadi telah terinfeksi, kondisi masih sehat dan belum
pilihan metode yang baik untuk klasifikasi data menunjukan gejala dan tanda yang khas, tetapi
hepatitis [16]. Untuk pengembangan penelitian, penularannya terus berjalan [22].
maka akan dilakukan penerapan metode Naive
Bayes dipadukan dengan optimasi Particle Swarm Tabel 1.Prevalensi Hepatitis Menurut Karakteristik di
Optimization (PSO) yang akan digunakan untuk Indonesia Tahun 2013
seleksi atribut agar meningkatkan akurasi dalam Karakteristik Prevalensi
memprediksi penyakit hepatitis. Hepatitis
Kelompok umur (tahun)
LANDASAN/KERANGKA PEMIKIRAN <1 0,5
A. Hepatitis 1-4 0,8
Hati dikenal dengan namalever dalam bahasa 5-14 1,0
Belanda atau hepar dalam istilah kedokteran. Hati 15-24 1,1
adalah organ terbesar di dalam tubuh yang terletak 25-34 1,3
di sebelah kanan atas rongga perut, tepat dibawah 35-44 1,3
diafragma (sekat yang membatasi daerah dada dan 45-54 1,4
perut). Bentuk hati seperti prisma segitiga dengan 55-64 1,3
sudut siku-sikunya membulat, beratnya sekitar 1,25 65-74 1,4
sampai 1,5 kg dengan berat jenis 1,05. Hati >75 1,3
merupakan organ yang lunak, kenyal tetapi juga Jenis Kelamin
rapuh, permukaannya licin, berwarna coklat Laki-laki 1,3
kemerahan dan dilintasi oleh berbagai pembuluh Perempuan 1,1
darah [17].Hati berfungsi sebagai organ pembentuk Pekerjaan
protein, faktor pembekuan darah, lemak dan Tidak Bekerja 1,1
karbohidrat (glokusa).Tekstur hati yang rusak tentu Pegawai 1,0
menurunkan produksi zat-zat tersebut Wiraswasta 1,2
[18].Terganggunya fungsi hati menyebabkan Petani/Nelayan/Buruh 1,6
gangguan sistem organ lainnya [19] termasuk Sumber : Riskesdas Tahun 2013, Balitbangkes, Kemenkes
timbulnya penyakit, salah satunya penyakit
hepatitis.Orang yang menderita hepatitis, organ Berdasarkan tabel 2.1.terlihat karakteristik
hatinya sedang dalam keadaan tidak sehat alias sakit prevalensi hepatitis tertinggi pada kelompok umur
[20]. 45-54 dan 65-74 (1,4%). Penderita penyakit hepatitis
baik laki-laki maupun perempuan, proporsinya tidak
ISSN : 1979-9330 (Print) - 2088-0154 (Online) 3
Journal Speed – Sentra Penelitian Engineering dan Edukasi – Volume 12 No 1 – Februari 2020 speed.web.id

berbeda secara bermakna. Jenis pekerjaan juga C. Naive Bayes


memperngaruhi prevalensi hepatitis, penderita Naive bayes adalah salah satu algoritma yang
hepatitis banyak ditemukan pada ditemukan dalam teknik klasifikasi dengan metode
petani/nelayan/buruh dibandingkan jenis pekerjaan probabilitas dan statistik yang mudah diaplikasikan
yang lain. [27].Bayes dapat digunakan untuk memprediksi
probabilitas keanggotaan suatu class [28] dan dapat
B. Knowledge Discovery in Database (KDD) menghasilkan nilai akurasi yang tinggi dengan
Data Mining sering juga disebut dengan kecepatan waktu yang baik saat diaplikasikan ke
Knowledge Discovery in Database atau disingkat dalam database dengan data yang besar [29] karena
KDD, yaitu kegiatan yang meliputi pengumpulan, fitur-fitur didalamnya dapat bekerja secara
pemakaian data histori untuk menelusuri data yang independen [23].Klasifikasi Bayes didasarkan pada
ada untuk membangun sebuah model agar dapat teorema Bayes, diambil dari nama seorang ahli
mengenali pola data yang lain berukuran besar matematika yang juga menteri Prebysterian Inggris,
[23].Data Mining juga dapat didefinisikan sebagai Thomas Bayes (1702-1761), yaitu [23]:
sebuah proses untuk menemukan hubungan, pola P(x|y) = P(y|x) P(x)
dan tren baru yang bermakna dengan menyaring P(y)
data yang sangat besar, yang tersimpan dalam Keterangan:
penyimpanan, menggunakan teknik pengenalan pola y = data dengan kelas yang belum diketahui
seperti teknik Statistik dan Matematika x =hipotesis data y merupakan suatu kelas
[24].Sebenarnya kedua istilah tersebut memiliki spesifik
konsep yang berbeda, tetapi berkaitan satu sama P(x|y) = probabilitas hipotesis x berdasarkan
lain dan salah satu tahapan dalam keseluruhan KDD kondisi y
adalah Data Mining[25]. P(x) = probabilitas hipotesis x
P(y|x) = probabilitas y berdasarkan kondisi pada
hipotesis x
P(y) = probabilitas dari y

D. Particle Swarm Optimization (PSO)


Dalam bukunya yang berjudul Jaringan Saraf
Tiruan dan Pemrograman menggunakan Matlab,
Jong Jek Siang (2009) menyebutkan bahwa Particle
Swarm Optimization (PSO) diperkenalkan oleh Dr.
Eberhart dan Dr. Kennedy pada tahun 1995,
merupakan algoritma optimasi yang meniru proses
Sumber: (Maimon & Rokach, 2010 p.3) yang terjadi dalam kehidupan populasi burung (flock
Gambar 2.Tahapan Proses Knowladge Discovery in of bird) dan ikan (school of fish) dalam bertahan
Database hidup. Sejak diperkenalkan pertama kali, algoritma
PSO berkembang cukup pesat, baik dari sisi aplikasi
maupun dari sisi pengembangan metode yang
Dalam proses Data Mining terdapat upaya
digunakan pada algoritma tersebut[30].Algoritma
standarisasi, yang disebut metodologi CRISP-DM.
PSO adalah sebuah populasi yang didasarkan
Ada enam fase yang saling berhubungan untuk
penelusuran inisialisasi partikel secara random dan
menggambarkan proses Data Mining yaitu: bussines
adanya interaksi diantara partikel dalam populasi.Di
understanding, data understanding, data
dalam PSO setiap partikel bergerak melalui ruang
preparation, modelling, evaluation, dan deployment
solusi dan mempunyai kemampuan untuk mengingat
[26].
posisi terbaik sebelumnya dan dapat bertahan dari
generasi ke generasi [31].

E. Validasi (K-Fold Cross Validation)


Validasi digunakan untuk memperoleh prediksi
menggunakan model yang ada dan kemudian
membandingkan hasil tersebut dengan hasil yang
sudah diketahui, ini mewakili langkah paling penting
dalam proses membangun sebuah model [32].
Sumber: (Maimon & Rocakh, 2010 p.1032)
Gambar 3.Proses CRISP-DM F. Metode Evaluasi Confusion Matrix

ISSN : 1979-9330 (Print) - 2088-0154 (Online) 4


Journal Speed – Sentra Penelitian Engineering dan Edukasi – Volume 12 No 1 – Februari 2020 speed.web.id

Confusion Matrix [33] adalah metode evaluasi


model klasifikasi berdasarkan perhitungan objek
testing, dimana data hasil prediksi ada diantara dua
kelas (mislabeling) yaitu menghasilkan kelas positif
dan kelas negatif.

Tabel 2. Model Confusion Matrix


Assigned class
Actual Classs

Positive
Positive
FN
Positive TP
TN
Negative FP
Sumber: G.I. Webb. 2017, p.260 Gambar 4.Kerangka Pemikiran
Pada tahap evaluasi menggunakan confusion matrix HASIL DAN PEMBAHASAN
yang dilakukan menggunakan tool RapidMiner akan
Tahap pertama yang dilakukan adalah
diperoleh nilai accuracy, sensitivity, specificity, PPV
mengumpulkan data primer dari RSUD Al-Mulk Kota
dan NPV.
Sukabumi berdasarkan hasil lab dengan jumlah 119
orang yang terdiri dari 101 pasien positif dan 18
G. Metode Evaluasi ROC Curve pasien negatif hepatitis untuk diseleksi berdasarkan
Kurva ROC (Receiver Operating Characteristic) 12 atribut predictor dan 1 atribut hasil.
adalah cara lain untuk mengevaluasi akurasi dari
klasifikasi secara visual[34]. Secara teknik, kurva
Tabel 3.Atribut dan Nilai Kategori dalam
ROC juga disebut grafik ROC, grafik ROC terdiri dari
Memprediksi Penyakit Hepatitis
dua dimensi grafik yaitu TP rate diletakan pada Atribut Nilai Range Sumber
sumbu Y, sedangkan FP rate diletakan pada sumbu
1-4 1-4
X. 5-14 5-14
15-24 15-24 (Kemente
METODOLOGI PENELITIAN 25-34 25-34 rianKeseh
Jenis Penelitian Umur 35-44 35-44
atan RI,
Dua pendekatan utama yang digunakan dalam 45-54 45-54
55-64 55-64 2014)
penelitian ini yaitu pendekatan kualitatif dan
65-74 65-74
pendekatan kuantitatif.Pendekatan kualitatif >75 >75
merupakan penelitian ilmiah yang mempelajari Peremp Peremp
Jenis
kondisi dan proses, secara umum dilakukan dengan uan uan
melakukan interview dan wawancara yang Kelamin Laki-
Laki-laki
Laki
mendalam terhadap seorang maupun kelompok Rendah <5 www.hepatitiscentral.co
yang berkaitan dengan objek penelitian, sedangkan Enzim Hati Normal 5-40
penelitian kuantitatif mengacu pada kerangka m
Tinggi >40
penelitian yang akan digunakan dengan menjelaskan Ya Ya (Risa Helilintar et.al,
Kelelahan
proses bagaimana pertanyaan penelitian akan Tidak Tidak 2017)
diperoleh jawabannya dan harus memberikan Lemah, (Fenny Sinaga, 2017),
definisi konseptual sementara. Penelitian kuantitatif Ya Ya
Letih, Lesu, (C. Bharat Kumar et.al,
pada gilirannya akan sangat mengandalkan bantuan
statistik dan pemodelan kualitatif. Tujuan Sakit Tidak Tidak 2014)
digunakannya model tersebut untuk memprediksi (Fenny Sinaga, 2017),
Gangguan Ya Ya
penyakit hepatitis menggunakan algoritma Naive (Ahmad Ramdhani et.al,
Bayes dan Particle Swarm Optimazation (PSO) yang Pola Makan
Tidak Tidak 2015)
akan digunakan untuk optimasi seleksi atribut
dengan langkah-langkah yang disajikan dalam (Risa Helilintar et.al,
Ya Ya
kerangka pemikiran (Gambar 3.1) sebagai berikut: Pembengka 2017),
kan Limpa (Ahmad Ramdhani et.al,
Tidak Tidak
2015)

Ya Ya

ISSN : 1979-9330 (Print) - 2088-0154 (Online) 5


Journal Speed – Sentra Penelitian Engineering dan Edukasi – Volume 12 No 1 – Februari 2020 speed.web.id

Titik (C. Bharat Kumar et.al,


Serabut 2014) Gambar 5. Desain Model Naïve Bayes
Tidak Tidak
Pembuluh Sehingga jika model tersebut dijalankan maka akan
Darah didapatkan hasil seperti gambar 4.2. dibawah ini:
Penumpuka Ya Ya (C. Bharat Kumar et.al,
n Cairan Tidak Tidak 2014)
www.hepatitiscentral.co
Perubahan Normal <=1.10 m
Warna Kulit, (Ahmad Ramdhani et.al,
Mata, Urin 2015),
dan Feses >1.10- (Latifatul Khairiah et.al,
Tinggi
3.00
2017)
www.hepatitiscentral.co
Rendah <3.5
Kadar m, Gambar 6.Hasil Probabilitas dengan RapidMiner
Protein Normal 3.5-5.0 (C. Bharat Kumar et.al,

Tinggi >5.0 2014) A. Evaluasi Model Algoritma Naive Bayes


dengan Confucion Matrix
Waktu Normal <14 (Dugdale, 2013),
Pembekuan (C. Bharat Kumar et.al, Tabel 4.Confusion Matrix Metode Naive Bayes
Darah Tinggi >15 2014)

Eksperimen dan Pengujian Model Naive Bayes


Pembuatan model Naive Bayes dilakukan pada
Berdasarkan tabel diatas terdapat rincian jumlah
dataset yang terdiri dari 12 atribut yang merupakan
True Positive (TP) 92, False Negative (FN) 9, False
atribut dari diagnosis penyakit hepatitis dan class
Positive (FP) adalah 9 dan True Negative (TN) 9.Dari
yang merupakan hasil akhir prediksi. Data kemudian
data tersebut maka dapat dihitung nilai accuracy,
di validasi agar proses pelatihan dapat berjalan
sensitvity, specifity, PPV dan NPV. Data hasil olahan
dengan cepat dan mampu digunakan untuk dapat dilihat pada tabel dibawah ini:
melakukan pelatihan. Langkah awal dalam
mengimplementasikan model Naive Bayes terlebih
dahulu kita mencari probabilitas hipotesis untuk Tabel 5.Nilai Accuracy, Sensitivity, Specificity, PPV
masing-masing Kelas P(H). Hipotesis yang ada yaitu dan NPVNaive Bayes
Nilai
pasien positif hepatitis dan pasien negatif hepatitis Accuracy 0,848
sebanyak 119 record. Perhitungan probabilitas yaitu Sensitivity 0,910
seperti ini: Specificity 0,5
P(X|Ya) = 101 : 119 = 0,84873 PPV 0,910
P(X|Tidak)= 18 : 119 = 0,15126 NVP 0,5
Perhitungan diatas dapat dibuatkan model Naïve
92+9
Bayes dengan Framework Rapidminer Studio versi Accuracy = = 0,848
92+9+9+9
8.2.1 yaitu seperti terlihat pada gambar 4.1: 92
Sensitivity = 92+9 = 0,910
9
Specificity = 9+9 = 0,5
92
PPV = 92+9 = 0,910
9
NPV = 9+9 = 0,5
B. Evaluasi Model Algoritma Naive Bayes
dengan ROC Curve

ISSN : 1979-9330 (Print) - 2088-0154 (Online) 6


Journal Speed – Sentra Penelitian Engineering dan Edukasi – Volume 12 No 1 – Februari 2020 speed.web.id

Tabel 7.Nilai Accuracy, Sensitivity, Specificity, PPV


dan NPV Naive Bayes dan PSO
Nilai
Accuracy 0,924
Sensitivity 0,942
Specificity 0,8
PPV 0,970
NPV 0,666

98+12
Accuracy = = 0,924
98+12+3+6
98
Sensitivity = 98+6 = 0,942
12
Specificity = 12+3 = 0,8
98
PPV = 98+3 = 0,970
12
NPV = = 0,666
Gambar 7. Nilai AUC Naive Bayes dalam grafik 12+6
ROC
Berdasarkan nilai AUC sebesar 0,894 yang
ditunjukan gambar di atas maka akurasi memiliki
tingkat Good Classification.

Evaluasi Model Algoritma Naive Bayes dan PSO


Eksperimen dan Pengujian Model Naive Bayes dengan ROC Curve
Perhitungan pada keseluruhan data dilakukan
dengan RapidMiner, model yang terbentuk dengan
algoritma Naive Bayes sendiri akan dibandingkan
dengan model yang terbentuk setelah proses
pembobotan attribut. Nilai bobot attribut akan
diberikan kepada oleh setiap partikel PSO. Model
yang terbentuk akan diuji sehingga dapat diketahui
akurasi model yang terbentuk, setelah itu partikel
PSO akan bergerak ke arah partikel terbaik agar
akurasi model yang dihasilkan dapat lebih tinggi dari
sebelumnya. Atribut yang terseleksi dari 12 atribut
menjadi 4 atribut, yang terdiri dari: Jenis Kelamin,
Lemah-Letih-Lesu, Titik Serabut Pembuluh Darah
dan Perubahan Warna Kulit-Mata-Urin-Feses.

Evaluasi Model Algoritma Naive Bayesdan Gambar 8. Nilai AUC Naive Bayesdan PSO
Particle Swarm Optimization dengan Confucion dalam grafik ROC
Matrix Berdasarkan nilai AUC sebesar 0,941 yang
ditunjukan gmabar di atas maka akurasi memiliki
Tabel 6.Confusion Matrix Metode Naive Bayesdan tingkat Excellent Classification.
PSO
Komparasi Model Naive Bayes dengan Naive
Bayes dan Particle Swarm Optimization
Hasil pengujian menyimpulkan bahwa Atribut
yang mempengaruhi pengujian adalah 12 atribut.
Hasil pengujian model Naive Bayes tanpa seleksi
Berdasarkan tabel diatas dari data testing terdapat atribut dibandingkan dengan model Naive Bayes
rincian jumlah True Positive (TP) 98, False Negative dengan seleksi atribut menggunakan Particle Swarm
(FN) 6, False Positive (FP) adalah 3 dan True Optimization dapat dilihat pada tabel berikut:
Negative (TN) 12.Dari data tersebut maka dapat
dihitung nilai accuracy, sensitvity, specifity dan NPV. Tabel 8. Pengujian Algoritma klasifikasi
Data hasil olahan dapat dilihat pada tabel di bawah: Naive Bayes dan Particle Swarm Optimization -
Naive Bayes
ISSN : 1979-9330 (Print) - 2088-0154 (Online) 7
Journal Speed – Sentra Penelitian Engineering dan Edukasi – Volume 12 No 1 – Februari 2020 speed.web.id

Accuracy AUC
Naive Bayes 84,85% 0.894 Gambar 10.Hasil Pengujian Aplikasi Model
Naive Bayes& PSO
PSO-Naive 92,50% 0.941
Bayes KESIMPULAN
Dari hasil pengujian diatas, dengan dilakukan
evaluasi baik secara confusion matrix maupun ROC Berdasarkan hasil penelitian tersebut, maka
curve terbukti bahwa pengujian yang dilakukan diperoleh nilai akurasi algoritma Naive Bayes senilai
Optimasi Naive Bayes menggunakan Particle Swarm 84,85%, sedangkan untuk nilai akurasi Optimasi
Optimization memiliki nilai akurasi yang lebih tinggi Naive Bayes menggunakan PSO sebesar 92,50%
dibanding hanya menggunakan Naive Bayes. Nilai sehingga tampak selisih nilai akurasi yaitu sebesar
akurasi untuk model algoritma Naive Bayes sebesar 7,65%. Sedangkan evaluasi menggunakan ROC
84,85% dengan nilai AUC 0,894 dan nilai akurasi curve diperoleh hasil untuk algoritma Naive Bayes
model Naive Bayes dengan seleksi atribut bernilai 0,894 dengan tingkat diagnosa Good
menggunakan Particle Swarm Optimization sebesar Classification dan Optimasi Naive Bayes
92,50% dengan AUC 0,941. Berdasarkan nilai menggunakan PSO bernilai 0,941 dengan tingkat
tersebut diperoleh selisih akurasi sebesar 7,65% dan diagnosa Excellent Classification, didapatkan selisih
selisih AUC sebesar 0,047. nilai AUC sebesar 0,047. Sehingga dapat
disimpulkan bahwa penerapan teknik optimasi
Particle Swarm Optimization mampu menyeleksi
Pengembangan Aplikasi Model dari Naive Bayes atribut pada Naive Bayes dan menghasilkan tingkat
dan Particle Swarm Optimization akurasi diagnosis penyakit hepatitis yang lebih baik
Berdasarkan hasil eksperimen didapatkan dibanding dengan menggunakan metode individual
model terbaik dari metode Naive Bayes dan Naive Naive Bayes.
Bayes dan Particle Swarm Optimization, yang Untuk penelitian selanjutnya lebih dikembangkan
dikembangkan menjadi sebuah aplikasi. lagi dengan menggunakan metode seleksi atribut
yang lain seperti chi-square, forward selection,
backward elimination dan sebagainya untuk
ketepatan penyeleksian atribut, kemudian lakukan
komparasi dengan menggunakan pengujian metode
yang sama untuk dataset public sebagai data
sekunder dan data hasil riset sebagai data primer
dengan menggunakan metode optimasi lain seperti:
Ant Colony Optimization (ACO), Genetik Algorithm
(GA).

DAFTAR PUSTAKA
[1] Erawati, Wati. (2015). Prediksi Penyakit Hati
Menggunakan Model Algoritma Neural Network.
Jurnal Techno Nusa Mandiri Vol. 12 No. 2,
September 2015.
[2] Setiati, Siti. (2014). Buku Ajar Ilmu Penyakit
Dalam. Jakarta: Interna Publishing.
[3] Khairiah, Latifatul, Tursina dan Tedy Rismawan.
(2017). Sistem Pakar Diagnosis Penyakit Hati
dengan Metode Dempster Shafer Berbasis
Android. Jurnal Coding Sistem Komputer Untan
Vol. 5 No. 2 Hal. 57-66 ISSN : 2338-493X
[4] Sinaga, Ferry. (2017). Diagnosa Penyakit
Hepatitis Menggunakan Aplikasi Jaringan Saraf
Tiruan dengan Menggunakan Metode
Gambar 9.Pengujian Aplikasi Model Naive Bayes& Perception. Majalah Ilmiah INTI Vol. 12 No. 1
PSO Januari 2017 ISSN: 2339-210X.
[5] Ramdhani, Ahmad, R. Rizal Isnanto dan Ike
Pertiwi Windasari. (2015). Pengembangan
Sistem Pakar untuk Diagnosis Penyakit
Hepatitis Berbasis Web Menggunakan Metode
Certainty Factor. Jurnal Teknologi dan Sistem
ISSN : 1979-9330 (Print) - 2088-0154 (Online) 8
Journal Speed – Sentra Penelitian Engineering dan Edukasi – Volume 12 No 1 – Februari 2020 speed.web.id

Komputer Vol. 3 No. 1 Januari 2015 e-ISSN: [18] Cahyono, J.B. Suharjo B. (2010). Hepatitis B.
2338-0403. Yogyakarta: Kanisius.
[6] Saputra, Suranto. (2017). Komparasi Algoritma [19] Furqonita, Deswati. (2008). Seri IPA Biologi.
Berbasis Neural Network dalam Mendeteksi Jakarta: Quadra.
Penyakit Hepatitis. Factor Exacta Vol. 10 No. 1 [20] Waluyo, Srikandi dan Budhi, M.P.s (2011). 100
Hal 40-49 p-ISSN: 1979-276X e-ISSN: 2502- Question & Answers: Hepatitis. Jakarta: PT. Elex
339X. Media Komputindo.
[7] Kemenkes RI. (2013). Badan Penelitian dan [21] Yatim, Faisal. (2008). Macam-macam Penyakit
Pengembangan Kesehatan Republik Indonesia, Menular dan Cara Pencegahannya Jilid 2.
“Riset Kesehatan Dasar 2013”. Jakarta: Pustaka Obor Populer.
[8] Friedayanthie, Eka Wulansari. (2015). Analisa [22] Infodatin. (2014). Situasi dan Analisis Hepatitis.
Data Mining untuk Prediksi Hepatitis dengan http://www.depkes.go.id/resources/downloadpu
Menggunakan Metode Naive Bayes dan Support sdatin/infodatin-hepatitis.pdf.
Vectore Machine. Jurnal Khatulistiwa [23] Prasetyo, Eko. (2012). Data Mining Konsep dan
Informatika Vol. 3 No.1 Juni 2015. Aplikasi Menggunakan Matlab. Yogyakarta: Andi
[9] Hadi, Moch Irfan & Muhammad Yusuf Alamudi. Offset.
(2017). Skrinning Hepatitis B Surface Antibody [24] Kamagi, David Hartanto dan Seng Hansun.
(HbsAb) pada Remaja di Surabaya dengan 2014. Implementasi Data Mining dengan
Menggunakan Rapid Test. Journal of Health Algoritma C4.5 Memprediksi Tingkat Kelulusan
Science and Prevention, Vol. 1 No. 2 September Mahasiswa. Tangerang: UTLIMATICS, Vol. 6
2017 ISSN 2549-919X (online). No. 1, Juni 2014 ISSN: 2085-4552.
[10] WHO | Hepatitis [Internet]. WHO. [cited 2018 [25] Kusrini & Taufiq Emha Luthfi. (2009). Algoritma
May 25]. Available from: Data Mining. Yogyakarta: Andi Offset.
http://www.who.int/hepatitis/en/ [26] Maimon, O., and Rokach, L. (2010). Data Mining
[11] Handarko, Jefry Latu dan Alamsyah. (2015). and Knowledge Discovery Handbook. New York:
Implementasi Fuzzy Decision Tree untuk Springer.
Mendiagnosa Penyakit Hepatitis. [27] Santosa, Budi. (2010). Tutorial Particle Swarm
UNNESJournal of Mathematics Vol. 4 No. 2 Optimization. Institut Teknologi Surabaya.
2015 ISSN: 2252-6943 [28] Qurnia, Ida Lailatul, Eko Prasetyo dan Rifki
[12] Munawarah, Raudlatul, Oni Soesanto dan M. Fahrial Zainal. (2016). Classification of Diabetes
Reza Faisal. (2016). Penerapan Metode Support Disease using Naive Bayes Case Study: Siti
Vector Machine pada Diagnosa Hepatitis. Khadijah Hospital. Journal of Electrical
Kumpulan Jurnal Ilmu Komputer (KLIK) Vol. 4, Engineering and Computer Sciences Vol. 1 No.
No. 1 Februari 2016. ISSN: 2406-7857. 2 December 2016 ISSN: 2528-0260.
[13] Suwardika, Gede. 2017. Pengelompokan dan [29] Widiastuti, Nur Aeni, Stefanus Santosa dan
Klasifikasi pada Data Hepatitis dengan Catur Supriyanto. (2014). Algoritma Klasifikasi
Menggunakan Support Vector Data Mining Naive Bayes Berbasis Particle
Machine,Classification and Regression Tree dan Jurnal Swarm Optimization untuk Deteksi
Regresi Logistik Biner. Journal of Education Penyakit Jantung. Pseudocode Vol. 1 No. 1,
Research and Evaluation Vol 1 No. 3 Hal. 183- Februari 2014 ISSN: 2355-5920.
191 [30] Lubis, Muhammad Ridwan. (2017). Metode
[14] Septiani, Wisti Dwi. (2014). Penerapan Hybrid Particle Swarm Optimization Neural
Algoritma C4.5 untuk Prediksi Penyakit Network Backpropagation untuk Prediksi Hasil
Hepatitis. Jurnal Techno Nusa Mandiri Vol. 11 Pertandingan Sepak Bola. Jurnal Sains
No. 1 Maret 2014. Komputer dan Informatika (J-SAKTI) Vol. 1 No.
[15] Astuti, Tri & Yuliyanti. (2015). Imputasi Missing 1, Maret 2017 ISSN: 2548-9771 E-ISSN: 2549-
Attribute Values Dataset Hepatitis Berdasarkan 7200.
Algoritme RIPPER. Jurnal Telematika Vol. 8 No. [31] Kusumawati, D., Winarno, W. W., & Arrief, m. R.
2, Agustus 2015. ISSN: 1979-9268 & e-ISSN: (2015). Prediksi Kelulusan Mahasiswa
2441-4536. Menggunakan Metode Neural Network dan
[16] T. Karthikeyan, PhD and P. Thangaraju. (2013). Particle Swarm Optimization.
Analysis of Classification Algorithm Applied to Semnasteknomedia Online Vol. 3 No. 1 Hal. 3-
Hepatitis Patients. International Journal of 8.
Computer Applications, Vol. 62 No.15, January [32] Ciptohartono, Claudia Clarentia. (2014).
2013 (0975 – 8887) Algoritma Klasifikasi Naive Bayes untuk Menilai
[17] Wijayakusuma, H.M Hembing. (2008). Tumpas Kelayakan Kredit. Jurnal Teknik Informatika
Hepatitis dengan Ramuan Herbal. Jakarta: Fakultas Ilmu Komputer Semarang.
Pustaka Bunda.
ISSN : 1979-9330 (Print) - 2088-0154 (Online) 9
Journal Speed – Sentra Penelitian Engineering dan Edukasi – Volume 12 No 1 – Februari 2020 speed.web.id

[33] Gorunescu, F. (2011). Data Mining Concepts,


Models and Techniques. Berlin: Springer.
[34] Utami, Lilyani Asri. (2017). Analisis Sentimen
Opini Publik Berita Kebakaran Hutan Melalui
Komparasi Algoritma Support Vector Machine
dan K-nearest Neighbor Berbasis Particle
Swarm Optimization. Vol 13, No 1.

ISSN : 1979-9330 (Print) - 2088-0154 (Online) 10

Anda mungkin juga menyukai