Anda di halaman 1dari 8

DIAGNOSA PENYAKIT DIABETES MELLITUS DENGAN METODE NAVE

BAYES BERBASIS DESKTOP APPLICATION

Almira Syawli1, Gopi Yudoyo2, M. Ali Fahmi3, Silvia Ari Santhy4, Zulkarnaein5
1. Teknik Informatika, Program Teknologi Informasi dan Ilmu Komputer, Universitas Brawijaya,
Malang, 65145, Indonesia
2. Program Teknologi Informasi dan Ilmu Komputer, Universitas Brawijaya, Malang, 65145,
Indonesia
Email: oely294@gmail.com , yud.gopi@gmail.com2, darkblitzard@gmail.com3,
1

silvia.aska@gmail.com4, zulkhafourze@gmail.com5

Abstrak
Bidang kesehatan merupakan salah satu bidang yang sudah menerapkan berbagai teknologi komputer.
Untuk melakukan diagnosa penyakit yang diderita pasien pun sudah dilakukan dengan bantuan
komputer. Salah satunya adalah untuk mendiagnosa penyakit diabetes mellitus yang dapat terjadi pada
siapa pun. Penyakit diabetes mellitus merupakan salah satu jenis penyakit yang sering ditemukan pada
masyarakat. Penyakit ini juga merupakan penyebab kematian terbesar keempat di dunia, dan di
Indonesia terutama di kota-kota besar seperti Jakarta dan Surabaya sudah hampir 10 persen
penduduknya mengidap diabetes. Oleh karena itu, penelitian ini bertujuan untuk mencegah masalah
tersebut dengan bantuan sistem pakar. Dalam hal ini, pasien dapat memasukkan berbagai gejala yang
mengindikasi penyakit Diabetes Mellitus. Dari gejala yang dimasukkan, dapat diketahui prediksi
bahwa pasien terkena atau tidak terkena Diabetes Mellitus dengan metode Naive Bayes. Metode
Nave Bayes ini membantu kita dalam menentukan probabilitas seorang pasien dengan gejala tertentu
dapat dikatakan terkena Diabetes mellitus atau tidak terkena Diabetes mellitus berdasarkan dari 22
gejala sebagai indikator kunci dari Diabetes Mellitus. Dari masukan tersebut akan dibandingkan
dengan data training yang telah tervalidasi.

Kata Kunci : Diabetes mellitus, Teorema Bayes, Metode Nave Bayes, Sistem Pakar

Abstract
The health sector is one area that has been implementing a variety of computer technologies. To make
a diagnosis of the patient's illness was already done with the help of computers. One is to diagnose
diabetes mellitus that can be happened to anyone. Diabetes mellitus is a disease that is oftenly found
in the community. This disease is also the fourth largest cause of death in the world, and in Indonesia,
especially in big cities such as Jakarta and Surabaya which are nearly 10 percent of the population
have diabetes. Therefore, this study aims to avoid these problems with the help of an expert system. In
this case, the patient may enter a variety of symptoms that indicate Diabetes Mellitus disease. From
that symptoms, it can be seen the predictions of patients that exposed or not exposed to Diabetes
Mellitus with the Naive Bayes method. Naive Bayes method helps us in determining the probability of
a patient with certain symptoms that can be said exposed or not exposed based on 22 symptoms as a
key indicator of Diabetes Mellitus. Furthermore, the input will be compared with training data that
has been validated.

Keywords: Diabetes Mellitus, Bayes Theorem, Naive Bayes Methods, Expert System

1
PENDAHULUAN Teorema Bayes adalah sebuah
pendekatan untuk sebuah ketidaktentuan yang

Diabetes Mellitus (DM) adalah diukur dengan probabilitas. Pendekatan bayes

penyakit yang akhir-akhir ini semakin banyak pada saat klasifikasi adalah mencari

dijumpai. Penyakit Diabetes Melitus juga probabilitas tertinggi (VMAP) dengan masukan

sering kita sebut dengan istilah kencing manis atribut (a1, a2, a3, ..., an) seperti tampak pada

atau penyakit gula darah. Penyakit yang satu persamaan 1 berikut [2] :

ini termasuk jenis penyakit kronis yang tanda


awalnya yaitu meningkatnya kadar gula dalam VMAP = arg max P(vj |a1,a2,a3,...,an) (1)

darah sebagai akibat adanya gangguan sistem vj V

metabolisme dalam tubuh. Organ tubuh yang


terganggu adalah pankreas yang mana sudah Teorema Bayes sendiri berawal dari rumus

tidak berfungsi sebagaimana mestinya. persamaan 2 berikut :

Pankreas sudah tidak mampu memproduksi


hormon insulin dalam memenuhi kebutuhan
P(A|B) = (2)
tubuh. Beberapa faktor yang menyebabkan
seseorang menderita penyakit diabetes, yaitu
[3] : Dimana P(A|B) artinya peluang A jika
1) Banyak mengkonsumsi makanan yang diketahui keadaan B. Kemudian dari
mengandung gula persamaan rumus 2 diatas didapat persamaan 3
2) Kurang tidur seperti berikut :
3) Makan terlalu banyak karbohidrat dari nasi
atau roti P(B A) = P( B | A) P(A) (3)
4) Merokok
5) Kurangnya Aktivitas Fisik Sehingga didapatkan teorema bayes seperti
6) Faktor Keturunan persamaan 4 berikut :

Penentuan mengenai terkena penyakit Diabetes |


P(A | B) = (4)
Mellitus, dapat dikenali melalui beberapa
gejala yang dirasakan seperti banyak kencing,
dehidrasi, berat badan turun, penglihatan Yang mana :
kabur, dan sebagainya. Prediksi seseorang A adalah hipotesis data A (class spesifik)
mengidap penyakit ini dapat diketahui dari B adalah data dengan class yang belum
perhitungan probabilitas menggunakan metode diketahui
Nave Bayes. Metode ini memanfaatkan
teorema Bayes.

2
P(A|B) adalah probabilitas hipotesis A seperti banyak kencing, dehidrasi, berat badan
berdasar kondisi B (posterior | turun, penglihatan kabur, dan sebagainya.
probability) Dalam prosesnya, diperlukan beberapa
P(B|A) adalah probabilitas B berdasar tahapan untuk menjadikan data mentah sebagai
kondisi pada hipotesis A knowledge based bagi sistem pakar. Aktivitas
P(A) adalah probabilitas hipotesis A yang dilakukan untuk memindahkan kepakaran
(prior probability) adalah [3] :

P(B) adalah probabilitas dari B 1. Knowledge Acquistion (dari pakar atau


sumber lainnya)

Menggunakan teorema bayes ini, persamaan 2. Knowledeg Representation (ke dalam

diatas dapat ditulis menjadi persamaan 5 komputer)


berikut ini : 3. Knowledge Inferencing
4. Knowledge Transfering

|
Vmap=arg max Akuisisi pengetahun dilakukan sepanjang
proses pembangunan sistem. Proses akuisisi
(5)
pengetahuan dibagi kedalam enam tahap, yaitu
[5] :
Karena nilai P(a1, a2, a3, ..., an) konstan untuk
1. Tahap Identifikasi
semua vj, maka persamaan ini dapat ditulis
Tahap identifikasi meliputi penentuan
menjadi persamaan 6 berikut ini :
komponen-komponen kunci dalam sistem
yang sedang dibangun. Komponen kunci
VMAP = arg max P(a1,a2,a3,...,an | vj)P(vj)
ini adalah knowledge
vj V
engineer, pakar, karakteristik masalah,
(6)
sumber daya dan tujuan.
2. Tahap Konseptualisas
Untuk menghitung P(a1, a2, a3, ..., an | vj) bisa
Tahap ini, memperjelas konsep konsep
jadi semakin sulit karena jumlah term P(a1, a2,
kunci dan hubungannya yang telah
a3, ..., an | vj) bisa jadi sangat besar [2]. Hal ini
didtemtukan pada tahap sebelumnya.
disebabkan jumlah term tersebut
3. Tahap Formalisasi
Permasalahannya adalah bagaimana cara
Tahap ini, memetakan seluruh konsep
memprediksikan bahwa seseorang terkena
kosenp pengatahuan sebelumnya ke dalam
Diabetes Mellitus dengan menggunakan
representasi formal yang sesuai dengan
metode Nave Bayes. Prediksi ini dapat
permasalahan.
menggunakan masukan berupa gejala gejala
4. Tahap Implementasi
Diabetes Mellitus yang dirasakan oleh pasien
Pada tahap ini, hasil dari formalisasi
diterapkan ke dalam skema representasi

3
pengetahuan yang dipilih kemudian Perancangan Sistem
dibuatlah prototype dari sisem.
5. Tahap Pengujian Prosedur perancangan sistem secara
Tahap ini, melakukan pengujian terhadap umum terdiri atas beberapa tahap antara lain
sistem dengan memasukkan berbagai perancangan data, perancangan proses dan
sampel masalah. perancangan interface.
6. Revisi Protoype Tahap pertama adalah perancangan
data meliputi data input, data output dan data
METODE PENELITIAN training. Data training yang akan digunakan
sebagai acuan untuk menentukan data output
Pada penelitian ini, metode yang yang dihasilkan oleh sistem, diperoleh dari
digunakan adalah metode klasifikasi dengan Departemen kesehatan dan kesejahteraan
Nave Bayes. Nave Bayes menyederhanakan sosial RI 2001 sebanyak 18 data [4].
teorema bayes dengan asumsi bahwa fitur-fitur Tahap kedua adalah perancangan
yang terdapat didalamnya saling tidak proses implementasi Nave Bayes ke dalam
tergantung atau independen, setiap kata sistem. Pada tahap ini akan dijelaskan cara
independen satu sama lain. Seperti tampak kerja sistem (perhitungan) dan proses-proses
pada persamaan 7 berikut ini : yang akan digunakan, mulai dari masuknya
data input yang kemudian akan diproses oleh
P(a1,a2,a3,...,an | vj) = | (7) sistem hingga menjadi data output.
Pada tahap ini diambil beberapa data

Dengan mensubstitusikan persamaan ini training untuk di tes. Kemudian diambil

dengan persamaan diatas maka akan dihasilkan probabilitas kemunculan setiap nilai masing-

rumus seperti persamaan 8 berikut ini : masing fitur per kelasnya.


Langkah pertama adalah dengan

VMAP = arg max P(vj) | (8) meng-generate data training yang telah
diperoleh sebanyak 18 dataset. Dari data
vj V
training yang diperoleh, kemudian dilakukan
analisa mengenai gejala (fitur) dari penyakit
Nave Bayes adalah model penyederhanaan
Diabetes Mellitus. Setelah menganalisa,
dari metode bayes. Dimana:
didapatkan 22 indikasi (bersifat diskrit) dari
VMAP = Nilai output hasil klasifikasi
Diabetes Mellitus, yaitu :
Nave Bayes
a. Polituria
P(a1, a2, a3, , an) = Peluang A
b. Polidipsia
Vj = Keadaan atau kategori j
c. Polipagia
d. Kesemutan
e. Rasa tebal

4
f. Berat badan turun Dari kedua fungsi diatas, dapat
g. Kulit dilakukan perhitungan dengan metode Nave
h. Gatal Bayes seperti pada persamaan 9 berikut :
i. Bisul
j. Infeksi ( ) | (9)
k. Keputihan
l. Luka Dimana j adalah jumlah kelas dan i adalah
m. Lapar jumlah fitur yang ada.
n. Gemetar Aturan bayes itu sendiri bisa
o. Lemah ditetapkan sebagai berikut:
p. Konsentrasi Misalkan terdapat kategori dua kelas P(h1) dan
q. Keringat P(h2).
r. Berdebar | < | , maka x diklasifikasikan
s. Pusing sebagai h2.
t. Gelisah Pada pengamatan nilai x tertentu,
u. Koma ketika mengambil suatu keputusan maka
Serta dua kelas utama yaitu kelas Ya (terkena probabilitas errornya seperti pada persamaan
Diabetes Mellitus) dan kelas Tidak (tidak 10 berikut :
terkena Diabetes Mellitus).
Langkah kedua yaitu melakukan |
| {
testing dengan diberikan data sample. Dengan |
begitu dapat dihitung peluang terkena atau (10)
tidak terkena Diabetes Mellitus menggunakan
Nave Bayes. Dalam proses perhitungannnya Jadi jelasnya peluang error bisa diminimalkan
dibutuhkan Prior yang merupakan probabilitas jika diberikan nilai x dengan memutuskan h1
kemunculan kejadian tiap kelas yang tidak jika | > | dan memutuskan h2
diketahui dengan pasti tetapi dapat diestimasi jika | > | [1]. Maka untuk
dari data yang tersedia. Prior dinyatakan memutuskan sesuatu atau decide dengan
dengan (P(hj)). memilih nilai posterior yang paling besar.
Variabel random diskrit yang Tahap ketiga adalah perancangan
didistribusikan bergantung pada kemunculan interface. Tahap ini merupakan tahap
objek dan dinyatakan dengan P(x|h) yang pembuatan user interface sebagai fasilitator
menyatakan peluang muncul x jika diketahui h. dalam berkomunikasi antar sistem dengan
Fungsi peluang P(x|hj) ini disebut juga dengan user.
istilah fungsi likelihood dari hj terhadap x.

5
HASIL DAN PEMBAHASAN Ya 4/10 3/8
15 Gemetar
Tidak 6/10 5/8
Ya 9/10 2/8
Eksperimen dilakukan untuk menguji 16 Lemah
Tidak 1/10 6/8
kinerja sistem penentuan terkena Diabetes Ya 2/10 5/8
17 Konsentrasi
Mellitus. Pada proses pengujian ini, digunakan Tidak 8/10 3/8
Ya 9/10 2/8
metode klasifikasi Nave Bayes. 18 Keringat
Tidak 1/10 6/8
Langkah pertama yaitu menghitung Ya 2/10 7/8
19 Berdebar
probabilitas kemunculan dari setiap fitur Tidak 8/10 1/8
(gejala) terhadap kelasnya. Berdasarkan Ya 5/10 4/8
20 Pusing
Tidak 5/10 4/8
perhitungan tersebut, diperoleh hasil seperti
Ya 5/10 5/8
pada tabel 1 berikut : 21 Gelisah
Tidak 5/10 3/8
Ya 2/10 5/8
22 Koma
Tabel 1. Likelihood tiap fitur dari semua kelas Tidak 8/10 3/8

Diabetes Mellitus
Fitur Kondisi Kemudian dilakukan analisis
Ya Tidak
Ya 7/10 3/8 keakuratan data dengan memasukkan data
1 Poliuria
Tidak 3/10 5/8 sample melalui sistem seperti pada gambar 1
Ya 8/10 3/8
2 Polidipsia dan 2 berikut.
Tidak 1/10 5/8
Ya 9/10 1/8
3 Polipagia
Tidak 1/10 7/8
Ya 5/10 4/8
4 Kram
Tidak 5/10 4/8
Ya 6/10 2/8
5 Kesemutan
Tidak 4/10 6/8
Ya 2/10 7/8
6 Rasa Tebal
Tidak 8/10 1/8
Berat Badan Ya 4/10 6/8
7
Turun Tidak 6/10 2/8
Ya 2/10 7/8 Gambar 1. Form input data user
8 Kulit
Tidak 8/10 1/8
Ya 3/10 6/8
9 Gatal
Tidak 7/10 2/8
Ya 1/10 6/8
10 Bisul
Tidak 9/10 2/8
Ya 2/10 7/8
11 Infeksi
Tidak 8/10 1/8
Ya 4/10 5/8
12 Keputihan
Tidak 6/10 3/8
Ya 7/10 1/8
13 Luka
Tidak 3/10 7/8 Gambar 2. Form input gejala
Ya 2/10 4/8
14 Lapar
Tidak 8/10 4/8

6
Pengujian keakuratan dilakukan Dari pengujian tersebut, dapat
dengan memasukkan masalah yang sama diketahui tingkat keakurasiannya adalah :
dengan data training sebelumnya. Dari hasil Akurasi = = 94,4%
pengujian tersebut, dapat dihitung tingkat
keakuratan dengan cara pada persamaan 11
KESIMPULAN
berikut :
Pada penelitian ini dapat disimpulkan
bahwa semakin banyak jumlah data yang
Akurasi = digunakan untuk training maka semakin tinggi
(11) keakuratannya. Selain itu, semakin sering juga
dilakukan learning atau penambahan
Adapun hasil pengujian dari setiap knowledge maka akan semakin cepat
data training ditunjukkan pada tabel 2 berikut : mendapatkan klasifikasi dengan benar.
Untuk langkah selanjutnya, akan
Tabel 2. Hasil pengujian berkonsentrasi pada pengembangan aplikasi
Data Data Data Output seperti dapat menentukan nilai variasi
ke - Training (Hasil Pengujian) konstanta bayes secara otomatis untuk
1 ya ya mendapatkan akurasi yang tinggi dengan
2 ya ya berapapun jumlah data trainingnya. Aplikasi
3 tidak tidak juga dapat disempurnakan untuk
4 tidak tidak meminimalisir waktu pemrosesan pada saat
5 tidak tidak learning.
6 ya ya
7 ya ya DAFTAR PUSTAKA
8 ya ya
9 tidak tidak
[1] Basuki, Achmad. 2006. Metode Bayes.
10 tidak tidak
Pens, Institut Teknologi Sepuluh
11 ya ya
November.
12 tidak tidak
13 ya ya
[2] Ferry Febrian, Analisis Komparasi
14 tidak ya
Algoritma Klasifikasi Data Mining Pada
15 ya ya
Akseptasi Data Fakultatif Reasuransi
16 ya ya
Jiwa, Tesis, Program Studi Teknik
17 ya ya
Informatika, Program Pasca Sarjana (S2)
18 tidak tidak
Magister Komputer, 2011. URL :
http://edp.stmikpasim.ac.id/agoenthea/pub
lic_html/thesis/Research%20Method/romi

7
-mp/01%20-
%20research%20fields/data%20mining/th
esis/Ferry%20-
%20Komparasi%20Klasifikasi%20DM%
20untuk%20Akseptasi%20Reas.pdf
diakses tanggal 4 januari 2012.

[3] Suardin Yakub, Sistem Pakar Deteksi


Penyakit Diabetes Mellitus Dengan
Menggunakan Pendekatan Nave
Bayesian Berbasis Web, Skripsi, Jurusan
Teknik Informatika, Fakultas Sains Dan
Teknologi, 2008. URL : http://lib.uin-
malang.ac.id/thesis/fullchapter/04550034-
suardin-yakub.ps diakses tanggal 4
Oktober 2012.

[4] DEPKES RI. 2001. Pedoman


Pengobatan Dasar Di Puskesmas
Berdasarkan Gejala. Jakarta :
DEPKES.

[5] Firebaugh M.W., 1989, Artificial


Intelligence: A knowledge-Based
Approach, PWS-Kent Publishing
Company, Boston.

Anda mungkin juga menyukai