Anda di halaman 1dari 8

DIAGNOSA PENYAKIT DIABETES MELLITUS DENGAN METODE NAÏVE BAYES BERBASIS DESKTOP APPLICATION

Almira Syawli 1 , Gopi Yudoyo 2 , M. Ali Fahmi 3 , Silvia Ari Santhy 4 , Zulkarnaein 5

1. Teknik Informatika, Program Teknologi Informasi dan Ilmu Komputer, Universitas Brawijaya, Malang, 65145, Indonesia

2. Program Teknologi Informasi dan Ilmu Komputer, Universitas Brawijaya, Malang, 65145, Indonesia Email: oely294@gmail.com 1 , yud.gopi@gmail.com 2 , darkblitzard@gmail.com 3 , silvia.aska@gmail.com 4 , zulkhafourze@gmail.com 5

Abstrak Bidang kesehatan merupakan salah satu bidang yang sudah menerapkan berbagai teknologi komputer. Untuk melakukan diagnosa penyakit yang diderita pasien pun sudah dilakukan dengan bantuan komputer. Salah satunya adalah untuk mendiagnosa penyakit diabetes mellitus yang dapat terjadi pada siapa pun. Penyakit diabetes mellitus merupakan salah satu jenis penyakit yang sering ditemukan pada masyarakat. Penyakit ini juga merupakan penyebab kematian terbesar keempat di dunia, dan di Indonesia terutama di kota-kota besar seperti Jakarta dan Surabaya sudah hampir 10 persen penduduknya mengidap diabetes. Oleh karena itu, penelitian ini bertujuan untuk mencegah masalah tersebut dengan bantuan sistem pakar. Dalam hal ini, pasien dapat memasukkan berbagai gejala yang mengindikasi penyakit Diabetes Mellitus. Dari gejala yang dimasukkan, dapat diketahui prediksi bahwa pasien terkena atau tidak terkena Diabetes Mellitus dengan metode Naive Bayes. Metode Naïve Bayes ini membantu kita dalam menentukan probabilitas seorang pasien dengan gejala tertentu dapat dikatakan terkena Diabetes mellitus atau tidak terkena Diabetes mellitus berdasarkan dari 22 gejala sebagai indikator kunci dari Diabetes Mellitus. Dari masukan tersebut akan dibandingkan dengan data training yang telah tervalidasi.

Kata Kunci : Diabetes mellitus, Teorema Bayes, Metode Naïve Bayes, Sistem Pakar

Abstract

The health sector is one area that has been implementing a variety of computer technologies. To make a diagnosis of the patient's illness was already done with the help of computers. One is to diagnose diabetes mellitus that can be happened to anyone. Diabetes mellitus is a disease that is oftenly found in the community. This disease is also the fourth largest cause of death in the world, and in Indonesia, especially in big cities such as Jakarta and Surabaya which are nearly 10 percent of the population have diabetes. Therefore, this study aims to avoid these problems with the help of an expert system. In this case, the patient may enter a variety of symptoms that indicate Diabetes Mellitus disease. From that symptoms, it can be seen the predictions of patients that exposed or not exposed to Diabetes Mellitus with the Naive Bayes method. Naive Bayes method helps us in determining the probability of a patient with certain symptoms that can be said exposed or not exposed based on 22 symptoms as a key indicator of Diabetes Mellitus. Furthermore, the input will be compared with training data that has been validated.

Keywords: Diabetes Mellitus, Bayes Theorem, Naive Bayes Methods, Expert System

1
1

PENDAHULUAN

Diabetes Mellitus (DM) adalah penyakit yang akhir-akhir ini semakin banyak dijumpai. Penyakit Diabetes Melitus juga sering kita sebut dengan istilah kencing manis atau penyakit gula darah. Penyakit yang satu ini termasuk jenis penyakit kronis yang tanda awalnya yaitu meningkatnya kadar gula dalam darah sebagai akibat adanya gangguan sistem metabolisme dalam tubuh. Organ tubuh yang terganggu adalah pankreas yang mana sudah tidak berfungsi sebagaimana mestinya. Pankreas sudah tidak mampu memproduksi hormon insulin dalam memenuhi kebutuhan tubuh. Beberapa faktor yang menyebabkan seseorang menderita penyakit diabetes, yaitu [3] :

1) Banyak mengkonsumsi makanan yang mengandung gula 2) Kurang tidur

3)

Makan terlalu banyak karbohidrat dari nasi atau roti

4) Merokok 5) Kurangnya Aktivitas Fisik 6) Faktor Keturunan

Penentuan mengenai terkena penyakit Diabetes Mellitus, dapat dikenali melalui beberapa gejala yang dirasakan seperti banyak kencing, dehidrasi, berat badan turun, penglihatan kabur, dan sebagainya. Prediksi seseorang mengidap penyakit ini dapat diketahui dari perhitungan probabilitas menggunakan metode Naïve Bayes. Metode ini memanfaatkan teorema Bayes.

Teorema Bayes adalah sebuah pendekatan untuk sebuah ketidaktentuan yang diukur dengan probabilitas. Pendekatan bayes pada saat klasifikasi adalah mencari

probabilitas tertinggi (V MAP ) dengan masukan

atribut (a 1 , a 2 , a 3 ,

persamaan 1 berikut [2] :

, a n ) seperti tampak pada

V MAP = arg max P(v j |a 1 ,a 2 ,a 3 , V

v j

,a n )

(1)

Teorema Bayes sendiri berawal dari rumus persamaan 2 berikut :

P(A|B) =

(2)

Dimana P(A|B) artinya peluang A jika diketahui keadaan B. Kemudian dari persamaan rumus 2 diatas didapat persamaan 3 seperti berikut :

P(B

A) = P( B | A) P(A)

(3)

Sehingga didapatkan teorema bayes seperti persamaan 4 berikut :

P(A | B) =

Yang mana :

|

(4)

A adalah hipotesis data A (class spesifik)

B adalah data dengan class yang belum diketahui

2
2

P(A|B) adalah probabilitas hipotesis A berdasar kondisi B (posterior | probability)

P(B|A) adalah probabilitas B berdasar kondisi pada hipotesis A

P(A) adalah probabilitas hipotesis A (prior probability)

P(B) adalah probabilitas dari B

Menggunakan teorema bayes ini, persamaan diatas dapat ditulis menjadi persamaan 5 berikut ini :

Vmap=arg max

|

 

(5)

Karena nilai P(a 1 , a 2 , a 3 ,

,

a n ) konstan untuk

semua v j , maka persamaan ini dapat ditulis

menjadi persamaan 6 berikut ini :

V MAP = arg max P(a 1 ,a 2 ,a 3 , V

v j

,a n | v j )P(v j )

 

(6)

Untuk menghitung P(a 1 , a 2 , a 3 ,

,

a n | v j ) bisa

jadi semakin sulit karena jumlah term P(a 1 , a 2 ,

, a n | v j ) bisa jadi sangat besar [2]. Hal ini

disebabkan jumlah term tersebut Permasalahannya adalah bagaimana cara memprediksikan bahwa seseorang terkena Diabetes Mellitus dengan menggunakan metode Naïve Bayes. Prediksi ini dapat menggunakan masukan berupa gejala gejala Diabetes Mellitus yang dirasakan oleh pasien

a 3 ,

seperti banyak kencing, dehidrasi, berat badan turun, penglihatan kabur, dan sebagainya. Dalam prosesnya, diperlukan beberapa tahapan untuk menjadikan data mentah sebagai knowledge based bagi sistem pakar. Aktivitas yang dilakukan untuk memindahkan kepakaran adalah [3] :

1. Knowledge Acquistion (dari pakar atau sumber lainnya)

2. Knowledeg Representation (ke dalam komputer)

3. Knowledge Inferencing

4. Knowledge Transfering

Akuisisi pengetahun dilakukan sepanjang proses pembangunan sistem. Proses akuisisi pengetahuan dibagi kedalam enam tahap, yaitu [5] :

1. Tahap Identifikasi Tahap identifikasi meliputi penentuan komponen-komponen kunci dalam sistem yang sedang dibangun. Komponen kunci ini adalah knowledge engineer, pakar, karakteristik masalah, sumber daya dan tujuan.

2. Tahap Konseptualisas Tahap ini, memperjelas konsep konsep kunci dan hubungannya yang telah didtemtukan pada tahap sebelumnya.

3. Tahap Formalisasi Tahap ini, memetakan seluruh konsep kosenp pengatahuan sebelumnya ke dalam representasi formal yang sesuai dengan permasalahan.

4. Tahap Implementasi Pada tahap ini, hasil dari formalisasi diterapkan ke dalam skema representasi

3
3

pengetahuan yang dipilih kemudian dibuatlah prototype dari sisem.

5. Tahap Pengujian Tahap ini, melakukan pengujian terhadap sistem dengan memasukkan berbagai sampel masalah.

6. Revisi Protoype

METODE PENELITIAN

Pada penelitian ini, metode yang digunakan adalah metode klasifikasi dengan Naïve Bayes. Naïve Bayes menyederhanakan teorema bayes dengan asumsi bahwa fitur-fitur yang terdapat didalamnya saling tidak tergantung atau independen, setiap kata independen satu sama lain. Seperti tampak pada persamaan 7 berikut ini :

P(a 1 ,a 2 ,a 3 ,

,a

n | v j ) =

|

(7)

Dengan mensubstitusikan persamaan ini dengan persamaan diatas maka akan dihasilkan rumus seperti persamaan 8 berikut ini :

V MAP = arg max P(v j )

v j

V

|

(8)

Naïve Bayes adalah model penyederhanaan dari metode bayes. Dimana:

VMAP = Nilai output hasil klasifikasi Naïve Bayes

P(a1, a2, a3, …, an) = Peluang A

Vj = Keadaan atau kategori j

Perancangan Sistem

Prosedur perancangan sistem secara umum terdiri atas beberapa tahap antara lain perancangan data, perancangan proses dan perancangan interface. Tahap pertama adalah perancangan data meliputi data input, data output dan data training. Data training yang akan digunakan sebagai acuan untuk menentukan data output yang dihasilkan oleh sistem, diperoleh dari Departemen kesehatan dan kesejahteraan sosial RI 2001 sebanyak 18 data [4]. Tahap kedua adalah perancangan proses implementasi Naïve Bayes ke dalam sistem. Pada tahap ini akan dijelaskan cara kerja sistem (perhitungan) dan proses-proses yang akan digunakan, mulai dari masuknya data input yang kemudian akan diproses oleh sistem hingga menjadi data output. Pada tahap ini diambil beberapa data training untuk di tes. Kemudian diambil probabilitas kemunculan setiap nilai masing- masing fitur per kelasnya. Langkah pertama adalah dengan meng-generate data training yang telah diperoleh sebanyak 18 dataset. Dari data training yang diperoleh, kemudian dilakukan analisa mengenai gejala (fitur) dari penyakit Diabetes Mellitus. Setelah menganalisa,

didapatkan 22 indikasi (bersifat diskrit) dari Diabetes Mellitus, yaitu :

a. Polituria

b. Polidipsia

c. Polipagia

d. Kesemutan

e. Rasa tebal

4
4

f. Berat badan turun

Dari kedua fungsi diatas, dapat

g.

Kulit

dilakukan perhitungan dengan metode Naïve

h.

Gatal

Bayes seperti pada persamaan 9 berikut :

i.

Bisul

j.

k. Keputihan

l. Luka

m. Lapar

n. Gemetar

o. Lemah

p. Konsentrasi

q. Keringat

r. Berdebar

s. Pusing

t. Gelisah

u. Koma

Infeksi

Serta dua kelas utama yaitu kelas Ya (terkena

Diabetes

terkena Diabetes Mellitus).

kedua yaitu melakukan

testing dengan diberikan data sample. Dengan

begitu

dapat dihitung peluang terkena atau

tidak terkena Diabetes Mellitus menggunakan

Naïve Bayes. Dalam proses perhitungannnya

dibutuhkan Prior yang merupakan probabilitas

yang tidak

diketahui dengan pasti tetapi dapat diestimasi

dinyatakan

dari

dengan (P(h j )).

yang

didistribusikan bergantung pada kemunculan

yang

objek

menyatakan peluang muncul x jika diketahui h.

Fungsi peluang P(x|h j ) ini disebut juga dengan

istilah fungsi likelihood dari h j terhadap x.

Mellitus)

dan kelas Tidak (tidak

Langkah

kemunculan

data

kejadian

yang

tiap kelas

Prior

tersedia.

random

Variabel

dan

diskrit

P(x|h)

dinyatakan

dengan

(

)

|

(9)

Dimana j adalah jumlah kelas dan i adalah

jumlah fitur yang ada.

Aturan bayes itu sendiri bisa

ditetapkan sebagai berikut:

Misalkan terdapat kategori dua kelas P(h 1 ) dan

P(h 2 ).

, maka x diklasifikasikan

sebagai h 2 .

Pada pengamatan nilai x tertentu,

ketika mengambil suatu keputusan maka

probabilitas errornya seperti pada persamaan

| <

|

10 berikut :

|

{

|

|

(10)

Jadi jelasnya peluang error bisa diminimalkan

jika diberikan nilai x dengan memutuskan h 1

jika

|

>

| dan memutuskan h 2

jika

|

>

| [1]. Maka untuk

memutuskan sesuatu atau decide dengan

memilih nilai posterior yang paling besar.

perancangan

interface. Tahap ini merupakan tahap

pembuatan user interface sebagai fasilitator

dalam berkomunikasi antar sistem dengan

user.

Tahap

ketiga

adalah

5
5

HASIL DAN PEMBAHASAN

Eksperimen dilakukan untuk menguji

kinerja sistem penentuan terkena Diabetes

Mellitus. Pada proses pengujian ini, digunakan

metode klasifikasi Naïve Bayes.

Langkah pertama yaitu menghitung

probabilitas kemunculan dari setiap fitur

(gejala) terhadap kelasnya. Berdasarkan

perhitungan tersebut, diperoleh hasil seperti

pada tabel 1 berikut :

Tabel 1. Likelihood tiap fitur dari semua kelas

Diabetes Mellitus

 

Fitur

Kondisi

Ya

Tidak

 

Ya

7/10

3/8

1 Poliuria

Tidak

3/10

5/8

Ya

8/10

3/8

2 Polidipsia

Tidak

1/10

5/8

Ya

9/10

1/8

3 Polipagia

Tidak

1/10

7/8

Ya

5/10

4/8

4 Kram

Tidak

5/10

4/8

Ya

6/10

2/8

5 Kesemutan

Tidak

4/10

6/8

Ya

2/10

7/8

6 Rasa Tebal

Tidak

8/10

1/8

7 Berat Badan

Turun

Ya

4/10

6/8

Tidak

6/10

2/8

 

Ya

2/10

7/8

8 Kulit

Tidak

8/10

1/8

Ya

3/10

6/8

9 Gatal

Tidak

7/10

2/8

Ya

1/10

6/8

10 Bisul

Tidak

9/10

2/8

Ya

2/10

7/8

11 Infeksi

Tidak

8/10

1/8

Ya

4/10

5/8

12 Keputihan

Tidak

6/10

3/8

Ya

7/10

1/8

13 Luka

Tidak

3/10

7/8

Ya

2/10

4/8

14 Lapar

Tidak

8/10

4/8

15 Gemetar

16 Lemah

17 Konsentrasi

18 Keringat

19 Berdebar

20 Pusing

21 Gelisah

22 Koma

Ya

4/10

3/8

Tidak

6/10

5/8

Ya

9/10

2/8

Tidak

1/10

6/8

Ya

2/10

5/8

Tidak

8/10

3/8

Ya

9/10

2/8

Tidak

1/10

6/8

Ya

2/10

7/8

Tidak

8/10

1/8

Ya

5/10

4/8

Tidak

5/10

4/8

Ya

5/10

5/8

Tidak

5/10

3/8

Ya

2/10

5/8

Tidak

8/10

3/8

Kemudian dilakukan analisis

keakuratan data dengan memasukkan data

sample melalui sistem seperti pada gambar 1

dan 2 berikut.

sample melalui sistem seperti pada gambar 1 dan 2 berikut. Gambar 1 . Form input data

Gambar 1. Form input data user

sample melalui sistem seperti pada gambar 1 dan 2 berikut. Gambar 1 . Form input data

Gambar 2. Form input gejala

6
6

Pengujian keakuratan dilakukan dengan memasukkan masalah yang sama dengan data training sebelumnya. Dari hasil pengujian tersebut, dapat dihitung tingkat keakuratan dengan cara pada persamaan 11 berikut :

Akurasi =

(11)

Adapun hasil pengujian dari setiap data training ditunjukkan pada tabel 2 berikut :

Tabel 2. Hasil pengujian

Data

Data

Data Output

ke -

Training

(Hasil Pengujian)

1

ya

ya

2

ya

ya

3

tidak

tidak

4

tidak

tidak

5

tidak

tidak

6

ya

ya

7

ya

ya

8

ya

ya

9

tidak

tidak

10

tidak

tidak

11

ya

ya

12

tidak

tidak

13

ya

ya

14

tidak

ya

15

ya

ya

16

ya

ya

17

ya

ya

18

tidak

tidak

Dari

pengujian

tersebut,

dapat

diketahui tingkat keakurasiannya adalah :

Akurasi =

KESIMPULAN

= 94,4%

Pada penelitian ini dapat disimpulkan bahwa semakin banyak jumlah data yang digunakan untuk training maka semakin tinggi keakuratannya. Selain itu, semakin sering juga dilakukan learning atau penambahan knowledge maka akan semakin cepat mendapatkan klasifikasi dengan benar. Untuk langkah selanjutnya, akan berkonsentrasi pada pengembangan aplikasi seperti dapat menentukan nilai variasi konstanta bayes secara otomatis untuk mendapatkan akurasi yang tinggi dengan berapapun jumlah data trainingnya. Aplikasi juga dapat disempurnakan untuk meminimalisir waktu pemrosesan pada saat learning.

DAFTAR PUSTAKA

[1] Basuki, Achmad. 2006. Metode Bayes. Pens, Institut Teknologi Sepuluh November.

[2] Ferry Febrian, ” Analisis Komparasi Algoritma Klasifikasi Data Mining Pada Akseptasi Data Fakultatif Reasuransi Jiwa”, Tesis, Program Studi Teknik Informatika, Program Pasca Sarjana (S2)

Magister Komputer, 2011. URL :

7
7

diakses tanggal 4 januari 2012.

[3] Suardin Yakub, “Sistem Pakar Deteksi Penyakit Diabetes Mellitus Dengan Menggunakan Pendekatan Naïve Bayesian Berbasis Web”, Skripsi, Jurusan Teknik Informatika, Fakultas Sains Dan Teknologi, 2008. URL : http://lib.uin-

diakses

tanggal

4

Oktober 2012.

[4] DEPKES RI. 2001. Pedoman Pengobatan Dasar Di Puskesmas Berdasarkan Gejala. Jakarta :

[5]

DEPKES.

Firebaugh

M.W.,

A

1989,

knowledge-Based

Artificial

Intelligence:

Approach,

Company, Boston.

PWS-Kent

Publishing

8
8