Prediksi Diabetes
*Corresponding author:
Abstraks
Diabetes Melitus (DM) adalah salah satu penyakit penyakit kronis yang menyebabkan kematian.
Peningkatan gula darah yang tidak terkontrol, teridentifikasi dan tidak terprediksi dengan cepat
mengakibatkan terjadinya komplikasi. Dalam data mining telah banyak menggunakan pendekatan-
pendekatan dalam melakukan prediksi penyakit salah satu nya penggunaan algortima decison tree C4.5.
Motif dari penelitian ini adalah membangun sebuah model prediksi kemungkinan diabetes pasien dengan
algoritma C4.5 dan melihat akurasi dari model yang dihasilkan. Model prediksi dibuat dengan
menggunakan data prediksi kemungkinan diabetes. Model prediksi dengan algoritma decision tree C4.5
memiliki akurasi 41,22% pred ever, 81,99% pred no info dan 100% pred former. menghasilkan 8 rule,
dengan jumlah class 5 never 1 former dan 2 no info dari hasil yang didapat dalam melakukan prediksi
penyakit diabetes.
Kata kunci : Data Mining, Klasifikasi, C4.5 Decision Tree, Diabetes Mellitus.
PENDAHULUAN
Diabetes mellitus adalah penyakit metabolis yang kronis yang mana pesien penyakit
diabetes tidak menghasilkan jumlah insulin yang cukup atau bisa dikatakan tubuh
pasien tidak sanggup memanfaatkan insulin dengan baik sehingga menyebabkan gula
darah di dalam tubuh mengalami jumlah yang berlebihan, kondisi ini sering kali
dirasakan setelah komplikasi terjadi pada organ tubuh. Pasien didiagnosa menderita
penyakit diabetes pada saat kadar glukosa darahnya melebihi nilai normal. Penyakit
diabetes mellitus adalah penyakit yang memeiliki kompleksitas tinggi, perawatan medis
yang berkelanjutan sangat dibutuhkan guna menurunkan dampak komplikasi dengan
pengecekan glekemik. Banyaknya penderita diabetes dari tahun ke tahun semakin
bertambah. Pasien diabetes di Indonesia sebesar 10 juta jiwa di tahun 2015. Merajuk
pada data Federasi
Diabetes Internasional, diprediksi penderita penyakit diabetes di Indonesia akan
bertambah menjadi 16.2 juta pada tahun 2040 . Guna menyikapi masalah ini, perlu
adanya pendeteksian sejak dini penyakit diabetes. Deteksi sejak dini diharapkan dapat
menurunkan resiko komplikasi pada pasien diabetes diwaktu mendatang. Guna
menganalisa pasien pengidap penyakit Diabetes sejak dini, Pencatatan terhadap
penyakit ini banyak dilakukan agar dapat dilakukan pencegahan. Salah satu yang
pencatatan yang bisa dilakukan adalah dengan memanfaatkan teknik klasifikasi dengan
data mining.
Landasan Teori
1. Data Mining
Metode yang dipakai untuk menggali informasi yang belum ditemukan dengan cara
manual dari suatu kumpulan data disebut dengan data mining Sejak tahun 1990,
sudah mulai dikenal istilah data mining hal ini karena kebutuhan mengolah data
adalah hal yang bermanfaat dan sangat perlu dilakukan dari bermacam bidang ilmu,
dalam bidang kesehatan, akademik, bahkan industri Ilmu Data mining adalah
perpaduan ilmu dari artificial intelligence, statistik, dan penelitian basis data yang
selalu meningkat. Menurut artikel metode data mining merupakan sebuah proses
menentukan ikatan yang mengandung arti, pola, dan keterkaitan dengan mengolah
kelompok data. Dalam data mining terdapat 6 metode yang biasa di jalankan yaitu
ramalan atau prediksi, penggambaran atau deskripsi, klasifikasi, estimasi, asosiasi
dan clustering.
Metode Penenlitian
Dataset diabetes yang digunakan adalah data sekundr dari dataset prediksi diabetes.
Data terdiri atas1000 data. Data tersebut mencakup fitur seperti usia,jenis
kelamin,indeks masa tubuh (BMI) hipertensi,penyakit jantung, riwayat merokok, kadar
HbA1C, dan kadar glukosa darah.
Tabel 1 Data Prediksi Diabetes
Decision tree
Decision tree adalah algoritma supervised machine learning yang digunakan untuk
memecahkan masalah klasifikasi. Tujuan utama menggunakan algoritma decision tree,
karena algoritma C4.5 mampu menghasilkan model prediksi secara spesifik dalam
bentuk aturan yang mudah untuk diimplementasikan. Dalam decision tree memiliki
root node dan internode untuk melakukan prediksi dan klasifikasi.
Evaluasi Performance
Evaluasi kinerja model klasifikasi yang dihasilkan, dilihat berdasarkan pada hasil
pengujian objek yang diprediksi dengan benar dan salah. Model klasifikasi akan
ditentukan nilai akurasi. Akurasi dalam klasifikasi menentukan persentase ketepatan
record data yang di klasifikasikan secara benar. Hasil hitungan, ditabulasi kedalam
bentuk confusion matrix yang memiliki jumlah nilai true positif (TP), false negative (FN)
dan true negative (TN).
Gambar 3
Confusion Matrik Decision Tree Algoritma C4.5
Pada gambar 2 diatas dapat dilihat bahwa pred never dengan recall true never adalah
92,74 % dan class precision 41,22%. pred no info dengan recall 37,61% dan class
precision 81,99%. Pred former dengan nilai true former 2,25% dan class precision
100%dari data di dapat.
kesimpulan
Pendeteksian penyakit diabetes menjadi salah satu hal yang sangat penting dalam dunia
medis. Dalam penelitian yang dilakukan adalah membuat model prediksi penyakit
diabetes dilakukan dengan menggunakan algoritma decision tree c4.5. pred never
dengan nilai class precision 41,22% dan pred no info dengan nilai class precision
81,99% dan pred former dengan nilai precision 100% dengan 8 rule yaitu 5 never,1
former dan 2 no info dari data diatas.
DAFTAR PUSTAKA