Anda di halaman 1dari 5

Implementasi Algoritma Decision Tree Untuk Klasifikasi Data

Prediksi Diabetes

Pramana Dwi Julianto, Agus Priyanto, Edo Yosia Limbong


Program Teknik Industri, Fakultas Teknologi Industri
Institut Teknologi Batam, Indonesia

*Corresponding author:

Abstraks

Diabetes Melitus (DM) adalah salah satu penyakit penyakit kronis yang menyebabkan kematian.
Peningkatan gula darah yang tidak terkontrol, teridentifikasi dan tidak terprediksi dengan cepat
mengakibatkan terjadinya komplikasi. Dalam data mining telah banyak menggunakan pendekatan-
pendekatan dalam melakukan prediksi penyakit salah satu nya penggunaan algortima decison tree C4.5.
Motif dari penelitian ini adalah membangun sebuah model prediksi kemungkinan diabetes pasien dengan
algoritma C4.5 dan melihat akurasi dari model yang dihasilkan. Model prediksi dibuat dengan
menggunakan data prediksi kemungkinan diabetes. Model prediksi dengan algoritma decision tree C4.5
memiliki akurasi 41,22% pred ever, 81,99% pred no info dan 100% pred former. menghasilkan 8 rule,
dengan jumlah class 5 never 1 former dan 2 no info dari hasil yang didapat dalam melakukan prediksi
penyakit diabetes.

Kata kunci : Data Mining, Klasifikasi, C4.5 Decision Tree, Diabetes Mellitus.

PENDAHULUAN
Diabetes mellitus adalah penyakit metabolis yang kronis yang mana pesien penyakit
diabetes tidak menghasilkan jumlah insulin yang cukup atau bisa dikatakan tubuh
pasien tidak sanggup memanfaatkan insulin dengan baik sehingga menyebabkan gula
darah di dalam tubuh mengalami jumlah yang berlebihan, kondisi ini sering kali
dirasakan setelah komplikasi terjadi pada organ tubuh. Pasien didiagnosa menderita
penyakit diabetes pada saat kadar glukosa darahnya melebihi nilai normal. Penyakit
diabetes mellitus adalah penyakit yang memeiliki kompleksitas tinggi, perawatan medis
yang berkelanjutan sangat dibutuhkan guna menurunkan dampak komplikasi dengan
pengecekan glekemik. Banyaknya penderita diabetes dari tahun ke tahun semakin
bertambah. Pasien diabetes di Indonesia sebesar 10 juta jiwa di tahun 2015. Merajuk
pada data Federasi
Diabetes Internasional, diprediksi penderita penyakit diabetes di Indonesia akan
bertambah menjadi 16.2 juta pada tahun 2040 . Guna menyikapi masalah ini, perlu
adanya pendeteksian sejak dini penyakit diabetes. Deteksi sejak dini diharapkan dapat
menurunkan resiko komplikasi pada pasien diabetes diwaktu mendatang. Guna
menganalisa pasien pengidap penyakit Diabetes sejak dini, Pencatatan terhadap
penyakit ini banyak dilakukan agar dapat dilakukan pencegahan. Salah satu yang
pencatatan yang bisa dilakukan adalah dengan memanfaatkan teknik klasifikasi dengan
data mining.

Landasan Teori
1. Data Mining
Metode yang dipakai untuk menggali informasi yang belum ditemukan dengan cara
manual dari suatu kumpulan data disebut dengan data mining Sejak tahun 1990,
sudah mulai dikenal istilah data mining hal ini karena kebutuhan mengolah data
adalah hal yang bermanfaat dan sangat perlu dilakukan dari bermacam bidang ilmu,
dalam bidang kesehatan, akademik, bahkan industri Ilmu Data mining adalah
perpaduan ilmu dari artificial intelligence, statistik, dan penelitian basis data yang
selalu meningkat. Menurut artikel metode data mining merupakan sebuah proses
menentukan ikatan yang mengandung arti, pola, dan keterkaitan dengan mengolah
kelompok data. Dalam data mining terdapat 6 metode yang biasa di jalankan yaitu
ramalan atau prediksi, penggambaran atau deskripsi, klasifikasi, estimasi, asosiasi
dan clustering.

Metode Penenlitian
Dataset diabetes yang digunakan adalah data sekundr dari dataset prediksi diabetes.
Data terdiri atas1000 data. Data tersebut mencakup fitur seperti usia,jenis
kelamin,indeks masa tubuh (BMI) hipertensi,penyakit jantung, riwayat merokok, kadar
HbA1C, dan kadar glukosa darah.
Tabel 1 Data Prediksi Diabetes

Jenis sakit riwayat Tingkat


kelamin Usia Hipertensi jantung perokok bmi HbA1c_level Gula Darah Diabetes
Female 80.00.00 0 1 never 25.19.00 06.06 140 0
Female 54.00.00 0 0 No Info 27.32.00 06.06 80 0
Male 28.00.00 0 0 never 27.32.00 05.07 158 0
Female 36.00.00 0 0 current 23.45 05.00 155 0
Male 76.00.00 1 1 current 20.14 04.08 155 0
Female 20.00 0 0 never 27.32.00 06.06 85 0
Female 44.00.00 0 0 never 19.31 06.05 200 1
Female 79.00.00 0 0 No Info 1,018056 05.07 85 0
Male 42.00.00 0 0 never 33.64 04.08 145 0
Female 32.00.00 0 0 never 27.32.00 05.00 100 0
Female 53.00.00 0 0 never 27.32.00 06.01 85 0
Female 54.00.00 0 0 former 54.07.00 06.00 100 0
Female 78.00.00 0 0 former 36.05.00 05.00 130 0
https://www.kaggle.com/datasets/iammustafatz/diabetes-prediction-dataset
Pembagian Dataset
Dataset diabetes dibagi menjadi data training dan data testing. Data training digunakan
untuk menghasilkan model prediksi dengan menggunakan algoritma decision tree C4.5
dan data testing digunakan untuk melihat performa model prediksi yang dihasilkan.
Pembagian data training dan data testing dalam penelitian ini menggunakan metode k
fold cross validation dengan jumlah fold = 6. berikut ini merupakan merupakan proses
klasifikasi data presiksi diabetes menggunakan rapidminer.

Gambar 1. Proses klasifikasi menggunakan Aplikasi RapidMiner

Decision tree
Decision tree adalah algoritma supervised machine learning yang digunakan untuk
memecahkan masalah klasifikasi. Tujuan utama menggunakan algoritma decision tree,
karena algoritma C4.5 mampu menghasilkan model prediksi secara spesifik dalam
bentuk aturan yang mudah untuk diimplementasikan. Dalam decision tree memiliki
root node dan internode untuk melakukan prediksi dan klasifikasi.

Evaluasi Performance
Evaluasi kinerja model klasifikasi yang dihasilkan, dilihat berdasarkan pada hasil
pengujian objek yang diprediksi dengan benar dan salah. Model klasifikasi akan
ditentukan nilai akurasi. Akurasi dalam klasifikasi menentukan persentase ketepatan
record data yang di klasifikasikan secara benar. Hasil hitungan, ditabulasi kedalam
bentuk confusion matrix yang memiliki jumlah nilai true positif (TP), false negative (FN)
dan true negative (TN).

Hasil Dan Pembahasan


Gambar 2
Decision Tree prediksi
Decision Tree prediksi diabetes dapat dilihat pada gambar 1 dengan menggunakan
algoritma C4.5 dari data yang diambil bahwa umur yang beresiko terkena diabetes yaitu
lebih dari 13 tahun dengan index masa tubuh kurang dari 55,155 dengan tingkat gula
darah kurang dari 290 dan terdapat 8 rule, 5 never , 1 former,2 no info pada gambar
diatas.

Gambar 3
Confusion Matrik Decision Tree Algoritma C4.5

Pada gambar 2 diatas dapat dilihat bahwa pred never dengan recall true never adalah
92,74 % dan class precision 41,22%. pred no info dengan recall 37,61% dan class
precision 81,99%. Pred former dengan nilai true former 2,25% dan class precision
100%dari data di dapat.

kesimpulan
Pendeteksian penyakit diabetes menjadi salah satu hal yang sangat penting dalam dunia
medis. Dalam penelitian yang dilakukan adalah membuat model prediksi penyakit
diabetes dilakukan dengan menggunakan algoritma decision tree c4.5. pred never
dengan nilai class precision 41,22% dan pred no info dengan nilai class precision
81,99% dan pred former dengan nilai precision 100% dengan 8 rule yaitu 5 never,1
former dan 2 no info dari data diatas.
DAFTAR PUSTAKA

ADA, “Classification and Diagnosis of Diabetes Mellitus,” Stand. Med. Care


Diabetes, vol. 39, no. January, 2016, doi: 10.1016/B978-0-323-18907-1.00038-X.
F. Gorunescu, Data Mining: Concepts, Models, and Techniques. Springer, 2011.
Khairani, “Pengetahuan Diabetes Mellitus Dan Upaya Pencegahan Pada Lansia Di
Lam Bheu Aceh Besar,” Pengetah. Diabetes Mellit. Dan Upaya Pencegah. Pada Lansia Di
Lam Bheu Aceh Besar, vol. 3, no. 3, pp. 58– 66, 2012.
Nurlina, “Jurnal Media Keperawatan : Politeknik Kesehatan Makassar Jurnal
Media Keperawatan : Politeknik Kesehatan Makassar,” J. Media Keperawatan Politek.
Kesehat. Makassar, vol. 10, no. 01, pp. 59– 66, 2019.
R. Dita Merawati, “Penerapan Data Mining Penentu Minat Dan Bakat Siswa Smk
Dengan Metode C4 . 5,” J. Algor, vol. 1, no. 1, pp. 28–37, 2019.
Suwarno and AA Abdillah, “Penerapan Algoritma Bayesian Regularization
Backpropagation Untuk Memprediksi Penyakit Diabetes,” J. MIPA, vol. 39, no. 2, pp.
150–158, 2017.

Anda mungkin juga menyukai