Anda di halaman 1dari 7

“Prediksi Penyakit Malaria Menggunakan Algoritma Decision Tree

C4.5”

Dosen Pengampu : HANI NURHAYATI, M.T

Disusun Oleh :
Hikmah Damasta Ribilanam (17650062)
Mata Kuliah : Kecerdasan Buatan D

UIN MAULANA MALIK IBRAHIM MALANG


FAKULTAS SAINS DAN TEKNOLOGI
JURUSAN TEKNIK INFORMATIKA
2020
BAB I
PENDAHULUAN
1.1 Latar Belakang
Data mining adalah proses mengidentifikasi pola tersembunyi dalam data untuk
mendapatkan informasi atau pengetahuan yang berguna dalam jumlah data yang besar. Ada
beberapa teknik data mining, salah satunya adalah Decision Tree dengan menggunakan
algoritma C4.5. Algoritma C4.5 merupakan salah satu metode klasifikasi dan prediksi
karena memiliki banyak kelebihan, sehingga banyak digunakan dalam pengambilan
keputusan. Beberapa keunggulan algoritma ini dapat menangani pemangkasan, menangani
data numerik diskrit, dapat menangani nilai atribut yang hilang, dan menghasilkan aturan
yang mudah diinterpretasikan.
Kemajuan algoritma C4.5 yang begitu pesat telah memperoleh banyak manfaat seperti
halnya dalam bidang kesehatan. Data mining dengan teknik pembelajaran mesin yang
canggih dapat dijadikan penelitian dalam bidang medis untuk mengidentifikasi berbagai
masalah kesehatan. Pengetahuan yang diperoleh dengan teknik ini dapat membantu dalam
mempercepat proses diagnosis beberapa penyakit salah satunya seperti penyakit malaria.
Malaria adalah penyakit infeksi menular yang menyebar melalui gigitan nyamuk. Gigitan
nyamuk tersebut menyebabkan parasit masuk ke dalam tubuh manusia. Parasit ini akan
menetap di organ hati sebelum siap menyerang sel darah merah. Parasit malaria ini
bernama Plasmodium. Jenis Plasmodium pun bermacam - macam dan akan berpengaruh
terhadap gejala yang ditimbulkan serta pengobatannya. Malaria bisa sembuh secara total bila
ditangani dengan tepat. Namun jika tidak ditangani, penyakit ini bisa berakibat fatal dari
menyebabkan anemia berat, gagal ginjal, hingga kematian. Di Indonesia, jumlah penderita
malaria cenderung menurun dari tahun ke tahun. Namun, beberapa provinsi di Indonesia
masih banyak yang menderita malaria, terutama di wilayah timur Indonesia, yaitu Papua dan
Papua Barat. Sementara itu, provinsi DKI Jakarta dan Bali sudah masuk ke dalam kategori
provinsi bebas malaria.
Meski belum ada vaksinasi untuk mencegah malaria, dokter dapat meresepkan obat
antimalaria sebagai pencegahan jika seseorang berencana bepergian atau tinggal di area yang
banyak kasus malarianya. Selain itu, pencegahan bisa dilakukan dengan menghindari gigitan
nyamuk dengan memasang kelambu pada tempat tidur, menggunakan pakaian lengan
panjang dan celana panjang, serta menggunakan krim atau semprotan anti nyamuk. Langkah
pencegahan gigitan nyamuk juga penting untuk selalu dilakukan pada anak - anak.
Berdasarkan uraian di atas, peneliti memilih metode Decision Tree dalam
memprediksi penyakit malaria. Dalam penelitian ini dilakukan penerapan algoritma Decision
Tree C4.5 menggunakan metode Adaboost dengan mengoptimalkan atribut-atribut yang
berasal dari Dataset untuk memprediksi penyakit malaria untuk meningkatkan akurasi.
Berdasarkan hasil penelitian sebelumnya masih belum mencapai level excellence untuk itu
akurasi model C4.5 perlu ditingkatkan dengan metode Adaboost dalam memecahkan masalah
prediksi penyakit malaria.
1.2 Rumusan Masalah
Berdasarkan latar belakang di atas, maka rumusan masalah yang akan diselesaikan
adalah bagaimana menerapkan algoritma C4.5 untuk mendeteksi penyakit malaria dan
menghitung akurasi yang diperoleh dengan metode Adaboost dalam memecahkan masalah
prediksi penyakit malaria.

1.3 Tujuan Penulisan


Tujuan dari penulisan makalah ini adalah :
1. Membangun sebuah perangkat lunak untuk mendeteksi penyakit malaria dengan
menerapkan algoritma C4.5.
2. Mengetahui sejauh mana algoritma C4.5 diterapkan dengan baik pada perangkat
lunak.

1.4 Manfaat Penulisan


Manfaat dari penelitian ini adalah :
1. Membantu mempercepat dalam mendeteksi penyakit malaria dengan menerapkan
algoritma C4.5.
2. Menambah wawasan bagi pembaca makalah yang ingin mempelajari algoritma C4.5.
BAB II
KAJIAN TEORI
2.1 Sejarah
Algoritma pertama kali ditemukan pada tahun 1979 oleh John Ross Quinlan. J. Ross
Quinlan merupakan peneliti ilmu komputer di bidang data mining dan data keputusan.
Dia telah banyak berkontribusi dalam mengembangkan algoritma pohon keputusan.
Dengan memanfaatkan teori informasi milik Shanon, terciptalah algoritma ID3. Dirasa
algoritma ini masih memiliki kekurangan, kemudian Quinlan menyempurnakan
algoritma ID3 sehingga muncul algoritma C4.5. Algoritma C4.5 memiliki beberapa
keunggulan dibanding pendahulunya seperti lebih fleksibel, tingkat akurasi yang lebih
baik, efisien, dan menghasilkan pohon keputusan yang mudah untuk diinterpresikan.
Algoritma C4.5 merupakan algoritma yang digunakan untuk membentuk pohon
keputusan (decision tree). Pohon keputusan merupakan metode klasifikasi dan prediksi
yang berguna untuk mengeksplorasi data, menemukan hubungan tersembunyi antara
sejumlah calon variabel input dengan sebuah variabel target. Algoritma ini merupakan
pengembangan dari algoritma ID3.

2.2 Data Mining

Data mining merupakan istilah yang digunakan untuk menguraikan penemuan


pengetahuan di dalam database. Data mining adalah proses yang menggunakan teknik
statistik, matematika, kecerdasan buatan, dan machine learning untuk mengekstraksi dan
mengidentifikasi informasi yang bermanfaat dan pengetahuan yang terkait dari berbagai
database besar (Turban, dkk. 2005). Data mining dibagi menjadi beberapa kelompok
berdasarkan tugas yang dilakukan yaitu :
1. Deskripsi
Deskripsi adalah menggambaran pola dan kecenderungan yang terdapat dalam data
secara sederhana. Deskripsi dari pola dan kecenderungan sering memberikan
kemungkinan penjelasan untuk suatu pola atau kecenderungan.
2. Klasifikasi
Suatu teknik dengan melihat pada kelakuan dan atribut dari kelompok yang telah
didefinisikan. Teknik ini dapat memberikan klasifikasi pada data baru dengan
memanipulasi data yang telah diklasifikasi dan dengan menggunakan hasilnya untuk
memberikan sejumlah aturan. Klasifikasi menggunakan supervised learning.
3. Estimasi
Estimasi hampir sama dengan klasifikasi, perbedaanya adalah variabel target estimasi
lebih ke arah numerik daripada ke arah kategori. Model dibangun dengan
menggunakan record lengkap yang menyediakan nilai dari variabel target sebagai
nilai prediksi.
4. Prediksi
Prediksi memiliki kesamaan dengan klasifikasi dan estimasi, perbedaanya adalah hasil
dari prediksi akan ada dimasa mendatang. Beberapa teknik yang digunakan dalam
klasifikasi dan estimasi dapat juga digunakan (untuk keadaan yang tepat) untuk
prediksi.
5. Klastering
Klastering merupakan pengelompokan record, pengamatan, atau memperhatikan dan
membentuk kelas objek-obek yang memiliki kemiripan satu dengan yang lainnya dan
memiliki ketidakmiripan dengan record-record dalam kluster lain. Klastering
menggunakan unsupervised learning.
6. Asosiasi
Tugas asosiasi atau sering disebut juga sebagai market basket analysis dalam data
mining adalah menemukan relasi atau korelasi diantara himpunan itemitem dan
menemukan atribut yang muncul dalam satu waktu. Asosiasi menggunakan
unsupervised learning. Penting tidaknya suatu aturan assosiatif dapat diketahui
dengan dua parameter, support dan confidence.

2.3 Decision Tree


Decision Tree (Pohon keputusan) merupakan metode klasifikasi dan prediksi yang
sangat kuat dan terkenal. Metode pohon keputusan mengubah fakta yang sangat besar
menjadi pohon keputusan yang merepresentasikan aturan. Aturan dapat dengan mudah
dipahami dengan bahasa alami. Pohon keputusan juga berguna untuk mengeksplorasi data,
menemukan hubungan tersembunyi antara sejumlah calon variabel input dengan variabel
target. Sebuah pohon keputusan adalah sebuah struktur yang dapat digunakan untuk membagi
kumpulan data yang besar menjadi himpunan-himpunan record yang lebih kecil dengan
menerapkan serangkaian aturan keputusan, dengan masing-masing rangkaian pembagian,
anggota himpunan hasil menjadi mirip satu dengan yang lain.

2.4 Decision Tree C4.5


C4.5 adalah algoritma yang sudah banyak dikenal dan digunakan untuk klasifikasi
data yang memiliki atribut-atribut numerik dan kategorikal. Hasil dari proses klasifikasi yang
berupa aturan-aturan dapat digunakan untuk memprediksi nilai atribut bertipe diskret dari
record yang baru. Algoritma C4.5 sendiri merupakan pengembangan dari algoritma ID3,
dimana pengembangan dilakukan dalam hal bisa mengatasi missing data, bisa mengatasi data
kontinyu, dan pruning.

BAB III
PERANCANGAN SOFTWARE

3.1 Perancangan Umum


Rancangan yang akan dibangun adalah perangkat lunak yang dapat melakukan deteksi
penyakit malaria menggunakan algoritma C4.5 sehingga menghasilkan kondisi dimana untuk
menentukan keputusan proses deteksi.

3.2 Proses
Secara garis besar proses yang akan dibangun terdiri dari tahapan klasifikasi data,
menghitung akurasi dan uji data tunggal. Secara garis besar tahapan proses perangkat
lunak tersebut digambarkan melalui flowchart sebagai berikut :
Pada bagian ini dijelaskan juga tentang gambaran sistem yang akan dibangun
menggunakan diagram pemodelan sistem UML.

Anda mungkin juga menyukai