DATA MINING – A
KELOMPOK 6
Dadan 1177050026
Kartika Aprila 1177050058
Pramadita Sielda Dewi 1177050089
Toni Maulana 1177050114
Muhammad Ridhwan Ramadhan 1177050124
ABSTRAK
Diabetes merupakan penyakit yang sangat mematikan terbukti dari tahun ke tahun selalu
ada yang meninggal dikarnakan pasien tersebut mengidap penyakit diabetes, banyak cara
penangguhan sejak dini untuk penyakit diabetes. Salah satunya dengan data mining klasifikasi
algoritma neural network yang dapat digunakan untuk prediksi pasien mana yang terkena
penyakit diabetes dan pasien mana yang tidak terkena penyakit diabetes dengan menggunakan
parameter dan indikator yang ada, dan tools yang digunakan adalah tools jupyter notebook.
Dari penelitian ini, didapatkan hasil bahwa Neural Network menghasilkan nilai accuracy
sebesar 64,9%yang menunjukan bahwa hasil klasifikasinya cukup, sehingga dari dataset tersebut
dapat diprediksi mana saja yang mengidap penyakit diabetes dan mana yang bukan.
Katakunci: diabetes, klasifikasi, data mining, neural network.
ABSTRACT
Diabetes is a very deadly disease. It is proven that from year to year there are always those
who die because the patient has diabetes, there are many ways to prevent diabetes from an early
age. One of them is the data mining classification algorithm, a neural network that can be used to
predict which patients have diabetes and which patients are not diabetic by using existing
parameters and indicators, and the tools used are jupyter notebook tools.
From this study, the results show that the Neural Network produces an accuracy value of
64,9% which indicates that the classification results are sufficient, so that from the dataset it can
be predicted which ones have diabetes and which are not.
Keywords: diabetes, classification, data mining, neural network.
1 PENDAHULUAN
Diabetes mellitus adalah gangguan metabolisme yang secara genetik dan klinis termasuk
heterogen dengan manifestasi berupa hilangnya toleransi karbohidrat, jika telah berkembang
penuh secara klinis maka diabetes mellitus ditandai dengan hiperglikemia puasa postprandial,
aterosklerosis dan penyakit vaskular mikroangiopati. (Fatimah, 2015)[1].
Diabetes mellitus (DM) merupakan salah satu masalah kesehatan yang besar. Data dari
studi global menunjukan bahwa jumlah penderita Diabetes Melitus pada tahun 2011 telah
mencapai 366 juta orang. Jika tidak ada tindakan yang dilakukam, jumlah ini diperkirakan akan
meningkat menjadi 552 juta pada tahun 2030. Diabetes mellitus telah menjadi penyebab dari
4,6 juta kematian. Selain itu pengeluaran biaya kesehatan untuk Diabetes Mellitus telah
mencapai 465 miliar USD. International Diabetes Federation (IDF) memperkirakan bahwa
sebanyak 183 juta orang tidak menyadari bahwa mereka mengidap DM. Sebesar 80% orang
dengan DM tinggal di negara berpenghasilan rendah dan menengah. Pada tahun 2006, terdapat
lebih dari 50 juta orang yang menderita DM di Asia Tenggara. Jumlah penderita DM terbesar
berusia antara 40-59 tahun(Trisnawati & Setyorogo, 2013)[2].
Ada beberapa jenis Diabetes Mellitus yaitu Diabetes Mellitus Tipe I, Diabetes Mellitus
Tipe II, Diabetes Mellitus Tipe Gestasional, dan Diabetes Mellitus Tipe Lainnya. Jenis Diabetes
Mellitus yang paling banyak diderita adalah Diabetes Mellitus Tipe 2. Diabetes Mellitus Tipe
2 (DM Tipe 2) adalah penyakit gangguan metabolik yang di tandai oleh kenaikan gulah darah
akibat penurunan sekresi insulin oleh sel beta pankreas dan atau ganguan fungsi insulin
(resistensi insulin)(Trisnawati & Setyorogo, 2013)[3].
Data mining adalah proses yang menggunakan teknik statistik, matematika, kecerdasan
buatan, dan machine learning untuk mengekstraksi dan mengidentifikasi informasi yang
bermanfaat dan pengetahuan yang terkait dari berbagai database besar. Istilah data mining
memiliki hakikat sebagai disiplin ilmu yang tujuan utamanya adalah untuk menemukan,
menggali, atau menambang pengetahuan dari data atau informasi yang kita miliki (Ridwan,
Suyono, & Sarosa, 2013)[4].
Neural Network adalah prosesor yang terdistribusi paralel, terbuat dari unit-unit yang
sederhana, dan memiliki kemampan untuk menyimpan pengetahuan yang diperoleh secara
eksperimental dan siap pakai untuk berbagai tujuan. [6].
Pada gambar 1 diperlihatkan bahwa neural network terdiri atas satuan-satuan pemroses
berupa neuron. Y sebagai output menerima input dari neuron X1, X2, X3, ..., Xn dengan bobot
W1, W2, W3, ...., Wn. Hasil penjumlahan seluruh impuls neuron dibandingkan dengan nilai
ambang tertentu melalui fungsi aktivasi f setiap neuron. Fungsi aktivasi digunakan sebagai
penentu keluaran suatu neuron[7].
Salah satu metode pelatihan dalam Neural Network adalah pelatihan terbimbing
(supervised learning). Pada pelatihan terbimbing diperlukan sejumlah masukan dan target
yang berfungsi untuk melatih jaringan hingga diperoleh bobot yang diinginkan[8].
Maka dalam penelitian ini penulis berfokus pada algoritma klasifikasi machine learning
yang akan digunakan adalah neural network yang bertujuan untuk mengklasifikasi diagnosa
penyakit diabetes yang ditujukan dengan besarnya akurasi setelah penulis melakukan penelitian
menggunakan tools Jupyter Notebook.
2 METODOLOGI
2) Studi Literatur
Setelah penulis memperoleh dataset, kemudian mencari literatur guna menjadikan tolak
ukur penelitian yang dilakukan.
5) Perancangan Sistem
Tahap ini merupakan tahap perancangan sistem diabetes menggunakan algoritma Neural
Network yang dibangun dengan bahasa pemrograman python. Terdapat dua proses utama
dalam perancangan sistem disini, yaitu persiapan dataset dan implementasi algoritma Neural
Network yang akan menghasilkan pasien terkena diabetes atau tidak.
Gambar 2. Flowchart
6) Implementasi
Tahap implementasi perangkat lunak dilakukan dengan menggunakan bahasa
pemrograman python dengan tools Jupyter Notebook dan algoritma Neural Network serta
rules untuk mendapatkan hasil yang diinginkan.
7) Pengujian Sistem
Pada tahap ini dilakukan pengujian terhadap performansi dan akurasi algoritma Neural
Network yang diterapkan pada System .Pengujian ini dilakukan dengan beberapa pertanyaan
untuk memprediksi pasien yang terkena diabetes, yaitu angka banyak nya kelahiran, kadar
glukosa, tekanan darah, tebal kulit, kadar insulin, BMI,riwayat diabetes, dan umur.
Proses training, learning, dan testing menggunakan model neural network dengan dataset
sebanyak 220 data sebagai berikut:
1. Dataset diambil dari UCI yaitu diabetes.csv , selanjutnya akan diolah melalui bahasa
pemrograman python dengan lingkungan jupyter notebook.
Gambar 5
4. Tingkat akurasi yang dimiliki adalah sebesar 64,9%, setelah dilakukan Cross Validasi
terhadap seluruh dataset yang akan membagi data berdasarkan 20/80 , dimana 20% adalah
data latih dan 80% adalah data uji , maka hasilnya adalah 64,9%, ini menunjukan bahwa
dimilikinya dataset yang seimbang
Gambar 7
4 KESIMPULAN
[2] Nurmila, N., & Sugiharto, A. (2005). Algoritma neural network untuk klasifikasi diabetes 1,
1–10.
[3] Ridwan, M., Suyono, H., & Sarosa, M. (2013). Penerapan Data Mining Untuk Evaluasi Kinerja
Akademik Mahasiswa Menggunakan Algoritma Neural Network. EECCIS, 7(1), 59–64.
[4] Rosyada, A., & Trihandini, I. (2010). Determinan Komplikasi Kronik Diabetes Melitus pada
Lanjut Usia Determinan of Diabetes Mellitus Chronic Complications on Elderly. Jurnal Kesehatan
Masyarakat Nasional, 395–401.
[5] Trisnawati, S. K., & Setyorogo, S. (2013). Faktor Risiko Kejadian Diabetes Melitus Tipe II Di
Puskesmas Kecamatan Cengkareng Jakarta Barat Tahun 2012. Jurnal Ilmiah Kesehatan, 5(1), 6–
11.
[6] Pradhan, M., Kohale, K., Naikade, P., et.all. (2012). Design of Classifier for Detection of
Diabetes using Neural Network and Fuzzy k-Nearest Neighbor Algorithm. International Journal
Of Computational Engineering Research. Vol.2 Issue 5.
[7] Breimen, L., Schwenk, H., Bengio, Y. (2000). Boosting Neural Network. Neural Competition
12, 1869-1807. Massachutes Institute of Technology.
[10] Bishop, M.C. (1996). Neural Network for Pattern Recognition. Oxford UK:Clarendon press.
[4] Fausset, L. (1994). Fund
BIOGRAFI PENULIS
Nama : Dadan
TL : 05 Februari 1999
Asal Daerah : Lemahsugih, Majalengka