554 1236 1 PB PDF

Jurnal Bianglala Informatika Vol. I No.
1 September 2013
SISTEM PREDIKSI PENYAKIT DIABETES BERBASIS DECISION TREE
Anik Andriani
Manajemen Informatika
AMIK BSI Jakarta
Jl. R.S. Fatmawati No.24, Pondok Labu, Jakarta Selatan
Email: anik.aai@bsi.ac.id
ABSTRAK
Data penderita diabetes bertambah dari tahun ketahun. Tingkat diagnosa diabetes memberikan kontribusi yang
signifikan terhadap komorbiditas dan tingkat komplikasi diabetes. Berdasarkan data histori penderita diabetes
dapat dibuat rekomendasi prediksi penyakit diabetes yang membantu tenaga kesehatan. Klasifikasi merupakan
salah satu teknik dari data mining yang dapat digunakan untuk membuat prediksi. Klasifikasi dapat dilakukan
dengan decision tree salah satunya dengan algoritma C4.5. Penelitian ini bertujuan membuat klasifikasi data
diabetes dan menerapkannya dalam pembangunan sistem prediksi penyakit diabetes. Hasil klasifikasi data diabetes
dievaluasi dengan confusion matrix dan kurva ROC(Receiver Operating Characteristic) untuk mengetahui tingkat
akurasi hasil klasifikasi. Evaluasi yang dilakukan menunjukkan hasil yang termasuk Excellent Classification. Rule
hasil klasifikasi diimplementasikan untuk pembuatan sistem prediksi penyakit diabetes. Sistem yang dibangun
menggunakan Microsoft Visual Basic 6.0 dan database MySQL.
Kata kunci: Diabetes, Decision tree, Microsoft Visual Basic 6.0
ABSTRACT
Data diabetics increased from year to year. Diabetes diagnosis rate contributes significantly to the level of
comorbidities and complications of diabetes. Based on historical data diabetics can made recommendations that
help predict diabetes health professionals. Classification is one of data mining techniques that can be used to make
predictions. Classification can be done with a decision tree, one of them with the C4.5 algorithm. This study to
create a data classification of diabetes and apply them in the development of diabetes prediction system. Diabetes
data classification results are evaluated by confusion matrix and ROC(Receiver Operating Characteristic) curves to
determine the accuracy of the classification results. Evaluation results have shown that including Excellent
Classification. Rule classification results are implemented for prediction system of diabetes. The system is built
using Microsoft Visual Basic 6.0 and MySQL database.
Keyword: Diabetics, Decision tree, Microsoft Visual Basic 6.0
I. Pendahuluan diprediksikan akan terus meningkat dari tahun-

ketahun.
Menurut American Diabetes Association Diabetes adalah penyakit yang kompleks dan
(ADA, 2005), diabetes mellitus merupakan suatu rumit. Tingkat diagnosa diabetes memberikan
penyakit yang disebabkan karena kelainan sekresi kontribusi yang signifikan terhadap komorbiditas dan
insulin, kerja insulin atau bisa karena kedua-duanya tingkat komplikasi diabetes (CDA, 2008).
yang juga merupakan penyakit metabolik dengan Berdasarkan data histori penderita penyakit diabetes
karakteristik hiperglikemia. Berdasarkan data pada dapat dibuat rekomendasi prediksi penyakit diabetes
laporan World Health Organization (WHO, 2010) yang membantu tenaga kesehatan yaitu menggunakan
menyebutkan dari 57 juta kematian global di tahun klasifikasi data dengan decision tree.
2008, 36 juta atau 63% disebabkan karena penyakit Tujuan penelitian ini adalah membuat sistem
tidak menular seperti jantung, diabetes kanker, dan untuk prediksi penyakit diabetes dengan cara
penyakit pernafasan kronis. Dan angka tersebut membuat klasifikasi data penderita diabetes
menggunakan decision tree yang dapat diterapkan
1
Jurnal Bianglala Informatika Vol. I No. 1 September 2013
dengan penggunaan algoritma C4.5. Hasil klasifikasi berorientasi bertujuan secara otomatis membangun
selanjutnya diaplikasikan pada sistem prediksi model perilaku yang memperoleh sampel baru dan
penyakit diabetes yang dibangun dengan Microsoft tak terlihat dan mampu memprediksi nilai-nilai dari
Visual Basic 6.0 dan database MySQL. satu atau lebih dari variabel yang terkait dengan
sampel. Selain itu prediksi dikembangkan untuk
II. Tinjauan Pustaka memperoleh pola yang membentuk pengetahuan
dengan cara yang dapat dimengerti dan mudah
Data mining merupakan sebuah proses terpadu dioperasikan. Data mining prediction terdiri dari
dari analisis data yang terdiri dari serangkaian teknik klasifikasi dan regressi. Algoritma yang dapat
kegiatan yang berjalan berdasarkan pada digunakan untuk klasifikasi antara lain Neural
pendefinisian tujuan dari apa yang akan dianalisis Network, Bayesian Network, Decision Trees, Support
sampai pada interpretasi dan evaluasi hasil (Giudici & Vector Machine, dan Instance Based (Maimon &
Figini, 2009). Data mining juga dapat diartikan Rokach, 2010).
sebagai proses dalam menemukan pola dari sebuah Algoritma C4.5 dan decision tree merupakan
set data dimana proses tersebut harus otomatis atau dua model yang tak terpisahkan, karena untuk
biasanya semi-otomatis dan pola yang dihasilkan membangun sebuah decision tree, dibutuhan
harus berarti bahwa pola tersebut memberikan algoritma C4.5. Di akhir tahun 1970 hingga di awal
beberapa keuntungan (Witten, Frank, & Hall, 2011). tahun 1980-an, J. Ross Quinlan seorang peneliti di
bidang mesin pembelajaran mengembangkan sebuah
Klasifikasi atau taksonomi adalah proses model pohon keputusan yang dinamakan ID3
menempatkan suatu objek atau konsep kedalam satu (Iterative Dichotomiser), walaupun sebenarnya
set kategori berdasarkan objek atau konsep yang proyek ini telah dibuat sebelumnya oleh E.B. Hunt, J.
bersangkutan (Gorunescu, 2011). Ada banyak Marin, dan P.T. Stone. Kemudian Quinlan membuat
metode data mining yang digunakan untuk tujuan algoritma dari pengembangan ID3 yang dinamakan
yang berbeda-beda. Metode klasifikasi digunakan C4.5 yang berbasis supervised learning (Han &
untuk membantu dalam memahami pengelompokkan Kamber, 2006).
data. Klasifikasi sendiri merupakan cabang dari Menurut (Witten, Frank, & Hall, 2011)
discovery data mining seperti yang ditunjukkan pada serangkaian perbaikan yang dilakukan pada ID3
gambar 1 (Maimon & Rokach, 2010) . mencapai puncaknya dengan menghasilkan sebuah
sistem praktis dan berpengaruh untuk decision tree
yaitu C4.5. Perbaikan ini meliputi metode untuk
menangani numeric attributes, missing values, noisy
data, dan aturan yang menghasilkan rules dari trees.
Ada beberapa tahapan dalam membuat sebuah
decision tree dalam algoritma C4.5 (Larose, 2005)
yaitu :
1. Mempersiapkan data training. Data training
biasanya diambil dari data histori yang pernah
terjadi sebelumnya atau disebut data masa lalu
dan sudah dikelompokkan dalam kelas-kelas
tertentu.
2. Menghitung akar dari pohon. Akar akan
diambil dari atribut yang akan terpilih, dengan
Gambar 1. Data mining taksonomi cara menghitung nilai gain dari masing-masing
Sumber: (Maimon & Rokach, 2010) atribut, nilai gain yang paling tinggi yang akan
Pada gambar 1 menunjukkan data mining menjadi akar pertama. Sebelum menghitung
terdiri dari dua jenis yaitu data mining verification nilai gain dari atribut, hitung dahulu nilai
oriented yang berorientasi untuk memverifikasi data entropy. Untuk menghitung nilai entropy
pengguna dan data mining discovery oriented yang digunakan rumus :
digunakan untuk menemukan aturan baru atau pola ( )= ∑ − log
mandiri dari sebuah set data. Jenis data mining
discovery terdiri dari dua cabang yaitu prediction dan Keterangan :
description. Metode description berorientasi pada S= Himpunan kasus
interpretasi data yang berfokus pada pemahaman n = jumlah partisi S
dengan visualisasi. Sedangkan metode prediction Pi = proporsi Si terhadap S
2
Kemudian hitung nilai gain menggunakan rumus

: True Positive adalah jumlah record positif yang
diklasifikasikan sebagai positif, false positive
| | adalah jumlah record negative yang
( , )= ( )−∑ ∗
diklasifikasikan sebagai positif, false negative
( )
adalah jumlah record positif yang diklasifikasikan
Keterangan :
sebagai negative, true negative adalah jumlah
S = Himpunan Kasus
record negative yang diklasifikasikan sebagai
A = Fitur
negative, kemudian masukkan data uji. Setelah
n = jumlah partisi atribut A
data uji dimasukkan ke dalam confusion matrix,
|Si| = Proporsi Si terhadap S
hitung nilai-nilai yang telah dimasukkan tersebut
|S| = jumlah kasus dalam S
untuk dihitung jumlah sensitivity (recall),
3. Ulangi langkah ke 2 dan langkah ke 3 hingga
Specifity, precision, dan accuracy. Sensitivity
semua record terpatisi
digunakan untuk membandingkan jumlah t_pos
4. Proses partisi decision tree akan berhenti saat :
terhadap jumlah record yang positif sedangkan
a. semua record dalam simpul N mendapat
Specifity, precision adalah perbandingan jumlah
kelas yang sama.
t_neg terhadap jumlah record yang negative.
b. Tidak ada atribut didalam record yang
Untuk menghitung digunakan persamaan dibawah
dipartisi lagi
ini (Han & Kamber, 2006).
c. Tidak ada record didalam cabang yang
kosong
Se = _
Sebuah rule hasil klasifikasi dengan decision = _

tree jika diterapkan untuk prediksi perlu dilakukan
evaluasi dan validasi hasil sehingga diketahui Precision = _
_ _
seberapa akurat hasil prediksi. Untuk evaluasi dan accuracy =
validasi hasil rule klasifikasi dapat menggunakan
Sensitivity ( )
+
confusion matrix dan kurva ROC (Receiver
Operating Characteristic). ( )
1. Confusion Matrix Keterangan :
Metode ini hanya menggunakan tabel matriks t_pos = Jumlah true positives
seperti pada Tabel 1, jika dataset hanya terdiri t_neg = Jumlah true negative
dari dua kelas, kelas yang satu dianggap sebagai p = Jumlah record positives
positif dan yang lainnya negatif (Bramer, 2007). n = Jumlah tupel negatives
Evaluasi dengan confusion matrix menghasilkan f_pos = Jumlah false positives
nilai accuracy, precison, dan recall. Accuracy
dalam klasifikasi adalah persentase ketepatan 2. Kurva ROC(Receiver Operating Characteristic)
record data yang diklasifikasikan secara benar Kurva ROC menunjukkan akurasi dan
setelah dilakukan pengujian pada hasil klasifikasi membandingkan klasifikasi secara visual. ROC
(Han & Kamber, 2006). Sedangkan precision mengekspresikan confusion matrix. ROC adalah
atau confidence adalah proporsi kasus yang grafik dua dimensi dengan false positives sebagai
diprediksi positif yang juga positif benar pada garis horizontal dan true positive sebagai garis
data yang sebenarnya. Recall atau sensitivity vertical (Vercellis, 2009). The area under curve
adalah proporsi kasus positif yang sebenarnya (AUC) dihitung untuk mengukur perbedaan
yang diprediksi positif secara benar (Powers, performansi metode yang digunakan. AUC
2011). digunakan dengan menggunakan rumus (Liao,
2007):
Tabel 1 Model Confusion Matrix
Correct Classified as
θ = ∑ ∑ ψ (xt , xj )
Classification + -
+ True False
positives negatives Dimana :
1 <
- False True
positives negatives (X,Y) = =
Sumber: (Han & Kamber, 2006) 0 >
3
Professor John Kemeny dan Thomas Eugene Kurtz

Keterangan : pada pertengahan tahun 1960-an. Popularitas dan
X = Output positif pemakaian BASIC yang luas dalam berbagai jenis
Y = Output negatif komputer turut berperan dalam mengambangkan dan
memperbaiki bahasa BASIC hingga akhirnya lahir
ROC memiliki tingkat nilai diagnosa Visual Basic yang berbasis GUI (Graphic User
yaitu(Gorunescu, 2011): Interface) bersamaan dengan Microsoft Windows
(Liberty, 2005).
Akurasi bernilai 0.90-1.00 = excellent Microsoft Visual Basic 6.0 muncul pada
classification pertengahan tahun 1998. Versi ini telah
Akurasi bernilai 0.80-0.90 = good classification diimprovisasi di beberapa bagian termasuk
Akurasi bernilai 0.70-0.80 = fair classification kemampuan membuat aplikasi web meskipun kini
Akurasi bernilai 0.60-0.70 = poor classification VB6 sudah tidak didukung lagi, tetapi file runtime-
Akurasi bernilai 0.50-0.60 = failure nya masih didukung hingga Windows 7.
Sedangkan MySQL adalah sistem manajemen
Pembangunan sistem prediksi penyakit database yang bersifat bebas atau open source.
diabetes berdasarkan rule hasil klasifikasi dengan MySQL mengolah database menggunakan bahasa
decision tree yaitu dengan algoritma C4.5 dibangun SQL (Cabral & Murphy, 2009)
dengan Microsoft Visual Basic atau sering disebut
dengan VB saja. VB merupakan sebuah bahasa III.Metode Penelitian
pemrograman yang menawarkan Integrated Penelitian ini termasuk jenis penelitian
Development Environment (IDE) visual untuk eksperimen yang menggunakan data dalam
membuat program perangkat lunak berbasis sistem penelitiannya dan menghasilkan kesimpulan yang
operasi Microsoft Windows dengan menggunakan mampu dibuktikan oleh pengamatan atau percobaan.
model pemrograman (COM) (Jones, 2001). Dalam penelitian eksperimen, peneliti harus
Microsoft Visual Basic juga dapat diartikan memberikan hipotesis kerja atau membuat dugaan
sebagai sebuah aplikasi yang digunakan untuk pada kemungkinan hasil. Setelah itu peneliti bekerja
pengembangan dengan memanfaatkan keistimewaan mendapatkan data untuk membuktikan atau
konsep-konsep antar muka grafis dalam Microsoft menyangkal hipotesis. Kemudian peneliti
Windows. Aplikasi yang dihasilkan Visual Basic membangun desain eksperimental yang menurutnya
berkaitan erat dengan windows itu sendiri sehingga akan dapat memanipulasi orang atau data yang
dibutuhkan pengetahuan bagaimana cara kerja bersangkutan sehingga memperoleh informasi yang
windows (Suryana, 2009). dikehendaki (Kothari, 2004).
Visual Basic merupakan pengembangan dari Analisis data pada penelitian ini menggunakan
bahasa komputer BASIC (Beginner’s All-purpose Knowledge Discovery in Databases (KDD) yang
Symbolic Instruction Code) yang diciptakan oleh terdiri dari 9 tahap seperti pada gambar 2.
Gambar 2. Knowledge Discovery in Databases (Maimon & Rokach, 2010)
4
Gambar 3. Kerangka Pemikiran
Gambar 3 menjelaskan kerangka pemikiran dengan cara memilih data yang akan digunakan dan
dari penelitian yang akan dilakukan dimana terdiri membuang data yang missing value (bernilai
dari 9 tahap yang diadopsi dari 9 langkah KDD. kosong/tidak lengkap) dan noise (tidak tepat).
Tahap pertama yaitu tahap discovering and Hasilnya diperoleh data sejumlah 750 record.
understanding yang bertujuan memahami apa yang Setelah itu data dibagi menjadi dua yaitu data untuk
akan dilakukan dalam penelitian yaitu dilakukan klasifikasi sebanyak 700 record dan data untuk
dengan mengidentifikasi masalah dan menetapkan pengujian sistem sebanyak 50 record. Data
tujuan penelitian. Tahap kedua yaitu tahap selecting klasifikasi dibagi menjadi dua untuk testing dan
and creating dataset yang dilakukan dengan training dengan komposisi 80% dan 20% sehingga
mengumpulkan data yang akan digunakan dalam diperoleh data training sebanyak 560 record dan data
penelitian yaitu data penderita diabetes dari testing sebanyak 140 record. Tahap keempat yaitu
repository uci.edu. Tahap ketiga selanjutnya yaitu data transformation yang merupakan tahap untuk
preprocessing and cleansing yaitu memproses data mengembangkan data menjadi lebih baik sesuai
5
dengan pola informasi yang dibutuhkan. Dalam penyakit diabetes dengan menggunakan Microsoft
penelitian ini dilakukan transformasi data kedalam Visual Basic 6.0 dan database MySQL.
kategori-kategori. Tahap kelima yaitu choosing the
appropriate data mining task yaitu memilih teknik IV.Hasil dan Pembahasan
data mining yang akan digunakan. Untuk membuat
suatu prediksi penyakit diabetes dipilih data mining Klasifikasi data diabetes berbasis decision tree
klasifikasi. Tahap keenam yaitu choosing data dengan menggunakan algoritma C4.5 dilakukan
mining algorithm yaitu memilih algoritma klasifikasi menggunakan software Rapidminer 5. Hasilnya
yang akan digunakan yaitu algoritma C4.5. Tahap dievaluasi untuk mengetahui tingkat akurasi dalam
ketujuh yaitu employing data mining algorithm yaitu memprediksi penyakit diabetes sebagai berikut:
membuat klasifikasi pada dataset dengan algoritma
yang C4.5. Tahap kedelapan yaitu evaluation yang 1. Evaluasi dengan confusion matrix
dilakukan dengan mengevaluasi hasil klasifikasi Hasil evaluasi dengan confusion matrix dilakukan
untuk mengukur tingkat akurasi dalam membuat dua kali yaitu evaluasi hasil klasifikasi terhadap
prediksi penyakit diabetes. Evaluasi dilakukan data training dan evaluasi terhadap data testing.
dengan menggunakan confusion matrix dan kurva Evaluasi terhadap data training ditampilkan dalam
ROC. Tahap kesembilan yaitu using the discovered tabel 2 yang menunjukkan tingkat akurasi hasil
knowledge yaitu mengimplementasikan rule hasil klasifikasi jika diuji dengan data training sebesar
klasifikasi kedalam pembangunan sistem prediksi 87,86%.
Tabel 2. Hasil evaluasi nilai accuracy terhadap data training dengan Confusion Matrix
Evaluasi hasil klasifikasi terhadap data testing dapat diketahui tingkat accuracy terhadap data
ditampilkan dalam tabel 3. Dari tabel tersebut testing sebesar 84,29%.
Tabel 3. Hasil evaluasi nilai accuracy terhadap data testing dengan Confusion Matrix
2. Evaluasi dengan Kurva ROC dengan kurva ROC terhadap data training dapat
Hasil evaluasi dengan kurva ROC dilakukan dua dilihat pada gambar 4. Dari gambar 4 dapat
kali yaitu evaluasi hasil klasifikasi terhadap data dilihat nilai diagnosa sebesar 0,963 sehingga
training dan terhadap data testing. Evaluasi termasuk Excellent Classification.
6
Gambar 4. Kurva ROC Data Training
Evaluasi hasil klasifikasi terhadap data testing sebesar 0,941 yang termasuk Excellent
dengan kurva ROC dapat dilihat pada gambar 5. Classification.
Pada gambar 5 dapat dilihat hasil diagnosa
Gambar 5. Kurva ROC Data Testing
Berdasarkan hasil evaluasi dengan Confusion Basic 6.0 dan database MySQL. Database yang
Matrix dan Kurva ROC menunjukkan rule hasil dibuat terdiri dari 2 tabel yaitu tabel pasien dan tabel
klasifikasi untuk memprediksi penyakit diabetes prediksi.
termasuk Excellent Classification sehingga dapat Tahap setelah evaluasi hasil klasifikasi adalah
diimplementasikan kedalam sistem prediksi penyakit tahap pembangunan sistem. Alur penggunaan sistem
diabetes. Sistem dibangun dengan Microsoft Visual dapat dilihat pada gambar 6.
7
Gambar 6. Flowchart Sistem Prediksi Penyakit Diabetes
Gambar 6 menunjukkan menu utama sistem prediksi

penyakit diabetes terdapat 3 sub menu yaitu File,
Laporan, dan About Us. Sub menu file terdiri dari
input data pasien dan form prediksi. Sub menu
Laporan terdiri dari Laporan data pasien dan Laporan
hasil prediksi. Sub menu About Us berisi informasi
tentang sistem dan tata cara penggunaan. Bentuk dari
form utama dari sistem ini dapat dilihat pada gambar
7.
8
Gambar 7. Menu Utama Sistem Prediksi Diabetes secara lengkap. Tombol Simpan digunakan untuk
Pada gambar 7 dapat dilihat menu utama terdiri dari menyimpan inputan data kedalam tabel pasien. Batal
menu File yang terdiri dari sub menu Input Pasien untuk membatalkan inputan. Edit untuk mengubah
dan Prediksi Diabetes. Menu Laporan terdiri dari sub data pasien yang dapat dilakukan dengan mencari
menu Laporan Data Pasien dan Laporan Hasil dahulu data pasien dengan menginputkan nomor
Prediksi. pasien. Tombol Hapus digunakan untuk menghapus
Form input data pasien dapat dilihat pada gambar data pasien dari tabel pasien yang dapat dilakukan
8. Untuk menginput data pasien klik tombol Input dengan mencari dahulu data pasien dengan
maka otomatis tampil No.Pasien yang terdiri dari menginputkan nomor pasien. Cetak digunakan untuk
format tahun, bulan, tanggal, dan nomor urut mencetak data pasien, sedangkan laporan digunakan
pendaftaran pasien. Kemudian input data lainnya untuk mencetak laporan data pasien.
Gambar 8. Form Input Data Pasien

Form prediksi penyakit diabetes dapat dilihat pada gambar 9. Pada form tersebut kita input dulu no pasien
kemudian tekan enter, otomatis tampil data pasien sesuai yang tersimpan di database. Setelah itu input data hasil
Lab maka akan tampil Hasil Prediksi Diabetes atau Tidak.
Gambar 9. Form Prediksi Penyakit Diabetes
9
Sistem diuji menggunakan data baru sebanyak Han, J., & Kamber, M. (2006). Data Mining
50 record data. Hasil pengujian sistem menunjukkan Concepts And Techniques 2nd Edition. San
tingkat akurasi pada confusion matrix sebesar Fransisco: Elsevier.
73.33% dan 0,815 pada kurva ROC sehingga
termasuk Good Classification. Jones, P. (2001). Visual Basic: A Complete Course.
London: Continuum.
V. Kesimpulan dan Saran
Kesimpulan yang diperoleh dari penelitian ini Kothari, C. R. (2004). Research Methodology
adalah klasifikasi data penderita diabetes dengan Methods and Techniques, Second Revised Edition.
teknik data mining klasifikasi yang menggunakan New Delhi: New Age International Publishers.
algoritma C4.5 menghasilkan rule yang dapat
digunakan untuk prediksi penyakit diabetes. Larose, D. T. (2005). Discovering Knowledge in
Pengujian hasil klasifikasi menggunakan confusion Data An Introduction to Data Mining. New Jersey:
matrix dan kurva ROC menghasilkan klasifikasi yang John Willey and Sons.
termasuk Excellent Classification. Rule hasil
klasifikasi diterapkan dalam pembangunan sistem Liao, T. W. (2007). Enterprise Data Mining: A
prediksi diabetes dengan menggunakan Microsoft Review and Research Directions. Recent Advances in
Visual Basic 6.0 dan database MySQL. Hasil
pengujian sistem prediksi diabetes pada data baru Data Mining of Enterprise Data: Algorithms and
menunjukkan hasilnya termasuk Good Classification. Applications , 1-109.
Saran untuk penelitian selanjutnya adalah Liberty, J. (2005). Programming Visual Basic 2005.
komparasi dengan beberapa algoritma untuk prediksi USA: O'Reilly Media.
penyakit diabetes sehingga diperoleh algoritma
dengan tingkat akurasi tertinggi. Selain itu penelitian Maimon, O., & Rokach, L. (2010). Data Mining and
dilakukan dengan data diabetes yang lain dengan Knowledge Discovery Handbook Second Edition.
jumlah yang lebih banyak. London: Springer.
Daftar Pustaka
Powers, D. (2011). Evaluation: From Precision,
Recall and F-Measure To ROC, Informedness,
Bramer, M. (2007). Principles of Data Mining. Markedness & Correlation. Journal of Machine
United Kingdom: Springer. Learning Technologies , 37-63.
Cabral, S. K., & Murphy, K. (2009). MySQL Suryana, T. (2009). Visual Basic. Yogyakarta: Graha
Administrator's Bible. Indianapolis: Wiley Ilmu.
Publishing, Inc.
Vercellis, C. (2009). Business Intelligence. United
CDA. (2008). Clinical Practice Guidelines for the Kingdom: John Wiley and Sons.
Prevention and Management of Diabetes in Canada.
WHO. (2010). Global Status Report on
Canadian Journal of Diabetes .
noncommunicable Disease. Switzerland: WHO Press.
Giudici, P., & Figini, S. (2009). Applied Data Mining
Witten, I. H., Frank, E., & Hall, M. A. (2011). Data
for Business and Industry Second Edition. United
Mining Practical Machine Learning Tools and
Kingdom: John Willey and Sons.
Techniques Third Edition. Burlington: Elsevie
Gorunescu, F. (2011). Data Mining Concepts,
Models and Techniques. Berlin: Springer.
10

554 1236 1 PB PDF

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

554 1236 1 PB PDF

Diunggah oleh

Hak Cipta:

Format Tersedia

Jurnal Bianglala Informatika Vol. I No.

SISTEM PREDIKSI PENYAKIT DIABETES BERBASIS DECISION TREE

Kata kunci: Diabetes, Decision tree, Microsoft Visual Basic 6.0

Keyword: Diabetics, Decision tree, Microsoft Visual Basic 6.0

I. Pendahuluan diprediksikan akan terus meningkat dari tahun-

Kemudian hitung nilai gain menggunakan rumus

Sebuah rule hasil klasifikasi dengan decision = _

Professor John Kemeny dan Thomas Eugene Kurtz

Gambar 2. Knowledge Discovery in Databases (Maimon & Rokach, 2010)

Gambar 3. Kerangka Pemikiran

Gambar 4. Kurva ROC Data Training

Gambar 5. Kurva ROC Data Testing

Gambar 6. Flowchart Sistem Prediksi Penyakit Diabetes

Gambar 6 menunjukkan menu utama sistem prediksi

Gambar 8. Form Input Data Pasien

Gambar 9. Form Prediksi Penyakit Diabetes

Anda mungkin juga menyukai