Hairani
14/376443/PTK/10146
Supervisor
1. Dr. Noor Akhmad Setiawan, S.T., M.T.
2. Dr. Teguh Bharata Adji, S.T., M.T., M.Eng.
Latar Belakang
• Saat ini berbagai rumah sakit telah memanfaatkan peranan teknologi informasi
untuk mendukung manajemen pelayanannya. Salah satu pemanfaatan teknologi
informasi dibidang kesehatan adalah adanya rekam medis berbasis elektronik.
• Pertumbuhan data rekam medis yang begitu besar yang tersimpan pada
database telah menciptakan kondisi yang disebut rich of data but poor of
knowledge.
• Kumpulan data rekam medis yang begitu besar belum dimanfaatkan dengan
sebaiknya, sehingga data kumpulan rekam medis tersebut dibiarkan begitu saja
sehingga menjadi kumpulan data yang tidak berguna.
Rumusan Masalah
• Melakukan konfirmasi akurasi metode Correlated Naive Bayes
Classifier (C-NBC) dibandingkan algoritme Naive Bayes Classifier
(NBC) di bidang kesehatan dengan menggunakan empat dataset
yaitu Dataset Pima Indian Diabetes, Haberman, Indian Liver Patient,
dan Tyroid.
Tujuan Penelitian
• Melakukan konfirmasi apakah tingkat akurasi algoritme Correlated
Naive Bayes Classifier lebih tinggi dibandingkan tingkat akurasi
algoritme Naive Bayes Classifier di bidang kesehatan dengan
menggunakan dua dataset yaitu Dataset Pima Indian Diabetes,
Haberman, Indian Liver Patient, dan Tyroid.
Manfaat Penelitian
• menemukan algoritme yang memiliki akurasi yang paling optimal
untuk diterapkan di bidang kesehatan seperti klasifikasi penyakit,
diagnosis penyakit, dan prediksi penyakit
Keaslian Penelitian
No Nama Peneliti Tujuan Penelitian Metode
1. Shah & Jivani [4] Melakukan komparasi beberapa metode Random Forest, Naive Bayes,
klasifikasi untuk klasifikasi penyakit kanker dan KNN
payudara, kemudian memilih metode yang
memiliki akurasi paling optimal.
2. Alfisaharin & Mantoro [5] Membandingkan kinerja dari metode Naive Bayes, NBTree, dan
klasifikasi yang berbeda untuk memilih satu Decision Tree
metode dengan hasil yang paling akurat
untuk klasifikasi penyakit Liver.
Keaslian Penelitian (Lanjutan)
No Nama Peneliti Tujuan Penelitian Metode
3 Dash., et al [3] Melakukan implementasi metode naive Naive Bayes
bayes untuk klasifikasi penyakit
Hypothyroid.
4. Burhan Alfironi M., et al Meningkatkan tingkat akurasi algoritme Correlated Naive Bayes
[6] Naïve Bayes Classifier dengan Classifier (C-NBC), Naive
memperhitungkan nilai korelasi dari Bayes Classifier (NBC)
masing-masing attribute terhadap kelas.
5. Burhan Alfironi M., et al Menguji kinerja algoritme C-NBC dengan Correlated Naive Bayes
[7] NBC yang di ukur berdasarkan akurasinya Classifier (C-NBC), Naive
pada Dataset Iris, Dataset Balance Scale, Bayes Classifier (NBC)
Dataset Haberman, dan Dataset Servo.
Metodologi Penelitian
2. Haberman 306 3 2
4. Tyroid 215 6 3
Data Pre-processing
P(Kelas Tested Negative |X) = (P(Kelas Tested Negative |Age=22) * R(Kelas Tested Negative |Age = 22)) +
(P(Kelas Tested Negative | Number Times of Pregnant = 1) * R(Kelas Tested Negative | Number Times of
Pregnant = 1)) * P(X| Tested Negative) = (0,8 * 0,057) + (0,6 * 0,002) * 0,5 =0.023
Uji Normalitas :
Pengumpulan Data Pengujian Menggunakan One Sample
Mean Akurasi Kolmogrov-Smirnov
dataset Pre-Processing 10-Fold Cross Validation
Test
C-NBC 78,52
N 30 N 30
N 30 N 30
n 30 n 30
t tabel signifikan
thitung 17,057 level 0.05 thitung 7,495
df 29 ( ttabel = 1,699 ) df 29
Sig 0,000 Sig 0,000
Karena thitung = 17,057 lebih besar dari ttabel = 1,699 karena thitung = 7,495 lebih besar dari ttabel =
(17.057 > 1,699) sehingga H0 di tolak dan H1 di 1,699 (7,495 > 1,699) sehingga H2 di tolak dan
terima. Hal ini dapat disimpulkan bahwa tingkat H3 di terima. Hal ini dapat disimpulkan bahwa
akurasi algoritme Correlated Naive Bayes tingkat akurasi algoritme Correlated Naive
Classifier lebih significant dibandingkan tingkat Bayes Classifier lebih significant dibandingkan
akurasi Naive Bayes Classifier pada dataset pima tingkat akurasi Naive Bayes Classifier pada
indian diabetes. dataset haberman.
Uji Hipotesis (Lanjutan)
Tabel 4.25 Hasil Uji Paired T Test Dataset Indian Liver
Patient Tabel 4.26 Hasil Uji Paired T Test Dataset Tyroid
n 30 n 30
t tabel signifikan
thitung 128,23 level 0.05 thitung 41,987
df 29 ( ttabel = 1,699 ) df 29
Sig 0,000 Sig 0,000
Karena thitung = 128,23 lebih besar dari ttabel = 1,699 karena thitung = 41,987 lebih besar dari ttabel =
(128.23 > 1,699) sehingga H4 di tolak dan H5 di 1,699 (41,987 > 1,699) sehingga H6 di tolak dan
terima. Hal ini dapat disimpulkan bahwa tingkat H7 di terima. Hal ini dapat disimpulkan bahwa
akurasi algoritme Correlated Naive Bayes tingkat akurasi algoritme Correlated Naive
Classifier lebih significant dibandingkan tingkat Bayes Classifier lebih significant dibandingkan
akurasi Naive Bayes Classifier pada dataset indian tingkat akurasi Naive Bayes Classifier pada
liver patient. dataset Tyroid.
Kesimpulan
• Tingkat akurasi algoritme Correlated Naive Bayes Classifier (C-NBC) pada dataset pima
indian diabetes diperoleh sebesar 67,15%, tingkat akurasi algoritme Correlated Naive
Bayes Classifier (C-NBC) pada dataset haberman diperoleh sebesar 74,96%, tingkat
akurasi algoritme Correlated Naive Bayes Classifier (C-NBC) pada dataset indian liver
patient diperoleh sebesar 71,37%, tingkat akurasi algoritme Correlated Naive Bayes
Classifier (C-NBC) pada dataset tyroid diperoleh sebesar 78,52%. Kenaikan akurasi
algoritme Correlated Naive Bayes Classifier (C-NBC) dibandingkan algoritme Naive
Bayes Classifier (NBC) sebesar 5,96% untuk dataset haberman, sebesar 2,82% untuk
dataset pima indian diabetes, sebesar 26,38% untuk dataset indian liver patient, dan
sebesar 16,36% untuk dataset tyroid.
Kesimpulan (Lanjutan)
• Hasil yang diperoleh setelah dilakukan uji statistik menggunakan uji t paired
(berpasangan) pada empat dataset yang digunakan, didapatkan hasil bahwa tingkat
akurasi algoritme Correlated Naive Bayes Classifier (C-NBC) lebih signifikan
dibandingkan tingkat akurasi algoritme Naive Bayes Classifier (NBC) untuk dataset pima
indian diabetes, haberman, indian liver patient, dan Tyroid.
Saran
• Dataset yang digunakan pada penelitian ini memiliki jumlah instance
kurang dari 1000 instance, untuk kedepannya diharapkan pengujian dapat
dilakukan untuk jumlah instance dataset lebih dari 1000 instance
• Dataset yang digunakan pada penelitian sebanyak empat dataset, untuk
kedepannya diharapkan pengujian dapat dilakukan menggunakan lebih
dari dua dataset.
Terima Kasih