[Jakarta, Indonesia]
Universitas Budi Luhur 1
e-mail: 1 2111601957@Student.budiluhur.ac.id,
ABSTRACT
Heart disease is a major problem in the world of health. In 2015, data from the World Health Organization (WHO)
stated that around 17 million more people in the world died due to heart disease and blood vessel damage. where
death is equivalent to 31% of the total number of deaths worldwide. About 8.7 million people die due to heart
disease. This disease phenomenon usually occurs in developing countries where the average population has a lower
middle income. This paper aims to explain data mining methods from various writings in predicting heart disease
based on the type of chest pain experienced by the patient. The results show that the variables that are often used in
research are age, gender, type of chest pain, blood sugar, cholesterol, and heart rate. While the method with the best
level of accuracy is the neural network.
Keywords: Data Mining, Preprocessing Techniques, Heart Disease, Review
ABSTRAK
Penyakit jantung menjadi masalah utama dalam dunia kesehatan. Pada tahun 2015 data World Health Organization
(WHO) menyatakan bahwa sekitar 17 juta lebih orang di dunia meninggal diakibatkan oleh penyakit jantung dan
kerusakan pembuluh darah. Dimana kematian itu setara dengan 31% dari jumlah kematian yang ada diseluruh dunia.
Adapun sekitar 8,7 juta orang meninggal diakibatkan oleh penyakit jantung. Fenomena penyakit ini biasanya terjadi
di negara berkembang dimana rata-rata penduduknya memiliki penghasilan menengah kebawah. Tulisan ini
bertujuan untuk menjelaskan metode data mining dari berbagai tulisan dalam memprediksi penyakit jantung
berdasarkan tipe nyeri dada yang dialami pasien. Adapun hasilnya menunjukkan bahwa variabel yang sering
digunakan dalam penelitian adalah usia, jenis kelamin, tipe sakit dada, gula darah, kolesterol, dan detak jantung.
Sementara metode dengan tingkat akurasi terbaik adalah Neural Network.
Kata Kunci : Data mining, teknik pra-pemrosesan data, penyakit jantung, review
1. PENDAHULUAN
Penyakit jantung menjadi masalah utama dalam dunia kesehatan. Pada tahun 2015 data World Health Organization
(WHO) menyatakan bahwa sekitar 17 juta lebih orang di dunia meninggal diakibatkan oleh penyakit jantung dan
kerusakan pembuluh darah. Dimana kematian itu setara dengan 31% dari jumlah kematian yang ada diseluruh dunia.
Adapun sekitar 8,7 juta orang meninggal diakibatkan oleh penyakit jantung. Fenomena penyakit ini biasanya terjadi
di negara berkembang dimana rata-rata penduduknya memiliki penghasilan menengah kebawah.
Dalam indrustri kesehatan dan medis keakuratan prediksi sebuah penyakit sangatlah penting dan memerlukan
keputusan yang efektif dalam mengambil suatu analisa dan keakuratan prediksi suatu penyakit yang diderita pasien.
Penyakit jantung (Hananta & Muhammad, 2011) adalah terjadinya terganggunya keseimbangan antara suplai dan
kebutuhan darah yang terjadi akibat penyumbatan pembuluh darah. Kematian akibat penyakit jantung mencapai
959.227 pasien, yakni 41,4 % dari seluruh kematian atau setiap hari 2600 penduduk meninggal akibat penyakit
jantung (Hananta & Muhammad, 2011).
Metode prediksi penyakit jantung banyak diusulkan dengan mengunakan Genetic Algorithm (Anbarasi, Anupriya, &
Iyengar, 2010), native bayes dan decision trees (Palaniappan & Awang, 2008), decision support naïve bayes
(Subbalakshmi, Ramesh, & Chinna Rao, 2011), Multilayer Perceptron (Khemphila & Boonjing, 2011). Faktor gejala
yang terdiagnosa sebagai penyakit jantung antara lain adalah jenis sakit dada (cheasr pain), tekanan darah tinggi
(tresbps), kolesterol (chol), nilai tes EKG (resting electrodiagraphic ”restacg”)), denyut jantung (thalach) dan kadar
gula (fasting blood sugar “FBS”) (Mahmood & Kuppa, 2010). Dan beberapa factor lainnya yang menindentifikasi
bahwa seseorang mempunyai penyakit jantung.
Penyakit jantung meliputi aortic regurgition, cardiogenic shock, congenital heart disease, cardiomyopathy,
peripartum cardiomyopa-thy, tricuspid regurgitation (Hananta & Muhammad, 2011) yang sering menjangkit pada
anak-anak, orang dewasa dan tetap menjadi masalah utama di Negara-negara berkembang. Pada studi ini akan
menggunakan algoritma neural network dengan optimal sehingga hasil prediksi yang didapat lebih akurat. Dan bisa
digunakan untuk prediksi penyakit jantung lebih baik.
6. KESIMPULAN
Berbagai macam literatur telah dikumpulkan mengenai klasifikasi variabel, teknik data preprocessing, dan metode
yang digunakan untuk memprediksi penyakit jantung. Dari beberapa literatur yang telah di review tersebut, kita
dapat menyimpulkan bahwa variabel yang paling sering digunakan adalah usia, jenis kelamin, tipe sakit dada, gula
darah, kolesterol, dan detak jantung. Sementara metode yang lebih sering digunakan adalah naïve bayes dengan
tingkat akurasi 70%-86%. Tingkat akurasi tertinggi adalah penelitian yang menggunakan neural network yang
mencapai nilai sebesar 90%-95%. Jadi dari penelitian diatas metode paling akurat adalah neural network untuk
memprediksi penyakit jantung berdasarkan tipe nyeri yang dialami pasien.
DAFTAR PUSTAKA
A. A. Bakar and F. Febriyani, “Rough Neural Network Model for Tuberculosis Patient Categorization,” in
Proceedings of the International Conference on Electrical Engineering and Informatics, 2007, no. 1, pp. 765–768.
A. Riani, Y. Susianto, N. Rahman, “mplementasi Data Mining Untuk Memprediksi Penyakit Jantung Mengunakan
Metode Naive Bayes”, Journal of Innovation Information Technology and Application (JINITA), Vol. 1, no. 1, pp
25-34, 2019.
A. N. Sari , S. Alfionita, “Klasifikasi Penyakit Jantung Menggunakan Metode Naïve Bayes”, AMRI (Analisa,
Metode, Rekayasa, Informatika) Vol. 1, No. 1, April 2022, pp. 22~26.
B. Azhar, W.K. Sari, “Penerapan Data Mining Dan Teknologi Machine Learning Pada Klasifikasi Penyakit
Jantung”, Jurnal Sistem Informasi, Vol. 14, no. 1, pp. 2560- 2568, 2022.
B. Rifai, “Algoritma Neural Network Untuk Prediksi Penyakit Jantung”, Techno Nusa Mandiri, Vol. 9, no. 1, pp. 1-
9, 2013.
D. Maulana, R. Yahya, “Implementasi Algoritma Naïve Bayes Untuk Klasifikasi Penderita Penyakit Jantung Di
Indonesia Menggunakan Rapid Miner, SIGMA – Jurnal Teknologi Pelita Bangsa, Vol. 10 No. 2, ISSN : 2407-3903
2019
J. Han and M. Kamber, “Data Mining: Concepts and Techniques, Second”. San Francisco, Canada: Morgan
Kaufmann Publishers, 2006, p. 772.
S. B. Kotsiantis, D. Kanellopoulos, and P. E. Pintelas, “Data Preprocessing for Supervised Learning,” International
Journal of Computer Science (IJCS), vol. 1, no. 2, pp. 111–117, 2006.
T. Asha, S. Natarajan, and K. N. B. Murthy, “A Data Mining Approach to the Diagnosis of Tuberculosis by
Cascading Clustering and Classification,” Journal of computing, vol. 3, no. 4, 2011.