Anda di halaman 1dari 1

APPLICATION OF DATA MINING ON DETERMINATING THE

SURVIVABILITY FROM HEART ATTACK PATIENT

Penyakit jantung merupakan gangguan yang terjadi pada sistem pembuluh darah besar sehingga
menyebabkan jantung dan peredaran darah tidak berfungsi dengan baik.Penyakit ini dapat menyebabkan
kematian oleh penderitanya. Oleh karena itu, penyakit perlu diantisipasi agar dapat diketahui lebih dini dan
diobati atau terapi sesegera mungkin untuk mengurangi kematian atau memperpanjang kelangsungan
hidup pasien

AIM & OBJECTIVES DATA

Dengan bantuan teknologi, data hasil analisis biostatistik dapat


diolah dengan teknik data mining untuk membentuk korelasi antar
1 Sumber : DatasetHeart Failure Clinical Records
dari website UCI Machine Learning Repository.

data dari data historis yang ada sehingga dapat dijadikan alat 2 Jumlah Observasi : 299 pasien gagal jantung.

3
prediksi jika diimplementasikan dari pola yang terbentuk Variabel Target : Death Event
sebelumnya. Penelitian ini bertujuan untuk memprediksi
kelangsungan hidup pasien gagal jantung berdasarkan atribut
yang digunakan
4 Variabel prediktor : age, creatinine_phosphokinase,
ejection fraction, platelets , serum creatinine, serum
sodium, time, anemia, diabetes, high blood pressure,

smoking, sex

METHOD

1. Feature Selection 2. -
Data Pre Processing

Variabel Identification
Univariate Analysis
Deteksi Missing Value

Bivariate Analysis Deteksi Outlier

Transformasi Data

3. ML Trained Model

Berdasarkan hasil feature selection, seluruh variabel prediktor


Decision Tree DT ( ) Random Forest RF ( ) masuk dalam pembentukan model. Hal ini mempertimbangkan
Naive Bayes NB ( ) Adaboost
bahwa berdasarkan hasil matriks korelasi hanya satu variabel
K Nearest Neighbor KNN ( ) Neural Network NN ( ) numerik yang memiliki nilai korelasi > 0.5.
Support Vector Machine SVM ( )

RESULT
ML Trained Model

Data Exploration Metode Akurasi Sensitivity Specifiity


=5
0,8 0,87 0,63
Model KNN dengan k
DT

0,65 0,92 0,46


Pola hubungan antara variabel age, serum creatine,
serum sodium, time dengan kematian karena NB Metode terbaik untuk
serangan jantung cenderung memiliki hubungan mengklasifikasikan kejadian
yang positif, sedangkan variabel creatine KNN 0,98 1 0,94 kematian pasien gagal jantung
0,85 0,9 0,75
phospokinase, platelets tidak terlihat memiliki
hubungan dengan variabel status kematian SVM pada penelitian ini adalah metode

RF 0,83 0,88 0,79 K-Nearest Neighbour dengan k =


5 dan akurasi sebesar 98,33%.
Berdasarkan chi-square test tidak ada variabel
kategorik yang signifikan berhubungan dengan ADB
0,78 0,63 0,85

0,82 0,85 0,74


variabel target.
ANN

CONCLUSION REFERENCES

Data Mining sangat berguna dalam mencari pola yang akurat dalam mengestimasi kematian [1] Novaldy, Firza.(2021). Penerapan PSO Pada
pasien penyakit gagal jantung. Naive Bayes Untuk Prediksi Harapan Hidup
Penggunaan banyak variabel dalam kasus ini tetap dapat membentuk model yang akurat Pasien Gagal Jantung. Journal Responsif. pp 37-43
walaupun banyak dari variabel yang bersangkutan tidak memiliki hubungan yang kuat dengan
variabel target berdasarkan analisis bivariat [2] Yunus, Ryan dkk. (2021). Application of the K-
Metode terbaik berdasarkan penelitian ini adalah metode K-Nearest Neighbour dengan k = 5 Nearest Neighbors (KNN) Algorithm for
Pada penelitian selanjutnya dapat dilakukan dengan menggunakan lebih banyak observasi Classification of Heart Failure. Journal of Applied
ataupun pengujian dengan metode lain seperti cross-validation. Intelligent System. Vol.6 No.1, 2021, pp 1-9

Anda mungkin juga menyukai