Principal Component Analysis (PCA) - Reduksi Variabel Penyakit Jantung Koroner
Principal Component Analysis (PCA) - Reduksi Variabel Penyakit Jantung Koroner
Judul
• Penerapan Principal Component Analysis (PCA) untuk mereduksi variabel-variabel yang mempengaruhi penyakit
jantung koroner.
Data
• Dataset yang digunakan → data penyakit jantung koroner (Heart Disease) dari UCI machine learning repository.
• Dataset berisi 14 Variabel dengan 304 responden.
Tujuan
• Cleaning data variabel pada dataset menjadi 13 variabel dan 297 responden.
• PCA digunakan untuk mereduksi 13 Variabel dalam dataset menjadi 4 variabel yg mempengaruhi (faktor).
PROBLEM STATEMENT
Jantung merupakan organ yang sangat penting bagi manusia. Setiap manusia berpotensi terkena serangan jantung,
apabila asupan oksigen dalam tubuh kurang dan metabolisme terganggu. Salah satu yang patut dihindari yaitu
penyakit jantung koroner, yang membuat penyempitan arteri koronia sehingga jantung kekurangan oksigen.
Berbahayanya penyakit jantung koroner berakibat pada terjadi kematian pada seseorang dan membuat kerugian
ekonomi tertinggi dibanding penyakit lain. Menurut data dari World Health Organization (WHO), sekitar 50%
dari 17 juta penduduk dunia meninggal akibat jantung dan pembuluh darah. Oleh karena itu dibutuhkan suatu
algoritma yang bisa membuat keputusan untuk memprediksi penyebab penyakit jantung koroner. Dalam hal ini
metode Principal Component Analysis (PCA) digunakan sebagai fitur ekstraksi (reduksi) variabel-variabel yang
mempengaruhi penyakit jantung koroner.
13 VARIABEL PENYAKIT JANTUNG KORONER
Variabel Keterangan
Age Age in years
Sex 1 : male, 0 : female
Cp Chest Pain → 1: typical angina; 2 : atypical angina; 3 : non anginal pain; 4 : asymptomatic
Trestbps resting blood pressure (in mm Hg on admission to the hospital)
Chol serum cholestoral in mg/dl
Fbs (fasting blood sugar > 120 mg/dl) (1 = true; 0 = false)
Restecg resting electrocardiographic results 0:normal; 1: having ST-T wave abnormality (T wave inversions and/or
ST elevation or depression of > 0.05 mV); 2: showing probable or definite left ventricular hypertrophy
Thalach Maximum heart rate achieved
Exang exercise induced angina (1 = yes; 0 = no)
Oldpeak ST depression induced by exercise relative to rest
Slope the slope of the peak exercise ST segment. 1:upsloping; 2:flat; 3:downsloping
Ca number of major vessels (0-3) colored by flourosopy
Thal 3 = normal; 6 = fixed defect; 7 = reversable defect
Penerapan Principal Component Analysis untuk mereduksi variabel penyakit jantung koroner