DM 2651
DM 2651
2.1 Dataset
Pada projek ini saya menggunakan dataset yang diambil dari situs Kaggle
(https://www.kaggle.com/sulianova/cardiovascular-disease-dataset/version/1).
Dengan nama cardio_train.csv dimana didalam dataset tersebut terdapat 70.000
data pasien yang mempunyai dan tidak mempunyai penyakit jantung.
2.2 Algorithm
Pada projek ini saya menggunakan algoritma supervised learning bernama K-
Nearest Neighbor dimana Tujuan dari algoritma ini adalah untuk
mengklasifikasikan obyek baru berdasarkan atribut dan sample sample dari training
data. Kelebihan KNN (K-Nearest Neighbor):
3.2 Modules
3.3 Results
Pada penelitian ini digunakan 70.000 data pasien yang didapat melalui website
kaggle.com. Dimana 65.04% merupakan wanita dan 34.96% laki laki
Hasil dari penelitian yang dilakukan dengan menggunakan metode supervised
learning K-Nearest Neighbor ini didapat bahwa penyakit jantung memiliki
kecenderungan pada seorang perempuan, bisa dilihat pada diagram dibawah.