diusulkan
abstrak: nave bayes, weka, klasifikasi
1. Pendahuluan
Dataset yang digunakan bersumber dari data rekam medis
penyakit jantung Cleveland yang didapatkan secara online
di UCI repository. Dataset memiliki 14 atribut, atribut yang
terakhir merupakan kelas, attribute terdiri dari age, sex, cp,
trestbps, chol, fbs, restecg, thalach, exang, oldpeak, slope,
ca, thal, num.
berdasarkan studi literature pada sebuah penelitian
tentang wawancara dokter ahli jantung menjelaskan bahwa
attribute yang digunakan untuk penyakit jantung khususnya
penyankit jantung koroner. Attribute diatas dibagi menjadi 2
bagian yang disesuaikan dengan gejala penyakit jantung
yaitu kronis dan akut. Gejala penyakit kronis memerlukan
hamper semua attribute untuk diagnose gangguan pada
jantung dimana attribute nomor 1,2,5 dan 6 merupakan
attribute bebas (penunjang). Sementara untuk gejala akut,
attribute nomor 3 sampai 7 dan 14 merupakan attribute
dalam
penyimpanan
dengan
menggunakan
teknik
bayes
reasoning.
merupakan
Algoritma
salah
nave
metode
bayes
probabilistic
bertujuan
untuk
1.
Selection
2.
Pre-Processing / Cleaning
dapat
mengalami
3.
Transformation
4.
Data mining
5.
Interpretation / evaluation
mengakibatkan
pembuluh
darah
2.1 Klasifikasi
Asap rokok
Polusi udara
1.
inteksida, cat)
2.
diklasifikasi,
3.
hakikatnya
adalah
kelainan
metabolisme.
minum-minum
merokok,
sebagainya.
jantung
misalnya
diabetes)
Obesitas dapat menyebabkan penyakit jantung karena
monitor)
(false negatife)
Precision =
3.
TP
TP+ FP
Recall
P(H|X) =
(false negative)
P ( X|H ) . P( H)
P( X )
Recall =
Keterangan:
4.
TP
TP+ FN
F-measure
penjumlahan
(posteriori probability)
dikalikan dua.
P(H)
hipotesis H
P(X)
precision
dan
recall,
kemudian
Precisionrecall
Precision+recall
: Probabilitas X
III. METODOLOGI
asli dari inputan atau dengan kata lain berisi nilai actual dan
untuk
melakukan
evaluasi
model
klasifikasi
klasifikasi
Evaluasi dan validasi hasil dapat dihitung
menggunakan rumus akurasi, precision, recall dan f-measure
berdasarkan confusion matrix
1.
dalam
memprediksi
penyakit
jantung.
Akurasi
Perhitungan akurasi dilakukan dengan cara membagi
jumlah data yang diklasifikasi secara benar dengan
total sample data testing yang diuji.
TP+TN
Akurasi =
TP+TN + FP+ FN
2.
Precision
menghitung nilai precision dengan cara membagi
jumlah data benar yang bernilai positif (true positive)
1.
2.
3.
menggunakan
yang
195 baris data (2/3 dari jumlah baris data penelitian) dan
jumlah testing terdiri dari 101 baris baris data (1/3 dari
proses
algoritma
nave
bayes
4.1.1
dipilih
untuk
kemudian
di
training
dengan
proses.
detik.
kedua
dianalisis
untuk
melihat
apakah
ada
penyakit
jantung
dengan
Aktual yang
sebenarnya
Sakit
Tidak sakit
Sakit
38
7
Prediksi
Tidak Sakit
10
46
menggunakan
TP+TN
P+ N
38+ 46
101
10+ 7
101
0,83168 = 83,17%
Error tahap pertama
FP+ FN
P+ N
0,16831 = 16,83%
Waktu proses pengujian dari data testing yang melibatkan
4.1.2
kedua
Pengujian I
Pengujian II
Atribute yang direduksi
Fbs
Jumlah attribute
13
12
Akurasi
83,17%
84,16%
Error
16,83%
15,84%
Waktu testing (detik)
0,57582
0,65077
Waktu training (detik)
0,38135
0,35456
Table 4.7 hasil pengujian percobaan tahap pertama dan
kedua
table 4.1 namun tanpa atribut fbs. Untuk proses training data
yang melibatkan 12 atribute adalah: 0,35456 detik.
Berasarkan hasil dari training data tanpa menggunakan
attribute fbs dilakukan pengujian terhadap data testing dan
diperoleh hasil prediksi yang ditampilkan dalam table
confusion matrix berikut:
Table 4.4 hasil pengujian data testing dataset tahap kedua
Aktual yang
sebenarnya
sakit
Tidak sakit
Sakit
38
6
Prediksi
Tidak Sakit
10
47
TP+TN
P+ N
38+ 47
101
0,84158 = 84,16%
FP+ FN
P+ N
10+ 6
101
0,15481 = 15,84%
84,16%
dan
nilai
error
15,84%.
Sementara
jika
[1]
[4]
[3]
[5]