Jenis Hepatitis PDF
Jenis Hepatitis PDF
1 JUNI 2015
ABSTRACT
In the case of hepatitis disease prediction has been solved by a method using Support Vector
Machine (SVM) .Penyakit hepatitis is an inflammatory disease of the liver due to viral infection
that attacks and cause damage to cells and organs function hati.Penyakit forerunner hepatitis is a
disease of the liver cancer. Attributes or variables that have as many as 20 attributes which
consists of 19 attributes preditor and 1 as the output destination attribute used to differentiate the
results of the examination. Invene dataset from the University of California (UCI) Machine
Learning Repository 583 as the data used and replace missing after the data is used only to
evaluate the data 153 SVMyang approach proposed in the study ini.Hasil simulations showed that
by developing this model achieved a reduction in dimensions and identification hati.Salah cancer
of the optimization algorithm is quite popular is Naïve Bayes. In this study, will be used also
classification algorithm Support Vector Machine (SVM) will be used to establish a predictive
classification model of hepatitis.
24
JURNAL KHATULISTIWA INFORMATIKA, VOL. 3, NO. 1 JUNI 2015
26
JURNAL KHATULISTIWA INFORMATIKA, VOL. 3, NO. 1 JUNI 2015
space (Bellotti & Crook, 2007).Hyperplane itu sering sangat baik: Ini mungkin
terbaik adalah hyperplane yang terletak bukan classifier terbaik dalam setiap
ditengah-tengah antara dua set obyek diberikan aplikasi, tetapi biasanya dapat
dari dua class. Hyperplane pemisah diandalkan untuk menjadi kuat dan
terbaik antara kedua class dapat melakukan dengan sangat baik (Wu,
ditemukan dengan mengukur margin 2009).
hyperplane tersebut dan mencari titik
maksimalnya.Margin adalah jarak 2.7. Confusion matrix
antara hyperplane tersebut dengan Confusion matrix memberikan
pattern terdekat dari masing-masing keputusan yang diperoleh dalam traning
class.Pattern yang paling dekat ini dan testing, confusion matrix memberikan
disebut sebagai support vector (Aydin, penilaian performance klasifikasi
Karakose & Akin, 2011). berdasarkan objek dengan benar atau
salah (Gorunescu, 2011).Confusion matrix
2.6. Naive Bayes berisi informasi aktual (actual) dan
Klasifikasi Bayes juga dikenal prediksi (predicted) pada sistem
dengan Naïve Bayes, memiliki klasifikasi.
kemampuan sebanding dengan dengan
pohon keputusan dan Neural Network Tabel 1. Confusion Matrix
(Han & Kamber, 2007). Klasifikasi Bayes Classification Predicted Class
adalah pengklasifikasian statistik yang Observed Class = Class = No
dapat digunakan untuk memprediksi Yes
probabilitas keanggotaan suatu kelas Class
(Kusrini, 2009). Naïve Bayes dapat Class a b
= Yes true (false
menggunakan penduga kernel
positive - negative -
kepadatan, yang meningkatkan kinerja
TP) FN)
jika asumsi normalitas sangat tidak Class c d
benar, tetapi juga dapat menangani = No (false (true
atribut numeric menggunakan positive - negative -
diskritisasi diawasi (Witten & Frank, FP) TN)
2011). Teknik Naïve Bayes (NB) adalah
salah satu bentuk sederhana dari Keterangan:
Bayesian yang jaringan untuk klasifikasi. True Positive (TP) = proporsi positif
Sebuah jaringan Bayes dapat dilihat dalam data set yang diklasifikasikan
sebagai diarahkan sebagai tabel dengan positif.
distribusi probabilitas gabungan lebih
dari satu set diskrit dan variabel True Negative (TN) = proporsi negative
stokastik (Pearl 1988) (Liao, 2007). dalam data set yang diklasifikasikan
Metode ini penting karena beberapa negative.
alasan, termasuk berikut. Hal ini sangat
mudah untuk membangun, tidak perlu False Positive (FP) = proporsi negatif
ada yang rumit Parameter estimasi dalam data set yang diklasifikasikan
skema berulang. Ini berarti dapat segera potitif.
diterapkan untuk besar Data set. Sangat
mudah untuk menafsirkan, sehingga FalseNegative (FN) = proporsi negative
pengguna tidak terampil dalam dalam data set yang diklasifikasikan
teknologi classifier dapat memahami negatif.
mengapa itu adalah membuat klasifikasi
itu membuat. Dan, sangat penting, hal
27
JURNAL KHATULISTIWA INFORMATIKA, VOL. 3, NO. 1 JUNI 2015
28
JURNAL KHATULISTIWA INFORMATIKA, VOL. 3, NO. 1 JUNI 2015
29
JURNAL KHATULISTIWA INFORMATIKA, VOL. 3, NO. 1 JUNI 2015
31
JURNAL KHATULISTIWA INFORMATIKA, VOL. 3, NO. 1 JUNI 2015
banyak atribut dan informasi yang swarm optimization beracuan pada nilai
digunakan akan mengakibatkan weight pada algoritma tersebut. Setelah
banyaknya waktu dan biaya yang ditemukan nilai akurasi yang paling
dikorbankan bahkan akan mengurangi ideal dari parameter tersebut langkah
tingkat akurasi dan kompleksitas yang selanjutnya adalah menentukan nilai
lebih tinggi. weight,sehingga terbentuk struktur
Mengingat pentingnya seleksi algoritma yang ideal untuk pemecahan
atribut dalam Support Vector Machine masalah tersebut.
(SVM) maka diterapkan Particle swarm Berdasarkan Tabel tersebut
optimization (PSO) untuk melakukan menunjukan bahwa, tingkat akurasi
tugas tersebut. Particle swarm dengan menggunakan algoritma SVM
optimization (PSO) diketahui dapat adalah sebesar 68,42%, dan dapat
digunakan sebagai teknik optimasi dihitung untuk mencari nilai accuracy,
untuk mengoptimalkan subset fitur. sensitivity, specificity, ppv, dan npv
Algoritma PSO sederhana dan memiliki hasilnya dan dapat dihitung untuk
kompleksitas yang lebih mencari nilai accuracy, sensitivity,
rendah.sehingga dapat memastikan specificity, ppv, dan npv pada
solusi optimal dengan menyesuaikan persamaan dibawah ini:
pencarian global dan lokal, sehingga Accuracy = TP + TN
kinerja klasifikasi Support Vector Machine = 77 + 29 = 0.6838
(SVM) dapat ditingkatkan. TP + TN + FP + FN 77 + 29 + 8 + 41
Eksperiment dilakukan kembali Sensitivity = TP = 77 = 0.6525
dengan menerapkan Particle swarm TP + FN 77+ 41
optimization (PSO) untuk seleksi atribut Specificity = TN = 29 = 0.7838
dalam Support Vector Machine (SVM) dan TN + FP 29 + 8
dilakukan penyesuaian pada parameter PPV = TP = 77 = 0.9058
C, ε dan population. Dari 20 variabel TP + FP 77+ 8
prediktor dilakukan seleksi atribut NPV = TN = 29 = 0.4142
sehingga menghasikan terpilihnya 15 TN + FN 29 + 41
atribut yang dihasilkan.
31
JURNAL KHATULISTIWA INFORMATIKA, VOL. 3, NO. 1 JUNI 2015
32
JURNAL KHATULISTIWA INFORMATIKA, VOL. 3, NO. 1 JUNI 2015
Accuracy = TP + TN
= 78 + 33
2. Kurva ROC
= 0.7161
Hasil perhitungan divisualisasikan
TP + TN + FP + FN = 78 + 33 + 7
dengan kurva ROC.Perbandingan
+ 37
kedua metode komparasi bisa
dilihat pada Gambar 3 yang
Sensitivi = TP = 78 = 0.6782
merupakan kurva ROC untuk
ty
algoritma Support Vector Machines
TP + FN 78+ 37 berbasis Naïve Bayes .Kurva ROC
Specificit = TN = 33 = 0.8250 pada gambar 3 mengekspresikan
y confusion matrix dari Tabel 4. Garis
TN + FP 33 + 7 horizontal adalah false positives dan
PPV = TP = 78 = 0.9176 garis vertikal true positives
TP + FP 78+ 7
NPV = TN = 33 = 0.4714
TN + FN 33 + 37
Gambar 3. Kurva ROC dengan Metode Support Vector Machines berbasis Naïve Bayes
33
JURNAL KHATULISTIWA INFORMATIKA, VOL. 3, NO. 1 JUNI 2015
Gambar 4. Kurva ROC Support vector machine berbasis Particle Swarm Optimization
34
JURNAL KHATULISTIWA INFORMATIKA, VOL. 3, NO. 1 JUNI 2015
35
JURNAL KHATULISTIWA INFORMATIKA, VOL. 3, NO. 1 JUNI 2015
36