Anda di halaman 1dari 18

Integrasi SMOTE dan Information

Gain pada Naive Bayes untuk


Prediksi Cacat Software

Akbar Noprianto – 2016240055


Martha lan Asi Dignity Sinaga – 2016240020
Rusdi Zulpikar - 2016240062
Teknik SMOTE (Synthetic Minority Over-
Sampling Technique) menghasilkan hasil yang
baik dan efektif untuk menangani
ketidakseimbangan kelas pada teknik
oversampling untuk memproses kelas
APA ITU TEKNIK minoritas (positif)
SMOTE DAN
INFORMATION
GANE? Information Gain digunakan dalam pemilihan
atribut untuk menangani kemungkinan noise
attribute.
APA YANG DI
DAPATKAN • Setelah dilakukan percobaan bahwa penerapan
DARI SMOTE model SMOTE dan Information Gain terbukti
DAN menangani imbalance class dan noise attribute
INFORMATION untuk prediksi cacat software.
GANE?
LALU BAGAIMANA KINERJA NAÏVE BAYES?

• Naive Bayes pada prediksi cacat


perangkat lunak telah menunjukkan
kinerja yang baik dan menghasilkan
probabilitas rata-rata 71 persen. Selain
itu juga merupakan classifier yang
sederhana dan waktu yang dibutuhkan
dalam proses belajar mengajar lebih
cepat dari algoritma pembelajaran
mesin lainnya.
NASA adalah dataset yang sangat
Dataset apa 
populer digunakan dalam
yang paling pengembangan model prediksi cacat
software, umum dan dapat digunakan
populer pada secara bebas oleh para peneliti. Dari
penelitian yang dilakukan sebelumnya
prediksi ada dua isu utama pada prediksi cacat
perangkat lunak yaitu noise attribute dan
cacat? imbalance class
APA SAJA PENELITIAN PADA PREDIKSI CACAT SOFTWARE?

1) perkiraan jumlah cacat yang tersisa dalam sistem


perangkat lunak

2) menemukan hubungan cacat perangkat lunak,

3) klasifikasi rawan cacat dalam komponen software, yang


terdiri dari dua kelas, yaitu rawan cacat dan bukan rawan
cacat (Song, Jia, Shepperd, Ying, & Liu, 2011).
APA SAJA KLASIFIKASI UNTUK PREDIKSI CACAT
SOFTWARE?

Pengklasifikasi yang telah digunakan seperti:


Klasifikasi adalah pendekatan populer untuk - C4.5, Naif Bayes,
memprediksi cacat software (Lessmann, Member,
Baesens, Mues, and Pietsch, 2008). - Logictic Regresi,
- Regresi Linear dan
- SVM (Hall, Beecham, Bowes, Gray, & Counsell,
2010).
 Berbagai jenis algoritma klasifikasi telah
diterapkan untuk memprediksi cacat
perangkat lunak, termasuk :
 logistic regression (Lessmann, Member,
Baesens, Mues, & Pietsch, 2008), LALU APA SAJA
 J48 (Riquelme, Ruiz, & Moreno, 2008),
ALGORITMA
 OneR (Song et al., 2011),
 Neural Network (Wahono & Suryana, 2013)
KLASIFIKASINYA?
dan
 Naive Bayes (Menzies, Greenwald, & Frank,
2007).
PENDEKATAN APA SAJA UNTUK
MENGURANGI KETIDAK SEIMBANGAN?

Pendekatan pertama
Pendekatan kedua untuk
menggunakan undersampling
menangani
untuk menangani
ketidakseimbangan dalam
ketidakseimbangan dalam
kelas dari fault prone (fp
kelas dari not fault prone (nfp)
modul kelas minoritas
modul kelas mayoritas
(positive) (Yap et al., 2014).
(negative)
Sementara
Oversampling dapat
undersampling dapat
menyebabkan overfitting
membuang sebagian
untuk membuat duplikat
besar potensi sampel
jumlah yang sama
berguna (Yap et al.,
dengan sampel minoritas,
2014).

LALU APA PERBEDAAN UNDERSAMPLING DAN


OVERSAMPLING?
BERIKUT
DIAGRAM
DARI NAÏVE
B AY E S D A N
SMOTE+IG
( I N F O R M AT I
ON GANE)
Kurva ROC (Receiver Operating Sedangkan Area Under the ROC (AUC)
Characteristics) telah diperkenalkan untuk memberikan ringkasan untuk kinerja
mengevaluasi kinerja algoritma classifier. algoritma classifier.
Kurva ROC digunakan untuk mengkarakterisasi trade-off antara true
positive rate (TPR) and false positive rate (FPR).

AUC untuk meningkatkan cross-studi komparatif. AUC yang merupakan


pengukuran yang lebih baik dari akurasi dalam mengevaluasi dan
membandingkan
BERIKUT CONTOH MODEL
AUC NAÏVE BAYES
BERIKUT CONTOH PEMODELAN NAÏVE
BAYES SMOOTH+IG(INFORMATION GANE)
• Kombinasi teknik SMOTE dan algoritma
Information Gain diusulkan untuk
meningkatkan kinerja pada prediksi cacat
software. SMOTE diterapkan untuk
menangani imbalance class. Sedangkan KESIMPULAN
algoritma Information Gain digunakan
untuk proses pemilihan atribut yang
relevan untuk menangani noise atribut.
TERIMA KASIH

Anda mungkin juga menyukai