NIM : 180212070
MK : Big Data
a) Naive Bayes
b) Decision Tree
c) K-NN
Boleh pilih menggunakan Tools apa saja, misal RapidMiner, Orange, Weka dan lain-lain.
Buat analisis dari accuracy, precision dan recall dari masing-masing algoritma, kemudian
analisis dan bandingkan hasil ketiga algoritma tersebut.
Penyelesaian :
A. Naive Bayes
1) Kita buka aplikasi Rapid Miner, kemudian kita klik new process, kemudian akan
muncul tampilan seperti ini.
2) Kemudian ketikkan read excel pada menu pencarian operator, lalu drag read excel
ke process atau juga bisa di klik dua kali pada tulisan read excel. Buat dua read
excel. Maka akan muncul tampilan seperti ini.
3) Kemudian, agar kedua operator read excel dapat berfungsi, kita masukkan file
excelnya, file excel training.xlsx kita masukkan di operator read excel pertama, dan
file excel testing.xlsx kita masukkan pada operator read excel yang kedua. Untuk
memasukkan file tersebut kita klik import configuration wizard di pojok sebelah
kiri. lalu, kita jelajahi untuk mencari file yang ingin kita masukkan. Contohnya
seperti ini :
4) Kemudian setelah kita mendapatkan file yang kita cari, lalu kita klik tombol next,
hingga mendapatkann tampilan seperti ini :
5) Kemudian kita ulangi lagi cara seperti tadi pada operator read excel 2, hanya saja
pada operator ini kita memasukkan file testing.xlsx. maka jika itu semua selesai,
maka operatornya menjadi kuning yang artinya operatornya sudah berfungsi.
6) Setelah itu, kita ketikkan Naive Bayes pada operator, kemudian apabila kita telah
menemukan operator tersebut, kita drug dan seret ke main process.
7) Kemudian kita cari operator apply model, kita lakukan cara yang sama seperti pada
operator Naive Bayes, yaitu tarik dan drug pada main process.
8) Lalu kemudian kita cari operator performance, dan kita drug ke main process juga.
9) Lalu apabila itu semua sudah kita lakukan, kita sambungkan antar operator hingga
terdapat lampu hijau yang menandakan bahwa semua operator berfungsi dengan
baik.
10) Lalu jika semuanya sudah sukses, maka kita run proses tersebut sehingga terdapat
occurasy, precision, dan recall dan data lainnya.
Hasil Accurasy pada algoritma ini adalah ±90%, yaitu prediksi Ya dan true Ya
16, prediksi Ya true Tidak 2, prediksi Tidak dan true Ya 0, prediksi Tidak dan true
Tidak 3. Yang pada prediksi Ya class precisionnya 88.89% dan pada prediksi Tidak
100%. serta Class recallnya pada true Ya 100% dan pada true Tidak 60%.
12) Berikut tampilan daripada Precision :
Hasil Precision pada algoritma ini adalah 100% (Positive class : Tidak), yaitu
prediksi Ya dan true Ya 16, prediksi Ya true Tidak 2, prediksi Tidak dan true Ya 0,
prediksi Tidak dan true Tidak 3. Yang pada prediksi Ya class precisionnya 88.89%
dan pada prediksi Tidak 100%. serta Class recallnya pada true Ya 100% dan pada true
Tidak 60%.
Hasil Recall pada algoritma ini adalah 60% (Positive class : Tidak), yaitu prediksi Ya
dan true Ya 16, prediksi Ya true Tidak 2, prediksi Tidak dan true Ya 0, prediksi Tidak
dan true Tidak 3. Yang pada prediksi Ya class precisionnya 88.89% dan pada prediksi
Tidak 100%. serta Class recallnya pada true Ya 100% dan pada true Tidak 60%.
B. Decision Tree
Hasil
Precision pada
algoritma ini
adalah 100%
(Positive class :
Tidak).
Hasil Recall pada algoritma ini adalah 40% (Positive class : Tidak)
C. K-NN
Cara ataupun langkah-langkah melakukan prediksi kelulusan mahasiswa
menggunakan algoritma ini juga sama seperti algoritma Naive Bayes, maka dari itu saya
hanya menampilkan beberapa langkah saja, adapun langkah-langkahnya seperti berikut :
1) Berikut tampilan daripada Accurasy :
Hasil Recall pada algoritma ini adalah 100% (Positive class : Tidak)
Jadi, pada ketiga algoritma ini terdapat :
Naive Bayes
Accurasy : ±90%,
Presicion : 100%
Recall : 60%
Desicion Tree
Accurasy : ±85%
Presicion : 100%
Recall : 40%
k-NN
Accurasy : ±81%.
Presicion : ±55%
Recall : 100%
Dapat disimpulkan bahwa, nilai accurasy tertinggi adalah naive bayes, nilai precision
terrendah adalah k-NN sedangkan naive bayes dan desicion tree sama yaitu 100%. serta
nilai recall tertinggi adalah k-NN