Anda di halaman 1dari 11

Nama : Rifka Aulia

NIM : 180212070

MK : Big Data

Silakan buat model prediksi kelulusan mahasiswa (dataset terlampir) menggunakan


algoritma :

a) Naive Bayes
b) Decision Tree
c) K-NN

Boleh pilih menggunakan Tools apa saja, misal RapidMiner, Orange, Weka dan lain-lain.
Buat analisis dari accuracy, precision dan recall dari masing-masing algoritma, kemudian
analisis dan bandingkan hasil ketiga algoritma tersebut.

Penyelesaian :

A. Naive Bayes

Adapun langkah-langkahnya sebagai berikut :

1) Kita buka aplikasi Rapid Miner, kemudian kita klik new process, kemudian akan
muncul tampilan seperti ini.
2) Kemudian ketikkan read excel pada menu pencarian operator, lalu drag read excel
ke process atau juga bisa di klik dua kali pada tulisan read excel. Buat dua read
excel. Maka akan muncul tampilan seperti ini.

3) Kemudian, agar kedua operator read excel dapat berfungsi, kita masukkan file
excelnya, file excel training.xlsx kita masukkan di operator read excel pertama, dan
file excel testing.xlsx kita masukkan pada operator read excel yang kedua. Untuk
memasukkan file tersebut kita klik import configuration wizard di pojok sebelah
kiri. lalu, kita jelajahi untuk mencari file yang ingin kita masukkan. Contohnya
seperti ini :
4) Kemudian setelah kita mendapatkan file yang kita cari, lalu kita klik tombol next,
hingga mendapatkann tampilan seperti ini :

Lalu disitu terdapat data-data, karena kita ingin memprediksi kelulusan


mahasiswa, maka kita ubah atribut pada kolom tepat_waktu menjadi label, setelah
itu, kita klik finish.

5) Kemudian kita ulangi lagi cara seperti tadi pada operator read excel 2, hanya saja
pada operator ini kita memasukkan file testing.xlsx. maka jika itu semua selesai,
maka operatornya menjadi kuning yang artinya operatornya sudah berfungsi.
6) Setelah itu, kita ketikkan Naive Bayes pada operator, kemudian apabila kita telah
menemukan operator tersebut, kita drug dan seret ke main process.

7) Kemudian kita cari operator apply model, kita lakukan cara yang sama seperti pada
operator Naive Bayes, yaitu tarik dan drug pada main process.

8) Lalu kemudian kita cari operator performance, dan kita drug ke main process juga.
9) Lalu apabila itu semua sudah kita lakukan, kita sambungkan antar operator hingga
terdapat lampu hijau yang menandakan bahwa semua operator berfungsi dengan
baik.

10) Lalu jika semuanya sudah sukses, maka kita run proses tersebut sehingga terdapat
occurasy, precision, dan recall dan data lainnya.

11) Berikut tampilan daripada Accurasy :

Hasil Accurasy pada algoritma ini adalah ±90%, yaitu prediksi Ya dan true Ya
16, prediksi Ya true Tidak 2, prediksi Tidak dan true Ya 0, prediksi Tidak dan true
Tidak 3. Yang pada prediksi Ya class precisionnya 88.89% dan pada prediksi Tidak
100%. serta Class recallnya pada true Ya 100% dan pada true Tidak 60%.
12) Berikut tampilan daripada Precision :

Hasil Precision pada algoritma ini adalah 100% (Positive class : Tidak), yaitu
prediksi Ya dan true Ya 16, prediksi Ya true Tidak 2, prediksi Tidak dan true Ya 0,
prediksi Tidak dan true Tidak 3. Yang pada prediksi Ya class precisionnya 88.89%
dan pada prediksi Tidak 100%. serta Class recallnya pada true Ya 100% dan pada true
Tidak 60%.

13) Berikut tampilan daripada Recall :

Hasil Recall pada algoritma ini adalah 60% (Positive class : Tidak), yaitu prediksi Ya
dan true Ya 16, prediksi Ya true Tidak 2, prediksi Tidak dan true Ya 0, prediksi Tidak
dan true Tidak 3. Yang pada prediksi Ya class precisionnya 88.89% dan pada prediksi
Tidak 100%. serta Class recallnya pada true Ya 100% dan pada true Tidak 60%.

B. Decision Tree

Cara ataupun langkah-langkah melakukan prediksi kelulusan mahasiswa


menggunakan algoritma ini sama seperti algoritma Naive Bayes, maka dari itu saya
hanya menampilkan beberapa langkah saja, adapun langkah-langkahnya seperti berikut :

1) Berikut tampilan daripada Accurasy :

Hasil Accurasy pada algoritma ini adalah ±85% .


2) Berikut tampilan daripada Precision :

Hasil
Precision pada
algoritma ini
adalah 100%
(Positive class :
Tidak).

3) Berikut tampilan daripada Recall :

Hasil Recall pada algoritma ini adalah 40% (Positive class : Tidak)

C. K-NN
Cara ataupun langkah-langkah melakukan prediksi kelulusan mahasiswa
menggunakan algoritma ini juga sama seperti algoritma Naive Bayes, maka dari itu saya
hanya menampilkan beberapa langkah saja, adapun langkah-langkahnya seperti berikut :
1) Berikut tampilan daripada Accurasy :

Hasil Accurasy pada algoritma ini adalah ±81%.

2) Berikut tampilan daripada Precision :


Hasil Precision pada algoritma ini adalah ±55% (Positive class : Tidak)

3) Berikut tampilan daripada Recall :

Hasil Recall pada algoritma ini adalah 100% (Positive class : Tidak)
Jadi, pada ketiga algoritma ini terdapat :

Naive Bayes

 Accurasy : ±90%,
 Presicion : 100%
 Recall : 60%

Desicion Tree

 Accurasy : ±85%
 Presicion : 100%
 Recall : 40%

k-NN

 Accurasy : ±81%.
 Presicion : ±55%
 Recall : 100%

Dapat disimpulkan bahwa, nilai accurasy tertinggi adalah naive bayes, nilai precision
terrendah adalah k-NN sedangkan naive bayes dan desicion tree sama yaitu 100%. serta
nilai recall tertinggi adalah k-NN

Anda mungkin juga menyukai