SIMULASI METODE NAIVE BAYES PADA RAPID MINER
DENGAN DATASET “MUSHROOM CLASSIFICATION”
Diajukan untuk memenuhi nilai UAS pada Semester Delapan
mata kuliah Warehouse dan Business Intelligence
Disusun Oleh :
1. M. Bayu Alamsah 11200320
2. Marsito 11200295
3. Nurul Syiffa Adinda 11200474
Program Studi Sistem Informasi
Sekolah Tinggi Manajemen Informatika dan Komputer Nusa Mandiri Jakarta
2021
1. Tema
Tema yang akan kami angkat adalah klasifikasi dengan label jamur yang beracun dan
jamur yang aman dengan beberapa kriteria tertentu seperti warna jamur, bentuk
jamur, tekstur, bau, dan lain-lain.
2. Data Set
Data set yang digunakan adalah “Mushroom Classification” dengan sumber
Kaggle.com. Data set yang kami peroleh masih dalam bentuk mentah sehingga perlu
diolah terlebih dahulu dengan cara mengubah setiap huruf pada cell dengan atribut
infomasi yang sesuai menggunakan fitur find and replace.
Data set mentah
Pengolahan Data Set
Data Set Telah Diolah
3. Metode
Metode yang digunakan adalah metode Naive Bayes dengan algoritma klasifikasi.
Naïve Bayes merupakan sebuah metode penggolongan berdasarkan probabilitas
sederhana dan dirancang untuk dipergunakan dengan asumsi bahwa antar satu kelas
dengan kelas yang lain tidak saling tergantung (independen). Pada klasifikasi Naïve
Bayes, proses pembelajaran lebih ditekankan pada mengestimasi probabilitas.
4. Tools
Tools yang digunakan adalah Rapid Miner versi 9.8.0. Dalam prosesnya terdapat
beberapa langkah yaitu :
A. Input Data Set
Yang pertama adalah memasukan data set dengan memasukan kata kunci “read”
pada kolom operator. Setelah itu pilih read excel karena dataset yang digunakan
memiliki format xlsx. Setelah itu klik “import configuration wizard” lalu pilih
data set yang akan digunakan, setelah itu klik next. Pada tahap ini tentukan juga
label yang akan digunakan sebagai parameter, jika suda klik finish.
B. Input Method.
Langkah yang kedua adalah memasukan metode yang digunakan, yaitu Naive
Bayes. Caranya masukan kunci “naive bayes” pada kolom operator lalu drag and
drop naive bayes ke worksheet.
C. Input Validation
Langkah yang ketiga adalah memasukan validasi yang akan digunakan. Pada
makalah ini kami menggunakan cross validasi yang mana didalamnya memuat
dua komponen yaitu data training dan data testing. Caranya adalah dengan
memasukan kata kuncu “validation” pada kolom operator, lalu drag and drop
cross validation ke worksheet. Setelah itu kita klik dua kali pada objek, lalu akan
muncul dua bagian seperti ini
Selanjutnya adalah mengisi bagian training dengan “naive bayes”, dan bagian testing
dengan “apply model dan “performance” seperti pada gambar
D. Konektor
Terakhir adalah menghubungkan setiap proses sampai tanda peringatan
menghilang. Konektor harus sesuai dengan tipe data yang akan dihubungkan,
misal mod dengan mod, lab dengan lab, exa dengan exa dan lain-lain. Biasanya
dilambangkan dengan warna yang sama.
Untuk proses lengkap penggunaan tools ini dapat dilihat di youtube dengan link
berikut : https://youtu.be/Ksr_sEY6e3U
5. Hasil
Berikut adalah hasil pengolahan data dengan metode naive bayes
1. Akurasi
2. Presisi
3. Recall