Anda di halaman 1dari 12

Tugas Data Mining

“Laporan Implementasi Naive Bayes”

Dosen Pengampu : Nurul Renaningtyas, M.Kom

Di Susun Oleh :
Nama : Tri Puji Astuti
Nim : 17090090
Kelas : 6B

PROGRAM STUDI D4 TEKNIK INFORMATIKA


POLITEKNIK HARAPAN BERSAMA TEGAL
2020
1. Pertama kita install terlebih dahulu packages yang akan digunakan, kemudian
panggil dengan perintah library( ).

2. Selanjutnya import data yang akan di gunakan, disini data yang akan digunakan
adalah dataset.csv
3. Mengkonversi variabel output (Outcome) menjadi variabel kategori, Ini diperlukan
karena output terdiri atas dua kelas yakni true dan false. True menyatakan bahwa
seorang pasien menderita diabetes dan false menyatakan bahwa seorang pasien bebas
diabetes.

4. Dengan mempelajari struktur data


5. Menetapkan nilai 0 ke NA

6. Untuk mengecek jumlah dari nilai yang hilang lakukan visualisasi


7. Imputations dengan menggunakan package mice pada R

8. Tranfer data yang hilang diprediksi


9. Setelah melakukan proses imputations maka langkah selanjutnya adalah
menampilkan apakah masih terdapat nilai yang hilang dengan menggunakan
missmap().

10. Melakukan beberapa visualisasi untuk melihat tampilan dari setiap variabel. Tahap
ini penting dilakukan untuk memahami pentingnya masing-masing variabel
prediktor.
#Visualisasi 1
#Visualisasi 2

#Visualisasi 3
#Visualisasi 4

#Visualisasi 5
11. Selanjutnya yaitu tahap pemodelan dilakukan dengan membagi data menjadi dua
bagian yaitu data untuk pelatihan dan pengujian. Pelatihan dilakukan untuk
membangun dan melatih model sedangkan pengujian dilakukan untuk
mengevaluasi efisiensi model.
12. Untuk membandingkan hasil dari fase pelatihan dan pengujian, maka dibuat
variabel terpisah yang menyimpan nilai variabel response.

13. Selanjutnya adalah meload package e1071 yang menyimpan fungsi Naïve Bayes.
Ini merupakan fungsi yang disediakan oleh R.
14. Pembentukan model Naïve Bayes dilakukan dengan menggunakan kumpulan data
pelatihan.

15. Untuk memeriksa efisiensi model, maka dilakukan pengujian terhadap model
tersebut. Setelah itu dilakukan evaluasi keakuratan model dilakukan dengan
menggunakan Confusion Matrix.
16. Untuk menyimpulkan praktikum yang dilakukan, terlihat pada gambaran plot
menunjukkan masing-masing variabel prediktor memiliki tanggung jawab dalam
memprediksi hasil. Terlihat urutan variabel yang paling berpengaruh dalam proses
prediksi.

Anda mungkin juga menyukai