Di Susun Oleh :
Nama : Tri Puji Astuti
Nim : 17090090
Kelas : 6B
2. Selanjutnya import data yang akan di gunakan, disini data yang akan digunakan
adalah dataset.csv
3. Mengkonversi variabel output (Outcome) menjadi variabel kategori, Ini diperlukan
karena output terdiri atas dua kelas yakni true dan false. True menyatakan bahwa
seorang pasien menderita diabetes dan false menyatakan bahwa seorang pasien bebas
diabetes.
10. Melakukan beberapa visualisasi untuk melihat tampilan dari setiap variabel. Tahap
ini penting dilakukan untuk memahami pentingnya masing-masing variabel
prediktor.
#Visualisasi 1
#Visualisasi 2
#Visualisasi 3
#Visualisasi 4
#Visualisasi 5
11. Selanjutnya yaitu tahap pemodelan dilakukan dengan membagi data menjadi dua
bagian yaitu data untuk pelatihan dan pengujian. Pelatihan dilakukan untuk
membangun dan melatih model sedangkan pengujian dilakukan untuk
mengevaluasi efisiensi model.
12. Untuk membandingkan hasil dari fase pelatihan dan pengujian, maka dibuat
variabel terpisah yang menyimpan nilai variabel response.
13. Selanjutnya adalah meload package e1071 yang menyimpan fungsi Naïve Bayes.
Ini merupakan fungsi yang disediakan oleh R.
14. Pembentukan model Naïve Bayes dilakukan dengan menggunakan kumpulan data
pelatihan.
15. Untuk memeriksa efisiensi model, maka dilakukan pengujian terhadap model
tersebut. Setelah itu dilakukan evaluasi keakuratan model dilakukan dengan
menggunakan Confusion Matrix.
16. Untuk menyimpulkan praktikum yang dilakukan, terlihat pada gambaran plot
menunjukkan masing-masing variabel prediktor memiliki tanggung jawab dalam
memprediksi hasil. Terlihat urutan variabel yang paling berpengaruh dalam proses
prediksi.