PERTEMUAN VIII
DATA MINING
Oleh
NPM : F1A021022
LABORATORIUM MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS BENGKULU
2023
KATA PENGANTAR
Puji dan syukur penulis panjatkan ke hadirat Allah SWT atas segala rahmat
laporan praktikum Data Mining ini dengan baik dan lancar. Penulis juga ingin
Pada kesempatan ini Penulis juga mengucapkan terima kasih kepada yang
terhormat:
baik dari segi susunan kata, kalimat maupun tatanan bahasa. Oleh karena itu,
penulis mengharapkan kritik dan saran dari semua pihak untuk laporan ini. Akhir
kata penulis berharap agar laporan ini memberikan banyak manfaat dan
Dinda Efriani
ii
DAFTAR ISI
HALAMAN JUDUL...............................................................................................i
KATA PENGANTAR...........................................................................................ii
DAFTAR ISI.........................................................................................................iii
DAFTAR TABEL.................................................................................................iv
DAFTAR GAMBAR..............................................................................................v
BAB I PENDAHULUAN.......................................................................................1
1.1 Latar Belakang...........................................................................................1
1.2 Rumusan Masalah.....................................................................................2
1.3 Tujuan Penelitian.......................................................................................2
1.4 Manfaat Penelitian.....................................................................................2
1.5 Batasan Masalah........................................................................................3
1.6 Sistematika Penulisan................................................................................3
BAB II TINJAUAN PUSTAKA...........................................................................5
2.1 Naïve Bayes Classifier................................................................................5
BAB III METODE PENELITIAN.......................................................................8
3.1 Jenis Dan Sumber Data.............................................................................8
3.2 Variabel Penelitian....................................................................................8
3.3 Analisis Data...............................................................................................8
3.4 Diagram Alur Penelitian.........................................................................10
BAB IV HASIL DAN PEMBAHASAN.............................................................11
4.1 Hasil Penelitian.........................................................................................11
4.2 Pembahasan..............................................................................................11
BAB V KESIMPULAN DAN SARAN...............................................................13
5.1 Kesimpulan...............................................................................................13
5.2 Saran.........................................................................................................13
DAFTAR PUSTAKA...........................................................................................15
LAMPIRAN..........................................................................................................16
iii
DAFTAR TABEL
iv
DAFTAR GAMBAR
v
BAB I
PENDAHULUAN
dikembangkan oleh ilmuwan abad ke-18, Thomas Bayes. Metode ini diberi label
"naive" karena asumsi sederhana atau "naif" yang dibuat: semua fitur yang
nyata hal ini mungkin tidak sepenuhnya benar. Metode ini telah diterapkan dalam
filtering, analisis sentimen, dan lainnya. Keuntungan utamanya adalah efisien dan
sering kali memberikan kinerja yang baik meskipun dengan asumsi sederhana
tersebut.
menjelaskan atau membedakan konsep atau kelas data dengan tujuan untuk dapat
memperkirakan kelas dari suatu objek. Klasifikasi merupakan proses awal dari
keanggotaan kelas suatu data yang akan masuk ke dalam kelas tertentu, sesuai
Bayes yang ditemukan oleh Thomas Bayes pada abad ke-18. Naive bayes
classifier menunjukkan akurasi dan kecepatan yang tinggi bila diterapkan pada
1
database yang besar. Metode ini sering digunakan dalam menyelesaikan masalah
dalam bidang mesin pembelajaran karena metode ini dikenal memiliki tingkat
(Widianto, 2019)
sebagai berikut :
sebagai berikut:
bayes classifier.
1. Bagi Penulis
masalah.
2. Bagi Pembaca
2
a. Bermanfaat bagi pembaca mengenai manfaat dan cara melakukan naive
bayes classifier.
bab dan setiap bab terdiri dari beberapa subbab. Adapun isi dari bab tersebut
BAB I PENDAHULUAN
sistematika penulisan.
Bab ini merupakan bab yang memuat pengertian dan teori yang
3
BAB IV HASIL DAN PEMBAHASAN
Bab ini merupakan bab yang memuat rangkuman dari hasil secara
DAFTAR PUSTAKA
4
BAB II
TINJAUAN PUSTAKA
ketergantungan yang diberikan oleh nilai pada variabel kelas. Definisi lain
probabilitas dan statistik yang ditemukan oleh ilmuwan Inggris Thomas Bayes,
sebelumnya.
secara kondisional saling bebas jika diberikan nilai output. Dengan kata lain,
diberikan nilai output, probabilitas mengamati secara bersama adalah produk dari
ini hanya membutuhkan jumlah data pelatihan (training data) yang kecil untuk
Naive bayes sering bekerja jauh lebih baik dalam kebanyakan situasi dunia nyata
5
pengalaman di masa sebelumnya sehingga dikenal sebagai Teorema Bayes. Ciri
(Novianti, 2023)
menjelaskan atau membedakan konsepatau kelas data dengan tujuan untuk dapat
memperkirakan kelas dari suatu obyek. Oleh karena itu, kelas yang ada tentulah
lebih dari satu. Penentuan kelas dari suatu dokumen dilakukan dengan cara
membandingkan nilai probabilitas suatu sampel berada di kelas yang satu dengan
pada teorema Bayes. Ciri utama dari naive bayes classifier ini adalah asumsi yang
sangat kuat akan independensi dari masing-masing kondisi atau kejadian. Untuk
memerlukan sejumlah petunjuk untuk menentukan kelas apa yang cocok bagi
(Natalius, 2010)
menggunakan atribut kata yang muncul dalam satu dokumen sebagai dasar
6
yaitu memprediksi probabilitas di masa depan berdasarkan pengalaman di masa
yang tinggi dalam proses pelatihan dan klasifikasi membuat algoritma ini menarik
untuk digunakan sebagai salah satu metode klasifikasi. Proses klasifikasi biasanya
dibagi menjadi dua fase, yaitu learning dan test. Pada fase learning, sebagian data
perkiraan. Kemudian, pada fase test model yang sudah terbentuk diuji dengan
sebagian data lainnya untuk mengetahui akurasi dari model tersebut (Rosandy,
2016).
7
BAB III
METODE PENELITIAN
Data yang digunakan untuk penelitian ini merupakan data sekunder yang
bersifat kuantitatif yaitu data bersumber dari package “HouseVotes84” yang ada
pada program R untuk batasan masalah yang mana data yang didapatkan dalam
bentuk numerik dan ordinal. Data ini dapat diproses menggunakan rumus dan
8
2. Menghitung Jumlah kasus Per kelas.
9
3.4 Diagram Alur Penelitian
10
Mulai
Tidak Ya
Standart Deviasi
tiap Parameter
Selesai
11
BAB IV
Pada batasan masalah, didapatkan hasil nilai dalam tabel dan plot arsitektur
ANN dalam gambar dengan menggunakan R. Tabel dan gambar output dapat
Pada teladan di atas, praktikan diminta untuk membuat plot arsitektur ANN
dari data yang diberikan. Langkah pertama yang dilakukan adalah mengaktikfan
digunakan dalam teladan ini adalah nnet. Variabel independen dari teladan ini
adalah ujian tulis dan ujian praktek, sedangkan variabel dependennya adalah
status kelulusan. Berdasarkan script yang dibuat, data teladan dibagi menjadi 2
sampel dimana sampel dibagi berdasarkan kategori variabel status kelulusan. Data
12
1-5 merupakan status kelulusan berniai 1 yang diambil sebanyak 2 sampel, data 6-
dibuat mesin ANN yang akan dilakukan klasifikasi. Perintah nnet dijalankan
dengan data training, dalam hal ini yaitu data yang telah diberi nama “dataDinda”
menggambarkan banyaknya node yang akan digunakan pada hidden layer, dalam
dalam gradient descent, dalam hal ini yaitu 5 e -4. Maxit merupakan maksimum
iterasi yang akan dilakukan, dalam hal ini maksimum iterasi yang akan dilakukan
adalah 200. Berdasarkan output program, iterasi berakhir pada iterasi ke-100
untuk mencapai nilai konvergen dengan nilai final value 1.768478. Berdasarkan
output yang diperoleh pada objek “Dinda” menunjukkan bahwa kita sudah
membuat struktur jaringan ANN dengan 2 layer input, 2 hidden layer, dan 2 layer
output dengan bobot 20. Untuk menampilkan plot arsitektur ANN menggunakan
perintah plot.nnet, dalam hal ini judul plotnya diberi nama Plot ANN Dinda
Efriani dengan ketebalan warnanya diatur sebesar 0.5, lingkarannya diberi warna
pink dan kuning, serta garis-garis node diberi warna hitam dan abu-abu.
Berdasarkan plot, dapat dilihat bahwa terdapat 2 layer input yaitu ujian tulis dan
ujian praktik, 2 hidden layer, dan 2 layer output yaitu lulus dan tidak lulus.
13
BAB V
KESIMPULAN DAN SARAN
5.1 Kesimpulan
ketergantungan yang diberikan oleh nilai pada variabel kelas. Definisi lain
probabilitas dan statistik yang ditemukan oleh ilmuwan Inggris Thomas Bayes,
sebelumnya.
kata yang muncul dalam satu dokumen sebagai dasar klasifikasinya. Algoritma
naive bayes classifier yang sederhana dan kecepatannya yang tinggi dalam proses
pelatihan dan klasifikasi membuat algoritma ini menarik untuk digunakan sebagai
salah satu metode klasifikasi. Proses klasifikasi biasanya dibagi menjadi dua fase,
yaitu learning dan test. Membuat naive bayes classifier dapat dilakukan dengan
Pada hasil batasan masalah ada terdapat 15 data yang pada reference dan
prediction nya setosa, tidak ada data yang pada prediction nya versicolor dan
reference nya setosa, kemudian juga tidak ada data yang prediction nya virginica
dan reference nya setosa. Tidak ada data yang prediction nya setosa dan reference
14
nya versicolor, ada 14 data yang prediction nya versicolor dan reference nya
versicolor, dan ada 1 data yang prediction nya virginica dan reference nya
versicolor. Tidak ada data yang prediction nya setosa dan reference nya
virginica, ada 2 data yang prediction nya versicolor dan reference nya virginica
dan ada 13 data yang prediction nya virginica dan reference nya virginica.
Kemudian untuk nilai Accuracy yaitu 0.9333, untuk nilai Kappa yaitu 0.9,
kemudian untuk nilai Sensitivity terbagi menjadi 3 class, yang pertama untuk nilai
setosa yaitu 1.0000, untuk nilai versicolor yaitu 0.9333, dan nilai virginica yaitu
0.8667. Kemudian, untuk nilai Specificity juga terdapat 3 class, yang pertama nilai
setosa yaitu 1.0000, nilai versicolor yaitu 0.9333, dan nilai virginica yaitu 0.9667.
5.2 Saran
harus teliti dan mengikuti prosedur yang ada agar tidak terjadi kendala ataupun
error.
15
DAFTAR PUSTAKA
16
LAMPIRAN
17
Lampiran 3. Output Memasukkan Data
18
Lampiran 5. Output Test dan Akurasi
19