Anda di halaman 1dari 24

LAPORAN PRAKTIKUM

PERTEMUAN VIII
DATA MINING

Oleh

Nama : Dinda Efriani

NPM : F1A021022

Dosen Pengampu : 1. Septri Damayanti, S.Si., M.Si.

2. Winalia Agwil, S.Si., M.Si.

Asisten Praktikum : 1. Nutia Rosdalena, S.Stat.

2. Annisa Fadilah Sari (F1F019007)

3. Latifah Gusti Pertiwi (F1F019010)

LABORATORIUM MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS BENGKULU

2023
KATA PENGANTAR

Puji dan syukur penulis panjatkan ke hadirat Allah SWT atas segala rahmat

dan karunia-Nya yang telah diberikan sehingga penyusun bisa menyelesaikan

laporan praktikum Data Mining ini dengan baik dan lancar. Penulis juga ingin

mengucapkan terima kasih kepada Dosen Pengampu dan Asisten Praktikum

dalam penulisan laporan ini.

Pada kesempatan ini Penulis juga mengucapkan terima kasih kepada yang

terhormat:

1. Septri Damayanti, S.Si., M.Si. Selaku Dosen Pengampu.

2. Winalia Agwil, S.Si., M.Si. Selaku Dosen Pengampu.

3. Nutia Rosdalena, S.Stat. Selaku Asisten Praktikum.

4. Annisa Fadilah Sari Selaku Asisten Praktikum.

5. Latifah Gusti Pertiwi Selaku Asisten Praktikum.

6. Terakhir, pada keluarga dan teman-teman yang senantiasa memberikan

dukungan kepada penulis.

Penulis menyadari bahwa penulisan laporan ini masih banyak kekurangan,

baik dari segi susunan kata, kalimat maupun tatanan bahasa. Oleh karena itu,

penulis mengharapkan kritik dan saran dari semua pihak untuk laporan ini. Akhir

kata penulis berharap agar laporan ini memberikan banyak manfaat dan

pembelajaran untuk pembaca.

Bengkulu, 04 Desember 2023

Dinda Efriani

ii
DAFTAR ISI

HALAMAN JUDUL...............................................................................................i
KATA PENGANTAR...........................................................................................ii
DAFTAR ISI.........................................................................................................iii
DAFTAR TABEL.................................................................................................iv
DAFTAR GAMBAR..............................................................................................v
BAB I PENDAHULUAN.......................................................................................1
1.1 Latar Belakang...........................................................................................1
1.2 Rumusan Masalah.....................................................................................2
1.3 Tujuan Penelitian.......................................................................................2
1.4 Manfaat Penelitian.....................................................................................2
1.5 Batasan Masalah........................................................................................3
1.6 Sistematika Penulisan................................................................................3
BAB II TINJAUAN PUSTAKA...........................................................................5
2.1 Naïve Bayes Classifier................................................................................5
BAB III METODE PENELITIAN.......................................................................8
3.1 Jenis Dan Sumber Data.............................................................................8
3.2 Variabel Penelitian....................................................................................8
3.3 Analisis Data...............................................................................................8
3.4 Diagram Alur Penelitian.........................................................................10
BAB IV HASIL DAN PEMBAHASAN.............................................................11
4.1 Hasil Penelitian.........................................................................................11
4.2 Pembahasan..............................................................................................11
BAB V KESIMPULAN DAN SARAN...............................................................13
5.1 Kesimpulan...............................................................................................13
5.2 Saran.........................................................................................................13
DAFTAR PUSTAKA...........................................................................................15
LAMPIRAN..........................................................................................................16

iii
DAFTAR TABEL

Tabel 3.1 Variabel penelitian...................................................................................8


Tabel 4.1 Output tabel test dan akurasi..................................................................11

iv
DAFTAR GAMBAR

Gambar 3.1 Diagram alur penelitian......................................................................10


Gambar 4.1 Plot arsitektur ANN...........................................................................11

v
BAB I
PENDAHULUAN

1.1 Latar Belakang

Naive Bayes Classifier berasal dari konsep teori probabilitas yang

dikembangkan oleh ilmuwan abad ke-18, Thomas Bayes. Metode ini diberi label

"naive" karena asumsi sederhana atau "naif" yang dibuat: semua fitur yang

digunakan untuk klasifikasi dianggap saling independen, meskipun dalam dunia

nyata hal ini mungkin tidak sepenuhnya benar. Metode ini telah diterapkan dalam

berbagai konteks, termasuk pengenalan teks dan klasifikasi dokumen, spam

filtering, analisis sentimen, dan lainnya. Keuntungan utamanya adalah efisien dan

sering kali memberikan kinerja yang baik meskipun dengan asumsi sederhana

tersebut.

Klasifikasi adalah proses untuk menemukan model atau fungsi yang

menjelaskan atau membedakan konsep atau kelas data dengan tujuan untuk dapat

memperkirakan kelas dari suatu objek. Klasifikasi merupakan proses awal dari

pengelompokkan data. Proses klasifikasi dokumen merupakan proses yang sangat

penting dalam bidang sistem informasi, khususnya dalam proses penambangan

data (data mining) untuk memperoleh pengetahuan bisnis (business knowledge).

Algoritma naive bayes classifier merupakan salah satu pengklasifikasian

statistik, dimana pengklasifikasian ini dapat memprediksi probabilitas

keanggotaan kelas suatu data yang akan masuk ke dalam kelas tertentu, sesuai

dengan perhitungan probabilitas. Pengklasifikasian Bayes didasari oleh teorema

Bayes yang ditemukan oleh Thomas Bayes pada abad ke-18. Naive bayes

classifier menunjukkan akurasi dan kecepatan yang tinggi bila diterapkan pada

1
database yang besar. Metode ini sering digunakan dalam menyelesaikan masalah

dalam bidang mesin pembelajaran karena metode ini dikenal memiliki tingkat

akurasi yang tinggi dengan perhitungan sederhana. Teorema Bayes merupakan

dasar aturan dari naive bayes classifier.

(Widianto, 2019)

1.2 Rumusan Masalah

Berdasarkan latar belakang di atas, masalah yang dapat disimpulkan adalah

sebagai berikut :

1. Apa itu metode naive bayes classifier pada data mining?


2. Bagaimana mengaplikasikan program R untuk melakukan melakukan Naive

bayes classifier pada data mining?

1.3 Tujuan Penelitian

Berdasarkan rumusan masalah di atas, tujuan yang dapat disimpulkan adalah

sebagai berikut:

1. Mahasiswa Mengetahui naive bayes classifier pada data mining.

2. Mahasiswa mampu mengaplikasikan program R untuk melakukan naive

bayes classifier.

1.4 Manfaat Penelitian

1. Bagi Penulis

a. Menjadi rujukan bagi peneliti mengenai manfaat dan cara

Mengaplikasikan program R untuk melakukan naive bayes classifier.

b. Memberikan jawaban yang optimal dari rumusan masalah dan batasan

masalah.

2. Bagi Pembaca

2
a. Bermanfaat bagi pembaca mengenai manfaat dan cara melakukan naive

bayes classifier.

b. Evaluasi bagi penelitian selanjutnya.

1.5 Batasan Masalah

1. Gunakan data “HouseVotes84” yang tersedia dalam program R untuk

melakukan Naïve Bayes Clasifier. Gunakan data training sebesar

(100 %−22 %) dan data testing sebesar 22 %. Buatlah interpretasi dari

keluaran program R!.

1.1 Sistematika Penulisan

Agar mempermudah dalam memahami skripsi ini akan dikemukakan lima

bab dan setiap bab terdiri dari beberapa subbab. Adapun isi dari bab tersebut

adalah sebagai berikut:

BAB I PENDAHULUAN

Bab ini merupakan bab yang memuat latar belakang penelitian,

tujuan dan manfaat dari penelitian, batasan masalah penelitian dan

sistematika penulisan.

BAB II TINJAUAN PUSTAKA

Bab ini merupakan bab yang memuat pengertian dan teori yang

diperlukan untuk rancangan penelitian pada bab-bab berikutnya.

BAB III METODE PENELITIAN

Bab ini merupakan bab yang memuat uraian mengenai jenis

penelitian, variabel penelitian, informasi mengenai sumber data,

dan analisis data.

3
BAB IV HASIL DAN PEMBAHASAN

Bab ini merupakan bab yang memuat hasil analisis dan

pembahasan dari hasil yang telah diperoleh dan interpretasi.

BAB V KESIMPULAN DAN SARAN

Bab ini merupakan bab yang memuat rangkuman dari hasil secara

keseluruhan dan saran yang diberikan oleh penulis terhadap hasil

maupun analisis yang telah dilakukan.

DAFTAR PUSTAKA

4
BAB II
TINJAUAN PUSTAKA

2.1 Naïve Bayes Classifier

Naive bayes merupakan sebuah pengklasifikasian probabilistik sederhana

yang menghitung sekumpulan probabilitas dengan menjumlahkan frekuensi dan

kombinasi nilai dari dataset yang diberikan. Algoritmanya menggunakan teorema

Bayes dan mengasumsikan semua atribut independen atau tidak saling

ketergantungan yang diberikan oleh nilai pada variabel kelas. Definisi lain

mengatakan naive bayes merupakan pengklasifikasian dengan metode

probabilitas dan statistik yang ditemukan oleh ilmuwan Inggris Thomas Bayes,

yaitu memprediksi peluang di masa depan berdasarkan pengalaman di masa

sebelumnya.

Naive bayes didasarkan pada asumsi penyederhanaan bahwa nilai atribut

secara kondisional saling bebas jika diberikan nilai output. Dengan kata lain,

diberikan nilai output, probabilitas mengamati secara bersama adalah produk dari

probabilitas individu. Keuntungan penggunaan naive bayes adalah bahwa metode

ini hanya membutuhkan jumlah data pelatihan (training data) yang kecil untuk

menentukan estimasi paremeter yang diperlukan dalam proses pengklasifikasian.

Naive bayes sering bekerja jauh lebih baik dalam kebanyakan situasi dunia nyata

yang kompleks daripada yang diharapkan

Langkah –langkah Metode NaïveBayes (Algoritma)

Algoritma NaiveBayes merupakan sebuah metoda klasifikasi menggunakan

metode probabilitas dan statistik yg dikemukakan oleh ilmuwan Inggris Thomas

Bayes. Algoritma NaiveBayes memprediksi peluang di masa depan berdasarkan

5
pengalaman di masa sebelumnya sehingga dikenal sebagai Teorema Bayes. Ciri

utama dr NaïveBayesClassifier ini adalah asumsi yg sangat kuat (naïf) akan

independensi dari masing-masing kondisi / kejadian.

1. Menghitung jumlah kelas / label

2. Menghitung jumlah kasus per kelas

3. Kalikan semua variable kelas

4. Bandingkan hasil per kelas

(Novianti, 2023)

Klasifikasi adalah proses untuk menemukan model atau fungsi yang

menjelaskan atau membedakan konsepatau kelas data dengan tujuan untuk dapat

memperkirakan kelas dari suatu obyek. Oleh karena itu, kelas yang ada tentulah

lebih dari satu. Penentuan kelas dari suatu dokumen dilakukan dengan cara

membandingkan nilai probabilitas suatu sampel berada di kelas yang satu dengan

nilai probabilitas suatu sampel berada di kelas yang lain.

Naive bayes classifier merupakan sebuah metode klasifikasi yang berakar

pada teorema Bayes. Ciri utama dari naive bayes classifier ini adalah asumsi yang

sangat kuat akan independensi dari masing-masing kondisi atau kejadian. Untuk

menjelaskan teorema naive bayes, perlu diketahui bahwa proses klasifikasi

memerlukan sejumlah petunjuk untuk menentukan kelas apa yang cocok bagi

sampel yang dianalisis tersebut.

(Natalius, 2010)

Metode naive bayes classifier untuk klasifikasi atau kategorisasi teks

menggunakan atribut kata yang muncul dalam satu dokumen sebagai dasar

klasifikasinya. Algoritma klasifikasi naive bayes memanfaatkan teori probabilitas,

6
yaitu memprediksi probabilitas di masa depan berdasarkan pengalaman di masa

sebelumya. Algoritma naive bayes classifier yang sederhana dan kecepatannya

yang tinggi dalam proses pelatihan dan klasifikasi membuat algoritma ini menarik

untuk digunakan sebagai salah satu metode klasifikasi. Proses klasifikasi biasanya

dibagi menjadi dua fase, yaitu learning dan test. Pada fase learning, sebagian data

yang telah diketahui kelas datanya diumpankan untuk membentuk model

perkiraan. Kemudian, pada fase test model yang sudah terbentuk diuji dengan

sebagian data lainnya untuk mengetahui akurasi dari model tersebut (Rosandy,

2016).

7
BAB III
METODE PENELITIAN

3.1 Jenis Dan Sumber Data

Data yang digunakan untuk penelitian ini merupakan data sekunder yang

bersifat kuantitatif yaitu data bersumber dari package “HouseVotes84” yang ada

pada program R untuk batasan masalah yang mana data yang didapatkan dalam

bentuk numerik dan ordinal. Data ini dapat diproses menggunakan rumus dan

operasi matematika serta dapat dianalisis dengan sistem statistika.

3.2 Variabel Penelitian

Variabel yang digunakan dalam penelitian ini berupa penyajian data.

Terdapat 3 variabel dalam penelitian ini, diantaranya:

Tabel 3.1 Variabel penelitian


No Ujian Tulis Ujian Praktek Status Kelulusan
1 20 90 Lulus
2 10 20 Tidak Lulus
3 30 40 Tidak Lulus
4 20 50 Tidak Lulus
5 80 50 Lulus
6 30 80 Lulus
7 40 40 Tidak Lulus
8 30 85 Lulus
9 80 22 Lulus
10 50 35 Tidak Lulus

3.3 Analisis Data

Langkah-langkah yang dilakukan untuk melakukan melakukan naive bayes

classifier dengan program R adalah sebagai berikut:

1. Menghitung jumlah kelas / label.

8
2. Menghitung Jumlah kasus Per kelas.

3. Kalikan semua variable kelas

4. Bandingkan hasil per kelas

9
3.4 Diagram Alur Penelitian

10
Mulai

Baca Data Training

Apakah Data Numerik ?

Tidak Ya

Jumlah dan Mean tiap


Probabilitas parameter

Tabel Standart Deviasi


Probabilitas tiap Parameter

Standart Deviasi
tiap Parameter

Selesai

Gambar 1. Diagram Alur Penelitian

11
BAB IV

HASIL DAN PEMBAHASAN

4.1 Hasil Penelitian

Pada batasan masalah, didapatkan hasil nilai dalam tabel dan plot arsitektur

ANN dalam gambar dengan menggunakan R. Tabel dan gambar output dapat

dilihat dibawah ini:

Tabel 4.1 Output tabel test dan akurasi


Cres
True
1 2
1 2 0
2 0 2
Akurasi 100

Gambar 4.1 Plot arsitektur ANN


4.2 Pembahasan

Pada teladan di atas, praktikan diminta untuk membuat plot arsitektur ANN

dari data yang diberikan. Langkah pertama yang dilakukan adalah mengaktikfan

package dan memasukkan data ke dalam lembar kerja R. Package yang

digunakan dalam teladan ini adalah nnet. Variabel independen dari teladan ini

adalah ujian tulis dan ujian praktek, sedangkan variabel dependennya adalah

status kelulusan. Berdasarkan script yang dibuat, data teladan dibagi menjadi 2

sampel dimana sampel dibagi berdasarkan kategori variabel status kelulusan. Data

12
1-5 merupakan status kelulusan berniai 1 yang diambil sebanyak 2 sampel, data 6-

10 merupakan status kelulusan bernilai 1 yang diambil sebanyak 2 sampel.

Setelah sampel ditentukan, kemudian dengan menggunakan package nnet akan

dibuat mesin ANN yang akan dilakukan klasifikasi. Perintah nnet dijalankan

dengan data training, dalam hal ini yaitu data yang telah diberi nama “dataDinda”

menggambarkan banyaknya node yang akan digunakan pada hidden layer, dalam

hal ini digunakan 2 node. Decay menggambarkan seberapa cepat penurunan

dalam gradient descent, dalam hal ini yaitu 5 e -4. Maxit merupakan maksimum

iterasi yang akan dilakukan, dalam hal ini maksimum iterasi yang akan dilakukan

adalah 200. Berdasarkan output program, iterasi berakhir pada iterasi ke-100

untuk mencapai nilai konvergen dengan nilai final value 1.768478. Berdasarkan

output yang diperoleh pada objek “Dinda” menunjukkan bahwa kita sudah

membuat struktur jaringan ANN dengan 2 layer input, 2 hidden layer, dan 2 layer

output dengan bobot 20. Untuk menampilkan plot arsitektur ANN menggunakan

perintah plot.nnet, dalam hal ini judul plotnya diberi nama Plot ANN Dinda

Efriani dengan ketebalan warnanya diatur sebesar 0.5, lingkarannya diberi warna

pink dan kuning, serta garis-garis node diberi warna hitam dan abu-abu.

Berdasarkan plot, dapat dilihat bahwa terdapat 2 layer input yaitu ujian tulis dan

ujian praktik, 2 hidden layer, dan 2 layer output yaitu lulus dan tidak lulus.

13
BAB V
KESIMPULAN DAN SARAN

5.1 Kesimpulan

Naive bayes merupakan sebuah pengklasifikasian probabilistik sederhana

yang menghitung sekumpulan probabilitas dengan menjumlahkan frekuensi dan

kombinasi nilai dari dataset yang diberikan. Algoritmanya menggunakan teorema

Bayes dan mengasumsikan semua atribut independen atau tidak saling

ketergantungan yang diberikan oleh nilai pada variabel kelas. Definisi lain

mengatakan naive bayes merupakan pengklasifikasian dengan metode

probabilitas dan statistik yang ditemukan oleh ilmuwan Inggris Thomas Bayes,

yaitu memprediksi peluang di masa depan berdasarkan pengalaman di masa

sebelumnya.

Metode naive bayes classifier untuk klasifikasi teks menggunakan atribut

kata yang muncul dalam satu dokumen sebagai dasar klasifikasinya. Algoritma

naive bayes classifier yang sederhana dan kecepatannya yang tinggi dalam proses

pelatihan dan klasifikasi membuat algoritma ini menarik untuk digunakan sebagai

salah satu metode klasifikasi. Proses klasifikasi biasanya dibagi menjadi dua fase,

yaitu learning dan test. Membuat naive bayes classifier dapat dilakukan dengan

bantuan program R. Dengan bantuan R, kita dapat dengan cepat melakukan

analisis klasifikasi menggunakan naive bayes classifier.

Pada hasil batasan masalah ada terdapat 15 data yang pada reference dan

prediction nya setosa, tidak ada data yang pada prediction nya versicolor dan

reference nya setosa, kemudian juga tidak ada data yang prediction nya virginica

dan reference nya setosa. Tidak ada data yang prediction nya setosa dan reference

14
nya versicolor, ada 14 data yang prediction nya versicolor dan reference nya

versicolor, dan ada 1 data yang prediction nya virginica dan reference nya

versicolor. Tidak ada data yang prediction nya setosa dan reference nya

virginica, ada 2 data yang prediction nya versicolor dan reference nya virginica

dan ada 13 data yang prediction nya virginica dan reference nya virginica.

Kemudian untuk nilai Accuracy yaitu 0.9333, untuk nilai Kappa yaitu 0.9,

kemudian untuk nilai Sensitivity terbagi menjadi 3 class, yang pertama untuk nilai

setosa yaitu 1.0000, untuk nilai versicolor yaitu 0.9333, dan nilai virginica yaitu

0.8667. Kemudian, untuk nilai Specificity juga terdapat 3 class, yang pertama nilai

setosa yaitu 1.0000, nilai versicolor yaitu 0.9333, dan nilai virginica yaitu 0.9667.

5.2 Saran

Laporan Praktikum ini menggunakan program R pada analisisnya. Oleh

karena itu, dalam melakukan tahapan pemrograman pada praktikum selanjutnya

harus teliti dan mengikuti prosedur yang ada agar tidak terjadi kendala ataupun

error.

15
DAFTAR PUSTAKA

Widianto, Mochammad Haldi. 2019. Algoritma Naive Bayes. Bandung : BINUS


Higher Education.
Rosandy, T. 2016. Perbandingan Metode Naive Bayes Classifier dengan Metode
Decision Tree (C4.5) untuk Menganalisa Kelancaran Pembiayaan.
https://media. neliti.com/media/publications/141765-ID-none.pdf.
Novianti, Pepi, Etis Sunandi dan Winalia Agwil. 2023. Modul Praktikum Data
Mining. Bengkulu: Laboratorium FMIPA Universitas Bengkulu.
Natalius, S. 2010. Metode Naive Bayes Classifier. https://informatika.stei.itb.ac.
id/~rinaldi.munir.a./Probstat/2010/2011/Makalah2010/MakalahProbstat2010
-017.pdf.

16
LAMPIRAN

Lampiran 1. Data Teladan


No Ujian Tulis Ujian Praktek Status Kelulusan
1 20 90 Lulus
2 10 20 Tidak Lulus
3 30 40 Tidak Lulus
4 20 50 Tidak Lulus
5 80 50 Lulus
6 30 80 Lulus
7 40 40 Tidak Lulus
8 30 85 Lulus
9 80 22 Lulus
10 50 35 Tidak Lulus

Lampiran 2. Syntax Teladan

17
Lampiran 3. Output Memasukkan Data

Lampiran 4. Output Cleaning Data

Lampiran 5. Output Test dan Akurasi

18
Lampiran 5. Output Test dan Akurasi

19

Anda mungkin juga menyukai