Anda di halaman 1dari 13

IMPLEMENTASI NAÏVE BAYES CLASSIFIER UNTUK KLASIFIKASI DAN

PENCARIAN BUKU PADA APLIKASI PERPUSTAKAAN BERBASIS WEB


(STUDI KASUS: PERPUSTAKAAN JURUSAN MATEMATIKA FMIPA
UNIVERSITAS CENDERAWASIH)

Rekha Ayu Anggraeni1, Meilia Nur Indah Susanti2, Abdurrasyid3


Program Studi Teknik Informatika, Sekolah Tinggi Teknik PLN
Email: rekha1531258@sttpln.ac.id1, meilia@sttpln.ac.id2, abdurrasyid@sttpln.ac.id3

ABSTRAK
Banyaknya jumlah bahan pustaka berupa buku-buku baru yang tersedia di perpustakaan menyebabkan
petugas mengalami kesulitan dalam mengelola data perpustakaan seperti data peminjaman, data
laporan, dan pengklasifikasian serta pencarian buku. Demikian pula yang dihadapi petugas
perpustakaan di Jurusan Matematika FMIPA Universitas Cenderawasih yang menjadi obyek penelitian
ini. Aplikasi ini dibangun menggunakan bahasa pemrograman PHP, database MySQL, dan
memanfaatkan metode Naïve Bayes Classiffier (NBC) serta text mining. Klasifikasi buku terdiri dari
empat kategori yaitu: matematika, fisika, sistem informasi, dan statistik. Hasil penelitian dari 30 data
sampel abstrak buku yang terbagi dalam data training dan data testing didapatkan akurasi dari nilai
probabilitas sebesar 90%. Sehingga dapat disimpulkan bahwa tingginya akurasi klasifikasi didapatkan
dengan banyaknya penggunaan dokumen sebagai data training dan sebaliknya akurasi akan menurun
dengan semakin sedikitnya penggunaan dokumen sebagai data training.

Kata Kunci : Klasifikasi Buku, Text mining, Naive bayes classifier

ABSTRACT

The large number of library material in the form of new books available in the library causes staff to
have difficulty in managing library data such as borrowing data, report data, and the classification and
search of books. Likewise faced by library staff in the Mathematics and Natural Sciences Department
of Cenderawasih University, which was the object of this study. This application was built using the
PHP programming language, MySQL database, and utilizing the Naïve Bayes Classiffier (NBC) method
and text mining. The book classification consists of four categories, namely: mathematics, physics,
information systems, and statistics. The results of 30 sample data of book abstract divided into training
data and testing data obtained accuracy from a probability value of 90%. So it can be concluded that
the high classification accuracy is obtained by the many uses of documents as training data and
conversely the accuracy will decrease with the fewer use of documents as training data

Keyword : Book Classification, Text mining, Naive Bayes classifier

1
I. PENDAHULUAN Berdasarkan hasil survey melalui
1.1 Latar Belakang Masalah wawancara kepada pustakawan dan kuesioner
online yang disebar, berhasil diisi oleh 82
Perpustakaan sebagai pengelola mahasiswa/i aktif Jurusan Matematika FMIPA
informasi dan pengetahuan harus bisa Universitas Cenderawasih dengan Google
menggunakan dan memanfaatkan teknologi Form didapatkan hasil bahwa persentase perlu
informasi dengan optimal untuk memenuhi adanya sebuah aplikasi perpustakaan sebesar
berbagai kebutuhannya. Beberapa 100%. Gambaran di atas menjadikan sebuah
pertimbangan tentang alasan perpustakaan objek penelitian oleh penulis untuk membuat
memanfaatkan teknologi informasi dan sebuah aplikasi perpustakaan yang dapat
komunikasi antara lain: (1) tuntutan terhadap melakukan pencarian buku dengan bantuan text
kuantitas dan pelayanan perpustakaan, (2) mining. Adapun metode yang penulis terapkan
tuntutan terhadap penggunaan koleksi secara ialah Naïve Bayes Classifier yang fungsinya
bersama, (3) kebutuhan untuk mengefektifkan untuk mengakuratkan penklasifikasian dan
sumber daya manusia, (4) tuntutan terhadap pencarian judul buku perpustakaan.
efisien waktu, dan (5) keragaman informasi
yang dikelola (Saleh, 2006:1). Tujuan Maka dari itu, penulis mengfokuskan
perpustakaan adalah untuk menyediakan permasalahan pada pengklasifikasian dan
fasilitas dan sumber informasi dan menjadi pencarian buku dengan membuat sebuah
pusat pembelajaran (Sutarno NS, 2006:34). aplikasi perpustakaan yang berjudul
“Implementasi Naïve Bayes Classifier Untuk
Berdasarkan hasil wawancara dengan Klasifikasi Dan Pencarian Buku Pada
penanggung jawab perpustakaan di Jurusan Aplikasi Perpustakaan Berbasis Web (Studi
Matematika FMIPA Universitas Cenderawasih Kasus: Perpustakaan Jurusan Matematika
yaitu Bapak Abraham bahwa saat ini proses Fmipa Universitas Cenderawasih)”.
yang terjadi di perpustakaan dari awal Diharapkan dengan adanya aplikasi tersebut
pendataan pengunjung perpustakaan, dapat mempermudah pelayanan dan akses
pendataan katalog buku, pencarian buku, informasi serta pengelolaan data perpustakaan
pendataan peminjaman buku hingga pendataan bagi mahasiswa dan petugas perpustakaan.
pengembalian buku masih dilakukan secara
manual. Informasi mengenai data yang berhasil 1.2 Tujuan Penelitian
didapat ialah rata-rata jumlah pengunjung 1. Mempelajari metode Naïve Bayes Classifier
perpustakaan pada setiap bulannya yaitu ± 40 untuk pengklasifikasian dan pencarian
orang, sedangkan rata-rata jumlah peminjam buku.
yang tercatat pada setiap bulannya ± 12 kali 2. Membangun sebuah aplikasi Perpustakaan
peminjaman, belum lagi ditambah dengan di Jurusan Matematika FMIPA Universitas
perpanjangan buku yang tidak tercatat oleh Cenderawasih.
petugas. Namun jumlah pendataan 3. Mengimplementsikan metode Naïve Bayes
pengembalian buku tanpa denda didapatkan Classifier untuk aplikasi perpustkaan.
rata-rata ± 3 kali pengembalian perbulan.
Sedangkan pengembalian buku dengan denda 1.3 Rumusan Masalah
dapat mencapai ± 8 kali pengembalian. Berdasarkan uraian pada latar belakang,
Ditambah lagi, informasi kehilangan buku maka masalah yang akan di bahas pada
tercatat ± 2 kali dalam sebulan. Data ini penulisan ini, yaitu :
berdasarkan pencatatan perpustakaan pada 1. Bagaimana membuat Aplikasi Perpustakaan
bulan Februari 2017 – November 2018. Pada Jurusan Matematika FMIPA Universitas
jumlah koleksi buku, sebanyak 360 dokumen Cendrawasih ditinjau dari pengklasifikasian
buku yang tercatat di dalam pencatatan data buku, pencarian koleksi buku, pendataan
oleh petugas perpustakaan. Rentannya peminjaman dan pengembalian buku?
kerusakan dan kehilangan informasi buku 2. Bagaimana hasil implementasi metode
maupun pendataan peminjaman, pengembalian, Naïve Bayes Classifier pada Aplikasi
dan denda membuat sistem ini dianggap kurang Perpustakaan Jurusan Matematika FMIPA
efektif. Selain itu dengan jumlah buku yang Universitas Cendrawasih dalam
banyak dan akan terus bertambah membuat pengklasifikasian dan pencarian buku
proses pencarian ketersediaan buku sangat sulit. perpustakaan?

2
1.4 Batasan Masalah Seleksi kata dengan minimal muncul pada 4
Pada penulisan ini, masalah yang atau 5 dokumen memberikan akurasi yang
dibatasi diantaranya : paling tinggi. Pada klasifikasi dokumen berita
1. Data buku yang diuji berasal dari Jurusan didapatkan akurasi yang lebih tinggi (maksimal
Matematika FMIPA Universitas 91%) dibandingkan dengan dokumen akademik
Cendrawasih. (maksimal 82%). Baik pada dokumen berita
2. Proses klasifikasian buku berdasarkan maupun dokumen akademik, penggunaan 50%
abstrak buku tersebut. dokumen sebagai dokumen pelatihan
3. Algoritma yang akan diimplementasikan memberikan kinerja akurasi diatas 75%.
pada bahasan mengenai proses Penggunaan kata unik dalam koleksi dokumen
pengklasifikasian dan pencarian buku latih tanpa filter memberikan kinerja yang
adalah Naïve Bayes Classifier. kurang optimal. Telah dicoba melakukan filter
4. Proses pencarian buku berdasarkan judul, kata menggunakan frekuensi dokumen.
abstrak, kategori, penulis, pengarang dan Ditemukan filter minimal kata muncul dalam 4
tahun terbit. atau 5 dokumen memberikan hasil akurasi yang
paling tinggi dibandingkan dengan filter yang
II. LANDASAN TEORI lain. Meskipun demikian belum dapat diketahui
2.1 Tinjauan Pustaka acuan batasan nilai minimal ini jika jumlah
Dalam penulisan ini tinjauan pustaka dokumen lebih banyak lagi.
penelitian dibagi kedalam dua sub bab, yaitu:
penelitian terdahulu dan matriks penelitian. Penelitian ketiga berjudul, “Text
Adapun penjelasannya adalah sebagai berikut: Classification for Student Data Set using
Naive Bayes Classifier and KNN
Penelitian pertama berjudul, Classifier”(Rajeswari & Juliet, 2017).
“Implementasi Naïve Bayes Classifier Pada Penelitian ini fokus kami adalah pada
Program Bantu Penentuan Buku Referensi klasifikasi teks dengan menggunakan Naïve
Matakuliah” (Nurani, Susanto, & Proboyekti, Bayes classifier dan K-Nearest Neighbor
2007). Penelitian ini bertujuan untuk classifier yang dimana untuk membandingkan
pengklasifikasian buku-buku referensi kinerja dan akurasi dari pengklasifikasian
berdasarkan silabus matakuliah dengan dengan menggunakan Rapid miner pada data
memanfaatkan informasi dari buku berupa set mahasiswa. Hasil dari penelitian ini
daftar isi. Hasil penelitian menunjukkan bahwa menunjukkan bahwa Naives Bayes classifier
program bantu dapat dilakukan pada kasus ini adalah sebuah metode klasifikasi yang baik
diperoleh nilai presisi yaitu 63% dimana dengan nilai akurasi 66,67% dibandingkan
terdapat 63 dokumen dikategorikan benar dan dengan tingkat akurasi KNN yaitu dengan nilai
37 dokumen dikategorikan salah. Metode akurasi 38,89%.
Bayesian memerlukan pengetahuan awal untuk
dapat mengambil suatu keputusan. Tingkat Berdasarkan beberapa penelitian diatas,
keberhasilan metode ini sangat tergantung pada penulis dapat menyimpulkan bahwa metode
pengetahuan awal yang diberikan. Untuk buku- Naive Bayes Classifier merupakan metode yang
buku yang dijadikan referensi bersama dapat sesuai untuk membantu dalam pengklasifikasin
mengklasifikasikan dengan baik berdasarkan teks ataupun abstrak, data set mahasiswa.
nilai probabilitas tertingginya. Dalam kasus ini penulis mempunyai kesamaan
dengan penelitian-penelitian sebelumnya yaitu
Penelitian kedua berjudul, “Klasifikasi menggunakan algoritma Naïve Bayes dalam
Text dengan Naive Bayes Classifier (NBC) melakukan pengujian klasifikasi pada
untuk Pengelompokan Teks Berita untuk dokumen. Namun perbedaannya yaitu terletak
Abstract Akademis” (Hamzah, 2012). pada tujuan penulis untuk melakukan
Penelitian ini mengkaji kinerja NBC untuk klasifikasi sekaligus pencarian berdasar abstrak
kategorisasi teks berita dan teks akademis. buku untuk aplikasi perpustakaan di Jurusan
Penelitian menggunakan data 1000 dokumen Matematika FMIPA Universitas Cenderawasih.
berita dan 450 dokumen abstrak akademik. Ditambah dengan penggunaan metode TF
Hasil penelitian menunjukkan pada dokumen (Term Frequency) untuk menghitung bobot
berita akurasi maksimal dicapai 91% kemunculan kata/token pada data latih dan data
sedangkan pada dokumen akademik 82%. uji.

3
2.2 Landasan Teori 2.2.3 Term frequency
2.2.1 Text mining Term frequency atau lebih sering disingkat
(Feldman & Sanger, 2006) berpendapat dengan TF merupakan pembobotan yang
bahwa text mining adalah bidang baru dan sering digunakan dalam penelusuran
menarik dari penelitian ilmu komputer yang informasi dan text mining (Turney & Pantel,
mencoba memecahkan krisis informasi yang 2010). Term frequency adalah pembobotan
berlebihan dengan menggabungkan teknik dari yang sederhana dimana penting tidaknya
penambangan data, pembelajaran mesin, sebuah kata dianggap sama atau sebanding
pemrosesan bahasa alami, pengambilan dengan jumlah kemunculan kata tersebut
informasi, dan manajemen pengetahuan. dalam dokumen.

2.2.2 Text Processing 2.2.4 Naïve Bayes Classifier

Didalam proses text mining terdapat Naïve Bayes Classifier merupakan salah
proses text processing (Asshidiq & Sulistyo, satu metode machine learning yang
2013). Text processing merupakan tindakan memanfaatkan perhitungan probabilitas dan
menghilangkan karakter-karakter tertentu yang statistik yang dikemukakan oleh ilmuwan
terkandung dalam dokumen, seperti koma, Inggris Thomas Bayes, yaitu memprediksi
tanda petik dan lain-lain serta mengubah semua probabilitas di masa depan berdasarkan
huruf kapital menjadi huruf kecil. Text mining pengalaman di masa sebelumnya. Dasar dari
dalam prakteknya mencari pola-pola tertentu, Naïve Bayes yang dipakai dalam pemrograman
mengasosiasikan suatu bagian teks dengan adalah rumus Bayes:
yang lain berdasarkan aturan-aturan tertentu, P (A|B) = (P(B|A) * P(A))/P(B) (2.1)
kata-kata yang dapat mewakili sehingga dapat Peluang kejadian A sebagai B ditentukan
dilakukan analisa keterhubungan antar satu dari peluang B saat A, peluang A, dan peluang
dengan yang lain (Wisnu & Hetami, 2015). B. Pada pengaplikasiannya nanti rumus ini
Berikut tahapan-tahapan proses didalam text berubah menjadi:
processing: P(Vj | X) = (P(X|V j) x P(Vj)) / P(X) (2.2)
a. Tokenizing Dikarenakan P(X) bernilai konstan,
Tahap tokenizing adalah tahap maka hanya P(X|Cj) x P(Cj).
pemotongan tiap kata dalam kalimat atau Penyederhanaan dari NBC yang cocok
parsing dengan menggunakan spasi dalam pengklasifikasian teks atau dokumen.
sebagai delimiter yang akan menghasilkan Persamaannya adalah:
token berupa kata. Pada tokenizing Pr(X|vj) = П𝑛𝑖=1 Pr(Xt|vj) (2.3)
terdapat beberapa proses yang harus VMAP = arg 𝑚𝑎𝑥 V𝑗 ∈ V P(Vj) P(X |Vj) (2.4)
dilakukan yaitu merubah semua huruf
besar menjadi kecil (text to lowercase). Keterangan:
Docsj
b. Filtering P(Vj) = (2.5)
|Contoh|
Tahap filtering adalah tahap penyaringan nk+1
kata yang didapat dari tokenizing yang P(Wk | Vj) = (2.6)
n+|vocabulary|
dianggap tidak penting atau tidak memiliki
makna dalam proses text mining yang Dimana untuk:
disebut stopword. Stopword berisi Vmap :nilai kemungkinan tertinggi dari
katakata umum yang sering muncul dalam seluruh anggota himpunan V
sebuah dokumen dalam jumlah banyak P(Vj) :peluang dari nilai kategori dari
namun tidak memiliki kaitan dengan tema himpunan V
tertentu. Contoh stopwords adalah “yang”, Docsj :jumlah dokumen yang memiliki
“di”, dll. kategori j dalam pelatihan
c. Stemming Contoh : jumlah dokumen yang digunakan
Tahap stemming adalah tahap P(Vj|X): probabilitas kemunculan kelas Vj
mengembalikan kata-kata yang diperoleh dengan kondisi X,
dari hasil filtering ke bentuk dasarnya, X : kejadian X
menghilangkan imbuhan awal (prefix) dan Vj : kelas yang tersedia (V1..Vn)
imbuhan akhir (sufix) sehingga didapat
kata dasar.

4
P(X) : probabilitas kemunculan kejadian X yang nantinya akan dibandingkan dalam
dengan kondisi Vi, karena bernilai proses text mining. Penulis menggunakan 20
konstan, seringkali dihilangkan. sampel dokumen buku sebagai data latih
Xt : nilai-nilai atribut dalam sample X dalam penelitian.
Pr(X|Vj):probabilitas kejadian Xt dengan b. Data Uji
kondisi Vj, dapat dihitung dari Data uji atau sering disebut dengan data
database training testing, yaitu data judul buku yang telah
nk : frekuensi munculnya kata wk dalam dikumpulkan penulis dan selanjutnya akan
dokumen yang berkategori vj diklasifikasikan kedalam kelas-kelas
n : banyaknya keseluruh kata dalam kategori buku secara otomatis dengan
dokumen berkategori vj menggunakan metode text processing yang
vocabulary: banyaknya kata di dalam contoh akan digunakan sebagai data uji dari aplikasi
pelatihan. (Hamzah, 2012) yang dibuat. Penulis menggunakan 10
dokumen sampel data uji dalam penilitian.
III. METODOLOGI PENELITIAN
3.1 Tahapan Penelitian 3.2.2 Analisis Kebutuhan Fungsional
Kebutuhan fungsional dari aplikasi ini
Mulai
meliputi:
a. Sistem dapat melakukan input pendataan
buku.
Wawancara/Kuesioner
Analisa Kebutuhan b. Sistem dapat melakukan input pendataan
Studi Pustaka
anggota perpustakaan.
c. Sistem dapat melakukan transaksi
Perancangan Konsep Perancangan UML
peminjaman.
Perancangan Basis Data d. Sistem menyediakan fitur yang
Perancangan Tampilan memungkinkan penggunanya mengetahui
Perhitungan metode detail buku dalam perpustakaan.
e. Sistem dapat menghitung denda apabila
Pembuatan Aplikasi
Pemograman PHP peminjam terlambat mengembalikan
Database MySQL buku.
f. Sistem dapat menampilkan laporan
Pengujian Aplikasi Black Box bulanan peminjaman buku, pengembalian
Accuracy buku, dan denda.
Tidak
Sesuai? 3.2.3 Analisis Kebutuhan Pengguna
Ya
a. Kebutuhan Mahasiswa dan dosen
1. Mahasiswa dan dosen login ke sistem
Pembuatan Laporan
2. Mahasiswa dan dosen mencari buku
perpustakaan
3. Mahasiswa melakukan peminjaman
Selesai
buku secara online
b. Kebutuhan admin
Gambar 3.1 Tahapan Penelitian 1. Melakukan login ke dalam sistem
2. Kelola data mahasiswa dan dosen
3.2 Analisis Kebutuhan 3. Kelola data buku
Analisis yang dibutuhkan terdiri dari 4. Kelola data peminjaman
analisis pengguna. 5. Kelola data denda
3.2.1 Analisis Kebutuhan Data 6. Kelola report
a. Data Latih
Data latih merupakan kumpulan data 3.3 Perancangan Penelitian
buku yang bersumber dari koleksi Perancangan penelitian menggunakan
perpustakaan yang selanjutnya Unified Modeling Language, perancangan
diklasifikasikan secara manual kedalam basis data, perancangan antar muka serta lokasi
kelas-kelas datanya oleh penulis. Data inilah dan waktu penelitian.

5
3.3.1 Use Case Diagram
Usecase
User System

Sistem Klasifikasi dan Pencarian Buku di Perpustakaan

Login
Mengklik Menu Buku

Menampilkan Etalase
Kelola Data Mahasiswa
Buku

<<Extend>> <<Extend>>
<<Extend>>
Mengklik button Pinjam
Hapus Data Edit Data Tambah Data
Mahasiswa Mahasiswa Mahasiswa

Kelola Data Dosen


Menampilkan Form
Peminjaman Buku
<<Extend>> <<Extend>> Mengisi form
<<Extend>>
Hapus Data Tambah Data peminjaman
Dosen Edit Data Dosen
Dosen

Klik button Booking


Kelola Data Kategori
Menyimpan data booking
<<Extend>>
<<Extend>> <<Extend>> Mahasiswa buku

Hapus Data Edit Data Tambah Data


Kategori Kategori Kategori

Kelola Data Buku

Admin <<Extend>> <<Extend>>


<<Extend>>
Gambar 3.6 Activity Diagram Peminjaman
Hapus Tambah
Data Buku Edit Data Data Buku
Buku

Kelola Data Denda


Dosen
3.3.3 Sequence Diagram
<<Extend>><<Extend>>
Hapus Data Edit Data
Denda Denda
Database Halaman User

Cari buku

<<Extend>> User 1: [input]


Lihat Buku
Username dan
Password ()
2: [Cek] Username
Riwayat Peminjaman
dan Password ()
3: [salah] ()
Report
4: [berhasil] ()
<<Extend>>
<<Extend>>
<<Extend>>
Jumlah
Transaksi
Peminjaman
Jumlah buku Total Denda 5: [Tampilkan
belum
dikembalikan Halaman User] ()

Gambar 3.2 Use case diagram Gambar 3.7 Sequence Diagram Login

3.3.2 Activity Diagram Menu Buku Preprocessing Database

User System Mahasiswa / Dosen

1: [input Query]
()

Menam pilkan halam an 2: [Klik Cari] ()


Buka aplikas i
login 3: [Get Query] ()

4: [Tokenizing] ()

Mengis i Us ernam e dan


Validas i login
Pas s word 5: [Filtering] ()

7: [Token All
6: [Stemming] ()
doc] ()
Salah
8: [Return token
dok] ()
Benar
9: [Token per
Menam pilkan halam an doc] ()
utam a 16: [Tampilkan
hasil pencarian]
()

Gambar 3.8 Sequence Diagram Pencarian


Gambar 3.3 Login Buku
Menu
Database
User System Peminjaman

Admin

Memilih Menu
Manajemen Buku

Menampilkan Etalase
Buku

2: [Get Data
1: [Cek Peminjaman baru]
Input Query pada
Cek Query
Peminjaman] () ()
textbox pencarian

tidak kosong

kosong 3: [Klik Acc


Peminjaman] ()
Melakukan proses
tokenization, filtering, dan
stemming 5: [Return Data
Peminjaman] ()
Hitung Similarity
data buku 6: [Tampilkan
Data
Peminjaman] ()
Tampilkan
Pilih hasil pencarian
Informasi Buku

Gambar 3.9 Sequence Diagram Acc Pinjam


Gambar 3.5 Activity Diagram Pencarian Buku

6
3.3.4 Perancangan Basisdata Tabel 3.5 Tabel Buku
Tabel 3.1 Tabel Admin No. Field Type Size Ke Description
N Field Type Siz Ke Descript Name y
o. Name e y ion 1 Id_buku Varc 10 PK Id buku
1 id_adm Int 11 PK Id admin har
in 2 Id_kateg Varc 11 FK Id kategori
2 Userna Varch 15 usernam ori har auto increment
me ar e user 3 Judul Text Judul buku
3 Passwo Varch 10 passwor 4 Penerbit Varc 30 Penerbit buku
rd ar d user har
Tabel 3.2 Tabel Anggota 5 Pengaran Varc 30 Pengarang
N Field Type Si K Descrip g har buku
o. Name ze ey tion 6 Catatan Text Catatan
1 Nim / Nip Varc 15 P Nim tentang buku
har K mahasi 7 Tahun_t Int 4 Tahun terbit
swa erbit buku
2 Nama_Le Varc 10 Nama 8 Stok Int 5 Stok buku
ngkap har 0 mahasi 9 Image_b Text Gambar buku
swa uku
3 Jurusan Varc 10 Jurusan
har 0 Tabel 3.6 Tabel Report
4 Email Varc 50 Email No. Field Name Type Size Key Description
har mahasi 1 Id_report Int 5 PK Id report
swa 2 Id_peminjaman Int 5 FK Durasi
5 Password Varc 10 Kata denda
har sandi 3 Id_denda Int 5 FK Harga denda
akun 4 Bulan Date Bulan
mahasi pengambilan
swa laporan
6 Image_mh Text Foto
s mahasi Tabel 3.7 Tabel Peminjaman
swa
Field Type Size Key Description
Tabel 3.3 Tabel Kategori No.
Name
N Field Type Si K Descrip Id_pinjam Int 5 PK Id
o. Name ze ey tion 1
pinjam
1 Id_katego Varc 11 P Id 2 Id_buku Varchar 10 FK Id buku
ri har K kategor NIM Varchar 15 FK Nim
i auto 3
mhs
increm NIP Varchar 15 FK Nip
ent 4
dosen
2 Nama_kat Varc 30 Nama 5 Tgl_pinjam Date 30 Tgl pjm
egori har kategor
Tgl_selesai Date Tgl
i 6
Slsai
Tabel 3.4 Tabel Denda
Tgl_kembali Date Tgl
No Field Typ Siz Ke Descripti 7
kembali
. Name e e y on 8 Notif Email Int 1 Email
1 Id_den Int 5 PK Id denda 9 Denda Int 1 Denda
da Keterangan Text Ket.
2 Durasi Int 2 Durasi 10
pinjam
denda
3 Nomin Int 15 Harga
al denda

7
3.4 Teknik Analisis Gambar 3.13 Term Frequency
3.4.1 Text Processing Tabel 3.8 Token Data Latih
Bobot
a. Tokenizing No Token
Tokenizing
A1 A2 A3 A4
1 fisika 0 17 0 0
Masukan
abstak buku 2 listrik 0 7 0 0
3 magnet 0 3 0 0
Case Folding

4 muatan 0 1 0 0
Cleaning
preg_replace 5 coulomb 0 1 0 0
Mengubah menjadi 6 medan 0 1 0 0
kata explode
7 gauss 0 1 0 0
RETURN
8 potensial 0 1 0 0
Gambar 3.10 Tokenizing 0
9 kapasitor 1 0 0
c. Filtering
10 elektrika 0 1 0 0
Dst…
180 Output 0 0 2 0
Total 141 134 167 177

3.4.3. Naïve Bayes Classifier


a. Klasifikasi

Gambar 3.11 Filtering


d. Stemming

Gambar 3.14 Proses Klasifikasi NBC

Gambar 3.12 Stemming a. Menghitung probabilitas untuk setiap


kelas :
3.4.2. TF
Berdasarkan persamaan pada (2.5) maka
didapatkan perhitungan seperti dibawah ini:
Docsj
P(Vj) =
|Contoh|

Tabel 3.9 Probabilitas kelas

Doscj |Contoh| Hasil


P(A1) 5 0,25
P(A2) 5 20 0,25
P(A3) 5 0,25

8
P(A4) 5 0,25

b. Menghitung probabilitas setiap kata IV. Hasil dan Pembahasan


(token) pada setiap kelas
Berdasarkan persamaan pada (2.6) maka 4.1 Hasil
didapatkan perhitungan seperti dibawah ini:
𝒏𝒌 +𝟏
Pr(wi|vj) =|𝒏|+(𝒗𝒐𝒄𝒂𝒃𝒖𝒍𝒂𝒓𝒚)

1. Term “fisika”
1+0
• Pr(fisika |A1) = = 0,0013
141+619
1+17
• Pr(fisika |A2) = = 0,0239 Gambar 4.1 Halaman Login
134+619
1+0
• Pr(fisika |A3) = = 0,0013
167+619
1+0
• Pr(fisika |A4) = = 0,0013
177+619
...Dst
68. Term “output”
1+0
• Pr(output |A1) = = 0,0013
141+619
1+0
• Pr(output |A2) = = 0,0013 Gambar 4.2 Halaman Utama Admin
134+619
1+2
• Pr(output |A3) = = 0,0038
167+619
1+0
• Pr(output |A4) = = 0,0013
177+619

Tabel 3.10 Probabilitas term pada tiap kelas


Bobot
Ter m
A1 A2 A3 A4 Gambar 4.3 Beranda Anggota
fisika 0,0013 0,0239 0,0013 0,0013
listrik 0,0013 0,0106 0,0013 0,0013
magnet 0,0013 0,0053 0,0013 0,0013
Dst
output 0,0013 0,0013 0,0038 0,0013

b. Pencarian
Mulai

Menghitung jumlah kemunculan token


per kelas/kategori

Menghitung P(vj) = docsj/ Contoh Gambar 4.4 Manajemen Buku

Mencari nilai max P


(vj)

Tampilkan hasil
pencarian

Selesai

Gambar 3.14 Proses Pencarian NBC

Gambar 4.5 Manajemen Peminjaman

9
D Abstrak
generaliz, regresi, neural, network,
dinamika, atmosfer, dinamis,
metode, olah, data, analisis,
Gambar 4.6 Konfirmasi Acc Pinjam interpretasi, penelitian, prakiraan,
peluang, strategis

1) Klasifikasi buku
a. Probabilitas setiap kelas:
Selanjutnya adalah melakukan perkalian
nilai pada probabilitas setiap kelas pada data
latih dan uji dengan persamaan (2.2) dan (2.4):
Rumus robabilitas jumlah token pada
Gambar 4.7 Halaman Report masing-masing kelas di data latih:
1. Pr(A1) = 141 / 619 = 0,2278
4.2Pembahasan 2. Pr(A1) = 134 / 619 = 0,2165
3. Pr(A1) = 167 / 619 = 0,2698
Sebelum tahap NBC, dilakukan 4. Pr(A1) = 177 / 619 = 0,2859
penjumlahan total dari setiap token pada
keseluruhan data latih yang sudah didapatkan Tabel 4.1 Perhitungan NBC
dari hasil text processing dan TF sebelumnya No Kelas Formulas Total
pada bab 3 yaitu hasil penggabungan dokumen 1 A1/Mtk 0,0013 x 2,1736E-
tiap kelas. 0,0013 x 73
(Vocabulary) = |A1|+|A2|+|A3|+|A4| 0,0013 x
= 141 + 134 + 167+ 177 0,0013 x
= 619 token 0,0013 x
0,0013 x
Perhitungan contoh data uji D1: 0,0013 x
D Abstrak 0,0013 x
Buku ini mengajarkan penerapan 0,0013 x
ilmu statistika pada kasus 0,0013 x
klimatologi. Topik yang disajikan 0,0013 x
antara lain adalah random forest 0,0013 x
untuk klasifikasi status cuaca, 0,0013 x
prediksi pasang surut menggunakan 0,0013 x
algorithme & trous wavelet, prediksi 0,0013 x
curah hujan menggunakan 0,0013 x
generalized regresi neural network. 0,0013 x
Perubahan dinamika atmosfer yang 0,0013 x
sangat dinamis membuat para 0,0013 x
D1
pengguna membutuhkan referensi 0,0013 x
metode statistika guna memperoleh 0,0013 x
hasil yang lebih optimal khususnya 0,0013 x
dalam berbagai pengolahan data, 0,0013 x
analisis , interpretasi, serta prediksi. 0,0013 x
Hadirnya buku ini diharapkan 0,0013 x
mampu sebagai referensi dalam 0,0013 x
melakukan penelitian dan bisa 0,0013 x 141 /
membantu untuk merubah tantangan 619
prakiraan menjadi sebuah peluang 2 A2 / 0,0013 x 5,2068E-
strategis di masa yang akan datang. Fisika 0,0013 x 73
terap, ilmu, statistik, klimatologi, 0,0013 x
Stem
klasifikasi, cuaca, prediksi, 0,0013 x
ming
algorithme, trous, wavelet, hujan, 0,0013 x

10
No Kelas Formulas Total No Kelas Formulas Total
0,0013 x 0,0138 x (nilai
0,0013 x 0,0013 x maksimal)
0,0013 x 0,0013 x
0,0013 x 0,0013 x
0,0013 x 0,0013 x
0,0013 x 0,0013 x
0,0013 x 0,0013 x
0,0013 x 0,0013 x
0,0013 x 0,0013 x
0,0013 x 0,0013 x
0,0027 x 0,0063 x
0,0013 x 0,0013 x
0,0013 x 0,0013 x
0,0013 x 0,0013 x
0,0013 x 0,0013 x
0,0013 x 0,0013 x
0,0013 x 0,0013 x
0,0013 x 0,0013 x
0,0013 x 0,0239 x
0,0013 x 0,0075 x
0,0013 x 0,0013 x
0,0013 x 134 / 0,0013 x
619 0,0013 x
3 A3 / SI 0,0013 x 2,998E-72 0,0025 x
0,0013 x 0,0013 x 177 /
0,0013 x 619
0,0013 x
0,0013 x 2) Pencarian buku
0,0013 x Dibawah ini adalah kumpulan token data uji
0,0013 x di atas pada hasil stemming yang telah
0,0013 x terbentuk oleh data uji.
0,0013 x Tabel 4.2 Hasil Penggabungan Token
0,0013 x Kelas
0,0013 x No Token
A1 A2 A3 A4
0,0013 x
0,0013 x 1 terap 0 0 0 0
0,0013 x 2 ilmu 0 0 0 0
0,0013 x 3 statistik 0 0 0 10
0,0013 x
4 klimatologi 0 0 0 0
0,0013 x
0,0013 x 5 klasifikasi 0 0 0 0
0,0013 x 6 cuaca 0 0 0 0
0,0013 x 0
7 prediksi 0 0 0
0,0344 x
0,0013 x 8 algorithme 0 0 0 0
0,0013 x 9 trous 0 0 0 0
0,0013 x 10 wavelet 0 0 0 0
0,0013 x
11 hujan 0 0 0 0
0,0013 x
0,0013 x 167 / 12 generaliz 0 0 0 0
619 13 regresi 0 0 0 4
4 A4/Sta 0,0013 x 1,0759E- 14 neural 0 0 0 0
0,0013 x 69
15 network 0 0 0 0

11
Kelas V. Kesimpulan dan Saran
No Token 5.1 Kesimpulan
A1 A2 A3 A4
16 dinamika 0 1 0 0 1. Aplikasi perpustakaan berbasis web di
17 atmosfer 0 0 0 0 Jurusan Matematika FMIPA Universitas
Cenderawasih dalam pengembangannya
18 dinamis 0 0 0 0 menggunakan pemograman PHP dan database
19 metode 0 0 0 0 MySQL. Aplikasi ini memiliki fitur sebagai
20 olah 0 0 0 0 informasi perpustakaan seperti pendataan
21 data 0 0 26 18 anggota, pendataan peminjaman dan
pengembalian buku, pengklasifikasian data
22 analisis 0 0 0 5 buku, pencarian koleksi buku, dan pembuatan
23 interpretasi 0 0 0 0 laporan perpustakaan. Pengujian black box
24 penelitian 0 0 0 0 pada aplikasi menghasilkan uji fungsi menu
0 maupun tombol dapat digunakan dengan baik
25 prakiraan 0 0 0
dan tidak didapatkan error pada saat pengujian.
26 peluang 0 0 0 1
27 strategis 0 0 0 0 2. Klasifikasi dan pencarian buku dengan
Total 0 1 26 38 metode Naive Bayes Classifier pada
perpustakaan Jurusan Matematika FMIPA
a. Menghitung setiap probabilitas setiap Universitas Cenderawasih dilakukan dengan
kelas berdasarkan data latih dan data uji. menggunakan 20 data latih dan 10 data uji.
Berdasarkan persamaan pada (2.5) maka Hasilnya diperoleh seluruh dokumen relevan
didapatkan perhitungan seperti dibawah ini: dengan nilai probabilitas akurasi sebesar 90%.
Docsj Sehingga disimpulkan bahwa metode Naive
P(Vj) = Bayes Classifier dapat digunakan untuk
|Contoh|
0 membantu mengklasifikasikan judul buku
1. P(X|A1) = x 0,25 = 0
20
1 maupun pencarian buku. Maka didapatkan
2. P(X|A2) = x 0,25 = 0,0125 bahwa semakin banyak jumlah data latih yang
20
26
3. P(X|A3) = x 0,25 = 0,325 digunakan, maka semakin baik pula dalam
20
38 melakukan pengklasifikasian judul buku.
4. P(X|A4) = x 0,25 =0,475
20
5.2 Saran
Hasil maksimum dari perbandingan
perhitungan probabilitas kelas diatas adalah: 1. Aplikasi perpustakaan Jurusan Matematika
P(X|A4) atau kategori statistik FMIPA Universitas Cenderawasih diharapkan
Penulis melakukan pengujian pada dapat dikembangkan dengan menggunakan
aplikasi dengan menggunakan 20 data latih dan metode maupun algoritma klasifikasi lain yang
10 dokumen uji. Dari pengujian tersebut dapat lebih optimal.
disimpulkan bahwa metode naive bayes 2. Untuk mendukung hasil yang akurat maka
classifier pada pengklasifikasian judul buku ini disarankan untuk menggunakan banyak
menghasilkan akurasi dari nilai probabilitas dokumen sumber untuk pengisian data latih di
sebesar 90%. Dengan akurasi yang tinggi database.
membuktikan bahwa metode Naive bayes dapat 3. Masih dapat terjadinya penginputan data
digunakan untuk membantu buku yang berulang atau sama pada proses
mengklasifikasikan buku perpustakaan. Dari tambah buku perpustakaan.
hasil percobaan yang telah dilakukan, maka 4. Sistem ini dapat dikembangkan dengan
didapatkan bahwa semakin banyak data latih menambahkan sistem multi peminjaman buku
yang digunakan, maka semakin baik pula dalam sekali transaksi serta validasi tanggal
aplikasi dalam melakukan pengklasifikasian peminjaman sehingga aplikasi ini dapat
judul buku. digunakan secara maksimal.

12
DAFTAR PUSTAKA SERING DIPINJAM DAERAH
A. Nurani, B. Susanto, U. Proboyekti. (2007). DEMAK MENGGUNAKAN NAÏVE
Implementasi Naïve Bayes Classifier BAYES, 1–25.
Pada Program Bantu Penentuan Buku Suryatiningsih. (2009). Web Programing.
Referensi Matakuliah, Jurnal Politeknik Telkom Bandung.
Informatika, 3(2), 32- 36. Turney, P., & Pantel, P. (2010). From
Asshidiq, A. S., & Sulistyo, M. (2013). frequency to meaning: Vector space
Penilaian Ujian Bertipe Essay models of semantics. Journal Of
Menggunakan Metode Text Similarity. Artificial Intelegence Research , 37, 141-
Jurnal Informatika. 188.
Bramwell A. Kasaedja, Rizal Sengkey, ST, Widodo, P.P. & Herlawati. (2011).
MT, Oktavian A. Lantang, ST, M. Menggunakan UML. Informatika
(2014). Rancang Bangun Web Service Bandung.
Perpustakaan Universitas Sam Wisnu, D., & Hetami, A. (2015). Perancangan
Ratulangi. E-Journal Teknik Elektro Dan Informtaion Retreival (IR) untuk
Komputer, 13. Pencarian Ide Pokok Teks Artikel
Feldman, R., & Sanger, J. (2006). The Text Berbahasa Inggris dengan Pembobotan
Mining Handbook. Vector Space Model. Jurnal Ilmiah
Hamzah, A. (2012). Klasifikasi Teks Dengan Teknologi dan Informasi, Volume 9.
Naïve Bayes Classifier (NBC) Untuk
Pengelompokan Teks Berita Dan
Abstract Akademis.
Kurniawan, B., Effendi, S., & Sitompul, O. S.
(2012). Klasifikasi Konten Berita
Dengan Metode Text Mining. Jurnal
Dunia Teknologi Informasi, 1(1), 14–19.
Kustiyahningsih, Yeni dan Devie Rosa
Anamisa. (2011). Pemrograman Basis
Data Berbasis Web Menggunakan PHP
& MySQL. Graha Ilmu.
Li-guo, D., & Ai-ping, L. (2014). A New Naive
Bayes Text Classification Algorithm,
12(2), 947–952.
Medi, S. (2012). Pembuatan Website Sekolah
Menengah
NS, Sutarno. (2006). Manajemen Perpustakaan:
Suatu Pendekatan Praktik. Sagung Seto.
Nugroho, Adi. (2005). Analisis dan
Perancangan Sistem Informasi dengan
Metodologi Berorientasi Objek. Edisi
Revisi, Informatika Bandung.
Pressman, R.S. (2010) Software Engineering: a
Practioner's Approach 7thEdition,
McGraw-Hill Higher Education.
Raharjo, B. (2015). Mudah Belajar PHP.
Informatika Bandung.
Rajeswari, R. P., & Juliet, K. (2017). Text
Classification for Student Data Set using
Naive Bayes Classifier and KNN
Classifier, 43(1), 8–12.
Saleh, Abdul Rahman. (2006). "Program
Otomasi untuk Meningkatkan Kinerja
Perpustakaan".
Serovia, L., & Sudaryanto, S. (2017).
PREDIKSI DATA BUKU YANG

13