5
UNTUK MENENTUKAN MINAT SISWA MEMBACA PADA
PERPUSTAKAAN SMP NEGERI 1 LASEM KABUPATEN
REMBANG
Abstrak
Di Era modern ini banyak sekali penggunaan media internet yang berdampak semakin
sedikitnya minat seseorang dalam membaca buku. Pada SMP Negeri 1 Lasem memiliki masalah
peminatan siswa dalam membaca buku yang masih belum diketahui seberapa banyak siswa
minat meminjam buku di perpustakaan SMP Negeri 1 Lasem. Oleh karena itu untuk mengetahui
seberapa besar minat siswa meminjam buku diperpustakaan SMP Negeri 1 Lasem perlu
melakukan pencarian informasi dari data peminjaman buku perpustakaan dengan
menggunakan teknik klasifikasi data mining dalam meningkatkan nilai ujian nasional dan ujian
sekolah yang lebih baik. Dengan teknik klasifikasi data mining algoritma C4.5 dengan data
setnya adalah peminjaman buku perpustakaan. Hasil yang diperoleh adalah node dan posisi
terbaik, dengan posisi terbaik ditentukan pada atribute jangka pinjam karena bersifat kontinu
yang memiliki gain tertinggi. Informasi yang dihasilkan adalah posisi terbaik dari atribute
jangka pinjam , serta perhitungan entropy mencari node akar dengan gain tertinggi diambil
dari attribute jangka pinjam, jenis kelamin, kelas, jenis buku. Sehingga proses tersebut diulang
ulang sampai pada posisi terbaik jangka waktu dan node untuk mendapatkan hasil akhir minat
atau tidak minat sebagai pembentuk pohon keputusan. Dengan diketahuinya siswa yang paling
banyak meminjam buku di perpustakaan akan dapat memprediksikan minat baca siswa baru.
Kata Kunci: Data Mining, Teknik Klasifikasi, Algoritma C4.5, Peminjaman buku,
Perpustakaan, pohon keputusan
Abstract
In the modern era is a lot of use of internet media which affects fewer person's interest in
reading books. At SMPN 1 Lasem specialization students have problems in reading the book is
not yet known how many students interest to borrow books at the library of SMP Negeri 1
Lasem. Therefore, to find out how much interest students in the library to borrow books SMPN
1 Lasem need to search information from the data library book lending by using techniques
classification of data mining to improve the national test scores and better school exam. With
the technique classification of data mining algorithms C4.5 to the data disk set is a book lending
library. The results obtained are the nodes and the best position, the best position is determined
on the attributes and loan term due to be continuous which has the highest gain. The resulting
information is the best position of attribute-term loans, as well as the calculation of entropy
looking for the root node with the highest gain is taken of attribute-term loans, gender, class,
type of book. So the process is repeated again until the best position and node time period to get
the final result as interest or no interest in forming a decision tree. By knowing the students
most borrowed books in the library will be able to predict the new students' interest in reading.
Keywords: Data Mining, Techniques Classification, Algorithm C4.5, book lending, library,
decision trees
1
1. PENDAHULUAN sedikit karena menghadapi ujian
nasional. Akan tetapi banyak sedikitnya
Di era modern ini banyak sekali jumlah kunjungan masih belum dapat
penggunaan media internet yang menentukan banyaknya buku yang
berdampak semakin sedikitnya dipinjam karena mungkin penyebab
seseorang dalam membaca buku. utamanya malas mencari buku yang
Padahal buku adalah ilmu pengetahuan jumlahnya banyak dan akhirnya hanya
yang sangat banyak dan eksklusif untuk sekedar berkunjung. Padahal membaca
ditelusuri daripada media internet hanya buku dengan cara meminjam buku
menyediakan sedikit referensi. Banyak berpengaruh pada nilai ujian sekolah
perpustakaan-perpustakaan di Indonesia maupun ujian nasional dan berdampak
termasuk di dalam sekolah maupun pada sekolah SMP Negeri 1 Lasem
jenjang yang lebih tinggi seperti sebagai sekolah terbaik sekabupaten
perguruan tinggi. Perpustakaan sekolah Rembang.
didirikan untuk mengajak para siswa
siswi untuk lebih mendalami dari setiap Maka dari itu diperlukannya suatu
pelajaran yang diberikan oleh guru penelitian untuk mengetahui seberapa
dikelas. Selain itu dengan sering besar minat membaca jika dilihat
membaca maupun meminjam buku di berdasarkan seberapa banyak
perpustakaan, kita dapat mengerjakan meminjam buku di perpustakaan bukan
tugas sekolah dengan benar. Pada dari data berkunjung. Dengan data
Perpustakaan SMP NEGERI 1 Lasem, mining algoritma C4.5 dapat
Kabupaten Rembang memiliki tingkat membangun sebuah aplikasi dengan
kunjungan digambarkan dengan grafik perhitungan algoritma C4.5 berbasis
sebagai berikut: web sehingga nantinya jika terdapat
kelas yang memiliki data sedikit dalam
GRAFIK JUMLAH PENGUNJUNG meminjam buku perpustakaan akan
PERPUSTAKAAN SMP NEGERI 1 LASEM BULAN
JULI 2014 S.D JUNI 2015
disosialisasikan betapa pentingnya
500 membaca buku untuk keperluan ujian
sekolah maupun ujian nasional nanti
dimasa mendatang dan juga untuk
0 memprediksi peminatan membaca oleh
Juli-2014
Mei-2015
Okt-14
Des-2014
Nov-14
Jan-15
Feb-15
Apr-15
Agst-2014
Juni-2015
Sep-14
Mrt-2015
2
berguna untuk membuat pohon bantuan kompter agar data tersebut
keputusan (Decision Tree), sedangkan dapat terintegrasi dengan aplikasi yang
pohon keputusan adalah dibuat.
pengklasifikasian data yang dibentuk
dengan node [2]. 4. Data Mining
Dengan proses pengekstrakan data
mining ini mendapatkan pola data
2. METODE PENELITIAN peminjaman yang sudah dirubah dengan
Metode yang diusulkan metode C4.5 menerapkan algoritma C4.5.
dalam mencari dan menemukan
frekuensi minat siswa dalam setiap 5. Interpretation (Evaluation)
kelas ke perpustakaan tertinggi pada Pola yang sudah telah diidentifikasi
data peminjaman buku di SMP Negeri 1 nantinya diolah untuk diterjemahkan
Lasem Kabupaten Rembang. kedalam bahasa yang mudah dipahami
agar kelak dapat membantu
memperoleh keputusan strategi bisnis.
3
9 P IX Mapel 11 tidak IE el
A minat 38 L VII T.Map 5 minat
10 VII IF el
P Mapel 9 minat
II 39 L VII T.Map 5 minat
11 VII T.Map IF el
P 9 minat
II el 40 P VII T.Map 5 minat
12 VII T.Map tidak IF el
P 8
IF el minat 41 L IX T.Map 3 minat
13 VII T.Map B el
P 10 minat
IA el 42 L IX Mapel 3 minat
14 VII T.Map B
P 2 minat
IA el 43 P IX Mapel 9 tidak
15 VII T.Map E minat
P 3 minat
IH el 44 P IX Mapel 2 minat
16 VII T.Map B
P 6 minat
IH el 45 P IX Mapel 5 minat
17 VII T.Map H
P 4 minat
H el 46 P VII T.Map 4 tidak
18 VII T.Map IB el minat
P 4 minat
H el 47 L VII T.Map 8 minat
19 VII T.Map IE el
P 4 minat
H el 48 L VII Mapel 6 minat
20 VII T.Map IE
P 4 minat
A el 49 L VII T.Map 11 minat
21 VII T.Map IE el
P 4 minat
A el 50 P VII Mapel 8 minat
22 VII T.Map tidak IH
P 4
A el minat
23 VII T.Map
P 4 minat
A el 3.2 Proses Perhitungan
24 P VII T.Map 3 minat
IH el
25 P VII T.Map 6 tidak Pada proses perhitungan c4.5, pertama
IG el minat kali yang harus dilakukan adalah
26 P VII T.Map 6 tidak menghitung entropy dari semua data.
IG el minat Berikut ini perhitungannya:
27 P VII T.Map 2 tidak
ID el minat
28 P VII T.Map 2 tidak
E(Semua) = - ((p(minat/semua) x log2
ID el minat p(minat/semua)) + (p(tidak
29 P VII T.Map 2 minat minat/semua) x log2 p(tidak
IE el lancar/semua)))
30 L VII T.Map 2 minat = - (((32/50) x log2 (32/50)) + ((18/50)
IE el
x log2 (18/50)))
31 L VII T.Map 6 minat
IE el = 0.9427 (1)
32 P VII T.Map 6 tidak
IE el minat Langkah selanjutnya menentukan posisi
33 P VII T.Map 5 tidak terbaik. Untuk menentukan posisi
G el minat terbaik dibutuhkan data yang bersifat
34 P VII T.Map 5 tidak
kontinu atau data yang tidak ada batas
ID el minat
35 P VII T.Map 5 tidak jumlahnya, dalam data perpustakaan
ID el minat attribute yang bersifat kontinu adalah
36 P VII T.Map 5 minat jangka pinjam, lalu penentuan posisi
IE el terbaik didapatkan dari gain yang paling
37 P VII T.Map 5 minat
4
tinggi sedangkan entropy jangka pinjam Entropy Total
didapatkan dengan menggunakan 50 32 18 0.942
7
rumus:
Jangka Pinjam
E(jangka pinjam) = - ((p(minat/jangka <= 10 46 31 15 0.910 0.03
pinjam) x log2 p(minat/ jangka pinjam)) 9 98
+ (p(tidak minat/) x log2 p(tidak minat/ > 10 4 1 3 0.811
jangka pinjam)) (2) 3
Jenis Kelamin
L 9 9 0 0 0.13
Berikut ini hasil perhitungan entropy
P 41 23 18 0.989 16
dan gain untuk mencari posisi terbaik 2
dari atribut plafond. Kelas
IX A 3 0 3 0 0.62
Tabel 2: Pencarian Posisi Terbaik IX B 3 3 0 0 2
IX E 1 0 1 0
N Jangka Mina Tidak Entrop Gain IX H 1 1 0 0
o Pinjam t Mina y VII A 4 3 1 0.811
t 3
1 <=2 4 2 0.9183 0.00 VII G 1 0 1 0
>2 28 16 0.9457 03 VII H 3 3 0 0
2 <=3 8 2 0.7219 0.02 VIII A 2 2 0 0
>3 24 16 0.971 15 VIII B 1 0 1 0
3 <=4 14 4 0.7642 0.03 VIII C 5 2 3 0.971
>4 18 14 0.9887 48 VIII D 4 0 4 0
4 <=5 20 10 0.9183 0.00 VIIIE 10 9 1 0.469
>5 12 8 0.971 33 VIII F 4 3 1 0.811
5 <=6 23 13 0.9436 0 3
>6 9 5 0.9403 Jenis Buku
6 <=8 26 14 0.9341 0.00 mata 9 6 3 0.918 0.00
12 pelajar 3 05
>8 6 4 0.971 an
7 <=9 28 15 0.933 0.00 tidak 41 26 15 0.947
>9 4 3 0.9852 24 mata 4
8 <=10 31 15 0.9109 0.03 pelajar
>10 1 3 0.8113 98 an
9 <=11 32 18 0.9427 0
>11 0 0 0 Dari Tabel 3: Pencarian Node
didapatkan suatu gain tertinggi yang
Dari Tabel 2: Pencarian Posisi Terbaik terletak pada attribute kelas, Nantinya
sehingga diperoleh posisi terbaik dalam attribute kelas sebesar 0.622 tersebut
menentukan gain terbesar pada attribute akan dijadikan node akar dimana
jangka pinjam yaitu <= 10 dan > 10. attribute kelas tersebut memiliki 3
Selanjutnya melakukan perhitungan cabang antara lain minat, tidak minat,
entropy dan gain yang nantinya untuk dan belum diketahui. Sehingga
memperoleh node akar. Dibawah ini diperlukan melakukan perhitungan
tabel perhitungan entropy dan gain. untuk mendapatkan nilai gain yang
masih belum diketahui hasilnya.
Tabel 3: Pencarian Node
Proses selanjutnya mencari node
Kriteri Juml Min Tida Entro Gain internal, caranya sama seperti tabel 2
a ah at k py
Min Pencarian Posisi Terbaik dan tabel 3
at Pencarian Node. Proses ini dilakukan
5
terus – menerus sampai data
mendapatkan hasil keputusan akhir
berupa pohon keputusan sebagai 3.3.3 Halaman Input Data Training
berikut.
6
ini digunakan oleh karyawan dengan data actual atau data asli dari
Perpustakaan. data training tersebut.
Gambar 8. Rules
Gambar 9. Memprediksi Siswa Baru
7
Gambar 11. Halaman Utama Admin
8
2. Dan pada algortima C4.5 telah baru supaya lebih menambah wawasan
dibuktikan tingkat akurasi dari prediksi pengetahuan dan bagi yang belum minat
dengan menggunakan confusion matrik membaca buku memberikan tambahan
sebanyak 71,5% dari semua data jangka pinjam dan buku-buku selain
berjumlah 1520 dengan diambil data matapelajaran seperti komik bergambar
training sebesar 70% dan data testing tentang kepahlawanan Indonesia dan
sebesar 30%. Atribute yang lain-lain.
mempengaruhi peminatan siswa dalam
membaca buku dalam algortima C4.5 DAFTAR PUSTAKA
tersebut adalah Jangka pinjam, Jenis
Kelamin, Kelas, Jenis Buku.. [1] Budanis Dwi Meilani Achmad dan
4.2 Saran Fauzi Slamat, Mei 2012. Klasifikasi
Data Karyawan Untuk Menentukan
1. Dalam peneltian ini memiliki Jadwal Kerja Menggunakan Metode
keterbatasan dalam pengetahuan Decision Tree, vol. 16, No.1.
sehingga perlu dilakukan perbaikan
antara lain: [2] Ferry Kristian Sukendro Wimmie
Handiwidjojo, Agustus 2015. Sistem
a. Sangat diperlukan lagi penelitian Informasi Penjualan Sepeda Motor
lebih lanjut agar penelitian saat ini dapat Bekas Menggunakan Algoritma C4.5,
dibandingkan penelitian-penelitian vol. 01, No. 02.
selanjutnya untuk mendapatkan hasil
yang lebih baik. [3] Dicky Nofriansyah, S.Kom,
M.Kom., 2015. Konsep Data Mining Vs
b. Diperlukan objek yang beda dengan Sistem Pendukung Keputusan.
data sama yaitu data peminjaman buku Yogyakarta: Deepublish.
perpustakaan untuk dijadikan
perbandingan objek lama dengan objek
yang baru.