Anda di halaman 1dari 9

IMPLEMENTASI DATA MINING ALGORITMA C4.

5
UNTUK MENENTUKAN MINAT SISWA MEMBACA PADA
PERPUSTAKAAN SMP NEGERI 1 LASEM KABUPATEN
REMBANG

Maulana Rezza Alvian, Acun Kardianawati


Universitas Dian Nuswantoro , Fasilkom Udinus, Jurusan Sistem Informasi
Jalan 5-11 Nakula 1, Semarang, 50131, (+6224) 3520165/ (+6224) 3569684
Marealalvian1994@gmail.com

Abstrak
Di Era modern ini banyak sekali penggunaan media internet yang berdampak semakin
sedikitnya minat seseorang dalam membaca buku. Pada SMP Negeri 1 Lasem memiliki masalah
peminatan siswa dalam membaca buku yang masih belum diketahui seberapa banyak siswa
minat meminjam buku di perpustakaan SMP Negeri 1 Lasem. Oleh karena itu untuk mengetahui
seberapa besar minat siswa meminjam buku diperpustakaan SMP Negeri 1 Lasem perlu
melakukan pencarian informasi dari data peminjaman buku perpustakaan dengan
menggunakan teknik klasifikasi data mining dalam meningkatkan nilai ujian nasional dan ujian
sekolah yang lebih baik. Dengan teknik klasifikasi data mining algoritma C4.5 dengan data
setnya adalah peminjaman buku perpustakaan. Hasil yang diperoleh adalah node dan posisi
terbaik, dengan posisi terbaik ditentukan pada atribute jangka pinjam karena bersifat kontinu
yang memiliki gain tertinggi. Informasi yang dihasilkan adalah posisi terbaik dari atribute
jangka pinjam , serta perhitungan entropy mencari node akar dengan gain tertinggi diambil
dari attribute jangka pinjam, jenis kelamin, kelas, jenis buku. Sehingga proses tersebut diulang
ulang sampai pada posisi terbaik jangka waktu dan node untuk mendapatkan hasil akhir minat
atau tidak minat sebagai pembentuk pohon keputusan. Dengan diketahuinya siswa yang paling
banyak meminjam buku di perpustakaan akan dapat memprediksikan minat baca siswa baru.

Kata Kunci: Data Mining, Teknik Klasifikasi, Algoritma C4.5, Peminjaman buku,
Perpustakaan, pohon keputusan

Abstract
In the modern era is a lot of use of internet media which affects fewer person's interest in
reading books. At SMPN 1 Lasem specialization students have problems in reading the book is
not yet known how many students interest to borrow books at the library of SMP Negeri 1
Lasem. Therefore, to find out how much interest students in the library to borrow books SMPN
1 Lasem need to search information from the data library book lending by using techniques
classification of data mining to improve the national test scores and better school exam. With
the technique classification of data mining algorithms C4.5 to the data disk set is a book lending
library. The results obtained are the nodes and the best position, the best position is determined
on the attributes and loan term due to be continuous which has the highest gain. The resulting
information is the best position of attribute-term loans, as well as the calculation of entropy
looking for the root node with the highest gain is taken of attribute-term loans, gender, class,
type of book. So the process is repeated again until the best position and node time period to get
the final result as interest or no interest in forming a decision tree. By knowing the students
most borrowed books in the library will be able to predict the new students' interest in reading.

Keywords: Data Mining, Techniques Classification, Algorithm C4.5, book lending, library,
decision trees

1
1. PENDAHULUAN sedikit karena menghadapi ujian
nasional. Akan tetapi banyak sedikitnya
Di era modern ini banyak sekali jumlah kunjungan masih belum dapat
penggunaan media internet yang menentukan banyaknya buku yang
berdampak semakin sedikitnya dipinjam karena mungkin penyebab
seseorang dalam membaca buku. utamanya malas mencari buku yang
Padahal buku adalah ilmu pengetahuan jumlahnya banyak dan akhirnya hanya
yang sangat banyak dan eksklusif untuk sekedar berkunjung. Padahal membaca
ditelusuri daripada media internet hanya buku dengan cara meminjam buku
menyediakan sedikit referensi. Banyak berpengaruh pada nilai ujian sekolah
perpustakaan-perpustakaan di Indonesia maupun ujian nasional dan berdampak
termasuk di dalam sekolah maupun pada sekolah SMP Negeri 1 Lasem
jenjang yang lebih tinggi seperti sebagai sekolah terbaik sekabupaten
perguruan tinggi. Perpustakaan sekolah Rembang.
didirikan untuk mengajak para siswa
siswi untuk lebih mendalami dari setiap Maka dari itu diperlukannya suatu
pelajaran yang diberikan oleh guru penelitian untuk mengetahui seberapa
dikelas. Selain itu dengan sering besar minat membaca jika dilihat
membaca maupun meminjam buku di berdasarkan seberapa banyak
perpustakaan, kita dapat mengerjakan meminjam buku di perpustakaan bukan
tugas sekolah dengan benar. Pada dari data berkunjung. Dengan data
Perpustakaan SMP NEGERI 1 Lasem, mining algoritma C4.5 dapat
Kabupaten Rembang memiliki tingkat membangun sebuah aplikasi dengan
kunjungan digambarkan dengan grafik perhitungan algoritma C4.5 berbasis
sebagai berikut: web sehingga nantinya jika terdapat
kelas yang memiliki data sedikit dalam
GRAFIK JUMLAH PENGUNJUNG meminjam buku perpustakaan akan
PERPUSTAKAAN SMP NEGERI 1 LASEM BULAN
JULI 2014 S.D JUNI 2015
disosialisasikan betapa pentingnya
500 membaca buku untuk keperluan ujian
sekolah maupun ujian nasional nanti
dimasa mendatang dan juga untuk
0 memprediksi peminatan membaca oleh
Juli-2014

Mei-2015
Okt-14

Des-2014
Nov-14

Jan-15
Feb-15

Apr-15
Agst-2014

Juni-2015
Sep-14

Mrt-2015

siswa baru. Dalam membangun aplikasi


data mining C4.5 tersebut akan berguna
Kls 7 Kls 8 Kls 9 dalam mengelolah data peminjaman
buku dari tahun-tahun selanjutnya
Gambar 1. Grafik Pengunjung Perpustakaan
Data mining sendiri adalah proses
Dari pernyataan pada Gambar 1. pengolahan atau menggali data dari
Grafik Pengunjung Perpustakaan dapat suatu kumpulan database yang sangat
diketahui banyaknya siswa-siswi besar dan masih belum diketahui ilmu
berkunjung ke perpustakaan dari bulan ilmu yang terkandung didalamnya
Juli 2014-Juni 2015 mengalami dengan pola teknik statistic,
penurunan dari kelas 7 maupun kelas 8. matematika, kecerdasan buatan, dan
Dan puncak tertinggi pada kelas 7 machine learning [1]. Data mining
adalah pada bulan April 2015 dan kelas mempunyai banyak metode, Salah
8 adalah bulan Oktober 2014, khusus satunya C4.5. C4.5 merupakan metode
untuk kelas 9 memang jumlahnya yang digunakan pada data mining yang

2
berguna untuk membuat pohon bantuan kompter agar data tersebut
keputusan (Decision Tree), sedangkan dapat terintegrasi dengan aplikasi yang
pohon keputusan adalah dibuat.
pengklasifikasian data yang dibentuk
dengan node [2]. 4. Data Mining
Dengan proses pengekstrakan data
mining ini mendapatkan pola data
2. METODE PENELITIAN peminjaman yang sudah dirubah dengan
Metode yang diusulkan metode C4.5 menerapkan algoritma C4.5.
dalam mencari dan menemukan
frekuensi minat siswa dalam setiap 5. Interpretation (Evaluation)
kelas ke perpustakaan tertinggi pada Pola yang sudah telah diidentifikasi
data peminjaman buku di SMP Negeri 1 nantinya diolah untuk diterjemahkan
Lasem Kabupaten Rembang. kedalam bahasa yang mudah dipahami
agar kelak dapat membantu
memperoleh keputusan strategi bisnis.

3. HASIL DAN PEMBAHASAN

3.1 Data Training yang Digunakan

Data yang digunakan untuk perhitungan


Gambar 2. Process Knowledge Discovery in C4.5 adalah peminjaman buku
Database perpustakaan pada SMP Negeri 1
Lasem. Pada data ini menggunakan data
Langkah analisa yang digunakan untuk sampel berjumlah 50 dari data
mengolah dataset berdasarkan metode keseluruhan yaitu 1500. Berikut ini data
data mining menggunakan proses sampel 50 dari total data yang akan
knowledge discovery in databases dilakukan proses perhitungan c4.5 .
(KDD), yang terdiri dari [3]
: Tabel 1: Data Training
1. Data selection
Kumpulan kumpulan data yang N J.K Kls J.Buku J.Pinja Pemina
diseleksi adalah data peminjaman buku o el m tan
1 P VII T.Map 5 tidak
perpustakaan 2014-2015. IC el minat
2 P VII T.Map 5 tidak
2. Pre-Processing IC el minat
Pada proses ini melakukan pembersihan 3 P VII T.Map 5 tidak
data dari data-data mentah dengan IC el minat
mengambil attribute jenis kelamin, 4 P VII T.Map 10 minat
IC el
kelas, lama meminjam, range kode 5 P VII T.Map 10 minat
buku. IC el
6 P VII T.Map 8 minat
3. Transformation IE el
Dalam tahap transformasi mengubah 7 P IX Mapel 11 tidak
A minat
format data yaitu data peminjaman buku
8 P IX T.Map 11 tidak
yang kedalam mircosoft excel dengan A el minat

3
9 P IX Mapel 11 tidak IE el
A minat 38 L VII T.Map 5 minat
10 VII IF el
P Mapel 9 minat
II 39 L VII T.Map 5 minat
11 VII T.Map IF el
P 9 minat
II el 40 P VII T.Map 5 minat
12 VII T.Map tidak IF el
P 8
IF el minat 41 L IX T.Map 3 minat
13 VII T.Map B el
P 10 minat
IA el 42 L IX Mapel 3 minat
14 VII T.Map B
P 2 minat
IA el 43 P IX Mapel 9 tidak
15 VII T.Map E minat
P 3 minat
IH el 44 P IX Mapel 2 minat
16 VII T.Map B
P 6 minat
IH el 45 P IX Mapel 5 minat
17 VII T.Map H
P 4 minat
H el 46 P VII T.Map 4 tidak
18 VII T.Map IB el minat
P 4 minat
H el 47 L VII T.Map 8 minat
19 VII T.Map IE el
P 4 minat
H el 48 L VII Mapel 6 minat
20 VII T.Map IE
P 4 minat
A el 49 L VII T.Map 11 minat
21 VII T.Map IE el
P 4 minat
A el 50 P VII Mapel 8 minat
22 VII T.Map tidak IH
P 4
A el minat
23 VII T.Map
P 4 minat
A el 3.2 Proses Perhitungan
24 P VII T.Map 3 minat
IH el
25 P VII T.Map 6 tidak Pada proses perhitungan c4.5, pertama
IG el minat kali yang harus dilakukan adalah
26 P VII T.Map 6 tidak menghitung entropy dari semua data.
IG el minat Berikut ini perhitungannya:
27 P VII T.Map 2 tidak
ID el minat
28 P VII T.Map 2 tidak
E(Semua) = - ((p(minat/semua) x log2
ID el minat p(minat/semua)) + (p(tidak
29 P VII T.Map 2 minat minat/semua) x log2 p(tidak
IE el lancar/semua)))
30 L VII T.Map 2 minat = - (((32/50) x log2 (32/50)) + ((18/50)
IE el
x log2 (18/50)))
31 L VII T.Map 6 minat
IE el = 0.9427 (1)
32 P VII T.Map 6 tidak
IE el minat Langkah selanjutnya menentukan posisi
33 P VII T.Map 5 tidak terbaik. Untuk menentukan posisi
G el minat terbaik dibutuhkan data yang bersifat
34 P VII T.Map 5 tidak
kontinu atau data yang tidak ada batas
ID el minat
35 P VII T.Map 5 tidak jumlahnya, dalam data perpustakaan
ID el minat attribute yang bersifat kontinu adalah
36 P VII T.Map 5 minat jangka pinjam, lalu penentuan posisi
IE el terbaik didapatkan dari gain yang paling
37 P VII T.Map 5 minat

4
tinggi sedangkan entropy jangka pinjam Entropy Total
didapatkan dengan menggunakan 50 32 18 0.942
7
rumus:
Jangka Pinjam
E(jangka pinjam) = - ((p(minat/jangka <= 10 46 31 15 0.910 0.03
pinjam) x log2 p(minat/ jangka pinjam)) 9 98
+ (p(tidak minat/) x log2 p(tidak minat/ > 10 4 1 3 0.811
jangka pinjam)) (2) 3
Jenis Kelamin
L 9 9 0 0 0.13
Berikut ini hasil perhitungan entropy
P 41 23 18 0.989 16
dan gain untuk mencari posisi terbaik 2
dari atribut plafond. Kelas
IX A 3 0 3 0 0.62
Tabel 2: Pencarian Posisi Terbaik IX B 3 3 0 0 2
IX E 1 0 1 0
N Jangka Mina Tidak Entrop Gain IX H 1 1 0 0
o Pinjam t Mina y VII A 4 3 1 0.811
t 3
1 <=2 4 2 0.9183 0.00 VII G 1 0 1 0
>2 28 16 0.9457 03 VII H 3 3 0 0
2 <=3 8 2 0.7219 0.02 VIII A 2 2 0 0
>3 24 16 0.971 15 VIII B 1 0 1 0
3 <=4 14 4 0.7642 0.03 VIII C 5 2 3 0.971
>4 18 14 0.9887 48 VIII D 4 0 4 0
4 <=5 20 10 0.9183 0.00 VIIIE 10 9 1 0.469
>5 12 8 0.971 33 VIII F 4 3 1 0.811
5 <=6 23 13 0.9436 0 3
>6 9 5 0.9403 Jenis Buku
6 <=8 26 14 0.9341 0.00 mata 9 6 3 0.918 0.00
12 pelajar 3 05
>8 6 4 0.971 an
7 <=9 28 15 0.933 0.00 tidak 41 26 15 0.947
>9 4 3 0.9852 24 mata 4
8 <=10 31 15 0.9109 0.03 pelajar
>10 1 3 0.8113 98 an
9 <=11 32 18 0.9427 0
>11 0 0 0 Dari Tabel 3: Pencarian Node
didapatkan suatu gain tertinggi yang
Dari Tabel 2: Pencarian Posisi Terbaik terletak pada attribute kelas, Nantinya
sehingga diperoleh posisi terbaik dalam attribute kelas sebesar 0.622 tersebut
menentukan gain terbesar pada attribute akan dijadikan node akar dimana
jangka pinjam yaitu <= 10 dan > 10. attribute kelas tersebut memiliki 3
Selanjutnya melakukan perhitungan cabang antara lain minat, tidak minat,
entropy dan gain yang nantinya untuk dan belum diketahui. Sehingga
memperoleh node akar. Dibawah ini diperlukan melakukan perhitungan
tabel perhitungan entropy dan gain. untuk mendapatkan nilai gain yang
masih belum diketahui hasilnya.
Tabel 3: Pencarian Node
Proses selanjutnya mencari node
Kriteri Juml Min Tida Entro Gain internal, caranya sama seperti tabel 2
a ah at k py
Min Pencarian Posisi Terbaik dan tabel 3
at Pencarian Node. Proses ini dilakukan

5
terus – menerus sampai data
mendapatkan hasil keputusan akhir
berupa pohon keputusan sebagai 3.3.3 Halaman Input Data Training
berikut.

Gambar 6. Input Data Training

Gambar 3. Decision Tree


Pada Gambar 6. Input Data Training
menjelaskan tentang mengupload data
3.3 Antarmuka Sistem training yang sudah siap digunakan
untuk perhitungan data mining dan
menampilkan rules atau pola data. Dan
3.3.1 Halaman Login User pada tulisan merah “ Klik Disini”
berfungsi sebagai data yang yang sudah
terupload dapat dihapus secara
otomatis. Dalam format upload data
training tersebut berbentuk format excel
CSV dan halaman ini digunakan oleh
Gambar 4. Login User karyawan Perpustakaan.

Pada menu login pengguna melakukan


pengisian username dan password untuk 3.3.4 Halaman Lihat Data Training
dapat masuk ke sebuah sistem. Dan
username dan password tersebut
didapatkan dari Admin.

3.3.2 Halaman Beranda atau Utama

Gambar 7. Lihat Data Training

Pada Gambar 7. Lihat Data Training


menjelaskan tentang hasil dari upload
Gambar 5. Halaman Beranda atau Utama
data dari menu input data training untuk
dapat dilihat lebih jelas. Dengan
Pada Gambar 5. Halaman Beranda atau menampilkan attribute jenis kelamin,
Utama menjelaskan setelah pengguna kelas, jenis buku, jangka pinjam, dan
melakukan login maka akan ditampilkan peminatan yang nantinya data tersebut
halaman awal system yaitu berupa diolah untuk menentukan rules, akurasi
penjelasan system tersebut. dan memprediksi siswa baru. Halaman

6
ini digunakan oleh karyawan dengan data actual atau data asli dari
Perpustakaan. data training tersebut.

3.3.7 Halaman Memprediksi Siswa


3.3.5 Halaman Rules Baru

Gambar 8. Rules
Gambar 9. Memprediksi Siswa Baru

Pada Gambar 8. Rules menjelaskan Pada Gambar 9. Memprediksi Siswa


tentang menu berupa hasil data dari data Baru menjelaskan tentang menu yang
yang sudah diolah pada menu input data berguna untuk memprediksi peminatan
training. Hasil dari pengolahan tersebut siswa baru dalam meminjam buku
berbentuk rules. Rules atau pohon perpustakaan dari hasil rules data
keputusan tersebut sangat panjang maka training tadi yang di dalamnya
dari itu dibuat berbentuk kalimat. mengisikan jenis kelamin, kelas, jenis
Halaman ini digunakan oleh karyawan buku, jangka pinjam. Halaman ini
Perpustakaan. digunakan oleh karyawan perpustakaan.

3.3.6 Halaman Akurasi 3.3.8 Halaman Login Admin

Gambar 10. Login Admin

Pada Gambar 10. Login Admin


Gambar 8. Akurasi menjelaskan tentang menu yang
digunakan khusus untuk admin untuk
Pada Gambar 8. Akurasi menjelaskan mengolah system tersebut. Dalam
tentang berupa hasil dari sebuah proses halaman tersebut admin harus
atau pengujian rules tadi. Pengujian mengisikan username dan passwordnya.
tersebut untuk membuat suatu akurasi.
Halaman ini digunakan oleh karyawan
Perpustakaan. Akurasi tersebut dapat 3.3.9 Halaman Utaman Admin
diperoleh dari hasil rules dicocokan

7
Gambar 11. Halaman Utama Admin

Gambar 13. Tambah User Admin


Pada Gambar 11. Halaman Utama
Admin menjelaskan tentang menu yang
Pada Gambar 13. Edit User Admin
menampilkan status dari setiap admin
menjelaskan tentang halaman yang
dan admin yang melakukan login.
digunakan untuk mengedit dengan
Dalam halaman tersebut menampilkan
merubah nama, alamat, nomor telepon,
informasi admin yang terdiri dari nama
username, password dari data diri admin
(nama admin), alamat, nomor telepon,
yang sebelumnya telah dibuat.
username, password, dan opsi hapus
serta edit user admin. Untuk tombol edit
user admin akan dialihkan ke halaman
baru yaitu halaman edit user admin. 4. KESIMPULAN DAN SARAN

3.3.10 Edit User Admin


4.1 Kesimpulan

Dari hasil analisis data dengan memakai


teknik data mining yang diterapkan
pada sistem yang sudah dijelaskan maka
dapat diambil kesimpulan yaitu

1. Dengan menggunakan algoritma C4.5


Gambar 12. Edit User Admin dengan penentuan entropy, gain, node
akar dan internal dapat membentuk
Pada Gambar 12. Edit User Admin suatu pohon keputusan atau decision
menjelaskan tentang halaman yang tree yang hasilnya dapat mengetahui
digunakan untuk mengedit dengan seberapa besar minat siswa dalam
merubah nama, alamat, nomor telepon, membaca buku dilihat dari data
username, password dari data diri admin peminjaman buku dan juga untuk
yang sebelumnya telah dibuat. Dan jika memprediksi siswa baru yang
sudah mengisikan apa saja yang ingin meminjam buku diperpustakaan yang
diedit dari 5 atribute pengisian diatas jika diketahui siswa tidak minat
selanjutnya klik tombol update dan membaca buku akan disosialisasikan
nantinya akan otomatis tergantikan demi meningkatkan nilai ujian nasional
admin lama dengan admin baru yang dan ujian sekolah dan penambahan
sudah diedit. buku-buku baru baik buku
matapelajaran maupun buku tidak
3.3.11 Tambah User Admin matapelajaran bagi siswa yang sudah
tinggi minat membacanya supaya
mereka tidak bosan.

8
2. Dan pada algortima C4.5 telah baru supaya lebih menambah wawasan
dibuktikan tingkat akurasi dari prediksi pengetahuan dan bagi yang belum minat
dengan menggunakan confusion matrik membaca buku memberikan tambahan
sebanyak 71,5% dari semua data jangka pinjam dan buku-buku selain
berjumlah 1520 dengan diambil data matapelajaran seperti komik bergambar
training sebesar 70% dan data testing tentang kepahlawanan Indonesia dan
sebesar 30%. Atribute yang lain-lain.
mempengaruhi peminatan siswa dalam
membaca buku dalam algortima C4.5 DAFTAR PUSTAKA
tersebut adalah Jangka pinjam, Jenis
Kelamin, Kelas, Jenis Buku.. [1] Budanis Dwi Meilani Achmad dan
4.2 Saran Fauzi Slamat, Mei 2012. Klasifikasi
Data Karyawan Untuk Menentukan
1. Dalam peneltian ini memiliki Jadwal Kerja Menggunakan Metode
keterbatasan dalam pengetahuan Decision Tree, vol. 16, No.1.
sehingga perlu dilakukan perbaikan
antara lain: [2] Ferry Kristian Sukendro Wimmie
Handiwidjojo, Agustus 2015. Sistem
a. Sangat diperlukan lagi penelitian Informasi Penjualan Sepeda Motor
lebih lanjut agar penelitian saat ini dapat Bekas Menggunakan Algoritma C4.5,
dibandingkan penelitian-penelitian vol. 01, No. 02.
selanjutnya untuk mendapatkan hasil
yang lebih baik. [3] Dicky Nofriansyah, S.Kom,
M.Kom., 2015. Konsep Data Mining Vs
b. Diperlukan objek yang beda dengan Sistem Pendukung Keputusan.
data sama yaitu data peminjaman buku Yogyakarta: Deepublish.
perpustakaan untuk dijadikan
perbandingan objek lama dengan objek
yang baru.

2. Untuk pihak-pihak yang berhubungan


dengan sekolah dalam meningkatkan
minat siswa membaca buku hendaknya:

a. Bagi pihak guru seharusnya siswa


yang kurang atau tidak minat membaca
buku memberlakukan siswa untuk
diberikan suatu tugas tambahan seperti
pekerjaan rumah atau PR yang nantinya
jawaban tugas tersebut diperoleh dari
buku buku perpustakaan sehingga
secara tidak langsung siswa mau
meminjam dan membaca buku.

b. Bagi pihak Perpustakaan seharusnya


untuk siswa yang sudah minat membaca
buku diberikan tambahan buku buku

Anda mungkin juga menyukai