Jurn

10
BAB II
LANDASAN TEORI
2.1. Perpustakaan
Perpustakaan berasal dari kata dasar pustaka. Menurut Kamus Besar
Bahasa Indonesia, pustaka artinya kitab, buku (Depdikbud : 1980). Dalam bahasa
Inggris dikenal dengan library. Istilah ini berasal dari kata librer atau libri, yang
artinya buku (Sulitstyo Basuki : 1999). Dari kata latin tersebut terbentuklah
istilah librarius, tentang buku. Dalam bahasa asing lainnya perpustakaan disebut
bibliotheca (Belanda), yang juga berasal dari dari bahasa Yunani biblia yang
artinya tentang buku, kitab (Wiji Suwarno : 2007). Menurut Sutarno (2003 :7),
Perpustakaan adalah suatu ruangan, bagian dari gedung/bangunan, atau gedung itu
sendiri, yang berisi buku-buku koleksi, yang disusun dan diatur sedemekian rupa
sehingga mudah dicari dan dipergunakan apabila sewaktu-waktu diperlukan untuk
pembaca.
Untuk mempermudah pengkasesan kembali informasi buku, maka
dibangunlah sebuah katalog. Katalog memberikan informasi buku kepada para
pencari buku dan mempermudah dalam penjelajahan koleksi buku yang ada dalam
sebuah perpustakaan. Katalogisasi adalah proses pembuatan katalog dimana
dalam katalog dicantumkan data penting yang terkandung dalam bahan pustaka,
baik ciri fisik maupun isi intelektual, seperti nama pengarang, judul buku, penerbit
dan subyek. Jadi katalogisasi adalah proses pengambilan keputusan yang
menuntut kemampuan mengintepretasikan dan menerapkan berbagai standar
10
11

sehingga hal-hal penting dari bahan pustaka terekam menjadi katalog. Tujuan
katalogisasi adalah merupakan sarana yang efisien membantu pengguna
perpustakaan dalam memperoleh dokumen. Menurut Cutter (1876), tujuan
katalog adalah sebagai berikut:
1. memungkin seseorang mememukan sebuah buku yang diketahui berdasarkan
a. pengarang
b. judul atau
c. subyek
2. menunjukan buku yang dimiliki perpustakaan
a. oleh pengarang tertentu
b. berdasarkan subyek tertentu, atau
c. dalam jenis literature tertentu
3. Membantu dalam pemilihan buku
a. berdasarkan edisinya
b. berdasarkan karakternya
2.2. Perpustakaan Digital
Dengan adanya perkembangan teknologi, pelayanan perpustakaan yang
awalnya dilakukan dengan cara face-to-face antara pustakawan dengan pencari
buku, mengalami perubahan paradigma yang berbeda. Terlebih dengan adanya
perkembangan internet yang saat ini menjadi teknologi yang perlu dikembangkan
dalam setiap instansi publik, telah memberikan revolusi dalam perkembangan
perpustakaan. Digital library atau perpustakaan digital atau e-library didefinisikan
sebagai perpustakaan yang mengedepankan adanya teknologi informasi sebagai
12

otomasisasi pelayanan perpustakaan. Pelayananan ini memberikan kemudahan
kepada pencari buku untuk melihat koleksi perpustakaan hanya melalui internet.
Tujuannya tidak lain adalah untuk peningkatan kualitas pelayanan dan efisiensitas
pencari buku untuk mengakses perpustakaan.
Perpustakaan digital dapat didefenisikan sebagai sebuah bentuk teknologi
informasi yang diterapkan pada perpustakaan dalam bentuk online. Definisi
perpustakaan digital sendiri sebenarnya sangatlah luas bahkan sebuah portal yang
menyediakan informasi tentang referensi buku-buku yang dapat tercakup dalam
lingkup perpustakaan digital ini. Namun, istilah perpustakaan digital lebih tepat
ditujukan sebagai usaha untuk membuat sebuah transformasi proses pencarian
buku buku atau referensi buku pada perpustakaan.
2.3. Text mining
Text mining adalah salah satu bidang khusus dari data mining. Sesuai
dengan buku The Text mining Handbook, Text mining dapat didefinisikan sebagai
suatu proses menggali informasi dimana seorang user berinteraksi dengan
sekumpulan dokumen menggunakan tools analisis yang merupakan komponen-
komponen dalam data mining yang salah satunya adalah peringkatan dokumen.
Tujuan dari Text mining adalah untuk mendapatkan informasi yang berguna dari
sekumpulan dokumen. Jadi, sumber data yang digunakan pada Text mining
adalah kumpulan teks yang memiliki format yang tidak terstruktur atau minimal
semi terstruktur. Adapun tugas khusus dari Text mining antara lain yaitu
pengkategorisasian teks (text categorization) dan pengelompokan teks (text
clustering).
13

Text mining bisa dianggap subjek riset yang tergolong baru. Text mining
dapat memberikan solusi dari permasalahan seperti pemrosesan, pengorganisasian
/ pengelompokkan dan menganalisa unstructured text dalam jumlah besar. Dalam
memberikan solusi, text mining mengadopsi dan mengembangkan banyak teknik
dari bidang lain, seperti Data mining, Information Retrieval, Statistik dan
Matematik, Machine Learning, Linguistic, Natural Languange Processing, dan
Visualization. Kegiatan riset untuk text mining antara lain ekstraksi dan
penyimpanan text, preprocessing akan konten text, pengumpulan data statistic dan
indexing dan analisa konten.
2.4. Ekstraksi Dokumen
Teks yang akandilakukan proses Text mining, pada umumnya memiliki
beberapa karakteristik diantaranya adalah memiliki dimensi yang tinggi, terdapat
noise pada data, dan terdapat struktur teks yang tidak baik. Cara yang digunakan
dalam mempelajari suatu data teks, adalah dengan terlebih dahulu menentukan
fitur-fitur yang mewakili setiap kata untuk setiap fitur yang ada pada dokumen.
Sebelum menentukan fitur fitur yang mewakili, diperlukan tahap pre processing
yang dilakukan secara umum dalam text mining pada dokumen, yaitu case folding,
tokenizing, filtering, stemming, analyzing seperti yang ditunjukkan pada Gambar
2.1.
14

a. Case folding dan Tokenizing
Case folding adalah mengubah semua huruf dalam dokumen menjadi huruf
kecil. Hanya huruf a sampai dengan z yang diterima. Karakter selain huruf
dihilangkan dan dianggap delimiter. Tahap tokenizing / parsing adalah tahap
pemotongan string input berdasarkan tiap kata yang menyusunnya. Contoh dari
tahap ini adalah sebagai berikut dapat dilihat pada Gambar 2.2.

Gambar 2.2 Proses Case folding dan tokenizing
Case folding
stemming
filtering
tokenizing
analyzing
Gambar 2.1. Proses Pre-Proccesing Text
mining
15

b. Filtering
Tahap filtering adalah tahap mengambil kata - kata penting dari hasil token.
Bisa menggunakan algoritma stoplist (membuang kata yang kurang penting) atau
wordlist (menyimpan kata penting). Stoplist / stopword adalah katakata yang tidak
deskriptif yang dapat dibuang dalam pendekatan bag-of-words. Contoh stopwords
adalah yang, dan, di, dari dan seterusnya. Contoh dari tahapan ini dapat
dilihat pada Gambar 2.3.

c. Stemming
Tahap stemming adalah tahap mencari root kata dari tiap kata hasil filtering.
Pada tahap ini dilakukan proses pengembalian berbagai bentukan kata ke dalam
suatu representasi yang sama. Tahap ini kebanyakan dipakai untuk teks berbahasa
inggris dan lebih sulit diterapkan pada teks berbahasa Indonesia. Hal ini
dikarenakan bahasa Indonesia tidak memiliki rumus bentuk baku yang permanen.
Contoh dari tahapan ini dapat dilihat pada Gambar 2.4.
dalam
manajemen
pengetahuan
terdapat
transfer
pengetahuan
logistic
yang
dikatakan
sutarno

manajemen
pengetahuan
transfer
pengetahuan
logistic
dikatakan
sutarno

Hasil Token
Hasil Filter
Gambar 2.3. Proses Filtering
16

Dalam bahasa Indonesia, afiks/imbuhan terdiri dari sufiks (akhiran), infiks
(sisipan), dan prefix (awalan). Karena proses penambahan infiks dalam bahasa
Indonesia jarang terjadi maka proses stemming yang dibangun hanya menangani
kata yang mengalami penambahan prefiks dan sufiks.
Dalam penelitian ini algoritma yang dipakai untuk melakukan stemming
adalah Porter untuk Kata Bahasa Indonesia. Algoritma Porter adalah cara
pencarian root word (kata dasar) yang dilakukan secara stripping imbuhan dan
akhiran tanpa memperhatikan sisipan dan tanpa pengecekan kamus kata dasar.
Porter Stemmer for Bahasa Indonesia dikembangkan oleh Fadillah Z. Tala pada
tahun 2003. Implementasi Porter Stemmer for Bahasa Indonesia berdasarkan
English PorterStemmer yang dikembangkan oleh W.B. Frakes pada tahun 1992.
Karena bahasa Inggris datang dari kelas yang berbeda, beberapa modifikasi telah
dilakukan untuk membuat Algoritma Porter dapat digunakan sesuai dengan
bahasa Indonesia.Adapun tahap-tahap algoritma ini adalah :
1. hapus partikel
dikatakan
contoh lain
membela
menguatnya
dibandingkan
kata
contoh lain
bela
menguat
dibanding
Hasil filtering
Hasil stemming
Gambar 2.4. Proses Stemming
17

2. hapus possessive pronoun ( pengganti kepunyaan, diantaranya ku, mu, nya)
3. Hapus awalan pertama. Jika tidak ada lanjutkan ke langkah 4a, jika ada cari
maka lanjutkan ke langkah 4b.
4. a. Hapus awalan kedua, lanjutkan ke langkah 5a.
b. Hapus akhiran, jika tidak ditemukan maka kata tersebut diasumsikan
sebagai root word. Jika ditemukan maka lanjutkan ke langkah 5b.
5. a. Hapus akhiran. Kemudian kata akhir diasumsikan sebagai root word
b. Hapus awalan kedua. Kemudian kata akhir diasumsikan sebagai root
word.
Terdapat 5 kelompok aturan pada Algoritma Porter untuk Bahasa Indonesia
ini. Aturan tersebut dapat dilihat pada Tabel 2.1 sampai Tabel 2.5. Tabel-tabel ini
digunakan untuk acuan pemotongan imbuhan dan akhiran kata-kata bahasa
Indonesia. Tabel 2.1 merupakan partikel yang sering digunakan untuk infleksi
kata bahasa Indonesia. Tabel 2.2 merupakan kata ganti milik orang pertama,
kedua dan ketiga. Tabel 2.3 sampai Tabel 2.4 merupakan kumpulan imbuhan
awalan kata Bahasa Indonesia dan didefiniskan juga peluruhan awalan menjadi
huruf yang membentuk sebuah kata. Sedangkan Tabel 2.5 merupakan akhiran kata
Bahasa Indonesia.
Tabel 2.1 Aturan untuk Inflection Particle
Akhiran Replacement Additional Condition Contoh
-lah null null Pergilah
-kah null null Mejakah
-tah null null mejatah
-pun null null bukupun

18

Tabel 2.2 Aturan untuk Inflection Possesive Pronoun
-ku null null laptopku
-mu null null bukumu
-nya null null miliknya

Tabel 2.3 Aturan untuk First Order Derivational Prefix

Awalan Replacement Additional Condition Contoh
meng- Null Null Mengambil
meny- S V..* menyapu
Men- Null Null menduduki
Mem- P V..* memaksa
Mem- Null Null mempunyai
Me- Null Null Melarang
Peng- Null Null Penggusuran
Peny- S V.. Penyaksian
Pen- Null Null Penjajah
Pem- P V. Pemahat
Pem- Null Null Pembantu
Di- Null Null Ditanya
ter- Null Null Terjadi
ke- Null Null kelakuan

Tabel 2.4 Aturan untuk Second Order Derivational Prefix
Awalan Replacement Additional Condition Contoh
Ber- Null null Bersalah
Bel- Null Ajar Belajar
Be- Null K*er Bekerja
Per- Null Null Perjelas
Pel- Null Ajar Pelajar
Pe- Null Null pekerja

Tabel 2.5 Aturan untuk Derivation Suffix
-kan null Prefix bukan anggota
{ke,peng}
Tarikkan
-an null Prefix bukan anggota {di,
meng, ter}
Makanan
19

-i null Prefix bukan anggota {ber,
ke, peng}
tandai

d. Analisa
Tahap Analisa merupakan tahap penentuan seberapa jauh keterhubungan
antar kata-kata antar dokumen yang ada. Dalam tahap analisa ini adalah proses
pembobotan dokumen terhadap kata kunci yang dimasukkan. Sebelum memasuki
dalam tahap analisa, berikut digambarkan ilustrasi algoritma Text mining pada
Gambar 2.5 (Adrifina,dkk:2008).

Gambar 2.5. Ilustrasi Text mining
Untuk mengalisa keterhubungan antar kata-kata dari document yang ada
maka digunakan algoritma TF/IDF. Algoritma ini memiliki formula yang
digunakan untuk menghitung bobot (w) masing-masing dokumen terhadap kata
kunci yaitu :
W
d,t
= tf
d,t
*IDF
t
.............................................................. (2.1)
IDF= log (D/df) ............................................................... (2.2)
Dimana :
20

d = dokumen ke d
t = kata ke t dari kata kunci
W = bobot dokumen ke d terhadap kata ke t
D = total dokumen
df = banyak dokumen yang mengandung kata yang dicari
tf = banyak kata yang dicari pada sebuah dokumen
Setelah bobot (W) masing-masing dokumen diketahui, maka dilakukan
proses sorting / pengurutan dimana semakin besar nilai W, semakin besar tingkat
similaritas dokumen tersebut terhadap kata yang dicari, demikian sebaliknya.
e. Pembobotan TF/IDF
Apabila diurutkan dalam proses sorting secara descending tidak dapat
mengurutkan secara tepat dikarenakan adanya nilai W yang sama maka untuk
mengatasi ini, digunakan vector-space model.
f. Vector Space Model
Vector space model (Model Ruang Vektor) adalah suatu model yang
digunakan untuk mengukur kemiripan antara suatu dokumen dengan suatu query.
Dalam model ruang vektor, koleksi dokumen direpresentasikan oleh matriks
termdocument (atau matriks term-frequency) (Cios : 2007) sebagaimana
digambarkan pada Gambar 2.6. Setiap sel dalam matriks bersesuaian dengan
bobot yang diberikan dari suatu term dalam dokumen yang ditentukan. Nilai nol
berarti bahwa term tersebut tidak hadir di dalam dokumen. Keberhasilan dari
model VSM ini ditentukan oleh skema pembobotan terhadap suatu term baik
untuk cakupan lokal maupun global, dan faktor normalisasi (Polettini:2004).
21

Pembobotan lokal hanya berpedoman pada frekuensi munculnya term dalam suatu
dokumen dan tidak melihat frekuensi kemunculan term tersebut di dalam
dokumen lainnya.

Gambar 2.6 Gambar matriks term-document untuk database
dengan n dokumen dan t term

Pada algoritma vector space model gunakan rumus untuk mencari nilai
cosinus sudut antara dua vector dari setiap bobot dokumen (WD) dan bobot dari
kata kunci (WK). Rumus yang digunakan digambarkan pada Gambar 2.7.

Gambar 2.7. Gambar Formula VSM
Setelah mendapatkan cosine tiap-tiap dokumen, maka hasil bobot dari
kata kunci diurutkan. Bobot yang besar menjadi prioritas sebagai document yang
memiliki hubungan dengan kata kunci.
22

2.5. WAP (Wireless Application Protocol)
WAP (Wireless Application Protocol) adalah sebuah protocol atau sebuah
teknik messaging service yang memungkinkan sebuah handphone digital atau
terminal mobile yang mempunyai fasilitas WAP, melihat/membaca isi sebuah
situs di internet dalam sebuah format text khusus. Situs internet ini harus
merupakan situs dengan fasilitas WAP. Elemen-elemen penting dari WAP adalah
WAP Client, WAP Gateway danWAP Server (Gregorius:2001) .
WAP Gateway disini dalam dunia GSM, adalahprovider layanan jasa
telekomunikasi seperti Telkomsel, Indosat atau Satelindo. Teknologi yang
digunakan untuk berkomunikasi antara handphone denganWAP Gateway adalah
GPRS (General Packet Radio Service). Sedangkan komponen-komponen pada
WAP Server adalah :
Web Server, dalam hal ini bisa menggunakan Apache
Database, sebagai penyimpan informasi di WEB, bisa menggunakan
MySQL.
PHP, sebagai bahasa script disisi server untuk pengembangan WAP.
WML, sebagai interface ke HandPhone sehingga kode-kode PHP bisa
terbaca di ponsel yang terbatas kemampuannya.
2.6. Pemrograman PHP
PHP merupakan program aplikasi yang bersifat server side, artinya hanya
dapat berjalan pada sisi server saja dan tidak dapat berfungsi tanpa adanya sebuah
23

server di dalamnya. PHP juga bukan sebuah bahasa pemrograman yang lengkap.
Maksudnya program ini tidak menyertakan sebuah compiler tersendiri yang
membuat program hasilnya menjadi program .exe yang dapat dijalankan
tersendiri. Program ini akan selalu membutuhkan sebuah server pendukung yang
disebut web server dan program PHP itu sendiri untuk menjalankan semu script
program.
2.7. MySQL Server
MySQL merupakan software system manajemen database ( Database
Management System DBMS ) yang sangat populer di kalangan pemrograman
web, terutama pada pemrograman menggunakan script PHP dan Perl. Software
database ini kini telah tersedia juga pada platform system operasi Windows
(98/ME atau pun NT/2000/XP).
Mysql merupakan database yang paling popular digunakan untuk
membangun aplikasi web yang menggunakan database sebagai sumber dan
pengelola datanya. Kepopuleran MySQL dimungkinkan karena kemudahannya
untuk digunakan, cepat secara kinerja query, dan mencukupi untuk kebutuhan
database perusahaan perusahaan skala menengah kecil. MySQL merupakan
database yang digunakan oleh situs-situs terkemuka di Internet untuk menyimpan
datanya. Software database MySQL kini dilepas sebagai software manajemen
database yang open source, sebelumnya merupakan software database yang
shareware.
2.8. XHTML-MP
24

Dalam perkembangannya, WAP sudah mengalami beberapa perubahan
mulai dari WAP 1.1,1.2, dan terakhir adalah WAP 2.0 yang didefinisikan oleh
WAP Forum dan di-publish pada tahun 2005. Dalam WAP 2.0 ini telah
mendukung adanya WAP Cascanding Style Sheets (WAP-CSS), yang merupakan
sheets yang mendukung dalam memperindah tampilan web itu sendiri. Sedangkan
yang dulunya sebagai penampil ke dalam browser mobile phone menggunakan
WML, dalam WAP 2.0 telah berubah menggunakan XHTML yang disebut
sebagai XHTML-MP. XHTML-MP atau eXtensible HyperText MarkupLanguage
for Mobile Profile merupakan bahasa markupyang didefinisikan dalam WAP
2.0.Tujuan XHTML MP adalah menggabungkan teknologi untuk mobile Internet
browsing dan WWW.
2.9. Ilmu Pengetahuan dan Penyampaian Kebenaran dalam Kajian Islam
Kualitas kehidupan manusia kian hari selalu berkembang. Hal itu
disebabkan oleh adanya perkembangan ilmu pengetahuan. Karena tanpa ilmu
manusian tidak akan mampu merubah suatu peradaban. Bahkan dirinyapun tidak
bisa menjadi lebih. Ilmu merupakan sesuatu yang sangat penting dan merupakan
kewajiban bagi setiap muslim untuk menuntutnya. (HR. Ahmad dengan sanad
hasan), ada kemungkinan bahwa wahyu pertama turun kepada Nabi SAW
mengisyaratkan tentang perintah membaca (belajar) sebagaimana yang telah
difirmankan Allah kepada Nabi Muhammad SAW di saat beliau berkholwat di
gua Hira.
`.!, ,, _ _l>
25

Artinya : Bacalah dengan (menyebut) nama Tuhanmu yang Menciptakan
(Al-Alaq:1)

Kata Iqra terambil dari kata kerja karaa yang pada mulanya berarti
menghimpun. Apabila kita merangkai huruf kemudian mengucapkan rangkaian
tersebut maka kita sudah menghimpunnya yakni membacanya (Shihab,2002)
Dengan demikian, realisasi perintah tersebut tidak mengharuskan adanya suatu
teks tertulis sebagai objek bacaan, tidak pula harus diucapkan sehingga terdengar
oleh orang lain. Karena dalam kamus-kamus ditemukan aneka ragam arti dari kata
tersebut. Antara lain: menyampaikan, menelaah, membaca, mendalami, meneliti,
mengetahui ciri-ciri sesuatu dan lain sebagainya (Shihab,2002).
Sehubungan dengan ilmu ini Rasulullah SAW telah memerintahkan kepada
umatnya bahwa menuntut ilmu itu wajib dilakukan oleh setiap muslim, bahkan
diperjelas dengan mulai dari lahri sampai liat lahat. Ilmu apapun sepanjang itu
membawa kemashlahatan bagi diri dan umat manusia pada umumnya, Oleh
karena itu dalam hadistnya , Rasulullah pernah bersabda :

Artinya:
Menuntut ilmu wajib bagi setiap muslim. (HR. Ahmad dengan sanad hasan )

Artinya:
Tuntutlah ilmu dari buaian sampai keliang lahat. (HR:Bukhori Muslim)
Yang lebih megesankan lagi bahwa ilmu adalah jalan menuju kebahagian,
kita bisa mencapai apapun dengan ilmu. Barang siapa yang menginginkan dunia
harus dengan ilmu dan barang siapa yang menginginkan akhirat juga harus
dengan ilmu, dan barang siapa yang menginginkan keduanya juga harus dengan
26

ilmu. inilah fungsi utama ilmu bagi manusia yaitu penyerelaras antara
kehidupan akhirat dan dunia. Hadist Rasulullah SAW:

Artinya:
Barang siapa yang menempuh suatu jalan untuk menuntut ilmu, maka
Allah mudah kan jalanya menuju surga. (HR: Tirmidzi).

Allah SWT telah menjanjikan dalam salah satu ayat dalam Al-Quran,
bahwa akan mengangkat derajat orang-orang mu'min yang tunduk kepada
perintah-Nya dan perintah Rasul-Nya. Dan secara khusus Allah menyebut janji
itu untuk orang-orang yang berilmu diantara orang-orang yang beriman itu. Janji
Allah SWT secara nyata menandaskan penghargaan Islam kepada ilmu dan orang-
orang yang berilmu.
!!., _ `.., :| _, >l >.. _l.>.l >.! _., < >l :| _,
': ':! _, < _ `.., >.. _ . l-l .>: < !., l.-.
,,>

Hai orang-orang beriman apabila dikatakan kepadamu: "Berlapang-lapanglah
dalam majlis", maka lapangkanlah niscaya Allah akan memberi kelapangan
untukmu. Dan apabila dikatakan: "Berdirilah kamu", maka berdirilah, niscaya
Allah akan meninggikan orang-orang yang beriman di antaramu dan orang-
orang yang diberi ilmu pengetahuan beberapa derajat. Dan Allah Maha
Mengetahui apa yang kamu kerjakan. (QS:Al-mujadalah :11).

Salah satu pengamalan ilmu adalah kita mengajarkan kepada orang lain.
Dalam hal pengamalan ini tidak haruslah seseorang itu langsung tatap muka, akan
tetapi bisa media lain untuk mengamalkannya. Sebagaimana dijelaskan di atas,
27

bahwa Rasulullah menganjurkan untuk mencari ilmu sehingga perlu ada orang
yang mampu di dalam bidangnya untuk mengajarkannya. Dalam pengajaran,
diharapkan manusia untuk memberikan informasi-informasi yang benar tanpa
menutup-nutupinya, sebagaimana firman Allah SWT berikut:
| _ ..>, !. !.l. _. ..,l _.> _. .-, !. .., _!.ll _ ..>l ,.l`
`.-l, < `.-l, _`.-.ll __
Artinya:
Sesungguhnya orang-orang yang Menyembunyikan apa yang telah Kami
turunkan berupa keterangan-keterangan (yang jelas) dan petunjuk, setelah Kami
menerangkannya kepada manusia dalam Al Kitab, mereka itu dilaknati Allah dan
dilaknati (pula) oleh semua (makhluk) yang dapat melaknati (Q.S. Al-Baqarah :
159)
Dalam ayat ini disebutkan lagi sifat-sifat ahli Kitab tersebut dan bahwa
mereka mendapat laknat dari Allah, malaikat dan manusia seluruhnya. Ayat ini
turun mengenai pendeta-pendeta Yahudi. Mereka menyembunyikan terhadap
kaum mereka sifat-sifat Nabi Muhammad yang tersebut dalam kitab-kitab mereka,
agar orang-orang Yahudi itu jangan masuk Islam. Orang-orang ahli Kitab yang
selalu menyembunyikan kebenaran Islam dan kebenaran Nabi Muhammad SAW.
padahal yang demikian itu telah tertulis dengan nyata dan jelas dalam kitab-kitab
mereka, adalah orang-orang yang telah sewajarnya mendapat laknat dari Allah
dan dijauhkan dari rahmat dan kasih sayang-Nya dan wajar pula bila dimintakan
laknat untuk mereka oleh malaikat dan manusia seluruhnya. Hukum mengenai
kutukan bagi orang yang menyembunyikan ilmu pengetahuan yang sebenarnya
mesti disiarkan dan dikembangkan tidak hanya terbatas pada Ahli Kitab itu,
bahkan mencakup semua orang yang bersifat seperti
28

itu. (http://www.rumahislam.com/tafsir-depag-ri). Hal ini dikuatkan oleh sebuah
hadits Rasulullah SAW yang diriwayatkan oleh Abu Hurairah, beliau bersabda:

Artinya:
Barangsiapa ditanyakan kepadanya tentang sesuatu ilmu yang diketahuinya
tetapi tidak mau menerangkannya kepada penanya itu, maka Allah akan
membelenggunya dengan belenggu api pada hari kiamat. (HR Ibnu Majah dari
Abu Hurairah).(Said Hawa:2000)
Abu Hurairah berkata: "Kalau tidaklah karena takut akan ancaman Allah
dalam ayat ini (ayat 159) tentulah saya tidak akan meriwayatkan suatu hadis pun
dari Rasulullah."( Said Hawa:2000). Karena itu seorang muslim berkewajiban
menyampaikan ilmu yang dimilikinya baik yang berupa pengetahuan agama
maupun berupa pengetahuan umum, yang bermanfaat bagi masyarakat.
Dalam ayat lain, Allah SWT berfirman:
_>!., ..>l l _.,l. _>l _L.,l!, ..>. _>l `.. .l-. _
Artinya:
Hai ahli Kitab, mengapa kamu mencampur adukkan yang haq dengan
yang bathil dan menyembunyikan kebenaran, padahal kamu
mengetahuinya?(QS. Ali Imran: 71)

29

BAB III
DESAIN DAN PERANCANGAN SISTEM
3.1. Analisis Sistem
Analisis sistem bertujuan untuk mengidentifikasi permasalahan-
permasalahan yang ada pada sistem dimana aplikasi dibangun yang meliputi
perangkat lunak (software), pengguna (user) serta hasil analisis terhadap sistem
dan elemen-elemen yang terkait. Analisis ini diperlukan sebagai dasar bagi
tahapan perancangan sistem. Analisis sistem Desain dan implementasi ini
meliputi desain data, deskripsi sistem, desain proses dan implementai desain dan
semua yang diperlukan dalam page rank (peringkatan dokumen).
3.1.1. Analisa Data
Data pengujian yang digunakan dalam penelitian ini adalah abstraksi dari
hasil sekripsi mahasiswa UIN Maliki Malang yang diperoleh dari perpustakaan
pusat UIN Malang. Data ini diambil dari semua jurusan yang ada pada semua
Fakultas di UIN Maliki Malang kecuali Fakultas Humaniora dan Budaya sejumlah
795 buah seperti tertera pada Tabel 3.1. Untuk fakultas Humaniora dan Budaya
tidak diambil sebagai data uji coba karena abstrak yang dibuat menggunkana
bahasa Arab dan Inggris. Karena hal ini berpengaruh pada saat preprocessing
hanya menerima data yang berbahasa Indonesia.

29
30

Tabel 3.1 Tabel data uji
No Fakultas Jurusan Jumlah
1. Sains dan Teknologi Matematika 20 buah
Biologi 20 buah
Kimia 20 buah
Fisika 20 buah
Teknik Informatika 30 buah
Teknik Arsitektur 20 buah
2. Syariah Al-Akhwal Asy-Syahsiyah 20 buah
3. Ekonomi Manajemen 30 buah
4. Tarbiyah PAI 30 buah
Pendidikan IPS 30 buah
PGMI 30 buah
5. Psikologi Psikologi 30 buah
TOTAL 300 buah

3.1.2. Spesifikasi Sistem
Sistem yang dibangun memiliki kemampuan sebagai berikut:
a. melakukan filtering terhadap kata-kata yang tidak penting seperti yang, dan,
yaitu dan lain sebagainya
b. mengembalikan kata dasar dari kata-kata hasil filtering.
c. melakukan pembobotan kata terhadap kata kunci yang dimasukkan
d. memberikan peringkatan sesuai bobot terhadap kata kunci
3.1.3. Spesifikasi Pengguna
Sistem ini ditujukan untuk digunakan oleh semua pihak yang membutuhkan
optimasi pencaran buku pada perpustakaan, khususnya para pencari buku di
perpustakaan dan pustakawan dalam sebuah perpustakaan dalam peningkatan
pelayanan perpustakaan yang lebih baik.

31

3.1.4 Lingkungan Operasi
Perangkat lunak yang dibangun ini membutuhkan perangkat lunak lain
sebagai penunjang agar sistem in berjalan dengan sesuai dengan fungsinya.
Kebutuhan tersebut diantaranya:
a. Antar muka pemakai
Sebagai penunjang antarmuka pemakai dari perangkat lunak, diperlukan web
browser , seperti: Internet Explorer 6, Mozilla Firefox 1.5, atau di atasnya.
b. Antar muka komunikasi
Untuk komunikasi antar server dan client, maka diperlukan jaringan internet
karena sistem yang dibangun berbasi web.
c. Aplikasi server
Dibutuhkan dua jenis server untuk memusatkan proses dari perangkat lunak, yaitu
web server dan database server. Untuk web server-nya dapat menggunakan
aplikasi Apache 2.5.9 dan untuk database server-nya menggunakan MySQL
5.0.8. Aplikasi server ini akan mengatur request ke server dan juga respon
terhadap request dari server ke client.
3.1.5 Deskripsi Sistem
Sistem yang dibangun ini adalah perpustakaan digital yang diakses melalui
piranti bergerak yang didalamnya diimplementasikan metode text mining dalam
katalog buku untuk optimasi pencarian. Tujuannya adalah untuk membuat
peringkatan dokumen terhadap kata kunci yang dimasukkan. Tahapan dalam
pembuatan peringkatan dokumen ini ada 2, yaitu preprocessing dan analisa.
Seperti digambar pada Gambar 3.1, dalam tahap preprocessing, proses
yang dilakukan adalah:
32

- Administrator memasukkan dokumen ke dalam perangkat lunak
- Sistem akan melakukan pemrosesan terhadap dokumen tersebut, yaitu case
folding, tokenizing, filtering, stemming.
- Hasil proses tersebut, kemudian disimpan kedalam database termasuk juga
data aslinya.

Gambar 3.1 Proses Preprocessing
Kemudian dalam tahap analisa, proses yang dilakukan sebagaimana
dijelaskan pada Gambar 3.2 adalah:
- User memasukkan kata kunci
- Kata kunci diproses ke dalam preprocessing
Start
Masukkan
dokumen
Proses pre processing
(case folding, tokenizing, filtering,
stemming)
Menyimpan data asli dan data hasil
pre processing ke dalam database
Stop
33

- Sistem akan mengambil dokumen hasil preprocessing yang mengandung
kata kunci
- Sistem akan menghitung bobot dokumen terhadap kata kunci
- Hasil pembobotan akan dilakukan peringkatan dokumen
- Sistem menampilkan dokumen asli sesuai peringkat dokumen

Gambar 3.2 Diagram alir analisa konten
Start
Masukkan kata
kunci
Kata kunci dimasukkan ke proses
pre processing
Ambil data hasil pre processing
sesuai kata kunci
Hitung pembobotan dokumen
terhadap kata kunci
Ambil dokumen asli dari
database dan diperingkatkan
sesuai bobot
Tampilkan
peringkatan
dokumen
Stop
34

3.2. Perancangan Sistem
Pada perancangan sistem peringkatan hasil pencarian buku ini akan
dijelaskan mengenai rancangan aplikasi yang akan dikerjakan serta fitur-fitur yang
akan dipakai pada aplikasi tersebut. Objek dari penelitian ini yaitu teks abstrak
buku dimana data latih maupun data uji terdiri data abstrak yang ada. Hal ini
digunakan untuk pemberian hasil peringkatan isi buku terhadap kata kunci yang
dimasukkan.
Kegiatan riset untuk text mining antara lain ekstraksi dan penyimpanan text,
preprocessing akan konten teks, pengumpulan data statistik dan analisa konten.
3.2.1. Ekstraksi Dokumen
Teks yang akan dilakukan proses text mining, pada umumnya memiliki
beberapa karakteristik diantaranya adalah memiliki dimensi yang tinggi, terdapat
noise pada data, dan terdapat struktur teks yang tidak baik. Cara yang digunakan
dalam mempelajari suatu data teks, adalah dengan terlebih dahulu menentukan
fitur-fitur yang mewakili setiap kata untuk setiap fitur yang ada pada dokumen.
Sebelum menentukan fitur fitur yang mewakili, diperlukan tahap preprocessing
yang dilakukan secara umum dalam text mining pada dokumen, yaitu case folding,
tokenizing , filtering, stemming.
3.2.1.1 Case folding
Dalam tahap ini dokumen yang masuk akan dirubah menjadi huruf kecil.
Hanya huruf a sampai dengan z yang hanya diterima. Karakter selain huruf
itu, baik angka maupun symbol-simbol lain akan dihilangkan dan dianggap
sebagai delimeter.
35

3.2.1.2 Tokenizing
Tahap tokenizing disebut juga sebagai parsing, yaitu pemotongan tahap
pemotongan string input berdasarkan tiap kata yang menyusunnya. Karena dalam
tahap sebelumnya semua karakter dan symbol telah dihilangkan kecuali huruf a
sampai z maka tahap parsing ini delimiter yang dipakai sebagai pemotongan
adalah spasi. Diagram alir case folding dan tokenizing dapat dilihat pada Gambar
3.3.

Gambar 3.3 Proses Case folding dan Tokenizing
3.2.1.3 Filtering
Tahap filtering adalah tahap mengambil kata - kata penting dari hasil token.
Algoritma yang dipakai adalah stoplist (membuang kata yang kurang penting)
atau wordlist (menyimpan kata penting). Stoplist / stopword adalah katakata yang
Start
Dokumen
Ubah semua karakter dalam
huruf kecil
Hapus karakter dan symbol
selain a-z
Potong dokumen menjadi
kata berdasarkan spasi
Hasil kata
Stop
36

tidak deskriptif yang dapat dibuang dalam pendekatan bag-of-words. Dalam tahap
pembuangan kata-kata yang tidak penting adalah kata hasil parsing dicek dengan
kamus (kumpulan kata) stopword. Jika kata parsing ada yang sama dengan
stopword maka kata akan dibuang/dihapus. Stopword yang digunakan dalam
penelitian ini dapat dilihat dalam lampiran. Diagram alir filtering dapat dilihat
pada Gambar 3.4.

Gambar 3.4 Diagram Alir filtering
3.2.1.4 Stemming
Untuk mendapatkan hasil peringkatan halaman informasi yang relevan, maka
diperlukan sebuah tahap yaitu stemming. Sebagaimana dijelaskan paga Bab
sebelumnya, Stemming adalah pengembalian kata dasar dari kata-kata yang telah
Start
Kata setelah case folding
dan tokenizing
Cek data
stopword
Hapus kata yang masuk
ke dalam stopword
daftar kata>0
Stop
37

mengalami imbuha, sisipan dan awalan. Diagram alir proses stemming dengan
Algoritma Porter dapat dilihat pada Gambar 3.5.

Gambar 3.5 Proses Algoritma Porter
Word
Remove Particle
Remove Possesive Pronoun
Remove 1
st
Order Prefix
Remove Sufix
Cek 1
st
order
prefix
Remove 2
nd
Order Prefix
Remove Sufix
Cek sufix
Remove 2
nd
Order Prefix

Kata dasar
ya
tidak
tidak
Start
Stop
ya
38

3.2.2 Analisa
Tahap Analizyng merupakan tahap penentuan seberapa jauh keterhubungan
antar kata-kata antar dokumen yang ada. Dalam tahap ini, dicari bobot tiap-tiap
dokumen terhadap kata kunci yang dimasukkan. Tahap analisa ini algoritma yang
digunakan adalah Algoritma TF/IDF dan Vector Space Model.
3.2.2.1 Algoritma TF/IDF (Term Frequency I nversed Document Frequency)
Metode TF-IDF ini merupakan metode pembobotan dalam bentuk sebuah
metode yang merupakan integrasi antar term frequency (tf), dan inverse document
frequency (idf). Dari formula yang dijelaskan Bab sebelumnya dapat digambar
dalam diagram alir pada Gambar 3.6 dan Gambar 3.7.

Gambar 3.6 Diagram Alir Pembobotan TF/IDF
A
39

Gambar 3.7 Diagram Alir Pembobotan TF/IDF
Setelah bobot (W) masing-masing dokumen diketahui, maka dilakukan
proses sorting / pengurutan dimana semakin besar nilai W, semakin besar tingkat
similaritas dokumen tersebut terhadap kata yang dicari, demikian sebaliknya. Jika
hasil pembobotan memiliki bobot yang sama, maka algoritma ini dilanjutkan
dengan menggunakan algoritma vector space model. Berikut diagram analisa
algoritma TF/IDF dapat dilihat pada Gambar 3.8.
A
40

Gambar 3.8 Gambar analisa TF/IDF
3.2.2.2 Cosine Similarity
Seperti dijelaskan pada pembahasan sebelumnya bahwa ide dari metode ini
adalah dengan menghitung cosines sudut dari dua vector, yaitu W dari tiap
dokumen dan W dari kata kunci. Dari perhitungan tersebut dapat dibuat diagram
alir sebagaimana Gambar 3.9.
Start
Kata kunci
Analizyng dengan data
dokumen yang sudah
di-stemming
Hasil bobot
Wi= Wn
Sorting
Vector Space Model
Stop
41

Gambar 3.9 Vector Space Model
3.2.3 Contoh Perhitungan Manual Text Mining
Dalam contoh perhitungan ini akan dijabarkan berdasarkan proses-proses dalam
text mining, yaitu preprocessing (case folding, tokenizing, filtering, stemming)
dan analisa (algoritma tf/idf dan algoritma cosine similarity).

Start
input W hasil tf/idf
For i=0;i<jmlh W;i++
Hitung Sqrt kata kunci
Hitung Sqrt Di
Hitung Sum ( kk dot Di)
Hitung Cosine Di
next
Urutkan cosine secara desc
Wcosine dalam urutan desc
Stop
42

a. Prerprocessing
Contoh dokumen berasal dari buku berikut:
Judul : Ajax Membangun Web dengan Teknologi Asynchronuse
JavaScript dan XML
Pengarang : Andi Sunyoto
Penerbit : Andi Offset
Kota : Yogyakarta
Tahun : 2007
Sinopsis : AJAX adalah suatu teknik pemrograman berbasis web
untuk menciptakan aplikasi web lebih interaktif dan
dinamis. Fungsi AJAX adalah memindahkan sebagian
besar interaksi web server, serta melakukan
pertukaran data dengan server dibelakang layar
sehingga halaman web tidak harus dibaca ulang
secara keseluruhan setiap kali seorang pengguna
melakukan perubahan. Selain itu, ada beberapa
keuntungan menggunakan AJAX antara lain lebih
interaktif , merubah data hanya mengambil halaman
yang relevan dan lebih cepat.
a) Case folding
Dalam tahap ini, dilakukan proses penerimaan karakter a-z dan selain
karakter tersebut akan dibuang. Hasil dari proses case folding adalah sebagai
berikut:
ajax adalah suatu teknik pemrograman berbasis web untuk
menciptakan aplikasi web lebih interaktif dan dinamis
fungsi ajax adalah memindahkan sebagian besar interaksi
web server serta melakukan pertukaran data dengan server
dibelakang layar sehingga halaman web tidak harus dibaca
ulang secara keseluruhan setiap kali seorang pengguna
melakukan perubahan selain itu ada beberapa keuntungan
menggunakan ajax antara lain lebih interaktif merubah
data hanya mengambil halaman yang relevan dan lebih cepat

43

b) Tokenizing
Setelah dokumen melewati proses case folding maka dokumen tersebut akan
di-parsing berdasarkan spasi agar terbentuk kumpulan kata seperti Tabel 3.2.
Tabel 3.2 Tabel Tokenizing
NO KATA NO KATA
1. ajax 35. web
2. adalah 36. tidak
3. suatu 37. harus
4. teknik 38. dibaca
5. pemrograman 39. ulang
6. berbasis 40. secara
7. web 41. keseluruhan
8. untuk 42. setiap
9. menciptakan 43. kali
10. aplikasi 44. seorang
11. web 45. pengguna
12. lebih 46. melakukan
13. interaktif 47. perubahan
14. dan 48. selain
15. dinamis 49. itu
16. fungsi 50. ada
17. ajax 51. beberapa
18. adalah 52. keuntungan
19. memindahkan 53. menggunakan
20. sebagian 54. ajax
21. besar 55. antara
22. interaksi 56. lain
23. web 57. lebih
24. server 58. interaktif
25. serta 59. merubah
26. melakukan 60. data
27. pertukaran 61. hanya
28. data 62. mengambil
29. dengan 63. halaman
30. server 64. yang
31. dibelakang 65. relevan
32. layar 66. dan
33. sehingga 67. lebih
34. halaman 68. cepat

44

c) Filtering
Pada proses filtering ini kata-kata yang tidak penting akan dibuang.
Kumpulan kata-kata tidak penting itu disebut sebagai stoplist. Adapun kata-kata
yang termasuk stoplist akan dilampirkan. Setelah penghilangan, maka akan
mendapat hasil seperti Tabel 3.3.
Tabel 3.3. Tabel Hasil Filtering
NO KATA NO KATA
1. ajax 19. server
2. teknik 20. dibelakang
3. pemrograman 21. layar
4. berbasis 22. halaman
5. web 23. web
6. menciptakan 24. dibaca
7. aplikasi 25. ulang
8. web 26. keseluruhan
9. interaktif 27. pengguna
10. dinamis 28. perubahan
11. fungsi 29. keuntungan
12. ajax 30. ajax
13. memindahkan 31. interaktif
14. interaksi 32. merubah
15. web 33. data
16. server 34. halaman
17. pertukaran 35. relevan
18. data 36. cepat

d) Stemming
Pada proses stemming ini tiap kata akan dihilangkan awalan dan akhiran
sehingga membentuk kata dasar. Hasil dari proses stemming ini dapat dilihat pada
Tabel 3.4.

45

Tabel 3.4 Tabel proses stemming
NO KATA KATA DASAR
1. ajax ajax
2. teknik teknik
3. pemrograman program
4. berbasis basis
5. web web
6. menciptakan cipta
7. aplikasi aplikasi
8. web web
9. interaktif interaktif
10. dinamis dinamis
11. fungsi fungsi
12. ajax ajax
13. memindahkan pindah
14. interaksi interaksi
15. web web
16. server server
17. pertukaran tukar
18. data data
19. server server
20. dibelakang belakang
21. layar layar
22. halaman halaman
23. web web
24. dibaca baca
25. ulang ulang
26. keseluruhan seluruh
27. pengguna guna
28. perubahan ubah
29. keuntungan untung
30. ajax ajax
31. interaktif interaktif
32. merubah ubah
33. data data
34. halaman halaman
35. relevan relevan
36. cepat cepat
b. Analisa
Dokumen sebagai contoh berjumlah 3. Dokumen ini telah melewati proses
preprocessing:
46

Kata kunci :
perubahan web
Kata kunci kemudian dimasukkan dalam proses preprocessing, sehingga
menghasilkan kata kunci ubah web.

Dokumen 1:
ajax teknik program basis web cipta aplikasi web
interaktif dinamis
Dokumen 2:
fungsi ajax pindah interaksi web server tukar data
server belakang layar halaman web
Dokumen 3:
baca ulang seluruh guna ubah untung ajax interaktif
ubah data halaman relevan cepat
1. Algoritma TF/IDF
Formula yang digunakan untuk menghitung bobot (w) masing-masing
dokumen terhadap kata kunci adalah:
W
d,t
= tf
d,t
* IDF ................................................................................. (3.1)
IDF= D/df .......................................................................................... (3.2)
Dimana: d = dokumen, t = kata ke-t dari kata kunci, W = bobot dokumen ke- d
terhadap katak ke- t, D= total dokumen, df= jumlah dokumen yang mengandung
kata kunci
Untuk memudahkan perhitungan, maka akan dibuat tabel perhitungan
frekuensi kata seperti tertera pada Tabel 3.5.

47

Tabel 3.5 Tabel Perhitungan TF/IDF
Token
tf
df D/df IDF
W
Kk D1 D2 D3 Kk D1 D2 D3
ajax 0 1 1 1 3 1 0 0 0 0 0
teknik 0 1 0 0 1 3 0,477 0 0,477 0 0
program 0 1 0 0 1 3 0,477 0 0,477 0 0
basis 0 1 0 0 1 3 0,477 0 0,477 0 0
web 1 2 2 0 2 1,5 0,176 0,176 0,352 0,352 0
cipta 0 1 0 0 1 3 0,477 0 0,477 0 0
aplikasi 0 1 0 0 1 3 0,477 0 0,477 0 0
interaktif 0 1 0 1 2 1,5 0,176 0 0,176 0 0,176
dinamis 0 1 0 0 1 3 0,477 0 0,477 0 0
fungsi 0 0 1 0 1 3 0,477 0 0 0,477 0
pindah 0 0 1 0 1 3 0,477 0 0 0,477 0
interaksi 0 0 1 0 1 3 0,477 0 0 0,477 0
server 0 0 2 0 1 3 0,477 0 0 0,954 0
tukar 0 0 1 0 1 3 0,477 0 0 0,477 0
data 0 0 1 1 2 1,5 0,176 0 0 0,176 0,176
belakang 0 0 1 0 1 3 0,477 0 0 0,477 0
layar 0 0 1 0 1 3 0,477 0 0 0,477 0
halaman 0 0 1 1 2 1,5 0,176 0 0 0,176 0,176
baca 0 0 0 1 1 3 0,477 0 0 0 0,477
ulang 0 0 0 1 1 3 0,477 0 0 0 0,477
seluruh 0 0 0 1 1 3 0,477 0 0 0 0,477
guna 0 0 0 1 1 3 0,477 0 0 0 0,477
ubah 1 0 0 2 1 3 0,477 0,477 0 0 0,954
untung 0 0 0 1 1 3 0,477 0 0 0 0,477
relevan 0 0 0 1 1 3 0,477 0 0 0 0,477
cepat 0 0 0 1 1 3 0,477 0 0 0 0,477

48

Bobot (W) untuk Dokumen 1 : 0,176+0,477= 0,352
Bobot (W) untuk Dokumen 2 : 0,352+0 = 0,352
Bobot (W) untuk Dokumen 3 : 0+0,954 = 0,954
Setelah dilakukan perhitungan, dapat diketahui bahwa nilai bobot dari D1
dan D2 adalah sama. Apabila diurutkan maka proses sorting tidak dapat
mengurutkan secara tepat, kara nilai keduanya sama. Maka untuk mengatasinya,
digunakan algoritma dari vector space model.
2. Cosine Similarity
Untuk mempermudah perhitungan, maka akan digambarkan dalam tabel
perhitungan vector space model seperti pada Tabel 3.6. Pada tahap ini akan
dihitung cosines similiraty antar dokumen dimana bobot dokumen-dokumen
digambarkan sebagai matrik. Untuk menghitung kosinus sudu antar dokumen
terhadap kata kunci maka dicari dulu token-token dari dokumen. Token-token
diperoleh dari pencarian kata dalam dokumen setelah proses preprocessing.
Token diambil satu kata jika mempunya dua atau lebih kata yang sama pada
kumpulan dokumen.
Kemudian setiap token-token akan dihitung bobot nya terhadap dokumen-
dokumen yang ada dan terhadap kata kunci yang dimasukkan. Setelah
mendapatkan bobot tiap token, dicari bobot kuadrat dari bobot dokumen dan
perkalian bobot kata kunci terhadap bobot dokumen.
49

Tabel 3.6 Tabel Perhitungan Vector Space Model
Token
W W
2

Kk*D1 Kk*D2 Kk*D3
Kk D1 D2 D3 Kk
2
D1
2
D2
2
D3
2

ajax 0 0 0 0 0 0 0 0 0 0 0
teknik 0 0,477 0 0 0 0,228 0 0 0 0 0
program 0 0,477 0 0 0 0,228 0 0 0 0 0
basis 0 0,477 0 0 0 0,288 0 0 0 0 0
web 0,176 0,352 0,352 0 0,031 0,124 0,124 0 0,062 0,062 0
cipta 0 0,477 0 0 0 0,228 0 0 0 0 0
aplikasi 0 0,477 0 0 0 0,228 0 0 0 0 0
interaktif 0 0,176 0 0,176 0 0,031 0 0,031 0 0 0
dinamis 0 0,477 0 0 0 0,228 0 0 0 0 0
fungsi 0 0 0,477 0 0 0 0,228 0 0 0 0
pindah 0 0 0,477 0 0 0 0,228 0 0 0 0
interaksi 0 0 0,477 0 0 0 0,228 0 0 0 0
server 0 0 0,954 0 0 0 0,910 0 0 0 0
tukar 0 0 0,477 0 0 0 0,228 0 0 0 0
data 0 0 0,176 0,176 0 0 0,031 0,031 0 0 0
belakang 0 0 0,477 0 0 0 0,228 0 0 0 0
layar 0 0 0,477 0 0 0 0,228 0 0 0 0
halaman 0 0 0,176 0,176 0 0 0,031 0,031 0 0 0
baca 0 0 0 0,477 0 0 0 0,228 0 0 0
ulang 0 0 0 0,477 0 0 0 0,228 0 0 0
seluruh 0 0 0 0,477 0 0 0 0,228 0 0 0
guna 0 0 0 0,477 0 0 0 0,228 0 0 0
ubah 0,477 0 0 0,954 0,228 0 0 0,910 0 0 0,455
untung 0 0 0 0,477 0 0 0 0,228 0 0 0
relevan 0 0 0 0,477 0 0 0 0,228 0 0 0
cepat 0 0 0 0,477 0 0 0 0,228 0 0 0
Perhiutngan
Sum (kk
2
) Sum (W
2
Di) Sum (kk dot Di)
0,259 1,523 2,464 2,599
0,062 0,062 0,455
Sqrt
(sum kk
2
)
Sqrt (sum W
2
Di)
0,509 1,234 1,570 1,612
4
9

50

Perhitungan:
Formula :
Cosine (Di) = sum(kk dot Di)/([sqrt(kk
2
)]*[sqrt(Di
2
)])
Perhitungan bobot tiap dokumen.
Cosine (D1) = 0,062/(0,509*1,234)
= 0,062/0,628
= 0.098
Cosine (D2) = 0,062/(0,509*1,570)
= 0,078
Cosine (D3) = 0,455/(0,509*1,612)
= 0,455/0,821
= 0,554
Setelah mendapatkan bobot tiap dokumen, maka dokumen-dokumen akan
diurutkan dari bobot terbesar ke bobot terkecil, sehingga hasil dari perangkingan
dokumen dapat dilihat pada Tabel 3.7.
Tabel 3.7 Tabel Rangking Dokumen
Rangking Dokumen 1 2 3
Dokumen ke 3 1 2
Bobot 0,554 0,098 0,078

3.2.4. Perancangan Aplikasi Web
Dalam perancangan website yang dibangun untuk digital library ini dibagi
menjadi 2 bagian. Bagian pertama adalah untuk pengaksesan lewat komputer
desktop atau portabel PC yaitu menggunakan aplikasi web yang berbasis php dan
html. Bagian kedua yaitu digital library yang diakses lewat telpon gengam yaitu
51

menggunakan apilikasi web yang berbasis php dan XHTML MP. Untuk bagian
pertama yang menggunakan komputer atau portabel PC diperuntukkan untuk
administrator dan user. Sedangkan yang berbasis XHTML MP diperuntukkan
untuk user saja.
3.2.5. Konteks Diagram
Konteks Diagram merupakan pendekatan terstruktur yang mencoba untuk
menggambarkan sistem pertama kali secara garis besar (disebut dengan top level)
dan memecah-mecahnya menjadi bagian yang lebih terinci. Contex diagram ini
menggambarkan hubungan input/output antara sistem dengan kesatuan luar
(Jogiyanto, 1999: 54). Untuk konteks diagram system ini adalah Gambar 3.10.

kel uaran data buku
Kel uaran data sekripsi
Informasi Data Sekri psi
Informasi Buku
Katal og
Input data sekri psi
Input Data Buku
1
perpustakaan digi tal
+
User
Admi n

Gambar 3.10 Konteks Diagram
Konteks diagram pada aplikasi ini ada 2 entitas luar yaitu administrator dan
user. Dari Administrator akan diperoleh data-data buku dan sekripsi sebagai
masukan preprocessing dalam text mining. Sedangkan dari user sebagai pengguna
52

akhir adalah melakukan pencarian informasi buku atau data sekripsi dengan kata
kunci yang dimasukkan terhadap abstrak sekripsi atau synopsis buku.
3.2.6. Data Flow Diagram(DFD)
Pada diagram selanjutnya setelah konteks diagram adalah proses yang ada
dalam aplikasi digital library tersebut. Sebagaimana yang telah dijelaskan dalam
perancangan aplikasi di atas bahwa system ini dibangun menjadi 2 bagian, yaitu
berbasis HTML dan XHTML MP. DFD level 1 dari aplikasi ini sebagaimana
digambarkan pada Gambar 3.11.
select data asl i si mpan data asli
select data preprocessing
si mpan data preprocessi ng
kel uaran data buku
Informasi Buku
Katal og
Input Data Buku
Admi n
User
1
di gital li brary b
asis web
+
2
di gital li brary b
asis wap
+
4 hasi l preprocesi ng2
5 data asl i

Gambar 3.11 DFD Level 1
Dalam level selanjutnya adalah penjelasan dari digital library yang berbasis
web. Adapun DFD level 2 dalam aplikasi tersebut seperti pada Gambar 3.12.
53

si mpan buku
si mpan
kel uaran data buku
Input Data Buku
Admi n
1
text processi ng
4 hasi l preprocesi ng 5 buku

Gambar 3.12 DFD Level 2 Digital Library berbasis web
Bagian yang kedua yaitu aplikasi yang dibangun berbasis XHTML MP.
DFD Level 2 ini setingkat dengan DFD level 2 yang berbasiswa web di atas
seperti Gambar 3.13.
Flow_86
Flow_81
Informasi Buku
Katal og
User
1
anal isa
4 hasi l preprocesi ng 5 buku

Gambar 3.13 DFD Level 2 Digital Library berbasis XHTML MP
3.2.7. Entity Relationship Diagram(ERD)
Entity Relationship Diagram (ERD) adalah sebuah diagram yang
menggambarkan hubungan atau relasi antar Entity, dan setiap Entity terdiri atas
satu atau lebih atribut yang mempresentasikan seluruh kondisi (fakta) dari yang
kita tinjau. Hubungan relasi antar entity tersebut dapat dilihat pada Gambar 3.14.
54

Gambar 3.14 ERD
3.2.8. Desain Database
Berikut tabel-tabel yang digunakan dalam pembangunan aplikasi web:
1. Tabel kata stopword / stoplist
Tabel stoplist adalah tabel untuk penyimpanan kata-kata yang kurang penting,
seperti : yang, di, dan. Tabel ini digunakan untuk penyimpanan data yang
dihilangkan pada proses filtering. Tabel ini mempunyai struktur seperti terlihat
pada Tabel 3.8.
Tabel 3.8 Struktur Tabel Stoplist
Nama Field Tipe Data
kata varchar(50)

relasi
relasi
relasi
relasi
relasi
relasi
relasi
aturan stemmer
imbuhan
statement
additional_condition
tipe
buku
id_buku
judul
pengarang
penerbit
tahun_terbit
kota_terbit
abstrak
preprocessing_buku
id_buku
hasil_filtering
hasil_stemming
stoplist
kata
agenda
id_agenda
tema
isi_agenda
tempat
tgl_mulai
tgl_selesai
tgl_posting
id_user
artikel
id_artikel
id_kategori
id_user
judul
isi_artikel
gambar
hari
tanggal
jam
counter
banner
id_banner
judul
url
gambar
tgl_posting
berita
id_berita
id_kategori
id_user
judul
isi_berita
gambar
hari
tanggal
jam
counter
buku_tamu
id
sekarang
nama
email
homepage
subjek
komentar
jawab
hubungi
id_hubungi
nama
email
subjek
pesan
tanggal
kategori
id_katgori
nama_kategori
keterangan
modul
id_modul
nama_modul
link
static_content
gambar
publish
status
aktif
urutan
pengumuman
id_pengumuman
judul
isi
tanggal
tgl_posting
id_user
user
id_user
password
nama_lengkap
email
kota
level
tugas_akhir
nim
nama
judul
tahun
pembimbing1
pembimbing2
abstrak
f akultas
jurusan
preprocessing_tugasakhir
nim
hasil_filtering
hasil_stemming
55

2. Tabel Buku
Tabel buku adalah tabel penyimpanan data tentang buku. Tabel buku ini
mempunyai desain seperti Tabel 3.9.
Tabel 3.9 Struktur Tabel buku
id_buku varchar(50)
judul varchar (100)
pengarang varchar(100)
penerbit varchar(100)
tahun_terbit varchar(100)
kota_terbit varchar(100)
abstrak text

3. Tabel Preprocessing buku
Tabel preprocessing buku adalah tabel penyimpanan kata dari abstrak buku
yang telah melalui proses preprocessing sebagaimana dapat dilihat pada
Tabel 3.10.
Tabel 3.10 Struktur Tabel Preprocessing_buku
id_buku varchar(50)
hasil_filtering varchar(100)
hasil_stemming varchar(100)

4. Tabel Agenda
Tabel agenda dipergunakan untuk menyimpan agenda-agenda kegiatan. Tabel
tersebut seperti tertera pada Tabel 3.11.
Tabel 3.11 Struktur Tabel agenda
id_agenda int(5)
tema varchar(50)
isi_agenda varchar(200)
tempat varchar(50)
tgl_mulai date
tgl_selesai date
tgl_posting date
id_user varchar(20)
56

5. Tabel Artikel
Tabel Artikel dipergunakan untuk menyimpan tulisan artikel yang terkait
dengan perpustakaan seperti pada Tabel 3.12.
Tabel 3.12 Struktur Tabel artikel
id_artikel int(5)
id_kategori int(5)
id_user varchar(50)
judul varchar(100)
isi_artikel text
gambar varchar(100)
hari varchar(20)
tanggal date
jam time
counter int(5)

6. Tabel banner
Tabel banner digunakan untuk menyimpan data tentang link dari sebuah web
eksternal. Desain tabel banner dapat dilihat pada Tabel 3.13.
Tabel 3.13 Struktur Tabel banner
id_banner int(5)
judul varchar(100)
url varchar(100)
gambar varchar(100)
tgl_posting date

7. Tabel berita
Tabel berita dipergunakan untuk menyimpan tulisan berita. Lihat Tabel 3.14.

57

Tabel 3.14 Struktur Tabel berita
id_berita int(5)
id_kategori int(5)
id_user varchar(50)
judul varchar(100)
isi_berita text
gambar varchar(100)
hari varchar(20)
tanggal date
jam time
counter int(5)

8. Tabel buku tamu
Tabel buku tamu dipergunakan untuk menyimpan kritik dan saran dari
pengguna web. Desain tabel dapat dilihat pada Tabel 3.15.
Tabel 3.15 Struktur Tabel buku_tamu
id int(10)
sekarang varchar(12)
nama varchar(50)
email varchar(60)
homepage varchar(60)
alamat text
komentar text
jawab text

9. Tabel hubungi
Tabel hubungi dipergunakan untuk menyimpan pesan dari user kepada
admin. Desain dapat dilihat pada Tabel 3.16.
Tabel 3.16 Struktur Tabel hubungi
id_hubungi int(5)
nama varchar(50)
email varchar(100)
subjek varchar(100)
pesan text
tanggal date
58

10. Tabel kategori
Tabel kategori dipergunakan untuk menyimpan kategori artikel yang ditulis.
Desain tabel tersebut dapat dilihat pada Tabel 3.17.
Tabel 3.17 Struktur Tabel kategori
id_kategori int(5)
nama_kategori varchar(50)
keterangan varchar(100)

11. Tabel modul
Tabel modul digunakan untuk menyimpan nama modul web. Desain tabel
dapat dilihat pada Tabel 3.18.
Tabel 3.18 Struktur Tabel modul
id_modul int(5)
nama_modul varchar(50)
link varchar(100)
static_content text
gambar varchar(100)
publish enum(y,n)
status enum(user,admin)
aktif enum(y,n)
urutan int(5)

12. Tabel pengumuman
Tabel pengumuman untuk menyimpan pengumuman yang dikeluarkan oleh
perpustakaan. Desain tabel dapat dilihat pada Tabel 3.19.
Tabel 3.19 Struktur Tabel pengumuman
id_pengumuman int(5)
judul varchar(100)
isi text
tanggal date
tgl_posting date
id_user varchar(50)
59

13. Tabel user
Tabel user digunakan untuk menyimpan akun pengguna web. Desain tabel
dapat dilihat pada Tabel 3.20.
Tabel 3.20 Struktur Tabel user
id_user varchar(50)
password varchar(50)
nama_lengkap varchar(100)
email varchar(100)
kota varchar(100)
level varchar(50)

14. Tabel tugas akhir
Tabel tugas akhir digunakan untuk menyimpan data tentang tugas akhir.
Desain table dapat dilihat pada Tabel 3.21.
Tabel 3.21 Struktur tugas akhir
Nim varchar(10)
Nama varchar(50)
Judul varchar(200)
Tahun varchar(10)
Pembimbing1 varchar(100)
Pembimbing2 varchar(100)
Abstrak Text
Fakultas varchar(100)
Jurusan varchar(200)
15. Tabel preprocessing_tugasakhir
Tabel ini digunakan untuk menyimpan hasil proses preprocessing data tugas
akhir. Lihat Tabel 3.22.
Tabel 3.22 Struktur Tabel preprocessing_tugasakhir
Nim varchar(50)
Hasil_filtering text
Hasil_stemming text

60

3.2.9. Perancangan Antar Muka
Dalam perancangan antar muka aplikasi web yang dibangun ini dibagi
menjadi 2, yaitu desain interface untuk web yang berbasis HTML dan web yang
berbasis XHTML MP.
3.2.9.1. Website berbasis HTML
a. Perancangan Halaman Utama
Perancangan halaman ini adalah halaman utama dari website. Dalam
halaman in dibagi menjadi beberapa bagian yaitu header, menu, konten dan footer
seperti digambarkan pada Gambar 3.15.

Gambar3.15 Halaman Utama

Konten

header

menu
footer
61

b. Perancangan Modul Pencarian
Modul pencarian ini adalah untuk pencarian data buku dan tugas akhir.
Dalam modul pencarian ini akan dibagi menjadi 2, yaitu pencarian untuk buku
dan pencarian untuk tugas akhir. Dalam form inilah analisa text mining akan
diimplementasikan. Desain modul pencarian dapat dilihat pada Gambar 3.16.

Gambar 3.16 Modul Pencarian
c. Perancangan Modul Admin
Rancangan modul admin ini digunakan untuk mengontrol seluruh website.
Dalam modul admin ini akan diimplementasikan preprocessing text mining yang

logo
Teks pencarian Tombol cari

Hasil pencarian
62

diletakkan pada proses input buku dan input data tugas akhir. Selain itu, seluruh
pengaturan modul dapat dikontrol dari modul ini.
1. Perancangan Halaman Login
Sebelum masuk ke dalam halaman admin, maka pengguna sebagai seorang
admin harus memasukkan akunnya. Akun yang dimiliki terdiri dari nama dan
password yang telah dibuat dalam modul user dalam modul admin. Rancangan
form login sebagaimana dapat dilihat pada Gambar 3.17.

Gambar 3.17 Formulir Login
2. Perancangan Halaman Utama Admin
Rancangan desain halaman ini merupakan tampilan awal dari halaman
control panel administrator. Admin dapat memilih beberapa menu dan melakukan
manajeman data didalam rancangan desain halaman ini seperti digambarkan pada
Gambar 3.18.

header
footer
Nama
Password
Login
63

Gambar 3.18 Halaman utama admin
3. Perancangan Masukan Data Buku
Dalam masukan data buku ini data-data yang dimasukkan meliputi id buku,
judul, penerbit, kota penerbit, tahun penerbitan, edisi cetakan dan abstrak atau
sinopsis buku yang dapat dilihat pada Gambar 3.19. Dalam pemrosesan database
akan diimplementasikan preprocessing text mining.

header
footer

menu

Control panel
64

Gambar 3.19 input data buku
4. Perancangan Masukan Data Tugas Akhir
Dalam masukan tugas akhir ini, data-data yang dimasukkan meliputi: nim,
nama mahasiswa, judul tugas akhir/skripsi, fakultas, jurusan, tahun, pembimbing
1, pembimbing 2 dan abstrak sekripsi. Rancangan tampilannya dapat dilihat pada
Gambar 3.20.

header
footer

menu
ID Buku
Judul Buku
Penerbit
Kota Terbit
Tahun Terbit
Edisi
Abstrak
Simpan Batal
65

Gambar 3.20 input data tugas akhir

3.2.9.2. Website berbasis XHTML MP
Untuk web yang berbasis XHTML MP ini dirancang untuk diakses melalui
perangkat mobile sehingga desain dibuat minimalis fungsionalis agar dapat
diakses secara mudah dan efisien. Lihat Gambar 3.21.

header
footer

menu
NIM
Nama
Judul Sekripsi
Pembimbing 1
Fakultas
Jurusan
Tahun
Pembimbing 2
Abstrak
Simpan Batal
66

Gambar 3.21 halaman utama web mobile
Untuk desain modul pencarian, secara garis besar sama denga website yang
berbasis HTML, dengan diubah sesuai dengan resolusi perangkat mobile. Lihat
Gambar 3.22.

Gambar 3.22 Formulir Pencarian
3.3. Perancangan Uji Coba
Pada subbab ini dilakukan perancangan uji coba pada algoritma text mining
yang telah dibangun. Uji coba dilakukan berdasarkan kata kunci yang dimasukkan
dan dihitung akurasi hasil pencarian yang ada.
header
Top menu
Pencarian buku / sekripsi
Berita terbaru
Bottom menu
footer
logo
Tombol cari
67

3.3.1. Tujuan Uji Coba
Beberapa hal yang menjadi tujuan pengujian sistem ini adalah sebagai
berikut:
a. memeriksa apakah algoritma yang dibangun dapat berjalan dengan baik
b. menghitung precission, yaitu mengevaluasi kemampuan sistem untuk
menemukan kembali dokumen top-ranked yang paling relevan, dan
didefinisikan sebagai persentase dokumen yang diretrieve yang benar-benar
relevan terhadap query pengguna (Cios:2007).
c. menghitung recall mengevaluasi kemampuan sistem untuk menemukan
semua item yang relevan dari dalam koleksi dokumen dan didefinisikan
sebagai persentase dokumen yang relevan terhadap query pengguna dan yang
diterima (Cios:2007).
d. Menghitung waktu proses analisa pembobotan dokumen.
3.3.2. Skenario Uji Coba
Tahap pertama, skenario pengujian Sistem perpustakaan digital yang
dibangun ini adalah difokuskan kepada hasil peringkatan halaman. Objek
pengujian adalah abstrak sekripsi dari seluruh jurusan dari semua fakultas UIN
Maliki Malang sejumlah 120 buah kecuali Fakultas HUMBUD. Dalam pengujian
ini juga akan dihitung presisi dan recall hasil pembobotan dokumen terhadap
query. Pengujian tahap kedua yaitu perhitungan waktu proses terhadap analisa
pembobotan dokumen dengan data yang bervariasi yaitu 100, 200 dan 300.
Pengujian ini tidak mempengaruhi terhadap pengujian pertama karena data yang
digunakan dengan jumlah yang berbeda.

Jurn

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Jurn

Diunggah oleh

Hak Cipta:

Format Tersedia

10

Anda mungkin juga menyukai