net/publication/336603042
CITATIONS READS
4 627
1 author:
SEE PROFILE
Some of the authors of this publication are also working on these related projects:
All content following this page was uploaded by Favorisen Rosyking Lumbanraja on 17 October 2019.
Hal 217
Favorisen Rosyking Lumbanraja: Sistem Pencarian Data Teks dengan Menggunakan
Metode Klasifikasi Rocchio(Studi Kasus:Dokumen Teks Skripsi)
Oleh karena itu, diperlukan aplikasi bagian dasar dalam parsing dari dokumen
yang dapat membantu pengunjung sebuah teks disebut tokenizer. Proses ini
situs web untuk mencari konten yang memerlukan pengetahuan tentang bahasa
sesuai dengan keinginan pengguna. untukmenangani karakter-karakter khusus
Ruang lingkup penelitian adalah dan menentukan batasan satuan unit
pengembangan sistem rekomendasi dalam dokumen.Proses Parsing akan
pencarian berbasis web pada dokumen menghasilkan daftar isitilah beserta
abstrak skripsi S1 Jurusan Ilmu Komputer informasi tambahan seperti frekuensi dan
yang disimpan dalam database. posisi yang akan digunakan untuk proses
Sedangkan tujuan penelitian ini adalah selanjutnya.
mengembangkan dan Stemming
mengimplementasikan sistem Stemming merupakan proses
rekomendasi pencarian yang dapat penghilangan/ pemotongan prefiks
membantu pengguna mencari isi konten (awalan) dan sufiks (akhiran) dari kata
informasi suatu situs web berberbahasa dan istilah-istilah dokumen [1]. Stemming
Indonesia menggunakan Teknik Rocchio. diakukan atas dasar asusmi bahwa kata-
Text Mining Dan Klasifikasi Teks kata yang memilik stem yang sama
Text Mining merupakan salah satu memiliki makna dasar yang sama.
aplikasi dari bidang data mining, yang Teknik stemming dapat dikategorikan
khusus mengolah data dalam bentuk teks menjadi 3, yaitu:
[6]. Tujuan text mining adalah mencari • berdasarkan aturan dalam bahasa
informasi implisit dari data teks sehingga tertentu
bisa digunakan oleh pengguna untuk • berdasarkan kamus
mengambil keputusan. • berdasarkan kemunculan bersama
Klasifikasi Teks merupakan teknik Salah satu tujuan utama dilakukan
dalam teks mining yang bertujuan proses stemming adalah meningkatkan
mengelompokkan dokumen-dokumen ke efesiensi. Stemming mengurangi jumlah
dalam kelompok kategori tertentu. Setiap kata-kata unik dalam indeks sehingga
dokumen yang ada di dalam korpus diberi menghemat sumber daya komputasi dan
kategori yang spesifik. Kemudian sistem sumber daya penyimpanan.
akan menemu-kembalikan (retrieve) Inverted Index
dokumen yang dianggap sesuai dengan Inverted Index adalah struktur yang
kueri yang diberikan oleh pengguna. dioptimasi untuk proses
Secara umum, teknik ini merupakan penemukembalian (retrieve) dokumen
supervised clustering, karena data sedangkan proses update hanya menjadi
dokumen perlu diklasifikasi oleh pertimbangan sekunder. Struktur tersebut
seseorang yang dianggap pakar terlebih membalik teks sehingga indeks
dahulu. Tujuan utama klasifikasi adalah memetakan kata ke posisi didalam
mengelompokkan dokumen-dokumen dokumen (seperti bagian index dalam
yang memiliki karakteristik yang mirip. buku memetakan kata atau isitilah tertentu
Parsering ke halaman dalam buku) [1].
Parsing merupakan proses memilah isi Interveted Index terdiri dari dua bagian
dokumen menjadi unit-unit kecil yang yaitu sebuah index kata/term yang
akan menjadi penciri misalnya berupa berisikan daftar istilah unik dalam
kata, frase atau kalimat. Unit terkecil ini dokumen, dan untuk setiap kata/term
yang disebut sebagai token. Proses parsing terdapat posting list, yaitu memuat posisi
merujuk pada proses pengidentifikasian kata tersebut adalah dokumen.
token dalam rangkaian teks [1]. Sehingga
Hal 218
Kumpulan Makalah Seminar Semirata 2013 Fakultas MIPA Universitas Lampung
Hal 219
Favorisen Rosyking Lumbanraja: Sistem Pencarian Data Teks dengan Menggunakan
Metode Klasifikasi Rocchio(Studi Kasus:Dokumen Teks Skripsi)
Hal 220
Kumpulan Makalah Seminar Semirata 2013 Fakultas MIPA Universitas Lampung
Hal 221
Favorisen Rosyking Lumbanraja: Sistem Pencarian Data Teks dengan Menggunakan
Metode Klasifikasi Rocchio(Studi Kasus:Dokumen Teks Skripsi)
Tabel 6 Jumlah Dokumen Yang Ada Pada menampilkan hasil kueri pencarian.
Masing-Masing Kategori Keilmuan Implementasi
No Kelaskeilmuan Jumlahdokumen Sistem temu kembali informasi dengan
1 Temu Kembali Informasi 7 menggunakan teknik Rocchio ini
2 DataMining 20
3 RekayasaPerangkatLunak 16 menggunakan:
Hal 222
Kumpulan Makalah Seminar Semirata 2013 Fakultas MIPA Universitas Lampung
KESIMPULAN
Hal 224