id
SKRIPSI
Diajukan untuk Memenuhi Salah Satu Syarat Mencapai Gelar Strata Satu Program
Studi Informatika
Disusun oleh :
ADE IRAWAN
M0510001
HALAMAN JUDU L
SKRIPSI
Disusun Oleh :
ADE IRAWAN
M0510001
i
library.uns.ac.id digilib.uns.ac.id
HALAMAN P ERSETUJUAN
SKRIPSI
Disusun oleh :
ADE IRAWAN
M0510001
Pembimbing I Pembimbing II
ii
library.uns.ac.id digilib.uns.ac.id
SKRIPSI
IMPLEMENTASI VECTOR SPACE MODEL DENGAN
METODE COSINE SIMILARITY DAN CONDITIONAL
PROBABILITY UNTUK SISTEM DETEKSI PLAGIARISME
DOKUMEN SKRIPSI MAHASISWA
Disusun oleh :
ADE IRAWAN
M0510001
Skripsi ini telah disetujui untuk dipertahankan di hadapan dewan penguji pada
tanggal :
iii
library.uns.ac.id digilib.uns.ac.id
HALAMAN MOTTO
“Life is like riding a bicycle. To keep your balance you must keep moving”
(Albert Einstein)
iv
library.uns.ac.id digilib.uns.ac.id
HALAMAN PERSEMBAHAN
“Skripsi ini saya persembahkan untuk orang tua dan keluarga tercinta,
serta kepada seluruh pembaca karya ini”
v
library.uns.ac.id digilib.uns.ac.id
KATA PENGANTAR
Segala puji penulis panjatkan kehadirat Allah SWT atas limpahan rahmat
dan hidayah-Nya, sehingga penulis dapat menyelesaikan skripsi yang berjudul
“Implementasi Vector Space Model dengan Metode Cosine Similarity dan
Conditional Probability untuk Sistem Deteksi Plagiarisme Dokumen Skripsi
Mahasiswa”.
1. Allah SWT atas segala limpahan rahmat dan karunia-Nya sehingga skripsi
ini dapat diselesaikan.
2. Orang tua dan keluarga Penulis, yang selalu memberikan dukungan dan
doa kepada Penulis.
3. Bapak Drs. Bambang Harjito, M.App.Sc., Ph.D selaku Kepala Program
Studi Informatika, Fakultas MIPA, Universitas Sebelas Maret.
4. Bapak Ristu Saptono, S.Si.,M.T. selaku dosen pembimbing I yang telah
memberikan bimbingan dalam penyusunan skripsi ini.
5. Bapak Heri Prasetyo, S.Kom., M.Sc.Eng., Ph.D. selaku dosen
pembimbing II yang telah memberikan bimbingan dalam penyusunan
skripsi ini.
6. Bapak dan Ibu Dosen Program Studi Informatika FMIPA UNS yang telah
memberikan pengajaran kepada Penulis selama menempuh masa studi.
7. Teman-teman S1 Informatika yang telah memberikan semangat dalam
penyelesaian skripsi ini.
Penulis berharap agar skripsi ini dapat bermanfaat bagi berbagai pihak.
Surakarta,
Penulis
vi
library.uns.ac.id digilib.uns.ac.id
ABSTRACT
vii
library.uns.ac.id digilib.uns.ac.id
ABSTRAK
viii
library.uns.ac.id digilib.uns.ac.id
DAFTAR ISI
Table of Contents
HALAMAN JUDUL................................................................................................ i
ix
library.uns.ac.id digilib.uns.ac.id
LAMPIRAN .......................................................................................................... 57
x
library.uns.ac.id digilib.uns.ac.id
DAFTAR TABEL
Tabel 2.1 Kombinasi Awalan Akhiran yang Tidak Diijinkan (Agusta, 2009) ..... 10
Tabel 2.2 PenelitianTerkait ................................................................................... 20
Tabel 4.1 Detail Jumlah Data ................................................................................ 29
Tabel 4.2 Contoh Hasil Tokenization .................................................................... 31
Tabel 4.3 Index kata dasar hasil stemming ........................................................... 32
Tabel 4.4 Contoh hasil pembobotan TF-IDF ........................................................ 33
Tabel 4.5 Contoh hasil pembobotan TF-IDF pada query ..................................... 38
Tabel 4.6 Contoh hasil perihitungan Cosine dan Conditional .............................. 39
Tabel 4.7 Data paragraf testing ............................................................................. 40
Tabel 4.8 Paragraf terambil Id 1630 ..................................................................... 44
Tabel 4.9 Paragraf terambil Id 2507 ..................................................................... 46
Tabel 4.10 Paragraf terambil Id 3701 ................................................................... 48
Tabel 4.11 Hasil precision, recall, dan F-measure skenario I ............................... 49
Tabel 4.12 Hasil precision, recall, dan F-measure skenario II .............................. 50
Tabel 4.13 Hasil precision, recall, dan F-measure skenario III ............................ 50
Tabel 4.14 Hasil precision, recall, dan F-measure skenario IV ............................ 51
xi
library.uns.ac.id digilib.uns.ac.id
DAFTAR GAMBAR
Gambar 2.1 Representasi Dokumen dan Vektor pada Ruang Vektor (Mandala &
Setiawan, 2002) ..................................................................................................... 12
Gambar 2.2 Matriks Term-Dokumen (Mandala, 2006) ........................................ 13
Gambar 2.3 Ilustrasi Peluang Bersyarat (Sahoo, 2013) ........................................ 16
Gambar 3.1 Diagram Metodologi Penelitian ........................................................ 23
Gambar 3.2 Tahap Preprocessing dan Indexing Library ...................................... 25
Gambar 3.3 Tahap Implementasi Vector Space Model ........................................ 27
Gambar 4.1 Contoh salah satu paragraf hasil parsing .......................................... 30
Gambar 4.2 Contoh hasil Case Folding ................................................................ 30
Gambar 4.3 Contoh 100 kata pada daftar StopWord Tala (Tala, 2003) ............... 32
Gambar 4.4 User Interface halaman testing untuk Id dokumen library 123 ........ 35
Gambar 4.5 Detail paragraf query Id 20 dengan paragraf nomor 1 pada library . 36
Gambar 4.6 User Interface halaman testing untuk Id dokumen library 63 .......... 37
Gambar 4.7 Detail paragraf query Id 10 dengan paragraf nomor 2 pada library . 37
Gambar 4.8 Contoh Parsing Paragraf Query ........................................................ 38
Gambar 4.9 Isi paragraf dengan id :1630 .............................................................. 44
Gambar 4.10 Isi paragraf dengan id :2507 ............................................................ 46
Gambar 4.11 Isi paragraf dengan id :3701 ............................................................ 47
xii
library.uns.ac.id digilib.uns.ac.id
DAFTAR LAMPIRAN
xiii