Anda di halaman 1dari 2

A.

1.

Metode Ruang Vektor


Pengertian Ruang Vektor

Mandala (2002, hal: 3) menyatakan bahwa model sistem temu kembali


informasi menentukan detail sistem temu kembali informasi yaitu meliputi
representasi dokumen maupun query, fungsi pencarian (retrieval function) dan
notasi kesesuaian (relevance notation) dokumen terhadap query. Metode Ruang
Vektor adalah suatu metode untuk merepresentasikan sistem temu kembali
informasi. Suatu sistem temu kembali informasi terdiri atas dua bagian, yaitu
penyimpanan dokumen dan pemrosesan query. Untuk mengimplementasikan
metode ruang vektor, diasumsikan sudah tersedia sekumpulan term yang dapat
mendeskripsikan kumpulan dokumen yang tersimpan dalam suatu sistem temukembali informasi. Baik query maupun dokumen-dokumen yang disimpan,
dinyatakan dalam bentuk vector (Salton, 1989). Misalkan terdapat sejumlah n kata
yang berbeda sebagai kamus kata (vocabulary) atau indeks kata (terms index).
Kata-kata ini akan membentuk ruang vektor yang memiliki dimensi sebesar n.
Setiap kata i dalam dokumen atau query diberikan bobot sebesar w i. Baik
dokumen maupun query direpresentasikan sebagai vektor berdimensi n.
Penginde

a.

Pengindeks- an Dokumen
Pengindeks-an dokumen di bagi menjadi 3 tahapan yaitu.
- Parsing

mengambil term-term dari dokumen dan query dengan cara memotong


string input berdasarkan tiap kata yang menyusunnya (Lusiana et al,
2008). Elemen teks (string input) dipisahkan dengan teknik parsing
menggunakan fungsi split dimana pemisahan string dilakukan
berdasarkan white space (spasi dan tab) untuk kemudian diletakkan
-

pada array
Stopward Removing
menghilangkan stopword pada string input yang menyusun dokumen
dan query, contoh:
User could find relevant information by using search engine.
Dilakukan parsing:

Dalam proses ini digunakan sebuah daftar kata buang


(stoplist)
(dibuang)

yaitu

daftar

karena

kata-kata

tidak

yang

signifikan

tidak

dalam

digunakan

membedakan

dokumen atau query. Stoplist ini terdiri atas 658 kata,


umumnya berupa kata tugas, kata hubung, kata bantu, yang
mempunyai fungsi dalam kalimat penyusun dokumen tetapi
tidak memiliki arti. Daftar stopword terlampir bersama
dengan listing program
Proses yang dilakukan

stopword ini adalah:

b.
c.

Pembobotan
Similarity measure

dalam

tahap

penghilangan

Anda mungkin juga menyukai