Perhatikan Soal Yang Diberikan Dengan Cermat Dan Teliti. Jawablah sesuai dengan instruksi
dalam soal. Perhatikan Bobot Soal Tiap Nomor dalam mengerjakan dan manage waktu
pengerjaan dengan optimal.
1. Tentukan Hasil pengolahan dokumen teks diatas dengan menggunakan metode berikut:
[30 Point]
a. Tokenize
b. Stop Word Removal
c. Stemming
2. Bentuklah matriks term dokumen di atas dengan menggunakan Boolean Model dengan
inverted list kemudian tentukan dokumen yang muncul dari hasil pencarian, jika diberikan
query berikut ini :
[30 Point]
a. Kompetisi AND NOT Piala OR NOT Juara OR Gagal.
b. Presiden OR Indonesia AND NOT Wakil AND NOT Rakyat.
Page 1 of 2
FM-UDINUS-BM-04-15/R0
3. Bentuklah matriks term dokumen dari hasil pengolahan soal no.1 di atas dengan menggunakan
menggunakan Vector Space Model dan pembobotan TF.IDF, kemudian tentukan ranking
dokumen dengan kemiripan paling tinggi menggunakan metode Cosinus Similarity jika
diberikan query “Wakil Rakyat Indonesia”!
[40 Point]
Page 2 of 2