1
c. Hilangkan beberapa symbol dalam kata tersebut dengan menggunakan regular
expression.
2
2. Pada soal nomer satu gunakan NLTK dan Sastrawi dalam melakukan koding :
a. Gunakan NLTK untuk menghasilkan Case Folding dan Tokenize
c. Gunakan Sastrawi untuk melakukan StopWord sehingga kata sambung atau kata
yang diaggap tidak penting dihilangkan supaya tidak masuk dalam proses
pengolahan text lebih lainjut.
3
d. Gunakan Sastrawi untuk melakukan Steaming dokumen text tersebut.
3. Gunakan Vector Space Model(VSM) dalam mencari kata query =”karya inovasi” dalam
beberapa dokumen dengan perhitungan manual atau mengunakan excel,sebagai
berikut:
Dokumen 1=”Apapun kondisinya saat ini kita harus bekerja dan berkarya
inovatif”
Dokumen 2=”Berkarya inovatif menghasilkan produk ungulan yang layak jual
yang selalu membutuhkan karya KARYA INOVASI secara dinamis”
Dokumen 3=”Banyak potensi yang kita miliki, banyak riset hasil penelitian yang
perlu kita hilirisasi sehingga mampu menghasilkan karya produk inovasi yang
hasilnya sesuai kebutuhan pasar”
Dokumen 4=”Inovasi dinamis, layak jual, menghasilkan karya bangsa yang
mandiri dengan harus berkarya yang inovasi sehingga karya inovasi produk local
bangsa kita mampu meningkatkan perekonomian bangsa Indonesia”
4
4. Pada Soal nomer 3 diatas buat koding VSM untuk mencari query diatas.
5
6