Mining
Rumusan Masalah
• Menerapkan text preprocessing dalam proses text mining untuk data yang akan
digunakan dalam proses Analisa sentimen dengan dengan experiment dan
pengujian menggunakan tools rapid miner yang memiliki fitur pemrosesan
diantaranya; transform case, filter stop word (Indonesia), Filter tokenize.
• Mengimplementasikan proses pembentukan vector kalimat dengan menggunakan
TF-IDF (term frequency-inverse document frequency) Matrix.
Signifikasi Penelitian
Pada penelelitian ini penulis mengembangkan informasi atau text mining dengan
menggunakan pengolahan sumber data yang baik dan terstruktur dengan proses awal atau
preprocessing text yang berguna untuk mengolah data awal yang masih bermacam macam
untuk menjadi sebuah data yang teratur dan dapat dikenai atau diterapkan beberapa
metode text mining yang ada. Dengan pengujian menggunakan tools rapidminer yang
memiliki fitur pemprosesan diantaranya:
1. Transform case
2. Filter stop word (Indonesia)
3. Filter tokenize
Untuk dapat diolah atau diproses ke algoritma selanjutnya maka data awal diperlukan
transformasi data dari teks kedalam sebuah matrix yang berisi numerik pada penelitian
ini penulis menggunkan proses pembentukan vector kalimat menggunakan TF-IDF
(Term frequency-inverse document frequency) matrix. Adapun proses text mining dan
alur preprocessing text sebagai berikut:
1. Pada tahap pemrosesan awal data dengan menggunakan transform cases ini
mengubah semua huruf kedalam huruf kecil semua, namun jika teks sudah dalam
huruf kecil maka tidak di ubah. Dari dataset refiew aplikasi android berbahasa
indonesia ini ada beberapa teks atau huruf yang yang dirubah dari huruf besar kedalam
huruf kecil seperti yang ada pada tabel 4.
2. Pada tahapan ini menyeleksi fitur atau kata kata yang bukan merupakan kata, dalam
hal ini peneliti mengambil menghilangkan semua tanda baca dan segala sesuatu yang
bukan huruf jadi teks menjadi bersih dari tanda baca dan angka ataupun apapun yang
bukan huruf.
3. Pada tahapan ini filter stopword berfungsi untuk mengurangi atau menghilangkan
beberapa kata yang tidak memiliki hubungan terhadap sentimen, yaitu kata kata yang
tidak berpengaruh terhadap hasil sentimen pada review tersebut.
Penggunaan Referensi
Pada penulisan jurnal penelitian ini penulis menggunakan 7 sumber lain untuk dijadikan
referensi, dan penulis menggunakan semua sumber yang digunakan sebagai referensi.
Pada penulisan jurnal penelitian ini, penulis tidak melampirkan penelitian terdahulu
terkait dengan penelitian yang penulis lakukan.