Tugas 12 (Jawaban)
Tugas 12 (Jawaban)
Tugas
1.Sebutkan dan jelaskan tahapan-tahapan dalam text_preprocessing atau cleaning data pada
analisis sentiment baik data yang di ambil dari twitter ataupun facebook ?
Jawaban :
Text Preprocessing adalah tahapan dimana kita melakukan seleksi data agar data yang akan
kita olah menjadi lebih terstruktur.
A. Case folding adalah proses untuk mengubah huruf dalam teks menjadi huruf standar atau
huruf kecil. Data yang diterima pada case folding hanya huruf 'a' sampai 'z', karakter selain
huruf-huruf tersebut dihilangkan dan hanya dianggap delimiter.
B. Tokenizing adalah tahap pemotongan string input berdasarkan tiap kata yang
menyusunnya.
Solo
spirit
of
Central
Djava
C. Frequency Distribution adalah tahapan untuk mengetahui jumlah suatu kata dalam satu
kalimat.
Sebelum(1),km(1),pergi(2),biarkan(1),dia(1),yg(1)
Sebelum
Km
Pergi
Biarkan
yg
Dia
Pergi
E. Normalization adalah tahap untuk menyeragamkan kata yang memiliki makna yang sama
namun penulisan berbeda.
Sebelum Sebelum
Km kamu
Pergi pergi
Biarkan biarkan
Dia dia
Yg yang
Pergi pergi
Sebelum belum
Kamu kamu
Pergi pergi
Biarkan biar
Dia dia
Yang yang
Pergi pergi