Deteksi Hatespeech Pada Media Sosial Twitter Menggunakan Algoritma
Deteksi Hatespeech Pada Media Sosial Twitter Menggunakan Algoritma
Nama Kelompok :
Efri Hidayat Ali170401045
Raynaldo Fajrin 170401005
Ningsih Dwi Putri 170401015
Text Pre Processing
Text Preprocessing adalah tahapan dimana aplikasi melakukan seleksi
data yang akan diproses pada setiap dokumen. Proses preprocessing ini
meliputi
• Case folding
• Tokenizing
• Filtering
• Normalization
• Stemming
Lanj…
• case folding bertujuan untuk mengubah semua huruf dalam dokumen menjadi huruf kecil, menghapus
angka, tanda baca, dan karakter kosong pada awal atau akhiran dokumen.
• Tokenizing proses pemisahan teks menjadi potongan-potongan yang disebut sebagai token untuk kemudian
di analisa.
• Filtering (Stopword Removal) tahap mengambil kata-kata penting dari hasil token dengan menggunakan
• Normalization digunakan untuk menyeragamkan term yang memiliki makna sama namun penulisanya
berbeda, bisa diakibatkan kesalahan penulisan, penyingkatan kata, ataupun “bahasa gaul”.
• Stemming proses menghilangkan infleksi kata ke bentuk dasarnya, namun bentuk dasar tersebut tidak