Anda di halaman 1dari 11

DETEKSI HATESPEECH PADA

MEDIA SOSIAL TWITTER


MENGGUNAKAN ALGORITMA
LSTM
Dosen Pengampu : Febby Apri Wenando, S.Pd., M. Eng

Nama Kelompok :
Efri Hidayat Ali170401045
Raynaldo Fajrin 170401005
Ningsih Dwi Putri 170401015
Text Pre Processing
Text Preprocessing adalah tahapan dimana aplikasi melakukan seleksi
data yang akan diproses pada setiap dokumen. Proses preprocessing ini
meliputi
• Case folding
• Tokenizing
• Filtering
• Normalization
• Stemming
Lanj…
• case folding bertujuan untuk mengubah semua huruf dalam dokumen menjadi huruf kecil, menghapus

angka, tanda baca, dan karakter kosong pada awal atau akhiran dokumen.

• Tokenizing proses pemisahan teks menjadi potongan-potongan yang disebut sebagai token untuk kemudian

di analisa.

• Filtering (Stopword Removal) tahap mengambil kata-kata penting dari hasil token dengan menggunakan

algoritma stoplist (membuang kata kurang penting) atau wordlist (menyimpan kata penting).

• Normalization digunakan untuk menyeragamkan term yang memiliki makna sama namun penulisanya

berbeda, bisa diakibatkan kesalahan penulisan, penyingkatan kata, ataupun “bahasa gaul”.

• Stemming proses menghilangkan infleksi kata ke bentuk dasarnya, namun bentuk dasar tersebut tidak

berarti sama dengan akar kata (root word).


LSTM
LSTM merupakan salah satu jenis dari Recurrent Neural Network
(RNN) dimana dilakukan modifikasi pada RNN dengan
menambahkan memory cell yang dapat menyimpan informasi untuk
jangka waktu yang lama (Manaswi, 2018).
Penerapan algoritma LSTM
Lanj…
Lanj…
Lanj…
Lanj…
Lanj…
Lanj…

Anda mungkin juga menyukai