Anda di halaman 1dari 6

See discussions, stats, and author profiles for this publication at: https://www.researchgate.

net/publication/346627361

Klasifikasi Emosi Pada Twitter terkait penerapan NEW NORMAL


Menggunakan Algoritma Naive Bayes

Conference Paper · June 2020

CITATIONS READS

0 378

2 authors:

Robi Kurniawan Aulia Apriliani


Universitas Mega Rezky Universitas Mega Rezky
2 PUBLICATIONS   15 CITATIONS    4 PUBLICATIONS   25 CITATIONS   

SEE PROFILE SEE PROFILE

Some of the authors of this publication are also working on these related projects:

Application of the Naïve Bayes Algorithm and Simple Exponential Smoothing for Food Commodity Prices Forecasting View project

Postgraduate Student's Works on Data Mining Application Project View project

All content following this page was uploaded by Robi Kurniawan on 18 March 2023.

The user has requested enhancement of the downloaded file.


Konferensi Nasional Ilmu Komputer (KONIK) 2020 ISSN : 2338-2899

Klasifikasi Emosi pada Twitter terkait Penerapan New Normal


menggunakan Algoritma Naïve Bayes
Robi Kurniawan1, Aulia Apriliani2
1, 2
Teknik Informatika, Universitas Kristen Indonesia (UKI) Paulus Makassar
Email Coprespondent Author : robbykurniawan.rpl@gmail.com

ABSTRACT — Emotions are able to show human melihat beragam respon atau reaksi masyarakat terkait
feelings about something also considered a reaction shown in penerapan new normal, banyaknya tulisan atau teks yang
interacting as in determining choices, actions, opinions and diperoleh dari twitter menjadi bukti emosi masyarakat
perceptions. Emotional classification in this research was done cukup banyak dituangkan melalui media sosial twitter. New
from verbal information in the form of writing obtained from
words, sentences, paragraphs and so on through social media
normal atau era baru setelah adanya covid 19 ini menjadi
twitter. Twitter as one of social media that can provide a forum perbincangan favorit masyarakat dan sering menjadi
which is quite high. With the emotional classification of tweets, trending topic di twitter. Masyarakat Indonesia memang
it can be seen how people’s interactions and reactions related diketahui merupakan pengguna aktiff harian twitter, hal ini
to implementation of new normal. This research classifies basic diketahui melalui laporan finansial twitter kuartal ke-3 tahun
human emotions, namely, fear, anger, disgust, sadness and 2019 yang mengklaim Indonesia menjadi salah satu Negara
happiness related to the implementation of new normal using
yang pertumbuhan pengguna aktif harian twitternya paling
the naïve bayes algorithm. The data used in this research as
many as 5000 records. The results of testing the average besar [2].
accuracy respectively for precision, recall, f1-score are for Klasifikasi emosi merupakan salah satu bentuk dari
macro average= 47%, 38%, 39%, for micro average= 75%, analisis sentiment, analisis dapat menentukan sikap dari
68%, 67%. Accuracy for the calculating f1-score = 68%. it pembicara atau penulis terhadap suatu topik ataupun
shows that the system can perform a pretty good emotional dokumen. [3]. Analisis sentimen menganalisis pendapat,
detection of the basic emotional classification that has been
sentimen, evaluasi, penilaian, sikap, dan emosi sesorang
determined.
terhadap suatu hal, masalah, peristiwa. Ada beberapa
Keyword — Emotions, Naïve Bayes Algorithm, New Normal,
Twitter penamaan terkait penelitian ini, yaitu penambangan opini
ABSTRAK — Emosi mampu menunjukkan perasaan manusia (opinion mining), ekstraksi opini (opinion extraction),
terhadap sesuatu hal juga dianggap sebagai reaksi yang penambangan sentiment (sentiment mining) [4]. Penelitian
ditunjukkan dalam berinteraksi seperti dalam menentukan pilihan, terkait analisis sentiment dan klasifikasi sentiment cukup
tindakan, opini dan persepsi. Klasifikasi emosi pada penelitian ini banyak ditemukan, diantaranya, Klasifikasi emosi pada
dilakukan dari informasi verbal berupa tulisan yang diperoleh dari
twitter menggunakan bayesian network sebagai bahan
kata, kalimat, paragraf dan sebagainya melalui media sosial twitter.
Twitter sebagai salah satu media yang dapat memberikan wadah pertimbangan keputusan politik. Penelitian ini memodelkan
bagi masyarakat untuk menunjukkan emosi terkait suatu isu, ketidakpastian dan relasi antar fitur [3]. Selanjutnya
apalagi melihat pengguna aktif harian twitter di Indonesia yang implementasi algoritma naïve bayes untuk klasifikasi emosi
cukup tinggi. Dengan klasifikasi emosi dari tweet dapat diketahui lirik lagu berbahasa inggris, penelitian ini menggunakan TF-
bagaimana interaksi dan reaksi masyarakat terkait penerapan new IDF dengan bantuan fitur set ISEAR untuk menghasilkan
normal. Penelitian ini mengklasifikasikan emosi dasar manusia klasifikasi yang semakin baik [5].
yaitu, takut, marah, jijik, sedih dan senang terkait pemberlakuan
New Normal menggunakan algoritma naïve bayes. Data yang Berdasarkan dari uraian diatas dan dengan melihat
digunakan dalam penelitian ini sebanyak 5000 record. Hasil beberapa penelitian terkait maka dirancang sebuah
pengujian akurasi rata-rata secara berturut-turut untuk precision penelitian untuk klasifikasi emosi yang mampu
recall, f1-score yaitu untuk rata-rata makro = 47% , 38% , 39%, mengklasifikasikan 5 label emosi yaitu, anger, happy,
rata-rata mikro= 75%, 68%, 67%. Akurasi untuk perhitungan f1- sadnees, lover, fear. Hal ini untuk mengetahui lebih dalam
score = 68%. Hal ini menunjukkan bahwa sistem dapat melakukan lagi bagaimana reaksi masyarakat terhadap penerapan new
deteksi emosi yang cukup baik terhadap klasifikasi emosi dasar
yang telah ditentukan.
normal, apakah masyarakat setuju atau tidak. Dan melihat
bagaimana akurasi naïve bayes dalam pengklasifikasian
Kata kunci — Algoritma Naïve Bayes, Analisis Emosi, New
Normal, Twitter. teks.
Data yang digunakan dalam penelitian ini didapatkan
dengan API twitter menggunakan teknik web scraper yang
I. PENDAHULUAN menghasilkan 5000 record untuk selanjutnya diolah dengan
Emosi manusia adalah suatu keadaan jiwa kompleks yang algoritma naïve bayes. Naïve bayes digunakan sebagai
terdiri dari tiga komponen berbeda yaitu pengalaman mesin untuk pengkategorian 5 label emosi yang telah
subjektif, respon psikologis dan respon ekspresif[1]. ditentukan, algoritma ini dipilih karena merupakan salah
Klasifikasi Emosi menjadi hal menarik untuk dibahas ketika satu metode klasifikasi yang dikenal simple tapi memiliki

1
Nama belakang penulis 1 et al.
IJCCSISSN
akurasi yang cukup tinggi [6]. Naïve bayes memiliki kinerja
yang cukup tinggi untuk klasifikasi dokumen teks[7].

II. METODE PENELITIAN


A. Objek Penelitian
Objek yang diteliti merupakan tweet (mention, reply, like,
reetweet) atau teks berbahasa Indonesia yang dituangkan
masyarakat melalui media sosial twitter dengan kata kunci
new normal yang menghasilkan sebanyak 5000 record sejak
tanggal 20 Mei sampai 12 Juni..
B. Instrumen Pengumpulan Data
Adapun instrumen pengumpulan data yang dilakukan
pada penelitian ini adalah sebagai berikut:
a. Studi Literatur. Mengumpulkan data untuk menjelaskan
teori-teori yang menunjang penelitian
b. Observasi. Melakukan observasi dokumen yaitu melihat
bagaimana keadaan sebenarnya pada sosial media twitter
mengenai penerapan new normal. Hal tersebut dilakukan
Gambar 1. Teknik pengolahan dan Analisis data secara
agar latar belakang masalah menjadi lebih kuat.
sistematis
C. Teknik Pengolahan dan Analisis Data
Teknik Pengolahan dan analisis data mengikuti teknik text
mining. Text mining merupakan suatu proses menggali III. HASIL
sekumpulan informasi melalui sekumpulan dokumen[8].
Mengacu pada tahapan pengolahan dan analisis data,
Secara sistematis teknik pengolahan dan analisis data yang
setelah proses scraping data dan data telah disimpan di
digunakan dalam penelitian ini yaitu sebagai berikut:
database, selanjutnya terbentuklah data set, berikut sample
a. Pengumpulan data, Pencarian data dilakukan dengan data set berdasarkan 5 label emosi.
mencari tweet dengan kata kunci new normal dan diambil
dengan twitter API menggunakan teknik web scraper. Tabel 1. Contoh Data set sebelum preprocessing
Secara keseluruhan diperoleh 5000 total tweet dengan Label Tweet
emosi yang berbeda-beda. anger RT @wiinaaaa jangan kaya psbb yg pengen
b. Preprocessing, Secara umum hal yang termasuk dalam
terlihat demokrasi dan menjunjung ham,
preprocessing adalah cleaning, normalisasi, transformasi,
pemilihan fitur dan ekstraksi fitur [9]. Pada tahap berharap kedisiplinan rakyatnya, padahal
preprocessing dilakukan penghapusan reetweet, tweet umumnya masyarakat kita itu rebel, bar-bar
duplikat, tweet dengan tautan, stopwords atau eliminasi
fear asking kalo new normal beneran di terapin. mall
kata yang dianggap tidak penting, dan melakukan
stemming untuk menghasilkan kata murni (kata dasar) dibuka, sekolah dibuka, kuliah mulai offline.
tanpa imbuhan apapun [10]. Jujur gue takut takut kena covid19. #newnormal
c. Pelabelan otomatis, pemberian label kelas yang bersifat
happy Kami sedang siap-siap untuk membuka masjid
otomatis yang kemudian membentuk suatu dataset, agar
data dapat digunakan dalam membuat klasifikasi. Ada 5 & sarana ibadah mulai dari kajian di masjid &
label emosi yang terbentuk yaitu anger, happy, sadness, shalat jumat dan tempat ibadah dulu. Yang lain
love, fear. belum Zaki Iskandar (28/05) #NewNormal
d. Training, pada proses ini akan dihitung probabilitas setiap
#Covid19 #KeluarPakaiMasker #JagaJarak
kelas dan setiap kata dalam tweet.
e. Evaluasi, proses evaluasi dilakukan dengan melakukan #RajinCuciTangan #BersamaLawanCorona
perhitungan akurasi keseluruhan dan akurasi setiap kelas, #TangerangTanggapBencana
precision, recall dan f1-score.

2
Nama belakang penulis 1 et al.
IJCCSISSN
Love Mencintai tanpa memiliki akan menjadi New Tabel 3. Contoh pelabelan emosi untuk tiap-tiap kelas
Label Tweet
anger Marah, kesal, murka, dengki, benci, curiga,

sadness Akhir2 ini kita sering mendengar "New Normal", kecewa, …

apa sih New Normal itu? Menurut Ketua Tim fear Takut, was-was, ragu, khawatir, ngeri, …

Pakar Gugus Tugas Percepatan Penanganan


happy Senang, girang, bahagia, gembira, riang,…
Covid19, Wiku Adisasmita, New Normal adalah
Love Cinta, gemas, pujaan,saying, …
perubahan perilaku untuk tetap menjalankan
aktivitas normal. Persiapkan diri buat menjalani sadness Sedih, pilu, murung, duka, sesal,…
#NewNormal ya!

Setelah proses pelabelan otomatis selesai, selanjutnya


dilakukan training klasifikasi naïve bayes. Pada proses
Tabel 2. Contoh Data set setelah preprocessing training akan dibangun model klasifikasi, tahap pertama
Label Tweet yang akan dilakukan adalah menghitung kemunculan tweet
berdasarkan kelas atau labelnya. Peluang dihitung dengan
anger Jangan, psbb, terlihat, demokrasi, menjunjung,
membagi jumlah data tiap kelas dengan total data Pr(c).
ham, berharap, kedisiplinan, rakyatnya, Peluang selanjutnya digunakan untuk memberikan lebel
padahal, umumnya, masyarakat, rebel, bar-bar, pada tweet yang belum diketahui kelasnya. Jika dalam
fear new normal, di terrapin, mall, buka, sekolah, proses testing terdapat kata yang sama pada kelas yang
berbeda maka akan ditambahkan jumlah kata untuk
buka, kuliah, Jujur, takut, covid19, menghindari suatu probabilitas kata kosong disuatu kelas.
happy siap-siap, membuka, masjid, sarana, ibadah, Proses training klasifikasi secara sederhana digambarkan
mulai, kajian, shalat jumat, tempat ibadah dulu. pada diagram ini.

Love Mencintai, tanpa, memiliki, New Normal, .

sadness New Normal, perubahan, perilaku, tetap,


menjalankan, aktivitas, normal, Persiapkan, diri,
buat, menjalani,

Preprocessing dilakukan dengan menghapus reetweet,


tweet duplikat, tweet tautan, eliminasi kata yang tidak
penting (stopwords) dan melakukan stemming. Setelah data
set sudah melalui tahap preprocessing, selanjutnya
dilakukan pelabelan otomatis, pelabelan otomatis dilakukan
karena jumlah data yang cukup banyak. Pada proses
pelabelan otomatis akan digunakan kata kunci yang
digunakan sebagai penanda untuk setiap kelas atau label
yang telah ditentukan. Apabila penanda tidak ditemukan
maka dianggap sebagai kelas netral dan apabila terdapat
beberapa penanda dari kelas yang berbeda maka data akan
dilabeli sesuai kelasnya.

Gambar 2. Diagram Alir Proses Training

3
Nama belakang penulis 1 et al.
IJCCSISSN
Tahap terakhir setalah proses training adalah melakukan Tabel 5. Hasil Evaluasi Naïve bayes
evaluasi yaitu menghitung precision, recall dan f1-score Klasifikasi Precision Recall F1-Score
untuk tiap label emosi, yang akan dibahas pada bagian
pembahasan. Anger 59% 94% 72%

Fear 0% 0% 0%
IV. PEMBAHASAN
Happy 92% 44% 60%
Bagian ini membahas lebih detail mengenai hasil evaluasi
yang telah didapatkan dari klasifikasi emosi pada twitter Love 0% 0% 0%
menggunakan algoritma naïve bayes. Penelitian ini berhasil
menarik sebanyak 5000 record data yang telah Sadness 84% 53% 65%
diklasifikasikan sesuai kelas atau label emosinya masing-
masing.
Setelah melihat hasil perhitungan prediksi dengan
Tabel 4. Jumlah Data sesuai klasifikasi algoritma dan melihat perbandingan dengan data
Label Emosi Record sebenarnya, diketahui bahwa anger happy dan sadness
mempunyai jumlah persentase yang tinggi, sementara fear
Anger 2055 dan love untuk tiap pengujian jumlah persentasenya= 0%.
Jika dijabarkan, maka pada perhitungan precision persentase
Fear 5 tertinggi ada pada emosi happy= 92%, sadness=84%,
anger=59%, untuk recall secara berurut ada anger=94%,
Happy 1256
sadness= 53%, happy= 44%, untuk f1-score anger= 72%,
Love 1 sadness=65%, happy= 60%.
Precision mampu menjawab pertanyaan berapa persen
Sadness 1641 anger yang benar dari keseluruhan emosi yang diprediksi,
begitu pula untuk ke-empat emosi lainnya. Recall mampu
menjawab pertanyaan berapa persen emosi yang diprediksi
Dari table diatas maka diperoleh grafik sebagai berikut: anger dibandingkan dengan keseluruhan emosi anger pada
data sebenarnya, begitu pula untuk emosi lainnya. F1-score
merupakan perbandingan rata-rata presisi dan recall yang
dibobotkan.
Selanjutnya kita lakukan perhitungan akurasi dengan
menghitung rata-rata makro dan rata-rata terbobot pada hasil
klasifikasi,

Tabel 6. Hasil Perhitungan Akurasi


Precision Recall F1-Score

Macro avg 47% 38% 39%

Weighted avg 75% 68% 67%


Gambar 3. Grafik Berdasarkan Klasifikasi emosi
Accuracy 68%

Grafik menunjukkan bahwa berdasarkan tweet


masyarakat cenderung anger atau marah terkait penerapan Rata-rata makro menghitung metrik secara independen
isu new normal di Indonesia, selanjutnya disusul dengan untuk setiap kelas atau label emosi dan kemudian
emosi sadness lalu happy. Untuk fear dan love sangat jauh menghitung rata-ratanya (perhitungan ini memperlakukan
menurun dibandingkan dengan 3 emosi sebelumnya. Hal ini semua kelas atau label secara merata). Kecocokan pada rata-
menjadi jawaban salah satu pertanyaan kita sejak awal yaitu rata makro digunakan untuk mengetahui kinerja sistem
apakah masyarakat setuju atau tidak terkait penerapan isu secara keseluruhan pada seluruh set data. Untuk rata-rata
new normal. terbobot memperhitungkan bobot untuk setiap datanya, hasil
Untuk mengetahui akurasi dari klasifikasi emosi dengan perhitungan rata-rata terbobot dipengaruhi oleh banyaknya
algoritma naïve bayes, selanjutnya dilakukan perhitungan jumlah data dan besar kecilnya pembobotan yang dibuat.
akurasi dan evaluasi untuk recall, precision, dan f1-score, Akurasi digunakan sebagai acuan performansi algoritma,
hasilnya sebagai berikut: pada f1-score sendiri menghitung perbandingan rata-rata
presisi dan recall yang dibobotkan.

4
Nama belakang penulis 1 et al.
IJCCSISSN
V. KESIMPULAN DAFTAR ACUAN

Emosi masyarakat terkait isu new normal di twitter [1] H. D and H. S, Discovering Psychology. New York:
menunjjukan emosi anger yang paling dominan, disusul Worth Publisher.
happy, sadness, kemudian fear dan love yang sangat jauh [2] ―Annual Report Twitter,‖ 2019. [Online]. Available:
perbandingannya dari 3 emosi teratas.. Hasil evaluasi https://investor.twitterinc.com/financial-
menunjukkan bahwa sistem dapat melakukan deteksi emosi information/annual-reports/default.aspx. [Accessed:
yang cukup baik terhadap klasifikasi emosi dasar yang telah 10-Jan-2020].
ditentukan dibuktikan dengan pengukuran precision, recall [3] M. S. Mubarok, M. S. Asriadie, and Adiwijaya,
dan f1-score. Hasil pengujian akurasi rata-rata secara ―Klasifikasi Emosi Pada Twitter Menggunakan
berturut-turut untuk precision recall, f1-score yaitu untuk Bayesian Network,‖ vol. 4, no. 1, 2017.
[4] B. Liu, Sentimen Analysis and Opinion Mining.
rata-rata makro = 47% , 38% , 39%, rata-rata
Morgan and Claypoop Publishers, 2012.
terbobot= 75%, 68%, 67%. Akurasi untuk perhitungan f1-
[5] L. W. Astuti, A. R. C, and Y. Lukito,
score = 68%.
―IMPLEMENTASI ALGORITMA NAÏVE BAYES
MENGGUNAKAN ISEAR UNTUK
KLASIFIKASI EMOSI LIRIK LAGU
BERBAHASA INGGRIS,‖ vol. 14, no. 1, pp. 16–
21, 2017.
[6] F. Handayani and S. Pribadi, ―Implementasi
Algoritma Naive Bayes Classifier dalam
Pengklasifikasian Teks Otomatis Pengaduan dan
Pelaporan Masyarakat melalui Layanan Call Center
110,‖ J. Tek. Elektro, vol. 7, no. 1, pp. 19–24, 2015.
[7] A. Hamzah, ―Klasifikasi Teks Dengan Naïve Bayes
Classifier (NBC) Untuk Pengelompokan Teks
Berita Dan Abstract Akademis,‖ Pros. Semin. Nas.
Apl. Sains Teknol. Periode III, no. 2011, pp. 269–
277, 2012.
[8] A. Imam and H. Fajtriab, ―Implementasi Text
Mining pada Mesin Pencarian Twitter untuk
Menganalisis Topik - Topik Terkait ‗KPK dan
Jokowi,‘‖ Pros. Semin. Nas. Mat. dan Pendidik.
Mat. UMS 2015, pp. 570–581, 2015.
[9] K. S, K. D, and P. P, ―Data Preprocessing for
Supervised Learning,‖ J. Comput. saince, vol. 1,
2006.
[10] P. B. S. Wiguna and B. S. Hantono, ―Peningkatan
Algoritma Porter Stemmer Bahasa Indonesia
berdasarkan Metode Morfologi dengan
Mengaplikasikan 2 Tingkat Morfologi dan Aturan
Kombinasi Awalan dan Akhiran,‖ J. Nas. Tek.
Elektro dan Teknol. Inf., vol. 2, no. 2, pp. 1–6, 2013.

View publication stats

Anda mungkin juga menyukai