JURNAL
JURNAL
Penulis Koresponden:
Meilany Gresia ,
Fakultas Ilmu Komputer,
Universitas Methodist Indonesia, Medan,
Jl. Hang Tuah No.8, Medan - Sumatera Utara .
Email: corresp-author@gmail.com
1. PENDAHULUAN
Coronavirus atau biasa dikenal dengan Covid-19 merupakan wabah penyakit baru yang ditemukan
pada akhir tahun 2019 Penyebaran virus Covid-19 sangat cepat sehingga pada tanggal 11 Maret 2020
WHO (World Health Organization) mendeklarasikan virus Covid-19 sebagai pandemic global.
Salah satu strategi pemerintah Indonesia dalam menghentikan penyebaran Covid-19 adalah dengan
memanfaatkan teknologi yaitu membuat sebuah aplikasi PeduliLindungi merupakan sebuah aplikasi
untuk menelusuri Contact Tracing & Tracking demi memperkuat upaya penurunan penyebaran Covid-19.
Aplikasi PeduliLindungi dapat diakses melalui Google Play Store.
Review atau ulasan para pengguna terhadap aplikasi PeduliLindungi sangat beragam. Ada yang
menyatakan aplikasi PeduliLindungi bermanfaat dan ada pula yang menyatakan berbagai keluhan terkait
kinerja aplikasi tersebut. Untuk menganalisis ulasan tersebut bukanlah hal yang mudah, karena jumlah
ulasan yang dimuat umumnya berjumlah sangat banyak apabila diproses secara manual. Karena itu
dibutuhkan sebuah metode dalam menganalisis sentiment dimana prosesnya yaitu mengklasifikasikan
ulasan tersebut pada kelas positif dan negative. Metode yang dapat digunakan dalam menganalisis ulasan
tersebut menggunakan metode Naïve Bayes.
Pada penelitian Analisis Sentimen Publik dari Twitter tentang Kebijakan Penanganan Covid-19
Indonesia dengan Naïve Bayes Classification menyimpulkan bahwa Naïve Bayes Classification
Methotika : Jurnal Ilmiah Teknik Inf ormatika Vol.2, No.1 April 2022 : 1-7
2
memperoleh tingkat akurasi sebesar 87,34% sentivitas sebesar 93,43% dan spesifitas 71,76% yang berarti
metode ini sudah cukup baik dalam mengklasifikasikan sentimen negatif maupun positif (Naraswati et al.,
2021)
2. METODE PENELITIAN
Objek penelitian yang digunakan pada penelitian ini adalah ulasan pengguna aplikasi
PeduliLindungi. Penakan dilakukan dengan beberapa tahap yang dimulai dengan pengumpulan data dan
analisis algoritma yang divisualisasikan dengan flowchart pada Gambar 1
Scrappin Pembagian
Mulai Label Data Preprocessing Data Uji
g Data Data Split
Daya
Latih
Pembobotan
dengan Term
Frequency (TF)
Model
Klasifikasi
dengan Naïve
Bayes
Evaluasi
Performance
Selesai
Data uji
Data Stopword
Selesai Stemming
Bersih Removal
1. Cleanning merupakan proses yang akan membantu pembersihan teks dari karakter, symbol
maupun tanda baca yang tidak diperlukan dalam analisis sentiment (Nabila Nasution, 2021)
2. Case Folding mengkonversi keseluruhan teks dalam dokumen menjadi suatu bentuk
standar (biasanya huruf kecil atau lowercase). Karakter yang diterima hanya berupa huruf
‘a’ sampai dengan ‘z’ yang akan diubah menjadi huruf kecil (Balya, 2019).
3. Tokenizing merupakan proses memecah kalimat menjadi pototngan kata atau yang disebut
dengan token
4. Stopword Removal merupakan proses untuk menghapus kata penghubung dan kata yang tidak
memiliki makna dari setiap kalimat sehingga proses training nantinya dapat berjalan lebih efektif
(Nabila Nasution, 2021).
Methotika : Jurnal Ilmiah Teknik Inf ormatika Vol.2, No1. April 2022 : 1-7
3
5. Stemming merupakan proses mengambil kata dasar dari kata yang berimbuhan baik
awalan,akhiran maupun awalan akhiran.
c. Term Frequency (TF)
Term Frequency (TF) merupakan frekuensi kemunculan term pada sebuah dokumen. Jadi
pembobotan TF didasarkan pada jumlah kemunculan term atau kata pada sebuah dokumen yang
bersangkutan. Semakin besar jumlah kemunculan suatu term (TF tinggi) dalam dokumen, semakin
besar pula bobotnya atau akan memberikan nilai kesesuaian yang semakin besar (Herdhianto, 2020).
Dalam penelitian ini, penulis menggunakan Term Frequency murni (raw TF) dimana nilai TF
diberikan berdasarkan jumlah kemunculan suatu term di dokumen.
d. Algoritma Naïve Bayes
Naive Bayes adalah algoritma yang memanfaatkan teori peluang yang dikemukakan oleh
Ilmuwan Inggris, Thomas Bayes. Cara kerja metode ini yaitu dengan memprediksi peluang
terjadinya kejadian di masa depan berdasarkan data yang ada sebelumnya. Tingkat performa dari
sistem klasifikasi yang dibuat menggunakan Naïve Bayes Classifier (NBC), bergantung pada data
yang dimiliki dan data yang dipilih sebagai data latih. Jika data yang dipilih sebagai data latih bisa
mewakili semua atau sebagaian besar data yang dimiliki, maka sistem klasifikasi yang dibuat
mempunyai performa yang bagus.
Algoritma Naïve Bayes Classifier (NBC) memberi nilai target kepada data baru menggunakan
nilai , yaitu nilai kemungkinan tertinggi dari seluruh anggota himpunan setdomain V. Setiap data
dipresentasikan dengan pasangan atribut dimana dan seterusnya merupakan kata
pertama, adalah kata kedua dan seterusnya. Sedangkan V adalah himpunan kategori sentiment.
Persamaannya dapat dilihat pada persamaan berikut:
Dimana:
=Kategori komentar j=1,2 Dimana dalam penulisan ini kategori komentar positif, =
kategori komentar negative
= Probabilitas pada kategori
= Probabilitas dari
Untuk dan dihitung pada saat pelatihan dimana persamaanya dapat diliihat pada
persamaan 2.4 dan persamaan 2.5 sebagai berikut:
Keterangan:
Jumlah dokumen setiap kategori j
= Jumlah dokumen dari semua kategori
= jumlah frekuensi kemunculan setiap kata
= Jumlah frekuensi kemunculan kata dari setiap kategori
jumlah semua kata dari semua kategori
e. Confusion Matrix
Confusion matrix atau biasa juga disebut erro matrix pada dasarnya digunakan untuk memberikan
informasi perbandingan dari hasil klasifikasi yang dilakukan oleh model yang digunakan dengan hasil
klasifikasi sebenarnya. Confusion matrix biasanya digambarkan dalam bentuk tabel matriks
yang menjelaskan kinerja model klasifikasi pada serangkaian data uji yang nilai sebenarnya
telah diketahui. Confusion Matrix juga dapat mengukur kinerja model yang dibuat dengan
Methotika : Jurnal Ilmiah Teknik Inf ormatika Vol.2, No1. April 2022 : 1-7
4
menghitung tingkat akurasi ,precision, recall dan f1-score berdasarkan hasil confusin matrix. Tabel
Confusion Matrix adalah sebagai berikut:
Tabel 1. Confusion Matrix
Actual/ 1(Positive) 0(Negative)
Predicted
1(Positive) TP FP
(True Positive) (False Negative)
Type 1 Error
0(Negative) FN TN
(False Negative) (True Negative)
Type 2 Error
Methotika : Jurnal Ilmiah Teknik Inf ormatika Vol.2, No1. April 2022 : 1-7
5
Methotika : Jurnal Ilmiah Teknik Inf ormatika Vol.2, No1. April 2022 : 1-7
6
3.3. Visualisasi
Visualisasi dari hasil analisis sentiment ditampilkan dengan bentuk word cloud . Word cloud
merupakan tampilan dari kata kata yang sering muncul, dan besar kecilnya menunjukkan frekuensi
frekuensi kemunculannya dalam data.
4. KESIMPULAN
Berdasarkan hasil penelitian, maka dapat diambil kesimpulan bahwa
1. Metode Naïve Bayes dalam menganalisis sentiment berdasarkan ulasan pengguna aplikasi
PeduliLindungi di GooglePlaystore berhasil diterapkan.
2. Hasil analisis sentiment ulasan Aplikasi PeduliLindungi cenderung bersifat sentimen Negatif. Para
pengguna Aplikasi PeduliLindungi lebih banyak menyatakan keluhan terkait kinerja Aplikasi
PeduliLindungi.
3. Proses preprocessing belum mampu membersihkan data dari kata kata yang tidak memiliki makna.
Contohnya, untuk nama orang dan product tidak hilang pada preprocesing. Tentunya hal ini dapat
berpengaruh pada hasil analisis sentiment.
REFERENSI
[1] Naraswati, N. P. G., Nooraeni, R., Rosmilda, D. C., Desinta, D., Khairi, F., & Damaiyanti,
R. (2021). Analisis Sentimen Publik dari Twitter Tentang Kebijakan Penanganan Covid-19
di Indonesia dengan Naive Bayes Classification. Sistemasi, 10(1), 222.
Methotika : Jurnal Ilmiah Teknik Inf ormatika Vol.2, No1. April 2022 : 1-7
7
https://doi.org/10.32520/stmsi.v10i1.1179
[2] Windy, A. (n.d.). Kupas Tuntas Aplikasi PeduliLindungi. Kominfo.Go.Id.
https://aptika.kominfo.go.id/2021/10/kupas-tuntas-aplikasi-pedulilindungi/
[3] Nugraha, F. A., Harani, N. H., & Habibi, R. (2020). Analisis Sentimen Terhadap
Pembatasan Sosial Menggunakan Deep Learning (R. M. Awangga (ed.); 1st ed.).
[4] Nabila Nasution. (2021). UNIVERSITAS SUMATERA UTARA Poliklinik UNIVERSITAS
SUMATERA UTARA. Jurnal Pembangunan Wilayah & Kota, 1(3), 82–91.
[5] Balya. (2019). Analisis Sentimen Pengguna Youtube Di Indonesia Pada Review Smartphone
Menggunakan Naïve Bayes. Skripsi Universitas Sumatera Utara, 4–16.
[6] Herdhianto, A. (2020). Sentiment Analysis Menggunakan Naïve Bayes Classifier (NBC)
Pada Tweet Tentang Zakat. http://repository.uinjkt.ac.id/dspace/handle/123456789/53661
[7] Mustika, Ardilla, Y., Manuhutu, A., Ahmad, N., Hasbi, I., Guntoro, Mnuhutu, M. A.,
Hozairi, M. R., Wardhani, A. K., Alim, S., Romli, I., Religia, Y., Octafian, Dt., Utan, S. U.,
& Iin, E. (2021). Data Mining dan Aplikasinya (N. Rismawati (ed.)). Widina Bhakti
Persada Bandung.
[8] Id, I. D. (2021). MACHINE LEARNING. UR PRESS.
[9] Ying, Y., & Park, D. (2018). IMPLEMENTASI NAIVE BAYES CLASSIFIER DAN ASOSIASI
UNTUK ANALISIS SENTIMEN DATA ULASAN APLIKASI E-COMMERCE SHOPEE
PADA SITUS GOOGLE PLAY. 6–7.
[10] Devid. (2017). ID-OpinionWords.
[11] Harun, A., & Ananda, D. P. (2021). Analysis of Public Opinion Sentiment About Covid-19
Vaccination in Indonesia Using Naïve Bayes and Decission Tree Analisa Sentimen Opini
Publik Tentang Vaksinasi Covid-19 di Indonesia Menggunakan Naïve Bayes dan Decission
Tree. 1(April), 58–63.
[12] Nugroho, D. G., Chrisnanto, Y. H., & Wahana, A. (2015). Analisis Sentimen Pada Jasa
Ojek Online ... (Nugroho dkk.). 156–161.
[13] Rasyadi, M. H. (2017). Analisis Sentimen Pada Twitter Menggunakan Metode Naïve Bayes
(Studi Kasus Pemilihan Gubernur Dki Jakarta 2017). 1–17.
[14] Ratnawati, F. (2018). Implementasi Algoritma Naive Bayes Terhadap Analisis Sentimen
Opini Film Pada Twitter.
[15] Sarosa, M., Muna, N., Kusumawardani, M., Suyono, A., & Mulyani, Y. (2022).
Pemrograman Python Dalam Contoh dan Penerapan . Media Nusa Creative (MNC
Publishing).
[16] Suyanto, Y. (2018). Pemograman Terstruktur Dengan Delphi. Gadjha Mada University
Press.
[18] Widodo, R. B. (2022). MACHINE LEARNING METODE K-NEAREST NEIGHBORS
KLASIFIKASI ANGKA BAHASA ISYARAT. Media Nusa Creative (MNC Publishing).
Methotika : Jurnal Ilmiah Teknik Inf ormatika Vol.2, No1. April 2022 : 1-7