Anda di halaman 1dari 7

Methotika : Jurnal Ilmiah Teknik Informatika

ISSN : 2776 – 5792


Vol. 2, No. 1, April 2022, pp. 1-7
http://ojs.fikom-methodist.net/index.php/methotika 1

IMPLEMENTASI METODE NAÏVE BAYES PADA ANALISIS


SENTIMEN APLIKASI PEDULILINDUNGI

Meilany Gresia1 , Imelda Sinaga2 , Yolanda Rumapea3


1,2,3
Fakultas Ilmu Komputer, Universitas Methodist Indonesia
1,2,3
Jurusan Teknik Informatika, Universitas Methodist Indonesia

Info Artikel ABSTRAK


Abstrak yang disiapkan dengan baik memungkinkan pembaca untuk
Histori Artikel: mengidentifikasi konten dasar dokumen dengan cepat dan akurat, untuk
Received, Sep 9, 2019 menentukan relevansinya dengan minat mereka, dan dengan demikian untuk
Revised, May 20, 2020 memutuskan apakah akan membaca dokumen secara keseluruhan. Abstrak harus
informatif dan cukup jelas, memberikan pernyataan yang jelas tentang masalah,
Accepted, Jun 11, 2020 pendekatan atau solusi yang diusulkan, dan menunjukkan temuan dan kesimpulan
utama. Abstrak harus terdiri dari 200 hingga 250 kata. Abstrak harus ditulis dalam
Keywords: (10pt) bentuk lampau. Nomenklatur standar harus digunakan dan singkatan harus
dihindari. Tidak ada literatur yang harus dikutip. Daftar kata ku nci memberikan
Kata kunci pertama , kesempatan untuk menambahkan kata kunci, yang digunakan oleh layanan
Katakunci kedua , pengindeksan dan abstrak, selain yang sudah ada di judul. Penggunaan kata kunci
Kata Kunci Ketiga , yang bijaksana dapat meningkatkan kemudahan bagi pihak yang berkepentingan
Kata Kunci Keempat, untuk menemukan artikel kami (9 poin)
Kata Kunci Kelima . This is an open access article under the CC BY-SA license.

Penulis Koresponden:
Meilany Gresia ,
Fakultas Ilmu Komputer,
Universitas Methodist Indonesia, Medan,
Jl. Hang Tuah No.8, Medan - Sumatera Utara .
Email: corresp-author@gmail.com

1. PENDAHULUAN
Coronavirus atau biasa dikenal dengan Covid-19 merupakan wabah penyakit baru yang ditemukan
pada akhir tahun 2019 Penyebaran virus Covid-19 sangat cepat sehingga pada tanggal 11 Maret 2020
WHO (World Health Organization) mendeklarasikan virus Covid-19 sebagai pandemic global.
Salah satu strategi pemerintah Indonesia dalam menghentikan penyebaran Covid-19 adalah dengan
memanfaatkan teknologi yaitu membuat sebuah aplikasi PeduliLindungi merupakan sebuah aplikasi
untuk menelusuri Contact Tracing & Tracking demi memperkuat upaya penurunan penyebaran Covid-19.
Aplikasi PeduliLindungi dapat diakses melalui Google Play Store.
Review atau ulasan para pengguna terhadap aplikasi PeduliLindungi sangat beragam. Ada yang
menyatakan aplikasi PeduliLindungi bermanfaat dan ada pula yang menyatakan berbagai keluhan terkait
kinerja aplikasi tersebut. Untuk menganalisis ulasan tersebut bukanlah hal yang mudah, karena jumlah
ulasan yang dimuat umumnya berjumlah sangat banyak apabila diproses secara manual. Karena itu
dibutuhkan sebuah metode dalam menganalisis sentiment dimana prosesnya yaitu mengklasifikasikan
ulasan tersebut pada kelas positif dan negative. Metode yang dapat digunakan dalam menganalisis ulasan
tersebut menggunakan metode Naïve Bayes.
Pada penelitian Analisis Sentimen Publik dari Twitter tentang Kebijakan Penanganan Covid-19
Indonesia dengan Naïve Bayes Classification menyimpulkan bahwa Naïve Bayes Classification

Methotika : Jurnal Ilmiah Teknik Inf ormatika Vol.2, No.1 April 2022 : 1-7
2

memperoleh tingkat akurasi sebesar 87,34% sentivitas sebesar 93,43% dan spesifitas 71,76% yang berarti
metode ini sudah cukup baik dalam mengklasifikasikan sentimen negatif maupun positif (Naraswati et al.,
2021)
2. METODE PENELITIAN
Objek penelitian yang digunakan pada penelitian ini adalah ulasan pengguna aplikasi
PeduliLindungi. Penakan dilakukan dengan beberapa tahap yang dimulai dengan pengumpulan data dan
analisis algoritma yang divisualisasikan dengan flowchart pada Gambar 1

Scrappin Pembagian
Mulai Label Data Preprocessing Data Uji
g Data Data Split

Daya
Latih

Pembobotan
dengan Term
Frequency (TF)

Model
Klasifikasi
dengan Naïve
Bayes

Evaluasi
Performance

Selesai

Gambar 1. Flowchart Analisis Sentimen


a. Pengumpulan Data
Pada penelitian ini objek yang diteliti adalah ulasan pengguna aplikasi PeduliLindungi
yang terdapat pada Google Playstore. Pengumpulan data dilakukan dengan menggunakan metode
Scrapping. Data yang diambil sebanyak 745 data dimulai dari tanggal 12 September - 14
September2022.
b. Preprocessing
Data teks mentah yang diperoleh biasanya tidak terstruktur serta terdapat banyak noise seperti
tanda baca,imbuhan, angka, karakter-karakter khusus, dan lain sebagainya. Pada tahap ini, data teks
akan dibersihkan sehingga tersisa bentuk dasar dari masing masing kata saja untuk keperluan analisis
lebih lanjut (Nugraha et al., 2020). Adapun tahapan preprocessing pada penelitian ini diantaranya
adalah
Data
Latih
Mulai Cleanning Case Folding Tokenizing

Data uji

Data Stopword
Selesai Stemming
Bersih Removal

Gambar 2. Flowchart Preprocessing

1. Cleanning merupakan proses yang akan membantu pembersihan teks dari karakter, symbol
maupun tanda baca yang tidak diperlukan dalam analisis sentiment (Nabila Nasution, 2021)
2. Case Folding mengkonversi keseluruhan teks dalam dokumen menjadi suatu bentuk
standar (biasanya huruf kecil atau lowercase). Karakter yang diterima hanya berupa huruf
‘a’ sampai dengan ‘z’ yang akan diubah menjadi huruf kecil (Balya, 2019).
3. Tokenizing merupakan proses memecah kalimat menjadi pototngan kata atau yang disebut
dengan token
4. Stopword Removal merupakan proses untuk menghapus kata penghubung dan kata yang tidak
memiliki makna dari setiap kalimat sehingga proses training nantinya dapat berjalan lebih efektif
(Nabila Nasution, 2021).

Methotika : Jurnal Ilmiah Teknik Inf ormatika Vol.2, No1. April 2022 : 1-7
3

5. Stemming merupakan proses mengambil kata dasar dari kata yang berimbuhan baik
awalan,akhiran maupun awalan akhiran.
c. Term Frequency (TF)
Term Frequency (TF) merupakan frekuensi kemunculan term pada sebuah dokumen. Jadi
pembobotan TF didasarkan pada jumlah kemunculan term atau kata pada sebuah dokumen yang
bersangkutan. Semakin besar jumlah kemunculan suatu term (TF tinggi) dalam dokumen, semakin
besar pula bobotnya atau akan memberikan nilai kesesuaian yang semakin besar (Herdhianto, 2020).
Dalam penelitian ini, penulis menggunakan Term Frequency murni (raw TF) dimana nilai TF
diberikan berdasarkan jumlah kemunculan suatu term di dokumen.
d. Algoritma Naïve Bayes
Naive Bayes adalah algoritma yang memanfaatkan teori peluang yang dikemukakan oleh
Ilmuwan Inggris, Thomas Bayes. Cara kerja metode ini yaitu dengan memprediksi peluang
terjadinya kejadian di masa depan berdasarkan data yang ada sebelumnya. Tingkat performa dari
sistem klasifikasi yang dibuat menggunakan Naïve Bayes Classifier (NBC), bergantung pada data
yang dimiliki dan data yang dipilih sebagai data latih. Jika data yang dipilih sebagai data latih bisa
mewakili semua atau sebagaian besar data yang dimiliki, maka sistem klasifikasi yang dibuat
mempunyai performa yang bagus.
Algoritma Naïve Bayes Classifier (NBC) memberi nilai target kepada data baru menggunakan
nilai , yaitu nilai kemungkinan tertinggi dari seluruh anggota himpunan setdomain V. Setiap data
dipresentasikan dengan pasangan atribut dimana dan seterusnya merupakan kata
pertama, adalah kata kedua dan seterusnya. Sedangkan V adalah himpunan kategori sentiment.
Persamaannya dapat dilihat pada persamaan berikut:

Dimana:
=Kategori komentar j=1,2 Dimana dalam penulisan ini kategori komentar positif, =
kategori komentar negative
= Probabilitas pada kategori
= Probabilitas dari
Untuk dan dihitung pada saat pelatihan dimana persamaanya dapat diliihat pada
persamaan 2.4 dan persamaan 2.5 sebagai berikut:

Keterangan:
Jumlah dokumen setiap kategori j
= Jumlah dokumen dari semua kategori
= jumlah frekuensi kemunculan setiap kata
= Jumlah frekuensi kemunculan kata dari setiap kategori
jumlah semua kata dari semua kategori
e. Confusion Matrix
Confusion matrix atau biasa juga disebut erro matrix pada dasarnya digunakan untuk memberikan
informasi perbandingan dari hasil klasifikasi yang dilakukan oleh model yang digunakan dengan hasil
klasifikasi sebenarnya. Confusion matrix biasanya digambarkan dalam bentuk tabel matriks
yang menjelaskan kinerja model klasifikasi pada serangkaian data uji yang nilai sebenarnya
telah diketahui. Confusion Matrix juga dapat mengukur kinerja model yang dibuat dengan

Methotika : Jurnal Ilmiah Teknik Inf ormatika Vol.2, No1. April 2022 : 1-7
4

menghitung tingkat akurasi ,precision, recall dan f1-score berdasarkan hasil confusin matrix. Tabel
Confusion Matrix adalah sebagai berikut:
Tabel 1. Confusion Matrix
Actual/ 1(Positive) 0(Negative)
Predicted
1(Positive) TP FP
(True Positive) (False Negative)
Type 1 Error
0(Negative) FN TN
(False Negative) (True Negative)
Type 2 Error

3. HASIL DAN PEMBAHASAN (11 PT)


Proses analisis sentiment ini terbagi menjadi 2 proses yaitu proses training dan testing. Kedua proses
ini menggunakan Bahasa Pemograman python dengan memanfaatkan library sklearn yaitu
MultinomialNaiveBayes. Setelah data di preprocessing, data dibagi menjadi 2 bagian yaitu data training
dan data testing dengan perbandingan 80:20. Pada proses data training dilakukan pembobotan kata dan
kemudian pembentukan model Naïve Bayes dengan mencari nilai probabilitas setiap kata yang akan
dijadikan sebagai acuan untuk data uji. Proses training menggunakan data yang terdiri dari 361 sentimen
Negatif dan 235 sentimen Positif.
3.1. Pengujian Sistem
Proses testing menggunakan data sebanyak 149 data yang sudah diberi label actual yaitu 107
sentimen Positif dan 42 sentimen Negatif. Data testing diuji menggunakan klasifikasi Naïve Bayes.
Berikut hasil pengujian data testing:

Gambar 3. Hasil Analisis Sentimen

3.2. Evaluasi Hasil


Evaluasi Hasil pada penelitian ini menggunakan confusion matrix betujuan untuk
memberikan informasi perbandingan hasil klasifikasi yang menggunakan sebuah metode dengan
nilai aktualnya. Proses evaluasi menggunakan 149 data uji dimana 107 sentimen Positif dan 42
sentimen Negatif. Hasil confusion matrix dapat dilihat pada Gambar 4

Methotika : Jurnal Ilmiah Teknik Inf ormatika Vol.2, No1. April 2022 : 1-7
5

Gambar4. Hasil Confusion Matrix


Berdasarkan hasil confusion matrix yang didapatkan, dijelaskan bahwa:
• True Positive (TP) yaitu data positif yang diprediksi dengan metode klasifikasi Naïve Bayes benar
diperoleh sebanyak 36 data
• True Negative (TN) yaitu data negatif yang diprediksi dengan metode klasifikasi Naïve Bayes
benar diperoleh sebanyak 93 data
• False Positif (FP) yaitu data negatif namun jika diprediksi dengan metode klasifikasi Naïve Bayes
menghasilkan data positif diperoleh sebanyak 18 data
• False Negative data positif namun jika diprediksi dengan metode klasifikasi Naïve Bayes
menghasilkan data negatif diperoleh sebanyak 1 data
Confusion Matrix juga dapat mengukur kinerja model yang dibuat dengan menghitung tingkat akurasi
,precision, recall dan f1-score. Pada penelitian ini hasil Akurasi, precision dan recall dihitung
menggunakan Bahasa pemograman python dengan mengimport classification_report yang ada pada
library sklearn.metrics. Untuk hasil pada sistem dapat dilihat pada Gambar 5

Gambar 5. Hasil Classification Report


Dengan demikian, Metode Naïve Bayes merupakan metode yang baik dalam menganalisis
sentiment karena mempunyai tingkat akurasi sebesar 87,16% . precision 66,66%, recall 97,29% dan f1-
score 79.12%.

Methotika : Jurnal Ilmiah Teknik Inf ormatika Vol.2, No1. April 2022 : 1-7
6

3.3. Visualisasi
Visualisasi dari hasil analisis sentiment ditampilkan dengan bentuk word cloud . Word cloud
merupakan tampilan dari kata kata yang sering muncul, dan besar kecilnya menunjukkan frekuensi
frekuensi kemunculannya dalam data.

Gambar 6. Wordcloud Label Positif


Pada tampilan wordcloud diatas disimpulkan bahwa kata yang memiliki frekuensi kemunculan kata pada
sentiment positif adalah kata bagus, bantu, mantap, aplikasi dan baharu. Untuk Hasil Wordlcloud label
Negatif adalah sebagai berikut:

Gambar 7. WordCloud Label Negatif


Pada tampilan wordcloud diatas disimpulkan bahwa kata yang memiliki frekuensi kemunculan kata
pada sentiment negatif adalah kata aplikasi, gabung buka dan susah.

4. KESIMPULAN
Berdasarkan hasil penelitian, maka dapat diambil kesimpulan bahwa
1. Metode Naïve Bayes dalam menganalisis sentiment berdasarkan ulasan pengguna aplikasi
PeduliLindungi di GooglePlaystore berhasil diterapkan.
2. Hasil analisis sentiment ulasan Aplikasi PeduliLindungi cenderung bersifat sentimen Negatif. Para
pengguna Aplikasi PeduliLindungi lebih banyak menyatakan keluhan terkait kinerja Aplikasi
PeduliLindungi.
3. Proses preprocessing belum mampu membersihkan data dari kata kata yang tidak memiliki makna.
Contohnya, untuk nama orang dan product tidak hilang pada preprocesing. Tentunya hal ini dapat
berpengaruh pada hasil analisis sentiment.

REFERENSI
[1] Naraswati, N. P. G., Nooraeni, R., Rosmilda, D. C., Desinta, D., Khairi, F., & Damaiyanti,
R. (2021). Analisis Sentimen Publik dari Twitter Tentang Kebijakan Penanganan Covid-19
di Indonesia dengan Naive Bayes Classification. Sistemasi, 10(1), 222.
Methotika : Jurnal Ilmiah Teknik Inf ormatika Vol.2, No1. April 2022 : 1-7
7

https://doi.org/10.32520/stmsi.v10i1.1179
[2] Windy, A. (n.d.). Kupas Tuntas Aplikasi PeduliLindungi. Kominfo.Go.Id.
https://aptika.kominfo.go.id/2021/10/kupas-tuntas-aplikasi-pedulilindungi/
[3] Nugraha, F. A., Harani, N. H., & Habibi, R. (2020). Analisis Sentimen Terhadap
Pembatasan Sosial Menggunakan Deep Learning (R. M. Awangga (ed.); 1st ed.).
[4] Nabila Nasution. (2021). UNIVERSITAS SUMATERA UTARA Poliklinik UNIVERSITAS
SUMATERA UTARA. Jurnal Pembangunan Wilayah & Kota, 1(3), 82–91.
[5] Balya. (2019). Analisis Sentimen Pengguna Youtube Di Indonesia Pada Review Smartphone
Menggunakan Naïve Bayes. Skripsi Universitas Sumatera Utara, 4–16.
[6] Herdhianto, A. (2020). Sentiment Analysis Menggunakan Naïve Bayes Classifier (NBC)
Pada Tweet Tentang Zakat. http://repository.uinjkt.ac.id/dspace/handle/123456789/53661
[7] Mustika, Ardilla, Y., Manuhutu, A., Ahmad, N., Hasbi, I., Guntoro, Mnuhutu, M. A.,
Hozairi, M. R., Wardhani, A. K., Alim, S., Romli, I., Religia, Y., Octafian, Dt., Utan, S. U.,
& Iin, E. (2021). Data Mining dan Aplikasinya (N. Rismawati (ed.)). Widina Bhakti
Persada Bandung.
[8] Id, I. D. (2021). MACHINE LEARNING. UR PRESS.
[9] Ying, Y., & Park, D. (2018). IMPLEMENTASI NAIVE BAYES CLASSIFIER DAN ASOSIASI
UNTUK ANALISIS SENTIMEN DATA ULASAN APLIKASI E-COMMERCE SHOPEE
PADA SITUS GOOGLE PLAY. 6–7.
[10] Devid. (2017). ID-OpinionWords.
[11] Harun, A., & Ananda, D. P. (2021). Analysis of Public Opinion Sentiment About Covid-19
Vaccination in Indonesia Using Naïve Bayes and Decission Tree Analisa Sentimen Opini
Publik Tentang Vaksinasi Covid-19 di Indonesia Menggunakan Naïve Bayes dan Decission
Tree. 1(April), 58–63.
[12] Nugroho, D. G., Chrisnanto, Y. H., & Wahana, A. (2015). Analisis Sentimen Pada Jasa
Ojek Online ... (Nugroho dkk.). 156–161.
[13] Rasyadi, M. H. (2017). Analisis Sentimen Pada Twitter Menggunakan Metode Naïve Bayes
(Studi Kasus Pemilihan Gubernur Dki Jakarta 2017). 1–17.
[14] Ratnawati, F. (2018). Implementasi Algoritma Naive Bayes Terhadap Analisis Sentimen
Opini Film Pada Twitter.
[15] Sarosa, M., Muna, N., Kusumawardani, M., Suyono, A., & Mulyani, Y. (2022).
Pemrograman Python Dalam Contoh dan Penerapan . Media Nusa Creative (MNC
Publishing).
[16] Suyanto, Y. (2018). Pemograman Terstruktur Dengan Delphi. Gadjha Mada University
Press.
[18] Widodo, R. B. (2022). MACHINE LEARNING METODE K-NEAREST NEIGHBORS
KLASIFIKASI ANGKA BAHASA ISYARAT. Media Nusa Creative (MNC Publishing).

Methotika : Jurnal Ilmiah Teknik Inf ormatika Vol.2, No1. April 2022 : 1-7

Anda mungkin juga menyukai