php/journal
Kata kunci: Analisis sentimen, Multinomial Naive Bayes, Black box testing, Confusion matrix, Precision dan
Recall
ABSTRACT
The purpose of this study was to determine the level of public sentiment from product reviews on the 3second
online store in the shopee application using the Multinomial Naïve Bayes method. Review analysis can easily be
done by looking at the number of stars given by buyers, but the number of stars cannot represent the content of
the entire review. It is necessary to look at the entire content of the review comments to be able to understand
the overall intent of the review. It is possible to analyze reviews manually by looking at one by one, but if you
have many reviews, it will be faster to use a sentiment analysis system by using a classification technique.
Multinomial Nave Bayes Algorithm is the development of Nave Bayes which is used in making sentiment
analysis, because this algorithm aims to classify modes in positive and negative categories. Based on the results
of the tests carried out the Multinomial Naïve Bayes method proved to work well in this study. This is evidenced
by the results of the confusion matrix from testing the classification system and classification from linguists who
got an accuracy value of 91% and obtained a sentiment level as evidenced by the recall and precision results
which were worth 65.93% and 60% for the positive class, while for the negative class it was worth 34.06% and
31%.
Keywords: Sentiment analysis, Multinomial Naive Bayes, Black box testing, Confusion matrix, Precision and
Recall.
sehingga memudahkan penggunanya untuk untuk mode klasifikasi dalam kategori positif dan
berbelanja diberbagai toko yang berbeda dalam 1 negatif.
produk pencarian. Pada kegiatan pembelian produk Maka dari itu pada penelitian ini peneliti
disebuah toko online dalam aplikasi Shopee, pembeli melakukan analisis sentimen masyarakat pada ulasan
dapat memberikan ulasan setelah menerima barang produk dari salah satu toko dalam aplikasi Shopee,
yang dibeli. Ulasan pembelian produk terdiri dari sehingga kita bisa tahu sentimen dari masyarakat
bintang dan isi komentar ulasan yang berisi terhadap suatu produk dari toko tersebut, dan dapat
tanggapan apresiasi maupun kritik dan masukan pada juga membantu masyarakat lain supaya lebih berhati-
produk yang telah dibeli tersebut. Semakin banyak hati dalam membeli sebuah produk di toko online.
jumlah bintang yang dimiliki, maka semakin baik Adapun toko online yang menjadi objek
pula reputasi yang dimiliki toko tersebut. Ulasan penelitian ini yaitu toko local brand 3Second. Di
pembelian produk memiliki pengaruh yang lansir dari artikel yang ditulis oleh media online
signifikan terhadap minat beli dari pembeli lain. shopee.co.id, toko online tersebut termasuk lima dari
Ulasan pembelian produk dapat digunakan oleh local brand yang kualitasnya tidak jauh beda dengan
penjual untuk mendapat informasi sebagai bahan kualitas dari produk-produk brand luar. Data tersebut
perbaikan pada produk dan layanan sehingga tercipta diperoleh dari sumber novellmag.com, dengan
kepuasan pelanggan terhadap tokonya. peringkat pertama 3Second.
Analisis ulasan secara mudah dapat Menjadi urutan pertama toko local brand
dilakukan dengan melihat jumlah bintang yang dengan kualitas terbaik, akan membuat toko 3second
diberikan oleh pembeli, tetapi jumlah bintang tidak semakin dikenal oleh masyarakat dan membuat
dapat mewakili isi dari keseluruhan ulasan. tingkat penjualan semakin banyak. Oleh karea itu
Diperlukan melihat seluruh isi komentar ulasan Kepuasan pelanggan merupakan hal penting yang
untuk dapat mengetahui keseluruhan maksud ulasan. menjadi tujuan dari semua toko online. Selain
Sangat mungkinkan untuk menganalisis ulasan kepuasan pelanggan yang menjadi hal penting, tak
secara manual dengan melihat satu persatu, namun lupa pula dalam penjualan online tentu tidak jauh
apabila ulasan yang dimiliki banyak akan lebih cepat dari sentimen masyarakat atau konsumen oleh karena
menggunakan sistem analisis sentimen dengan cara itu penulis berdasarkan ulasan di atas mengangkat
melakukan teknik kalsifikasi. judul yaitu “Analisis Sentimen Masyarakat Terhadap
Text Mining adalah salah satu teknik yang Toko Online Pada Aplikasi Shopee Menggunakan
dapat digunakan untuk melakukan klasifikasi Metode Multinomial Naïve Bayes”
dokumen dimana Text Mining merupakan variasi dari
Data Mining yang berusaha menemukan pola 2. Kajian Pustaka
menarik dari sekumpulan data tekstual yang 2.1 Prosedur Penelitian
berjumlah besar (Kurniawan et al., 2012). Naïve Pada penelitian ini sistem mempunyai dua
bayes biasa digunakan sebagai klasifikasi opini atau tahapan proses yaitu tahap data training adalah
pun untuk pengklasifikasian. Sehingga untuk proses pembelajaran dan tahap data testing yang
mempercepat proses perhitungan digunakan nantinya merupakan output dari sistem ini. Nilai
algoritma Multinomial Naïve Bayes. Algoritma output berupa sentimen ulasan yang bernilai positif
Multinomial Naïve Bayes adalah pengembangan dari atau negatif yang diklasifikasikan oleh sistem
Naïve Bayesyang Text Mining adalah salah satu berdasarkan pembelajaran data training. Berikut alur
teknik yang dapat digunakan untuk melakukan prosedur penelitian dapat dilihat pada Gambar 1.
klasifikasi dokumen dimana Text Mining merupakan
variasi dari Data Mining yang berusaha menemukan
pola menarik dari sekumpulan data tekstual yang
berjumlah besar (Kurniawan et al., 2012). Naïve
bayes biasa digunakan sebagai klasifikasi opini atau
pun untuk pengklasifikasian. Sehingga untuk
mempercepat proses perhitungan digunakan
algoritma Multinomial Naïve Bayes. Algoritma
Multinomial Naïve Bayes adalah pengembangan dari
Naïve Bayesyang digunakan dalam pembuatan
analisis sentiment, karena algoritma ini bertujuan
Pilih data Menampilk Menampilk Sesuai Recall adalah perhitungan dokumen yang
testing an sub an sub relevan dari seluruh dokumen relevan yang berada
Masukan menu data, menu data, didalam data. Precision adalah jumlah kelompok
data cleansing, cleansing, dokumen relevan dari total jumlah dokumen yang
testing: stopword stopword ditemukan.
Klik stemming,d stemming,d
Recall
tombol an hasil an hasil 𝑗𝑢𝑚𝑙𝑎 ℎ 𝑑𝑜𝑘𝑢𝑚𝑒𝑛 𝑟𝑒𝑙𝑒𝑣𝑎𝑛 𝑦𝑎𝑛𝑔 𝑑𝑖𝑡𝑒𝑚𝑢𝑘𝑎𝑛
proses akhir akhir 𝑡𝑜𝑡𝑎𝑙 𝑑𝑜𝑘𝑢𝑚𝑒𝑛 𝑟𝑒𝑙𝑒𝑣𝑎𝑛 𝑦𝑎𝑛𝑔 𝑑𝑖𝑡𝑒𝑚𝑢𝑘𝑎𝑛 𝑑𝑎𝑙𝑎𝑚 𝑘𝑜𝑙𝑒𝑘𝑠𝑖
perhitung masing- masing- Precision
an masing masing 𝑗𝑢𝑚𝑙𝑎 ℎ 𝑑𝑜𝑘𝑢𝑚𝑒𝑛 𝑟𝑒𝑙𝑒𝑣𝑎𝑛 𝑦𝑎𝑛𝑔 𝑑𝑖𝑡𝑒𝑚𝑢𝑘𝑎𝑛
menu menu 𝑗𝑢𝑚𝑙𝑎 ℎ 𝑡𝑜𝑡𝑎𝑙 𝑑𝑜𝑘𝑢𝑚𝑒 𝑛 𝑦𝑎𝑛𝑔 𝑑𝑖𝑡𝑒𝑚𝑢𝑘𝑎𝑛
sudah ada sudah ada Dari total 200 data ulasan yang uji oleh
datanya datanya sistem ditemukan 127 data bernilai positif dan 73
Hasil pengujian halaman training, admin data bernilai negatif. Berikut ini nilai recall dan
akan memasukkan data ulasan pada form masukkan precision untuk kelas positif dapat dilihat pada Tabel
data testing sistem akan mengolah ulasan tersebut 8.
dan dicocokkan dengan data yang ada pada database.
Tabel 8.Recall Dan Precision Kelas Positif
Jika data cocok maka sistem akan menampilkan
hasil. Kelas Positif Relevan Tidak Relevan
3.2.2Hasil Pengujian Menurut Ahli Bahasa True 120 7
Hasil yang diperoleh menurut ahli bahasa False 0 0
menyatakan untuk membedakan sebuah komentar Pada tabel diatas pengukuran recall dan
atau ulasan suatu barang, baik secara lisan ataupun precision yaitu:
tulisan tergantung dari hasil yang diharapan dari 120
Recall = 120 +62 x 100%
barang tersebut apakah sudah memenuhi harapannya.
Kalimat yang diungkapkan bisa diketahui melalu = 65.93%
penggunaan kata yang lebih dominan kedalam kata 120
Precision = 127 +73 x 100%
sifat. Data testing yang di berikan kepada ahli bahasa
sebanyak 200 data yang telah diuji pada sistem = 60%
sebelumnya, 182 data tersebut dikatakan telah sesuai Berikut ini nilai recall dan precision untuk
menurut ahli bahasa bapak Harmin, S.Pd.,M.Pd. kelas negatif dapat dilihat pada Tabel 9.
3.2.3 Pengujian Confusion Matrix Tabel 9.Recall dan Precision Kelas Negatif
Pengujian Confusion Matrix juga sering Kelas Negatif Relevan Tidak Relevan
disebut error matrix. Confusion Matrix berbentuk True 62 11
tabel matriks yang menggambarkan kinerja model
False 0 0
klasifikasi pada serangkaian data uji yang nilai
sebenarnya. Tingkat akurasi algoritma analisis Pada tabel diatas pengukuran recall dan
sentimen dilakukan dengan cara membandingkan precision yaitu:
62
hasil klasifikasi yang diperoleh dari ahli bahasa Recall = 62 +120 x 100%
untuk mendapatkan hasil klasifikasi yang tepat pada
sistem. Berikut hasil confusuin matrix dapat dilihat = 34.06%
62
pada Tabel 7. Precision = 127 +73 x 100%
Tabel 7.Hasil Confusion Matrix = 31%
True Class Akurasi yang didapatkan dari adalah recall
Positif Negatif 65.93% dan precision 60% untuk kelas positif. Untuk
Predicted Positif 120 7 kelas negatif sebesar recall 34.06% dan precision
Class Negatif 11 62
TP +TN
31%. Nilai tersebut didapatkan dari recall yang
Accuracy = TP +TN +FP +FN x 100% membagi antara jumlah relevan yang ditemukan
120 + 62 dengan jumlah semua data relevan yang ditemukan
Accuracy = 120 +62+11+7 x 100%
dan precision yang membagi antara jumlah relevan
182
= 200 x 100% yang ditemukan dengan jumlah semua data yang
ditemukan.
= 91%
Daftar Pustaka
Gambar 10.Term Frequency [1] Kurniawan, B., Effendi, S., & Sitompul, O. S.
4) ConditionalProbabilitas (2012). Klasifikasi Konten Berita Dengan
Metode Text Mining. Jurnal Dunia Teknologi
Menghitung nilai conditional probabilitas dan Informasi. Vol 5 (1), 14–19.
memasukkan teknik laplace smoothing sebagai [2] Muktafin, E. H., Kusrini., & Luthfi, E. T.
proses penambahan nilai 1 untuk menghindari nilai (2020). Analisis Sentimen pada Ulasan
nol. Tampilan proses conditional probabilitas dapat Pembelian Produk di Marketplace Shopee
dilihat pada Gambar 11. Menggunakan Pendekatan Natural Language.
Jurnal Eksplora Informatika. 32-42.
[3] Mustaqhfiri, M., Abidin, Z., & Kusumawati, R.
(2012). Peringkasan Teks Otomatis Berita
Berbahasa Indonesia Menggunakan Metode
Maximum Marginal Relevance. 134-147.