Anda di halaman 1dari 8

IJCIT (Indonesian Journal on Computer and Information Technology) 7 (2) (2022) 119-126

IJCIT
(Indonesian Journal on Computer and Information Technology)
Journal Homepage: http://ejournal.bsi.ac.id/ejurnal/index.php/ijcit

Analisis Sentiment Masyarakat Menggunakan


Penggabungan Algoritma Naive Bayes Dan Particle
Swarm Optimization
Sopian Aji1, Ina Maryani2, Elly Muningsih3

1,2
Sistem Informasi, Universitas Nusa Mandiri
Jakarta, Indonesia
Email: sopian.sop@nusamandiri.ac.id1, ina.maryani@nusamandiri.ac.id2

3
Sistem Informasi Kampus Kota Yogyakarta, Universitas Bina Sarana Informatika
Yogyakarta, Indonesia
Email: elly.emh@bsi.ac.id

ABSTRAK
IMDb adalah sumber informasi paling populer untuk informasi film, TV, dan selebritas, Tonton trailer,
dapatkan jadwal tayang, dan beli tiket untuk film mendatang serta melihat ulasan guna dalam mengambil
keputusan yang akan diambil. Dengan menggunakan Aplikasi IMDb informasi akan lebih cepat lagi karena
kini informasi ada digenggaman tangan yang telah terinstal pada handphone yang digunakan dengan
jumlah lebih dari 100 juta unduhan untuk platform tersebut pada play store. Pada ulasan pengujian kali
ini Pengujian akan menggabungkan Algoritma Naive Bayes dengan Particle Swarm Optimization (PSO)
untuk meningkatkan nilai akurasi dan ROC Curve yang didapatkan. Data ulasan analisis sentimen yang
digunakan 1000 ulasan dalam bahasa indonesia yang masing-masing terdiri dari 500 ulasan negatif dengan
sifat yang tidak mendukung serta 500 ulasan positif dengan sifat yang mendukung, dengan sumber data
ulasan diambil dari Google Play di Aplikasi IMDb. Hasil yang didapat dari kedua model ini yakni Algoritma
Naive Bayes dengan Particle Swarm Optimization (PSO) mendapatkan hasil accuracy pengujian terbaik
yakni nilai accuracy: 80.00% eksperimen dilakukan dengan menggunakan Aplikasi RapidMiner Studio.
Kata Kunci: naive bayes, paticle swarm optimization, ulasan aplikasi imdb

ABSTRACTS
IMDb is the most popular source of information for movie, TV and celebrity information, Watch trailers,
get showtimes and buy tickets for upcoming movies and view reviews to make informed decisions. By using
the IMDb application, information will be even faster because now the information is in the palm of the
hand that has been installed on the cellphone used with more than 100 million downloads for that platform
on the play store. In this review, the test will combine the Naive Bayes Algorithm with Particle Swarm
Optimization (PSO) to increase the accuracy and ROC Curve values obtained. Sentiment analysis review
data used 1000 reviews in Indonesian, each of which consisted of 500 negative reviews with unsupportive
characteristics and 500 positive reviews with supportive characteristics, with the source of review data
taken from Google Play in the IMDb Application. The results obtained from these two models, namely the
Naive Bayes Algorithm with Particle Swarm Optimization (PSO) get the best test accuracy results, namely
the accuracy value: 80.00% experiments were carried out using the RapidMiner Studio Application.
Keywords: naive bayes, particle swarm optimization, imdb app review

Jurnal ini dapat diakses secara terbuka dan memiliki lisensi CC-BY-SA
(https://creativecommons.org/licenses/by-sa/4.0/) ©2022 by penulis dan IJCIT
Sopian Aji, et.al. Analisis Sentiment Masyarakat Menggunakan… | 120

1. PENDAHULUAN 2019)mengatakan bahwa Algoritma PSO cukup


Menonton film merupakan aktivitas baik dibandingkan algoritma genetika lainnya,
yang sangat digemari oleh banyak orang, bukan selain itu melalui algoritma PSO ini dapat
saja sebagai hiburan semata namun melalui film mengambil keputusan yang baik. Penggunaan
juga seseorang dapat belajar banyak hal (Keni penggabungan kedua metode yakni Naïve bayes
Hasanah Wiguna, 2021)). Tak jarang ketika ingin dan PSO juga dilakukan oleh (Sudriyanto et al.,
menonton sebuah film manusia membutuhkan 2021) untuk memprediksi mahasiswa yang lulus
informasi yang valid terkait rekomendasi film tepat waktu dan terbukti dapat menghasilkan
yang menarik untuk ditontonnya. nilai akurasi yang tinggi. Berikutnya dalam
IMDb (Internet Movie Database) penelitan lainnya juga PSO dianggap lebih unggul
merupakan media hiburan berupa informasi untuk menentukan posisi robot (Istighfarin et al.,
seperti film, acara televisi, video rumahan atau 2020). Selain itu masi berbicara mengenai
permainan, biografi kru produksi dan personil, keunggulan PSO yang terbukti dalam penelitian
acara internet, termasuk daftar pemeran, trailer (Saprudin, 2017) tentang peningkatan akurasi
movie. Menurut (Prasetyo et al., 2022) tercatat proses klasifikasi menggunakan Algoritma C45.
jutaan data film pada platform IMDB ini. Dengan berdasarkan literatur yang
Masalah yang muncul adalah polemic sudah disampaikan maka peneliti melakukan
ulasan positif dan negatif terhadap suatu film. penelitian untuk proses analisis data pada IMDb.
Tak jarang masyarakat berkomentar atau
memberikan ulasan yang kurang pantas bahkan 2. METODE PENELITIAN
sampai memberikan kalimat yang kasar dan Metode yang digunakan oleh peneliti
bersifat ujaran kebencian. Ulasan dari untuk mengolah data atau ulasan dalam analisa
masyarakat pada aplikasi IMDB ini dapat sentiment ini eksperimen menggunakan
dijadikan bahan analisis sentiment untuk penggabungan algoritma yakni Naive Bayes
mengetahui pendapat masyarakat tentang dengan Particle Swarm Optimization (PSO),
aplikasi IMDB. penggabungan algortma ini dapat meningkatkan
Analisis sentiment adalah teknik yang nilai akurasi dan ROC Curve pada algoritma Naive
digunakan untuk mengetahui informasi Bayes. Adapun Pengolahan data tersebut
sentiment yang bernilai positif, bernilai netral didapatkan dari ulasan atau komentar google
atau bernilai negative pada suatu teks (Legiawati play store pada penggunan aplikasi IMDb. Data
et al., 2022). Analisis sentiment ini banyak tersebut dibagi kedalam 2 (dua) kelompok yaitu
dilakukan oleh para peneliti seperti dalam ulasan yang bersifat positif dengan makna
penelitian (Jatmiko, dkk, 2022 ) yaitu tentang menduku dan ulasan yang bersifat negatif
analisis sentiment komentar di twitter terkait dengan makna yang menolak, yang tersimpan
event formula E di Jakarta. Sejumlah algoritma dalam 1 (satu) dokumen excel dengan ekstension
telah digunakan untuk proses analisis sentiment xlsx.
seperti penggunaan algoritma naïve bayes yang Data yang akan diolah untuk penilitian
digunakan oleh (Ramadhani & Wahyudin, 2022) yakni ulasan yang terdiri dari 1000 data ulasan
untuk analisis jenis vaksin covid-19, selain itu dari pengguna aplikasi IMDb, terdiri dari 500
dalam penelitian lainnya yaitu (Pramukti et al., ulasan yang bersifat positif atau mendukung dan
2022) mengenai kebijakan perpanjangan PPKM 500 ulasan yang bersifat negative atau menolak
dimasa pandemi. Algoritma naïve bayes sangat atau tidak mendukung. Hasil dari
popular dan sering digunakan oleh para peneliti pengelompokan data ulasan tersebut diproses
karena kemampuannya dapat menganalisis data menggunakan Aplikasi RapidMiner dengan
dan menghasilkan nilai akurasi yang tinggi. pengolahan pada text processing yang peneliti
Dalam penelitian ini peneliti gunakan Tokenize, Transform Cases, Stopwords
menggunakan algoritma PSO (Particle Swarm (dictionar).
Optimization). Dalam (Setiawan et al.,

IJCIT (Indonesian Journal on Computer and Information Technology)


p-ISSN: 2527-449X | e-ISSN: 2549-7421
121 | Vol. 7 No.2, November 2022 Hal. 119-126

Gambar 1. Kerangka Pemikiran

Pada gambar 1 menjelaskan bahwa tabel 1 yang dilalui terdiri dari Tokenize,
kerangka kerja dalam penelitian ini dimulai Transform Cases, dan Stopwords(disctionary).
dengan mengambil data dari ulasan pengguna Hasil pengolahan sebagai berikut:
aplikasi IMDb dengan menggunakan bahasa
indonesai yakni pada google play store dengan Tabel 1. Text Processing menggunakan
alamat tautan sebagai berikut ini Tokenize, Transform Cases, Stopwords
https://play.google.com/store/apps/details/IMD (Dictionar)
b_Movies_TV?id=com.imdb.mobile&hl=in&gl=U Ulasan Tokenize Transform Stopwords
S kemudian hasil dari pengumpulan data Cases (Dictionar)
tersebut dilakukan pemrosesan teks
aplikasi aplikasi aplikasi aplikasi
menggunakan tokenize, Transform Case,
apaan apaan apaan nih apaan nih
Stopwords (direktori). Pada Stopwords (dictionar)
nih! gak nih gak gak bisa gak bisa
ini peneliti menambahkan kosa kata atau kata
bisa bisa buat buat
yang mengandung unsur kebencian. Sedangkan
buat buat nonton nonton
pada feature selection terlihat jelas terjadinya
nonton nonton film film
penggabungan 2 (dua) algoritma dimana Naive
film, film payah
Bayes berada dalam Particle Swarm
PAYAH!! PAYAH bego
Optimization, sehingga hasil eksperimen
BEGO! BEGO
tersebut didapatkan hasil keakuratan dari
memproses data tersebut.
Pada tabel 1 terlihat bagaimana proses
ulasan ujaran kebencian yang bersifat negatif
3. HASIL DAN PEMBAHASAN setelah melewati beberapa proses menjadi
Penelitian dalam melakukan ulasan yang menjadi lebih baik bersifat positif.
eksperimen menggunakan metode Naive Bayes Dimana ulasan setelah melalui text processing
dan Particle Swarm Optimization untuk seluruh simbol karakter atau tanda
menganalisa sentimen pengguna aplikasi IMDb, baca akan dihilangan seperti tanda seru (!) koma
dimana pengguna memberikan pengalamannya (,) dan symbol karakter lainnya. Kemudian pada
dalam menggunakan aplikasi IMDb pada ulasan transform cases seluruh text yang menggunakan
google play store. Untuk mengukur akurasi data huruf kapital atau huruf besar akan berubah
eksperimen menggunakan Aplikasi RapidMiner menjadi huruf kecil, karena ungkapan text dalam
Studio 9.10.011 dengan menggunakan spesifikasi huruf kapital adalah ungkapan dimana seseorang
CPU Intel Core i3 1.90GHz, RAM 10 GB, dan mengungkapkan ungkapan yang tinggi, keras
system operasi Microsoft Windows 10 atau marah. Pada tahap terakhir yakni
Professional 64-bit. Stopwords (disctionary) berfungsi untuk
Berikut salah satu ulasan yang menghilangkan kosa kata atau penggunaan kata
mengandung ujaran kebencian yakni pada data yang memiliki arti ujaran kebencian dengan kata-
ulasan yang bersifat negatif, data akan diproses kata kasar, Seperti yang kita lihat pada tabel 1
menggunakan Text Processing yang terlihat pada “BEGO” dalam Bahasa Indonesia artinya “sangat

IJCIT (Indonesian Journal on Computer and Information Technology)


p-ISSN: 2527-449X | e-ISSN: 2549-7421
Sopian Aji, et.al. Analisis Sentiment Masyarakat Menggunakan… | 122

bodoh”, sehingga setelah melewati tahap dalam ulasan positif sesuai dengan prediksi yang
stopwords (disctionary) ini akan dihilangkan. dilakukan dengan metode Naive Bayes, 69 data
Pada pengujian pertama yakni pada diprediksi ulasan positif tetapi ternyata hasil
ulasan aplikasi IMDb menggunakan algoritma prediksinya ulasan negatif, 311 diklasifikasikan
Naive Bayes mendapatkan hasil accuracy: review negatif sesuai dengan prediksi yang
74.28%. dilakukan dengan metode Naive Bayes dan 188
data diprediksi ulasan negatif ternyata hasil
Tabel 2. Accuracy Algoritma Naive Bayes prediksinya ulasan positif.
true Negatif true Positif Dalam menentukan hasil penelitian
pred. Negatif 311 69 menggunakan algoritma Naive Bayes dengan
pred. Positif 188 431 rancangan pada RapidMiner Studio seperti yang
terlihat pada gambar 2. Sedangkan hasil dari ROC
Pada tabel 2 diatas dapat lihat hasil Curve pada penelitian Naive Bayes dapat kita
prediksi yang didapat yaitu 431 diklasifikasikan ke lihat pada gambar 3.

Gambar 2. Modelling Validation Testing Naive Bayes

IJCIT (Indonesian Journal on Computer and Information Technology)


p-ISSN: 2527-449X | e-ISSN: 2549-7421
123 | Vol. 7 No.2, November 2022 Hal. 119-126

Gambar 3. ROC Curve Algoritma Naive Bayes

Pada gambar 3 terlihat dengan jelas bahwa prediksinya ulasan negatif, 84 diklasifikasikan
hasil yang didapat ROC Curve Algoritma Naive review negatif sesuai dengan prediksi yang
Bayes dengan nilai AUC (optimistic): 0.931 +/- dilakukan dengan metode Naive Bayes dan
0.019 (micro average: 0.931) (positive class: Particle Swarm Optimization (PSO), dan 52 data
Positif). Kemudian pengujian kedua dilakukan diprediksi ulasan negatif ternyata hasil
yakni menggabungkan kedua metode Naive prediksinya ulasan positif. Dengan accuracy yang
Bayes dengan Particle Swarm Optimization didapat pada pengujian kedua menggunakan
(PSO) seperti yang terlihat pada tabel 3. Naive Bayes dan Particle Swarm Optimization
(PSO) nilai accuracy: 80.00%.
Tabel 3. Accuracy Algoritma Naive Bayes dan Dalam menentukan hasil penelitian
Particle Swarm Optimization (PSO) menggunakan algoritma Naive Bayes dan Particle
true Negatif true Positif Swarm Optimization (PSO) dengan rancangan
pred. Negatif 84 8 pada RapidMiner Studio tampak pada gambar 4.
pred. Positif 52 156 Sedangkan hasil dari ROC Curve pada penelitian
Naive Bayes dan Particle Swarm Optimization
Pada tabel 3 dapat lihat hasil prediksi (PSO) dapat dilihat pada gambar 5.
yang didapat yaitu 156 diklasifikasikan ke dalam Pada gambar 5 bahwa hasil dari
ulasan positif sesuai dengan prediksi yang penelitian yang kedua ini didapat ROC Curve
dilakukan dengan metode Naive Bayes dan Algoritma Algoritma Naive Bayes dan Particle
Particle Swarm Optimization (PSO), 8 data Swarm Optimization (PSO) dengan nilai AUC
diprediksi ulasan positif tetapi ternyata hasil (optimistic): AUC (optimistic): 0.968 (positive
class: Positif).

IJCIT (Indonesian Journal on Computer and Information Technology)


p-ISSN: 2527-449X | e-ISSN: 2549-7421
Sopian Aji, et.al. Analisis Sentiment Masyarakat Menggunakan… | 124

Gambar 4. Modelling Validation Testing Naive Bayes dan Particle Swarm Optimization (PSO)

IJCIT (Indonesian Journal on Computer and Information Technology)


p-ISSN: 2527-449X | e-ISSN: 2549-7421
125 | Vol. 7 No.2, November 2022 Hal. 119-126

Gambar 5. ROC Curve Algoritma Naive Bayes dan Particle Swarm Optimization (PSO)

4. KESIMPULAN kita dapat menentukan pilihan dengan tepat dari


Pengujian model dengan pengalaman yang telah menggunakan aplikasi
menggunakan Algoritma Algoritma Naive Bayes atau produk tersebut. Tentu saja penilaian yang
dan Particle Swarm Optimization (PSO) dengan diberikan atau ulasan ada yang bersifat
menggunakan data ulasan analisis sentimen dari mendukung atau menolak hal ini merupakan hal
1000 data ulasan dalam bahasa indonesia yang yang wajar yang sering terjadi, permasalahnya
terdiri dari 500 ulasan positif dengan sifat yang adalah pada ulasan yang disampaikan
mendukung dan 500 review negative dengan mengandung unsur kebencian. Tentu saja hal ini
sifat yang tidak mendukung, Model yang yang tidak boleh terjadi dengan memberikan
dihasilkan mendapatkan hasil accuracy pengujian ulasan yang baik walaupun bersifat tidak
pertama dilakukan dengan menggunakan mendukung atau menolak akan tetap bersifat
Algoritma Naive Bayes dengan nilai accuracy: positif bagi pengembang aplikasi atau produk
74.28% yang kemudian diuji kembali dengan tertentu sehingga dapat meningkat kualitas oleh
pengujian yang kedua dengan menggabungakan pengembang aplikasi atau produk tertentu dari
2 (dua) Algoritma Naive Bayes dan Particle ulasan atau komentar yang diberikan oleh
Swarm Optimization (PSO) dengan nilai yang pengguna aplikasi atau produk.
terbaik dengan accuracy 80.00%. Setelah kita
melihat hasil nilai accuracy pengujian pertama
dan kedua ini kita dapat simpulkan bahwa 5. REFERENSI
pengjuan kedua jauh lebih baik, dimana H. B. Jatmiko, N. T. Kurniadi, D. M. (2022).
Algoritma Naive Bayes akan lebih baik lagi Optimasi Naïve Bayes Dengan Particle
hasilnya jika menggagungan Algoritma Particle Swarm Optimization Untuk Analisis
Swarm Optimization (PSO) sehingga dapat Sentimen Formula E-Jakarta. 2(1), 22–30.
meningkat nilai accuracy. Dengan adanya ulasan Istighfarin, N. F., Rahmastati, R. A., & Nugroho, H.
atau komentar yang disampaikan oleh pengguna (2020). Penerapan Metode Particle
aplikasi atau produk melalui kolum komentar,

IJCIT (Indonesian Journal on Computer and Information Technology)


p-ISSN: 2527-449X | e-ISSN: 2549-7421
Sopian Aji, et.al. Analisis Sentiment Masyarakat Menggunakan… | 126

Swarm Optimization (PSO) Dan Genetic Ramadhani, S. H., & Wahyudin, M. I. (2022).
Algorithm (GA) Pada Sistem Optimasi Analisis Sentimen Terhadap Vaksinasi
Visible Light Communication (VLC) Untuk Astra Zeneca pada Twitter Menggunakan
Menentukan Posisi Robot. Simetris: Jurnal Metode Naïve Bayes dan K-NN. Jurnal JTIK
Teknik Mesin, Elektro Dan Ilmu Komputer, (Jurnal Teknologi Informasi Dan
11(1), 279–286. Komunikasi), 6(4), 526–534.
https://doi.org/10.24176/simet.v11i1.40 https://doi.org/10.35870/jtik.v6i4.530
52 Saprudin, S. (2017). Penerapan Particle Swarm
Keni Hasanah Wiguna. (2021). Film Bukan Hanya Optimization (PSO) untuk Klasifikasi dan
Sekedar Hiburan. Analisis Kredit dengan Menggunakan
Https://Www.Djkn.Kemenkeu.Go.Id/. Algoritma C4.5. Jurnal Informatika
Legiawati, N., Hermanto, T. I., & Ramadhan, Y. R. Universitas Pamulang, 2(4), 214.
(2022). Analisis Sentimen Opini Pengguna https://doi.org/10.32493/informatika.v2i
Twitter Terhadap Perusahaan Jasa 4.1488
Ekspedisi Menggunakan Algoritma Naïve Setiawan, A., Santoso, L. W., & Adipranata, R.
Bayes Berbasis PSO. 9(4), 930–937. (2019). Penerapan Algoritma Particle
https://doi.org/10.30865/jurikom.v9i4.46 Swarm Optimization ( PSO ) untuk
29 Optimisasi Pembangunan Negara dalam
Pramukti, S. D., Nugroho, A., & Sunge, A. S. Turn Based Strategy Game. Jurnal Infra,
(2022). Analisis Sentimen Masyarakat 7(1), 249–255.
Dengan Metode Naïve Bayes dan Particle Sudriyanto, S., Rizaldi, R., & Hariri, M. A. R.
Swarm Optimization. Techno.Com, 21(1), (2021). Implementasi Particle Swarm
61–74. Optimization (PSO) untuk Optimisasi
https://doi.org/10.33633/tc.v21i1.5332 Algoritma Naive Bayes dalam
Prasetyo, V. R., Mercifia, M., Averina, A., Memprediksi Mahasiswa Lulus Tepat
Sunyoto, L., & Budiarjo. (2022). Film Waktu. COREAI: Jurnal Kecerdasan
Rating Prediction on Imdb Website Using Buatan, Komputasi Dan Teknologi
Neural Network. Jurnal Ilmiah NERO, 7(1), Informasi, 2(1), 62–68.
60293. https://www.ejournal.unuja.ac.id/index.p
hp/core/article/view/2181

IJCIT (Indonesian Journal on Computer and Information Technology)


p-ISSN: 2527-449X | e-ISSN: 2549-7421

Anda mungkin juga menyukai