Anda di halaman 1dari 8

DOI: 10.26418/justin.v10i4.

50858
Vol. 10, No. 4, Oktober 2022

p-ISSN : 2460-3562 / e-ISSN : 2620-8989

Analisis Sentimen pada Twitter Berbahasa Indonesia Terhadap


Penurunan Performa Layanan Indihome dan Telkomsel
Addiina Najlaa Nurkalyisaha1, Agung Triayudia2*, Ira Diana Sholihatia3
a
Program Studi Sistem Informasi Fakultas Teknologi Komunikasi dan Informatika
Universitas Nasional, Jl. Sawo Manila, Pejaten Ps. Minggu Jakarta 12520
1addiinanajlaanurkalyisah2018@student.unas.ac.id
2agungtriayudi@civitas.unas.ac.id
3iradiana2803@gmail.com

Abstrak
Opini masyarakat yang dituliskan dalam sebuah jejaring sosial Twitter dapat dimanfaatkan sebagai bahan dalam
proses analisis sentimen yang dapat diklasifikasikan ke dalam sentimen positif dan negatif. Analisis Sentimen
atau Opinion Mining adalah bagian dari studi ilmu Text Mining yang proses utamanya adalah mengambil dataset
mentah dan kemudian mengekstrasi dataset tersebut menjadi sebuah informasi bermanfaat yang bersifat
sentimen terhadap suatu permasalahan objek atau topik apakah cenderung ke dalam kalimat positif, atau
bahkan negatif. Penelitian memanfaatkan jejaring sosial media Twitter dalam prosesnya yang bertujuan untuk
mengklasifikasikan data tweets berbahasa Indonesia menjadi sentimen positif dan negatif. Proses pengambilan
data menggunakan Bahasa Pemrograman Python dengan memanfaatkan library snscrape. Data yang digunakan
dalam penelitian ini dilakukan proses klasifikasi data tweets menggunakan algoritma Naïve Bayes Classifier.
Setelah dilakukan pengujian dengan metode Naïve Bayes Classifier, didapatkan hasil akurasi sebesar 96%,
precision 96%, recall 96%, dan fi-score 95%.
Kata kunci: Analisis Sentimen, Naïve Bayes Classifier, Python, Snscrape, Text Mining, Twitter

Sentiment Analysis on Indonesian-Language Twitter Against the


Decreasing Performance of Indihome and Telkomsel Services
Abstract
The public opinion that is written down in a Twitter social network can be utilized as an ingredient in the
process of sentiment analysis that can be classified into positive and negative sentiments. Sentiment Analysis or
Opinion Mining is part of the study Text Mining science whose primary process is to take raw datasets and then
extract such datasets into useful information that is sentimental to an object problem or topic whether inclined
into a positive sentence or even negative. This research utilizes the social networking of Twitter in its process
aimed at classifying Indonesian-Language tweets data into positive and negative sentiments. The data retrieval
process uses the Python Programming Language by utilizing the snscrape library. The data that used in this
research was done by the process of classification of data tweets using the Naïve Bayes Classifier Algorithm.
After testing by the Naïve Bayes Classifier method, there was an accuracy result of 96%, precision result 96%,
recall result 96%, and Fi-score result 95%.
Keywords: Naïve Bayes Classifier, Python, Sentiment Analysis, Snscrape, Text Mining, Twitter

I. PENDAHULUAN penduduk di Indonesia, sekitar 51,5% diantaranya


menyebutkan kebutuhan dalam menggunakan internet
Evolusi jejaring sosial sebagai alat komunikasi yang
adalah untuk keperluan media sosial [2].
popular saat ini memungkinkan penggunanya untuk
Twitter berdasarkan statistiknya merupakan jejaring
berinteraksi secara global. Berdasarkan pada survey
sosial yang memiliki pertumbuhan yang sangat cepat dan
penetrasi dan perilaku pengguna internet di Indonesia
menjadi aplikasi yang sering dikunjungi sejak
yang diselenggarakan oleh Asosiasi Penyelenggara Jasa
didirikannya pada tahun 2006. Jejaring sosial yang
Internet Indonesia (APJII), memberikan hasil adanya
dibatasi 280 karakter ini (semula 140 karakter) dapat
keberagaman aktifitas yang dilakukan oleh masyarakat
mengirim sekitar 500 juta tweets per harinya [3]. Dengan
Indonesia di Internet dengan salah satu platform yang
tingginya jumlah tweets yang dikirim per harinya melalui
digunakan adalah jejaring sosial Twitter [1]. Pada tahun
Twitter, tweets tersebut mungkin dapat berisi ulasan
2019, terhitung 73,7% dari keseluruhan jumlah populasi
pengguna terhadap sebuah topik yang sedang hangat

Submitted 05-12-2021; Revised 02-08-2022; Accepted 02-08-2022 387


JUSTIN (Jurnal Sistem dan Teknologi Informasi) Vol. 10 , No. 4 , Oktober 2022

dibicarakan, salah satunya adalah topik “Penurunan ini dilakukan oleh Samsir, dkk, pada tahun 2021.
Performa Layanan Indihome dan Telkomsel” yang Penelitian ini menggunakan data tweets yang diambil pada
beberapa saat lalu ramai dibincangkan. November 2020 dengan akurasi nilai 30% untuk kelas
Meskipun banyak masyarakat Indonesia yang positif, 69% untuk kelas negatif, dan 1% untuk kelas
menggunakan dua layanan tersebut, tidak menentukan netral. Tanggapan negatif yang dihasilkan berdasarkan
apakah layanan tersebut selamanya akan memberikan pada ketidakpuasan publik terhadap penerapan
kesan positif terhadap masyarakat. Terlihat dari kejadian pembelajaran daring [12].
per tanggal 19 September 2021, penurunan performa Penelitian sentimen dengan judul “Komparasi
layanan internet indihome dan telkomsel diberbagai Algoritma Klasifikasi Text Mining Untuk Analisis
tempat di Idonesia mengakibatkan para pelanggan Sentimen Pada Review Restoran”. Penelitian ini
memberikan banyak komentar kritik dan keluhan melalui dilakukan oleh Muthia Dinda pada tahun 2018. Penelitian
Twitter kepada Telkom, dimana kedua layanan tersebut ini membandingkan dua algoritma klasifikasi, yaitu
tidak dapat diakses. algoritma Naïve Bayes dengan algoritma Support Vector
Berdasarkan pada tweets yang dikirim tersebut, Machine (SVM) terhadap review restoran. Hasil dari
gambaran opini publik dapat dilihat, dan selanjutnya akan pengujian pada penelitian ini adalah membuktikan bahwa
diekstraksi menjadi sebuah data informasi yang terstruktur algoritma Naïve Bayes Classifier (NBC) lebih unggul dari
untuk mengetehui polaritas dari sebuah opini apakah algoritma Support Vector Machine (SVM) dalam
termasuk ke dalam klasifikasi positif, netral, atau negatif mengklasifikasikan review restoran dengan teks berbahasa
[4][5]. Suatu metode yang dapat digunakan untuk Indonesia. Akurasi dari algoritma Naïve Bayes mencapai
mengubah data tersebut menjadi sebuah data informasi 87% sedangkan algoritma Support Vector Machine (SVM)
yang terstruktur adalah dengan menggunakan metode hanya dapat menghasilkan akurasi sebesar 56% [13].
analisis sentimen yang merupakan bagian dari cabang Penelitian analisis sentimen dengan topik opini
ilmu Text mining. masyarakat terhadap data tweets e-commerce Lazada yang
Text mining merupakan bagian bagian dari studi ilmu dilakukan oleh Dodi Setian dan Iin Seprina pada tahun
data mining yang prosesnya melakukan ekstraksi terhadap 2019. Tujuan dari penelitian ini adalah untuk mengetahui
dataset yang tidak terstruktur menjadi sebuah informasi opini masyarakat di Twitter terhadap layanan Lazada
yang dapat dijadikan sebagai acuan dengan dengan menggunakan Algoritma Naïve Bayes. Hasil
mengidentifikasi dan menemukan pola-pola yang menarik akurasi yang didapat sebesar 98,29% [14].
[6]. Text mining digunakan untuk memecahkan Twitter merupakan salah satu wadah yang dapat
permasalahan informasi dengan menggunakan teknik dari digunakan pada saat melakukan proses analisis sentimen,
data mining, machine learning, Natural Language dimana terdapat banyak sekali data atau dokumen teks
Processing (NLP), Information Retrieval (IR), dan yang dapat dijadikan sebagai bahan dalam melakukan
knowledge management. Text mining melibatkan proses - analisis sentimen [15].
preprocessing, ekstraksi dataset, penyimpanan Berdasarkan pada penjabaran diatas dan penelitian
representasi perantara data, pengelompokkan data seperti terdahulu, maka didapatkan sebuah batasan masalah, yaitu
analisis tren, dan visualisasi hasil [7][8]. bagaimana mengklasifikasikan sebuah sentimen dengan
Analisis sentimen adalah untuk mengetahui polaritas algoritma Naïve Bayes Classifier. Selain itu, ruang
dari sebuah kumpulan sentimen yang dikelompokkan lingkup penelitian ini adalah pengambilan data tweets dari
menjadi positif, netral, dan negatif. Analisis sentimen jarak waktu september 2021 sampai dengan Oktober 2021.
dilakukan dengan menggunakan teknik Natural Language
Processing (NLP) [9]. II. METODOLOGI PENELITIAN
Analisis sentimen saat ini dijadikan sebagai salah satu
A. Diagram Alur Penelitian
topik yang digunakan oleh banyak peneliti dengan tujuan
untuk memberikan sebuah informasi dari dataset yang Secara garis besar penelitian ini akan berdasarkan pada
tidak terstruktur [10]. Seperti pada penelitian yang proses konfigurasi metode analisis sentimen dengan
dilakukan oleh Sudiantoro Adhi pada tahun 2018 pada tahapan yang dapat dilihat pada Gambar 1.
objek opini masyarakat Indonesia terhadap pilkada Jawa Tahapan analisis sentimen yang terdiri dari tahapan
Barat. Tujuan dilakukannya penelitian tersebut adalah crawling data, text preprocessing, distribusi data yang
untuk mengklasifikasikan opini masyarakat terhadap dibagi menjadi data latih dan data uji, pemodelan data
pilkada Jawa Barat dengan algoritma Naïve Bayes dengan metode klasifikasi, dan evaluasi.
Classifier. Dataset yang digunakan dalam penelitian ini
yaitu, 300 total data tweets dan kemudian data tersebut
dibagi dengan keterangan total data latih sebesar 200 data,
dan data uji sebesar 100 data. Hasil akurasi dari pengujian
dengan algoritma Naïve Bayes Classifier adalah sebesar
84% dan cukup berhasil memprediksi kategori sentimen
positif dan negatif [11].
Penelitian lainnya dengan judul “Analisis Sentimen
Pembelajaran Daring Pada Twitter di Masa Pandemi
Covid-19 Menggunakan Metode Naïve Bayes”. Penelitian

Korespondensi : Agung Triayudi 388


JUSTIN (Jurnal Sistem dan Teknologi Informasi) Vol. 10 , No. 4 , Oktober 2022

D. Pembobotan Kata
mulai Penelitian ini menerapkan algoritma TF-IDF (Term
Frequency-Inverse Document Frequency) yang digunakan
untuk menghitung bobot kata dengan memberikan bobot
Crawling data pada sebuah kata (term) dari suatu dokumen (tweets).
Algoritma TF-IDF digunakan untuk memberikan evaluasi
seberapa pentingnya kata di dalam sebuah dokumen [17].
Dataset mentah Adapun rumus algoritma TF-IDF dituliskan sebagai
berikut:

𝐷𝐷
𝑊𝑊𝑖𝑖𝑖𝑖 = 𝑡𝑡𝑡𝑡𝑖𝑖𝑖𝑖 + �log � (1)
𝑑𝑑𝑑𝑑𝑖𝑖
Preprocessing
Keterangan:
Membagi data 𝑊𝑊𝑖𝑖𝑖𝑖 = bobot kata pada dokumen/tweets
𝑡𝑡𝑡𝑡𝑖𝑖𝑖𝑖 = jumlah kemunculan kata
dalam dokumen/tweets
D = jumlah dokumen tweets
Data uji 𝑑𝑑𝑓𝑓𝑓𝑓 = kemunculan kata dari D
Data latih
E. Algoritma Naïve Bayes
Naïve Bayes Classifier adalah metode klasifikasi yang
paling sering digunakan dalam penelitian yang berkaitan
dengan analisis sentimen. Naïve Bayes Classifier
Pemodelan
melakukan penggolongan kata dan dokumen berdasarkan
pada probabilitas dan dapat digunakan sebagai hipotesis
bahwa tidak ada ketergantungan antara satu kelas dengan
evaluasi
kelas lainnya [18].

𝑃𝑃(𝑥𝑥 |𝑐𝑐 )𝑃𝑃(𝑐𝑐)


𝑃𝑃(𝐶𝐶|𝑋𝑋) = (2)
Hasil klasifikasi 𝑃𝑃(𝑥𝑥)

Persamaan (2) menunjukkan C adalah data hipotesis dari


kelas tertentu, X menunjukkan data kelas yang belum
selesai diketahui, 𝑃𝑃(𝐶𝐶|𝑋𝑋) menunjukkan probabilitas hipotesis
berdasarkan pada kondisi (posteriori probability), 𝑃𝑃(𝑐𝑐)
Gambar 1. Diagram alur proses tahapan analisis sentimen menunjukkan probabilitas (prior probability), 𝑃𝑃(𝑥𝑥|𝑐𝑐)
menunjukkan probabilitas berdasarkan kondisi dalam
B. Pengumpulan Data hipotetsis, dan 𝑃𝑃(𝑥𝑥)menunjukkan probabilitas 𝑐𝑐.
Pada tahapan ini dilakukan proses crawling data Nilai pembuktian selalu tetap untuk setiap kelas dalam
dengan mendapatkan data tweets menggunakan library satu sampel. Nilai dari posterior akan dibandingkan
Snscrape pada Bahasa Pemrograman Python. Data yang dengan nilai-nilai posterior dari kelas lain untuk
diambil merupakan sekumpulan data tweets yang menentukan di kelas manakah suatu sampel dapat
didasarkan pada kata kunci yang menyebutkan kata diklasifikasikan. Persamaan (1) diatas dapat dijabarkan
Indihome dan Telkomsel. Dataset tweets mentah lebih lanjut menjadi persamaan berikut:
kemudian disimpan dalam format json yang kemudian
dikonversi ke dalam format CSV (Comma Separated 𝑝𝑝�𝑋𝑋1, 𝑋𝑋2, … 𝑋𝑋𝑋𝑋�𝐶𝐶 �𝑝𝑝(𝐶𝐶)
P(C|X1, X2,…Xn) = =
Values) untuk dilanjutkan pada proses selanjutnya. 𝑃𝑃(𝑋𝑋1,𝑋𝑋2,…𝑋𝑋𝑋𝑋)
𝑃𝑃�𝑋𝑋1�𝐶𝐶 �𝑝𝑝�𝑋𝑋2�𝐶𝐶 �…𝑝𝑝�𝑋𝑋𝑋𝑋�𝐶𝐶 �𝑝𝑝(𝐶𝐶)
C. Text Preprocessing (3)
𝑃𝑃(𝑋𝑋1,𝑋𝑋2,…𝑋𝑋𝑋𝑋)
Setelah melakukan pengambilan data, langkah
selanjutnya adalah melakukan preprocessing.
Preprocessing digunakan untuk menghasilkan satu set Dimana P(C|X1, X2,…Xn) adalah hasil perhitungan
fitur yang relevan dari teks dokumen [16]. Tahapan dari keseluruhan probabilitas posterior pada nilai X untuk
preprocessing terdiri dari tahapan case folding, cleaning, semua dinilai C, sehingga algoritma Naïve Bayes dapat
stemming, stopword removal, dan tokenization. membuat prediksi berdasarkan probabilitas maksimum.

Korespondensi : Agung Triayudi 389


JUSTIN (Jurnal Sistem dan Teknologi Informasi) Vol. 10 , No. 4 , Oktober 2022

F. Evaluasi B. Text Preprocessing


Tahap evaluasi dilakukan untuk memastikan hasil Setelah dilakukannya proses crawling data dari Twitter,
akurasi dari pemodelan terhadap data latih. Evaluasi tahapan selanjutnya adalah dilakukannya proses
diterapkan dalam bentuk confusion matrix untuk Preprocessing. Proses ini dilakukan karena dataset yang
mendapatkan hasil dari perhitungan accuracy, precision, didapat masih dalam bentuk yang tidak terstrukur. Tujuan
recall, dan fi-score. dilakukannya Preprocessing adalah untuk menghilangkan
noise dalam sebuah data sehingga dapat dibaca oleh
III. HASIL DAN PEMBAHASAN sistem dan dapat dihitung oleh algoritma. Berikut
beberapa tahapan dalam proses Preprocessing:
A. Pengambilan Data
• Case folding adalah proses mengubah kata yang
Data yang diambil dalam penelitian ini didapatkan dari mengandung huruf uppercase dan lowercase ke
media sosial Twitter dengan proses awal crawling data dalam lowercase semua.
menggunakan dua kata kunci, yaitu “Indihome” dan
• Tokenisasi adalah proses untuk menghilangkan
“Telkomsel” pada tweets berbahasa Indonesia. Proses atribut-atribut yang tidak penting dalam sebuah kata
pengambilan data dilakukan dengan menggunakan library seperti tanda baca, hashtag, RT, dan username.
snscrape untuk pengambilan data tweets lama. Periode
• Stopword removal adalah proses menghapus kata
pengumpulan data diambil dari jarak waktu 21 September
sambung, seperti “di”, “ke”, “yang”, “dan”
2021 sampai 2 Oktober 2021. Proses crawling data
• Stemming adalah proses mengubah sebuah kata
menghasilkan sekitar 1351 data mentah dari 2000 limit
menjadi kata dasar
data. Berikut proses pengambilan data yang ditampilkan
Hasil dari proses Text Preprocessing tersebut
pada Gambar 1.
ditampilkan pada Tabel 2 dibawah ini. Setelah melakukan
proses Text Preprocessing didapatkan dataset yang sudah
terstruktur sebanyak 1305 data yang sudah dilabeli dari
1351 data, dengan keterangan 1249 data tweets negatif,
dan 56 data tweets positif.
TABEL II
HASIL DATA PREPROCESSING

Kata Kunci Indihome dan Telkomsel


Gambar 2. Proses pengambilan data dengan snscrape
Mohon penjelasannya
@indihome @TelkomCare
Gambar 2 menunjukkan proses crawling data dengan @Telkomsel. Belakangan layanan
menggunakan library snscrape yang disimpan ke dalam kayak github, stack overflow,
format json, kemudian file json tersebut dikonversi ke quora berasa di-throttling. Akses
Sebelum
dalam format CSV. internet lainnya lancar, Cuma ke
web & layanan tertentu sering
TABEL I
DATA CRAWLING timed out. Ini pelanggaran hak
konsumen, merugikan usaha juga!
Username Teks https://t.co/cbLmUfTBs4
Mohon penjelasannya @indihome mohon penjelasan layanan
@TelkomCare @Telkomsel. Belakangan github stack overflow quora akses
layanan kayak github, stack overflow, quora Sesudah internet lain lancar web layanan
berasa di-throttling. Akses internet lainnya tentu ini langgar hak konsumen
@rednesia
lancar, Cuma ke web & layanan tertentu sering rugi usaha
timed out. Ini pelanggaran hak konsumen,
merugikan usaha juga!
https://t.co/cbLmUfTBs4
Tabel diatas memperlihatkan perbedaan antara data
Provider indihome dan telkomsel sungguh tweets sebelum dan sesudah dilakukannya proses
@gargiov Preprocessing.
menguji kesabaran
Telkom terus berupaya memperbaiki
C. Vektorisasi
permasalahan yang mempengaruhi layanan
@detikcom Setelah kata hasil dari Preprocessing dikumpulkan
IndiHome dan Telkomsel. Titik persoalan
gegara kabel… selanjutnya akan dilakukan pembobotan kata dengan
@Telkomsel Gak bisa jadi juara, jaringan algoritma TF-IDF. Manfaat dari proses pembobotan kata
@cybersatun
internet indihome dan telkomsel lemot parah ini adalah untuk memberikan bobot nilai pada kata dalam
dokumen sehingga dapat diolah pada proses klasifikasi [2].
Tabel diatas berisikan contoh tweets yang didapatkan dari Proses pembobotan kata dilakukan dengan menggunakan
hasil crawling data pada Twitter. Tweets yang masih perhitungan berdasarkan pada rumus (1). Dibawah ini
berisikan atribut yang nantinya akan dibersihkan pada adalah hasil perhitungan TF-IDF untuk 4 sampel dokumen
proses preprocessning. yang ditampilkan pada Tabel 3.

Korespondensi : Agung Triayudi 390


JUSTIN (Jurnal Sistem dan Teknologi Informasi) Vol. 10 , No. 4 , Oktober 2022

Sampel dokumen yang dipakai positif maka Term berada pada kelas positif, begitupun
Input Teks: sebaliknya.
D1 = “spotify kalau pakai telkomsel sudah normal”
D2 = “bahagia kabar layanan indihome telkomsel Keterangan:
sudah normal” nPositif =9
D3 = “lebih baik tidak pakai layanan bumn ini” nNegatif =8
D4 = “buka dana lemot pakai koneksi indihome” Jumlah = 13 kata

Output : (𝑛𝑛𝑛𝑛�
𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝
�)+1
𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛
𝑃𝑃(𝑤𝑤|𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃|𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁) =
TABEL III �𝑛𝑛. 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 �𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛 �+|𝑇𝑇|
VEKTORISASI SAMPEL DATA (4)
TF-IDF
Term
D1 D2 D3 D4 Probabilitas Prior
bahagia 0 0.47 0 0 a. Kata bahagia
buka 0 0 0 0.44
1+1
bumn 0 0 0.70 0 P(bahagia|Positif) = = 0,09
dana 0 0 0 0.44 9+13
indihome 0 0.37 0 0.35 0+1
kabar 0 0.47 0 0 P(bahagia|Negatif) = = 0,047
koneksi 0 0 0 0.44 8+13
layanan 0 0.37 0.55 0 b. Kata buka
lemot 0 0 0 0.44
normal 0.48 0.37 0 0
0+1
P(buka|Positif) = = 0,045
pakai 0.39 0 0.44 0.28 9+13
spotify 0.61 0 0 0 1+1
telkomsel 0.48 0.37 0 0 P(buka|Negatif) = = 0,095
8+13
Tabel diatas berisikan hasil perhitungan TF-IDF dari c. Kata bumn
empat sampel dokumen tweets terhadap 13 Term yang 0+1
terdapat di setiap dokumen. P(bumn|Positif) = = 0,045
9+13
D. Proses Klasifikasi Naïve Bayes 1+1
P(bumn|Negatif) = = 0,095
Proses klasifikasi dilakukan pada data latih untuk 8+13
membuat model. Sebelum melakukan proses klasifikasi, d. Kata dana
terlebih dahulu melakukan pembagian data dengan 0+1
membagi data menjadi 80% data latih (1044 tweets) dan P(dana|Positif) = = 0,045
20% data uji (261 tweets). 9+13
Pada tahapan klasifikasi dengan metode Naïve Bayes, 1+1
P(dana|Negatif) = = 0,095
perhitungan probabilitas kata dilakukan terhadap Term 8+13
pada setiap dokumen tweets. Term yang digunakan e. Kata indihome
terdapat pada Tabel 3. Proses perhitungan persamaan 1+1
dapat dilihat pada Tabel 4. P(indihome|Positif) = = 0,09
9+13
TABEL IV 1+1
KEMUNCULAN TERM PADA SETIAP KELAS P(indihome|Negatif) = = 0,095
8+13
Term Positif Negatif
bahagia 1 0
f. Kata kabar
buka 0 1 1+1
bumn 0 1 P(kabar|Positif) = = 0,09
dana 0 1
9+13
indihome 1 1 0+1
kabar 1 0 P(kabar|Negatif) = = 0,047
8+13
koneksi 0 1
layanan 1 1 g. Kata koneksi
lemot 0 1 0+1
normal 2 0 P(koneksi|Positif) = = 0,045
pakai 1 1 9+13
spotify 1 0 1+1
telkomsel 1 0 P(koneksi|Negatif) = = 0,095
9 8
8+13

Pemberian nilai Term berdasarkan pada kemunculan


Term di dalam dokumen tweets. Jika dokumen bernilai

Korespondensi : Agung Triayudi 391


JUSTIN (Jurnal Sistem dan Teknologi Informasi) Vol. 10 , No. 4 , Oktober 2022

h. Kata layanan
1+1 Perhitungan dilakukan pada data uji:
P(layanan|Positif) = = 0,09 D4 = “buka dana lemot pakai koneksi indihome”.
9+13
1+1
P(layanan|Negatif) = = 0,09 Perhitungan dilakukan dengan menghitung nilai
8+13 probabilitas tertinggi dari masing – masing kelas.
i. Kata lemot
0+1 𝑷𝑷(𝒑𝒑𝒑𝒑𝒑𝒑𝒑𝒑𝒑𝒑𝒑𝒑𝒑𝒑|𝑫𝑫𝑫𝑫) = 𝑃𝑃(𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝) × 𝑃𝑃(𝑏𝑏𝑏𝑏𝑏𝑏𝑏𝑏|𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝) ×
P(lemot|Positif) = = 0,045 𝑃𝑃(𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑|𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝) × 𝑃𝑃(𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖ℎ𝑜𝑜𝑜𝑜𝑜𝑜|𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝) ×
9+13
𝑃𝑃(𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙|𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝) × 𝑃𝑃(𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝|𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝)
1+1
P(lemot|Negatif) = = 0,095
8+13 = 0,5 × 0,045 × 0,045 × 0,09 × 0,045 × 0,09
j. Kata normal = 0,0000003691
2+1
P(normal|Positif) = = 0,136 𝑷𝑷(𝒏𝒏𝒏𝒏𝒏𝒏𝒏𝒏𝒏𝒏𝒏𝒏𝒏𝒏|𝑫𝑫𝑫𝑫) = 𝑃𝑃(𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛) × 𝑃𝑃(𝑏𝑏𝑏𝑏𝑏𝑏𝑏𝑏|𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛) ×
9+13
𝑃𝑃(𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑|𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛) × 𝑃𝑃(𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖ℎ𝑜𝑜𝑚𝑚𝑚𝑚|𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛) ×
0+1
P(normal|Negatif) = = 0,047 𝑃𝑃(𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙|𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛) × 𝑃𝑃(𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝|𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛)
8+13
k. Kata pakai = 0,5 × 0,095 × 0,095 × 0,09 × 0,095 × 0,095
1+1 = 0,0000036653
P(pakai|Positif) = = 0,09
9+13 TABEL V
1+1 HASIL NILAI PROBABILITAS
P(pakai|Negatif) = = 0,095 Probabilitas Positif 0,0000003691
8+13
Probabilitas Negatif 0,0000036653
l. Kata Spotify
1+1 Berdasarkan pada perhitungan probabilitas yang
P(spotify|Positif) = = 0,09
9+13 dilakukan pada sampel data uji, dapat dilihat kelas negatif
0+1 memiliki nilai probabilitas yang tinggi. Sehingga dapat
P(spotify|Negatif) = = 0,047 disimpulkan bahwa sampel data uji tersebut berada pada
8+13
kelas negatif.
m. Kata telkomsel
1+1 E. Evaluasi
P(telkomsel|Positif) = = 0,09
9+13 Setelah dilakukan pemodelan menggunakan metode
0+1 Naïve Bayes, selanjutnya melakukan pengujian data uji
P(telkomsel|Negatif) = = 0,047 dengan jumlah data 261 tweets (250 negatif dan 11
8+13 positif).
Berdasarkan data uji tersebut, hasil evaluasi terhadap
Probabilitas Posterior
data uji digambarkan dalam Confusion Matrix pada Tabel
Setelah melakukan perhitungan terhadap probabilitas
5 di bawah ini
Term, kemudian akan dilakukan perhitungan probabilitas
terhadap sampel dokumen. TABEL VI
Perhitungan probabilitas dokumen tweets dimana CONFUSION MATRIX
terdapat 2 data latih dengan sentiment positif dan negatif, Prediksi Prediksi
Jumlah
sehingga perhitungannya: Negatif Positif
True
250 0 250
𝑥𝑥(
𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝
) Negatif
𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃𝑃 𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛
𝑃𝑃( ) = (5) True
𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁 |𝐶𝐶| 10 1 11
Positif
Jumlah 260 1 261
1
P(Positif) = = 0,5
2 Pada tabel 5 digambarkan ada sekitar 260 data yang
diprediksi negatif dan 1 data yang diprediksi positif.
1 Namun dari 260 data yang diprediksi negatif, terdapat
P(Negatif) = = 0,5 kesalahan yang dimana seharusnya 10 data berada pada
2
kelas positif.
Untuk mendapatkan nilai probabilitas tertinggi, maka Berdasarkan pada confusion matrix tersebut,
dilakukan perhitungan dengan rumus : didapatkan nilai akurasi sebesar 96%. nilai precision
sebesar 96%, nilai recall sebesar 96%, dan nilai fi-score
𝑃𝑃 �
𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝
�𝑑𝑑� = 𝑃𝑃 �
𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝
� × 𝜋𝜋𝜋𝜋(𝑤𝑤|𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝|𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛) sebesar 95%.
𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛 𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛
(6)

Korespondensi : Agung Triayudi 392


JUSTIN (Jurnal Sistem dan Teknologi Informasi) Vol. 10 , No. 4 , Oktober 2022

Berdasarkan pada hasil penelitian dan pembahasan


yang telah dilakukan, maka dapat disimpulkan analisis
sentimen terhadap penurunan performa layanan Indihome
dan Telkomsel yang didasarkan pada objek data Twitter
dengan algoritma Naïve Bayes yang dijelaskan dengan
poin sebagai berikut:
1) Hasil sentimen terhadap penurunan performa layanan
Indihome dan Telkomsel berdasarkan data tweets,
didapatkan hasil klasifikasi 1044 untuk kelas negatif, dan
56 untuk kelas positif. Berdasarkan hasil tersebut, dapat
disimpulkan bahwa tingkat kekecewaan masyarakat
terhadap penurunan pelayanan cukup tinggi.
Gambar 3. Hasil perhitungan 2) Hasil perhitungan sentimen dengan metode klasifikasi
Naïve Bayes berdasarkan pada Confusion Matrix,
F. Perancangan Aplikasi menghasilkan tingkat nilai akurasi sebesar 96%, nilai
Desain aplikasi dibuat dengan menggunakan bootsrap precision sebesar 96%, nilai recall sebesar 96%, dan nilai
db Admin. Aplikasi analisis sentimen ini mengambil fi-score sebesar 95%.
langsung data tweets secara real time dengan 3) Besarnya nilai akurasi didapatkan dari proses
menghubungkan API Twitter dengan sistem. Untuk Preprocessing yang maksimal.
tampilan aplikasi dapat dilihat sebagai berikut.
4) Berdasarkan hasil dan pembahasan, terlihat bahwa
metode Naïve Bayes dapat diterapkan untuk menganalisis
sentimen data Twitter Berbahasa Indonesia.

DAFTAR PUSTAKA
[1] E. Mas’udah, E. D. Wahyuni, and A. A. Arifiyanti, “Analisis
Sentimen: Pemindahan Ibu Kota Indonesia Pada Twitter,” J.
Inform. dan Sist. Inf., vol. 1, no. 2, pp. 397–401, 2020.
[2] Asosiasi Penyelenggara Jasa Internet Indonesia, “Laporan
Survei Internet APJII 2019 – 2020,” Asos. Penyelenggara Jasa
Internet Indones., vol. 2020, pp. 1–146, 2020, [Online].
Available: https://apjii.or.id/survei.
[3] J. Winahyu and I. Suharjo, “Aplikasi Web Analisis Sentimen
Dengan Algoritma Multinomial Naïve Bayes,” vol. 10, pp.
Gambar 4. Crawling data tweets secara real time
206–214, 2021.
[4] D. Darwis, N. Siskawati, and Z. Abidin, “Penerapan Algoritma
Crawling data tweets dilakukan secara real time dengan Naive Bayes untuk Analisis Sentimen Review Data Twitter
menggunakan API Twitter. API Twitter yang terhubung BMKG Nasional,” J. Tekno Kompak, vol. 15, no. 1, pp. 131–
145, 2021.
dengan sistem memungkinkan aplikasi untuk mengambil [5] A. Wandani, F. Fauziah, and A. Andrianingsih, “Sentimen
data secara langsung dan melakukan pencarian sesuai Analisis Pengguna Twitter pada Event Flash Sale
dengan kata kunci yang ditulis, dan data yang diambil Menggunakan Algoritma K-NN, Random Forest, dan Naive
akan disimpan ke dalam database. Bayes,” J-SAKTI (Jurnal Sains Komput. dan Inform., vol. 5, no.
2, pp. 651–665, 2021.
[6] A. Poornima and K. S. Priya, “A Comparative Sentiment
Analysis of Sentence Embedding Using Machine Learning
Techniques,” 2020 6th Int. Conf. Adv. Comput. Commun. Syst.
ICACCS 2020, pp. 493–496, 2020, doi:
10.1109/ICACCS48705.2020.9074312.
[7] R. Feldman and J. Sanger, The Text Mining Handbook.
Cambridge University Press, 2006.
[8] K. Kowsari, K. J. Meimandi, M. Heidarysafa, S. Mendu, L.
Barnes, and D. Brown, “Text classification algorithms: A
survey,” Inf., vol. 10, no. 4, pp. 1–68, 2019, doi:
10.3390/info10040150.
[9] A. Triayudi, “Convolutional Neural Network For Test
Classification On Twitter,” J. Softw. Eng. Intellident Syst., vol.
Gambar 5. Klasifikasi sentimen 4, no. 3, pp. 123–131, 2019.
[10] R. Tineges, A. Triayudi, and I. D. Sholihati, “Analisis
Menu klasifikasi melakukan klasifikasi berdasarkan kata Sentimen Terhadap Layanan Indihome Berdasarkan Twitter
kunci dan data yang sebelumnya sudah dimasukkan ke Dengan Metode Klasifikasi Support Vector Machine (SVM),”
J. Media Inform. Budidarma, vol. 4, no. 3, p. 650, 2020, doi:
dalam database. Hasil klasifikasi ditampilkan dengan 10.30865/mib.v4i3.2181.
menggunakan visualisasi diagram. [11] A. V. Sudiantoro et al., “Analisis Sentimen Twitter
Menggunakan Text Mining Dengan,” vol. 10, no. 2, pp. 398–
401, 2018.
[12] Samsir, Ambiyar, U. Verawardina, F. Edi, and R. Watrianthos,
IV. KESIMPULAN “Analisis Sentimen Pembelajaran Daring Pada Twitter di Masa

Korespondensi : Agung Triayudi 393


JUSTIN (Jurnal Sistem dan Teknologi Informasi) Vol. 10 , No. 4 , Oktober 2022

Pandemi COVID-19 Menggunakan Metode Naïve Bayes,” J.


Media Inform. Budidarma, vol. 5, pp. 157–163, 2021, doi:
10.30865/mib.v5i1.2604.
[13] D. A. Muthia, “Komparasi Algoritma Klasifikasi Text Mining
Untuk Analisis Sentimen Pada Review Restoran,” J. PILAR
Nusa Mandiri, vol. 14, no. 1, pp. 69–74, 2018.
[14] D. Setian and I. Seprina, “Analisis Sentimen Masyarakat
Terhadap Data Tweets Lazada Menggunakan Text Mining Dan
Algoritma Naive Bayes,” Bina Darma Conf. Comput. Sci., pp.
998–1004, 2019.
[15] J. A. Septian, T. M. Fahrudin, and A. Nugroho, “Journal of
Intelligent Systems and Computation 43,” pp. 43–49, 2019,
[Online]. Available: https://t.co/9WloaWpfD5.
[16] L. A. Andika, P. A. N. Azizah, and R. Respatiwulan, “Analisis
Sentimen Masyarakat terhadap Hasil Quick Count Pemilihan
Presiden Indonesia 2019 pada Media Sosial Twitter
Menggunakan Metode Naive Bayes Classifier,” Indones. J.
Appl. Stat., vol. 2, no. 1, p. 34, 2019, doi:
10.13057/ijas.v2i1.29998.
[17] S. Fransiska and A. Irham Gufroni, “Sentiment Analysis
Provider by.U on Google Play Store Reviews with TF-IDF and
Support Vector Machine (SVM) Method,” Sci. J. Informatics,
vol. 7, no. 2, pp. 2407–7658, 2020, [Online]. Available:
http://journal.unnes.ac.id/nju/index.php/sji.
[18] M. Wongkar and A. Angdresey, “Sentiment Analysis Using
Naive Bayes Algorithm Of The Data Crawler: Twitter,” Proc.
2019 4th Int. Conf. Informatics Comput. ICIC 2019, pp. 1–5,
2019, doi: 10.1109/ICIC47613.2019.8985884.

Korespondensi : Agung Triayudi 394

Anda mungkin juga menyukai