Anda di halaman 1dari 7

Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-ISSN: 2548-964X

Vol. 5, No. 11, November 2021, hlm. 5068-5074 http://j-ptiik.ub.ac.id

Analisis Sentimen Twitter menggunakan Metode Naive Bayes dengan


Relevance Frequency Feature Selection (Studi Kasus: Opini Masyarakat
mengenai Kebijakan New Normal)
Kresentia Verena Septiana Toy1, Yuita Arum Sari2, Imam Cholissodin3

Program Studi Teknik Informatika, Fakultas Ilmu Komputer, Universitas Brawijaya


Email: 1verenakresentia@gmail.com, 2yuita@ub.ac.id, 3imamcs@ub.ac.id

Abstrak
COVID-19 pertama kali muncul di Wuhan, Cina dan menyebar ke seluruh dunia. Penyebaran virus
tersebut terjadi sangat cepat, termasuk di negara Indonesia. Pemerintah Indonesia berupaya menerapkan
kebijakan-kebijakan untuk menekan angka kenaikan kasus COVID-19. Kebijakan yang diterapkan
menimbulkan dampak baru pada masyarakat, contohnya penyempitan lapangan pekerjaan, pemutusan
hubungan kerja dan dampak lain yang berpengaruh terhadap perekonomian negara. Oleh karena itu,
Pemerintah menerapkan kebijakan baru yang disebut New Normal. New Normal menjadi topik
perbincangan yang menimbulkan pro kontra di kalangan masyarakat pada media sosial Twitter. Melalui
opini masyarakat tersebut, pemerintah dapat mengetahui bagaimana pendapat masyarakat terkait
kebijakan New Normal di Indonesia. Opini masyarakat tersebut dapat diklasifikasikan menjadi opini
positif, negatif dan netral sehingga memerlukan analisis sentimen. Proses analisis sentimen terdiri dari
pre-processing untuk pemrosesan opini, Relevance Frequency Feature Selection untuk mengurangi
jumlah fitur, dan klasifikasi menggunakan metode Naive Bayes. Dataset yang digunakan adalah 300
data opini masyarakat, dengan pembagian data menggunakan k-fold cross validation dengan k=5. Hasil
dari pengujian sebanyak 5 pengujian menggunakan klasifikasi Naive Bayes, diperoleh rata-rata akurasi
sebesar 62,6%, sementara hasil pengujian akurasi klasifikasi dengan penambahan RFFS diperoleh rata-
rata akurasi sebesar 65,3%.
Kata kunci: analisis sentimen, new normal, naive bayes, seleksi fitur, relevance frequency feature selection, k-
fold cross validation.
Abstract
COVID-19 first appeared in wuhan, China and spread around the world. The virus spread very rapidly,
including in Indonesia. The Indonesian government seeks to implement policies to suppress the COVID-
19 case increase. Implemented policies have a new impact on communities, such as job downsizing,
layoffs of work relationships and other effects on the country's economy. Consequently, the government
adopted a new policy called new normal. New normal has become a topic of debate among the public
on twitter's social media. Public opinion can be classified into positive, negative, and neutral opinions
and require analytic sentiments. The sentiment analysis process is based on pre-processing for opinion
processing, Relevance Frequency Feature Selection to reduce the number of features, and the
classification using Naive Bayes methods. The dataset is 300 public opinion data, with the distribution
of data using k-fold validation in k=5. The results of 5 tests using Naive Bayes classification, obtained
an average accuracy of 62,6%, while the results of classification accuracy tests with the addition of
Relevance Frequency Feature Selection obtained an average accuracy of 65,3%.
Keywords: sentiment analysis, new normal, naive bayes, feature selection, relevance frequency feature selection,
k-fold cross validation.

akut yang menginfeksi dan menular, dan dikenal


1. PENDAHULUAN dengan coronavirus 2 (SARS-CoV-2), yang
Coronavirus disease 2019 (COVID-19) berasal dari Wuhan, Cina dan menyebar ke
merupakan suatu virus oleh sindrom pernafasan seluruh penjuru dunia (Shereen et al., 2020).

Fakultas Ilmu Komputer


Universitas Brawijaya 5068
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer 5069

Penyebaran virus terjadi sangat cepat, termasuk menggunakan metode klasifikasi Naive Bayes
di negara Indonesia. Jumlah kasus yang semakin telah banyak dilakukan, diantaranya adalah
meningkat membuat pemerintah mengambil penelitian mengenai pengimplementasian
keputusan untuk mengeluarkan kebijakan baru metode Naive Bayes dan K-Means mengenai
dalam mengatasi permasalahan yang ada. analisis sentimen pada pemilihan calon presiden
Pemerintah menerapkan kebijakan baru New tahun 2019 (Kurniawan & Susanto, 2019) untuk
Normal (Normal Baru). Hidup normal baru mengetahui opini dari masyarakat terhadap
merupakan suatu kehidupan manusia yang selalu calon presiden pada pemilihan presiden 2019.
diperhadapkan dengan adanya ancaman dari Dari hasil penelitian tersebut, didapatkan hasil
Covid-19 (Muhyiddin, 2020). Pemberlakuan akurasi menggunakan metode klasifikasi Naive
kebijakan tersebut, menimbulkan banyak opini Bayes sebesar 93,35%.
terjadi di masyarakat. Dari hasil survei oleh Indo Penelitian lainnya yang dilakukan oleh
Barometer yang diberitakan melalui medcom.id Ahmad Wildan Attabi (2018) mengenai analisis
dikatakan sebanyak 83,1% masyarakat sentimen untuk menilai suatu produk dengan
mendukung kebijakan New Normal, sementara menggunakan metode Naive Bayes dan
11,2% sisanya tidak demikian. Information Gain sebagai seleksi fiturnya.
Media sosial menjadi wadah masyarakat Penelitian ini bertujuan untuk mengatasi
untuk berkomunikasi dan menyampaikan opini. permasalahan yang terjadi pada produk
Media sosial yang saat ini digunakan oleh kecantikan Mustika Ratu agar dapat mengetahui
kebanyakan masyarakat Indonesia adalah minat pasar, untuk melakukan kajian lebih pada
Twitter (Sabily et al., 2019). Twitter merupakan suatu produk serta menganalisis peningkatan
sosial media yang banyak digemari citra serta pendapatan perusahaan produk
penggunanya dalam menyuarakan aspirasi kecantikan tersebut. Data dalam penelitian
mereka berupa tweet atau cuitan (Fitriyyah et al., menggunakan data tweet sebanyak 200 data
2019). New Normal menjadi salah satu topik yang diperoleh dari twitter mengenai produk
yang dibicarakan oleh masyarakat pada sosial kecantikan dari Mustika Ratu. Ulasan tersebut
media Twitter. Melalui opini masyarakat pada dibagi menjadi ulasan positif dan negatif. Hasil
Twitter tersebut, pemerintah dapat mengetahui akurasi menunjukkan, dengan menggunakan
bagaimana pendapat masyarakat terkait metode Naive Bayes, didapatkan hasil akurasi
diterapkannya kebijakan New Normal di sebesar 70%.
Indonesia. Seleksi fitur berguna untuk melakukan
Banyaknya Tweet yang ada, membutuhkan penghapusan fitur yang tidak dibutuhkan pada
waktu yang tidak singkat untuk melakukan metode klasifikasi (Ling et al., 2014). Banyak
proses klasifikasi. Maka dari itu dibutuhkan metode-metode seleksi fitur yang biasa
penggunaan sebuah metode untuk melakukan digunakan agar proses klasifikasi menjadi lebih
proses klasifikasi data Twitter tersebut agar optimal. Pada penelitian yang dilakukan oleh
dapat di analisis dengan mengelompokkannya (Kilic & Sahin, 2019) sebelumnya yang
pada suatu kelas. Analisis sentimen adalah mengenai dua metode seleksi fitur baru untuk
bidang penelitian lanjutan yang ada diantara klasifikasi teks, salah satunya yaitu Relevance
beberapa bidang yaitu Natural Language Frequency Feature Selection, dijelaskan bahwa
Processing (NLP), Data Mining dan Machine metode seleksi fitur tersebut memberikan hasil
Learning yang berfokus pada proses akurasi yang lebih baik daripada seleksi fitur
pengekstraksian suatu sentimen di dalam kalimat Chi-Square pada saat jumlah fiturnya sebesar
berdasarkan isinya (Al-Ayyoub et al., 2018). Di 100, 200, dan 300 fitur.
mana dengan dilakukannya analisis sentimen, Berdasarkan penjabaran di atas, dilakukan
didapatkan hasil kelas klasifikasi dari dokumen penelitian dengan judul “Analisis Sentimen
yang digunakan. Pengelompokan dokumen Twitter Menggunakan Metode Naive Bayes
tersebut dapat dilakukan dengan menggunakan Dengan Relevance Frequency Feature Selection
metode klasifikasi, pada penelitian ini digunakan (Studi Kasus: Opini Masyarakat Mengenai
metode klasifikasi Naive Bayes. Metode Naive Kebijakan New Normal)”. Dengan dilakukannya
Bayes sering digunakan oleh para peneliti karena penelitian ini, diharapkan dapat memberikan
dianggap cukup efektif dalam mendapatkan hasil hasil klasifikasi kelas terhadap opini masyarakat
yang tepat dengan akurasi yang tinggi terkait new normal dengan kelas negatif, positif
(Kusumadewi, 2009). maupun netral sebagai kategorinya.
Penelitian terkait analisis sentimen dengan

Fakultas Ilmu Komputer, Universitas Brawijaya


Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer 5070

2. DASAR TEORI data yang tidak terstruktur serta menghapus kata


tidak penting pada dokumen (Pakpahan et al.,
2.1. Twitter 2019). Terdapat beberapa tahapan dalam Pre-
Twitter merupakan salah satu sosial media processing yaitu tokenization, case folding,
yang banyak digunakan oleh sebagian besar stopwords removal, dan stemming.
pengguna internet. Pengguna harian twitter telah
2.7. Relevance Frequency Feature Selection
terhitung total mencapai 134 juta, naik dari tahun
sebelumnya (Agi, 2019). Hal tersebut Relevance Frequency Feature Selection
dikarenakan mudahnya penggunaan twitter merupakan metode seleksi fitur yang berguna
untuk berbagi dan bertukar informasi dengan untuk melakukan penghapusan terhadap
pengguna lainnya. beberapa term yang tidak penting, sehingga
dapat menghasilkan term baru yang selanjutnya
2.2. Opini Masyarakat akan digunakan untuk proses klasifikasi. Term
Opini merupakan suatu ekspresi dari sikap akan direduksi berdasarkan hasil dari
yang timbul pada saat dilakukan pembahasan perhitungan Relevance Frequency Feature
mengenai topik tertentu (Eddison, 2015). Selection di setiap kelasnya. Untuk mendapatkan
Sedangkan masyarakat merupakan sekelompok hasil dari Relevance Frequency Feature
manusia yang berada di suatu wilayah, Selection dilakukan perhitungan bobot RF
membentuk suatu sistem dan hidup bersama- terlebih dahulu, dengan menggunakan
sama. Oleh karena itu, opini masyarakat perhitungan seperti pada Persamaan (1).
𝑎
merupakan suatu ekspresi dari masyarakat 𝑅𝐹(𝑡𝑗,𝑐𝑖) = log( 2 + ) (1)
max (1,𝑐)
berupa pendapat, kritik dan saran yang timbul
saat adanya pembahasan mengenai topik
Keterangan:
tertentu. Pada penelitian yang dilakukan ini,
𝑅𝐹(𝑡𝑗,𝑐𝑖) : bobot kata (term) t di kelas c ke i
opini masyarakat dikhususkan tentang kebijakan
pemerintah mengenai new normal di twitter. 𝑎 : total dari dokumen berisi kata (term) t di
kelas ci
2.3. Text Mining 𝑐 : jumlah dokumen berisi kata (term) t yang
tidak ada di kelas ci
Text mining merupakan suatu pengetahuan max (1, 𝑐) : nilai terbesar antara 1 dan c
yang didalamnya terkait dengan proses
hubungan antara pengguna dengan dokumen- Selanjutnya, untuk melakukan perhitungan
dokumen yang telah ada sebelumnya, seleksi fiturnya, maka diperlukan rumus
menggunakan tool analisis (Feldman & Sanger, perhitungan Relevance Frequency Feature
2007). Dilakukannya Text Mining adalah untuk Selection yang dapat dilihat pada Persamaan (2).
melakukan analisis dan menemukan pola-pola 𝑅𝐹𝐹𝑆(𝑡𝑗,𝑐𝑖) = 𝐷𝐹(𝑡𝑗,𝑐𝑖) ∗ 𝑅𝐹(𝑡𝑗,𝑐𝑖) (2)
yang menarik dan relevan dari dokumen yang
digunakan.
Keterangan:
2.4. Analisis Sentimen 𝑅𝐹𝐹𝑆(𝑡𝑗,𝑐𝑖) : hasil Relevance Frequency
Feature Selection pada setiap term
Analisis sentimen ialah tahapan, alat t di kelas c ke i
maupun teknik yang berfungsi dalam melakukan 𝐷𝐹(𝑡𝑗,𝑐𝑖) : jumlah term t di kelas c ke i
pendeteksian serta ekstraksi dari suatu informasi
𝑅𝐹(𝑡𝑗,𝑐𝑖) : bobot term t pada kelas c ke i
subjektif, contohnya adalah opini dari sebuah
tulisan (Mantyla et al., 2016). Analisis sentimen
2.8. Pembobotan Kata
bertujuan dalam melakukan ekstraksi dokumen
berupa kata atau kalimat dalam bentuk sentimen Pembobotan kata dilaukan untuk pemberian
positif, negatif dan netral. nilai dari setiap term pada suatu dokumen
(Deolika et al., 2019). Metode pembobotan kata
2.5. Pre-processing yang digunakan adalah Raw-Term Frequency.
Pre-processing merupakan tahapan awal Perhitungan Raw-Term Frequency dilakukan
yang dilakukan dalam penerapan text mining. pada masing-masing term yang telah didapatkan
dari hasil proses seleksi fitur. Dalam perhitungan
Pre-processing pada Text Mining bertujuan agar
memperoleh informasi menarik berdasarkan tersebut didapatkan frekuensi dari kemunculan

Fakultas Ilmu Komputer, Universitas Brawijaya


Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer 5071

term dari setiap dokumen yang digunakan. simpan pada file newnormal.csv, berbahasa
Persamaan (3) berikut, menunjukkan proses Indonesia, dan pengambilan data dilakukan dari
Raw-Term Frequency. tanggal 01 Maret 2020 hingga 30 Agustus 2020.
Cara lain yang digunakan adalah dengan cara
TF(d|t) = f(d,t) (3) manual langsung melalui Twitter dengan syntax
“until:2020-08-30 since:2020-06-01 New
Keterangan: Normal Pemerintah lang:id” dengan maksud
TF(d,t) : Raw-Term Frequency melakukan pengambilan data dari tanggal 01
f(d,t) : Frequency bobot kata (term) t didokumen Juni 2020 hingga 30 Agustus 2020 mengenai
d New Normal Pemerintah berbahasa Indonesia.

2.9. Naive Bayes 3.2. Implementasi Algoritme


Naive Bayes merupakan suatu metode yang Implementasi algoritme peneletian,
berguna untuk melakukan pengklasifikasian melewati proses tahapan seperti pada Gambar 1.
dengan aturan-aturan Bayes yang ada
menggunakan perhitungan peluang. Pada proses Mulai
klasifikasi dilakukan pengkategorian
menggunakan nilai probabilitas maksimal. Input data latih, data uji
Metode Naive Bayes sering digunakan para
peneliti karena dirasa efektif untuk memperoleh
Preprocessing
ketepatan hasil dengan akurasi yang tinggi
(Kusumadewi, 2009). Rumus untuk perhitungan
Naive Bayes ditunjukkan pada Persamaan (4). Relevance Frequency
Feature Selection
𝑃(𝑐)∗𝑃(𝑑|𝑐)
P(c|d)= (4)
𝑃(𝑑)
Raw term frequency

Keterangan:
Klasifikasi Naive
P(c|d) : posterior yaitu peluang kelas c Bayes
diberikan dokumen d
P(c) : prior atau peluang awal munculnya Hasil kelas
kategori c
P(d|c) : Nilai Likelihood Selesai
P(d) : Evidence atau peluang munculnya
dokumen d
Gambar 1. Diagram Alir Implementasi Algoritme
3. METODE PENELITIAN
Pada penelitian Analisis Sentimen Twitter
3.1. Pengumpulan Data Terhadap Opini Masyarakat Mengenai
Kebijakan New Normal Menggunakan Metode
Sebanyak 300 data digunakan pada Naive Bayes Dengan Relevance Frequency
penelitian ini, sebagai data latih dan data uji. Feature Selection. Terdapat beberapa tahapan
Pembagian data dilakukan dengan menggunakan yang harus dilakukan sebelum data diklasifikasi,
k-fold cross validation dengan k=5. Terdapat yaitu proses pre-processing yang didalamnya
240 data latih dan 60 data uji yang berbeda di beberapa tahapan yaitu case folding, cleaning,
setiap fold-nya. Data penelitian tersebut berupa tokenization, filtering dan stemming, kemudian
tweet opini masyarakat mengenai kebijakan new dilakukan perhitungan seleksi fitur Relevance
normal yang ada pada media sosial Twitter dari Frequency Feature Selection untuk
tanggal 01 Maret hingga tanggal 30 Agustus mendapatkan term baru setelah dilakukan
2020. Pengambilan data dilakukan dengan dua penyeleksian fitur. Lalu dilakukan proses
cara, yaitu dengan library Twint menggunakan pembobotan kata dengan menggunakan Raw
syntax ““twint -s "new normal" –o Tem Frequency untuk mendapatkan frekuensi
newnormal.csv --csv -l id --since 2020-03-01 -- dari setiap term yang ada pada suatu dokumen.
until 2020-08-30” dengan maksud melakukan Selanjutnya dilakukan proses klasifikasi
pengambilan data new normal yang akan di menggunakan Naive Bayes, sehingga didapatkan

Fakultas Ilmu Komputer, Universitas Brawijaya


Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer 5072

hasil klasifikasi berupa kelas positif, negatif atau 4.2. Pengujian Pengaruh Metode Relevance
netral. Frequency Feature Selection (RFFS)
Pengujian pengaruh metode Relevance
4. PENGUJIAN DAN ANALISIS
Frequency Feature Selection terhadap metode
Data latih yang digunakan pada pengujian klasifikasi Naive Bayes ini dilakukan untuk
saat ini adalah data tweet sebanyak 300 data mengetahui tingkat akurasi metode Naive Bayes
yang kemudian dilakukan pembagian data dengan seleksi fitur Relevance Frequency
dengan k-fold cross validation dan nilai k=5 Feature Selection. Di mana semua term yang
sebagai data latih dan data uji. telah didapatkan dari hasil pre-processing
selanjutnya akan dilakukan proses ekstraksi fitur
4.1. Pengujian Tingkat Akurasi Metode dengan menggunakan rumus perhitungan
Klasifikasi Naive Bayes metode Relevance Frequency Feature Selection,
Pengujian tingkat akurasi dengan metode sehingga didapatkan hasil term baru yang akan
Naive Bayes ini dilakukan untuk dapat digunakan untuk proses klasifikasi Naive Bayes.
mengetahui tingkat akurasi metode Naive Bayes Hasil dari pengujian yang dilakukan ditujukan
yang digunakan, di mana semua term yang telah untuk mengetahui seberapa besar pengaruh
didapatkan dari hasil pre-processing selanjutnya metode Relevance Frequency Feature Selection
akan di gunakan tanpa dilakukan proses pada proses klasifikasi dengan metode Naive
perhitungan seleksi fitur. Pengujian tingkat Bayes. Pengujian tingkat akurasi pengaruh
akurasi dengan penggunaan metode klasifikasi metode Relevance Frequency Feature Selection
Naive Bayes ini dilakukan dengan perhitungan terhadap metode klasifikasi Naive Bayes ini
Confusion Matrix menggunakan k-fold sebesar dilakukan dengan perhitungan Confusion Matrix
5-fold. Hasil pengujian metode klasifikasi Naive menggunakan k-fold sebesar 5-fold. Hasil
Bayes di tunjukkan pada Tabel 1. pengujian pengaruh metode Relevance
Tabel 1. Hasil Pengujian setiap Fold Menggunakan Frequency Feature Selection ditunjukkan pada
Metode Naive Bayes Tabel 2.

K- F- Tabel 2. Hasil Pengujian pengaruh metode


Accuracy Precision Recall Relevance Frequency Feature Selection setiap Fold
fold Measure
fold1 60% 60% 60% 60%
K- F-
fold2 63,3% 69% 63,3% 64,1% Accuracy Precision Recall
fold Measure
fold3 61,7% 62,4% 61,7% 61,8%
fold1 65% 65,3% 64,9% 65,1%
fold4 73,3% 75,8% 73,3% 73,4%
fold2 66,7% 69,6% 66,7% 67,4%
fold5 55% 54% 55% 54,2%
fold3 63,3% 64,7% 63,3% 63,4%
Rata-
62,6% 64,2% 62,6% 62,7% fold4 75% 79% 75% 75,2%
rata
fold5 56,7% 56,5% 56,7% 56,6%
Rata-
Berdasarkan hasil pengujian setiap fold 65,3% 67% 65,3% 65,5%
rata
menggunakan metode Naive Bayes, maka dapat
ditunjukkan hasil akurasinya pada Gambar 2.
Berdasarkan hasil pengujian setiap fold
pengaruh metode Relevance Frequency Feature
80% Selection, maka dapat ditunjukkan perbandingan
70% hasil akurasinya pada Gambar 3.
60%
50%
Accuracy
40%
30%
20%
10%
0%
fold1 fold2 fold3 fold4 fold5

Gambar 2. Grafik Hasil Akurasi Pengujian setiap


fold Menggunakan Metode Naive Bayes

Fakultas Ilmu Komputer, Universitas Brawijaya


Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer 5073

hasil akurasi sebesar 56,7% dengan precision


80%
70%
56,5%, recall 56,7% dan f-measure 56,6%.
60%
Terjadi perbedaan akurasi yang cukup besar dari
50%
kedua fold tersebut yaitu sebesar 18,3%. Dari
Naive Bayes
40% pengujian yang dilakukan sebanyak 5 kali
30%
Naive Bayes tersebut, rata-rata akurasi yang didapatkan
+ RFFS
20% adalah sebesar 65,3%. Pada fold ke-4 didapatkan
10% akurasi tertinggi karena dari 60 data uji pada fold
0% tersebut, didapatkan hasil prediksi benar
fold1 fold2 fold3 fold4 fold5 sebanyak 45 data dan 15 sisanya salah.
Gambar 3. Grafik Hasil Akurasi Pengujian Pengaruh Sedangkan pada fold ke-5 didapatkan hasil
Seleksi Fitur Relevance Frequency Feature prediksi benar sebanyak 33 data dan 27 data
Selection setiap fold sisanya salah. Berdasarkan Gambar 3, pada
pengujian menggunakan seleksi fitur Relevance
4.3. Hasil Analisis Frequency Feature Selection dan tanpa
penambahan seleksi fitur, dapat dilihat bahwa
Berdasarkan hasil pengujian tingkat akurasi
penggunaan seleksi fitur Relevance Frequency
dengan metode klasifikasi Naive Bayes,
Feature Selection (RFFS) dapat meningkatkan
didapatkan hasil akurasi tertinggi sebesar 73,3%,
hasil akurasi. Dari pengujian sebanyak 5 fold
dengan precision 75,8%, recall 73,3% dan f-
yang dilakukan, terdapat kenaikan hasil evaluasi
measure 73,4% pada pengujian fold-4 dan
di semua fold-nya. Terjadi kenaikan akurasi
akurasi terendah pada fold-5 dengan hasil
pada fold ke-1 sebesar 5%, fold ke-2 sebesar
akurasi sebesar 55% dengan precision 54%,
3,4%, fold ke-3 sebesar 1,6%, fold ke-4 sebesar
recall 55% dan f-measure 54,2%. Terjadi
1,7% dan fold ke-5 sebesar 1,7%. Terjadi
perbedaan akurasi yang cukup besar dari kedua
peningkatan hasil rata-rata akurasi yaitu sebesar
fold tersebut yaitu sebesar 18%. Dari pengujian
2,7%. Hal tersebut dikarenakan beberapa fitur
yang dilakukan sebanyak 5 kali tersebut, rata-
(term) dihilangkan sehingga tidak ikut dalam
rata akurasi yang didapatkan adalah sebesar
proses perhitungan klasifikasi. Penggunaan
62,7%. Pada fold-4 didapatkan akurasi tertinggi
metode seleksi fitur Relevance Frequency
karena dari 60 data uji pada fold tersebut,
Feature Selection ini mampu mereduksi atau
didapatkan hasil prediksi benar sebanyak 44 data
menghilangkan beberapa fitur yang tidak
dan 16 sisanya salah. Sedangkan pada fold ke-5
penting.
didapatkan hasil prediksi benar sebanyak 31 data
Dari kedua pengujian yang dilakukan,
dan 29 data sisanya salah. Salah satu data uji
didapatkan hasil kesalahan prediksi terbanyak
yang memiliki hasil prediksi salah yaitu
terjadi pada kelas netral. Hal tersebut terjadi
“pelonggaran New-Normal bukan karena
karena data netral yang digunakan masih tidak
kondisi sudah normal. Namun demi
mencirikan secara spesifik kelas netral tersebut.
pertimbangan ekonomi yang harus tumbuh”.
Data uji tersebut memiliki kelas aktual netral,
5. PENUTUP
dan mendapatkan hasil prediksi negatif. Dari 7
term yang didapatkan yaitu “new-normal”, 5.1. Kesimpulan
“normal”, “longgar”, ”kondisi”, ”timbang”,
“ekonomi”, dan “tumbuh” hanya terdapat 2 term Berdasarkan hasil dari pengujian yang telah
yang merupakan kata netral yaitu “new-normal”, dilakukan sebelumnya, maka didapatkan
dan “normal”. Sedangkan 5 term sisanya beberapa simpulan pada penelitian ini yaitu
merupakan kata negatif yang tidak penting. penggunaan metode Naive Bayes pada analisis
Term tersebut dapat dikategorikan dalam suatu sentimen mengenai opini masyarakat pada
kelas berdasarkan hasil dari perhitungan Twitter tentang kebijakan New Normal
likelihood terbesar. mendapatkan akurasi tertinggi sebesar 73,3%
Berdasarkan hasil pengujian pengaruh yang terjadi pada fold ke-4 dalam 5 kali
metode Relevance Frequency Feature Selection pengujian dengan pembagian dataset
(RFFS). didapatkan hasil akurasi tertinggi menggunakan 5-fold cross validation dan
sebesar 75%, dengan precision 79%, recall 75% dihasilkan rata-rata akurasi sebesar 62,6%.
dan f-measure 75,2% pada pengujian fold ke-4 Selain itu penggunaan metode seleksi fitur
dan akurasi paling rendah pada fold ke-5 dengan Relevance Frequency Feature Selection

Fakultas Ilmu Komputer, Universitas Brawijaya


Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer 5074

berpengaruh dalam meningkatkan hasil akurasi. 2019. Analisis Sentimen Ccalon Presiden
Dari 5 kali pengujan yang dilakukan, terjadi Indonesia 2019 dari Media Sosial Twitter
peningkatan hasil akurasi di setiap fold-nya. Menggunakan Metode Naive Bayes.
Terjadi peningkatan nilai rata-rata akurasi Jurnal Edukasi dan Penelitian
sebesar 2,7%. Dengan hasil rata-rata akurasi Informatika, V(3), pp.279-85.
yang didapatkan sebesar 65,3%.
Kilic, E. & Sahin, D.O., 2019. Two new feature
selection metrics for text classification.
5.1. Saran
Journal for Control, Measurement,
Pada penelitian yang telah dilakukan ini Electronics, Computing and
masih mempunyai beberapa kekurangan, Communication, 60, p.162–171.
sehingga terdapat saran yang diajukan peneliti
Kurniawan, I. & Susanto, A., 2019.
untuk pengembangan selanjutnya yaitu peneliti
Implementasi Metode K-Means dan
selanjutnya diharapkan jumlah data latih agar
Naïve Bayes Classifier untuk Analisis
dapat meningkatkan hasil akurasi dari pengujian
Sentimen Pemilihan Presiden (Pilpres)
dan data latih yang digunakan lebih beragam.
2019. Jurnal Eksplora Informatika, IX(1).
Sehingga data terlatih dengan baik, tidak
memiliki makna yang ambigu dan dapat lebih Kusumadewi, S., 2009. Klasifikasi Status Gizi
spesifik mencirikan setiap kelas yang digunakan. Menggunakan Naive Bayesian
Classification. CommIT (Communication
6. DAFTAR PUSTAKA and Information Technology) Journal, 3
Agi, 2019. CNN Indonesia. [Online] Available (1), p.6.
at: Ling, J., Kencana, P.E.N. & Oka, T.B., 2014.
https://www.cnnindonesia.com/teknologi Analisis Sentimen Menggunakan Metode
/20190424001600-185- Naive Bayes Classifier Dengan Seleksi
389042/pengguna-capai-330-juta- Fitur Chi Square. E-Jurnal Matematika, 3
keuntungan-twitter-naik-3-kali-lipat (3), pp.92-99.
[Accessed 24 April 2020].
Mantyla, M., Kuutila, M. & Graziotin, D., 2016.
Al-Ayyoub, M., Khamaiseh, A.A. & Jararweh, The Evolution of Sentiment Analysis - A
Y., 2018. A Comprehensive Survey of Review of Research Topics, Venues, and
Arabic Sentiment Analysis. Information Top Cited Papers. Research Gate.
Processing and Management, pp.1-23.
Muhyiddin, 2020. Covid-19, New Normal dan
Attabi, A.W., Muflikhah, L. & Fauzi, M.A., Perencanaan Pembangunan di Indonesia.
2018. Penerapan Analisis Sentimen untuk The Indonesian Journal of Development
Menilai Suatu Produk pada Twitter Planning, IV, pp.240-52.
Berbahas Indonesia dengan Metode Naive
Pakpahan, S.R.M., Indriati & Marji, 2019.
Bayes Classifier dan Information Gain.
Analisis Sentimen Tentang Opini
Jurnal Pengembangan Tekologi
Performa Klub Sepak Bola Pada
Informasi dan Ilmu Komputer, II(11),
Dokumen Twitter Menggunakan Support
pp.4548-54.
Vector Machine Dengan Perbaikan Kata
Deolika, A., Kusrini & Luthfi, E.T., 2019. Tidak Baku. Jurnal Pengembangan
Analisis Pembobotan Kata Pada Teknologi Informasi dan Ilmu Komputer,
Klasifikasi Text Mining. Jurnal Teknologi III(7), pp.7259-67.
Informasi, III(2), pp.179-84.
Sabily, A.F., Adikara, P.P. & Fauzi, M.A., 2019.
Eddison, C., 2015. Opini Masyarakat Surabaya Analisis Sentimen Pemilihan Presiden
Mengenai Corporate Identity ARTOTEL 2019 pada Twitter menggunakan Metode
Surabaya. Jurnal E-Komunikasi, III(1), Maximum Entropy. Jurnal
pp.1-10. Pengembangan Teknologi Informasi dan
Feldman, R. & Sanger, J., 2007. The Text Mining Ilmu Komputer, 3, pp.4204-09.
Handbook: Advanced Unstructure Data. Shereen, M.A. et al., 2020. COVID-19 infection:
New York: Cambridge University Press. Origin, transmission, and characteristics
Fitriyyah, S.N.J., Safriadi, N. & Pratama, E.E., of human coronavirus. Journal of
Advanced Research, 24, pp.91-98.

Fakultas Ilmu Komputer, Universitas Brawijaya

Anda mungkin juga menyukai