Anda di halaman 1dari 7

JURNAL IT

Volume XX No.X, xxx 2021 Media Informasi IT STMIK Handayani

ANALISIS SENTIMEN TERHADAP LARANGAN MUDIK TAHUN 2021


DI TWITTER DENGAN NAÏVE BAYES KLASIFIKASI

Tamsir
Sistem Komputer, STMIK Handayani Makassar
tamsirsir06@gmail.com

ABSTRAK

Baru-baru ini pemerintah megeluarkan kebijakan tentang larangan mudik di tengah pandemi virus corona
(covid-19) dan menjadi perbincangan hangat ditengah-tengah masyarakat salah satunya di media sosial twitter.
Twitter merupakan salah satu media sosial yang digunakan untuk penyampaian pesan berupa opini, kemudian
opini ini diambil dari jejaring sosial tersebut dengan queri “Larangan Mudik” dengan menggunakan
Bahasa Indonesia. Penelitian ini dilakukan untuk menganalisa opini masyarakat tentang kebijakan larangan
mudik dengan menggunakan Analisis sentimen, Analisis Sentimen merupakan salah satu cabang dari bidang
ilmu text mining. Analisis sentimen merupakan sumber penting dalam melakukan evaluasi dan pengambilan
keputusan terhadap sebuah topik permasalahan. Dengan Penelitian ini kami mencoba untuk menganalisa opini
masyarakat mengenai aturan larangan mudik dengan mengklasifikasikan opini kedalam 3 kelas yaitu positif,
negatif dan netral. Klasifikasi dilakukan dengan menggunakan metode Naïve Bayes Clasifiers.
Metode Naive Bayes Classifiers merupakan salah satu metode klasifikasi teks berdasarkan probabilitas kata
kunci dalam membandingkan dokumen latih dan dokumen uji. Hasil pengujian pada tools RapidMiner
memperlihatkan bahwa akurasi dengan fitur TF-IDF memberikan hasil akurasi yang baik. Secara keseluruhan
penggunaan metode Naive Bayes memiliki performansi yang cukup baik untuk melakukan klasifikasi tweet.

Kata kunci : Sentiment Analisis, Larangan Mudik, Twitter

1. PENDAHULUAN
Pemerintah kembali mengeluarkan kebijakan terkait larangan mudik lebaran tahun 2021 karena jumlah
kasus corona (covid-19) di indonesia semakin meningkat. Kebijakan larangan mudik yang tertuang dalam
Peraturan Menteri Perhubungan (Permenhub) Nomor 25 Tahun 2020 baik transportasi umum atau pribadi yang
bergerak antar daerah[1]. Sehingga memunculkan berbagai Opini di masyarakat mengenai larangan mudik
lebaran tahun 2021 terutama pada pada media social Twitter,Twitter sampai saat ini sangat digemari dan
menjadi penyebar informasi yang sangat cepat. Informasi yang beredar juga sangat banyak mulai dari berita,
opini, komentar, kritik dan saran, baik yang bersifat positif, negatif atau netral. sehingga perlu ada pengkajian
terhadap opini tersebut kedalam sebagai pemrosesan teks. Analisis sentimen merupakan proses yang sangat
dibutuhkan dalam menyaring opini-opini masyarakat dan diklasifikasikan ke dalam 3 kelas yaitu positif, negatif
dan netral[2]
. Agar dapat diperoleh hasil yang dapat membantu kebutuhan pemerintah dalam mengambil langkah-
langkah strategis guna menekan angka penyebaran kasus Corona (Covid-19). Twitter merupakan layanan sosial
media dan juga mikroblog yang memungkinkan penggunanya berkirim dan membaca pesan yang tidak lebih
dari 280 karakter yang disebut sebagai tweet. Sebelumnya, pesan di Twitter hanya sampai 140 karakter tetapi
pada tanggal 7 November 2017 ditambah menjadi 280 karakter, disebutkan oleh Direktur Jenderal Sumber Daya
Perangkat Pos dan Informatika (SDPP) Pementerian Komunikasi dan Informatika, tercatat sebanyak 19,5 juta
masyarakat Indonesia adalah pengguna Twitter dan Indonesia tercatat sebagai negara ke lima yang paling

Analisis Sentiment Terhadap Larangan Mudik Tahun 2021 Di Twitter Dengan Naïve 77
Bayes Klasifikasi
JURNAL IT
Volume XX No.X, xxx 2021 Media Informasi IT STMIK Handayani

banyak dan aktif dalam penggunaan Twitter (antara, 2012). Media Sosial Twitter bekerja real-time,
memungkinkan pengguna mengekspresikan opini dan perasaan mereka mengenai banyak isu atau
permasalahan[3].
Proses pengambilan data dari tweets Twitter dengan crawling text. menurut pengguna informasi sangat cepat
dan mudah tersebar melalui update-an status Twitter maka dari itu alasan twitter dipilih. We Are Social
melakukan penelitian (2018) perusahaan media Inggris yang bekerja sama dengan Hootsuite, sebagian besar
orang Indonesia menghabiskan tiga jam 23 menit sehari untuk mengakses media sosial. Twitter menempati
peringkat 7 pada Januari 2018 dengan persentase 27%[4].
Dalam penelitian ini menggunakan Algoritma Naive Bayes yang merupakan sebuah metoda klasifikasi
menggunakan metode probabilitas dan statistik yg dikemukakan oleh ilmuwan Inggris Thomas Bayes.
Algoritma Naïve Bayes memprediksi peluang di masa depan berdasarkan pengalaman di masa sebelumnya
sehingga dikenal sebagai Teorema Bayes. Ciri utama dr Naïve Bayes Classifier ini adalah asumsi yg sangat kuat
(naïf) akan independensi dari masing-masing kondisi atau kejadian.

2. METODE PENELITIAN

Gambar 2.1 Metode Penelitian

2.1 Crawling Data


Melakukan Connecting API Twitter untuk mendapatkan ‘Token Access’ yang menjadi syarat untuk
membuat pengumpulan dataset Twitter (Crawling Data) di dalam software RapidMiner. Proses pengambilan
data pada penelitian ini dilakukan secara otomatis dari twitter[5], kemudian dikelola dengan bantuan aplikasi
rapidminer untuk selanjutnya masuk tahap Dataset.

2.2 Data
Dataset dalam penelitian ini adalah data berbahasa Indonesia mengenai kebijakan larangan mudik di
peroleh dari twitter dengan query “Larangan Mudik” dengan metode crawling secara otomatis menggunakan
RapidMiner kemudian melakukan pelabelan sentimen Positif, Negatif dan Netral dalam dataset tersebut untuk
membuat tolak ukur perbandingan penilaian dengan mesin.

2.3 Pre-Processing
Langkah ini merupakan langkah awal untuk data yang diolah masuk pada proses klasifikasi terutama
berfokus pada pembersihan data bertujuan untuk menghilangkan dan mengatasi noisy data, termasuk mengatasi
informasi yang hilang (Adiwijaya, 2006). Tahap ini bertujuan agar hasil perhitungan optimal. Berikut langkah-
langkah yang dilakukan dalam pemrosesan teks diantaranya :

Analisis Sentiment Terhadap Larangan Mudik Tahun 2021 Di Twitter Dengan Naïve 78
Bayes Klasifikasi
JURNAL IT
Volume XX No.X, xxx 2021 Media Informasi IT STMIK Handayani

2.3.1 Tokenize digunakan agar semua kata dalam setiap dokumen dikumpulkan dan dihilangkan tanda baca,
dan dihilangkan jika ada simbol atau karakter khusus yang bukan huruf dan memisahkan kalimat menjadi
kata-kata sesuai kebutuhan yang sering disebut token.
2.3.2 Transform Cases digunakan untuk mengubah kapitalisasi karakter (huruf) menjadi kecil untuk semua
kata atau huruf.
2.3.3 Filter Token (byLength) digunakan untuk pemilihan token dengan ukuran panjang minimal 4 karakter
(huruf),
2.3.4 Stemming pada dokumen Bahasa Indonesia cukup kompleks, karena harus dilakukan penghilangan
seluruh imbuhan pada kata-kata yang terdapat pada tweets. Digunakan library Sastrawi Stemming
berbahasa Indonesia yang berbasis algoritme Nazief dan Adriani(Afuan, 2013).
2.3.5 topword removal adalah penyaringan kata-kata yang sering maupun jarang muncul, biasa disebut dengan
stopword. Proses ini disebut Dengan menghapus kata-kata yang jarang muncul tersebut, akan menjadi
optimal untuk mempertahankan kinerja klasifikasi sekaligus mengurangi data sparsial dan menyusutkan
ruang fitur secara substansial (Saif et al., 2014).

2.4 Naïve Bayes Klasifikasion


Pada tahap ini data dianalisis, lalu diterapkan model-model yang sesuai dengan jenis data. Model yang
diusulkan dalam penelitian ini yaitu naive bayes. metode ini merupakan salah satu metode machine learning
yang menggunakan perhitungan probabilitas. data dibagi kedalam data latih (training data) dan data uji (testing
data)

2.5 Evaluation
Setelah tahapan modeling selesai maka tahap selanjutnya adalah melakukan evaluasi terhadap hasil dari
pemodelan tersebut.

3. HASIL DAN PEMBAHASAN

Setelah melakukan Crawling pada media social twitter maka akan diperoleh data set dengan extensi csv
kemudian dilakukan pelabelan 'positif', 'negatif' dan ‘netral’ selanjutnya dilakukan pengoperasian 'Analisis
Sentimen' agar didapatkan hasil label sentiment, Ada beberapa Langkah yang diterapkan sebagai berikut.

3.1 Pengambilan Dataset


Pengambilan data pada penelitian ini menggunakan aplikasi RapidMiner secara otomatis pada twitter yang
merupakan opini masyarakat menggunakan bahasa indonesia terhadap kebijakan larangan mudik yang
ditetapkan oleh pemerintah. data dicrawling dengan query 'Larangan Mudik' sebanyak 100 data[6].

Gambar 3.1 Crawling data

3.2 Proses Pre-Processing


Setelah crawling data dari twitter dan data sudah di cleansing, kemudian dilanjutkan dengan tahap
preprocessing. Data tersebut tidak bisa langsung dimasukkan dalam pengolahan untuk sentimen analisis, maka
dilanjutkan dengan tahapan preprocessing.

Gambar 3.2 Proses Split Data dan Cleansing

Analisis Sentiment Terhadap Larangan Mudik Tahun 2021 Di Twitter Dengan Naïve 79
Bayes Klasifikasi
JURNAL IT
Volume XX No.X, xxx 2021 Media Informasi IT STMIK Handayani

Gambar 3.3 Process Document from Data

3.2.1 Tokenize (1)


Proses ini bertujuan untuk menghilangkan tanda baca, simbol dan katakter yang bukan berupa huruf pada
setiap opini, hasil dari tokenization ditunjukkan pada gambar dan tabel berikut.

Gambar 3.4 Edit Regular Expression

Tabel 3.1 Hasil Tokenization (1)


Teks sebelum Tokenization (1) Teks setelah Tokenization (1)
Wapres Ma’ruf Amin Prihatin, Menko Luhut; Wapres Maruf Amin Prihatin Menko Luhut
Karena Larangan Mudik Dilanggar Karena Larangan Mudik Dilanggar

3.2.2 Tokenize (2)


Proses ini bertujuan untuk menghilangkan angka pada setiap opini dengan memilih mode ‘non letters’ ,
hasil dari tokenization ditunjukkan pada gambar dan tabel berikut.

Gambar 3.5 Edit Tokenize (2)

Tabel 3.2 Hasil Tokenization (2)


Teks sebelum Tokenization (2) Teks setelah Tokenization (2)
Kemarin soal larangan mudik buat cegah wabah Kemarin soal larangan mudik buat cegah wabah
covid 19 mereka ngomong apa covid mereka ngomong apa

3.2.3 Transform Cases


Proses ini bertujuan untuk mengubah bentuk huruf kapital yang ada pada text menjadi huruf kecil semua
dengan fitur lowercase. Perbedaannya seperti pada tabel berikut.

Gambar 3.6 Edit Transform Cases

Analisis Sentiment Terhadap Larangan Mudik Tahun 2021 Di Twitter Dengan Naïve 80
Bayes Klasifikasi
JURNAL IT
Volume XX No.X, xxx 2021 Media Informasi IT STMIK Handayani

Tabel 3.3 Hasil Transform Cases


Teks sebelum Transform Cases Teks setelah Transform Cases
Membuka mata bahwa larangan mudik harusnya membuka mata bahwa larangan mudik harusnya
ditaati ditaati

3.2.4 Filter tokens (by length)


Pada tahap ini dilakukan pemilihan token dengan ukuran panjang minimal 4 karakter (huruf) dan panjang
maksimal 25 karakter (huruf).

Gambar 3.7 Edit Filter Tokens (by Length)

Tabel 3. Hasil Filter Tokens (by Length)


Teks sebelum Filter Tokens (by Length) Teks setelah Filter Tokens (by Length)
kemarin soal larangan mudik buat cegah wabah kemarin soal larangan mudik buat cegah wabah
covid mereka ngomong apa covid mereka ngomong

3.3 Validasi
pada penelitian ini menggunakan 10 Fold Cross-Validation. 10 Fold cross validation digunakan untuk
mendapatkan model terbaik. Cross validasi lebih baik daripada validasi Leave-One-Out untuk pemilihan model,
dan juga lebih baik daripada K-Fold lainnya[7]. Operator Cross Validation K-Fold ditunjukkan pada gambar
berikut.

Gambar 3.8 10 Fold Cross Validation

3.4 Evaluasi
Untuk melakukan evaluasi dalam penelitian ini menggunakan algoritma Naïve Bayes. Untuk
mendapatkan nilai yang akan dievaluasi maka digunakan 10 fold cross validation terhadap data yang telah
dihitung pembobotannya[8], dapat dilihat pada gambar dibawah.

Gambar 3.9 Proses Cross Validation

Analisis Sentiment Terhadap Larangan Mudik Tahun 2021 Di Twitter Dengan Naïve 81
Bayes Klasifikasi
JURNAL IT
Volume XX No.X, xxx 2021 Media Informasi IT STMIK Handayani

3.5 Hasil Analisis Sentimen


hasil accuracy pengujian naïve bayes untuk analisis sentiment pada media sosial twitter memperoleh hasil
sebesar 70.28%+/-11.25% (micro average: 70.45%)[9].

Gambar 3.10. Performance Vector

3.6 Hasil Analisa Rapid Miner


Setelah melakukan proses pada rapidminer, maka kita menguji data hasil analisa berikut [10].
.

Gambar 3.11 hasil analisis pelabelan negatif, netral, & positif

4. KESIMPULAN DAN SARAN


4.1 Kesimpulan
Dari hasil analisis sentiment larangan mudik tahun 2021 ditengah wabah covid-19 yang dilakukan pada
media social di twitter dengan query “Larangan Mudik” menggunakan metode naïve bayes, maka peneliti
dapat menarik sebuah kesimpulan bahwa metode ini cukup baik dalam klasifikasi text mining karena
algoritma ini dapat menghasilkan nilai akurasi cukup baik, hasil crawling dari twitter diklasifikasi kedalam
3 kelas yaitu positif, negatif dan netral.

4.2 Saran
Untuk selanjutnya peneliti berharap analisis sentiment ini dapat dikembangkan dengan menggunakan
dataset yang lebih banyak sehingga hasilnya lebih akurat.

Analisis Sentiment Terhadap Larangan Mudik Tahun 2021 Di Twitter Dengan Naïve 82
Bayes Klasifikasi
JURNAL IT
Volume XX No.X, xxx 2021 Media Informasi IT STMIK Handayani

DAFTAR PUSTAKA

[1] M. Ubaidillah and R. H. S. Aji, “Aglomerasi Dalam Permenhub tentang Larangan Mudik dan
Pengaruhnya terhadap Pertumbuhan Ekonomi,” ’Adalah, vol. 4, no. 1, pp. 151–158, 2020, doi:
10.15408/adalah.v4i1.15667.
[2] N. Haqqizar and T. N. Larasyanti, “Analisis Sentimen Terhadap Layanan Provider Telekomunikasi
Telkomsel Di Twitter Dengan Metode Naïve Bayes,” Pros. TAU SNAR-TEK 2019 Semin. Nas. Rekayasa
dan Teknol., vol. 10, no. 2, pp. 1–15, 2019.
[3] I. Wahyudi, S. Bahri, and P. Handayani, “Aplikasi Pembelajaran Pengenalan Budaya Indonesia,” vol. V,
no. 1, pp. 135–138, 2019, doi: 10.31294/jtk.v4i2.
[4] W. K. Pertiwi, “Riset Ungkap Pola Pemakaian Medsos Orang Indonesia,” Kompas.com, 2018.
https://tekno.kompas.com/read/2018/03/01/10340027/riset-ungkap-pola-pemakaian-medsos-orang-
indonesia?page=all (accessed Jun. 19, 2021).
[5] N. Ruhyana, “Analisis Sentimen Terhadap Penerapan Sistem Plat Nomor Ganjil / Genap Pada Twitter
Dengan Metode Klasifikasi Naive Bayes,” J. IKRA-ITH Inform., vol. 3, no. 1, pp. 94–99, 2019.
[6] M. Yasid et al., “Analisis Sentimen Opini Publik Mengenai Larangan Mudik pada Twitter Menggunakan
Naive Bayes,” Jurnal Media Informatika Budidarma, vol. 5, no. 1. pp. 23–28, 2020.
[7] K. S. Nugroho, “Validasi Model Klasifikasi Machine Learning pada RapidMiner,” medium.com, 2020.
https://medium.com/@ksnugroho/validasi-model-machine-learning-pada-rapidminer-50be0080df14
(accessed Jun. 19, 2021).
[8] A. Deolika, K. Kusrini, and E. T. Luthfi, “Analisis Pembobotan Kata Pada Klasifikasi Text Mining,” J.
Teknol. Inf., vol. 3, no. 2, p. 179, 2019, doi: 10.36294/jurti.v3i2.1077.
[9] F. Handayani and S. Pribadi, “Implementasi Algoritma Naive Bayes Classifier dalam Pengklasifikasian
Teks Otomatis Pengaduan dan Pelaporan Masyarakat melalui Layanan Call Center 110,” J. Tek. Elektro,
vol. 7, no. 1, pp. 19–24, 2015, doi: 10.15294/jte.v7i1.8585.
[10] M. W. A. Putra, Susanti, Erlin, and Herwin, “Analisis Sentimen Dompet Elektronik Pada Twitter
Menggunakan Metode Naïve Bayes Classifier,” IT J. Res. Dev., vol. 5, no. 1, pp. 72–86, 2020, doi:
10.25299/itjrd.2020.vol5(1).5159.

Analisis Sentiment Terhadap Larangan Mudik Tahun 2021 Di Twitter Dengan Naïve 83
Bayes Klasifikasi

Anda mungkin juga menyukai