Anda di halaman 1dari 5

Template Penulisan Jurnal Methodika

ANALISIS SENTIMEN BANTUAN LANGSUNG TUNAI PADA MASA PANDEMI


MENGGUNAKAN METODE TF-IDF DAN ALGORITMA NAIVE BAYES

1 2 3
Penulis ke-1 , Penulis ke-2 , Penulis ke-3 3[Font 10]
1
Alamat Institusi penulis ke-
2,3
Alamat Institusi penulis ke-2 dan
1email penulis ke-1, 2 email penulis ke-2, 3 email penulis ke-3

ABSTRAK
Penelitian ini berdasarkan dari dampak covid – 19 yang merupakan virus baru yang baru muncul
bertransmisi ke permukaan selama tahun 2020 – 2022 yang ditetapkan oleh badan kesehatan internasional
(WHO), hal tersebut membuat pemerintah memberikan tindakan dengan meningkatkan protokol kesehatan dan
memberikan bantuan ekonomi. Bantuan Langsung Tunai (BLT) merupakan salah satu bantuan dari pemerintah
berupa uang tunai kepada masyarakat miskin yang terkana dampak dari covid – 19, yang berupakan bagian dari
program Bantuan Sosial. Hal ini menimbulkan respon positif dan negatif dari masyarakat yang dituangkan pada
media sosial Twitter. Pada penelitian ini dilakukan analisa sentimen untuk mengetahui opini masyarakat
terhadap penerimaan bantuan. Disini metode yang digunakan yaitu algoritma klasifikasi Naive Bayes. Hasil
penelitian menunjukan bahwa algoritma Naive Bayes memiliki performa dengan nilai sebesar 65.57%.

Kata kunci-

I. PENDAHULUAN [3]. Penelitian menggunakan sumber data dari Twitter


Pandemi Covid-19 ini berdampak pada ini didukung oleh penelitian sebelumnya mengenai
kesejahteraan masyarakat Indonesia [1]. Pemerintah Twitter sebagai ruang publik pemerintah lokal yang
Indonesia menyikapi permasalahan sosial pandemi parsitifatif di era modern saat ini [4].
dengan memberikan bantuan sosial kepada seluruh
masyarakat yang terkena dampak. Bantuan sosial II. TINJAUAN PUSTAKA
tersebut disalurkan dalam banyak bentuk, dalam tahun a) ANALISIS SENTIMEN
2021 ini terdapat bantuan sosial kartu prakerja, subsidi
listrik, bantuan langsung tunai UMKM, Program Analisis sentimen adalah proses analisis data yang
Keluarga Harapan (PKH), program sembako, bantuan diperoleh dari berbagai platform media sosial maupun
sosial tunai (BST). Dengan topik bantuan sosial oleh internet. Proses analisis ini memerlukan pemahaman dan
pemerintah, dilakukan analisis untuk melihat secara pengolahan data teks untuk mendapatkan informasi
umum kedalam ruang diskusi media sosial Twitter. sentimen dari suatu teks ataupun kalimat opini dalam
Topik bantuan sosial barang atau jasa yang paling platform media sosial [3]. Analisis sentimen ini dilakukan
sering menjadi pembicaraan. Bernilai seperti apakah dengan tujuan untuk mengetahui, apakah teks opini
topik pembicaraan tersebut, lalu seperti apakah bantuan tersebut mengarah ke pandangan yang positif atau negatif.
sosial yang diinginkan masyarakat. Supaya dapat
diketahui dari hasil analisis sentimen klasifikasi ini. b) BANTUAN SOSIAL
Klasifikasi ini menggunakan metode Naive Bayes Bantuan sosial adalah pemberian bantuan berupa uang,
sebagai algoritma untuk menghitung probabilitas barang atau jasa yang diberikan kepada seseorang,
sentimen dalam data Twitter yang didapatkan. keluarga, kelompok atau masyarakat miskin, tidak
Penggunaan metode Naive Bayes didukung oleh mampu, dan/atau rentan terhadap resiko sosial [5].
penelitian sebelumnya yang menguji Naive Bayes Bantuan sosial yang diberikan pada saat pandemi covid19
apakah baik dalam melakukan klasifikasi data [2]. adalah upaya pemerintah pusat dan daerah untuk
Dengan hasil penelitian yang mengatakan bahwa Naive membantu seluruh masyarakat yang terdampak pandemi.
Bayes cukup berpotensi baik dalam klasifikasi dokumen Koordinasi kerjasama antara Kementerian sosial dan
dibandingkan metode lain dalam hal akurasi serta lembaga pemerintahan serta Kementerian Keuangan
efisiensi komputasi. Dalam penelitian sebelumnya dalam mengatur pengelolaan dana bantuan sosial, diatur
metode Naive Bayes juga dilakukan untuk menganalisis dalam PMK-43-2020 [6]. Beberapa bentuk bantuan sosial
kebijakan PPKM oleh pemerintah selama masa yang diberikan selama pandemi di akhir tahun 2021 dari
pandemi Covid-19 dari komentar Twitter, yang bulan September hingga Desember adalah : kartu prakerja
menghasilkan nilai 72.26% opini Twitter masuk dan subsidi gaji, kartu sembako, bantuan listrik, bantuan
kedalam polaritas positif dan 31.83% polaritas negatif kuota kemendikbudristek, PKH (Program Keluarga
1
Template Penulisan Jurnal Methodika

Harapan), BPUM (Bantuan Produktif Usaha Mikro) atau


Bantuan Langsung Tunai UMKM [7].
f) TERM FREQUENCY INVERSE DOCUMENT
c) NAIVE BAYES CLASSIFIER FREQUENCY (TF-IDF)
Naive Bayes Classifier adalah sebuah metode untuk TF-IDF merupakan metode yang digunakan untuk
melakukan klasifikasi sederhana berdasarkan algoritma menentukan nilai fekuensi sebuah kata di dalam sebuah
bayesian, dengan probabilitas sederhana supaya dapat dokumen atau artikel dan juga frekuensi di dalam
diketahui bahwa tidak ada keterkaitan antar kelas yang banyak dokumen [8]. Fitur ini mempermudah untuk
satu dan yang lain [9]. Model Naive Bayes ini dinilai berjalannya proses klasifikasi.
cukup berpotensi baik dalam klasifikasi dokumen
dibandingkan metode lain dalam hal akurasi serta g) RAPIDMINER
efisiensi komputasi [2], karena memungkinkan setiap RapidMiner merupakan perangkat lunak terbuka
atribut berkontribusi dalam keputusan akhir atribut yang (open source) yang digunakan sebagai salah satu solusi
setara dan independen. Penelitian tersebut menguatkan dalam melakukan analisis dalam data mining, teks
penulis untuk menggunakan metode Naive Bayes dalam mining, dan analisis prediksi [12].
analisis sentimen ini. Selain karena prosesnya yang
mudah dipahami, Naive Bayes ini sering digunakan
III. METODOLOGI
dalam penelitian serupa dengan hasil akurasi maksimal Metode yang digunakan pada penelitian ini
walaupun dengan data latih yang sedikit. adalah TF-IDF dan Naïve Bayes, metode TF-IDF
digunakan untuk Mengetahui jumlah kemunculan kata
d) TWITTER dalam dokumen, berapa kata dalam dokumen.
Twitter adalah layanan jejaring sosial dan mikroblog Sedangkan maetode Naïve Bayes digunakan untuk
daring yang memungkinkan penggunanya untuk pengkasifikasian sentimen.
mengirim dan membaca pesan berbasis teks hingga 140
karakter akan tetapi pada tanggal 07 November 2017
bertambah hingga 280 karakter yang dikenal dengan
sebutan kicauan (tweet) [10]. Salah satu daya tarik dari
Twitter adalah hastag atau kata yang dapat menjadi
trending, baik pada kolom pencarian ataupun dalam
trending tweet atau unggahan tweet. Dalam proses
analisis sentimen Twitter ini, penulis memanfaatkan
trending pada tweet dengan topik bantuan sosial agar
dapat diambil datanya untuk proses analisis penelitian.

e) PREPROCESSING Gambar 1. Metodologi Penelitian


Preprocessing adalah tahap awal pengolahan data
yang belum terstruktur [3]. Tujuannya untuk a) LITERATURE REVIEW
mempermudah proses pencarian query dalam dokumen, Literature Review merupakan tinjauan atau
mempercepat dalam pemrosesan terhadap dokumen, dan rangkuman kritis dari literatur yang relevan dengan
mempermudah proses pengurutan data yang diambil [11]. topik penelitian tertentu. Ini melibatkan
Preprocessing ini mempunyai tahapan-tahapan dalam mengumpulkan, meninjau, dan menganalisis karya-
mengolah suatu data teks, tahap tersebut meliputi [3]: 1. karya ilmiah, artikel, buku, dan sumber-sumber lain
Case folding, proses merubah semua huruf di dalam yang terkait dengan topik penelitian yang sedang
dokumen menjadi huruf kecil. Selain huruf dihilangkan. diinvestigasi.
2. Cleaning, proses untuk memperbaiki atau menghapus b) PENGAMBILAN DATA
data yang tidak akurat. Dilakukan missing value atau Pengambilan data merujuk pada proses
mengisi nilai yang hilang dan menghilangkan data yang mengumpulkan informasi atau fakta dari berbagai
bersifat noise. 3. Remove Stopword, kata-kata yang sumber untuk digunakan dalam analisis, penelitian, atau
kurang bermakna atau tidak mempunyai arti dihilangkan tujuan lainnya. Pengambilan data dapat melibatkan
atau dihapus 4. Tokenization, memecah kalimat dokumen beberapa langkah, termasuk perencanaan desain
menjadi potongan-potongan bagian yang disebut token. 5. penelitian, identifikasi sumber data, pengembangan
Stemming, mengubah kata menjadi bentuk kata dasarnya, instrumen pengumpulan data, implementasi
dengan cara menghilangkan kata imbuhan baik awalan pengumpulan data, dan analisis data.
atau akhiran kata.

2
Template Penulisan Jurnal Methodika

c) PREPROCESSING e) KLASIFIKASI NAIVE BAYES


Preprocessing ini untuk membersihkan kata yang Metode ini beroperasi dengan menggunakan
tidak diperlukan atau kata yang tidak bermakna. teorema Bayesian yang akan mencari probabilitas dari
Langkah-langkah dari preprocessing harus disesuaikan data sentimen Twitter yang sering muncul. Klasifikasi
dengan kondisi data komentar Twitter yang ada. Berikut Naive Bayes ini dilakukan pada data dokumen Twitter
contoh langkah preprocessing : yang sudah diproses dalam tahap preprocessing dan
“Jangan main-main dengan bansos covid19, bansos sudah melalui tahap ekstraksi fitur sehingga dapat lebih
harus diterima utuh oleh penerima manfaat.” mempermudah proses klasifikasi. Pengunaan Algoritma
ini lebih efektif dalam pengklasifikasian text mining,
 Tahap Replace serta memiliki 2 data yaitu data latih dan data uji.
mengganti suatu nila atau karakter tertentu dalam data
set dengan nilai atau karakter lain. IV. HASIL DAN PEMBAHASAN
: Jangan main main dengan bansos covid19 bansos
harus diterima utuh oleh penerima manfaat a) LITERATURE REVIEW
NO
2 Tahap Tokenization
proses mebagi teks menjadi unit unit yang lebih kecil.
: jangan | main | main | dengan | bansos | covid19 |
bansos | harus | diterima | utuh | oleh | penerima |
manfaat

3 Tahap Transform Case


merujuk pada pengubahan tipe huruf dalam teks seperti
mengubah huruf menjadi kecil semua atau besar semua.
: jangan main main dengan bansos covid19 bansos
harus diterima utuh oleh penerima manfaat

 Tahap Filter Stopword


proses menghilangkan kata-kata umum yang tidak
memiliki makna khusus atau katakata yang memiliki
imbuhan (di-, ke-, se-, me-, -lah, -nya, -an).
: main | main | bansos | covid19 | bansos | terima | utuh |
terima | manfaat b) DESKRIPSI DATA
Data yang digunakan untuk proses penelitian ini
 Tahap Filter Tokens merupakan data dari Twitter yang saya ambil dari
digunakan untuk memilih hanya token dengan batas Kaggle. Data Twitter ini berupa dokumen teks yang
minimum dan maksimum yang telah di tentukan. berasal dari komentar Twitter oleh user dengan
: main | main | bansos | covid19 | bansos | terima | utuh | berbagai topik. Dalam penelitan dibutuhkan data
terima | manfaat Twitter dengan topik bantuan sosial selama covid19,
dengan spesifikasi waktu data dari bulan Oktober
d) TF-IDF hingga November 2021.
Pada tahap ini dilakukan representasi data dengan
retrieve data (matriks yang mewakili kata dokumen). c) PENGOLAHAN & PENYAJIAN DATA
Selain proses tersebut terdapat fitur kemunculan kata
Data yang telah di-crawling dan tersimpan dalam
dengan Tf-Idf (Term frequency - Inverse Document
file .csv selanjutnya di-labelling di Rapidiner dengan
Frequency) [14].
menggunakan Operator Set Role. Labelling ini berguna
untuk menjadi acuan pembanding bagi label data
sebelum dilakukan klasifikasi dan label data setelah di
klasifikasi.

Gambar 2. Hasil Preprocessing TF-IDF 3


Template Penulisan Jurnal Methodika

7. Operator SplitData digunakan untuk memisahkan


data latih dan data uji, dengan Ratio data latih dan data
uji yaitu 10% : 90%. Perbandingan ratio berguna untuk
menentukan akurasi sentiment positive dan negative

8. Selanjutnya Operator Wordlist To Data digunakan


untuk mengkonversi daftar data menjadi format kata
label model dan menilai performance model yang
diterapkan oleh operator.

9. lalu terdapat operator example range untuk mengatur


dengan parameter seberapa banyak akan mengambil
data training.

10. Selanjutnya data training di-input ke operator yang


mengubah angka menjadi teks.
Gambar 3. Data Labelling
11. Kemudian output dari operator nominal to text akan
terhubung ke operator process document from data,
Proses selanjutnya dilakukan menggunakan rangkaian yaitu didalamnya terdapat proses preprocessing,
operator RapidMiner. Berikut proses dalam RapidMiner ekstraksi fitur menggunakan parameter tf-idf untuk data
: training.
1. Langkah pertama adalah meng-input data dari Kaggle
yang telah dilakukan cleansing data, dimasukkan ke 12. Data training dan data hasil klasifikasi Naïve Bayes
bagian Process menggunakan Retrieve Data. di pertemukan dalam operator apply model (2) untuk
membandingkan model dengan data yang belum di
2. Selanjutnya data masuk ke operator SetRole untuk label oleh hasil klasifikasi.
dilakukan pelabelan secara otomatis, untuk mengetahui
mana sentiment yang berlabel positive dan negative. 13. Data hasil label tersebut akan terhubung untuk input
ke operator performance (2) yang membandingkan 2
3. Kemudian data masuk ke dalam process lalu proses, yang pertama melalui klasifikasi yang kedua
menggunakan operator replace untuk membersihkan tidak melalui proses klasifikasi. Output dari operator
data dari atribut-atribut atau symbol yang tidak performance adalah performance akurasi data
digunakan seperti @, url, dan karakter lain yang tidak klasifikasi yang sudah diterapkan model dengan data
mempunyai arti. training yang tidak di klasifikasi.

4. Berlanjut pada Operator Nominal to Text, yang


bertujuan untuk mengganti tipe data dari polynomial ke
Text. Karena data yang di dapat bertipe polynomial.

5. Lalu masuk kedalam subproses dengan menggunakan


operator Process Document From Data yang memiliki
fungsi preprocessing, dan ekstraksi fitur dengan
parameter TF-IDF. Didalam proses tersebut terdapat
beberapa operator yang bertujuan untuk menambahkan
StopWord yang berfungsi untuk mengubah teks
menjadi kata per kata.
Gambar 4. Rangkaian Operator RapidMiner

6. Output sampel data pada operator Process Document


From Data langsung disambungkan ke port example
pada operator SplitData, sedangkan output word
dilanjutkan ke operator Wordlist To Data untuk
dilakukan perbandingan data dengan yang belum di beri
Gambar 5. Operator Process Document From Data
label.
d) HASIL PENELITIAN
Terdapat 2 result dari proses klasifikasi menggunakan
4
Template Penulisan Jurnal Methodika

algoritma Naive Bayes ini. Klasifikasi ini


menghasilkan 2.975 atribut dengan hasil sentimen
label yaitu nilai sentimen 2.235 positif, 443 negatif.
Serta menampilkan hasil performance vector yaitu
tingkat akurasi 65.57% . Data hasil di presentasikan
dengan tabel confusion matrix.

Gambar 6. Confusion Matrix

e) PENYAJIAN HASIL
Dari proses preprocessing dan pembobotan kata /
ekstraksi fitur menghasilkan atribut sebanyak 2.975
atribut. Maka diambil 21 atribut yang jumlah
kemunculannya paling banyak. Atribut tersebut
masukkan dalam operator wordlist yang akan
menyimpan data dalam tabel kata dan total jumlah
kemunculan kata. Data pada wordlist kemudian
ditampilkan menjadi wordcloud, wordcloud yang
ditampilkan merupakan 21 kata teratas yang jumlah
total kemunculan mencapai 545.

Gambar 7. Wordcloud 21 Kata Teratas

Anda mungkin juga menyukai