Paper 2 Kolom - Aspect Based Sentiment Analysis Rencana Pemindahan IKN Menggunakan Naive Bayes Classifier Dan Support Vector Machine

1
Aspect-Based Sentiment Analysis Rencana

Pemindahan Ibu Kota Negara Menggunakan Naïve
Bayes Classifier dan Support Vector Machine
Daffa Jatmiko1, Isti Surjandari 2
Abstract— The role of the capital city is very vital, at this time pemerataan di Indonesia dimana di Indonesia belum
the government has again decided to move the capital city because sepenuhnya merata terutama pembangunan dan pemerataan
Jakarta is considered no longer suitable as the capital city of the baik dari segi ekonomi maupun infrastruktur sarana prasarana
Republic of Indonesia. The relocation of Indonesia's capital city in yang ada di daerah-daerah tertinggal, terdepan dan terluar di
fact invites many pro and contra opinions among the public and
Indonesia. Tidak dapat dipungkiri bahwa juga ada masyarakat
this response is interesting to study, namely how the public views
this government policy which also describes the level of trust in
yang kontra terhadap pemindahan Ibukota ke Kalimantan
the government. Therefore, sentiment analysis is needed with a Timur. Ada yang menganggap bahwa persiapannya belum
machine learning-based classifier that is accurate and determines matang. Hal ini terjadi karena pemerintah dirasa kurang terbuka
the best algorithm. Data in the form of tweets is collected by web terhadap opini masyarakat, sehingga membawa kesan bahwa
scraping and pre-processed which produces data labels in the pemerintah belum siap terhadap pemindahan ibu kota. Selain
form of polarity and identified categories/aspects. Machine itu juga dengan banyaknya masalah di bidang ekonomi,
Learning model with Naive Bayes algorithm and Support Vector pendidikan, sosial budaya serta masalah lainnya yang belum
Machine is then used in the classification of binary class polarity teratasi. Hal-hal tersebut dapat menggiring opini masyarakat
with n-gram features (word order) and heuristic optimization,
bahwasannya pemerintah gegabah dalam pengambilan
namely Hyperparameter Tuning. From the combination of
features and optimization treatment, the MCC value as an
kebijakan pemindahan ibu kota. Dengan timbulnya opini pro
evaluation metric was compared and it was found that Naive dan kontra yang beragam dari masyarakat, rencana pemindahan
Bayes outperformed the Support Vector Machine in classifying ibu kota ini menjadi kasus yang menarik untuk diteliti tidak
public opinion on Twitter social media, especially regarding the hanya kecenderungannya melainkan juga pandangan mereka
relocation of the capital city. terhadap kebijakan pemerintah. Harapannya adalah kebijakan
yang dilakukan pemerintah dapat sejalan dengan aspirasi
Intisari— Peranan ibu kota sangatlah vital, saat ini pemerintah masyarakat dan pemerintah mampu mempersiapkannya dengan
kembali memutuskan pemindahan ibu kota karena Jakarta matang di berbagai aspek.
dianggap sudah tidak layak lagi menjadi ibu kota negara Timbulnya opini pro dan kontra masyarakat juga dapat
Republik Indonesia. Pemindahan ibu kota Indonesia nyatanya mempengaruhi tingkat kepercayaan masyarakat terhadap
mengundang banyaknya opini pro dan kontra di kalangan pemerintah dan dapat menjadi umpan balik yang berguna bagi
masyarakat dan respon ini menarik untuk diteliti yaitu pemerintah untuk mempertimbangkan segala aspek dalam
bagaimana pandangan masyarakat terhadap kebijakan
kebijakan berikutnya. Oleh karena itu, diperlukan sentiment
pemerintah ini yang juga menggambarkan tingkat kepercayaan
kepada pemerintah. Oleh karena itu, diperlukan sentiment analysis atau opinion mining yang akurat yang juga berarti
analysis dengan classifier berbasis machine learning yang akurat memerlukan classifier berbasis machine learning dengan nilai
dan menentukan algoritma yang terbaik. Data berupa tweets akurasi yang tinggi sehingga rumusan masalah yang diangkat
dikumpulkan dengan web scraping dan dilakukan pra- pada penelitian ini adalah “Apa algoritma Machine Learning
pemrosesan yang menghasilkan label data berupa polaritas dan terbaik untuk Opinion mining dalam menganalisis dan
kategori/aspek yang teridentifikasi. Model Machine Learning mengklasifikasikan opini masyarakat khususnya pengguna
dengan algoritma Naive Bayes dan Support Vector Machine Twitter mengenai rencana pemindahan ibu kota negara?”.
kemudian digunakan dalam klasifikasi polaritas kelas biner Tujuan yang ingin dicapai dari penelitian ini untuk melakukan
dengan fitur n-gram (urutan kata) dan optimasi heuristik yaitu
perbandingan dan menentukan model classifier terbaik pada
Hyperparameter Tuning. Dari kombinasi fitur dan perlakuan
optimasi, nilai MCC sebagai metrik evaluasi dibandingkan dan
analisis sentimen untuk mengklasifikasikan opini positif dan
ditemukan bahwa Naive Bayes mengungguli Support Vector negatif publik tentang wacana relokasi atau pemindahan ibu
Machine dalam mengklasifikasi opini publik di media sosial kota negara (IKN) dalam media sosial Twitter menggunakan
Twitter khususnya mengenai pemindahan ibu kota. Naive bayes, Support Vector Machine.
Kata Kunci— sentiment analysis, opinion mining, social media,

II. TINJAUAN TEORITIS
Nave Bayes, Support Vector Machine A. Naïve Bayes
I. PENDAHULUAN Dengan menggunakan teorema Bayes, dapat ditulis
Berkaitan dengan kebijakan Pemerintah mengenai p(C)p(F1 ,…,Fn |C)
p(C|F1 , … , Fn ) = . Dalam bahasa Inggris
p(F1 ,…,Fn )
pemindahan Ibukota ke Kalimantan Timur, banyak masyarakat
menunjukkan sikap setuju. Banyak faktor yang mendasari sikap sederhana persamaan di atas dapat ditulis sebagai
𝑝𝑟𝑖𝑜𝑟×𝑙𝑖𝑘𝑒𝑙𝑖ℎ𝑜𝑜𝑑
setuju dari mayoritas, terutama faktor yang terkait dengan 𝑝𝑜𝑠𝑡𝑒𝑟𝑖𝑜𝑟 = . Dalam prakteknya hanya
𝑒𝑣𝑖𝑑𝑒𝑛𝑐𝑒
Daffa Jatmiko: Aspect-Based Sentiment Analysis…

2
difokuskan pada pembilang dari pecahan tersebut, karena
penyebutnya tidak bergantung pada C dan nilai fitur Fi
diberikan, sehingga penyebutnya konstan secara efektif.
Pembilangnya setara dengan model probabilitas gabungan
p(C, F1 , … , Fn )
Sekarang asumsi independensi bersyarat “naif” mulai
berlaku: asumsikan bahwa setiap fitur ndependent
bersyarat dari setiap fitur lainnya untuk. Ini berarti bahwa
𝑝(𝐹𝑖 |𝐶, 𝐹𝑗 ) = 𝑝(𝐹𝑖 |𝐶)
Untuk 𝑖 ≠ 𝑗, sehingga model gabungan dapat Gambar. 1 Hyperplane pemisah margin-maksimum keras
dinyatakan sebagai Secara matematis, diberikan satu set poin 𝑥𝑖 yang termasuk
𝑝(𝐶, 𝐹1 , … , 𝐹𝑛 ) = 𝑝(𝐶) 𝑝(𝐹1 |𝐶) 𝑝(𝐹2 |𝐶) 𝑝(𝐹3 |𝐶) … dalam dua kelas yang dapat dipisahkan secara linier 𝜔1 , 𝜔2 ,
|𝑔(𝑥)|
𝑛 jarak setiap instance dari hyperplane sama dengan ‖𝑤‖ . SVM
= 𝑝(𝐶) ∏ 𝑝(𝐹𝑖 |𝐶) bertujuan untuk menemukan w, b, sehingga nilai 𝑔(𝑥) sama
𝑖=1 dengan 1 untuk titik data terdekat milik kelas 𝜔1 dan -1 untuk
yang terdekat dari 𝜔2 . Ini dapat dilihat sebagai memiliki
Ini berarti bahwa di bawah asumsi independensi di atas, margin
distribusi bersyarat atas ndepend kelas C dapat 1 1 2
dinyatakan seperti ini: + =
‖𝑤‖ ‖𝑤‖ ‖𝑤‖
𝑛 sedangkan 𝑤 𝑇 𝑥 + 𝑏 = 1 untuk x ∈ 𝜔1 , dan 𝑤 𝑇 𝑥 + 𝑏 = −1
1
𝑝(𝐶|𝐹1 , … , 𝐹𝑛 ) = 𝑝(𝐶) ∏ 𝑝(𝐹𝑖 |𝐶) untuk x ∈ 𝜔2 .
𝑍 Hal ini menyebabkan masalah optimasi yang meminimalkan
𝑖=1
fungsi tujuan
di mana Z (bukti) adalah ndepe penskalaan yang 1
hanya bergantung pada 𝐹1 , … , 𝐹𝑛 , 𝑖. 𝑒., sebuah konstanta 𝐽(𝑤) = ‖𝑤‖2
2
jika nilai ndepend fitur diketahui. subject pada constraint
Diskusi sejauh ini telah menurunkan model fitur 𝑦𝑖 (𝑤𝑖𝑇 𝑥 + 𝑏) ≥ 1, 𝑖 = 1,2, … , 𝑁
ndependent, yaitu model probabilitas naif Bayes. Ketika masalah optimasi-apakah minimalisasi atau
Pengklasifikasi naif Bayes menggabungkan model ini maksimalisasi-memiliki kendala dalam variabel yang
dengan aturan keputusan. Satu aturan umum adalah dioptimalkan, fungsi biaya atau kesalahan ditambah dengan
memilih hipotesis yang paling mungkin; ini dikenal menambahkan kendala, dikalikan dengan pengali Lagrange.
sebagai aturan keputusan a posteriori atau MAP Fungsi Lagrangian untuk SVM dibentuk dengan menambah
maksimum. Pengklasifikasi yang sesuai adalah fungsi fungsi tujuan dengan jumlah terbobot dari kendala,
𝑁
classify yang didefinisikan sebagai berikut: 1
ℒ(𝑤, 𝑏, 𝜆) = 𝑤 𝑇 𝑤 − ∑ 𝜆𝑖 [𝑦𝑖 (𝑤 𝑇 𝑥𝑖 + 𝑏) − 1]
2
𝑐𝑙𝑎𝑠𝑠𝑖𝑓𝑦(𝑓1 , … , 𝑓𝑛 ) = 𝑎𝑟𝑔𝑚𝑎𝑥 𝑝(𝐶 𝑖=1
𝑛 di mana w dan B disebut variabel primal, dan 𝜆𝑖 pengali
= 𝑐) ∏ 𝑝(𝐹𝑖 = 𝑓𝑖 |𝐶 = 𝑐) Lagrange.
𝑖=1 Dengan adanya kendala pertidaksamaan,Karush-Kuhn-Tucker
(KKT) kondisi menggeneralisasi pengali Lagrange.
B. Support Vector Machine KKT syaratnya adalah:
Teknik SVM adalah pengklasifikasi yang 1. Kendala utama
menemukan hyperplane atau fungsi 𝑔(𝑥) = 𝑤 𝑇 𝑥 + 𝑏 −[𝑦𝑖 (𝑤 𝑇 𝑥𝑖 + 𝑏) − 1] ≤ 0 ∀𝑖 = 1, … , 𝑁
yang dengan benar memisahkan dua kelas dengan 2. Kendala ganda
margin maksimum. 𝜆𝑖 ≥ 0 ∀𝑖 = 1, … , 𝑁
3. Kelambanan komplementaritas
𝜆𝑖 [𝑦𝑖 (𝑤 𝑇 𝑥𝑖 + 𝑏) − 1] = 0 ∀𝑖 = 1, … , 𝑁
4. Gradien Lagrangian (nol, sehubungan dengan
variabel primal)
𝑤 − ∑𝑁𝑖=1 𝜆𝑖 𝑦𝑖 𝑥𝑖
∇ℒ(𝑤, 𝑏, 𝜆) = [ 𝑁 ]=0
− ∑𝑖=1 𝜆𝑖 𝑦𝑖
Berdasarkan kondisi KKT,

3
𝑁
B. Identifikasi aspek
𝑤 = ∑ 𝜆𝑖 𝑦𝑖 𝑥𝑖 Kategori aspek (misalnya, makanan, harga)
𝑖=1 mengidentifikasi fitur yang lebih kasar daripada istilah aspek,
𝑁
dan mereka tidak selalu muncul sebagai istilah dalam kalimat
∑ 𝜆𝑖 𝑦𝑖 = 0 tertentu. Dalam contoh topik pemindahan IKN di atas, presiden,
𝑖=1 menteri, dan pemerintah yang mengacu pada kategori aspek
Masalah ganda optimasi SVM adalah menemukan “Pelaksanaan atau Implementasi IKN” karena pada konteks
𝑁
1 tweets di atas dijelaskan bahwa entitas-entitas tersebut yang
𝑚𝑎𝑥 (∑ 𝜆𝑖 − ∑ 𝜆𝑖 𝜆𝑗 𝑦𝑖 𝑦𝑗 𝑥𝑖 𝑥𝑗 ) turun tangan dalam pengerjaan dan pelaksanaan pemindahan
2
𝑖=1 𝑖,𝑗 IKN (tidak disebutkan secara eksplisit atau langsung melainkan
Subject pada implisit)..
𝑁
Terdapat pula banyak tweets yang langsung disebutkan
∑ 𝜆𝑖 𝑦𝑖 = 0 secara jelas seperti Kalimantan, Samarinda, dll yang merujuk
𝑖=1 pada pemilihan lokasi Ibu Kota baru sehingga masuk ke dalam
𝜆𝑖 ≥ 0 ∀𝑖 aspek “Lokasi”. Ada pula beberapa Istilah yang memiliki arti
yang sama seperti rakyat, penduduk, dan warga dimana
meskipun terdapat sedikit perbedaan pada definisinya namun
III. METODE PENELITIAN berdasarkan konteks mengacu pada entitas yang sama sehingga
Alur penelitian ini terdiri dari 7 tahap yaitu Inisiasi masuk ke dalam kategori aspek “Sosial”.
Penelitian (Research Initiation) yang dimulai dari proses TABEL 2
identifikasi masalah hingga proses studi literatur mengenai DAFTAR 7 ASPEK PEMINDAHAN IKN BERSERTA KATA KUNCINYA
opinion mining dan pemindahan IKN. Kemudian tahap
Aspek
Pemrosesan Data (Data Processing) yang dimulai dari proses Pelaksanaan Lokasi Pengelola Pembangunan
pengumpulan data hingga proses filtering. Berikutnya adalah IKN IKN Infrastruktur
tahap Aspect Identification yang dilanjutkan dengan Feature lain
Generation yaitu aplikasi N-Grams. Dua tahap terakhir adalah Jokowi Dki Jakarta Ahok Train
Classifier Building dengan Naïve Bayes dan Support Vector government East candidates Project
Machine dengan optimasi metaheuristik yaitu Hyperparameter kalimantan
Tuning (Hyperparameter Optimization) dan Evaluation dengan Minister Kalimantan Leader of Airport
Confusion Matrix yang mengukur precision, recall, accuracy, new
dan specificity dan juga Matthews Correlation Coefficient capital
(MCC). RUU Bekasi Chief Construction
ikn Bandung Authority Infrastructure
A. Pra-pemrosesan data Ikn law Samarinda
Seluruh dokumen harus dalam Times New Roman atau progress
relocation
Times font. Font tipe 3 tidak boleh digunakan. Jenis font lain
dapat digunakan jika diperlukan untuk tujuan khusus.
Aspek
Fitur ukuran font dapat dilihat pada Tabel 1.
Ekonomi Sosial Lingkung
TABEL 1 an
TAHAP PRA-PEMROSESAN money people habitat
No. Fase locals komodo
budget dragon
1 Pengumpulan Data, web scraping dengan Bahasa
pemrograman Python melalui Twitter Developer citizen komodo
debt island
Platform (Twitter API).
2 Penerjemahan Data, proses menerjemahkan tweets demonstrati orang utan
benefit on
menjadi Bahasa Inggris
3 Penghilangan Duplikasi, Menghapus contoh duplikat pay students Forest
sehingga hanya satu dari semua contoh duplikat yang cost
disimpan. funds
4 Penghapusan Ekspresi Reguler, mengganti ekspresi investment
regular menjadi dihilangkan
pertamina
5 Pelabelan Polaritas, Teks yang disediakan dianalisis
untuk menentukan apakah teks tersebut
garuda
mengekspresikan sentimen positif/negatif/netral. bumn
Karena algoritma SVM dipakai, maka dibutuhkan state-owned
polaritas yang biner sehingga difilter Kemba.i enterprises
menjadi hanya polaritas positif dan negative.

4
E. Evaluasi k-fold cross validation
ASPECTS PERCENTAGE Terdapat 4 model yang akan di evaluasi yaitu : Naïve Bayes,
Social Economy Optimized Naïve Bayes, Support Vector Machine, dan
Other 12% 16% Optimized Support Vector Machine. Confusion matrix, kriteria
infrastructure
development
performa model akan dipaparkan lebih lanjut pada analisis hasil
Environmen…
9% penelitian. Evaluasi semua model dilakukan dengan 10-fold
validation sehingga tidak diperlukannya data testing dan
Location training ataupun split dalam data.
9%
IV. HASIL PENELITIAN DAN PEMBAHASAN
IKN Analisis terakhir pada penelitian ini adalah perbandingan
IKN implementation antara semua model klasifikasi yang telah dikembangkan.
manager 36%
16%
Tabel 5. memuat semua nilai evaluasi performa dari model.
Menariknya, baik NB dan SVM yang dioptimalkan
Gambar. 2 Persentase 7 Aspek dalam data tweets mengungguli pengklasifikasi default mereka sendiri. NB
default belum dapat menangani tugas klasifikasi dengan baik
C. Generasi fitur N-grams
dengan akurasi dan MCC berturut-turut sebesar 61,76% dan 10%
Metode untuk memeriksa 'n' kata atau suara terus menerus pada model unigram, 59,76% dan 11% pada model bigram, dan
dari urutan teks atau ucapan yang diberikan. Model ini 67,20% dan 26% pada model trigram. Sementara itu, hasil NB
membantu untuk memprediksi item berikutnya secara yang dioptimalkan menghasilkan kinerja yang hanya sedikit
berurutan. Dalam analisis sentimen, model n-gram membantu lebih baik (tidak signifikan) jika dibandingkan dengan NB
menganalisis sentimen dari teks atau dokumen. Digunakan default perbedaan akurasi sebesar 2,33% pada model unigram,
operator Generate n-grams yang membuat semua kemungkinan 5,88% pada model bigram, dan 1,21% pada model trigram.
n-Gram dari setiap token dalam dokumen.
TABEL 5
D. Pembangunan model klasifikasi TAHAP PEMROSESAN TWEETS SEBELUM MODEL KLASIFIKASI ML
Setelah tweets diidentifikasi ke dalam beberapa aspek dan Model Klasifikasi

Kriteria
dibagi menjadi beberapa urutan teks, tweets kemudian diproses Default Optimized Default Optimized
Evaluasi
terlebih dahulu melalui beberapa tahap sebelum dioptimasi NB NB SVM SVM
parameternya (Hyperparameter Tuning). Setelah tweets akan Unigram
masuk ke dalam model klasifikasi Machine Learning. Tabel 3 Accuracy 61.76% 64.09% 62.69% 62.85%
Precision 64.91% 66.80% 62.69% 62.91%
mendeskripsikan proses model klasifikasi ML dan table 4
Sensitivity 84.94% 84.94% 100.00% 99.26%
menjelaskan parameter yang digunakan untuk masing-masing
Specificity 22.82% 29.05% 0.00% 1.66%
algoritma.
MCC 10% 17% 0% 4%
TABEL 3 Bigram
TAHAP PEMROSESAN TWEETS SEBELUM MODEL KLASIFIKASI ML Accuracy 59.76% 65.64% 61.94% 58.21%
No. Fase Precision 66.08% 66.91% 66.13% 69.12%
1 Case folding, konversi semua karakter dalam Sensitivity 73.58% 89.38% 80.49% 60.25%
dokumen menjadi huruf kecil semua Specificity 36.51% 25.73% 30.71% 54.77%
2 Tokenization, mengubah teks menjadi token sebelum MCC 11% 20% 13% 15%
mengubahnya menjadi vektor Trigram
3 Filter stopwords, menghilangkan kata-kata umum Accuracy 67.20% 68.41% 64.56% 66.10%
yang tidak memiliki makna atau informasi yang Precision 69.57% 69.82% 65.44% 73.02%
dibutuhkan (Ling et al. 2014) Sensitivity 84.69% 87.41% 92.10% 72.84%
4 Stemming, menghilangkan akhiran kata dan Specificity 37.76% 36.51% 18.26% 54.77%
membawanya ke kata dasar MCC 26% 28% 16% 28%
TABEL 4
PARAMETER NAÏVE BAYES DAN SUPPORT VECTOR MACHINE YANG Sama seperti sedikit perbaikan dari standar ke
DIOPTIMASI dioptimalkan dalam kinerja NB, Hyperparameter tuning
(Parameter optimization) hanya meningkatkan beberapa
Algoritma Parameter Grid/range
kinerja SVM menjadi sedikit lebih baik (tidak signifikan).
Number of 1-10
Naïve Bayes kernels Peningkatan akurasi dan MCC dalam SVM masing-masing
Bandwidth 0,1-0,5 sebesar 0,16% dan 4,29% pada model unigram, penurunan
Support C 0,1-100 akurasi sebesar 3,73% dan peningkatan MCC sebesar 1,85%
Vector 0,0001-10 pada model bigram, dan peningkatan sebesar 1,54% dan 12%
Gamma pada model trigram. Tanpa optimasi, dapat dikatakan SVM
Machine
masih dapat menjalankan tugas klasifikasinya meskipun
dengan nilai presisi dan specificity yang lebih kecil. Dengan

5
nilai MCC sebesar 16%, dapat disimpulkan bahwa model ini Studi dapat ditingkatkan di masa depan dengan
bukan definisi klasifier yang bagus dan bahkan hanya mencapai menambahkan lebih banyak pengklasifikasi antara lain :
28% setelah teroptimasi. Pada kasus ini, NB terbukti lebih baik random forest, decision tree, dan k-nearest neighbors serta
dari SVM ketika dioptimalkan meskipun dengan perbedaan perlakuan optimasi yang lebih beragam dan tepat. Penambahan
yang sangat kecil (perbedaan akurasi hanya 2,31% dan 0% pengklasifikasi ini diharapkan dapat memberikan wawasan
perbedaan MCC), yang menjadikan NB sebagai pengklasifikasi baru mengenai hasil dan karakteristik model yang dihasilkan
terbaik dalam penelitian ini. karena tidak menutup kemungkinan algoritme pengklasifikasi
30% 28% 28% selain NB maupun SVM dapat menghasilkan performa yang
26% lebih baik serta dengan perlakuan optimasi lainnya yang
25% memungkinkan model untuk bekerja lebih baik lagi dari
20% sebelumnya sehingga direkomendasikan untuk penelitian
20% 17% mendatang. Selain itu, dengan meningkatnya jumlah pengguna
15% 16%
15% 13% media social seperti Twitter, studi lebih lanjut diharapkan dapat
10%11% menemukan lebih banyak teknik dan cara memproses data teks
10% sentiment analysis yang tepat dan dapat digunakan jika bahasa
4% pada data bukanlah Bahasa standar yaitu Bahasa Inggris yang
5% sudah tersedia pada korpus untuk proses pembelajaran model
0%
0% yang akurat sehingga performa model dapat terus meningkat.
Optimized NB Optimized Default NB Default SVM
UCAPAN TERIMA KASIH
SVM
Judul untuk ucapan terima kasih dan referensi tidak diberi
MCC Unigram MCC Bigram MCC Trigram nomor. Terima kasih disampaikan kepada Tim TEKNOSI yang
telah meluangkan waktu untuk membuat template ini.
Gambar. 3 Peringkat Performa Model Berdasarkan Nilai MCC
REFERENSI
MCC digunakan sebagai kriteria utama untuk menentukan [1] Arslan, M. (2014). The significance of shifting capital of KAZAKSTAN
peringkat pengklasifikasi pada gambar 4.13. Pengklasifikasi from ALMATY TO ASTANA: An EVALUTION on the basis of
terbaik dalam penelitian ini adalah NB trigram teroptimasi geopolitical and Demographic Developments. Procedia - Social and
Behavioral Sciences, 120, 98–109.
diikuti oleh SVM trigram teroptimasi, kemudian NB Default https://doi.org/10.1016/j.sbspro.2014.02.086
trigram, dan terakhir, SVM default trigram. [2] Amrani, Y. A., Lazaar, M., & Kadiri, K. E. (2018). A novel hybrid
classification approach for sentiment analysis of text document.
V. KESIMPULAN International Journal of Electrical and Computer Engineering (IJECE),
8(6), 4554–4567. https://doi.org/10.11591/ijece.v8i6.pp4554-4567
Penelitian ini juga berfungsi sebagai studi perbandingan [3] Carley, K. M., Malik, M., Kowalchuck, M., Pfeffer, J., & Landwehr, P.
antara dua metode dan perlakuan penyetelan parameter (2015). Twitter usage in Indonesia. SSRN Electronic Journal.
optimasi yang diberikan kepada masing-masing metode. https://doi.org/10.2139/ssrn.2720332
Bertentangan dengan penelitian Kristiyanti et al pada tahun [4] Hamdan, H., Bellot, P., & Bechet, F. (2015). Lsislif: CRF and
logistic regression for Opinion target extraction and Sentiment
2020 dan Hakim et al pada 2021, penelitian ini menemukan POLARITY ANALYSIS. Proceedings of the 9th International
bahwa NB terbukti mengungguli SVM jika penyetelan Workshop on Semantic Evaluation (SemEval 2015), 753–758.
parameter optimasi dilakukan sebelum proses pembelajaran https://doi.org/10.18653/v1/s15-2128
terjadi. Jika tidak ada proses optimasi yang dilakukan, [5] Kelly, J. (2020). The city Sprouted: The rise of BRASÍLIA.
http://www.jstor.org/stable/10.2307/26924964?refreqid=search-
penelitian ini tetap sejalan dengan banyak penelitian serupa gateway.
dimana Naïve Bayes menjadi pilihan model klasifikasi terbaik [6] Logan, D. (2013, October 20). Myanmar's Phantom capital. The
karena kecepetan belajar dengan fitur berdimensi tinggi pada Globalist. https://www.theglobalist.com/myanmars-phantom-capital/.
data training yang terbatas. [7] Luo, P., Kang, S., Apip, Zhou, M., Lyu, J., Aisyah, S., Binaya, M.,
Regmi, R. K., & Nover, D. (2019). Water quality trend assessment in
Optimize parameters terbukti mampu meningkatkan Jakarta: A rapidly growing Asian megacity. PLOS ONE, 14(7).
performa model klasifikasi dengan waktu komputasi yang https://doi.org/10.1371/journal.pone.0219009
cukup singkat. Peningkatan pada NB tergolong tidak signifikan [8] Maitra, S., Madan, S., Kandwal, R., & Mahajan, P. (2018). Mining
namun mampu menunjukkan bahwa algoritme NB dapat authentic student feedback for faculty using naïve Bayes classifier.
Procedia Computer Science, 132, 1171–1183.
memberikan hasil yang lebih memuaskan jika parameter yang https://doi.org/10.1016/j.procs.2018.05.032
digunakan sesuai dan tepat. Dari penelitian ini, didapatkan 4 [9] Narayanan, V., Arora, I., & Bhatia, A. (2013). Fast and accurate
pengklasifikasi walaupun tidak cukup baik yaitu NB sentiment classification using an enhanced naive bayes model.
teroptimasi, SVM teroptimasi, NB default, dan SVM default Intelligent Data Engineering and Automated Learning – IDEAL 2013,
194–201. https://doi.org/10.1007/978-3-642-41278-3_24
dengan ketiga model pertama bekerja lebih baik dibandingkan [10] Ni, P., Kamiya, M., & Ding, R. (2018). Cities network along the
model SVM default yang hampir tidak mampu untuk Silk road: The global Urban competitiveness report 2017. SPRINGER.
melakukan tugas klasifikasi sentiment analysis. [11] Pak, A., & Paroubek, P. (2010). Twitter as a Corpus for Sentiment
Analysis and Opinion mining . Proceedings of the Seventh International
VI. SARAN Conference on Language Resources and Evaluation (LREC'10).
[12] Park, C. W., & Seo, D. R. (2018). Sentiment analysis of twitter corpus
related to artificial intelligence assistants. 2018 5th International

6
Conference on Industrial Engineering and Applications (ICIEA).
https://doi.org/10.1109/iea.2018.8387151
[13] Putri, R. F., Wibirama, S., Sukamdi, & Giyarsih, S. R. (2018).
Population condition analysis of jakarta land deformation area. IOP
Conference Series: Earth and Environmental Science, 148, 012007.
https://doi.org/10.1088/1755-1315/148/1/012007
[14] Reva, D. (2017, May 9). Capital City Relocation and National Security:
The Cases of Nigeria and Kazakhstan. UPSpace.
http://hdl.handle.net/2263/60413.
[15] Siegel, F. R. (2020). Coastal city flooding. In Adaptations of coastal
cities to global warming, sea level rise, climate change and endemic
hazards (pp. 27–34). essay, Springer.
[16] Sutoyo, E., & Almaarif, A. (2020). Educational Data Mining for
Predicting Student Graduation Using the Naïve Bayes Classifier
Algorithm. Jurnal RESTI (Rekayasa Sistem Dan Teknologi Informasi),
4(1), 95–101. https://doi.org/10.29207/resti.v4i1.1502
[17] Bayhaqy, A., Sfenrianto, S., Nainggolan, K., & Kaburuan, E. R.
(2018). Sentiment analysis about e-commerce from tweets using
decision tree, K-nearest neighbor, and Naïve Bayes. 2018 International
Conference on Orange Technologies (ICOT).
https://doi.org/10.1109/icot.2018.8705796
[18] Fitri, V. A., Andreswari, R., & Hasibuan, M. A. (2019). Sentiment
analysis of social media Twitter with case of anti-LGBT campaign in
Indonesia using naïve Bayes, decision tree, and Random Forest
algorithm. Procedia Computer Science, 161, 765–772.
https://doi.org/10.1016/j.procs.2019.11.181
[19] Guia, M., Silva, R., & Bernardino, J. (2019). Comparison of naïve
Bayes, support Vector Machine, decision trees and random forest on
sentiment analysis. Proceedings of the 11th International Joint
Conference on Knowledge Discovery, Knowledge Engineering and
Knowledge Management. https://doi.org/10.5220/0008364105250531
[20] Hakim, S. N., Putra, A. J., & Khasanah, A. U. (2021). Sentiment
analysis on myindihome user reviews using support vector machine and
naïve Bayes classifier method. International Journal of Industrial
Optimization, 2(2), 151. https://doi.org/10.12928/ijio.v2i2.4437
[21] Joachims, T. (1998). Text categorization with support Vector
MACHINES: Learning with many relevant features. Machine Learning:
ECML-98, 137–142. https://doi.org/10.1007/bfb0026683
[22] Kristiyanti, D. A., Putri, D. A., Indrayuni, E., Nurhadi, A., & Umam,
A. H. (2020). E-wallet sentiment analysis using naïve Bayes and Support
Vector Machine algorithm. Journal of Physics: Conference Series, 1641,
012079. https://doi.org/10.1088/1742-6596/1641/1/012079
[23] Neogi, A. S., Garg, K. A., Mishra, R. K., & Dwivedi, Y. K. (2021).
Sentiment analysis and classification of Indian Farmers’ protest using
Twitter data. International Journal of Information Management Data
Insights, 1(2), 100019. https://doi.org/10.1016/j.jjimei.2021.100019

Paper 2 Kolom - Aspect Based Sentiment Analysis Rencana Pemindahan IKN Menggunakan Naive Bayes Classifier Dan Support Vector Machine

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Paper 2 Kolom - Aspect Based Sentiment Analysis Rencana Pemindahan IKN Menggunakan Naive Bayes Classifier Dan Support Vector Machine

Diunggah oleh

Hak Cipta:

Format Tersedia

1

Aspect-Based Sentiment Analysis Rencana

Kata Kunci— sentiment analysis, opinion mining, social media,

Daffa Jatmiko: Aspect-Based Sentiment Analysis…

𝑝(𝐹𝑖 |𝐶, 𝐹𝑗 ) = 𝑝(𝐹𝑖 |𝐶)

Daffa Jatmiko: Aspect-Based Sentiment Analysis…

Daffa Jatmiko: Aspect-Based Sentiment Analysis…

Setelah tweets diidentifikasi ke dalam beberapa aspek dan Model Klasifikasi

Daffa Jatmiko: Aspect-Based Sentiment Analysis…

Daffa Jatmiko: Aspect-Based Sentiment Analysis…

Daffa Jatmiko: Aspect-Based Sentiment Analysis…

Anda mungkin juga menyukai