Paper 2 Kolom - Aspect Based Sentiment Analysis Rencana Pemindahan IKN Menggunakan Naive Bayes Classifier Dan Support Vector Machine
Paper 2 Kolom - Aspect Based Sentiment Analysis Rencana Pemindahan IKN Menggunakan Naive Bayes Classifier Dan Support Vector Machine
Abstract— The role of the capital city is very vital, at this time pemerataan di Indonesia dimana di Indonesia belum
the government has again decided to move the capital city because sepenuhnya merata terutama pembangunan dan pemerataan
Jakarta is considered no longer suitable as the capital city of the baik dari segi ekonomi maupun infrastruktur sarana prasarana
Republic of Indonesia. The relocation of Indonesia's capital city in yang ada di daerah-daerah tertinggal, terdepan dan terluar di
fact invites many pro and contra opinions among the public and
Indonesia. Tidak dapat dipungkiri bahwa juga ada masyarakat
this response is interesting to study, namely how the public views
this government policy which also describes the level of trust in
yang kontra terhadap pemindahan Ibukota ke Kalimantan
the government. Therefore, sentiment analysis is needed with a Timur. Ada yang menganggap bahwa persiapannya belum
machine learning-based classifier that is accurate and determines matang. Hal ini terjadi karena pemerintah dirasa kurang terbuka
the best algorithm. Data in the form of tweets is collected by web terhadap opini masyarakat, sehingga membawa kesan bahwa
scraping and pre-processed which produces data labels in the pemerintah belum siap terhadap pemindahan ibu kota. Selain
form of polarity and identified categories/aspects. Machine itu juga dengan banyaknya masalah di bidang ekonomi,
Learning model with Naive Bayes algorithm and Support Vector pendidikan, sosial budaya serta masalah lainnya yang belum
Machine is then used in the classification of binary class polarity teratasi. Hal-hal tersebut dapat menggiring opini masyarakat
with n-gram features (word order) and heuristic optimization,
bahwasannya pemerintah gegabah dalam pengambilan
namely Hyperparameter Tuning. From the combination of
features and optimization treatment, the MCC value as an
kebijakan pemindahan ibu kota. Dengan timbulnya opini pro
evaluation metric was compared and it was found that Naive dan kontra yang beragam dari masyarakat, rencana pemindahan
Bayes outperformed the Support Vector Machine in classifying ibu kota ini menjadi kasus yang menarik untuk diteliti tidak
public opinion on Twitter social media, especially regarding the hanya kecenderungannya melainkan juga pandangan mereka
relocation of the capital city. terhadap kebijakan pemerintah. Harapannya adalah kebijakan
yang dilakukan pemerintah dapat sejalan dengan aspirasi
Intisari— Peranan ibu kota sangatlah vital, saat ini pemerintah masyarakat dan pemerintah mampu mempersiapkannya dengan
kembali memutuskan pemindahan ibu kota karena Jakarta matang di berbagai aspek.
dianggap sudah tidak layak lagi menjadi ibu kota negara Timbulnya opini pro dan kontra masyarakat juga dapat
Republik Indonesia. Pemindahan ibu kota Indonesia nyatanya mempengaruhi tingkat kepercayaan masyarakat terhadap
mengundang banyaknya opini pro dan kontra di kalangan pemerintah dan dapat menjadi umpan balik yang berguna bagi
masyarakat dan respon ini menarik untuk diteliti yaitu pemerintah untuk mempertimbangkan segala aspek dalam
bagaimana pandangan masyarakat terhadap kebijakan
kebijakan berikutnya. Oleh karena itu, diperlukan sentiment
pemerintah ini yang juga menggambarkan tingkat kepercayaan
kepada pemerintah. Oleh karena itu, diperlukan sentiment analysis atau opinion mining yang akurat yang juga berarti
analysis dengan classifier berbasis machine learning yang akurat memerlukan classifier berbasis machine learning dengan nilai
dan menentukan algoritma yang terbaik. Data berupa tweets akurasi yang tinggi sehingga rumusan masalah yang diangkat
dikumpulkan dengan web scraping dan dilakukan pra- pada penelitian ini adalah “Apa algoritma Machine Learning
pemrosesan yang menghasilkan label data berupa polaritas dan terbaik untuk Opinion mining dalam menganalisis dan
kategori/aspek yang teridentifikasi. Model Machine Learning mengklasifikasikan opini masyarakat khususnya pengguna
dengan algoritma Naive Bayes dan Support Vector Machine Twitter mengenai rencana pemindahan ibu kota negara?”.
kemudian digunakan dalam klasifikasi polaritas kelas biner Tujuan yang ingin dicapai dari penelitian ini untuk melakukan
dengan fitur n-gram (urutan kata) dan optimasi heuristik yaitu
perbandingan dan menentukan model classifier terbaik pada
Hyperparameter Tuning. Dari kombinasi fitur dan perlakuan
optimasi, nilai MCC sebagai metrik evaluasi dibandingkan dan
analisis sentimen untuk mengklasifikasikan opini positif dan
ditemukan bahwa Naive Bayes mengungguli Support Vector negatif publik tentang wacana relokasi atau pemindahan ibu
Machine dalam mengklasifikasi opini publik di media sosial kota negara (IKN) dalam media sosial Twitter menggunakan
Twitter khususnya mengenai pemindahan ibu kota. Naive bayes, Support Vector Machine.
Untuk 𝑖 ≠ 𝑗, sehingga model gabungan dapat Gambar. 1 Hyperplane pemisah margin-maksimum keras
dinyatakan sebagai Secara matematis, diberikan satu set poin 𝑥𝑖 yang termasuk
𝑝(𝐶, 𝐹1 , … , 𝐹𝑛 ) = 𝑝(𝐶) 𝑝(𝐹1 |𝐶) 𝑝(𝐹2 |𝐶) 𝑝(𝐹3 |𝐶) … dalam dua kelas yang dapat dipisahkan secara linier 𝜔1 , 𝜔2 ,
|𝑔(𝑥)|
𝑛 jarak setiap instance dari hyperplane sama dengan ‖𝑤‖ . SVM
= 𝑝(𝐶) ∏ 𝑝(𝐹𝑖 |𝐶) bertujuan untuk menemukan w, b, sehingga nilai 𝑔(𝑥) sama
𝑖=1 dengan 1 untuk titik data terdekat milik kelas 𝜔1 dan -1 untuk
yang terdekat dari 𝜔2 . Ini dapat dilihat sebagai memiliki
Ini berarti bahwa di bawah asumsi independensi di atas, margin
distribusi bersyarat atas ndepend kelas C dapat 1 1 2
dinyatakan seperti ini: + =
‖𝑤‖ ‖𝑤‖ ‖𝑤‖
𝑛 sedangkan 𝑤 𝑇 𝑥 + 𝑏 = 1 untuk x ∈ 𝜔1 , dan 𝑤 𝑇 𝑥 + 𝑏 = −1
1
𝑝(𝐶|𝐹1 , … , 𝐹𝑛 ) = 𝑝(𝐶) ∏ 𝑝(𝐹𝑖 |𝐶) untuk x ∈ 𝜔2 .
𝑍 Hal ini menyebabkan masalah optimasi yang meminimalkan
𝑖=1
fungsi tujuan
di mana Z (bukti) adalah ndepe penskalaan yang 1
hanya bergantung pada 𝐹1 , … , 𝐹𝑛 , 𝑖. 𝑒., sebuah konstanta 𝐽(𝑤) = ‖𝑤‖2
2
jika nilai ndepend fitur diketahui. subject pada constraint
Diskusi sejauh ini telah menurunkan model fitur 𝑦𝑖 (𝑤𝑖𝑇 𝑥 + 𝑏) ≥ 1, 𝑖 = 1,2, … , 𝑁
ndependent, yaitu model probabilitas naif Bayes. Ketika masalah optimasi-apakah minimalisasi atau
Pengklasifikasi naif Bayes menggabungkan model ini maksimalisasi-memiliki kendala dalam variabel yang
dengan aturan keputusan. Satu aturan umum adalah dioptimalkan, fungsi biaya atau kesalahan ditambah dengan
memilih hipotesis yang paling mungkin; ini dikenal menambahkan kendala, dikalikan dengan pengali Lagrange.
sebagai aturan keputusan a posteriori atau MAP Fungsi Lagrangian untuk SVM dibentuk dengan menambah
maksimum. Pengklasifikasi yang sesuai adalah fungsi fungsi tujuan dengan jumlah terbobot dari kendala,
𝑁
classify yang didefinisikan sebagai berikut: 1
ℒ(𝑤, 𝑏, 𝜆) = 𝑤 𝑇 𝑤 − ∑ 𝜆𝑖 [𝑦𝑖 (𝑤 𝑇 𝑥𝑖 + 𝑏) − 1]
2
𝑐𝑙𝑎𝑠𝑠𝑖𝑓𝑦(𝑓1 , … , 𝑓𝑛 ) = 𝑎𝑟𝑔𝑚𝑎𝑥 𝑝(𝐶 𝑖=1
𝑛 di mana w dan B disebut variabel primal, dan 𝜆𝑖 pengali
= 𝑐) ∏ 𝑝(𝐹𝑖 = 𝑓𝑖 |𝐶 = 𝑐) Lagrange.
𝑖=1 Dengan adanya kendala pertidaksamaan,Karush-Kuhn-Tucker
(KKT) kondisi menggeneralisasi pengali Lagrange.
B. Support Vector Machine KKT syaratnya adalah:
Teknik SVM adalah pengklasifikasi yang 1. Kendala utama
menemukan hyperplane atau fungsi 𝑔(𝑥) = 𝑤 𝑇 𝑥 + 𝑏 −[𝑦𝑖 (𝑤 𝑇 𝑥𝑖 + 𝑏) − 1] ≤ 0 ∀𝑖 = 1, … , 𝑁
yang dengan benar memisahkan dua kelas dengan 2. Kendala ganda
margin maksimum. 𝜆𝑖 ≥ 0 ∀𝑖 = 1, … , 𝑁
3. Kelambanan komplementaritas
𝜆𝑖 [𝑦𝑖 (𝑤 𝑇 𝑥𝑖 + 𝑏) − 1] = 0 ∀𝑖 = 1, … , 𝑁
4. Gradien Lagrangian (nol, sehubungan dengan
variabel primal)
𝑤 − ∑𝑁𝑖=1 𝜆𝑖 𝑦𝑖 𝑥𝑖
∇ℒ(𝑤, 𝑏, 𝜆) = [ 𝑁 ]=0
− ∑𝑖=1 𝜆𝑖 𝑦𝑖
Berdasarkan kondisi KKT,