Anda di halaman 1dari 34

VISUALISASI POLA SPASIAL SENTIMEN PILPRES

INDONESIA TAHUN 2024 MENGGUNAKAN DATA TWITTER

Judul

PROPOSAL TESIS

Diajukan oleh:

AFFINA DYAN SETYAWATI


21/489570/PTK/14292

Kepada:

PROGRAM STUDI MAGISTER TEKNIK GEOMATIKA


DEPARTEMEN TEKNI GEODESI
FAKULTAS TEKNIK
UNIVERSITAS GADJAH MADA
YOGYAKARTA
2023
PROPOSAL TESIS

Persetujuan
VISUALISASI POLA SPASIAL SENTIMEN PILPRES
INDONESIA TAHUN 2024 MENGGUNAKAN DATA TWITTER

AFFINA DYAN SETYAWATI


21/489570/PTK/14292

Telah disetujui oleh:

Pembimbing Utama,

Dr. Ir. Diyono, S.T., M.T., IPU. Tanggal: …………………………


NIP. 196910101994031002

ii
DAFTAR ISI

Judul .............................................................................................................................. i
Persetujuan ................................................................................................................... ii
DAFTAR ISI............................................................................................................... iii
BAB I PENDAHULUAN ............................................................................................ 1
I.1. Latar Belakang ................................................................................................... 1
I.2. Rumusan Masalah .............................................................................................. 3
I.3. Tujuan Penelitian ............................................................................................... 3
I.4. Pertanyaan Penelitian ........................................................................................ 3
I.5. Manfaat Penelitian ............................................................................................. 3
I.6. Cakupan Penelitian ............................................................................................ 4
I.7. Tinjauan Pustaka ................................................................................................ 4
BAB II LANDASAN TEORI .................................................................................... 11
II.1. Big Data ......................................................................................................... 11
II.1.1. Machine Learning ................................................................................ 13
II.1.2. Data Twitter ......................................................................................... 14
II.2. Natural Language Processing ........................................................................ 15
II.2.1. Analisis Sentimen ................................................................................ 15
II.2.2. Geoparsing........................................................................................... 16
II.3. Visualisasi ...................................................................................................... 17
II.4. Webmap .......................................................................................................... 19
II.5. Uji Usabilitas .................................................................................................. 21
BAB III RENCANA PENELITIAN.......................................................................... 23
III.1. Persiapan ....................................................................................................... 23
III.1.1. Persiapan Alat .................................................................................. 23
III.1.2. Persiapan Bahan ............................................................................... 23
III.2. Cara Penelitian .............................................................................................. 24
III.2.1. Geoparsing ............................................................................................. 24
III.2.2. Analisis Sentimen................................................................................... 25
III.2.3. Visualisasi dan Pembuatan Webmap ...................................................... 25
III.2.4. Uji Usabilitas .......................................................................................... 25
III.2.5. Penarikan Kesimpulan dan Penulisan Laporan Akhir ........................... 26
III.3. Jadwal Penelitian .......................................................................................... 27
DAFTAR PUSTAKA ................................................................................................ 28

iii
1

BAB I
PENDAHULUAN
I.1. Latar Belakang
Pemilihan Umum Presiden dan Wakil Presiden Indonesia atau biasa disingkat
sebagai Pilpres merupakan pesta demokrasi yang diadakan setiap lima (5) tahun sekali.
Pemilu sendiri terdiri atas Pemilu DPR, DPD, dan DPRD atau biasa disebut sebagai
Pemilu legislatif (Pileg), Pemilu Presiden dan Wakil Presiden (Pilpres), serta Pemilu
Kepala Daerah dan Wakil Kepala Daerah (Pilkada). Pilpres merupakan pemilu yang
paling banyak dibahas, baik oleh masyarakat maupun media karena merupakan sebuah
sarana untuk memilih pemimpin nomor satu bagi sebuah negara. Pemilu tahun 2019
disebut sebagai pemilu satu hari yang paling kompleks dalam sejarah. Pilpres dan Pileg
dilaksanakan secara serentak pada Rabu, 17 April 2019. Hal itu menimbulkan masalah
seperti petugas yang kelelahan karena banyaknya surat suara yang harus dihitung,
bahkan sebanyak 894 petugas meninggal dunia (KOMPAS.com, 2020). Kejadian
tersebut dapat menjadi pelajaran bagi Pemerintah Indonesia bahwa jika masih akan
melaksanakan pemilu secara serentak, maka jumlah Panitia Pemungutan Suara (PPS)
dan Tempat Pemungutan Suara (TPS) harus dipastikan telah mencukupi.
Twitter merupakan salah satu media sosial yang banyak digunakan oleh
masyarakat dalam menyampaikan ide dan pemikirannya mengenai suatu fenomena.
Keberadaan fitur trending yang ada di Twitter membuat pengguna mengetahui topik
yang sedang ramai diperbincangkan. Data tweet mengenai suatu topik dapat diperoleh
menggunakan library python seperti snscrape dan tweepy secara gratis melalui
environment Python yaitu Jupyter Notebook atau Google Colaboratory. Proses
mengambil dan mengumpulkan data dari Twitter ini disebut dengan data scraping.
Hasil scraping tersebut dapat diolah lebih lanjut melalui analisis sentimen. Analisis
sentimen merupakan salah satu bagian dari Natural Language Programming (NLP)
yang dapat memahami dan memproses bahasa manusia untuk memperoleh informasi
tertentu. Analisis sentimen berguna untuk mengetahui bagaimana pola pemikiran
masyarakat mengenai suatu topik atau objek. Analisis sentimen dapat mendeteksi
apakah sebuah tweet memiliki sentimen yang negatif, positif, atau netral. Contohnya
adalah pendapat pengguna Twitter terhadap calon presiden dan wakil presiden.
Analisis sentimen telah banyak digunakan peneliti untuk mengetahui bagaimana
tanggapan pengguna Twitter terhadap suatu fenomena luar biasa seeprti pandemi
COVID-19 (Al isfahani & Mubarok, 2021; Sasmita dkk, 2022), khususnya dalam
aspek sosial budaya (Perez-Cepeda & Arias-Bolzmann, 2022), ekonomi (Fadhel dkk.,
2022; Mustari dkk., 2022; Padhana & Sadikin, 2021), kesehatan (Mailo & Lazuardi,
2021), lingkungan (Camacho dkk., 2021), transportasi (Romadloni dkk, 2019), dan
politik (Perdana dkk., 2022; Zuhri dkk., 2020). Analisis sentimen dapat dilakukan
dengan library Python seperti Naïve Bayes, Support Vector Machine, K-Nearest
Neighbor, Deep Belief Network, Recurrent Neural Network (RNN), Lexicon Based,
LDA Based Topic Modelling, dll.
Pemetaan pola spasial terhadap analisis sentimen dapat berguna dalam
menunjukkan keterkaitan antara pendapat pengguna Twitter di suatu daerah terhadap
topik tertentu. Deteksi dan pemantauan opini publik melalui sosial media seperti itu
dapat berguna bagi peneliti dan pembuat kebijakan dalam memperoleh informasi
secara real time (Camacho dkk., 2021). Menurut Camacho dkk. (2021) melalui
pemetaan titik sentimen, emosi, budaya, dan pendapat manusia dapat dilacak dari
waktu ke waktu untuk memahami di mana berbagai sentimen memanifestasikan
dirinya secara geografis. Pola spasial berguna untuk menunjukkan informasi yang
sebelumnya tersembunyi sehingga dapat memberikan pengetahuan yang berguna bagi
suatu tujuan tertentu.
Analisis sentimen mengenai Pilpres tahun 2024 telah dilakukan oleh beberapa
peneliti dengan menggunakan metode yang berbeda dan dataset yang berbeda pula.
Namun, belum ada yang mengkaji aspek spasial dari sentimen tersebut. Oleh karena
itu, akan dilakukan penelitian yang mengkaji bagaimana hubungan antara sentimen
pengguna Twitter dengan daerah tertentu melalui visualisasi pola spasial. Sebelumnya
akan dilakukan geoparsing untuk memperoleh data lokasi berdasarkan teks karena
dataset yang diperoleh tidak memiliki kolom location (latitude & longitude).
Geoparsing juga merupakan salah satu bagian dari NLP yakni proses memperoleh dan
mengidentifikasi lokasi geografis seperti nama tempat, alamat, dan koordinat dari teks.
Hasil penelitian ditujukan untuk pengamat politik yang berperan sebagai penjaga
kredibilitas informasi dan peneliti yang tertarik dengan analisis sentimen terutama
hubungannya dengan aspek spasial.

2
I.2. Rumusan Masalah
Visualisasi pola spasial analisis sentimen dari dataset Twitter dapat memberikan
informasi yang sebelumnya tersembunyi mengenai hubungan antara sentimen dengan
aspek spasial. Analisis sentimen mengenai Pilpres yang selama ini dilakukan belum
melibatkan aspek spasial. Hal itu disayangkan karena tweet memuat data geolokasi
jika pengguna mengaktifkan izin lokasi pada perangkat yang digunakan. Seiring
dengan berubahnya kebijakan Twitter, library scraping data gratis tidak bisa lagi
digunakan sehingga analisis sentimen dilakukan terhadap dataset Twitter pada
penelitian sebelumnya. Namun, dataset yang ada tidak memuat kolom koordinat yaitu
latitude dan longitude sehingga perlu dilakukan proses geoparsing untuk memperoleh
data lokasi dari teks. Beberapa metode analisis sentimen yang pernah digunakan juga
memberikan hasil yang beragam sehingga tidak diketahui metode mana yang
memberikan hasil terbaik.
I.3. Tujuan Penelitian
Tujuan utama penelitian ini adalah melakukan visualisasi pola spasial sentimen
pengguna media sosial Twitter terhadap Pemilihan Presiden dan Wakil Presiden
(Pilpres) Indonesia tahun 2024. Untuk mencapai tujuan tersebut, disusunlah tujuan
spesifik sebagai berikut:
1. Melakukan geoparsing untuk memperoleh lokasi dari dataset Twitter.
2. Menemukan metode yang sesuai untuk melakukan analisis sentimen.
3. Melakukan prediksi terhadap sentimen Pilpres di masa depan.
4. Membuat visualisasi pola spasial hasil analisis sentimen Pilpres 2024.
I.4. Pertanyaan Penelitian
Berdasarkan rumusan masalah dan tujuan penelitian yang telah disusun, maka
dirumuskan pertanyaan penelitian sebagai berikut:
1. Seperti apa hasil geoparsing dari dataset Twitter?
2. Apa metode yang paling sesuai untuk melakukan analisis sentimen?
3. Seperti apa hasil prediksi terhadap sentimen Pilpres di masa depan?
4. Bagaimana hasil visualisasi pola spasial dari analisis sentimen Pilpres 2024?
I.5. Manfaat Penelitian
Hasil dari penelitian dapat bermanfaat bagi pengamat politik yang berperan
sebagai penjaga kredibilitas informasi dalam dunia politik. Selain itu, penelitian ini

3
juga dapat digunakan sebagai referensi bagi peneliti yang tertarik dengan analisis
sentimen terutama pada hubungannya dengan aspek spasial.
I.6. Cakupan Penelitian
Berikut ini merupakan beberapa cakupan kegiatan yang akan dilakukan dalam
penelitian ini:
1. Lokasi penelitian adalah wilayah Republik Indonesia.
2. Metode yang digunakan untuk melakukan analisis sentimen dan prediksi
adalah Naïve Bayes, Support Vector Machine, K-Nearest Neighbor, dan
Deep Belief Network.
3. Data utama yang digunakan adalah dataset Twitter berupa tweet dari tanggal
1 Januari hingga 31 Desember 2021 yang diperoleh dari hasil scraping
peneliti sebelumnya dari Sekolah Tinggi Ilmu Statistika (STIS)
(Rahmanulloh & Santoso, 2022). Adapun data pendukung yang digunakan
adalah batas administrasi kabupaten di wilayah Republik Indonesia yang
diperoleh dari Badan Informasi Geospasial; basemap yang bersumber dari
OpenStreetMap; data mengenai jumlah Daftar Pemilih Tetap (DPT) dan
jumlah Tempat Pemungutan Suara (TPS) yang diperoleh dari website resmi
Komisi Pemilihan Umum (KPU) dan website resmi lainnya.
4. Perangkat lunak yang digunakan untuk melakukan analisis sentimen dan
prediksi adalah Jupyter Notebook. Sementara visualisasi pola berupa
choropleth akan dilakukan menggunakan perangkat lunak free and open
source software (FOSS) QGIS versi 3.28.9. Setelah itu, D3.js akan
digunakan untuk menghasilkan visualisasi data yang dinamis dan interaktif
pada laman web dengan bantuan Github untuk melakukan deployment.
I.7. Tinjauan Pustaka
Era digitalisasi memungkinkan pengguna mengekspresikan sudut pandang
dengan mudah. Hal itu menyebabkan data dan informasi dihasilkan dalam jumlah yang
banyak hanya dalam jangka waktu sangat singkat seperti yang ditunjukkan oleh
Gambar I.1. Data tersebut dapat memberikan wawasan yang berguna bagi suatu
organisasi atau pelaku bisnis untuk membuat keputusan yang efisien. Namun, data
tersebut umumnya hadir dalam bentuk yang semi terstruktur dan tidak terstruktur
sehingga sulit untuk diolah secara manual, juga mengingat jumlahnya yang sangat

4
banyak. Maka dari itu, penggunaan library Python yang beragam untuk melakukan
kegiatan seperti Machine Learning (ML), Deep Learning (DL), dan Natural Language
Processing (NLP) dapat sangat bermanfaat.

Gambar I.1. Dinamika Internet dalam Satu Menit tahun 2023


Sumber: eDiscoveryToday (2023)
Analisis sentimen menjadi bagian yang penting dari proses pengolahan data
yang banyak dan cenderung tidak terstruktur menjadi sebuah informasi bahkan
wawasan. Analisis sentimen merupakan bagian dari Natural Language Processing
(NLP). NLP sendiri merupakan bagian dari Artificial Intelligence (AI) yang
menggunakan algoritma Machine Learning (ML) untuk melakukan pemrosesan
terhadap bahasa alami manusia yang bukan merupakan bahasa
komputer/pemrograman. NLP memungkinkan perolehan informasi dari bahasa yang
beragam beserta dengan tata bahasanya.
Gambar I.1. menunjukkan bahwa setiap menitnya terdapat sebanyak 347.222
tweet diunggah oleh pengguna. Twitter merupakan salah satu media sosial yang paling
sering digunakan sebagai sumber data untuk analisis sentimen. Hal itu karena Twitter
merupakan media sosial berbasis teks yang memberikan fasilitas untuk menyampaikan
opini panjang melalui thread serta fitur trending untuk mengetahui hal-hal yang
sedang ramai diperbincangkan. Saat ini media sosial Instagram pun telah merilis

5
aplikasi Threads sehingga pengguna dapat mengunggah opininya dan memperoleh
balasan dari pengguna lain. Namun, dilansir dari laman VOI.id (2023), Adam Mosseri
selaku CEO menyampaikan bahwa Threads yang baru diluncurkan pada tanggal 5 Juli
2023 tersebut tidak mendukung pembahasan mengenai politik dan berita yang sensitif.
Hal itu membuat penggunaan Threads untuk beropini mengenai politik tidak semasif
Twitter. Oleh karena itu, dataset Twitter dipilih sebagai sumber data utama.
Pemilihan presiden dan wakil presiden atau Pilpres menjadi salah satu topik
yang paling ramai diperbincangkan oleh pengguna media sosial Twitter. Masyarakat
seringkali mengungkapkan dukungan dan kritikan kepada tokoh politik tertentu. Jati
dkk. (2019) menggunakan Support Vector Machine (SVM) dalam menganalisis
sentimen terhadap isu politik calon presiden (capres) Indonesia 2019. Hasilnya adalah
capres Jokowi memperoleh sentimen negatif lebih besar, sedangkan capres Prabowo
mengalami hal sebaliknya, yakni sentimen positif yang diperoleh lebih besar. Akurasi
SVM terhadap capres Jokowi adalah sebesar 98%, sedangkan untuk capres Prabowo
adalah 99%. Adapun Fitriyyah dkk. (2019) menggunakan metode Naïve Bayes dalam
analisis sentimen capres Indonesia 2019. Akurasi yang diperoleh pada pengujian tiga
kelas (negatif, positif, dan netral) adalah sebesar 64,6% untuk paslon 01 dan 58%
untuk paslon 02. Sementara akurasi pada pengujian dua kelas (negatif & positif)
diperoleh hasil 77,7% untuk paslon 01 dan 88% untuk paslon 02. Sementara itu, Seno
& Wibowo (2019) mengkombinasikan metode SVM dengan Lexicon Based untuk
mengatasi semakin banyaknya kata baru dan singkatan yang menyulitkan analisis
sentimen. Hasilnya adalah proses pelabelan terhadap dataset capres dan cawapres
Pemilu 2019 dapat dilakukan secara otomatis menggunakan Lexicon Based dengan
akurasi sebesar 92,5%. Metode Lexicon Analysis juga digunakan oleh Nababan dkk.
(2020) yang melakukan analisis sentimen berdasarkan hashtag yang menjadi trending
topic. Kesimpulannya adalah akurasi metode lexicon sangat bergantung pada jumlah
kata yang terdapat dalam kamus lexicon. Asmara dkk. (2020) menggunakan metode
yang sama dengan Fitriyyah dkk. (2019) dalam melakukan analisis sentimen, yakni
Naïve Bayes Classifier. Namun, bedanya Asmara dkk. (2020) melakukan analisis
secara temporal sehingga hasilnya dapat ditampilkan berdasarkan interval waktu
tertentu. Namun, akurasi yang dihasilkan cukup rendah yakni 62%.

6
Analisis sentimen terhadap Pilpres tahun 2024 pun telah dilakukan oleh
beberapa peneliti, seperti Ramadhan dkk. (2022) yang menggunakan metode Decision
Tree Method dan menghasilkan akurasi sebesar 99,3%. Sementara itu, Rahmanulloh
& Santoso (2022) menggunakan beberapa metode berbeda untuk setiap tokoh capres
seperti Long Short-Term Memory (LSTM), random forest, dan logistic regression.
Adapun tokoh capres yang dikaji adalah Anies Baswedan, Ganjar Pranowo, Prabowo
Subianto, Ridwan Kamil, dan Sandiaga Uno. LSTM juga digunakan oleh Firdlous &
Andrian (2023) dengan melakukan pelabelan sebelumnya menggunakan Lexicon-
based feature. Metode lainnya yang digunakan adalah Agglomerative Hierarchical
Clustering yang berguna untuk melakukan clustering terhadap data tweet yang sangat
banyak ke dalam sepuluh klaster (Sujadi dkk., 2023). Sujadi dkk. (2023) berfokus
untuk menganalisis tipe konten dan emosi dari tweet-tweet yang berhubungan dengan
salah satu kandidat capres, yakni Anies Baswedan. Metode textblob juga dapat
digunakan untuk melakukan analisis sentimen terhadap fenomena Pemilu 2024 secara
keseluruhan (Vindua & Zailani, 2023).
Analisis sentimen telah banyak digunakan oleh peneliti untuk menganalisis
beragam fenomena yang ada di tengah masyarakat dengan beragam metode yang
berbeda. Penelitian-penelitian terdahulu mengenai analisis sentimen menunjukkan
bahwa keberagaman tema menjadikan metode yang digunakan juga beragam. Hal
tersebut juga berdampak pada nilai akurasi yang bisa berbeda-beda antara satu metode
dengan metode lainnya jika diterapkan pada data yang sama. Suatu metode terkadang
dapat menghasilkan akurasi yang tinggi saat diterapkan pada suatu dataset, tetapi
ternyata tidak demikian saat dilakukan pada kasus yang lain. Hal inilah yang
mendorong Fitriyyah dkk. (2019) untuk menggunakan metode Naïve Bayes Classifier
(NBC). Hal itu karena penelitian Buntoro (2017) menghasilkan kesimpulan bahwa
metode NBC memberikan hasil akurasi sebesar 95%, yang mana lebih baik daripada
Support Vector Machine (SVM) dengan akurasi sebesar 90%. Akurasi keseluruhan
yang diperoleh Fitriyyah dkk. (2019) adalah tidak lebih dari 65% pada klasifikasi tiga
kelas (negatif, positif, dan netral). Maka dari itu, perlu dilakukan pencarian metode
yang paling cocok dan memberikan nilai akurasi terbaik pada topik atau objek tertentu
dengan melakukan percobaan terhadap beberapa metode.

7
Pola spasial atau spatial pattern didefinisikan oleh Lee dan Wong (2000) sebagai
sesuatu yang menunjukkan penempatan atau susunan benda-benda yang ada di
permukaan bumi. Pola spasial dapat menunjukkan proses spasial yang dipengaruhi
oleh berbagai aspek seperti lingkungan, fisik, sosial, atau budaya. Ratnasari dkk.
(2016) mengkombinasikan data penginderaan jauh di malam hari dengan jejak
geospasial dari data Twitter untuk mengidentifikasi interaksi dan pola spasial tata
ruang perkotaan. Analisis spatio-temporal terhadap analisis sentimen data Twitter
pernah dilakukan oleh Song & Xia (2016) untuk mengetahui bagaimana
perkembangan opini di Twitter dalam ruang dan waktu. Lokasi penelitian yang
diselidiki distribusi polaritas sentimennya adalah area buffer sejauh 1 km dari Kampus
Curtin Bentley di Perth, Australia Barat. Hasilnya sangat menarik, misalnya persentase
tweet positif berada di zona spasial bidang ilmu sosial, sedangkan bidang sains dan
teknik serta asrama memiliki persentase negatif tertinggi. Wawasan tersebut dapat
berguna bagi manajemen pengajaran dan pembelajaran universitas dalam mengambil
kebijakan. Paul dkk. (2017) melakukan penelitian serupa dengan topik berupa Pemilu
Amerika Serikat (AS) tahun 2016 yang bertujuan untuk menganalisis sentimen di
Twitter terhadap partai demokrat dan republik. Cakupan lokasinya adalah daerah dan
negara bagian AS, sedangkan cakupan waktunya adalah enam bulan menjelang
pemilihan presiden AS di tahun 2016.
Pola spasial terhadap pemilihan presiden telah menjadi topik penelitian yang
menarik untuk dikaji bahkan sejak tahun 1970-an. Johnston (1973) mengkaji pola
spasial dan pengaruhnya terhadap hasil pemungutan suara pada pemilihan Dewan
Kota Christchurch pada tahun 1968. Pada waktu itu, pemilihan Christchurch terdiri
atas dua partai. Variasi spasial dalam pola dukungan dipengaruhi oleh efek partai, yang
mencerminkan kecenderungan suatu kelompok dan lingkungannya untuk mendukung
kandidat tertentu dan efek individual, yaitu setiap kandidat memperoleh dukungan dari
daerah asalnya (Johnston, 1973). Pemilihan walikota Los Angeles (LA) pada tahun
1969 juga menjadi topik menarik yang kemudian dikaji oleh McPhail (1971).
Penelitian Woolstencroft (1980) membenarkan bahwa beberapa tahun sebelum jurnal
tersebut diterbitkan, ketertarikan para ahli geografi meningkat pada bidang electoral
geography atau geografi pemilu. Pendekatan utama dalam kajian pemungutan suara
dibahas dan dievaluasi dalam jurnal tersebut, seperti metode kartografi, model “teman

8
dan tetangga”, serta model nasionalisasi. Woolstencroft (1980) menilai pendekatan
nasionalisasi merupakan yang paling berguna untuk mendeskripsikan dan menjelaskan
fenomena politik subnasional yang dibatasi secara spasial. Hal itu karena keterbatasan
penggunaan kedua metode lain yang statis dan hanya dapat digunakan pada keadaan
tertentu.
Kolaborasi antara analisis sentimen dengan pola spasial dilakukan oleh Yaqub
dkk. (2020) terhadap Pilpres AS tahun 2016 dan Pilpres Inggris tahun 2017. Hasilnya
berhasil menunjukkan kaitan antara sentimen dengan hasil pemilu di lapangan terlepas
dari apa pun metodologi yang digunakan dalam pengumpulan data. Ebrahimi dkk.
(2017) menyebutkan bahwa salah satu tantangan dalam melakukan analisis sentimen
pada fenomena yang dinamis adalah pelibatan aspek lokasi. Prediksi pada fenomena
dinamis seperti pemilu harus mempertimbangkan pengaruh dari masing-masing
negara bagian melalui jumlah suara di negara bagian tersebut (Ebrahimi dkk., 2017).
Selama Pilpres AS tahun 2016, penggunaan data geolokasi Twitter telah berguna
dalam membantu memprediksi hasil akhir pemilu melalui analisis sentimen.
Perolehan dataset berupa tweet yang memuat informasi lokasi saat ini tidak
semudah seperti perolehan sebelum tahun 2019. Pasalnya Twitter telah menghapus
fitur geolokasi dengan alasan keamanan pengguna dan Twitter menyadari bahwa tidak
banyak pengguna memanfaatkan fitur tersebut. Hal itu disampaikan oleh akun resmi
Pusat Bantuan Twitter @Support pada tanggal 19 Juni 2019, bahwa dihapusnya fitur
tersebut ditujukan untuk menyederhanakan pengalaman menggunakan Twitter bagi
para penggunanya. Namun demikian, jika pengguna ingin membagikan lokasi
terkininya pada sebuah tweet, maka pengguna dapat memanfaatkan fitur kamera yang
mendukung fitur geotagging (Support, 2019). Geoparsing juga turut menjadi solusi
untuk memperoleh informasi lokasi pada tweet yang menyebutkan deskripsi lokasi
atau landmark tertentu. Geoparsing didefinisikan sebagai algoritma untuk
memperoleh dan menemukan lokasi geografis yang direferensikan dalam sebuah teks
(de Bruijn dkk., 2018), contohnya dalam hal ini adalah tweet.
Permasalahan selanjutnya mengenai geolokasi tweet adalah terdapat
kemungkinan bahwa deskripsi lokasi yang disebutkan dalam tweet bukan merupakan
lokasi akurat dari pengguna. Namun, sebenarnya hal tersebut tidak menjadi masalah
jika unit spasial yang digunakan adalah berupa batas administrasi. Adapun jika lokasi

9
yang disebutkan pada tweet bukan merupakan lokasi di mana tweet tersebut dibuat,
maka True Origin Model yang digagas oleh Lamsal dkk. (2022) dapat dijadikan solusi.
Metode tersebut dapat mendeteksi lokasi asal (As) dan bukan asal (Bs) untuk
mengatasi tweet yang menyebutkan lokasi B, sedangkan pengguna sedang berada di
lokasi A. Hasil dari geoparsing juga dapat ditingkatkan dengan metode yang
ditawarkan oleh de Bruijn dkk. (2018) yakni TAGGS, dengan mengelompokkan tweet
sehingga sekelompok tweet yang merujuk pada lokasi yang sama dapat dideteksi.
Oleh karena terbatasnya tweet dengan data geolokasi (yakni hanya sekitar 1%)
dan telah berubahnya kebijakan Twitter sehingga lokasi pengunggahan tweet tidak
ditampilkan dan akses terhadap profil pengguna telah dibatasi, maka diperlukan teknik
ekstraksi informasi mengenai lokasi dari dataset yang tersedia. Geoparsing dapat
sangat berguna untuk melakukan hal tersebut dengan kombinasi metode True Origin
Model dan TAGGS agar memperoleh hasil yang optimal. Selain itu, analisis sentimen
yang telah dilakukan oleh peneliti-peneliti sebelumnya terkait Pilpres 2024 belum
melakukan visualisasi data secara geospasial sehingga pola spasial yang mungkin
terbentuk di setiap daerah belum diketahui. Maka dari itu, keberadaan Webmap untuk
menampilkan hasil analisis sentimen dan informasi pendukung lainnya seperti jumlah
Daftar Pemilih Tetap (DPT), jumlah Tempat Pemungutan Suara (TPS), persebaran
DPT berdasarkan jenis kelamin, pekerjaan, dan usia sesuai dengan sentimen pada
tweet mereka dapat sangat bermanfaat untuk memberikan pengetahuan terkait
fenomena seperti Pilpres 2024.

10
11

BAB II
LANDASAN TEORI
II.1. Big Data
Terminologi Big Data sebenarnya tidak memiliki definisi yang pasti. Buyya dkk.
(2016) menyebutkan Big Data bukan merupakan istilah yang tepat dan tidak memiliki
arti tertentu selain menunjukkan ukurannya. Kata “Big” dalam Big Data terlalu umum
dan seberapa “besar” atau “kecil” sebuah data sangat bergantung terhadap waktu,
ruang, dan keadaan. Ukuran Big Data sendiri selalu berkembang. Buyya dkk. (2016)
dalam bukunya yang berjudul “Big Data: Principles and Paradigms” merangkum tujuh
definisi mengenai Big Data yang paling populer. Ketujuh definisi tersebut terdapat
pada Tabel II.1.
Tabel II.1. Tujuh definisi Big Data yang paling populer
No. Tipe Deskripsi
Big Data awal Mengacu pada definisi yang disebutkan oleh Douglas Laney yaitu
1
(3V) volume, kecepatan, atau 3V.
Big Data
2 sebagai Jenis definisi ini berorientasi pada pengembangan teknologi baru.
teknologi
Penerapan yang berbeda berdasarkan jenis Big Data yang berbeda. Barry
Devlin mendefinisikannya sebagai penerapan dengan proses sebagai
Big Data
3 medianya, informasi yang bersumber dari manusia, dan data yang
sebagai aplikasi
dihasilkan mesin. Shaun Connolly menyebutnya berfokus pada analisis
transaksi, interaksi, dan observasi data.
Merupakan jenis lain dari definisi berorientasi aplikasi, tetapi berfokus
Big Data
4 pada waktu daripada jenis data. Definisi ini mencari gambaran masa
sebagai sinyal
depan data/pola ‘sinyal’ baru dalam kumpulan data.
Matt Aslett menyebutkan bahwa sebelumnya Big Data sebagai analisis
Big Data data telah diabaikan karena keterbatasan teknologi. Hal itu menyoroti
5
sebagai peluang banyak peluang potensial dengan meninjau kembali dataset yang
dikumpulkan/diarsipkan sebelumnya.
Big Data Big Data sebagai proses berpikir manusia. Definisi ini membawa BDA ke
6 sebagai tingkatan baru, di mana Big Data bukan lagi menjadi alat analisis,
metafora melainkan merupakan perpanjangan dari otak manusia.
Big Data
sebagai istilah Pelabelan ulang Big Data untuk BI, data mining, atau aktivitas analitik
7
baru untuk hal- data tradisional lainnya.
hal lama
Sumber: Buyya dkk. (2016)
Sejarah mengenai berkembangnya deskripsi Big Data tidak lepas dari
kemunculan banyak perusahaan internet dan Teknologi Informasi, seperti Google,
YouTube, Yahoo, Facebook, Twitter, dan Apple (Buyya dkk., 2016). Pendefinisian
BIG Data juga dapat dibantu dengan ciri-ciri dari Big Data itu sendiri, yang mana telah
berubah dari waktu ke waktu mulai dari 3Vs, 4Vs, 6Vs, hingga 9Vs. Tujuan utama
dari Big Data Analytics (BDA) adalah Busines Intelligence (BI). Hal itu
memungkinkan proses pengambilan keputusan yang tepat berdasarkan prediksi
melalui analisis data yang tersedia.
Atribut-atribut baru dalam Big Data perlu diperjelas dan hubungannya
ditetapkan dalam tiga domain, antara lain:
a. Domain data: untuk mencari pola
b. Domain Business Intelligence (BI): untuk melakukan prediksi
c. Domain statistik: untuk melakukan asumsi
Seluruh atribut yang telah ditentukan dari tiga domain kemudian disajikan dalam
diagram Venn gabungan seperti yang terlihat pada Gambar II.1. Ketiga atribut data
3Vs awal mewakili makna sintaksis atau logis dari Big Data, sedangkan 9Vs mewakili
makna semantik (hubungan data, BI, dan statistik). Inti dari BDA adalah “machine
learning” karena tanpa mesin (komputer), misi pembelajaran dari Big Data tidak akan
mungkin dilakukan.

Gambar II.1. Diagram Venn 9Vs dalam model hirarki


Sumber: Buyya dkk. (2016)
Berdasarkan Gambar II.1, dapat diketahui bahwa terdapat tiga buah diagram
segitiga hirarki tunggal. Masing-masing diagram tersebut masuk ke dalam domain
data, BI, atau statistik. Atribut awal dari Big Data sebenarnya adalah volume, variety,
dan velocity. Ketiga atribut tersebut menempati posisi yang lebih tinggi di antara kedua

12
domain lainnya. Pengertian ketiga atribut tersebut beserta keenam atribut lainnya
dalam 9Vs dapat dilihat pada Tabel II.2.
Tabel II.2. Pengertian 9Vs
No. Domain Atribut Pengertian
1 Volume Aliran data yang masuk dan volume kumulatif data. Volume
merupakan atribut utama dalam domain Data.
2 Velocity Kecepatan data yang digunakan untuk mendukung interaksi
Data
dan dihasilkan oleh interaksi.
3 Variety Beragam format data dan struktur data yang tidak kompatibel
dan tidak konsisten.
4 Visibility Memungkinkan tinjauan ke belakang, wawasan, dan
pandangan ke depan mengenai suatu masalah dan solusi
memadai yang terkait dengannya.
Business
5 Value Nilai dan kegunaan untuk keuntungan jangka panjang atau
Intelligence
strategis.
(BI)
6 Verdict Pilihan atau keputusan yang harus diambil oleh pengambil
keputusan berdasarkan ruang lingkup masalah, sumber daya
yang tersedia, dan kapasitas komputasi tertentu.
7 Veracity Kebenaran dan kepastian kumpulan data.
8 Validity Cara memperoleh data dengan benar dan menghindari bias;
proses inferensi berdasarkan model statistik.
9 Statistika Variability Merupakan implikasi dari kompleksitas dan variasi data.
Secara statistik, variability merupakan cara menggunakan
inferensi logis untuk mengurangi kompleksitas data dan
mencapai hasil atau prediksi yang diinginkan.
Sumber: Buyya dkk. (2016)
II.1.1. Machine Learning
Inti dari Machine Learning (ML) yairu pengenalan pola secara otomatis oleh
“mesin yang belajar”. Tujuan utama ML adalah untuk membangun sistem yang dapat
bekerja melampaui kompetensi manusia dalam menangani banyak tugas atau masalah
yang kompleks (Buyya dkk, 2016). ML merupakan bagian dari Artificial lntelligence
(AI) atau kecerdasan buatan. Penyelesaian yang ditawarkan oleh ML adalah
memberikan algoritma atau serangkaian instruksi kepada komputer sehingga data
masukan dapat berubah menjadi jawaban keluaran. Tentunya keluaran yang baik tidak
dapat langsung diperoleh hanya melalui sekali percobaan, melainkan dengan
menggabungkan banyak percobaan. Sekali percobaan mungkin dapat menghasilkan
kesalahan yang besar, tetapi dengan menggabungkan banyak percobaan, kesalahan
akan berkurang hingga tingkat yang dapat diterima atau konvergensi.
Volume data yang semakin besar sejak tahun 1990-an mengarah pada
Knowledge Discovery in Database (KDD) atau juga disebut sebagai Data Mining
(Buyya dkk, 2016). Maknanya adalah penggalian basisdata dan penemuan makna atau

13
pengetahuan untuk pengambilan keputusan. Untuk menemukan pola yang bermakna
dari kumpulan data yang sangat besar, statistik merupakan alat penting untuk memberi
nilai tambah pada pengambilan sampel, pemodelan, analisis, interpretasi, dan
presentasi. Han dkk. (2012) dalam Buyya dkk, (2016) menyebutkan bahwa Data
Mining berhubungan erat dengan statistik. Teori statistik atau pemodelan probabilitas
telah mengubah disiplin AI dari yang mulanya berbasis aturan menjadi berbasis data,
yakni dengan mempelajari kumpulan data yang banyak, suatu model ML akan dapat
memperoleh pola atau tren yang bermakna.
Pembahasan mengenai ML tidak dapat terlepas dari dua paradigma modern yang
penting dalam ML, yakni Generative Learning dan Discriminative Learning.
Generative Learning/pembelajaran generatif merupakan pembelajaran Bayesian dari
model probabilistik termasuk jaringan Bayesian. Sementara Discriminative
Learning/pembelajaran diskriminatif ditujukan terhadap classifier seperti Support
Vector Machine (SVM) dan metode kernel. Jebara (2004) dalam bukunya yang
berjudul “Machine Learning: Discriminative and Generative” menyebutkan beberapa
contoh model dari kedua kategori ML tersebut, yaitu:
a. Generative Learning: bayesian inference, maximum likelihood, the
exponential family, maximum entropy, expectation maximization and
mixtures, dan graphical models.
b. Discriminative Learning: empirical risk minimization, structural risk
minimization, VC dimension and large margins, Support Vector Machines
(SVM), dan metode kernel.
II.1.2. Data Twitter
Twitter merupakan sebuah sosial media berbasis teks, tetapi pengguna juga tetap
dapat mengunggah gambar, video, serta hashtag. Jumlah karakter maksimal yang
dapat diunggah oleh pengguna berkembang dari yang mulanya 140 karakter pada
tahun 2006 atau awal dirilisnya Twitter, 280 karakter semenjak tahun 2017, hingga
4000 karakter pada tahun 2023 untuk pengguna Twitter Blue. Kecepatan dan
kemudahan publikasi menjadikan Twitter sebagai media komunikasi yang penting
bagi pengguna dari seluruh lapisan masyarakat. Twitter telah memainkan peran
penting dalam peristiwa sosial-politik seperti Arab Spring3 dan gerakan Occupy Wall
Street (Kumar dkk., 2013). Selain itu, Twitter juga telah digunakan untuk mengirim

14
laporan kerusakan dan informasi kesiapsiagaan bencana saat terjadi bencana alam
besar, seperti Badai Sandy.
Popularitas Twitter sebagai sumber informasi telah mendorong berkembangnya
aplikasi dan penelitian di berbagai domain (Kumar dkk., 2013). Bantuan kemanusiaan
dan bantuan bencana merupakan salah satu domain yang memanfaatkan informasi dari
Twitter untuk memberikan kesadaran situasional terhadap situasi kritis. Penggunaan
data teks untuk tujuan analisis tidak semasif data numerik yang lebih umum
digunakan. Hal itu karena model machine learning dapat secara efektif memodelkan
atribut numerik, tetapi tidak berfungsi dengan baik jika ada atribut teks (Buyya dkk.,
2016). Contoh atribut teks mencakup kata, frekuensinya, struktur tata bahasa yang
mendasarinya, atau keseluruhan rangkaian kata. Tantangan lainnya dari data teks
adalah dimensi data teks biasanya lebih tinggi daripada data numerik karena variasi
bahasa sangat besar. Begitu pula dengan ruang fitur yang mencakup keseluruhan.tata
bahasa dan kosa kata yang sangat besar.
II.2. Natural Language Processing
Natural Language Processing (NLP) merupakan sebuah teknik pemrosesan
bahasa alami yang berguna dalam menganalisis teks dan memahami nuansa dalam teks
(Buyya dkk., 2016). Bahasa alami yang dimaksud adalah bahasa yang digunakan
sehari-hari oleh manusia. Berkebalikan dengan bahasa komputer/pemrograman yang
digunakan manusia untuk dapat berkomunikasi dengan mesin dan membuat sebuah
program, NLP digunakan untuk menjadikan mesin mampu mengenali bahasa alami
manusia dan memperoleh informasi darinya. NLP hadir untuk mengatasi keterbatasan
yang disebabkan oleh semakin banyaknya bahasa yang dipelajari, sumber daya
linguistik, seperti lexicon dan notasi tata bahasa yang berlipat ganda seiring dengan
jumlah bahasa yang dipelajari. Metode analisis teks secara tradisional berpusat pada
metode sintaksis, sedangkan NLP telah mengubahnya menuju penggunaan metode
statistik untuk pemrosesan teks dan bahasa (Buyya dkk., 2016). Metode statistik NLP
sebagai pengurai teks sangat penting dalam membangun berbagai aplikasi yang dapat
membantu pekerjaan sehari-hari seperti mesin pencari, sistem pemberi rekomendasi,
pemeriksa ejaan, sistem terjemah mesin, dan mesin penjawab pertanyaan.
II.2.1. Analisis Sentimen

15
Analisis sentimen dapat memberikan gambaran tentang bagaimana orang
merespons suatu perusahaan, produk, atau topik (Kumar dkk., 2013). Analisis
sentimen berupaya untuk secara otomatis mengasosiasikan sepotong teks dengan “skor
sentimen”, yakni skor emosional positif atau negatif. Analisis sentimen menggunakan
dataset Twitter dilakukan per tweet, di mana kata-kata pada setiap tweet dibandingkan
dengan kata-kata pada tweet lain yang sebelumnya diberi label “positif” atau “negatif”.
Setelah melihat kata-kata tersebut, algoritma akan menilai apakah teks dalam tweet
tersebut positif atau negatif berdasarkan setiap kemungkinan yang ada.
Agar perbandingan konten dalam sebuah tweet dapat dilakukan, pertama-tama
lexicon harus ditemukan terlebih dahulu, yakni kamus kata serta skor positif dan
negatifnya. Pemilihan sumber untuk membangun lexicon sentimen harus dilakukan
secara cermat karena kata-kata dapat memiliki sentimen berbeda dalam konteks yang
berbeda. Sebagai contoh, pada buku berjudul “Twitter Data Analytics” karya Kumar
dkk. (2013) menggunakan Naïve Bayes Classifier sebagai algoritma sentimen.
Algortima tersebut mengklasifikasikan tweet sebagai sebagai positif atau negatif
dengan membandingkan setiap kata dalam tweet dengan kata-kata yang diberi label
dalam lexicon. Jika kata-kata dalam tweet lebih banyak digunakan pada tweet positif,
maka tweet tersebut diberi label positif, begitu pun sebaliknya.
II.2.2. Geoparsing
Geoparsing didefinisikan sebagai proses mengenali referensi lokasi dari teks dan
mengidentifikasi representasi geospasialnya. Dalam geoparsing, nama tempat yang
berisi informasi geografis disebut dengan toponim, yang terlebih dahulu harus
diidentifikasi (disebut geotagging) dan ditentukan koordinat geografisnya (disebut
geocoding) (Gritta dkk., 2018). Pendekatan dua tahap ini umum terjadi di domain dan
ini juga merupakan cara untuk mengevaluasi geoparser (alat untuk melakukan
geoparsing). Geoparsing terdiri atas dua tahap utama, yakni geotagging dan
geocoding.
Geotagging merupakan kasus khusus dari Named Entity Recognition (NER)
yang merupakan masalah terbuka di NLP. Geotagging hanya mengambil lokasi dan
salah satu komponen pentingnya adalah Metonymy Resolution. Geocoding dari sudut
pandang NLP adalah Named Entitiy Disambiguation (NED) diikuti oleh Named Entity
Linking (NEL). Koordinat yang benar dipilih dari daftar calon koordinat untuk setiap

16
lokasi dan konteks di sekitarnya. Setiap toponim dihubungkan dengan catatan dalam
basis pengetahuan geografis seperti GeoNames. Proses geoparsing dapat dilihat pada
Gambar II.2.

Gambar II.2. Proses geoparsing


Sumber: Gritta dkk. (2018)
II.3. Visualisasi
Saat pengguna berinteraksi di Twitter, informasi network atau jaringan akan
dihasilkan. Sementara itu, saat pengguna mempublikasikan tweet, informasi tekstual
dihasilkan. Tweet memiliki informasi lain yang disematkan, seperti informasi lokasi.
Selain itu, profil pengguna juga memberikan informasi tambahan mengenai pengguna
seperti nama dan deskripsi diri. Teknik visualisasi dapat membantu dalam proses
analisis dan pemahaman secara efisien mengenai bagaimana dan mengapa pengguna
berinteraksi di Twitter. Hasil visualisasi tersebut dapat berguna untuk kegiatan analisis
visual. Analisis visual merupakan sebuah pendekatan yang membantu manusia
memeriksa data melalui visualisasi intuitif (Kumar dkk., 2013).
Visualisasi yang dapat dilakukan terhadap dataset Twitter cukup beragam, mulai
dari visualisasi terhadap informasi jaringan, temporal, tekstual, hingga informasi
geospasial. Berikut ini merupakan penjelasan dari masing-masing jenis visualisasi:
a. Jaringan: berguna untuk mendapatkan wawasan tentang bagaimana dan
mengapa pengguna saling berinteraksi. Dua jenis jaringan yang dapat
diidentifikasi adalah jaringan arus informasi (information flow networks)
dan jaringan teman-pengikut (friend-follower networks).
b. Temporal: data time-series merupakan informasi yang sensitif terhadap
waktu mengenai suatu variabel. Variabel tersebut dalam konteks Twitter
mencakup volume tweet dan interaksi harian antarpengguna. Time-series
juga disebut sebagai tren. Visualisasi tren berguna untuk mendeteksi pola

17
temporal dalam data, seperti aktivitas periodik pengguna yang berujung
pada pemahaman mengenai tindakan mereka di Twitter. Visualisasi time-
series dapat digunakan untuk menganalisis informasi yang berkaitan dengan
waktu dan menyajikan urutan alami informasi berorientasi waktu.
c. Tekstual: informasi tekstual dapat divisualisasikan menggunakan word
clouds sebagai teknik meringkas yang efektif. Kata dengan ukuran font yang
besar menunjukkan tingkat pentingnya.
d. Geospasial: visualisasi geospasial dapat membantu menjawab pertanyaan
mengenai di mana suatu peristiwa terjadi dan di mana kemungkinan
peristiwa baru akan terjadi. Contoh metode yang dapat digunakan adalah
heatmaps.
Ian Muehlenhaus dalam bukunya yang berjudul “Web Cartography: Map Design
for Interactive and Mobile Devices” (2013) menjelaskan bahwa terdapat banyak jenis
visualisasi tematik yang dapat digunakan pada informasi geospasial. Contoh yang
paling populer dan mudah digunakan adalah peta choropleth. Penjelasan masing-
masing jenisnya dijelaskan sebagai berikut:
a. Peta choropleth: peta choropleth menggunakan nilai, warna, atau saturasi
yang berbeda untuk menunjukkan perbedaan data antarunit enumerasi
(misalnya kabupaten, provinsi, atau negara). Teknik klasifikasi untuk
menyajikan peta jenis ini beragam dan perlu dipilih dengan bijak agar efektif
untuk menampilkan informasi spasial secara intuitif. Beberapa teknik
tersebut di antaranya adalah natural breaks, quantiles, equal intervals,
standard deviations, dan juga unclassed choropleth maps.
b. Peta dot/titik: peta titik adalah representasi yang sangat baik untuk
menunjukkan distribusi spasial kumpulan data dalam unit enumerasi. Salah
satu contoh bentuk peta titik adalah heatmaps.
c. Peta simbol proporsional dan bertingkat: jenis peta ini sangat baik untuk
memvisualisasikan nilai mentah dari kumpulan data yang dihitung
berdasarkan unit enumerasi, berkebalikan dengan choropleth. Seperti peta
titik, peta jenis ini juga menggunakan simbol untuk mewakili nilai, tetapi
hanya diperlukan satu simbol per unit enumerasi dengan simbol di setiap

18
area diubah ukurannya dibandingkan dengan nilai lain dalam kumpulan
data. Simbol harus diukur secara proporsional berdasarkan luas.
d. Peta isaritmik: peta jenis ini merepresentasikan data menggunakan garis.
Setiap garis pada peta isaritmik mewakili nilai konstanta yang terjadi tegak
lurus permukaan bumi. Ada banyak nama spesifik yang diberikan pada garis
isaritmik tergantung pada jenis data yang dipetakannya; isoterm adalah garis
yang melambangkan suhu; isobar adalah garis yang melambangkan tekanan
atmosfer; isobath melambangkan kedalaman; dst. Dua jenis peta isaritmik
dapat dibuat bergantung pada sifat sampel data, yakni isometrik dan
isopletik. Peta isometrik dibuat dari data yang dikumpulkan di lokasi
tertentu dengan koordinat (data titik), sedangkan isoplet mewakili nilai yang
dikumpulkan berdasarkan unit enumerasi atau area poligon.
e. Peta aliran: merupakan salah satu representasi tematik yang paling dinamis.
Peta aliran digunakan untuk mewakili data yang bergerak dengan
menggambar garis dengan mata panah yang menunjukkan ke arah mana
suatu pergerakan terjadi. Jika terjadi pergerakan dua arah, maka akan ada
dua atau tidak ada mata panah yang ditampilkan.
f. Kartogram: kartogram merepresentasikan data dengan secara langsung
mendistorsi bentuk dan ukuran unit enumerasi pada peta dasar. Besaran
satuan pencacahan diubah berdasarkan kesamaan nilai data dan dibuat
proporsional satu sama lain. Kartogram paling efektif dalam memetakan
data mentah, tetapi juga dapat digunakan untuk memetakan persentase yang
bila digabungkan hasilnya 100.
g. Peta multivariat: merupakan peta yang menampilkan lebih dari satu tema
dalam satu waktu. Paling tidak terdapat lima jenis representasi multivairat
yang umum, antara lain thematic combinations, colored dots, chart maps,
charnoff faces, dan bivariate choropleth maps.
II.4. Webmap
Teknologi berubah dengan cepat dan tidak selalu dapat diprediksi. Seperti
halnya pada saat pemetaan masih berbasis kertas atau cetak (yang tidak dapat diakses
dalam jaringan) hingga akhirnya berkembang menjadi pemetaan berbasis web dengan
beragam keunggulannya. JavaScript−yang sering menjadi pilihan saat membuat peta

19
berbasis web karena interaktivitasnya−pun dahulunya dihindari oleh para pembuat
program karena JavaScript bukan merupakan bahasa “asli”, yakni JavaScript tidak
dikompilasi (Muehlenhaus, 2013). Tipe data spasial yang kompatibel dengan web juga
telah bermunculan, seperti KML (Keyhole Markup Language), GeoJSON
(Geographical JavaScript Object Notation), dan map tiles. Peta web tidak lagi terbatas
pada browser karena saat ini peta interaktif dapat dikemas sebagai aplikasi seluler atau
peta untuk dijual seperti peta kertas biasanya. Salah satu contoh library JavaScript
yang sangat berguna adalah D3.js. D3 (Data-Driven Document) merupakan perangkat
visualisasi serbaguna yang mendukung berbagai jenis visualisasi (Kumar dkk., 2013).
Pembuatan peta berbasis web paling tidak terdiri atas tiga bahasa terpisah, yakni
HTML, CSS, dan JavaScript. Masing-masing komponen ini menggunakan sintaks
pengkodean uniknya sendiri dan peran berbeda dalam membuat situs web berfungsi.
Berikut dijelaskan masing-masing bahasa tersebut berdasarkan buku yang berjudul
“Web Cartography: Map Design for Interactive and Mobile Devices” (2013).
1. HTML (Hyper Text Markup Language): HTML merupakan tumpuan dari
sebuah web, yakni bahasa yang digunakan untuk menyediakan konten ke
konten web. Sintaks HTML cukup sederhana yaitu bekerja melalui
penggunaan tag. HTML sebelumnya sangat terbatas dalam hal interaktivitas
dan kemampuan desain hingga akhirnya berkembang menjadi HTML5
untuk menyertakan sejumlah fitur interaktif dan dinamis baru yang
sebelumnya merupakan domain plug-in browser eksternal. HTML saat ini
digunakan hampir hanya untuk pengorganisasian dan pengiriman konten.
Dalam sistem HTML5 baru, HTML digunakan untuk konten. Penataan gaya
dan interaktivitas diserahkan kepada bahasa lain yaitu CSS dan JavaScript.
2. CSS (Cascading Style Sheets): jika HTML digunakan untuk menyediakan
dan mengatur konten yang dikirim ke browser web, maka CSS mengatur
gaya konten ini di dalam browser. Kegunaan CSS adalah untuk memformat
bahasa markup, yaitu HTML dan XML (Extensible Markup Language).
CSS berguna untuk membuat tampilan peta web menarik dengan mendesain
tampilan dan nuansa elemen peta web: batas, isian, garis luar, bayangan,
bentuk, bahkan tata letak peta.

20
3. JavaScript: berguna untuk memberikan interaktivitas pada peta web.
JavaScript merupakan bahasa pemrograman berbasis objek (OOP – Object
Oriented Programming) yang memungkinkan beragam pekerjaan, seperti
berinteraksi dan memperbarui konten halaman web tanpa memuat ulang
halaman, menganimasikan bagian peta web, memvalidasi informasi
formulir, dan mengambil data eksternal. Penggunaan HTML5 pada peta
web akan membutuhkan JavaScript untuk membuat interaktivitasnya.
II.5. Uji Usabilitas
ISO 9241-11 (2018) menyebutkan bahwa usabilitas merupakan tingkat
kegunaan dari sistem, produk, atau layanan dapat digunakan oleh pengguna sehingga
tujuan dapat dicapai secara efektif, efisien, dan memuaskan. Holzinger (2005)
menyebutkan bahwa terdapat beberapa metode dalam uji usabilitas yang biasa
dilakukan, antara lain:
1. Holistic evaluation (HE): diperlukan pakar untuk menguji apakah setiap
dialog elemen telah memenuhi prinsip usabilitas.
2. Cognitive walktrough (CW): metode yang berorientasi pada tugas, analisis
dilakukan untuk mengeksplorasi fungsi dari sistem.
3. Action analysis: mengutamakan apa yang dilakukan partisipan daripada apa
yang mereka katakan.
4. Thinking aloud (THA): melibatkan pikiran-pikiran pengguna saat
menggunakan sistem.
5. Field observation: metode yang tersederhana yakni dengan mengunjungi
satu per satu pengguna dan mengajukan pertanyaan-pertanyaan.
6. Questionnaires: metode tidak langsung dengan mengumpulkan pendapat
pengguna melalui pertanyaan-pertanyaan.
Quesenbery (2004) mendefinisikan usabilitas/kegunaan sebagai kualitas atau
karakteristik suatu produk berupa perangkat lunak dan aplikasi web yang memenuhi
kebutuhan orang yang berkepentingan untuk menggunakan produk tersebut sesuai
dengan kebutuhan pengguna. Menurut Quesenbery (2004), dimensi uji usabilitas
terbagi menjadi lima kriteria atau biasa disebut dengan 5Es: Usability, yaitu:
1. Effective/efektivitas: apakah produk berguna dan dapat membantu
pengguna untuk mencapai tujuan mereka dengan akurat.

21
2. Efficient/efisiensi: kecepatan dalam menyelesaikan suatu pekerjaan.
3. Engaging/daya tarik: seberapa nyaman, memuaskan, atau menarik sebuah
antarmuka saat digunakan.
4. Error Tolerant/toleransi terhadap kesalahan: seberapa baik produk dalam
mencegah kesalahan dan membantu pengguna menyelesaikan masalah yang
terjadi.
5. Easy to Learn/mudah dipelajari: seberapa mudah produk untuk dipahami
pengguna, baik pengguna ahli maupun pengguna awam.

22
23

BAB III
RENCANA PENELITIAN
III.1. Persiapan
III.1.1. Persiapan Alat
Perangkat keras yang digunakan adalah:
1. Laptop ASUS M409D dengan spesifikasi processor AMD Ryzen 3 3200U
dengan Radeon Vega Mobile Gfx 2.6GHz, RAM 4GB, SSD NVMe M.2 V-
GeN berkapasitas 256GB, HDD berkapasitas 1TB, dan tetikus logitech.
Perangkat digunakan dalam pengolahan data dan penulisan penelitian.
2. Harddisk Seagate berkapasitas 1 TB untuk penyimpanan data.
3. Printer untuk mencetak laporan penelitian.
Perangkat lunak yang digunakan adalah:
1. Sistem operasi Microsoft Windows 10.
2. Microsoft Word 2016 untuk penulisan laporan.
3. Draw.io untuk pembuatan diagram alir penelitian dan class diagram.
4. Jupyter Notebook sebagai lingkungan komputasi interaktif yang digunakan
untuk analisis data dan machine learning.
5. Visual Studio Code untuk menuliskan skrip kode Webmap visualisasi.
6. Github untuk melakukan deployment Webmap.
III.1.2. Persiapan Bahan
Bahan yang digunakan dalam penelitian ini adalah:
1. Alat tulis untuk menuliskan informasi yang diperlukan.
2. Dataset hasil scraping data tweet dari Twitter dalam format csv yang diperoleh
dari peneliti sebelumnya yaitu Nur Ulum Rahmanulloh (2022). Kolom yang
tersedia adalah “Datetime,Tweet Id,Text,Username” yaitu waktu saat tweet
diunggah, id tweet sebagai identitas unik, teks tweet yang diunggah, dan
username pengguna. Setiap file csv memuat hasil scraping untuk seorang
kandidat−yaitu Anies Baswedan, Ganjar Pranowo, Prabowo Subianto, Ridwan
Kamil, dan Sandiaga Uno−dalam jangka waktu satu bulan. Proses scraping
dilakukan terhadap tweet yang diunggah sejak 1 Januari 2021 hingga 31 Januari
2021 sehingga setiap kandidat memiliki 12 file csv dan total file csv adalah
sebanyak 60.
3. Batas administrasi Indonesia dalam unit kabupaten dan provinsi yang diperoleh
dari Badan Informasi Geospasial dalam format shapefile.
4. Basemap dari library OpenStreetMap.
III.2. Cara Penelitian
Penelitian akan dilakukan melalui beberapa tahapan yang akan digambarkan
dengan diagram alir pada Gambar III.1.

Gambar III.1. Tahapan Penelitian


III.2.1. Geoparsing
Geoparsing akan dilakukan dengan mengkombinasikan beberapa metode yang
terdapat dalam jurnal untuk mengatasi permasalahan lokasi asal dan bukan asal serta

24
meningkatkan ketepatan dalam pendeteksian lokasi. Geoparsing juga akan dicoba
pada gambar di tweet yang memuat data geotagging. Metode yang dapat mengatasi
permasalahan saat pengguna tidak menge-tweet dari tempat asalnya adalah True
Origin Model (Lamsal dkk., 2022). Sementara metode yang digunakan untuk
meningkatkan hasil geoparsing adalah TAGGS (de Bruijn dkk., 2018).
III.2.2. Analisis Sentimen
Analisis sentimen akan dilakukan dengan memanfaatkan beberapa metode
dengan tujuan untuk memperoleh hasil dengan akurasi terbaik. Metode yang
digunakan antara lain Naïve Bayes, Support Vector Machine, K-Nearest Neighbor, dan
Deep Belief Network. Hasil analisis sentimen dengan akurasi terbaik akan digunakan
dalam proses selanjutnya yaitu prediksi terhadap sentimen masa depan.
III.2.3. Visualisasi dan Pembuatan Webmap
Sebelum peta online dibuat, terlebih dahulu dilakukan analisis menggunakan
perangkat lunak QGIS untuk menghasilkan choropleth dan beberapa peta tematik
untuk menampilkan visualisasi seperti sebaran Daftar Pemilih Tetap (DPT)
berdasarkan jenis kelamin, usia, dan pekerjaan. Namun, hal tersebut belum dapat
dipastikan mengingat kebijakan Twitter yang telah berubah dan membatasi akses API-
nya. Hal itu berdampak pada terhalangnya akses untuk mengetahui informasi-
informasi tersebut pada profil pengguna.
III.2.4. Uji Usabilitas
Webmap yang telah dibuat perlu diuji tingkat usabilitasnya untuk mengetahui
tanggapan pengguna terhadap fungsi dan tampilannya. Hal itu dapat berguna dalam
perbaikan ke depannya. Pengujian dilakukan dengan metode kuisioner, pengguna
diberikan beberapa pertanyaan terkait dengan lima kriteria usabilitas (5Es). Tabel III.1
menunjukkan pernyataan yang akan digunakan dalam kuisioner. Kuisioner tersebut
merupakan adopsi dari penelitian Setyawati (2022). Adapun pernyataan-pernyataan
tersebut memiliki pilihan tanggapan sesuai skala Likert dengan rentang nilai dari 1
sampai dengan 5. Pilihan yang dapat dipilih oleh pengguna dan bobotnya ditunjukkan
oleh Tabel III.2.

25
Tabel III.1. Pernyataan kuisioner
Aspek
Komponen Kode Pernyataan
Usabilitas
P1 Menurut saya tampilan Webmap sudah menarik Engaging
Tampilan P2 Saya mudah memahami informasi yang diilustrasikan Easy to learn
Webmap Menurut saya pewarnaan masing-masing komponen
P3 Engaging
telah sesuai
Menurut saya Webmap memiliki loading time yang
P4 Efficient
cepat (< 1 menit)
Saya tidak kesulitan dalam menggunakan fitur-fitur
P5 Easy to learn
yang ada pada Webmap
Menurut saya perolehan informasi terkait analisis
P6 sentimen, jumlah DPT, dan jumlah TPS dilakukan Efficient
secara cepat
Fungsi
Error
Webmap P7 Saya dapat menggunakan Webmap tanpa kendala
tolerant
Saya dapat memahami penggunaan Webmap secara
P8 Easy to learn
mudah dan cepat
Menurut saya informasi yang ditampilkan sesuai
P9 Effective
dengan keadaan sebenarnya
Menurut saya fitur-fitur pada Webmap dapat berjalan Error
P10
dengan baik tolerant
Sumber: Setyawati (2022)
Tabel III.2. Bobot pilihan pernyataan
Pilihan Nilai
Sangat Setuju (SS) 5
Setuju (S) 4
Cukup Setuju (CS) 3
Tidak Setuju (TS) 2
Sangat Tidak Setuju (STS) 1
Indikator pernyataan yang diisikan oleh pengguna dihitung dengan mengalikan
tanggapan pengguna dengan bobot nilai sesuai Tabel III.2. Nilai yang diperoleh
selanjutnya dijumlah dan dihitung rata-ratanya sesuai jumlah pengguna untuk
mendapatkan nilai pada setiap pernyataan. Nilai pada setiap pernyataan kemudian
dirata-rata untuk memperoleh nilai kegunaan secara keseluruhan.
III.2.5. Penarikan Kesimpulan dan Penulisan Laporan Akhir
Setelah seluruh tahapan sudah dilakukan, maka seluruh proses dan hasil ditulis
dalam bentuk laporan tugas akhir. Tahapan terakhir dari kegiatan penelitian adalah
penarikan kesimpulan dan pelaporan akhir kegiatan penelitian yang dilakukan.
Penarikan kesimpulan dilakukan setelah dilakukan uji usabilitas dan analisis terhadap
hasil kuisioner. Selanjutnya, dilakukan penyusunan laporan akhir yang sesuai dengan
format yang sudah ditentukan. Laporan akhir terdiri atas lima bab utama yaitu terkait

26
pendahuluan, landasan teori, pelaksanaan, hasil dan pembahasan, serta yang terakhir
adalah kesimpulan dan saran.
III.3. Jadwal Penelitian
Penelitian akan dilaksanakan pada bulan September hingga bulan Desember
2023 dan bulan Januari 2024 dengan rincian jadwal seperti yang ditampilkan pada
Tabel III.3.
Tabel III.3. Rencana jadwal penelitian
Tahun 2023 dan 2024
No. Nama Kegiatan
Sep Okt Nov Des Jan
1. Persiapan
Studi Literatur
Alat dan Bahan
2. Pelaksanaan
Geoparsing dan analisis sentimen
Visualisasi dan Pembuatan Webmap
Uji Usabilitas
Analisis hasil
3. Pelaporan
Penulisan Tesis
Konsultasi dengan Dosen Pembimbing
Submit Jurnal
Seminar Tesis
Revisi Draf Tesis
Yudisium

27
DAFTAR PUSTAKA

Al isfahani, F., & Mubarok, R. (2021). Analisis Sentimen Pengguna Twitter terhadap
Kebijakan Pemberlakuan Pembatasan Sosial Berskala Besar (PSBB) dengan
Metode Naive Bayes. Jurnal Siliwangi Seri Sains Dan Teknologi, 7(1), 19–24.
http://jurnal.unsil.ac.id/index.php/jssainstek/article/view/3726
Asmara, R., Ardiansyah, M. F., & Anshori, M. (2020). Analisa Sentiment Masyarakat
terhadap Pemilu 2019 berdasarkan Opini di Twitter Menggunakan Metode Naive
Bayes Classifier. INOVTEK Polbeng - Seri Informatika, 5(2), 193.
https://doi.org/10.35314/isi.v5i2.1095
Buntoro, G. A. (2017). Analisis Sentimen Calon Gubernur DKI Jakarta 2017 Di
Twitter. INTEGER: Journal of Information Technology, 2(1), 32–41.
https://doi.org/10.31284/j.integer.2017.v2i1.95
Buyya, R., Calheiros, R. N., & Dastjerdi, A. V. (2016). Big Data: Principles and
Paradigms. In Elsevier. https://doi.org/10.1016/C2015-0-04136-3
Camacho, K., Portelli, R., Shortridge, A., & Takahashi, B. (2021). Sentiment
Mapping: Point Pattern Analysis of Sentiment Classified Twitter Data.
Cartography and Geographic Information Science, 48(3), 241–257.
https://doi.org/10.1080/15230406.2020.1869999
de Bruijn, J. A., de Moel, H., Jongman, B., Wagemaker, J., & Aerts, J. C. J. H. (2018).
TAGGS: Grouping Tweets to Improve Global Geoparsing for Disaster Response.
Journal of Geovisualization and Spatial Analysis, 2(1).
https://doi.org/10.1007/s41651-017-0010-6
Ebrahimi, M., Yazdavar, A. H., & Sheth, A. (2017). Challenges of Sentiment Analysis
for Dynamic Events. IEEE Intelligent Systems, 32(5), 70–75.
https://doi.org/10.1109/MIS.2017.3711649
eDiscoveryToday. (2023, April 20). 2023 Internet Minute Infographic, by eDiscovery
Today and LTMG! https://ediscoverytoday.com/2023/04/20/2023-internet-
minute-infographic-by-ediscovery-today-and-ltmg-ediscovery-trends/
Fadhel, R., Adrianto, F., & Alfarisi, M. F. (2022). Analisis Sentimen Investor terhadap
Kinerja Saham Syariah di Indonesia Selama Masa Pandemi COVID-19. Owner,
6(4), 3579–3591. https://doi.org/10.33395/owner.v6i4.1183
Firdlous, D. A., & Andrian, R. (2023). Sentiment Analysis Public Twitter on 2024
Election using the Long Short Term Memory Model. Sistemasi, 12(1), 52.
https://doi.org/10.32520/stmsi.v12i1.2145
Fitriyyah, S. N. J., Safriadi, N., & Pratama, E. E. (2019). Analisis Sentimen Calon
Presiden Indonesia 2019 dari Media Sosial Twitter Menggunakan Metode Naive
Bayes. Jurnal Edukasi Dan Penelitian Informatika (JEPIN), 5(3), 279.
https://doi.org/10.26418/jp.v5i3.34368
Gritta, M., Pilehvar, M. T., Limsopatham, N., & Collier, N. (2018). What’s Missing in
Geographical Parsing? Language Resources and Evaluation, 52(2), 603–623.
https://doi.org/10.1007/s10579-017-9385-8
Holzinger, A. (2005). Usability Engineering Methods for Software Developers.
Communications of the ACM, 48(1), 71–74.
https://doi.org/10.1145/1039539.1039541
International Organization for Standardization. (2018). International Standard 9241-
11:2018 Usability : Definitions and Concepts.

28
Jati, W. P., Lutfi, A. Z., Ilma, H., & Widodo, E. (2019). Analisis Sentimen terhadap
Isu Politik Calon Presiden Indonesia 2019 berdasarkan Opini Netizen dari Twitter
Menggunakan Metode Klasifikasi Support Vector Machine. Prosiding
Konferensi Nasional Penelitian Matematika Dan Pembelajarannya (KNPMP) IV
2019, Prodi Pendidikan Matematika FKIP UMS, PROSIDING-M2.
Jebara, T. (2004). Machine Learning: Discriminative and Generative. In Artforum
International (Vol. 51, Issue 1). Springer Science+Business Media, LLC.
https://doi.org/10.1007/978-1-4419-9011-2
Johnston, R. J. (1973). Spatial Patterns and Influences on Voting in Multi-candidate
Elections: The Christchurch City Council Elections, 1968. Urban Studies, 10(1),
69–81. https://doi.org/10.1080/00420987320080041
KOMPAS.com. (2020, January 22). Refleksi Pemilu 2019, Sebanyak 894 Petugas
KPPS Meninggal Dunia.
https://nasional.kompas.com/read/2020/01/22/15460191/refleksi-pemilu-2019-
sebanyak-894-petugas-kpps-meninggal-dunia
Kumar, S., Morstatter, F., & Liu, H. (2013). Twitter Data Analytics. In Springer.
Lamsal, R., Harwood, A., & Read, M. R. (2022). Where Did You Tweet from?
Inferring the Origin Locations of Tweets Based on Contextual Information.
Proceedings - 2022 IEEE International Conference on Big Data, Big Data 2022,
3935–3944. https://doi.org/10.1109/BigData55660.2022.10020460
Lee, J., & Wong, D. W. S. (2000). Statiscal Analysis with ArcView Gis.
Mailo, F. F., & Lazuardi, L. (2021). Analisis Sentimen Data Twitter Menggunakan
Metode Text Mining tentang Masalah Obesitas di Indonesia. Journal of
Information Systems for Public Health, 6(1), 44.
https://doi.org/10.22146/jisph.44455
McPhail, I. R. (1971). The Vote for Mayor of Los Angeles in 1969. Annals of the
Association of American Geographers, 61(4), 744–758.
Muehlenhaus, I. (2013). Web Cartography: Map Design for Interactive and Mobile
Devices. In Web Cartography. https://doi.org/10.1201/b16229
Mustari, N., Suardi, W., & Syukri, U. (2022). Analisis Sentimen Media Sosial:
Penerapan E-Katalog dalam Pengadaan Barang dan Jasa di Indonesia. PRAJA:
Jurnal Ilmiah Pemerintahan, 10(3), 193–200.
https://doi.org/10.55678/prj.v10i3.702
Nababan, A. P. R., Lumenta, A. S. M., Rindengan, Y. D. Y., Pontoh, F. J., & Akay, Y.
V. (2020). Analisis Sentimen Twitter Pasca Pengumuman Hasil Pilpres 2019
Menggunakan Metode Lexicon Analysis. Jurnal Teknik Informatika, 15(1), 33–
44.
Padhana, K. A., & Sadikin, M. (2021). Analisis Sentimen Masyarakat Terhadap
Kondisi Perekonomian di Indonesia Pada Masa Pandemi 2020. Jurnal Ilmu
Teknik Dan Komputer, 5(2), 268–277.
Paul, D., Li, F., Teja, M. K., Yu, X., & Frost, R. (2017). Compass: Spatio temporal
sentiment analysis of US election what twitter says! Proceedings of the ACM
SIGKDD International Conference on Knowledge Discovery and Data Mining,
Part F1296(November 2018), 1585–1594.
https://doi.org/10.1145/3097983.3098053
Perdana, A., Hermawan, A., & Avianto, D. (2022). Analisis Sentimen Terhadap Isu
Penundaan Pemilu di Twitter Menggunakan Naive Bayes Clasifier. Jurnal

29
Sisfokom (Sistem Informasi Dan Komputer), 11(2), 195–200.
https://doi.org/10.32736/sisfokom.v11i2.1412
Perez-Cepeda, M., & Arias-Bolzmann, L. G. (2022). Sociocultural Factors During
COVID-19 Pandemic: Information Consumption on Twitter. Journal of Business
Research, 140(May 2021), 384–393.
https://doi.org/10.1016/j.jbusres.2021.11.008
Quesenbery, W. (2004). Balancing the 5Es : Usability Set Your Mind at Es. Cutter IT
Journal, 17(2), 4–11.
Rahmanulloh, N. U., & Santoso, I. (2022). Delineation of The Early 2024 Election
Map: Sentiment Analysis Approach to Twitter Data. Jurnal Online Informatika,
7(2), 226–235. https://doi.org/10.15575/join.v7i2.925
Ramadhan, N. G., Wibowo, M., Mohd Rosely, N. F. L., & Quix, C. (2022). Opinion
Mining Indonesian Presidential Election on Twitter Data Based on Decision Tree
Method. Jurnal Infotel, 14(4), 243–248.
https://doi.org/10.20895/infotel.v14i4.832
Ratnasari, N., Candra, E. D., Saputra, D. H., & Perdana, A. P. (2016). Urban Spatial
Pattern and Interaction based on Analysis of Nighttime Remote Sensing Data and
Geo-social Media Information. IOP Conference Series: Earth and Environmental
Science, 47(1). https://doi.org/10.1088/1755-1315/47/1/012038
Romadloni, N. T., Santoso, I., & Budilaksono, S. (2019). Perbandingan Metode Naive
Bayes, KNN dan Decision Tree terhadap Analisis Sentimen Transportasi KRL
Commuter Line. Jurnal IKRA-ITH Informatika, 3(2), 1–9.
Sasmita, A. B., Rahayudi, B., & Muflikhah, L. (2022). Analisis Sentimen Komentar
pada Media Sosial Twitter tentang PPKM Covid-19 di Indonesia dengan Metode
Naïve Bayes. Jurnal Pengembangan Teknologi Informasi Dan Ilmu Komputer,
6(3), 1208–1214. http://j-ptiik.ub.ac.id
Seno, D. W., & Wibowo, A. (2019). Analisis Sentimen Data Twitter tentang Pasangan
Capres-Cawapres Pemilu 2019 dengan Metode Lexicon Based dan Support
Vector Machine. Jurnal Ilmiah FIFO, 11(2), 144.
https://doi.org/10.22441/fifo.2019.v11i2.004
Setyawati, A. D. (2022). Pemberian Alamat dan Pembuatan Kode Lokasi Alamat
(Geocoded Address) untuk Wilayah Desa Karangsari, Kabupaten Kulon Progo.
Song, Z., & Xia, J. (Cecilia). (2016). Spatial and Temporal Sentiment Analysis of
Twitter data. European Handbook of Crowdsourced Geographic Information,
205–221. https://doi.org/10.5334/bax.p
Sujadi, C. C., Sibaroni, Y., & Ihsan, A. F. (2023). Analysis Content Type and Emotion
of the Presidential Election Users Tweets using Agglomerative Hierarchical
Clustering. 8(3), 1230–1237.
Support. (2019, June 19). Support on X: "Most people don’t tag their precise location
in Tweets, so we’re removing this ability to simplify your Tweeting experience.
You’ll still be able to tag your precise location in Tweets through our updated
camera. It’s helpful when sharing o.
https://twitter.com/Support/status/1141039841993355264?ref_src=twsrc%5Etf
w%7Ctwcamp%5Etweetembed%7Ctwterm%5E1141040749586157569%7Ctw
gr%5E6dcfdf35f6e397b56b611780e92be9d2dce05bde%7Ctwcon%5Es2_&ref_
url=https%3A%2F%2F9to5mac.com%2F2019%2F06%2F19%2Ftwitter-pr
Vindua, R., & Zailani, A. U. (2023). Analisis Sentimen Pemilu Indonesia Tahun 2024

30
Dari Media Sosial Twitter Menggunakan Python. JURIKOM (Jurnal Riset
Komputer), 10(2), 479. https://doi.org/10.30865/jurikom.v10i2.5945
VOI.id. (2023, July 10). Bos Instagram: Threads Tidak Akan Mendorong Politik dan
Berita Keras. https://voi.id/teknologi/292555/bos-instagram-threads-tidak-akan-
mendorong-politik-dan-berita-keras
Woolstencroft, R. P. (1980). Electoral Geography: Retrospect and Prospect.
International Political Science Review, 1(4), 540–560.
https://www.jstor.org/stable/1600753
Yaqub, U., Sharma, N., Pabreja, R., Chun, S. A., Atluri, V., & Vaidya, J. (2020).
Location-based Sentiment Analyses and Visualization of Twitter Election Data.
Digital Government: Research and Practice, 1(2), 1–19.
https://doi.org/10.1145/3339909
Zuhri, K., Adha, N., & Saputri, O. (2020). Analisis Sentimen Masyarakat terhadap
Pilpres 2019 Berdasarkan Opini dari Twitter Menggunakan Metode Naive Bayes
Classifier. Bina Darma Conference on Computer Science 2020, 259–269.

31

Anda mungkin juga menyukai