1 PB
1 PB
56664
Vol. 10, No. 4, Oktober 2022
Abstrak
Fashion show merupakan salah satu ajang untuk mengekspresikan diri dalam bentuk busana, dan juga sebagai
wadah bagi seseorang untuk menyampaikan pesan tertentu bagi komunitas disekitarnya. Pergelaran peragaan
busana Citayam Fashion Week yang cukup trending di media sosial, memberikan beberapa respon dari netizen,
khususnya di media sosial tweeter. Penelitian ini bertujuan untuk menganalisa sentimen netizen yang
dikumpulkan dari hasil crawling tweet media sosial Twitter, yang kemudian dianalisis nilai-nilai sentimen di
dalamnya. Nilai-nilai ini kemudian dikelompokkan menggunakan algoritma k-means clustering, untuk seterusnya
digunakan sebagai kategori target dalam proses klasifikasi menggunakan algoritma support vector machine. Hasil
yang diperoleh dalam penelitian ini adalah dari tiga cluster yang dibentuk, 38,6% respon dari tweet menyatakan
sentimen positif, 40,4% menyatakan sentimen netral, dan 21% menyatakan respon negatif. Hasil klasifikasi
menggunakan algoritma SVM menunjukkan akurasi, presisi dan sensitivitas yang cukup baik untuk masing-masing
cluster yang terbentuk, dengan rata-rata nilai sebesar 98,75%, 98,96%, dan 97,48%.
Kata kunci: Analisis Sentimen, Tweeter, K-Means Clustering, Support Vector Machine
permasalahan tertentu, setelah terlebih dahulu melalui kata kunci, yaitu “citayam”, “fashion week” dan “citayam
proses pre-processing text seperi case folding, tokenisasi, fashion week” dalam proses pengumpulan tweet.
filtering, dan stemming [5]. Dengan memanfaatkan teknik- Tweet yang diperoleh kemudian difilter menggunakan
tenik information text retrieval untuk proses filtering widget Select Rows, untuk membuang tweet yang tidak
seperti stopwords, pembobotan kata, dan peletakan kata, menggunakan Bahasa Indonesia, dan hasilnya kemudian di
informasi yang diperoleh dapat diteruskan sebagai input pre-process untuk memperoleh token-token yang akan
bagi proses data mining untuk mengklasifikasikan data- dianalisa.
data yang ada di dalam sebuah dataset [6]. Dengan memanfaatkan widget Preprocessing Text yang
Clustering merupakan salah satu penerapan data mining disediakan oleh aplikasi Orange 3, pre-processing pada
yang berfungsi untuk mengelompokkan data ke dalam penelitian ini dilakukan melalui tiga tahapan, yaitu:
kelompok-kelompok yang berbeda, berdasarkan tingkat 1) Transformasi: Pada proses ini, masing-masing
kedekatannya [7]. Sebagai salah satu algoritma clustering, tweet ditransformasi menjadi bentuk huruf kecil, kemudian
k-means clustering mampu mengubah sekumpulan data menghilangkan kata-kata yang mengandung html, serta
yang belum diberi label atau target sebelumnya, menjadi membuang kata-kata yang mengandung http atau https.
data yang memiliki label melalui proses pengelompokkan 2) Tokenisasi: Pada proses ini, digunakan pre-
berdasarkan nilai jarak kedekatan masing-masing data trained Twitter model yang disediakan oleh aplikasi
terhadap cluster yang dibentuk [8]. Beberapa penelitian Orange 3, agar kata-kata yang mengandung simbol “#” dan
sudah membuktikan bahwa algoritma ini sangat baik untuk “@” tidak hilang.
dikombinasikan dengan algoritma lain yang membutuhkan 3) Filtering: Pada proses ini, dilakukan filter
label atau target pada data di dalam dataset, seperti terhadap kata-kata yang tidak mengandung makna
kombinasi dengan algoritma C4.5, decision tree, dan naïve sentimen di dalam Bahasa Indonesia, dengan memilih opsi
bayes dalam klasifikasi citra daun Tin [9], kombinasi Bahasa Indonesia pada bagian Stopwords. Selanjutnya
dengan algoritma random forest, support vector machine dilakukan filterisasi terhadap kata-kata yang berbentuk
(SVM), dan k-medoids dalam klasifikasi bunga Iris [10], angka numerik, dan akhirnya digunakan filterisasi Regexp
serta kombinasi dengan algoritma J48, random forest, dan (reguler expression), untuk memisah tweet menjadi kata-
k-nearest neighbors pada pengenalan iris mata manusia kata berbentuk token.
[11]. Berdasarkan penelitian-penelitian ini, algoritma k-
Data Transformasi Transformasi
means clustering digunakan untuk mengelompokkan nilai
Tweet Huruf Kecil Hapus html
sentimen di dalam tweet sehingga diperoleh kategori target Tweet
berupa sentimen positif, netral, dan negatif, yang kemudian Stopwords Pre-trained Transformasi
diolah melalui proses klasifikasi menggunakan algoritma Indonesia Twitter Model Hapus url
SVM.
Proses klasifikasi SVM dilakukan dengan cara Filter Filter
Token
memisahkan data menggunakan sebuah hyperplane, Numerik Regexp
menjadi dua kelas, yaitu positif dan negatif, berdasarkan
nilai kedekatan masing-masing vektor terhadap hyperplane Gambar 1. Pre-processing text
yang diperoleh [12]. SVM merupakan algoritma yang
populer digunakan dalam masalah klasifikasi karena Widget Sentiment Analysis selanjutnya digunakan untuk
akurasinya yang sangat baik, seperti penelitian klasifikasi menghitung nilai sentimen dari masing-masing tweet, yang
kanker payudara yang menghasilkan rata-rata nilai akurasi dapat bernilai positif, nol, ataupun negatif. Pada tahapan ini
sebesar 96,4% [13], penentuan jurusan siswa SMK dengan digunakan opsi pre-trained Multilangual Sentiment model
nilai akurasi sebesar 89% [14], dan klasifikasi peserta JISC yang disediakan oleh aplikasi Orange 3, dalam Bahasa
dengan nilai akurasi sebesar 95% [15]. Indonesia.
Pada penelitian ini, hasil klasifikasi sentimen Nilai sentimen yang diperoleh dari proses ini digunakan
masyarakat terhadap Citayam Fashion Week akan sebagai fitur dalam proses clustering menggunakan
dievaluasi menggunakan 10-fold cross validation, untuk algoritma k-means clustering. Pada tahapan ini, digunakan
memperoleh nilai akurasi, presisi dan sensitivitas dari parameter K = 3, sesuai dengan target respon sentimen
model yang dihasilkan, sehingga dapat diukur seberapa yang diinginkan, yaitu sentimen positif, netral dan negatif.
baik performanya. Selain itu, penelitian ini juga bertujuan Untuk menentukan kategori masing-masing cluster yang
untuk menganalisa respon masyarakat, khususnya netizen dihasilkan (C1, C2, dan C3), dihitung jumlah masing-
Indonesia, terhadap adanya pergeleran busana Citayam masing sentimen yang ada pada masing-masing cluster,
Fashion Week, yang dikumpulkan dari tweet media sosial dengan sentimen terbanyak digunakan sebagai kategori
Twitter. untuk cluster tersebut. Sebagai contoh, jika cluster C1
memiliki anggota 224 sentimen netral dan 16 sentimen
II. METODOLOGI bernilai negatif, maka C1 dikategorikan sebagai cluster
untuk sentimen netral. Demikian seterusnya untuk cluster
Penelitian ini menggunakan Twitter API untuk
C2 dan C3, digunakan proses yang sama.
mengumpulkan data tweet yang dibutuhkan di dalam
penelitian. Dengan menggunakan widget Twitter yang
disediakan aplikasi Orange 3 data mining, digunakan tiga
kernels,” Int. J. Electr. Comput. Eng., vol. 10, no. 5, pp. 5497–5506,
2020, doi: 10.11591/IJECE.V10I5.PP5497-5506.
[17] J. T. Samudra, B. H. Hayadi, and P. S. Ramadhan, “Komparasi 3
Metode Algoritma Klasifikasi Data Mining Pada Prediksi Kenaikan
Jabatan,” J. Teknol. Sist. Inf. dan Sist. Komput. TGD, vol. 5, no. 2,
pp. 127–133, 2022, [Online]. Available:
https://ojs.trigunadharma.ac.id/index.php/jsk/article/view/5642.