Abstrak – Kitabisa merupakan sebuah aplikasi asal Indonesia yang berfungsi untuk menggalang dana
secara online. Melalui aplikasi Kitabisa, pengguna dapat dengan mudah mendukung berbagai jenis
kampanye dan menyumbangkan dana untuk berbagai tujuan sosial. Berdasarkan hasil analisis sentimen
dari ulasan pengguna di Google Play Store, terdapat beragam pendapat mengenai aplikasi dan fitur-
fitur pada aplikasi Kitabisa. Jika dinilai berdasarkan rating/bintang yang diberikan oleh pengguna
melalui Google Play Store, belum dapat dipastikan bahwa ulasan pengguna cenderung positif, netral,
atau negatif. Penelitian ini bertujuan menganalisis sentimen aplikasi Kitabisa. Dengan melakukan
pemodelan topik mencari ulasan yang relavan dalam aplikasi Kitabisa dengan menggunakan pemodelan
Latent Dirichlet Allocation (LDA), dan mengklasifikasikan ulasan pengguna menggunakan metode
Support Vector Machine (SVM), dan SMOTE-Tomek Links. Hasil dari penelitian ini menunjukkan bahwa
menggunakan LDA menghasilkan 5 topik yang sering dibahas pada 750 ulasan yang diuji. Kemudian,
melakukan perbandingan tingkat akurasi menggunakan SMOTE-Tomek Links dengan tanpa
menggunakan SMOTE-Tomek Links dalam klasifikasi sentimen dengan metode SVM. Hasil dari tingkat
akurasi analisis sentimen ulasan pengguna aplikasi Kitabisa tanpa menggunakan SMOTE-Tomek Links
mendapatkan tingkat akurasi sebesar 72% dengan nilai precision 76%, recall 72%, dan f1 score 64%.
Sedangkan dengan menggunakan SMOTE-Tomek Links nilai akurasi yang didapatkan tingkat akurasi
sebesar 98% dengan nilai precision 98%, recall 98%, dan f1 score 98%. Berdasarkan penelitian ini,
dapat disimpulkan bahwa aplikasi Kitabisa menghasilkan 5 topik yang sering dibahas pada 750 ulasan
yang diuji oleh LDA. Penerapan SVM mampu meningkatkan akurasi klasifikasi sentimen pengguna,
terutama dengan penggunaan SMOTE-Tomek Links yang mampu mencapai akurasi 98%. Oleh karena
itu, rekomendasi penggunaan SMOTE-Tomek Links disarankan untuk meningkatkan akurasi analisis
sentimen ulasan pengguna aplikasi Kitabisa.
Abstract – Kitabisa is an application from Indonesia that functions to raise funds online. Through the
Kitabisa application, users can easily support various types of campaigns and grants for various social
causes. Based on the results of sentiment analysis from user reviews on the Google Play Store, there are
various opinions regarding the application and the features of the Kitabisa application. If it is assessed
based on the rating / stars given by users through the Google Play Store, it is not certain that user
reviews tend to be positive, neutral or negative. This study aims to analyze the sentiments of the Kitabisa
application. By doing topic modeling looking for relevant reviews in the Kitabisa application using
Latent Dirichlet Allocation (LDA) modeling, and classifying user reviews using the Support Vector
https://journal.universitasbumigora.ac.id/index.php/bite
ISSN: 2685-4066
Jurnal Bumigora Information Technology (BITe) 2
Machine (SVM) method, and SMOTE-Tomek Links. The results of this study indicate that using LDA
produces 5 topics that are frequently discussed in the 750 reviews tested. Then do a comparison of the
level of accuracy using SMOTE-Tomek Links without using SMOTE-Tomek Links in sentiment
classification using the SVM method. The results of the sentiment analysis accuracy of Kitabisa
application user reviews without using SMOTE-Tomek Links get an accuracy rate of 72% with a
precision value of 76%, 72% recall, and 64% f1 score. Whereas using SMOTE-Tomek Links the accuracy
value obtained is an accuracy rate of 98% with a precision value of 98%, a recall of 98%, and an f1
score of 98%. Based on this research, it can be interpreted that the Kitabisa application produces 5
topics that are often discussed in 750 reviews tested by LDA. The application of SVM can improve the
accuracy of user sentiment classification, especially with the use of SMOTE-Tomek Links which can
achieve 98% accuracy. Therefore, it is recommended to use SMOTE-Tomek Links to improve the
accuracy of the sentiment analysis assessment of Kitabisa application users.
1. Pendahuluan
Pada era digital saat ini, penggunaan aplikasi untuk melakukan donasi dan
penggalangan dana semakin populer. Salah satu platform penggalangan yang cukup dikenal
di Indonesia adalah Kitabisa. Kitabisa adalah adalah salah satu perusahaan yang bergerak di
bidang sosial atau social enterprise yang memanfaatkan mutakhirnya ilmu teknologi sebagai
pengelola finansial pengumpulan dana (fundraising) yang berbasis digital (crowdfunding).
Kitabisa merupakan aplikasi yang memungkinkan individu, organisasi, dan lembaga amal
untuk menggalang dana secara online [1].
Aplikasi Kitabisa adalah sebuah platform digital yang berdiri sejak tahun 2013. Aplikasi
ini telah berhasil meraih lebih dari 1 juta pengunduh, dan memperoleh rating tinggi sebesar
4.6/5.0 di Google Playstore, dengan demikian menunjukkan bahwa banyak pengguna merasa
puas dengan layanannya. Dalam menjalankan operasinya, Kitabisa telah berkomitmen untuk
beroperasi dengan amanah dan sesuai aturan yang berlaku. Aplikasi ini memiliki izin dan
legalitas dari beberapa instansi pemerintahan, termasuk Kementerian Hukum dan HAM
(kemenkumham), Kementerian Komunikasi dan Informatika (KOMINFO), Badan Amil
Zakat Nasional (BAZNAS), dan Kementerian Sosial (KEMENSOS). Platform Kitabisa telah
memfasilitasi 2,5 juta transaksi donasi bulanan dan mendukung lebih dari 28,000 galang
dana sosial setiap bulan pada tahun 2023. Oleh karena itu, analisis sentimen terhadap ulasan
Kitabisa penting karena partisipasi tinggi pengguna dalam berdonasi. Analisis sentimen
melibatkan ulasan pengguna di Google Play Store yang mencakup fitur aplikasi, kinerja, dan
pengalaman keseluruhan.
Pada penelitian sebelumnya, metode SVM telah banyakan digunakan untuk melakukan
analisis sentimen. Beberapa diantaranya adalah penelitian yang dilakukan oleh [2] dengan
melakukan implementasi Support Vector Machine dan Word Embedding dalam kasus
sentiment analysis didapatkan akurasi pada pelatihan sebesar 85%. Hasil pengujian
penelitian ini mampu melakukan sentiment analysis dengan kesalahan sebesar 15%.
Kemudian terdapat perbandingan penggunaan metode SVM dengan naïve bayes seperti
penelitian yang dilakukan oleh [3] untuk melakukan analisa sentimen tentang vaksin Covid –
19. Hasil penelitian diperoleh bahwa algoritma SVM memiliki performa lebih baik pada
bagian akurasi, presisi dan recall dengan nilai 90,47%, 90,23%, 90,78% dan performa pada
algoritma Naïve Bayes adalah 88,64%, 87,32%, 88,13%, dengan selisih akurasi 1,83%,
presisi 2.91% dan recall 2.65%. Peningkatkan performa ditingkatkan melalui optimasi pada
kedua algoritma SVM dan Naïve Bayes dengan menggunakan particle swarm optimization.
Penelitian ini berbeda dengan penelitian sebelumnya karena memodelkan topik yang
muncul dalam ulasan Kitabisa dan menggunakan metode SVM yang dikombinasikan dengan
SMOTE-Tomek Links untuk mengatasi data yang tidak seimbang. Data yang digunakan
berasal dari ulasan pengguna Kitabisa di Google Play Store, dengan tujuan menghasilkan
informasi berharga dan memahami respon pengguna terhadap aplikasi ini. Penelitian ini
https://journal.universitasbumigora.ac.id/index.php/bite
ISSN: 2685-4066
Jurnal Bumigora Information Technology (BITe) 3
2. Metode Penelitian
Pada penelitian ini memiliki 6 tahap metodologi penelitian dengan menggunakan
metodologi CRISP-DM.
https://journal.universitasbumigora.ac.id/index.php/bite
ISSN: 2685-4066
Jurnal Bumigora Information Technology (BITe) 4
Cleaning data
Pada tahap cleaning data dalam proses preprocessing bertujuan untuk
membersihkan data dari karakter-karakter yang tidak diinginkan atau tidak relevan.
Case Folding
Pada tahap case folding proses preprocessing bertujuan untuk mengubah
semua huruf dalam teks menjadi huruf kecil atau huruf besar agar konsisten dalam
pengolahan data. Hal ini dilakukan untuk menghindari perbedaan atau variasi
penulisan yang disebabkan oleh perbedaan kapitalisasi dalam teks.
Tokenizing
Tahap tokenizing merupakan salah satu langkah penting dalam proses
preprocessing data. Tujuan utamanya adalah memisahkan teks menjadi unit-unit
terpisah yang disebut token, seperti kata-kata individu. Setiap token yang
dihasilkan merepresentasikan unit paling dasar dalam teks yang memiliki makna
atau nilai tertentu dalam konteks analisis.
Stopwords
Tahap stopwords merupakan salah satu langkah dalam proses preprocessing
data yang bertujuan untuk menghapus kata-kata umum yang tidak memberikan
kontribusi signifikan dalam analisis teks. Kata-kata yang dihapus dalam tahap
stopwords biasanya termasuk kata-kata penghubung seperti "dan," "atau," "di," dll,
kemudian kata-kata umum seperti "saya," "kamu," "mereka," dll, maupun kata-kata
lainnya yang sering muncul dalam bahasa tertentu dan cenderung tidak membawa
informasi khusus tentang teks itu sendiri.
Stemming
Tahap stemming dalam proses preprocessing data bertujuan untuk mengubah
kata-kata dalam teks menjadi bentuk dasar atau akar kata. kata-kata dalam teks
akan dipangkas atau dipotong sehingga hanya menyisakan bentuk dasar atau akar
kata. Misalnya, kata-kata seperti "Berdonasi", "Memudahkan", dan "membantu"
akan dipotong menjadi "donasi", "mudah", dan "bantu".
2.4. Pemodelan
Pada tahap ini yaitu melakukan pembobotan data dengan menggunakan metode TF-
IDF. TF-IDF merupakan metode untuk menentukan frekuensi relatif dari setiap kata
atau token di mana setiap kata tersebut akan diberikan pembobotan berupa nilai
berdasarkan penting atau tidaknya suatu kata dalam dokumen berdasarkan jumlah
kemunculan kata dalam suatu dokumen dan mengukur kata-kata tersebut terhadap
keseluruhan dokumen yang ada [6]. Metode TF IDF berfungsi untuk memonitor
kemunculan token yang terdapat dalam himpunan teks [7]. Pada tabel dibawah ini
menggunakan contoh sebanyak 4 data yang akan diproses, Data akan dipisah menjadi
bagian kecil yang disebut term untuk menghitung bobotnya pada setiap term / kata.
Tabel 1 Pembobotan TF-IDF
No Term TF DF N
IDF = log
df
A B C D A B C D
1 aplikasi 1 0 1 1 3 0,124 0 0,124 0,124
2 bantu 1 0 0 0 1 0,602 0 0 0
3 rakyat 1 1 0 1 3 0,124 0,124 0 0,124
4 banyak 0 1 0 0 1 0 0,602 0 0
https://journal.universitasbumigora.ac.id/index.php/bite
ISSN: 2685-4066
Jurnal Bumigora Information Technology (BITe) 5
5 tampil 0 1 0 0 1 0 0,602 0 0
6 beranda 0 1 0 0 1 0 0,602 0 0
7 donasi 0 1 0 1 2 0 0,301 0 0,301
8 moga 0 0 1 0 1 0 0 0,602 0
9 berkah 0 1 1 0 2 0 0,301 0,301 0
10 kelola 0 0 1 0 1 0 0 0,602 0
11 donatur 0 0 1 1 2 0 0 0,301 0,301
12 crush 0 0 0 1 1 0 0 0 0,602
13 buka 0 0 0 1 1 0 0 0 0,602
14 padahal 0 0 0 1 1 0 0 0 0,602
15 update 0 0 0 1 1 0 0 0 0,602
https://journal.universitasbumigora.ac.id/index.php/bite
ISSN: 2685-4066
Jurnal Bumigora Information Technology (BITe) 6
2.5. Evaluasi
Pada tahap ini melakukan sebuah evaluasi kinerja pada penelitian. Untuk
melakukan evaluasi kinerja digunakan sebuah pemrosesan klasifikasi data dengan
menggunakan metode Support Vector Machine (SVM). SVM adalah salah satu metode
yang bisa digunakan dalam proses klasifikasi atau regresi [11]. Metode SVM ini
bertujuan untuk menemukan hyperplane terbaik yang memisahkan dua kelas pada input
space [12]. Prinsip yang dimiliki metode SVM adalah klasifikasi linear yang dapat
dipisahkan. Konsep kernel yang berada diruang kerja dimensi tinggi sudah dimasukan
kedalam metode SVM agar bisa memecahkan masalah non-linear [13]. Metode ini
sangat berguna dalam pemrosesan teks, di mana kata-kata dapat direpresentasikan
sebagai vektor numerik, dan SVM dapat mengambil keputusan berdasarkan vektor
tersebut.
2.6. Implementasi
Menerapkan hasil penelitian dalam konteks praktis, misalnya dengan menemukan
tingkat akurasi berdasarkan hasil analisis. Kemudian Melaporkan temuan penelitian dan
menyusun dokumen final, seperti skripsi.
https://journal.universitasbumigora.ac.id/index.php/bite
ISSN: 2685-4066
Jurnal Bumigora Information Technology (BITe) 7
https://journal.universitasbumigora.ac.id/index.php/bite
ISSN: 2685-4066
Jurnal Bumigora Information Technology (BITe) 8
Gambar 10 Tokenizing
3.2.4. Hasil Stopwords
Stopword digunakan untuk menghilangkan kata yang tidak memiliki makna
khusus. Proses ini dilakukan untuk membersihkan teks untuk meningkatkan
kualitas dataset. Berikut hasil Stopwords yang dihasilkan dalam penelitian.
https://journal.universitasbumigora.ac.id/index.php/bite
ISSN: 2685-4066
Jurnal Bumigora Information Technology (BITe) 9
Gambar 11 Stopwords
Gambar 12 Stemming
https://journal.universitasbumigora.ac.id/index.php/bite
ISSN: 2685-4066
Jurnal Bumigora Information Technology (BITe) 10
https://journal.universitasbumigora.ac.id/index.php/bite
ISSN: 2685-4066
Jurnal Bumigora Information Technology (BITe) 11
https://journal.universitasbumigora.ac.id/index.php/bite
ISSN: 2685-4066
Jurnal Bumigora Information Technology (BITe) 12
https://journal.universitasbumigora.ac.id/index.php/bite
ISSN: 2685-4066
Jurnal Bumigora Information Technology (BITe) 13
4. Kesimpulan
Melalui Penelitian ini dapat disimpulkan menjadi beberapa kesimpulan yaitu :
1. Metode LDA digunakan sebagai pemodelan topik yang dapat digunakan untuk
meringkas, melakukan klasterisasi, menghubungkan maupun memproses data yang
sangat besar karena LDA menghasilkan daftar topik yang diberi bobot untuk masing-
masing dokumen. Dari jumlah Coherence Score yang diuji didapatkan 5 Jumlah topik
yang memiliki nilai coherence score tertinggi dari 5 topik yang diuji.
2. SMOTETomek Links digunakan dalam bidang pengolahan data dan klasifikasi untuk
menangani ketidakseimbangan kelas yang terdapat dalam dataset. Jumlah data awal
sebelum penggunaan SMOTE-Tomek Links yaitu Positif 498, Negatif 178, Netral 74.
Kemudian setelah menggunakan SMOTE-Tomek Links data ulasan tersebut
diseimbangkan dengan mengikuti data mayoritas sebesar 498 untuk masing masing data.
3. Data yang digunakan merupakan ulasan yang diambil langsung dari ulasan pengguna
pada Google Play Store dengan dataset sebanyak 750 ulasan pada aplikasi Kitabisa. Hasil
pengujian ulasan pengguna aplikasi Kitabisa tanpa menggunakan SMOTE-Tomek Links
mendapatkan tingkat akurasi sebesar 72% dengan nilai precision 76%, recall 72%, dan f1
score 64%. Sedangkan dengan menggunakan SMOTE-Tomek Links nilai akurasi yang
didapatkan tingkat akurasi sebesar 98% dengan nilai precision 98%, recall 98%, dan f1
score 98%.
5. Saran
Adapun saran-saran yang dapat dilakukan untuk pengembangan penelitian
selanjutanya adalah sebagai berikut:
1. Dapat menggunakan teknik Wordcloud agar cepat melihat kata kata yang paling
sering muncul.
2. Dapat menggunakan perbandingan SMOTE, SMOTE-Tomek Links, dan
SMOTEENN untuk meningkatkan hasil yang didapatkan.
REFERENSI
[1] N. Hutami and Irwansyah, “Pemanfaatan Aplikasi Mobile Kitabisa Dalam Pelaksanaan
Crowdfunding Di Indonesia,” 2019.
[2] O. Al Farobi, “Implementasi Metode Support Vector Machine (SVM) Untuk Mengetahui
Respon Masyarakat Indonesia Terhadap Pemberian Vaksin Sinovac,” 2021.
[3] F. Fitriana, E. Utami, and H. Al Fatta, “Analisis Sentimen Opini Terhadap Vaksin Covid - 19
pada Media Sosial Twitter Menggunakan Support Vector Machine dan Naive Bayes,” Jurnal
Komtika (Komputasi dan Informatika), vol. 5, no. 1, pp. 19–25, Jul. 2021, doi:
10.31603/komtika.v5i1.5185.
[4] M. Firdaus, “Penentuan Klasifikasi Dengan CRISP-DM Dalam Memprediksi Kelulusan
Mahasiswa Pada Suatu Mata Kuliah,” 2022.
[5] G. K. Locarso, “Analisis Sentimen Review Aplikasi Pedulilindungi Pada Google Play Store
Menggunakan NBC.,” Jurnal Teknik Informatika Kaputama (JTIK), vol. 6, no. 2, 2022.
[6] S. Rahayu, Y. MZ, J. E. Bororing, and R. Hadiyat, “Implementasi Metode K-Nearest Neighbor
(K-NN) untuk Analisis Sentimen Kepuasan Pengguna Aplikasi Teknologi Finansial FLIP,”
Edumatic: Jurnal Pendidikan Informatika, vol. 6, no. 1, pp. 98–106, Jun. 2022, doi:
10.29408/edumatic.v6i1.5433.
[7] O. I. Gifari, M. Adha, I. Rifky Hendrawan, F. Freddy, and S. Durrand, “Analisis Sentimen
Review Film Menggunakan TF-IDF dan Support Vector Machine,” JIFOTECH (Journal Of
Information Technology, vol. 2, no. 1, 2022.
[8] N. L. P. M. Putu, Ahmad Zuli Amrullah, and Ismarmiaty, “Analisis Sentimen dan Pemodelan
Topik Pariwisata Lombok Menggunakan Algoritma Naive Bayes dan Latent Dirichlet
Allocation,” Jurnal RESTI (Rekayasa Sistem dan Teknologi Informasi), vol. 5, no. 1, pp. 123–
131, Feb. 2021, doi: 10.29207/resti.v5i1.2587.
https://journal.universitasbumigora.ac.id/index.php/bite
ISSN: 2685-4066
Jurnal Bumigora Information Technology (BITe) 14
[9] I. M. K. B. Putra and R. P. Kusumawardani, “Analisis Topik Informasi Publik Media Sosial di
Surabaya Menggunakan Pemodelan Latent Dirichlet Allocation (LDA),” Jurnal Teknik, vol. 6,
no. 2, 2017.
[10] Y. A. Sir and A. H. H. Soepranoto, “Pendekatan Resampling Data Untuk Menangani Masalah
Ketidakseimbangan Kelas,” Jurnal Komputer dan Informatika, vol. 10, no. 1, pp. 31–38, Mar.
2022, doi: 10.35508/jicon.v10i1.6554.
[11] W. Agustina, M. T. Furqon, and B. Rahayudi, “Implementasi Metode Support Vector Machine
(SVM) Untuk Klasifikasi Rumah Layak Huni (Studi Kasus: Desa Kidal Kecamatan Tumpang
Kabupaten Malang),” 2018. [Online]. Available: http://j-ptiik.ub.ac.id
[12] A. Novantika, “Analisis Sentimen Ulasan Pengguna Aplikasi Video Conference Google Meet
menggunakan Metode SVM dan Logistic Regression,” PRISMA, Prosiding Seminar Nasional
Matematika, vol. 5, pp. 808–813, 2022, [Online]. Available:
https://journal.unnes.ac.id/sju/index.php/prisma/
[13] M. Tri Anjasmoros and dan Fitri Marisa, “Seminar Nasional Hasil Riset Prefix-RTR Analisis
Sentimen Aplikasi Go-Jek Menggunakan Metode SVM dan NBC (Studi Kasus: Komentar Pada
Play Store),” 2020.
[14] R. Khalida and S. Setiawati, “Analisis Sentimen Sistem E-Tilang Menggunakan Algoritma
Naive Bayes Dengan Optimalisasi Information Gain,” Journal of Information and Information
Security (JIFORTY), vol. 1, no. 1, 2020, [Online]. Available:
http://ejurnal.ubharajaya.ac.id/index.php/jiforty
[15] M. Nurmalasari, N. Anggita Temesvari, S. Ni, and matul Maula, “Analisis Sentimen terhadap
Opini Masyarakat dalam Penggunaan Mobile-JKN untuk Pelayanan BPJS Kesehatan Tahun
2019,” 2020.
https://journal.universitasbumigora.ac.id/index.php/bite
ISSN: 2685-4066