1901010198-Diki Ashadi-S1 ILKOM-Artikel

Jurnal Bumigora Information Technology (BITe)  1
SENTIMEN ANALISIS DAN PEMODELAN

TOPIK APLIKASI KITABISA
MENGGUNAKAN METODE SUPPORT
VECTOR MACHINE (SVM) DAN SMOTE-
TOMEK LINKS
SENTIMENT ANALYSIS AND TOPIC

MODELING OF KITABISA APPLICATIONS
USING SUPPORT VECTOR MACHINE (SVM)
AND SMOTE-TOMEK LINKS METHODS
Diki Ashadi1*, Hairani2 , I Nyoman Switrayana3
1
Program Studi Ilmu Komputer, Fakultas Teknik, Universitas Bumigora
dikisatuu@gmail.com1* , hairani@universitasbumigora.ac.id2
nyoman.switrayana@universitasbumigora.ac.id3
Abstrak – Kitabisa merupakan sebuah aplikasi asal Indonesia yang berfungsi untuk menggalang dana
secara online. Melalui aplikasi Kitabisa, pengguna dapat dengan mudah mendukung berbagai jenis
kampanye dan menyumbangkan dana untuk berbagai tujuan sosial. Berdasarkan hasil analisis sentimen
dari ulasan pengguna di Google Play Store, terdapat beragam pendapat mengenai aplikasi dan fitur-
fitur pada aplikasi Kitabisa. Jika dinilai berdasarkan rating/bintang yang diberikan oleh pengguna
melalui Google Play Store, belum dapat dipastikan bahwa ulasan pengguna cenderung positif, netral,
atau negatif. Penelitian ini bertujuan menganalisis sentimen aplikasi Kitabisa. Dengan melakukan
pemodelan topik mencari ulasan yang relavan dalam aplikasi Kitabisa dengan menggunakan pemodelan
Latent Dirichlet Allocation (LDA), dan mengklasifikasikan ulasan pengguna menggunakan metode
Support Vector Machine (SVM), dan SMOTE-Tomek Links. Hasil dari penelitian ini menunjukkan bahwa
menggunakan LDA menghasilkan 5 topik yang sering dibahas pada 750 ulasan yang diuji. Kemudian,
melakukan perbandingan tingkat akurasi menggunakan SMOTE-Tomek Links dengan tanpa
menggunakan SMOTE-Tomek Links dalam klasifikasi sentimen dengan metode SVM. Hasil dari tingkat
akurasi analisis sentimen ulasan pengguna aplikasi Kitabisa tanpa menggunakan SMOTE-Tomek Links
mendapatkan tingkat akurasi sebesar 72% dengan nilai precision 76%, recall 72%, dan f1 score 64%.
Sedangkan dengan menggunakan SMOTE-Tomek Links nilai akurasi yang didapatkan tingkat akurasi
sebesar 98% dengan nilai precision 98%, recall 98%, dan f1 score 98%. Berdasarkan penelitian ini,
dapat disimpulkan bahwa aplikasi Kitabisa menghasilkan 5 topik yang sering dibahas pada 750 ulasan
yang diuji oleh LDA. Penerapan SVM mampu meningkatkan akurasi klasifikasi sentimen pengguna,
terutama dengan penggunaan SMOTE-Tomek Links yang mampu mencapai akurasi 98%. Oleh karena
itu, rekomendasi penggunaan SMOTE-Tomek Links disarankan untuk meningkatkan akurasi analisis
sentimen ulasan pengguna aplikasi Kitabisa.
Kata Kunci: Kitabisa, SVM, LDA, SMOTE-Tomek Links, Akurasi.
Abstract – Kitabisa is an application from Indonesia that functions to raise funds online. Through the
Kitabisa application, users can easily support various types of campaigns and grants for various social
causes. Based on the results of sentiment analysis from user reviews on the Google Play Store, there are
various opinions regarding the application and the features of the Kitabisa application. If it is assessed
based on the rating / stars given by users through the Google Play Store, it is not certain that user
reviews tend to be positive, neutral or negative. This study aims to analyze the sentiments of the Kitabisa
application. By doing topic modeling looking for relevant reviews in the Kitabisa application using
Latent Dirichlet Allocation (LDA) modeling, and classifying user reviews using the Support Vector
https://journal.universitasbumigora.ac.id/index.php/bite
ISSN: 2685-4066
Machine (SVM) method, and SMOTE-Tomek Links. The results of this study indicate that using LDA
produces 5 topics that are frequently discussed in the 750 reviews tested. Then do a comparison of the
level of accuracy using SMOTE-Tomek Links without using SMOTE-Tomek Links in sentiment
classification using the SVM method. The results of the sentiment analysis accuracy of Kitabisa
application user reviews without using SMOTE-Tomek Links get an accuracy rate of 72% with a
precision value of 76%, 72% recall, and 64% f1 score. Whereas using SMOTE-Tomek Links the accuracy
value obtained is an accuracy rate of 98% with a precision value of 98%, a recall of 98%, and an f1
score of 98%. Based on this research, it can be interpreted that the Kitabisa application produces 5
topics that are often discussed in 750 reviews tested by LDA. The application of SVM can improve the
accuracy of user sentiment classification, especially with the use of SMOTE-Tomek Links which can
achieve 98% accuracy. Therefore, it is recommended to use SMOTE-Tomek Links to improve the
accuracy of the sentiment analysis assessment of Kitabisa application users.
Keywords: Kitabisa, SVM, LDA, SMOTE-Tomek Links, Accuration
1. Pendahuluan
Pada era digital saat ini, penggunaan aplikasi untuk melakukan donasi dan
penggalangan dana semakin populer. Salah satu platform penggalangan yang cukup dikenal
di Indonesia adalah Kitabisa. Kitabisa adalah adalah salah satu perusahaan yang bergerak di
bidang sosial atau social enterprise yang memanfaatkan mutakhirnya ilmu teknologi sebagai
pengelola finansial pengumpulan dana (fundraising) yang berbasis digital (crowdfunding).
Kitabisa merupakan aplikasi yang memungkinkan individu, organisasi, dan lembaga amal
untuk menggalang dana secara online [1].
Aplikasi Kitabisa adalah sebuah platform digital yang berdiri sejak tahun 2013. Aplikasi
ini telah berhasil meraih lebih dari 1 juta pengunduh, dan memperoleh rating tinggi sebesar
4.6/5.0 di Google Playstore, dengan demikian menunjukkan bahwa banyak pengguna merasa
puas dengan layanannya. Dalam menjalankan operasinya, Kitabisa telah berkomitmen untuk
beroperasi dengan amanah dan sesuai aturan yang berlaku. Aplikasi ini memiliki izin dan
legalitas dari beberapa instansi pemerintahan, termasuk Kementerian Hukum dan HAM
(kemenkumham), Kementerian Komunikasi dan Informatika (KOMINFO), Badan Amil
Zakat Nasional (BAZNAS), dan Kementerian Sosial (KEMENSOS). Platform Kitabisa telah
memfasilitasi 2,5 juta transaksi donasi bulanan dan mendukung lebih dari 28,000 galang
dana sosial setiap bulan pada tahun 2023. Oleh karena itu, analisis sentimen terhadap ulasan
Kitabisa penting karena partisipasi tinggi pengguna dalam berdonasi. Analisis sentimen
melibatkan ulasan pengguna di Google Play Store yang mencakup fitur aplikasi, kinerja, dan
pengalaman keseluruhan.
Pada penelitian sebelumnya, metode SVM telah banyakan digunakan untuk melakukan
analisis sentimen. Beberapa diantaranya adalah penelitian yang dilakukan oleh [2] dengan
melakukan implementasi Support Vector Machine dan Word Embedding dalam kasus
sentiment analysis didapatkan akurasi pada pelatihan sebesar 85%. Hasil pengujian
penelitian ini mampu melakukan sentiment analysis dengan kesalahan sebesar 15%.
Kemudian terdapat perbandingan penggunaan metode SVM dengan naïve bayes seperti
penelitian yang dilakukan oleh [3] untuk melakukan analisa sentimen tentang vaksin Covid –
19. Hasil penelitian diperoleh bahwa algoritma SVM memiliki performa lebih baik pada
bagian akurasi, presisi dan recall dengan nilai 90,47%, 90,23%, 90,78% dan performa pada
algoritma Naïve Bayes adalah 88,64%, 87,32%, 88,13%, dengan selisih akurasi 1,83%,
presisi 2.91% dan recall 2.65%. Peningkatkan performa ditingkatkan melalui optimasi pada
kedua algoritma SVM dan Naïve Bayes dengan menggunakan particle swarm optimization.
Penelitian ini berbeda dengan penelitian sebelumnya karena memodelkan topik yang
muncul dalam ulasan Kitabisa dan menggunakan metode SVM yang dikombinasikan dengan
SMOTE-Tomek Links untuk mengatasi data yang tidak seimbang. Data yang digunakan
berasal dari ulasan pengguna Kitabisa di Google Play Store, dengan tujuan menghasilkan
informasi berharga dan memahami respon pengguna terhadap aplikasi ini. Penelitian ini
ISSN: 2685-4066
diharapkan memberikan wawasan berharga untuk pengembangan dan peningkatan kualitas

Kitabisa berdasarkan ulasan pengguna di Google Play Store.
2. Metode Penelitian
Pada penelitian ini memiliki 6 tahap metodologi penelitian dengan menggunakan
metodologi CRISP-DM.
Gambar 1 Metodologi CRISP-DM [4]

2.1. Pemahaman Bisnis
Pada tahap ini melakukan identifikasi dari tujuan bisnis dan masalah yang ingin
diselesaikan dengan melakukan scraping data berupa ulasan pengguna aplikasi Kitabisa.
Kemudian menggali pemahaman secara mendalam tentang konteks penelitian, termasuk
latar belakang, batasan masalah dan kebutuhan.
2.2. Pemahaman Data

Pada tahap ini yaitu melakukan mengumpulkan data yang relavan untuk penelitian
yang dilakukan dengan mengambil ulasan pengguna aplikasi Kitabisa melalui Google
Play Store. Kemudian Menganalisis dan memahami karakteristik data yang terdapat
pada ulasan tersebut, baik berupa format, kualitas, dan komplektifitas pada data.
2.3. Persiapan Data

Pada tahap ini melakukan pembersihan data atau melalui tahap preprocessing pada
data yang telah dikumpulkan. Preprocessing adalah tahap dalam memproses data agar
dapat digunakan untuk memproses suatu analisa [5]. Adapun Preprocessing yang
digunakan pada penelitian ini melalui 5 tahap preprocessing.
ISSN: 2685-4066
Gambar 2 Tahapan Preprocessing
 Cleaning data
Pada tahap cleaning data dalam proses preprocessing bertujuan untuk
membersihkan data dari karakter-karakter yang tidak diinginkan atau tidak relevan.
 Case Folding
Pada tahap case folding proses preprocessing bertujuan untuk mengubah
semua huruf dalam teks menjadi huruf kecil atau huruf besar agar konsisten dalam
pengolahan data. Hal ini dilakukan untuk menghindari perbedaan atau variasi
penulisan yang disebabkan oleh perbedaan kapitalisasi dalam teks.
 Tokenizing
Tahap tokenizing merupakan salah satu langkah penting dalam proses
preprocessing data. Tujuan utamanya adalah memisahkan teks menjadi unit-unit
terpisah yang disebut token, seperti kata-kata individu. Setiap token yang
dihasilkan merepresentasikan unit paling dasar dalam teks yang memiliki makna
atau nilai tertentu dalam konteks analisis.
 Stopwords
Tahap stopwords merupakan salah satu langkah dalam proses preprocessing
data yang bertujuan untuk menghapus kata-kata umum yang tidak memberikan
kontribusi signifikan dalam analisis teks. Kata-kata yang dihapus dalam tahap
stopwords biasanya termasuk kata-kata penghubung seperti "dan," "atau," "di," dll,
kemudian kata-kata umum seperti "saya," "kamu," "mereka," dll, maupun kata-kata
lainnya yang sering muncul dalam bahasa tertentu dan cenderung tidak membawa
informasi khusus tentang teks itu sendiri.
 Stemming
Tahap stemming dalam proses preprocessing data bertujuan untuk mengubah
kata-kata dalam teks menjadi bentuk dasar atau akar kata. kata-kata dalam teks
akan dipangkas atau dipotong sehingga hanya menyisakan bentuk dasar atau akar
kata. Misalnya, kata-kata seperti "Berdonasi", "Memudahkan", dan "membantu"
akan dipotong menjadi "donasi", "mudah", dan "bantu".
2.4. Pemodelan
Pada tahap ini yaitu melakukan pembobotan data dengan menggunakan metode TF-
IDF. TF-IDF merupakan metode untuk menentukan frekuensi relatif dari setiap kata
atau token di mana setiap kata tersebut akan diberikan pembobotan berupa nilai
berdasarkan penting atau tidaknya suatu kata dalam dokumen berdasarkan jumlah
kemunculan kata dalam suatu dokumen dan mengukur kata-kata tersebut terhadap
keseluruhan dokumen yang ada [6]. Metode TF IDF berfungsi untuk memonitor
kemunculan token yang terdapat dalam himpunan teks [7]. Pada tabel dibawah ini
menggunakan contoh sebanyak 4 data yang akan diproses, Data akan dipisah menjadi
bagian kecil yang disebut term untuk menghitung bobotnya pada setiap term / kata.
Tabel 1 Pembobotan TF-IDF
No Term TF DF N
IDF = log
df
A B C D A B C D
1 aplikasi 1 0 1 1 3 0,124 0 0,124 0,124
2 bantu 1 0 0 0 1 0,602 0 0 0
3 rakyat 1 1 0 1 3 0,124 0,124 0 0,124
4 banyak 0 1 0 0 1 0 0,602 0 0
ISSN: 2685-4066
5 tampil 0 1 0 0 1 0 0,602 0 0
6 beranda 0 1 0 0 1 0 0,602 0 0
7 donasi 0 1 0 1 2 0 0,301 0 0,301
8 moga 0 0 1 0 1 0 0 0,602 0
9 berkah 0 1 1 0 2 0 0,301 0,301 0
10 kelola 0 0 1 0 1 0 0 0,602 0
11 donatur 0 0 1 1 2 0 0 0,301 0,301
12 crush 0 0 0 1 1 0 0 0 0,602
13 buka 0 0 0 1 1 0 0 0 0,602
14 padahal 0 0 0 1 1 0 0 0 0,602
15 update 0 0 0 1 1 0 0 0 0,602
Kemudian menggunakan metode Latent dirichlet allocation (LDA) untuk

melakukan pemodelan topik pada ulasan pengguna aplikasi Kitabisa. Kelebihan metode
LDA adalah dapat mengekstrak topik secara akurat pada kumpulan data yang cukup
besar [8]. LDA bekerja dengan menerima masukan berupa dokumen-dokumen
individual dan sejumlah parameter. Lalu, LDA menghasilkan keluaran berupa model
yang terdiri dari bobot yang dapat dinormalisasi sesuai dengan probabilitas. Terdapat
dua jenis probabilitas yang relevan, yakni probabilitas bahwa suatu dokumen tertentu
menghasilkan topik tertentu, serta probabilitas bahwa topik tertentu menghasilkan kata-
kata spesifik dari sebuah kumpulan kosakata [9].
Pada tahap pemodelan topik menggunakan Latent Dirichlet Allocation (LDA),

memiliki berbagai macam alur pada tahap pemodelannya, berikut merupakan alur dari
pemodelan topik yang diterapkan:
Gambar 5 Alur Pemodelan LDA

Tahap berikutnya yaitu melakukan Penyeimbangan data dengan menggunakan
SMOTE-Tomek Links. SMOTE-Tomek Links adalah kombinasi dari SMOTE dan Tomek
Links yang termasuk dalam kategori over-under sampling dimana teknik oversampling
menggunakan SMOTE dan teknik undersampling adalah Tomek Links [10]. Berikut
merupakan alur dari proses SMOTE-Tomek Links yang diterapkan:
ISSN: 2685-4066
Gambar 6 Alur Penerapan SMOTETomek
2.5. Evaluasi
Pada tahap ini melakukan sebuah evaluasi kinerja pada penelitian. Untuk
melakukan evaluasi kinerja digunakan sebuah pemrosesan klasifikasi data dengan
menggunakan metode Support Vector Machine (SVM). SVM adalah salah satu metode
yang bisa digunakan dalam proses klasifikasi atau regresi [11]. Metode SVM ini
bertujuan untuk menemukan hyperplane terbaik yang memisahkan dua kelas pada input
space [12]. Prinsip yang dimiliki metode SVM adalah klasifikasi linear yang dapat
dipisahkan. Konsep kernel yang berada diruang kerja dimensi tinggi sudah dimasukan
kedalam metode SVM agar bisa memecahkan masalah non-linear [13]. Metode ini
sangat berguna dalam pemrosesan teks, di mana kata-kata dapat direpresentasikan
sebagai vektor numerik, dan SVM dapat mengambil keputusan berdasarkan vektor
tersebut.
2.6. Implementasi
Menerapkan hasil penelitian dalam konteks praktis, misalnya dengan menemukan
tingkat akurasi berdasarkan hasil analisis. Kemudian Melaporkan temuan penelitian dan
menyusun dokumen final, seperti skripsi.
3. Hasil dan Pembahasan
3.1. Persiapan Data

Dalam persiapan data, langkah-langkah yang dilakukan melibatkan penggunaan
aplikasi Jupyter Notebook dan dengan menggunakan bahasa pemrograman Python.
Data dalam penelitian ini diperoleh dari scrapping data yang didapatkan melalui ulasan
pengguna dari Google Play Store. jumlah data yang diambil berjumlah 750 data yang
terdiri dari 497 ulasan positif, 75 ulasan netral, dan 178 ulasan negatif. Setelah berhasil
melakukan scraping data, langkah selanjutnya adalah menyortir data yang akan
ditampilkan hanya "ulasan" dan "rating" yang digunakan dalam penelitian. Dataset
yang telah disimpan kemudian dipanggil kembali dengan memberikan bobot atau nilai
data dari tiap rating yang diperoleh dari ulasan pengguna. rating tersebut kemudian
dikategorikan menjadi tiga bagian yaitu positif, netral, dan negatif. Rating 1-2
dikategorikan “negatif”, Rating 3 dikategorikan Netral, dan Rating 4-5 dikategorikan
Positif.
ISSN: 2685-4066
Gambar 7 Menampilkan Hasil Data
3.2. Hasil Preprocessing Data

Preprocessing merupakan tahapan penting dalam menganalisis data yang dilakukan
sebelum memulai proses analisis. Prepocessing dilakukan untuk menghindari data yang
kurang sempurna, gangguan pada data, dan data-data yang tidak konsisten [14]. Tujuan
dari preprocessing adalah untuk menghilangkan noise dalam data untuk memperbaiki
kualitas data [15].
3.2.1. Hasil Cleaning Data

Cleaning Data difungsikan untuk membersihkan data dari nilai yang tidak
valid atau tidak lengkap. Berikut hasil Cleaning data yang dihasilkan dalam
penelitian.
ISSN: 2685-4066
Gambar 8 Cleaning Data
3.2.2. Hasil Case Folding

Case Folding digunakan dalam mengubah semua huruf menjadi huruf kecil
untuk menghilangkan perbedaan dalam sebuah tulisan. Berikut hasil Case folding
yang dihasilkan dalam penelitian.
Gambar 9 Case Folding
3.2.3. Hasil Tokenizing

Tokenizing digunakan dalam pemisahan teks menjadi unit-unit terkecil. Data
teks dipotong berdasarkan pemisah seperti spasi atau tanda baca. Berikut hasil
Case folding yang dihasilkan dalam penelitian.
Gambar 10 Tokenizing
3.2.4. Hasil Stopwords
Stopword digunakan untuk menghilangkan kata yang tidak memiliki makna
khusus. Proses ini dilakukan untuk membersihkan teks untuk meningkatkan
kualitas dataset. Berikut hasil Stopwords yang dihasilkan dalam penelitian.
ISSN: 2685-4066
Gambar 11 Stopwords
3.2.5. Hasil Stemming

Steming berfungsi untuk mengubah kata-kata dalam teks menjadi bentuk
dasar atau akar kata. kata-kata dalam teks akan dipangkas atau dipotong sehingga
hanya menyisakan bentuk dasar atau akar kata, dan kemudian diubah dalam
bentuk string. Berikut hasil Stemming yang dihasilkan dalam penelitian.
Gambar 12 Stemming
3.3. Hasil Pembobotan TF-IDF

Hasil yang diperoleh output TF yang merupakan frekuensi kemunculan kata pada
dokumen. Jika nilainya 0 maka kemunculan kata pada dokumen tidak ada namun jika
bernilai 1 maka kemunculan kata pada dokumen tersebut terdapat 1.
ISSN: 2685-4066
Gambar 13 Hasil TF-IDF
3.4. Hasil Pemodelan LDA

Hasil dari pemodelan Latent Dirichlet Allocation (LDA) dari ulasan pengguna
aplikasi Kitabisa dapat memberikan wawasan tentang topik-topik yang muncul dalam
data teks yang diolah. Sebelum menentukan output perlunya melakukan sebuah validasi
pemodelan topik (Topic Coherence). Dari 5 jumlah topik yang diinputkan terdapat
jumlah topik terbaik untuk digunakan sebagai pemodelan dalam LDA.
Gambar 14 Coherence Score LDA

Setelah mendapatkan Coherence Score maka Jumlah topik terbaik dari 5 topik
yang digunakan yaitu terdapat pada jumlah topik 5. Kemudian dilakukan pemodelan
LDA dengan menggunakan 5 jumlah topik.
ISSN: 2685-4066
Gambar 15 Hasil Pemodelan LDA
3.5. Hasil Penerapan SMOTE-Tomek Links

Setelah menerapkan metode SMOTE-Tomek Links pada data, didapatkan hasil
yang menghasilkan perbaikan pada masalah ketidakseimbangan kelas dalam dataset.
Metode ini telah menghasilkan dataset yang memiliki jumlah data yang seimbang antara
kelas mayoritas dan kelas minoritas. Dengan penerapan SMOTE-Tomek Links, jumlah
data pada kelas minoritas telah ditingkatkan melalui proses oversampling menggunakan
SMOTE. Sampel sintetis baru telah dibuat di antara data minoritas yang ada, sehingga
meningkatkan representasi kelas minoritas. Selain itu, metode Tomek Links juga telah
digunakan untuk menghapus pasangan sampel ambiguitas antara kelas minoritas dan
mayoritas.
Gambar 16 Hasil SMOTE-Tomek Links Data
3.5. Hasil Klasifikasi SVM

Data yang telah melakukan penerapan SMOTETomek links kemudian
diklasifikasikan dalam bentuk SVM. Tujuan dari pengujian ini adalah untuk
mengevaluasi kinerja metode SVM dalam mengklasifikasikan data yang telah diubah
melalui penerapan SMOTETomek links. Pada pengujian ini, dilakukan perbandingan
kinerja antara pengklasifikasi SVM yang menggunakan SMOTETomek Links dengan
yang tidak menggunakan SMOTETomek Links. Hal ini bertujuan untuk melihat
perbedaan akurasi hasil klasifikasi antara kedua pendekatan tersebut. Berikut
ISSN: 2685-4066
merupakan perbandingan dari visualisasi confusion matrix dengan pengklasifikasi SVM

yang menggunakan SMOTETomek Links dengan yang tidak menggunakan
SMOTETomek Links.
Tanpa SMOTETomek Menggunakan SMOTETomek
Gambar 17 Perbandingan Visualisasi Confusion Matrix SVM

Adapun hasil dari perhitungan Confusion Matrix mendapatkan perbandingan hasil
baik dari tingkat Akurasi, Presisi, Recall, dan fi-Score.
Hasil Tanpa SMOTETomek-Links
Gambar 18 Hasil Klasifikasi SVM Tanpa SMOTETomek
Hasil Menggunakan SMOTETomek-Links
Gambar 19 Hasil Klasifikasi SVM Dengan SMOTETomek
ISSN: 2685-4066
4. Kesimpulan
Melalui Penelitian ini dapat disimpulkan menjadi beberapa kesimpulan yaitu :
1. Metode LDA digunakan sebagai pemodelan topik yang dapat digunakan untuk
meringkas, melakukan klasterisasi, menghubungkan maupun memproses data yang
sangat besar karena LDA menghasilkan daftar topik yang diberi bobot untuk masing-
masing dokumen. Dari jumlah Coherence Score yang diuji didapatkan 5 Jumlah topik
yang memiliki nilai coherence score tertinggi dari 5 topik yang diuji.
2. SMOTETomek Links digunakan dalam bidang pengolahan data dan klasifikasi untuk
menangani ketidakseimbangan kelas yang terdapat dalam dataset. Jumlah data awal
sebelum penggunaan SMOTE-Tomek Links yaitu Positif 498, Negatif 178, Netral 74.
Kemudian setelah menggunakan SMOTE-Tomek Links data ulasan tersebut
diseimbangkan dengan mengikuti data mayoritas sebesar 498 untuk masing masing data.
3. Data yang digunakan merupakan ulasan yang diambil langsung dari ulasan pengguna
pada Google Play Store dengan dataset sebanyak 750 ulasan pada aplikasi Kitabisa. Hasil
pengujian ulasan pengguna aplikasi Kitabisa tanpa menggunakan SMOTE-Tomek Links
mendapatkan tingkat akurasi sebesar 72% dengan nilai precision 76%, recall 72%, dan f1
score 64%. Sedangkan dengan menggunakan SMOTE-Tomek Links nilai akurasi yang
didapatkan tingkat akurasi sebesar 98% dengan nilai precision 98%, recall 98%, dan f1
score 98%.
5. Saran
Adapun saran-saran yang dapat dilakukan untuk pengembangan penelitian
selanjutanya adalah sebagai berikut:
1. Dapat menggunakan teknik Wordcloud agar cepat melihat kata kata yang paling
sering muncul.
2. Dapat menggunakan perbandingan SMOTE, SMOTE-Tomek Links, dan
SMOTEENN untuk meningkatkan hasil yang didapatkan.
REFERENSI
[1] N. Hutami and Irwansyah, “Pemanfaatan Aplikasi Mobile Kitabisa Dalam Pelaksanaan
Crowdfunding Di Indonesia,” 2019.
[2] O. Al Farobi, “Implementasi Metode Support Vector Machine (SVM) Untuk Mengetahui
Respon Masyarakat Indonesia Terhadap Pemberian Vaksin Sinovac,” 2021.
[3] F. Fitriana, E. Utami, and H. Al Fatta, “Analisis Sentimen Opini Terhadap Vaksin Covid - 19
pada Media Sosial Twitter Menggunakan Support Vector Machine dan Naive Bayes,” Jurnal
Komtika (Komputasi dan Informatika), vol. 5, no. 1, pp. 19–25, Jul. 2021, doi:
10.31603/komtika.v5i1.5185.
[4] M. Firdaus, “Penentuan Klasifikasi Dengan CRISP-DM Dalam Memprediksi Kelulusan
Mahasiswa Pada Suatu Mata Kuliah,” 2022.
[5] G. K. Locarso, “Analisis Sentimen Review Aplikasi Pedulilindungi Pada Google Play Store
Menggunakan NBC.,” Jurnal Teknik Informatika Kaputama (JTIK), vol. 6, no. 2, 2022.
[6] S. Rahayu, Y. MZ, J. E. Bororing, and R. Hadiyat, “Implementasi Metode K-Nearest Neighbor
(K-NN) untuk Analisis Sentimen Kepuasan Pengguna Aplikasi Teknologi Finansial FLIP,”
Edumatic: Jurnal Pendidikan Informatika, vol. 6, no. 1, pp. 98–106, Jun. 2022, doi:
10.29408/edumatic.v6i1.5433.
[7] O. I. Gifari, M. Adha, I. Rifky Hendrawan, F. Freddy, and S. Durrand, “Analisis Sentimen
Review Film Menggunakan TF-IDF dan Support Vector Machine,” JIFOTECH (Journal Of
Information Technology, vol. 2, no. 1, 2022.
[8] N. L. P. M. Putu, Ahmad Zuli Amrullah, and Ismarmiaty, “Analisis Sentimen dan Pemodelan
Topik Pariwisata Lombok Menggunakan Algoritma Naive Bayes dan Latent Dirichlet
Allocation,” Jurnal RESTI (Rekayasa Sistem dan Teknologi Informasi), vol. 5, no. 1, pp. 123–
131, Feb. 2021, doi: 10.29207/resti.v5i1.2587.
ISSN: 2685-4066
[9] I. M. K. B. Putra and R. P. Kusumawardani, “Analisis Topik Informasi Publik Media Sosial di
Surabaya Menggunakan Pemodelan Latent Dirichlet Allocation (LDA),” Jurnal Teknik, vol. 6,
no. 2, 2017.
[10] Y. A. Sir and A. H. H. Soepranoto, “Pendekatan Resampling Data Untuk Menangani Masalah
Ketidakseimbangan Kelas,” Jurnal Komputer dan Informatika, vol. 10, no. 1, pp. 31–38, Mar.
2022, doi: 10.35508/jicon.v10i1.6554.
[11] W. Agustina, M. T. Furqon, and B. Rahayudi, “Implementasi Metode Support Vector Machine
(SVM) Untuk Klasifikasi Rumah Layak Huni (Studi Kasus: Desa Kidal Kecamatan Tumpang
Kabupaten Malang),” 2018. [Online]. Available: http://j-ptiik.ub.ac.id
[12] A. Novantika, “Analisis Sentimen Ulasan Pengguna Aplikasi Video Conference Google Meet
menggunakan Metode SVM dan Logistic Regression,” PRISMA, Prosiding Seminar Nasional
Matematika, vol. 5, pp. 808–813, 2022, [Online]. Available:
https://journal.unnes.ac.id/sju/index.php/prisma/
[13] M. Tri Anjasmoros and dan Fitri Marisa, “Seminar Nasional Hasil Riset Prefix-RTR Analisis
Sentimen Aplikasi Go-Jek Menggunakan Metode SVM dan NBC (Studi Kasus: Komentar Pada
Play Store),” 2020.
[14] R. Khalida and S. Setiawati, “Analisis Sentimen Sistem E-Tilang Menggunakan Algoritma
Naive Bayes Dengan Optimalisasi Information Gain,” Journal of Information and Information
Security (JIFORTY), vol. 1, no. 1, 2020, [Online]. Available:
http://ejurnal.ubharajaya.ac.id/index.php/jiforty
[15] M. Nurmalasari, N. Anggita Temesvari, S. Ni, and matul Maula, “Analisis Sentimen terhadap
Opini Masyarakat dalam Penggunaan Mobile-JKN untuk Pelayanan BPJS Kesehatan Tahun
2019,” 2020.
ISSN: 2685-4066

1901010198-Diki Ashadi-S1 ILKOM-Artikel

Diunggah oleh

Informasi Dokumen

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

1901010198-Diki Ashadi-S1 ILKOM-Artikel

Diunggah oleh

Hak Cipta:

Format Tersedia

Jurnal Bumigora Information Technology (BITe)  1

SENTIMEN ANALISIS DAN PEMODELAN

SENTIMENT ANALYSIS AND TOPIC

Kata Kunci: Kitabisa, SVM, LDA, SMOTE-Tomek Links, Akurasi.

Keywords: Kitabisa, SVM, LDA, SMOTE-Tomek Links, Accuration

diharapkan memberikan wawasan berharga untuk pengembangan dan peningkatan kualitas

Gambar 1 Metodologi CRISP-DM [4]

2.2. Pemahaman Data

2.3. Persiapan Data

Gambar 2 Tahapan Preprocessing

Kemudian menggunakan metode Latent dirichlet allocation (LDA) untuk

Pada tahap pemodelan topik menggunakan Latent Dirichlet Allocation (LDA),

Gambar 5 Alur Pemodelan LDA

Gambar 6 Alur Penerapan SMOTETomek

3. Hasil dan Pembahasan

3.1. Persiapan Data

Gambar 7 Menampilkan Hasil Data

3.2. Hasil Preprocessing Data

3.2.1. Hasil Cleaning Data

Gambar 8 Cleaning Data

3.2.2. Hasil Case Folding

Gambar 9 Case Folding

3.2.3. Hasil Tokenizing

3.2.5. Hasil Stemming

3.3. Hasil Pembobotan TF-IDF

Gambar 13 Hasil TF-IDF

3.4. Hasil Pemodelan LDA

Gambar 14 Coherence Score LDA

Gambar 15 Hasil Pemodelan LDA

3.5. Hasil Penerapan SMOTE-Tomek Links

Gambar 16 Hasil SMOTE-Tomek Links Data

3.5. Hasil Klasifikasi SVM

merupakan perbandingan dari visualisasi confusion matrix dengan pengklasifikasi SVM

Tanpa SMOTETomek Menggunakan SMOTETomek

Gambar 17 Perbandingan Visualisasi Confusion Matrix SVM

Gambar 18 Hasil Klasifikasi SVM Tanpa SMOTETomek

Hasil Menggunakan SMOTETomek-Links

Gambar 19 Hasil Klasifikasi SVM Dengan SMOTETomek

Anda mungkin juga menyukai