Abstrak
Program kampus merdeka atau yang sering disebut sebagai merdeka belajar kampus
merdeka (MBKM) adalah bagian dari terobosan baru yang dikeluarkan oleh Kementrian
Pendidikan, Kebudayaan, Riset, dan Teknologi Republik Indonesia pada tahun 2019 guna
meningkatkan kualitas dari mahasiswa serta diperuntukkan untuk menjawab kebutuhan
zaman sesuai dengan kebutuhan teknologi, dunia kerja, sosial masyarakat, dan budaya yang
signifikan. Program kampus merdeka ini sudah menuai pro dan kontra dari masyarakat
khususnya pada media sosial, bahkan dalam website kampus merdeka itu sendiri.
Pengimplementasian klasifikasi pada algoritma naive bayes dilakukan dengan beberapa
tahapan yaitu text preprocessing, perhitungan TF-IDF, perhitungan klasifikasi. Program
dibuat dengan bahasa pemrograman python pada tools jupiter, salah satu software yang
digunakan untuk mengelola proses pemrograman. Hasil pengklasifikasian yang didapatkan
adalah 14 data dengan sentimen negatif dan 175 data dengan sentimen positif. Dengan nilai
akurasi 57%, penelitian ini mendapatkan precision sebesar 0.80 pada data sentimen negatif
dan 0.95 pada sentimen positif. Recall sebesar 0.29 pada sentimen negatif dan 0.99 pada
sentimen positif, dan f1-score sebesar 0.42 pada data sentimen negatif dan 0.97 pada
sentimen positif. Untuk pemodelan naive bayes classifier didapatkan akurasi sebesar 0.942,
recall sebesar 0.8, precision 0.285, dan f1-score 0.421.
Kata Kunci : Analysis Sentiment, Kampus Merdeka, Naive Bayes
Abstract
The independent campus program or what is often referred to as the independent
learning campus independence (MBKM) is part of a new breakthrough issued by the Ministry
of Education, Culture, Research and Technology of the Republic of Indonesia in 2019 to
improve the quality of students and is intended to answer the needs of the times in
accordance with significant technological, world of work, social, and cultural needs. The
independent campus program has drawn pros and cons from the community, especially on
social media, even on the independent campus website itself. The implementation of the
classification in the naive Bayes algorithm is carried out in several stages, namely text
preprocessing, TF-IDF calculations, and classification calculations. The program is made
with the Python programming language on Jupiter tools, one of the software used to manage
the programming process. The classification results obtained are 14 data with negative
sentiment and 175 data with positive sentiment. With an accuracy value of 57%, this study
obtains a precision of 0.80 on negative sentiment data and 0.95 on positive sentiment. Recall
is 0.29 on negative sentiment and 0.99 on positive sentiment, and the f1-score is 0.42 on
negative sentiment data and 0.97 on positive sentiment. For naive Bayes classifier modeling,
accuracy is 0.942, recall is 0.8, precision is 0.285, and f1-score is 0.421.
Keywords: Sentiment Analysis, Independent Campus, Naive Bayes
PENDAHULUAN
Keputusan merdeka belajar yang diterapkan secara tegas oleh Kemendikbud bertujuan
untuk meningkatkan kemampuan soft dan hard skill peserta didik. Tujuan dari program ini
adalah agar lulusan memiliki kompetensi yang sesuai dengan kebutuhan zaman saat ini
(Nurhidayani et al., 2021). Selain itu, peserta didik juga dibekali untuk menjadi individu yang
lebih berkompeten, inovatif, dan mampu berintegrasi dengan masyarakat (Sumarto, 2020).
Program merdeka belajar memiliki tujuan besar yaitu meningkatkan Sumber Daya
Manusia (SDM) secara inovatif agar dapat beradaptasi dengan tantangan zaman. Oleh karena
itu, dalam pelaksanaan di lapangan, diperlukan panduan yang mengatur dengan rinci dalam
segala aspek. Pada tahun 2020, Direktorat Jenderal Pendidikan Tinggi merilis buku panduan
yang mencakup prinsip, aspek penilaian, dan prosedur penilaian (Tinggi, 2020).Pada era
digital ini, teknologi telah memainkan peran yang semakin penting dalam berbagai aspek
kehidupan, termasuk dalam dunia pendidikan. Salah satu inovasi terbaru dalam konteks
pendidikan adalah pengembangan aplikasi Kampus Merdeka, yang bertujuan untuk
meningkatkan kualitas pendidikan tinggi di Indonesia.
Aplikasi Kampus Merdeka ini memiliki berbagai fitur yang dirancang untuk
memudahkan mahasiswa dalam mengakses sumber daya pendidikan, berinteraksi dengan
dosen dan mahasiswa lainnya, serta mengikuti perkuliahan secara daring. Dalam konteks
penggunaan aplikasi ini, penting untuk memahami sentimen atau perasaan pengguna terkait
pengalaman mereka dalam menggunakan aplikasi ini.
Sentimen analysis atau analisis sentimen adalah teknik pemrosesan bahasa alami yang
digunakan untuk mengidentifikasi, memperoleh, dan memahami sentimen atau perasaan
dalam teks. Dalam konteks penelitian ini, sentimen analysis digunakan untuk menganalisis
perasaan pengguna terhadap penggunaan aplikasi Kampus Merdeka. Salah satu metode yang
populer dalam melakukan sentimen analysis adalah algoritma Naive Bayes. Algoritma Naive
Bayes merupakan metode klasifikasi yang berdasarkan pada teorema Bayes dengan asumsi
sederhana yang dikenal sebagai "naive" (polos). Meskipun sederhana, algoritma ini telah
terbukti efektif dalam banyak kasus, termasuk analisis sentimen.
Dalam penelitian ini, kami akan menggunakan algoritma Naive Bayes untuk
melakukan sentimen analysis terhadap penggunaan aplikasi Kampus Merdeka. Tujuan utama
dari penelitian ini adalah untuk memahami perasaan dan tanggapan pengguna terhadap
aplikasi ini, apakah mereka memiliki pengalaman yang positif, negatif, atau netral. Dengan
melakukan analisis sentimen terhadap penggunaan aplikasi Kampus Merdeka, kita dapat
mengidentifikasi kekuatan dan kelemahan aplikasi ini dari perspektif pengguna. Temuan dari
penelitian ini dapat menjadi landasan untuk pengembangan dan peningkatan fitur-fitur yang
ada dalam aplikasi, sehingga dapat memberikan pengalaman yang lebih baik bagi pengguna
di masa depan.
Melalui penelitian ini, diharapkan akan ada pemahaman yang lebih baik tentang
sentimen pengguna terhadap penggunaan aplikasi Kampus Merdeka dan kontribusinya dalam
meningkatkan pendidikan tinggi di Indonesia.
METODOLOGI PENELITIAN
Berdasarkan penelitian terkait, tinjauan penelitian, dan permasalahan yang telah
dijelaskan. Flowchart dari penelitian digambarkan melalui bagan pada Gambar 1.
Gambar 1. Flowchart Penelitian
Kegiatan penelitian dimulai dari mengumpulkan data, pengumpulan data dilakukan
dengan melakukan scraping ulasan aplikasi merdeka mengajar pada google play store,
dilanjutkan dengan proses pelabelan data, pembersihan data, melakukan pembagian data,
proses klasifikasi menggunakan algoritma Naïve Bayes, dan yang terakhir menganalisis
mengevaluasi algoritma Naïve Bayes.
No Content Label
C. Teks Preprocessing
Dalam teks praprocessing ini dilakukan beberapa tahapan, diantaranya yaitu tahap
data cleaning, case folding, tokenizing, Stopword Removal, Stemming. Berikut merupakan
contoh dari melakukan tahapan cleaning data pada penelitian ini:
Gambar 4. Tokenizing
Dalam tahap ini proses pemisahan teks menjadi potongan-potongan yang disebut
sebagai token untuk kemudian di analisa. Kata, angka, simbol, tanda baca dan entitas penting
lainnya dapat dianggap sebagai token. Didalam NLP, token diartikan sebagai “kata”
meskipun tokenize juga dapat dilakukan pada paragraf maupun kalimat. Setelah itu,
melakukan tahap stemming, seperti gambar berikut ini.
Gambar 5. Stemming
Dalam tahapan ini adalah proses pemetaan dan penguraian bentuk dari suatu kata
menjadi bentuk kata dasarnya. Untuk melakukan stemming bahasa Indonesia kita dapat
menggunakan library Python Sastrawi yang sudah kita siapkan di awal. Library Sastrawi
menerapkan Algoritma Nazief dan Adriani dalam melakukan stemming bahasa Indonesia.
D. Splitting Data
Dalam penelitian ini kami menetapkan bahwa variabel X yang diperoleh dari
keseluruhan Tweet, dan variabel y yang merupakan label. Sebelum dilakukan splitting data,
peneliti menerapkan seleksi fitur pembobotan kata menggunakan TF-IDF (Term Frequency
Inverse Document Frequency). Proses ini dilakukan untuk menilai term atau bobot kata dari
sebuah dokumen terhadap seluruh dokumen pada korpus. TF-IDF (Term Frequency-Inverse
Document Frequency) dihitung menggunakan rumus berikut:
Lalu, variabel X yang telah diterapkannya TF-IDF dan variabel y akan dipecah
menjadi X_train, X_test, y_train, dan y_test, dengan perbandingan 80% data training, dan
20% data testing. Serta, ditetapkannya stratify dari variabel y, dan random_state sebesar 42.
Dengan demikian, data training sebanyak 754 data, dan data testing sebanyak 189 data.
DAFTAR PUSTAKA