Text Mining

Sentiment Analysis Terhadap Penggunaan Aplikasi Merdeka Mengajar
Menggunakan Algoritma Naive Bayes Classifier

Dimas Ardiansyah1, Ramadani Maulana2, Risma Fuaida3, Nyzatty Arifin4, Ach. Hafis Zain5
200631100109@student.trunojoyo.ac.id, 200631100113@student.trunojoyo.ac.id,
200631100117@student.trunojoyo.ac.id, 200631100129@student.trunojoyo.ac.id,
200631100130@student.trunojoyo.ac.id
Pendidikan Informatika, Ilmu Pendidikan, Universitas Trunojoyo Madura
Jalan Raya Telang, Kec. Kamal, Kabupaten Bangkalan, Jawa Timur 69162
Abstrak
Program kampus merdeka atau yang sering disebut sebagai merdeka belajar kampus
merdeka (MBKM) adalah bagian dari terobosan baru yang dikeluarkan oleh Kementrian
Pendidikan, Kebudayaan, Riset, dan Teknologi Republik Indonesia pada tahun 2019 guna
meningkatkan kualitas dari mahasiswa serta diperuntukkan untuk menjawab kebutuhan
zaman sesuai dengan kebutuhan teknologi, dunia kerja, sosial masyarakat, dan budaya yang
signifikan. Program kampus merdeka ini sudah menuai pro dan kontra dari masyarakat
khususnya pada media sosial, bahkan dalam website kampus merdeka itu sendiri.
Pengimplementasian klasifikasi pada algoritma naive bayes dilakukan dengan beberapa
tahapan yaitu text preprocessing, perhitungan TF-IDF, perhitungan klasifikasi. Program
dibuat dengan bahasa pemrograman python pada tools jupiter, salah satu software yang
digunakan untuk mengelola proses pemrograman. Hasil pengklasifikasian yang didapatkan
adalah 14 data dengan sentimen negatif dan 175 data dengan sentimen positif. Dengan nilai
akurasi 57%, penelitian ini mendapatkan precision sebesar 0.80 pada data sentimen negatif
dan 0.95 pada sentimen positif. Recall sebesar 0.29 pada sentimen negatif dan 0.99 pada
sentimen positif, dan f1-score sebesar 0.42 pada data sentimen negatif dan 0.97 pada
sentimen positif. Untuk pemodelan naive bayes classifier didapatkan akurasi sebesar 0.942,
recall sebesar 0.8, precision 0.285, dan f1-score 0.421.
Kata Kunci : Analysis Sentiment, Kampus Merdeka, Naive Bayes
Abstract
The independent campus program or what is often referred to as the independent
learning campus independence (MBKM) is part of a new breakthrough issued by the Ministry
of Education, Culture, Research and Technology of the Republic of Indonesia in 2019 to
improve the quality of students and is intended to answer the needs of the times in
accordance with significant technological, world of work, social, and cultural needs. The
independent campus program has drawn pros and cons from the community, especially on
social media, even on the independent campus website itself. The implementation of the
classification in the naive Bayes algorithm is carried out in several stages, namely text
preprocessing, TF-IDF calculations, and classification calculations. The program is made
with the Python programming language on Jupiter tools, one of the software used to manage
the programming process. The classification results obtained are 14 data with negative
sentiment and 175 data with positive sentiment. With an accuracy value of 57%, this study
obtains a precision of 0.80 on negative sentiment data and 0.95 on positive sentiment. Recall
is 0.29 on negative sentiment and 0.99 on positive sentiment, and the f1-score is 0.42 on
negative sentiment data and 0.97 on positive sentiment. For naive Bayes classifier modeling,
accuracy is 0.942, recall is 0.8, precision is 0.285, and f1-score is 0.421.
Keywords: Sentiment Analysis, Independent Campus, Naive Bayes
PENDAHULUAN
Keputusan merdeka belajar yang diterapkan secara tegas oleh Kemendikbud bertujuan
untuk meningkatkan kemampuan soft dan hard skill peserta didik. Tujuan dari program ini
adalah agar lulusan memiliki kompetensi yang sesuai dengan kebutuhan zaman saat ini
(Nurhidayani et al., 2021). Selain itu, peserta didik juga dibekali untuk menjadi individu yang
lebih berkompeten, inovatif, dan mampu berintegrasi dengan masyarakat (Sumarto, 2020).
Program merdeka belajar memiliki tujuan besar yaitu meningkatkan Sumber Daya
Manusia (SDM) secara inovatif agar dapat beradaptasi dengan tantangan zaman. Oleh karena
itu, dalam pelaksanaan di lapangan, diperlukan panduan yang mengatur dengan rinci dalam
segala aspek. Pada tahun 2020, Direktorat Jenderal Pendidikan Tinggi merilis buku panduan
yang mencakup prinsip, aspek penilaian, dan prosedur penilaian (Tinggi, 2020).Pada era
digital ini, teknologi telah memainkan peran yang semakin penting dalam berbagai aspek
kehidupan, termasuk dalam dunia pendidikan. Salah satu inovasi terbaru dalam konteks
pendidikan adalah pengembangan aplikasi Kampus Merdeka, yang bertujuan untuk
meningkatkan kualitas pendidikan tinggi di Indonesia.
Aplikasi Kampus Merdeka ini memiliki berbagai fitur yang dirancang untuk
memudahkan mahasiswa dalam mengakses sumber daya pendidikan, berinteraksi dengan
dosen dan mahasiswa lainnya, serta mengikuti perkuliahan secara daring. Dalam konteks
penggunaan aplikasi ini, penting untuk memahami sentimen atau perasaan pengguna terkait
pengalaman mereka dalam menggunakan aplikasi ini.
Sentimen analysis atau analisis sentimen adalah teknik pemrosesan bahasa alami yang
digunakan untuk mengidentifikasi, memperoleh, dan memahami sentimen atau perasaan
dalam teks. Dalam konteks penelitian ini, sentimen analysis digunakan untuk menganalisis
perasaan pengguna terhadap penggunaan aplikasi Kampus Merdeka. Salah satu metode yang
populer dalam melakukan sentimen analysis adalah algoritma Naive Bayes. Algoritma Naive
Bayes merupakan metode klasifikasi yang berdasarkan pada teorema Bayes dengan asumsi
sederhana yang dikenal sebagai "naive" (polos). Meskipun sederhana, algoritma ini telah
terbukti efektif dalam banyak kasus, termasuk analisis sentimen.
Dalam penelitian ini, kami akan menggunakan algoritma Naive Bayes untuk
melakukan sentimen analysis terhadap penggunaan aplikasi Kampus Merdeka. Tujuan utama
dari penelitian ini adalah untuk memahami perasaan dan tanggapan pengguna terhadap
aplikasi ini, apakah mereka memiliki pengalaman yang positif, negatif, atau netral. Dengan
melakukan analisis sentimen terhadap penggunaan aplikasi Kampus Merdeka, kita dapat
mengidentifikasi kekuatan dan kelemahan aplikasi ini dari perspektif pengguna. Temuan dari
penelitian ini dapat menjadi landasan untuk pengembangan dan peningkatan fitur-fitur yang
ada dalam aplikasi, sehingga dapat memberikan pengalaman yang lebih baik bagi pengguna
di masa depan.
Melalui penelitian ini, diharapkan akan ada pemahaman yang lebih baik tentang
sentimen pengguna terhadap penggunaan aplikasi Kampus Merdeka dan kontribusinya dalam
meningkatkan pendidikan tinggi di Indonesia.
METODOLOGI PENELITIAN
Berdasarkan penelitian terkait, tinjauan penelitian, dan permasalahan yang telah
dijelaskan. Flowchart dari penelitian digambarkan melalui bagan pada Gambar 1.
Gambar 1. Flowchart Penelitian
Kegiatan penelitian dimulai dari mengumpulkan data, pengumpulan data dilakukan
dengan melakukan scraping ulasan aplikasi merdeka mengajar pada google play store,
dilanjutkan dengan proses pelabelan data, pembersihan data, melakukan pembagian data,
proses klasifikasi menggunakan algoritma Naïve Bayes, dan yang terakhir menganalisis
mengevaluasi algoritma Naïve Bayes.
HASIL DAN PEMBAHASAN

A. Dataset
Data yang digunakan peneliti merupakan hasil scraping data pengguna aplikasi merdeka
mengajar.
Tabel 1. Hasil Scraping Data
No Username Score At Content
1 Nur Aminah 1 2023-03-21 Aplikasinya tidak bisa
17:18:18 digunakan di pelatihan
2 Putri Kusuma Wardani 2 2023-05-18 Tidak bisa unggah video aksi
12:28:24 nyata dari youtube
3 Zefairys 08 2 2023-06-05 Aplikasinya eror, ketika saya
15:51:44 ingin upload
4 aditya mulawarman 3 2023-05-16 web tidak dapat diakses, video
11:39:24 pun mengalami bug
5 Jansje B.J keseh 5 2023-03-29 Aplikasi ini sangat
03:31:41 mempermudah untuk
mengakses
B. Labeling Data
Tahap melakukan pelabelan menggunakan 3 kategori yaitu negatif dan positif. data
yang dilakukan pelabelan yakni data yang diambil dari komentar sebelumnya. Pelabelan
dilakukan secara manual oleh setiap anggota.
Tabel 2. Hasil dari Labeling data
No Content Label
1 Memudakan kegiatan belajar dan mengajar Positif
2 Untuk membuka pengaturan loadingnya lama sekali Negatif

tidak bisa masuk. Mohon kepada devloper supaya
diperbaiki
C. Teks Preprocessing
Dalam teks praprocessing ini dilakukan beberapa tahapan, diantaranya yaitu tahap
data cleaning, case folding, tokenizing, Stopword Removal, Stemming. Berikut merupakan
contoh dari melakukan tahapan cleaning data pada penelitian ini:
Gambar 1. Data Cleaning

Dalam proses data cleaning dilakukan pembersihan untuk data yang dianggap tidak
perlu digunakan. Dengan demikian menghasilkan content 1000, 1000 score, dan 943 label.
Setelah dilakukan proses case folding, berikut ini merupakan proses dan hasil dari case
folding.
Gambar 2. Case Folding

Dalam tahap case folding ini dilakukan proses menyamaratakan antara huruf kapital
dan kecil yang ada. Setelah itu ada tahap stopword removal, sebagai berikut ini.
Gambar 3. Stopword Removal
Dalam tahap ini, kata umum yang biasanya muncul dalam jumlah besar dan dianggap
tidak memiliki makna dalam bahasa Indonesia seperti “yang”, “dan”, “di”, “dari”, dll. Makna
di balik penggunaan stopword yaitu dengan menghapus kata-kata yang memiliki informasi
rendah dari sebuah teks.
Selanjutnya yaitu tahap tokenizing, berikut ini merupakan proses dan hasil dari tahap
tokenizing.
Gambar 4. Tokenizing
Dalam tahap ini proses pemisahan teks menjadi potongan-potongan yang disebut
sebagai token untuk kemudian di analisa. Kata, angka, simbol, tanda baca dan entitas penting
lainnya dapat dianggap sebagai token. Didalam NLP, token diartikan sebagai “kata”
meskipun tokenize juga dapat dilakukan pada paragraf maupun kalimat. Setelah itu,
melakukan tahap stemming, seperti gambar berikut ini.
Gambar 5. Stemming
Dalam tahapan ini adalah proses pemetaan dan penguraian bentuk dari suatu kata
menjadi bentuk kata dasarnya. Untuk melakukan stemming bahasa Indonesia kita dapat
menggunakan library Python Sastrawi yang sudah kita siapkan di awal. Library Sastrawi
menerapkan Algoritma Nazief dan Adriani dalam melakukan stemming bahasa Indonesia.
D. Splitting Data
Dalam penelitian ini kami menetapkan bahwa variabel X yang diperoleh dari
keseluruhan Tweet, dan variabel y yang merupakan label. Sebelum dilakukan splitting data,
peneliti menerapkan seleksi fitur pembobotan kata menggunakan TF-IDF (Term Frequency
Inverse Document Frequency). Proses ini dilakukan untuk menilai term atau bobot kata dari
sebuah dokumen terhadap seluruh dokumen pada korpus. TF-IDF (Term Frequency-Inverse
Document Frequency) dihitung menggunakan rumus berikut:
TF-IDF = TF*IDF = TF*log(n/df)
Gambar 6. Rumus TF-IDF

Dimana:
TF = Teks frekuensi
IDF = Teks frekuensi dalam dokumen
n = Jumlah dokumen
Lalu, variabel X yang telah diterapkannya TF-IDF dan variabel y akan dipecah
menjadi X_train, X_test, y_train, dan y_test, dengan perbandingan 80% data training, dan
20% data testing. Serta, ditetapkannya stratify dari variabel y, dan random_state sebesar 42.
Dengan demikian, data training sebanyak 754 data, dan data testing sebanyak 189 data.
E. Pemodelan Algoritma Klasifikasi Naive Bayes

Tahap pengklasifikasian naïve bayes menggunakan jumlah kemunculan kata pada
dataset dari setiap kelas.[12] Data yang diklasifikasikan dengan algoritma naïve bayes yaitu
data hasil preprocessing yang sudah diberi label sesuai dengan sentimen data opini. Hasil
pengklasifikasian akan mendapatkan probabilitas sebagai berikut :
1. Precision atau perbandingan antara banyaknya data yang diprediksi positif dengan true
positive (TP).
2. Recall atau perbandingan antara banyaknya data yang sebenarnya positif dengan true
positif (TP).
3. F1-score atau perbandingan rata-rata antara recall dan precision.
4. Akurasi atau tingkat keakuratan model pada suatu data.
5. Confusion Matriks atau pengukuran performa untuk model learning dari klasifikasi naïve
bayes. [10]
Pemodelan naive bayes classifier dilakukan dengan membagi 943 data opini menjadi 80%
data training dan 20% data testing. Pembagian data training dan testing dapat dilihat pada
tabel 3.
Gambar 7. Pembagian Data

Berdasarkan tabel 3 menunjukkan bahwa pembagian data didapatkan 754 data
training dan 189 data testing. Selanjutnya dilakukan pengklasifikasian pada data testing
dengan algoritma naive bayes untuk mengetahui probabilitas sentimen. Hasil
pengklasifikasian dapat dilihat pada gambar 7.
Gambar 8. Hasil Klasifikasi Naïve Bayes

Hasil pengklasifikasian yang didapatkan pada pemodelan naive bayes classifier ini
adalah 14 data dengan sentimen negatif dan 175 data dengan sentimen positif. Dengan nilai
akurasi 57%, penelitian ini mendapatkan precision sebesar 0.80 pada data sentimen negatif
dan 0.95 pada sentimen positif. Recall sebesar 0.29 pada sentimen negatif dan 0.99 pada
sentimen positif, dan f1-score sebesar 0.42 pada data sentimen negatif dan 0.97 pada
sentimen positif.
Untuk pemodelan naive bayes classifier didapatkan akurasi sebesar 0.942, recall sebesar 0.8,
precision 0.285, dan f1-score 0.421.
KESIMPULAN
Penelitian analisis sentimen terhadap aplikasi Kampus Merdeka menggunakan
algoritma Naïve Bayes menghasilkan kesimpulan bahwa:
1. Pengguna aplikasi Kampus Merdeka cenderung memberikan respon positif terhadap
adanya aplikasi karena terdapat 175 data ulasan positif. Di mana data tersebut
lebih banyak dibandingkan data ulasan negatif yang berjumlah 14 data.
2. Berdasarkan dari pembagian 943 data ulasan aplikasi Kampus Merdeka menjadi 754
data training dan 189 data testing, klasifikasi menggunakan algoritma Naïve Bayes
mampu memprediksi dengan cukup baik. Hal ini ditunjukkan dari hasil akurasi sebesar
57%, precision sebesar 0.80 pada data sentimen negatif dan 0,95 pada data sentimen
positif, dan recall sebesar 0.29 pada sentimen negatif dan 0.99 pada sentimen positif.
DAFTAR PUSTAKA

Text Mining

Diunggah oleh

Informasi Dokumen

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Text Mining

Diunggah oleh

Hak Cipta:

Format Tersedia

Sentiment Analysis Terhadap Penggunaan Aplikasi Merdeka Mengajar

Menggunakan Algoritma Naive Bayes Classifier

HASIL DAN PEMBAHASAN

1 Memudakan kegiatan belajar dan mengajar Positif

2 Untuk membuka pengaturan loadingnya lama sekali Negatif

Gambar 1. Data Cleaning

Gambar 2. Case Folding

TF-IDF = TFIDF = TFlog(n/df)

Gambar 6. Rumus TF-IDF

E. Pemodelan Algoritma Klasifikasi Naive Bayes

Gambar 7. Pembagian Data

Gambar 8. Hasil Klasifikasi Naïve Bayes

Anda mungkin juga menyukai