Abstrak
Pengajaran yang baik dapat membantu mahasiswa dalam mencapai hasil yang maksimal. Untuk
meningkatkan kualitas pembelajaran dan standarisasi akademik perlu dilakukan evaluasi sehingga dapat
menghasilkan mahasiswa-mahasiswa yang berkualitas. Oleh karena itu, Jurusan Sistem informasi selalu
melakukan evaluasi terhadap kinerja menggunakan kuisioner yang diisikan oleh mahasiswa disetiap
akhir semester. Hasil kolom saran dapat dilakukan analisis sentimen untuk mengetahui saran tersebut
bernilai positif, negatif atau netral. Salah satu metode yang bisa digunakan untuk menyelesaikan
masalah opinion mining adalah Naive Bayes Classifier (NBC). NBC bisa digunakan untuk
mengklasifikasikan opini kedalam kelas positif, negatif dan netral. Data komentar yang terkumpul
sebanyak 3502 yang terbagi menjadi 3 semester. Data komentar ini kemudian dilakukan tahapan
preprocessing, pembobotan TF-IDF dan klasifikasi menggunakan metode Naive Bayes Classifier. Hasil
Pengujian terhadap 4 parameter menghasilkan akurasi sebesar 80,1%, Precision 80,3%, Recall 80,3%
dan F1-Score 80%. Hasil dari Usability testing diperoleh nilai rata-rata SUS Score sebesar 75. Sehingga
dapat disimpulkan bahwa Dashboard yang telah dibuat ini termasuk kedalam kategori Acceptance dan
berada pada rating “Good”
Kata kunci: Penambangan teks, klasifikasi Naïve Bayes, pemprosesan, TF-IDF, PowerBI, Evaluasi Kinerja
Abstract
Effective and efficient in teaching can help students achieve maximum results. An evaluation is needed
to improve the quality of learning and academic standardization, also it can improve the quality of the
student. Therefore, the Information Systems Department always evaluates performance using
questionnaires and filled by students at the end of each semester. The results of the suggestion column
can be sentiment analysis to find out whether the suggestion is positive, negative or neutral. The
classifier is a method that can classify data into several classes. Naive Bayes Classifier can be used to
classify opinions into positive, negative and neutral classes. The comment data was collected 3502
comments which were divided into 3 semesters. Then, this comment data processed in preprocessing,
weighting TF-IDF and classification using Naive Bayes Classifier. The test result on 4 parameters
resulted in an accuracy of 80,1%, Precision 80,3%, Recall 80,3% and F1-Score 80%. The results of
Usability testing obtained an average value of SUS Score of 75. So it can be concluded that the
Dashboard is included in the Acceptance category and in the rating of "Good"
Keywords: Text Mining, Naïve Bayes Classifier, Preprocessing, TF-IDF, PowerBI, Job Evaluation
0,93, serta untuk subproses opinion orientation IDF (𝑖𝑑𝑓𝑡 ) memperhatikan kemunculan term
adalah 0,95 dan 0,94. pada kumpulan dokumen. Untuk mendapatkan
nilai (𝑖𝑑𝑓𝑡 ) dapat menggunakan persamaan
2.2. Pengumpulan Data 𝑁
𝑖𝑑𝑓𝑡 = log (2)
Data komentar berjumlah 3502 komentar 𝑑𝑓𝑡
didapatkan dari Ketua Jurusan Sistem Informasi
Dimana :
dan TIM UJM Jurusan Sistem Informasi. Data
yang didapatkan terdiri dari 3 semester yaitu - 𝑖𝑑𝑓𝑡 : Nilai idf dari istilah t
semester Genap tahun ajaran 2016/2017,
- 𝑁 : Banyaknya dokumen atau
semester Gansjil tahun ajaran 2017/2018, dan
koleksi yang ada
semester Genap tahun ajaran 2017/2018.
- 𝑖𝑑𝑓𝑡 : Banyaknya kemunculan
2.3. Text Preprocessing istilah t dalam dokumen d
2. True Negatives (TN): Data negatif yang Informasi dan Tim UJM. Setelah itu, Tim UJM
berhasil dilabeli dengan benar oleh akan mengumpulkan data kuisioner selama 7
classifier. hari dan menghasilkan Data Mentah Hasil
3. False Positives (FP): Data negatif yang Kuisioner. Data mentah hasil kuisioner juga
ternyata salah dilabeli sebagai positif oleh akan disimpan kedalam SIMPLE (Sistem
classifier. Informasi Pelaporan) UB. Setelah pengumpulan
4. False Negatives (FN): Data positif yang data, akan dilakukan analisis terhadap kuisioner
ternyata salah dilabeli sebagai negatif oleh yang diisikan oleh mahasiswa selama 7 hari.
classifier. Analisis dibagi menjadi 3 bagian yaitu analisis
perdosen, analisis permata kuliah dan analisis
Confussion matrix merepresentasikan preprogram studi. Hasil dari analisis ini akan
tingkat akurasi dari proses klasifikasi yang telah menjadi Raport Dosen dan dilaporkan kepada
dilakukan. Tingkat akurasi menunjukkan Ketua Jurusan Sistem Informasi, serta
proporsi jumlah prediksi benar. menghasilkan Laporan Pertanggung Jawaban.
𝑇𝑃+𝑇𝑁
Ketua Jurusan Sistem Informasi yang menerima
𝐴𝑐𝑢𝑟𝑎𝑛𝑐𝑦 = (4) Laporan Hasil Evaluasi dari TIM UJM akan
𝑇𝑃+𝐹𝑃+𝑇𝑁+𝐹𝑁
memanggil dosen yang bersangkutan dan
Recall atau true positif rate (TP) adalah
melakukan pembinaan dengan dosen yang
proporsi dari kasus positif yang telah
terkait. Pembinaan ini dilakukan selama 7 hari
diidentifikasi dengan benar, rumus mencari
dan menghasilkan Laporan Hasil Pembinaan.
Recall:
𝑇𝑃
𝑇𝑟𝑢𝑒 𝑃𝑜𝑠𝑖𝑡𝑖𝑣𝑒/𝑅𝑒𝑐𝑎𝑙𝑙 = (5)
𝑇𝑃+𝑇𝑁
3.2. Preprocessing cukup baik dalam beri materi cukup baik beri materi
terima kasih terima kasih
Tahapan yang dilakukan dalam
preprocessing, yaitu :
a. Case Folding e. Tokenization
Case folding adalah tahapan mengubah Tokenization adalah tahapan untuk
semua huruf menjadi huruf kecil memecah kalimat menjadi kata.
(lowercase).
Tabel 6. Tokenization
Sebelum Tokenisasi Sesudah Tokenisasi
Tabel 2. Case Folding
Sebelum Case Folding Sesudah Case Folding
semoga selalu menjadi [‘moga’ ‘selalu’ ‘menjadi’
yang terbaik ‘yang’ ‘baik’]
Semoga selalu menjadi semoga selalu menjadi
yang terbaik yang terbaik cukup baik dalam [’cukup’ ’baik’ ’dalam’
pemberian materi terima ’beri’ ’materi’ ’terima’
Cukup baik dalam cukup baik dalam kasih. ’kasih’]
pemberian materi, terima pemberian materi, terima
kasih. kasih.
3.3 TF-IDF
b. Cleansing
Cleansing adalah tahapan untuk Perhitungan bobot kata dilakukan dengan
menghilangkan elemen-elemen yang menggunakan pembobotan Term Frequency-
dianggap sebagai noise. Inverse document Frequency (TF-IDF).
pp.1–10.
Sharfina, Z. and Santoso, H.B., 2016. An
Indonesian Adaptation of the System
Usability Scale ( SUS ). 2016
International Conference on Advanced
Computer Science and Information
Systems (ICACSIS), pp.145–148.
Sunardi, Fadlil, A. and Suprianto, 2018. Analisis
sentimen menggunakan metode naïve
bayes classifier pada angket mahasiswa.
(2), pp.1–9.
Undang-undang Republik Indonesia Nomor 14
Tahun 2005 tentang Guru dan Dosen.
Produk Hukum, p.54.
Velcu-laitinen, O. and Yigitbasioglu, O.M.,
2012. The Use of Dashboards in
Performance Management : Evidence
from Sales Managers. 12(November
2011), pp.39–58.