Abstrak
Drop out atau putus studi merupakan permasalahan yang berkaitan dengan keberhasilan studi
mahasiswa. Hal tersebut juga dialami pada program studi Sistem Informasi Universitas Brawijaya. Hasil
wawancara yang telah dilakukan dengan Ketua Program Studi Sistem Informasi bahwa telah terjadi
pemberhentian studi atau drop out setiap tahunnya. Adanya mahasiswa yang drop out dapat
menyebabkan turunnya kualitas dan mutu perguruan tinggi. Oleh karena itu, sebagai penanganan
terhadap masalah tersebut diperlukan sistem yang mampu membantu pengambilan keputusan untuk
memprediksi mahasiswa yang berpotensi drop out. Sistem ini diharapkan dapat membantu pihak
program studi Sistem Informasi Universitas Brawijaya dalam mengambil keputusan dan menjadi bahan
evaluasi dini serta memberikan penanganan lebih awal terhadap mahasiswa yang berpotensi drop out.
Salah satu teknik untuk prediksi adalah menggunakan data mining. Klasifikasi menggunakan algoritme
K-Nearest Neighbor (K-NN) merupakan salah satu metode data mining yang dapat digunakan untuk
memprediksi potensi drop out mahasiswa. Hasil pemrosesan dengan bantuan tool Weka didapatkan nilai
kedekatan terbaik menggunakan algoritme K-NN adalah k=5. Hasil evaluasi algoritme yang didapatkan
menggunakan confusion matrix adalah tingkat akurasi sebesar 99.2337%. Hasil nilai AUC dari kurva
ROC menunjukkan nilai sebesar 0.8918. Hasil pengujian usability yang dihasilkan menggunakan SUS
adalah 67.5.
Kata kunci: prediksi, data mining, klasifikasi, k-nearest neighbor, system usability scale
Abstract
Drop out is a problem related to the success of student learning. This problem has also happened in
Information System study program at Brawijaya University. The results of interviews were conducted
with the Head of the Information System Study Program that there was a drop out every year. The
existence of students who drop out can cause a decrease in the quality of higher education. Therefore,
as handling of these problems needs a system that capable to help make decisions to predict on students
who have the potential to drop out so prevention can be done. This system is expected to be able to help
the Brawijaya Information System Study Program in making decisions, become the material for early
evaluation and provide early treatment for students who have the potential to drop out. One technique
for predicting is to use data mining. Classification using K-Nearest Neighbor (K-NN) algorithm is one
of data mining method that can be used to predict student drop out potential. The results of processing
with the help of Weka tool found the best proximity value using the K-NN algorithm is k=5. The results
of evaluating algorithms obtained using confusion matrix have an accuracy rate of 99.2337%. The AUC
value result of ROC curve shows a value of 0.8918. The level of usability testing generated by utilizing
SUS is 67.
Keywords: prediction, data mining, classification, k-nearest neighbor, system usability scale
sama lain. Kualitas ini sangat berpengaruh untuk melakukan penelusuran terhadap data-
terhadap studi mahasiswa. Mahasiswa dengan data mahasiswa guna menemukan dan
kualitas tertentu dapat rentan terkena drop out. menghasilkan pola drop out dari mahasiswa.
Hasil wawancara yang telah dilakukan dengan Algoritme K-Nearest Neighbor dipilih karena K-
Ketua Program Studi Sistem Informasi, dimana NN marupakan salah satu algoritme klasifikasi
terdapat permasalahan yang dialami berkaitan dengan rumus sederhana dan mampu
dengan keberhasilan studi mahasiswa, yaitu memberikan hasil yang cukup baik dalam
terjadi pemberhentian studi atau drop out setiap beberapa kasus.
tahunnya. Masalah ini dapat memberikan Hasil prediksi ini akan diimplementasikan
dampak yang merugikan bagi mahasiswa dan pada dashboard sistem guna memberi
pihak program studi, yang mana dapat kemudahan dalam menampilkan informasi.
menyebabkan turunnya kualitas dan mutu Hasil ini diharapkan dapat membantu
program studi. Selain itu, salah satu aspek mendukung pihak program studi Sistem
penilaian BAN-PT dalam menentukan akreditasi Informasi menjadi bahan membantu
program studi S1 yaitu dari persentase pengambilan keputusan dan bahan evaluasi dini
mahasiswa yang drop out. serta memberikan tindak penanganan lebih awal
Oleh karena itu, sebagai penanganan kepada mahasiswa yang diprediksi berpotensi
terhadap masalah tersebut diperlukan terancam drop out.
identifikasi sejak dini untuk mengetahui
mahasiswa mana saja yang memiliki potensi 2. LANDASAN PUSTAKA
terancam drop out sehingga dapat dilakukan
pencegahan. Salah satu solusi yang dapat 2.1. Data Mining
membantu permasalahan ini yaitu dengan Data mining merupakan salah satu bidang
membuat sistem yang dapat digunakan dalam keilmuan yang menyatukan teknik dari
melakukan suatu prediksi terhadap mahasiswa pembelajaran mesin, pengenalan pola, statistik,
yang berpotensi terancam drop out. Dalam database, dan visualisasi untuk penanganan
memudahkan melakukan prediksi ini dapat permasalahan pengambilan informasi dari
menggunakan pendekatan data mining. Metode database yang besar (Larose, 2005).
data mining yang dapat digunakan untuk Data mining dibagi menjadi beberapa
melakukan prediksi drop out salah satunya yaitu kelompok berdasarkan tugas yang dapat
dengan memanfaatkan metode klasifikasi. dilakukan (Larose, 2005), yaitu:
Penelitian dengan topik prediksi 1. Deskripsi, untuk menggambarkan pola
pengunduran diri menggunakan algoritme data serta kecenderungan yang ada di dalam
mining pernah dilakukan sebelumnya oleh data
Ndaumanu (2014). Dalam penelitian yang 2. Klasifikasi, terdapat target variabel
dilakukan tersebut digunakan algoritme K- kategori
Nearest Neighbor. Berdasarkan hasil uji coba 3. Estimasi, hampir sama dengan
yang dilakukan didapat akurasi prediksi sebesar klasifikasi kecuali variabel target
79%. Penelitian lain yang pernah dilakukan oleh estimasi lebih ke arah numerik daripada
Yukslturk (2014) yang melakukan klasifikasi ke arah kategori
mahasiswa drop out menggunakan empat 4. Prediksi, hampir sama dengan
pendekatan data mining. Hasil akurasi penelitian klasifikasi dan estimasi, kecuali di
ini dari metode K-Nearest Neighbor, Decision dalam prediksi nilai dari hasil akan ada
Tree, Neural Network, dan Naive Bayes masing- di masa mendatang
masing adalah 87%, 79.9%, 76.8%, dan 73.9%. 5. Pengklasteran, pengelompokan record,
Penelitian yang dilakukan (Bayer, 2012) pengamatan atau memperhatikan dan
menggunakan data perilaku social dan pengujian membentuk kelas objek-objek yang
tingkat akurasi dengan 10-folds cross- memiliki kemiripan
validation. Hasil dengan tingkat akurasi tertinggi 6. Asosiasi, bertugas menentukan atribut
diperoleh pada semester 7 menggunakan metode yang muncul dalam satu waktu
K-NN dan PART yaitu lebih dari 90%.
Oleh karena itu, dalam penelitian yang akan 2.2. Algoritme K-Nearest Neighbor
dilakukan ini akan dilakukan prediksi dengan
menggunakan pendekatan data mining K-Nearest neighbor (K-NN) merupakan
menggunakan algoritme K-Nearest Neighbor metode berdasarkan analogi penatihan, dimana