1. PENDAHULUAN
Kelulusan mahasiswa adalah hal yang sangat penting dari suatu perguruan tinggi. Dalam undang-undang Republik
Indonesia nomor 12 tahun 2012 (2) tentang pendidikan tinggi yang dimaksud adalah jenjang pendidikan setelah
pendidikan menengah yang mencakup program diploma, program sarjana, program magister, program doktor, dan
program profesi, serta program spesialis, yang diselenggarakan oleh perguruan tinggi berdasarkan kebudayaan
bangsa Indonesia [1]. Salah satu penilaian standar utama yang dilakukan BAN-PT [2] dilihat dari kesuksesan dan
kualitas perguruan tinggi menciptakan ketepatan kelulusan mahasiswa yang dikatakan lulus dengn tepat waktu
jika mampu menyelesaikan studi kurun waktu 2 tahun atau 4 semester untuk jenjang studi S2. Namun pada
praktiknya mahasiswa tidak selalu mampu menyelesaikan studinya tersebut dalam waktu normal. Hal ini
ditunjukkan dengan dibagi masa studi menjadi dua kategori yaitu kurang dari sama dengan empat semester dan
lebih besar dari 4 semester. Semakin banyak mahasiswa yang mendaftar dan masuk sebagai peserta didik pada
perguruan tinggi maka jumlah mahasiswa yang lulus juga harus sama. Apabila banyak mahasiswa yang tidak lulus
maka akan terjadi penumpukan jumlah data pribadi mahasiswa di database dan sistem neo feeder perguruan tinggi.
Data dalam jumlah besar apabila diolah menggunakan beberapa metode tertentu akan memberikan informasi baru
yang dapat membantu pihak perguruan tinggi dalam mengambil suatu keputusan atau kebijakan. Salah satu
kebijakan adalah memprediksi kelulusan mahasiswa lebih awal untuk meningkatkan jumlah kelulusan mahasiswa
dan meminimalisir jumlah mahasiswa yang tidak lulus sesuai dengan masa studinya.
Salah satu teknik melakukan prediksi yang dapat digunakan adalah dengan teknik data mining. Data mining
adalah disiplin ilmu yang mempelajari metode untuk mengekstrak pengetahuan atau menemukan pola dari suatu
data yang besar dimana proses yang digunakan yaitu teknik statistik, matematika, kecerdasan buatan. Adapun
tujuan dari data mining yaitu untuk mengekstrak data yang besar dari suatu kumpulan data yang tersedia. Data
mining merupakan proses yang menggunakan satu atau lebih teknik pada machine learning untuk melakukan
analisis dan ekstrasi secara otomatis dari jumlah data yang besar. Data mining dapat digunakan secara luas dalam
seluruh penyimpananin formasi [3]. Adapun faktor-faktor yang menentukan kriteria dari data mining yaitu proses
pencarian nilai yang telah ditambahkan ke kumpulan data yang lampau, objek dari data mining merupakan data
Oktaviana Bangun, Copyright © 2022, MIB, Page 2006
Submitted: 27/07/2022; Accepted: 24/08/2022; Published: 25/10/2022
JURNAL MEDIA INFORMATIKA BUDIDARMA
Volume 6, Nomor 4, Oktober 2022, Page 2006-2013
ISSN 2614-5278 (media cetak), ISSN 2548-8368 (media online)
Available Online at https://ejurnal.stmik-budidarma.ac.id/index.php/mib
DOI: 10.30865/mib.v6i4.4572
dalam jumlah banyak dan komplek yang dapat mencari hubungan atau bentuk yang dapat memberikan indikasi
yang berguna [4]. Data akademik pada perguruan tinggi bertambah setiap tahunnya sejalan dengan bertambahnya
jumlah mahasiswa yang mendaftar di Perguruan Tinggi. Data yang banyak menyimpan informasi yang banyak
juga. Memprediksi kelulusan mahasiswa adalah suatu kegiatan untuk menentukan suatu kondisi dimasa depan
berdasarkan data yang telah ada. Penelitian dibidang data akademik telah banyak dilakukan dengan berbagai
metode dan algoritma, namun penggunaan algoritma Support Vector Machine (SVM) adalah suatu teknik yang
relatif baru pada tahun 1995 untuk melakukan prediksi, klasifikasi maupun regresi yang sangat populer di dekade
belakangan ini. Setiap perguruan tinggi memiliki kumpulan data yang menyimpan informasi sebagai informasi
biodata mahasiswa [5]. Dengan melimpahnya database yang dimiliki oleh perguruan tinggi tersebut, data yang
tersimpan dapat diketahui dengan menangani informasi mahasiswa [6]. Kumpulan data dapat digunakan untuk
berkonsentrasi pada contoh dan perilaku mahasiswa untuk membatasi penundaan kelulusan [7]. Salah satu strategi
yang dapat digunakan untuk mengkaji basis informasi adalah teknik data mining.
Klasifikasi merupakan suatu teknik yang dapat digunakan untuk memetakan masukan menjadi keluaran
diskrit yang dinamakan dengan label dan atribut. Atribut untuk suatu observasi diprediksi oleh pemetaan fungsi.
Sebagai contoh performa dari suatu kumpulan mahasiswa dapat diklasifikasikan sebagai “lulus” atau “tidak lulus”.
Teknik klasifikasi terdiri dari Support Vector Machine, Naïve Bayes, Discriminant Analysis, K-Nearest Neighbor,
Neural Network [8]
Menurut penelitian oleh Farbatul Janan, Sourav Kumar Ghosh, 2021 tentang Prediction of Student’s
Performance Using Support Machine Classifier untuk memprediksi kinerja mahasiswa tahun kedua dalam ujian
akhir. Hasil dari penelitian ini adalah model yang digunakan yaitu Fuzzy ANFIS diintegrasikan dengan SVM lebih
efektif dan praktis untuk prediksi kemajuan siswa yang akurat dengan persentase 81.25 %, Students Performance
Prediction Using SVM untuk ber konsentrasi pada tingkat kinerja mahasiswa Pasca Sarjana. Untuk mengungkap
keadaan nyata di studi yang lebih tinggi, data telah dikumpulkan hanya dari kumpulan siswa tersebut. Penelitian
oleh Honakan, 2018 klasifikasi dengan proses dukungan vektor mesin memiliki akurasi tinggi dengan stopword,
kombinasi tokenizing istilah frekuensi dan chi-square 47.43 %, sedangkan penelitian oleh Pratama, 2018 tentang
Support Vector Machine (SVM) mengklasifikasikan data menjadi 2 kelas menggunakan RBF Kernel Gaussian
dengan kombinasi nilai parameter λ=0,5, konstan γ=0,01, dan ε (epsilon)=0,001 itermax = 100, c = 1 menggunakan
data pelatihan untuk 170 dataset yang menghasilkan akurasi rata-rata 80.55%. Jadi persentase keakuratan, memori
dan keakuratan dipengaruhi oleh penentuan data pelatihan [9]
Penelitian mengenai penerapan algoritma SVM untuk mendapatkan model prediksi kelulusan mahasiswa
tepat waktu juga dilakukan oleh [10] tentang membandingkan algoritma machine learning dengan algoritma yang
lainnya yaitu Naïve Bayes. Data yang digunakan dalam penelitian ini seperti GPA, data profil, asal sekolah SMA
dan tempat tinggal. Berdasarkan hasil pengujian dengan data tersebut algoritma SVM memberikan nilai akurasi
yang lebih baik dibandingkan dengan algoritma Naïve Bayes yaitu 69,15%. Model prediksi kelulusan mahasiswa
tepat waktu yang dihasilkan oleh algoritma SVM lebih baik untuk digunakan pada data tersebut. Penelitian [11]
tentang presentase kesalahan klasifikasi yang dihasilkan dari algoritma dalam menentukan model kelulusan
mahasiswa tepat waktu di FMIPA UNTAD. Dua algoritma digunakan untuk membandingkan nilai kesalahan yang
dihasilkan dari masing-masing algoritma yaitu SVM dan regresi logistik biner. Hasil pengujian didapatkan bahwa
nilai kesalahan klasifikasi yang dihasilkan oleh SVM sebesar 16,84% sedangkan nilai kesalahan klasifikasi dari
regresi logistik biner sebesar 19,3%. Algoritma SVM memiliki nilai kesalahan yang lebih kecil dibandingkan
dengan regresi logistik biner sehingga SVM dapat digunakan pada proses klasifikasi kelulusan mahasiswa tepat
waktu FMIPA UNTAD. Penelitian tentang penggunaan SVM juga dilakukan oleh [12] pada penelitian ini
menggunakan algoritma SVM dibandingkan dengan dua algoritma lainnya yaitu KNN dan decision tree dalam
mendapatkan model terbaik untuk memprediksi mahasiswa agar lulus tepat waktu. Berdasarkan hasil pengujian
didapatkan bahwa SVM memberikan nilai akurasi yang paling tinggi yaitu sebesar 95% sedangkan KNN
memberikan akurasi sebesar 92% dan decision tree memberikan akurasi sebesar 93% berdasarkan dari data yang
digunakan. Model yang dihasilkan oleh SVM dapat digunakan untuk memprediksi kelulusan mahasiswa agar lulus
tepat waktu. Penelitian yang dilakukan oleh [13] tentang perbandingan antara algoritma Support Vector Machine
(SVM), Neural Network (NN) dan Decision Tree (DT) yang menghasilkan model yang dapat memprediksi waktu
kelulusan mahasiswa pada salah satu universitas swasta di Indonesia. Akurasi yang didapatkan dari ketiga
algoritma tersebut menunjukkan bahwa penggunaan algoritma SVM memberikan tingkat akurasi yang paling
tinggi yaitu 85,18%, sementara algoritma NN memiliki tingkat akurasi sebesar 84,68% dan akurasi dari DT sebesar
84,96%. Berdasarkan hasil penggunaan algoritma SVM tersebut mampu memberikan model yang paling baik
dalam memprediksi waktu kelulusan mahasiswa karena SVM memiliki tingkat akurasi yang paling tinggi.
Prediksi kelulusan merupakan hasil dari kegiatan memprediksi kelulusan apabila mahasiswa telah
memenuhi semua persyaratan yang telah di tetapkan oleh perguruan tinggi yaitu telah memempuh masa studi
selama 4 semester dan lulus dengan 46 sks, telah lulus mata kuliah wajib, tidak memiliki nilai C+, lulus ujian akhir
semester, seminar proposal, seminar hasil, kompre dan toefl sebagai persyaratan wisuda, IPK > 3.00. Support
Vector Machines (SVM) adalah suatu metode yang handal dalam menyelesaikan masalah klasifikasi data.
Penggunaan model SVM mengolah data menjadi data latih dan data uji [14]. Data latih digunakan untuk
membentuk model SVM, sementara nilai parameter bebasnya dipilih dari data awal. Selanjutnya model SVM yang
dihasilkan digunakan untuk mengklasifikasi data uji. Data yang digunakan dalam penelitian ini adalah data
Oktaviana Bangun, Copyright © 2022, MIB, Page 2007
Submitted: 27/07/2022; Accepted: 24/08/2022; Published: 25/10/2022
JURNAL MEDIA INFORMATIKA BUDIDARMA
Volume 6, Nomor 4, Oktober 2022, Page 2006-2013
ISSN 2614-5278 (media cetak), ISSN 2548-8368 (media online)
Available Online at https://ejurnal.stmik-budidarma.ac.id/index.php/mib
DOI: 10.30865/mib.v6i4.4572
Program Studi Ilmu Kesehatan Masyarakat Program Magister Fakultas Kesehatan Masyarakat Institut Kesehatan
Deli Husada Deli Tua. Artikel ini terdiri dari lima bagian yaitu pendahuluan, metode penelitian, hasil dan
pembahasan, kesimpulan dan saran
2. METODOLOGI PENELITIAN
2.1. Langkah-Langkah Penelitian
Metode penelitian menjelaskan tentang langkah-langkah dalam penelitian melakukan analisis klasifikasi dengan
Support Vector Machine (SVM) Linier dengan tahapan sebagai berikut :
1. Mengambil data mahasiswa sesuai dengan format Excel yang telah dibuat
2. Membagi data training dan data testing dengan jumlah data training 70% (555 mahasiswa) dari jumlah
mahasiswa 792 mahasiswa dan data testing 30 % (237 mahasiswa)
3. Data training dan data testing adalah data lulusan mahasiswa tahun 2016 s.d. 2021, sedangkan data untuk
prediksi adalah data mahasiswa tahun akademik 2020
4. Memdapatkan nilai w dan b
5. Membentuk persamaan Support Vector Machine (SVM) Linier
6. Proses Prediksi Kelulusan mahasiswa dibagi menjadi dua yaitu data training 70 % dan data testing 30%. Untuk
proses pembentukan persamaan ada nilai w atau bobot, persamaan akan dibentuk yang dapat menghasilkan
prediksi kelulusan mahasiswa yang lulus atau tidak. Karena ada 4 fitur (IPS1, IPS2, IPS3, IPS4), maka w juga
akan memiliki 4 fitur (w1, w2, w3, w4).
7. Formulasi yang digunakan untuk meminimalkan Nilai Margin:
1/2 ‖w‖2 = 1/2 (w12 + w22 + w32 + w42 dengan Syarat
yi (w.xi + b) > 1, i = 1,2,3,4,5, n
yi (w1.x1 + w2.x2 + w3.x3 + w4.x4 ≥ +1 untuk kelas lulus
yi (w1.x1 + w2.x2 + w3.x3 + w4.x4 ≥ -1 untuk kelas tidak lulus
8. Untuk tahapan membentuk persamaan memanfaatkan persamaan linear yaitu: substitusi dan eliminasi dimana:
Persamaan 1, nilai w = - karena dalam datasetnya data training data pertama masuk dalam kategori tidak lulus
dan Persamaan 2, nilai w = + karena dalam dataset data training data kedua masuk dalam kategori lulus. dst.
9. Setelah didapat hasil dari w1, w2, w3, w4 dan b, maka prediksi dilakukan dengan menggunakan data
mahasiswa yang belum lulus.
10. Selanjutnya melakukan prediksi atau klasifikasi di dataset pada testing, dimana data testing yang terdapat pada
Institut Kesehatan Deli Husada Deli Tua Program Magister Kesmas mahasiswa yang belum lulus dari
Angkatan 2020 (Semester 3) dan 2021 (Semester 2) dengan menggunakan algoritma Support Vector Machine
(SVM).
11. Mengetahui nilai akurasi lulus atau tidak
2.2 Sumber Data dan Variabel
Data yang digunakan dataset mahasiswa yang diperoleh dari sumber yang sudah ada yaitu salah satu perguruan
tinggi swasta Institut Kesehatan Deli Husada Deli Tua Jl. Besar No. 77 Deli Tua dengan data historis mahasiswa
S2 Prodi IKM pada Neo Feeder yang diambil dari tahun 2016 – 2021 sejumlah 792 sample yang diperoleh dari
administrasi bagian akademik dengan lima atribut sebagai prediktor dan satu atribut sebagai hasil yaitu lulus atau
tidak. Dataset yang digunakan dalam penelitian ini dikumpulkan melalui administrasi Pendidikan dan wawancara
dengan pengelola program studi sejumlah 792 data mahasiswa. Tabel 1 menjelaskan atribut data yang
diperoleh:[15]
Tabel 1. Atribut yang digunakan
No Atribut Definisi Operasional
1 Nama/NIM Dataset Tahun 2016 s.d. tahun 2021
2 IPS 1 Indeks Prestasi Semester Satu
3 IPS 2 Indeks Prestasi Semester dua
4 IPS 3 Indeks Prestasi Semester tiga
5 IPS 4 Indeks Prestasi Semester empat
6 Keterangan Ya/Tidak
Yang diuji mencoba menggunakan algoritma SVM Linear untuk mengatasi masalah nilai yang rendah
terhadap mahasiswa dan meningkatkan kinerja akademik mahasiswa dalam dataset besar yang mana kinerja
mahasiswa yang diperoleh pada saat ujian akhir semester dievaluasi oleh pihak program studi. Sebelum diperoleh
IPS1, IPS2, IPS3 dan IPS4 dataset yang diperoleh dijabarkan nilainya per masing-masing mata kuliah dengan SKS
mahasiswa dinamakan Daftar Peserta Nilai Akhir (DPNA) mahasiswa. Berikut salah satu contoh Tabel DPNA
mahasiswa semester ganjil
Selanjutnya Variabel x dalam penelitian ini adalah mahasiswa sudah lulus sebagai data ataupun yang belum
lulus, yang terdiri dari empat sub variable yaitu IPS1, IPS2, IPS3, IPS4.
3.2. Analisis Kinerja Algoritma Support Vector Machine (SVM) Linier
Algoritma Support Vector Machine (SVM) Linier merupakan salah satu algoritma yang paling popular [16].
Pelatihan yang dilakukan untuk mengetahui kinerja algoritma Support Vector Machine linear adalah:
Adapun data yang dikumpulkan sebagai contoh dapat disajikan pada tabel berikut:
Tabel 4. Sampel Data dan Data Uji
NPM IPS 1 IPS 2 IPS 3 1PS 4 LULUS
19.15.001 2.53 2.10 0.71 2.36 TIDAK
19.15.002 3.37 3.15 3.02 2.93 YA
19.15.004 2.37 2.17 2.17 2.19 TIDAK
19.15.005 2.37 2.72 2.12 1.98 TIDAK
4. KESIMPULAN
Masa studi mahasiswa dapat dilihat dengan nilai IPK yang akan diprediksi apakah mahasiswa tersebut akan lulus
atau tidak. Dengan menggunakan algoritma Support Vector Machine (SVM) dan menggunakan 792 data training
mahasiswa Program Studi Ilmu Kesehatan Masyarakat Program Magister Fakultas Kesehatan Masyarakat Institut
Kesehatan Deli Husada Deli Tua didapatkan kesimpulan bahwa mahasiswa yang lulus adalah 90% dan yang tidak
lulus adalah 10%
UCAPAN TERIMAKASIH
Puji dan Syukur kepada Tuhan Yang Maha Esa, Karena kehendak dan kebaikanNya Peneliti dapat menyelesaikan
penelitian ini. Doa, dukungan, arahan, bimbingan dari berbagai Pihak yaitu Prof. Herman Mawengkang selaku
Pembimbing I, Dr. Syahril Efendi, S.Si., M.IT selaku Pembimbing II, Suami, Anak dan orangtua tercinta, Institut
Kesehatan Deli Husada Deli Tua
REFERENCES
[1] “20. UU No.12 Tahun 2012 tentang Pendidikan Tinggi.pdf.”
[2] “PERATURAN MENTERI PENDIDIKAN DAN KEBUDAYAAN no 49 tahun 2014.pdf.”
[3] N. Mayasari, “Comparison of Support Vector Machine and Decision Tree in Predicting On-Time Graduation,” vol. 02,
no. 12, p. 13, 2016.
[4] L. Marlina, M. lim, and A. P. Utama Siahaan, “Data Mining Classification Comparison (Naïve Bayes and C4.5
Algorithms),” Int. J. Eng. Trends Technol., vol. 38, no. 7, pp. 380–383, Aug. 2016, doi: 10.14445/22315381/IJETT-
V38P268.
[5] “Aplikasi Data Mining dengan Metode Support Vector.pdf.”
[6] “Predicting students’ academic performance using a modified KNN algorithm.pdf.”
[7] C.-W. Hsu, C.-C. Chang, and C.-J. Lin, “A Practical Guide to Support Vector Classification,” p. 16.
[8] Faculty of Computer and Mathematical Sciences, Universiti Teknologi MARA, 40450 Shah Alam, Selangor, N.
Mohammad Suhaimi, S. Abdul-Rahman, S. Mutalib, N. H. Abdul Hamid, and A. Hamid, “Review on Predicting Students’
Graduation Time Using Machine Learning Algorithms,” Int. J. Mod. Educ. Comput. Sci., vol. 11, no. 7, pp. 1–13, Jul.
2019, doi: 10.5815/ijmecs.2019.07.01.
[9] L. W. Santoso and Y. Yulia, “Predicting student performance in higher education using multi-regression models,”
TELKOMNIKA Telecommun. Comput. Electron. Control, vol. 18, no. 3, p. 1354, Jun. 2020, doi:
10.12928/telkomnika.v18i3.14802.
[10] A. Kesumawati and D. T. Utari, “Predicting patterns of student graduation rates using Naïve bayes classifier and support
vector machine,” East Java, Indonesia, 2018, p. 060005. doi: 10.1063/1.5062769.
[11] I. T. Utami, “PERBANDINGAN KINERJA KLASIFIKASI SUPPORT VECTOR MACHINE (SVM) DAN REGRESI
LOGISTIK BINER DALAM MENGKLASIFIKASIKAN KETEPATAN WAKTU KELULUSAN MAHASISWA
FMIPA UNTAD,” J. Ilm. Mat. DAN Terap., vol. 15, no. 2, pp. 256–267, Dec. 2018, doi:
10.22487/2540766X.2018.v15.i2.11361.