Prediksi Kelulusan Mahasiswa Tepat Waktu 42eb4c1b
Prediksi Kelulusan Mahasiswa Tepat Waktu 42eb4c1b
Abstract: Students graduation on time is one of assessment in accreditation process of university. The
problem is how to know the students will be able to pass on time or not. In this study focus on how the
prediction of graduation students on time with data mining using decision tree algorithm and artificial
neural network. This research uses data of students who have passed the data as training and students
who have not passed as data testing. This study aims to determine the graduation of students on time
or not, the expected results can provide information and input for universities in making policy for
improvement in the future.
Abstrak: Kelulusan mahasiswa tepat waktu merupakan salah satu penilaian dalam proses akreditasi
perguruan tinggi. Permasalahannya adalah bagaimana mengetahui mahasiswa nantinya bisa lulus
tepat waktu atau tidak. Dalam penelitian ini fokus pada bagaimana prediksi kelulusan mahasiswa
tepat waktu dengan data mining menggunakan algoritma decision tree dan artificial neural network.
Penilitian ini menggunakan data mahasiswa yang sudah dinyatakan lulus sebagai data training dan
mahasiswa yang belum lulus sebagai data testing. Penelitian ini bertujuan untuk mengetahui kelulusan
mahasiswa tepat waktu atau tidak, yang diharapkan hasilnya dapat memberikan informasi dan
masukan bagi pihak perguruan tinggi dalam membuat kebijakan demi perbaikan di masa yang akan
datang.
Kata Kunci: Kelulusan, Data mining, Decision Tree, Artificial Neural Network
Kelulusan merupakan salah satu item bisa melakukan prediksi terhadap kelulusan
penilaian dalam proses akreditasi institusi suatu mahasiswa. Adapun teknik yang sering
perguruan tinggi. Elemen penilaian pada lulusan digunakan adalah dengan menggunakan data
perguruan tinggi salah satunya adalah perguruan mining. Dan metode yang sering digunakan
tinggi memiliki angka efisien edukasi yang ideal untuk prediksi kelulusan mahasiswa adalah
lulusnya tepat waktu akan membantu penilaian Menurut David Hand, Heikki Mannila,
akreditasi suatu perguruan tinggi. Di sisi lain, dan Padhraic Smyth (dalam Widodo dkk, 2013)
mahasiswa akan beruntung jika lulus tepat data mining adalah analisa terhadap data
waktu karena tidak akan membayar biaya kuliah (biasanya data yang berukuran besar) untuk
lagi dan bisa cepat bekerja setelah lulus kuliah. menemukan hubungan yang jelas serta
selalu dapat dideteksi secara dini, sehingga bisa sebelumnya dengan cara terkini dipahami dan
Prediksi Kelulusan Mahasiswa Tepat Waktu Menggunakan Metode Decision ... ... (Eko Prasetiyo Rohmawan) 21
berguna bagi pemilik data tersebut. Data mining dalam kelas-kelas berdasarkan prediksi waktu
sudah ada sejak lama dan teori-teorinya pun kelulusannya. µShow Centroid¶ GLJXQDNDQ XQWXN
sudah banyak dibahas dalam literatur. Teori-teori PHOLKDW FHQWURLG DNKLU GDUL SURVHV LWHUDVL µShow
tersebut antara lain: Naive-Bayes dan Nearest the Graphic¶ GLJXQDNDQ XQWXN PHQDPSLONDQ
Nighbour, Pohon Keputusan, Aturan Asosiasi, k- posisi tingkDW NHOXOXVDQ PDKDVLVZD µEvaluate
Means Clustering, dan Text Mining (Bramer, the Cluster¶ GLJXQDNDQ XQWXN PHQJKLWXQJ QLODL
2007). Sedangkan perkembangan terkini optimal dari hasil cluster tersebut.
menghadirkan algoritma-algoritma yang baru Penelitian serupa dilakukan Nuqson M.
dikembangkan antara lain: Jaringan Syaraf Huda (2010) yaitu aplikasi data mining untuk
Tiruan (JST), Algoritma Genetik, Fuzzy C- menampilkan informasi tingkat kelulusan
Means, Support Vector Machine (SVM), dan mahasiswa. Dalam penelitian ini kategori tingkat
lain-lain (Daniel, 2006). kelulusan di ukur dari lama studi dan IPK.
Metode klasifikasi merupakan pendekatan Algoritma yang digunakan adalah algoritma
untuk menjalankan fungsi klasifikasi dalam data apriori, informasi yang ditampilkan berupa nilai
mining yaitu menggolongkan data. Teknik support dan confidence dari masing-masing
klasifikasi ini dapat pula digunakan untuk kategori tingkat kelulusan.
melakukan prediksi atas informasi yang belum Dalam penelitian ini penulis akan
diketahui sebelumnya. Beberapa algoritma yang membandingan dua metode data mining yaitu
dapat digunakan antara lain adalah algoritma metode decision tree dan artificial neural
Decision Tree C.45, Artificial Neural Networks network. Kedua metode tersebut sudah banyak
(ANN), K-Nearest Neighbour (KNN), Algoritma digunakan dalam penelitian-penelitian
Naive Bayes, Algoritma Genetik, Rough Set, sebelumnya, antara lain penelitian Andri (2013)
Metode Berbasis Aturan, Memory Based Implementasi Teknik Data mining Untuk
Reasoning, dan Support Vector Machine Memprediksi Tingkat Kelulusan Mahasiswa
(Widodo dkk, 2013). Pada Universitas Bina Darma. Dalam penelitian
Penelitian yang menggunakan data mining tersebut hasil prediksi kelulusan memiliki tingkat
pada data set akademik dan kemahasiswaan telah akurasi di atas 90%. Adapun penelitian yang
banyak dilakukan, antara lain adalah penelitian berkaitan dengan metode artificial neural
yang dilakukan Alvi Syahrin (2013) yaitu network antara lain penelitian yang dilakukan
implementasi algoritma k-Means untuk oleh Kusumawati (2015) Prediksi kelulusan
klasterisasi mahasiswa berdasarkan waktu mahasiswa menggunakan metode neural network
kelulusan. Penelitian ini mengimplementasi dan particle swarm optimation. Dalam penelitian
algoritma K-Means ke dalam studi kasus tersebut tingkat akurasi yang dihasilkan sebesar
tersebut. Aplikasi ini terdiri dari empat fungsi, 87,31%.
\DNQL µ&OXVWHU¶ µShow Centroid¶ µShow the
Graphic¶ GDQ µEvaluate the ClusteU¶ µ&OXVWHU¶
digunakan untuk membagi data mahasiswa ke
Dalam penelitian ini, penulis decision tree dan metode artificial neural
menggunakan dua metode klasifikasi yaitu network secara terpisah, hasilnya akan
Decision Tree dan Artificial Neural Network. dibandingkan untuk melihat yang terbaik
Penulis mencoba membandingkan kedua metode diantara kedua metode tersebut. Dan hasilnya
MULAI
yang digunakan adalah Decision Tree dan
Artificial Neural Network. Data yang digunakan
dalam penelitian ini sebagai berikut:
PREDIKSI KELULUSAN MAHASISWA
TEPAT WAKU MENGGUNAKAN METODE 1) Data training dan data testing
DECISION TREE DAN ARTIFICIAL
NEURAL NETWORK Data ini akan digunakan sebagai proses
mining dan pengujian, berupa sampel data induk
DATA AKADEMIK MAHASISWA dan data akademik mahasiswa angkatan 2006-
2010 yang sudah dinyatakan lulus. Data ini
memiliki atribut NIM, jenis kelamin, asal
sekolah, jalur masuk, nilai ujian nasional, gaji
orang tua, IP semester 1-4, IPK semester 1-4 dan
ARTIFICIAL
DECISION TREE
NEURAL
keterangan lulus.
NETWORK
2) Data target
Data ini merupakan sampel data induk
HASIL PREDIKSI data akademik mahasiswa angkatan 2011-2012
yang diasumsikan belum lulus. Data ini memiliki
atribut NIM, jenis kelamin, asal sekolah, jalur
PENGUJIAN
masuk, nilai ujian nasional, gaji orang tua, IP
SISTEM
semester 1-4, dan IPK semester 1-4. Data ini
akan dijadikan testing berdasarkan data training.
SELESAI
Untuk memperoleh data yang diperlukan,
maka penulis menggunakan beberapa teknik
Gambar 1. Desain Penelitian
pengumpulan data yaitu:
1) Riset Perpustakaan (Library Research), yaitu
Berdasarkan desain penelitian pada
penelitian yang dilakukan dengan cara
gambar 1, prediksi kelulusan mahasiswa
pengumpulan data dengan membaca literatur
dilakukan dengan mengumpulkan data akademik
untuk mencari dan mengetahui teori yang
mahasiswa, selanjutnya data akademik
berhubungan dengan pokok permaslahan
mahasiswa dilakukan praproses data untuk
yang sedang diteliti.
Prediksi Kelulusan Mahasiswa Tepat Waktu Menggunakan Metode Decision ... ... (Eko Prasetiyo Rohmawan) 23
2) Riset lapangan (Field Research), yaitu |S| : Jumlah kasus dalam S
penelitian yang dilakukan dengan cara terjun Sebelum mendapatkan nilai Gain adalah
langsung pada objek yang diteliti untuk mencari nilai Entropy. Entropy digunakan untuk
mendapatkan data-data yang diperlukan baik menentukan seberapa informatif sebuah masukan
dengan cara interview maupun observasi, atribut untuk menghasilkan keluaran atribut.
dimana : Rumus dasar dari Entropy tersebut adalah
a. Observasi yaitu berupa kegiatan sebagai berikut:
pengamatan langsung terhadap objek Entropy (S) = ÃJE=1 FLE Û log2LE ««
yang diteliti. Keterangan:
b. Secondary data yaitu berupa data yang S : himpunan kasus
diperoleh peneliti dai sumber yang A : Fitur
sudah ada. Data yang diperoleh berupa n : jumlah partisi S
time series data yang berupa data pi : proporsi dari Si terhadap S
historis akademik mahasiswa periode Jaringan syaraf tiruan merupakan salah
2009 ± 2011. satu representasi buatan dari otak manusia yang
selalu mencoba untuk mensimulasikan proses
Algoritma decision tree yang digunakan pembelajaran otak manusia tersebut (Andrijasa,
adalah C4.5. secara umum untuk membangun 2010). Jaringan syaraf tiruan tercipta sebagai
pohon keputusan adalah sebagai berikut: suatu generalisasi model matematis dari
a. Pilih atribut sebagai node akar pemahaman manusia (human cognition) yang
b. Buat cabang untuk tiap-tiap nilai didasarkan atas asumsi sebagai:
c. Bagi kasus dalam cabang a. Pemrosesan informasi terjadi pada elemen
d. Ulangi proses untuk setiap cabang sampai sederhana yang disebut neuron.
semua kasus pada cabang memiliki kelas b. Isyarat mengalir diantara sel syaraf (neuron)
yang sama. melalui suatu sambungan penghubung.
Untuk memilih atribut sebagai node akar, c. Setiap sambungan penghubung memiliki
didasarkan pada nilai Gain tertinggi dari atribut- bobot yang bersesuaian
atribut yang ada. Untuk menghitung Gain d. Setiap sel syaraf akan merupakan fungsi
digunakan rumus seperti tertera dalam aktivasi terhadap isyarat hasil penjumlahan
persamaan berikut: Gain (S,A) = Entropy(S) - berbobot yang masuk kepadanya untuk
J
menentuka isyarat keluarannya
Í
|Si |
ÛEntropy (Si) ««
E=1 |S| Adapun pemodelan dengan Jaringan
Keterangan:
Syaraf Tiruan secara umum terdiri dari empat
S : Himpunan kasus
langkah yaitu penyiapan data, pemilihan
A : Atribut
arsitektur, pembelajaran (learning), dan
n : Jumlah partisi atribut A
pengujian (testing).
|Si| : Jumlah kasus pada partisi ke-i
Dalam pengumpulan data terdapat sumber Data yang digunakan dalam penulisan ini
data, sumber data yang dihimpun langsung oleh bernilai kategorial. Data ditransformasikan ke
sedangkan apabila melalui tangan kedua disebut 3) Data size reduction and dicritization, untuk
sumber sekunder. Data yang diperoleh adalah memperoleh data set dengan jumlah atribut
data sekunder karena diperoleh dari database dan record yang lebih sedikit tetapi bersifat
mahasiswa yang dimiliki oleh Universitas informatif. Dalam penelitian ini atribut yang
Dehasen Bengkulu. Data yang dikumpulkan tak relevan seperti nim, nama, tanggal lahir,
adalah data mahasiswa Universitas Dehasen periode masuk, status, IP semester 7, IPK
Bengkulu Program Studi Teknik Informatika semester 7,total SKS semester 7, IP semester
tahun akademik 2009, 2010 dan 2011. Data yang 8, IPK semester 8 dan total SKS semester 8
Prediksi Kelulusan Mahasiswa Tepat Waktu Menggunakan Metode Decision ... ... (Eko Prasetiyo Rohmawan) 25
hubungan tersembunyi antara sejumlah calon semester < 2,5 162 2 160 0,09597
5 >= 2,5 391 183 208 0,997049
variabel input dengan sebuah variabel target. IPK 0,24326
semester < 2,5 207 4 203 0,137626
Karena metode ini memadukan antara eksplorasi 6 >= 2,5 346 181 165 0,998457
SKS 0,06368
data dan pemodelan, maka sangat bagus sebagai total < 40 130 13 117 0,468996
semester >= 40 423 172 251 0,974691
langkah awal dalam proses pemodelan bahkan 2
Gain ratio merupakan varian dari Information gain adalah metode yang
information gain. Metode ini menghasilkan semua entropy dihitung, kemudian atribut
information gain untuk setiap atribut yang dengan entropy minimum yang dipilih untuk
memberikan nilai atribut yang seragam. dilakukan perpecahan pohon (split). Berikut hasil
Berdasarkan pohon keputusan di atas atribut pengujian dengan menggunakan metode decision
semester 6, karena pada tahap penghitungan Tabel 4. Hasil Pengujian Metode Decision
Tree
node awal memiliki gain tertinggi yaitu Accuracy: 74,51
0,276537056. Atribut di bawahnya adalah IPK True True Class
TELAT TEPAT Precision
semester 3 dan IP semester 3, jika IP semester 6 Pred. 73 7 91,25%
lebih dari 2,715 maka akan dilanjutkan ke atribut TELAT
Pred. 32 41 56,16%
IPK semester 3 dan jika IP semester 6 kurang TEPAT
dari 2,715 maka akan dilanjutkan ke atribut IP Class 69,52% 85,42%
recall
semester 3. Kemudian seterusnya sampai ke
simpul TEPAT dan TELAT. Dan berikut ini Berdasarkan hasil pengujian metode
hasil pohon keputusan berdasarkan informatif decision tree, tingkat akurasi yang dihasilkan
gain.
Prediksi Kelulusan Mahasiswa Tepat Waktu Menggunakan Metode Decision ... ... (Eko Prasetiyo Rohmawan) 27
adalah 74.5%. dengan prediksi telat sebesar prediksi telat sebesar 91,11% , dan prediksi tepat
91,25% dan prediksi tepat sebesar 56,16%. sebesar 63,49%
Prediksi Kelulusan Mahasiswa Tepat Waktu Menggunakan Metode Decision ... ... (Eko Prasetiyo Rohmawan) 29
Widodo, dkk. 2013. Penerapan Data mining
dengan MATLAB. Rekayasa Sains.
Bandung.