Abstrak : Kelulusan mahasiswa tepat waktu merupakan salah satu penilaian dalam proses
akreditasi perguruan tinggi. Permasalahannya adalah bagaimana mengetahui mahasiswa nantinya
bisa lulus tepat waktu atau tidak. Dalam penelitian ini fokus pada bagaimana prediksi kelulusan
mahasiswa tepat waktu dengan data mining menggunakan algoritma decision tree dan artificial
neural network. Penilitian ini menggunakan data mahasiswa yang sudah dinyatakan lulus sebagai
data training dan mahasiswa yang belum lulus sebagai data testing. Penelitian ini bertujuan untuk
mengetahui kelulusan mahasiswa tepat waktu atau tidak, yang diharapkan hasilnya dapat
memberikan informasi dan masukan bagi pihak perguruan tinggi dalam membuat kebijakan demi
perbaikan di masa yang akan datang.
Kata Kunci : Kelulusan, Data Mining, Decision Tree, Artificial Neural Network
penilaian dalam proses akreditasi institusi suatu mengatasi hal tersebut perlu ada teknik untuk
perguruan tinggi. Elemen penilaian pada lulusan bisa melakukan prediksi terhadap kelulusan
perguruan tinggi salah satunya adalah perguruan mahasiswa. Adapun teknik yang sering
tinggi memiliki angka efisien edukasi yang ideal digunakan adalah dengan menggunakan data
(BANPT, 2007). Sehingga jika mahasiswa mining. Dan metode yang sering digunakan
lulusnya tepat waktu akan membantu penilaian untuk prediksi kelulusan mahasiswa adalah
mahasiswa akan beruntung jika lulus tepat Menurut David hand, Heikki Mannila, dan
waktu karena tidak akan membayar biaya kuliah Padhraic Smyth dalam Widodo, Handayanto dan
lagi dan bisa cepat bekerja setelah lulus kuliah. Herlawati (2013) data mining adalah analisa
terhadap data (biasanya data yang berukuran
Prediksi kelulusan mahasiswa tepat waktu menggunakan metode desicion ... ... (Eko Prasetiyo Rohmawan ) 21
besar) untuk menemukan hubungan yang jelas yakni ‘Cluster’, ‘Show Centroid’, ‘Show the
serta menyimpulkannya yang belum diketahui Graphic’, dan ‘Evaluate the Cluster’. ‘Cluster’
sebelumnya dengan cara terkini dipahami dan digunakan untuk membagi data mahasiswa ke
berguna bagi pemilik data tersebut. Data mining dalam kelas-kelas berdasarkan prediksi waktu
sudah ada sejak lama dan teori-teorinya pun kelulusannya. ‘Show Centroid’ digunakan untuk
sudah banyak dibahas dalam literatur. Teori-teori melihat centroid akhir dari proses iterasi. ‘Show
tersebut antara lain: Naive-Bayes dan Nearest the Graphic’ digunakan untuk menampilkan
Nighbour, Pohon Keputusan, Aturan Asosiasi, k- posisi tingkat kelulusan mahasiswa. ‘Evaluate
Means Clustering, dan Text Mining (Bramer, the Cluster’ digunakan untuk menghitung nilai
2007). Sedangkan perkembangan terkini optimal dari hasil cluster tersebut.
menghadirkan algoritma-algoritma yang baru Penelitian serupa dilakukan Nuqson M.
dikembangkan antara lain: Jaringan Syaraf Huda (2010) yaitu aplikasi data mining untuk
Tiruan (JST), Algoritma Genetik, Fuzzy C- menampilkan informasi tingkat kelulusan
Means, Support Vector Machine (SVM), dan mahasiswa. Dalam penelitian ini kategori tingkat
lain-lain (Daniel, 2006). kelulusan di ukur dari lama studi dan IPK.
Metode klasifikasi merupakan pendekatan Algoritma yang digunakan adalah algoritma
untuk menjalankan fungsi klasifikasi dalam data apriori, informasi yang ditampilkan berupa nilai
mining yaitu menggolongkan data. Teknik support dan confidence dari masing-masing
klasifikasi ini dapat pula digunakan untuk kategori tingkat kelulusan.
melakukan prediksi atas informasi yang belum Dalam penelitian ini penulis akan
diketahui sebelumnya. Beberapa algoritma yang membandingan dua metode data mining yaitu
dapat digunakan antara lain adalah algoritma metode decision tree dan artificial neural
Decision Tree C.45, Artificial Neural Networks network. Kedua metode tersebut sudah banyak
(ANN), K-Nearest Neighbour (KNN), Algoritma digunakan dalam penelitian-penelitian
Naive Bayes, Algoritma Genetik, Rough Set, sebelumnya, antara lain penelitian Andri (2013)
Metode Berbasis Aturan, Memory Based Implementasi Teknik Data Mining Untuk
Reasoning, dan Support Vector Machine Memprediksi Tingkat Kelulusan Mahasiswa
(Widodo dkk., 2013). Pada Universitas Bina Darma. Dalam penelitian
Penelitian yang menggunakan data mining tersebut hasil prediksi kelulusan memiliki tingkat
pada data set akademik dan kemahasiswaan telah akurasi di atas 90%. Adapun penelitian yang
banyak dilakukan, antara lain adalah penelitian berkaitan dengan metode artificial neural
yang dilakukan Alvi Syahrin (2013) yaitu network antara lain penelitian yang dilakukan
implementasi algoritma k-Means untuk oleh Kusumawati (2015) Prediksi kelulusan
klasterisasi mahasiswa berdasarkan waktu mahasiswa menggunakan metode neural network
kelulusan. Penelitian ini mengimplementasi dan particle swarm optimation. Dalam penelitian
algoritma K-Means ke dalam studi kasus tersebut tingkat akurasi yang dihasilkan sebesar
tersebut. Aplikasi ini terdiri dari empat fungsi, 87,31%.
Dalam penelitian ini teknik data mining persamaan berikut: Gain (S,A) = Entropy(S) -
gaji orang tua, IP semester 1-4, dan IPK Jaringan syaraf tiruan merupakan salah satu
semester 1-4. Data ini akan dijadikan representasi buatan dari otak manusia yang
Algoritma decision tree yang digunakan pembelajaran otak manusia tersebut (M.F.
adalah C4.5. secara umum untuk membangun Andrijasa, 2010). Jaringan syaraf tiruan tercipta
pohon keputusan adalah sebagai berikut: sebagai suatu generalisasi model matematis dari
1. Pilih atribut sebagai node akar pemahaman manusia (human cognition) yang
4. Ulangi proses untuk setiap cabang sampai sederhana yang disebut neuron.
semua kasus pada cabang memiliki kelas 2. Isyarat mengalir diantara sel syaraf
didasarkan pada nilai Gain tertinggi dari atribut- 3. Setiap sambungan penghubung memiliki
Prediksi kelulusan mahasiswa tepat waktu menggunakan metode desicion ... ... (Eko Prasetiyo Rohmawan ) 23
bobot yang bersesuaian data yang tidak konsisten dan data yang
4. Setiap sel syaraf akan merupakan fungsi tidak lengkap (missing value).
aktivasi terhadap isyarat hasil penjumlahan 2. Data integration and transformation, untuk
berbobot yang masuk kepadanya untuk meningatkan akurasi dan efisiensi
menentuka isyarat keluarannya algoritma. Data yang digunakan dalam
Adapun pemodelan dengan Jaringan Syaraf penulisan ini bernilai kategorial. Data
Tiruan secara umum terdiri dari empat langkah ditransformasikan ke dalam software
yaitu: RapidMiner.
1. Penyiapan data 3. Data size reduction and dicritization, untuk
2. Pemilihan arsitektur memperoleh data set dengan jumlah atribut
3. Pembelajaran (learning) dan record yang lebih sedikit tetapi bersifat
4. Pengujian (testing) informatif. Dalam penelitian ini atribut yang
tak relevan seperti nim, nama, tanggal lahir,
periode masuk, status, IP semester 7, IPK
3. HASIL semester 7,total SKS semester 7, IP
semester 8, IPK semester 8 dan total SKS
data, sumber data yang dihimpun langsung oleh Setelah dilakukan tahapan data preparation,
peneliti disebut dengan sumber primer, total data berkurang menjadi 553 record.
sedangkan apabila melalui tangan kedua disebut Adapun rekap data berdasarkan jenis kelamin,
sumber sekunder. Data yang diperoleh adalah angkatan dan keterangan lulus tepat atau
mahasiswa yang dimiliki oleh Universitas Tabel 1. Rekapitulasi data mahasiswa lulus
tepat dan terlambat berdasarkan angkatan
Dehasen Bengkulu. Data yang dikumpulkan
dan jenis kelamin setelah data preparation
adalah data mahasiswa Universitas Dehasen Jenis kelamin
Angkat Laki-Laki Perempuan Jumla
Bengkulu Program Studi Teknik Informatika an h
Tep Terlamb Tep Terlamb
tahun akademik 2009, 2010 dan 2011. at at at at
2009 33 91 28 26 178
Jumlah data awal yang diperoleh dari 2010 31 89 34 31 185
pengumpulan data yaitu sebanyak 600 data, 2011 23 103 36 28 190
87 283 98 85 553
namun tidak semua data dapat digunakan dan Sumber: hasil pengolahan data mahasiswa setelah
pengolahan data awal
tidak semua atribut digunakan karena harus
melalui beberapa tahap pengolahan data awal 3.1. Proses Pohon Keputusan (Decision
(preparation data). Untuk mendapatkan data Tree)
yang berkualitas, beberapa teknik yang
dilakukan adalah sebagai berikut: Proses pengklasifikasian data menggunakan
1. Data validation, untuk mengidentifikasi dan metode decison tree ini untuk mengetahui
menghapus data yang ganjil (outlier/noise),
Prediksi kelulusan mahasiswa tepat waktu menggunakan metode desicion ... ... (Eko Prasetiyo Rohmawan ) 25
IPK 0,1 100 589
semeste 93 8
r4 70 SKS 0,1
< 179 4 175 0,15 total 80
2,5 441 semeste 00
9 r6 < 158 2 156 0,09
>= 374 181 193 0,99 120 794
2,5 925 1
7 >= 395 183 212 0,99
IPK 0,1 120 610
semeste 86 8
r5 41 Sumber: hasil pengolahan data decision tree
< 162 2 160 0,09
2,5 597
>= 391 183 208 0,99 3.2 Metode Artificial Neural Network
2,5 704
9
IPK 0,2
semeste 43
Metode kedua yang digunakan adalah
r6 26 Artificial Neural Network. Dan algoritma yang
< 207 4 203 0,13
2,5 762 digunakan adalah Backpropagation. Atribut
6
masukan yang digunakan sama dengan atribut
>= 346 181 165 0,99
2,5 845 pada Decision Tree.
7
SKS 0,0
total 63 3.3 Implementasi Metode Decision Tree
semeste 68
r2 < 40 130 13 117 0,46 dengan RapidMiner
899
6
>= 423 172 251 0,97 Implementasi dengan metode decision tree,
40 469 variabel yang digunakan adalah: jenis kelamin,
1
SKS 0,1 IP semester 1, IPK semester 1, total sks semester
total 56
semeste 79 1, semester 2, IP semester 2, IPK semester 2,
r3 < 60 143 2 141 0,10 total sks semester 2, semester 3, IP semester 3,
618
8 IPK semester 3, total sks semester 3, semester 4,
>= 410 183 227 0,99
IP semester 4, IPK semester 4, total sks semester
60 167
6 4, semester 5, IP semester 5, IPK semester 5,
SKS 0,1
total 76 total sks semester 5, semester 6, IP semester 6,
semeste 83 IPK semester 6, total sks semester 6, keterangan
r4 < 80 156 2 154 0,09
895 (tepat/telat).
9
>= 397 183 214 0,99
80 559
7
SKS 0,1
total 86
semeste 98
r5 < 155 1 154 0,05
100 622
>= 398 184 214 0,99
Gain ratio merupakan varian dari Information gain adalah metode yang
information gain. Metode ini menghasilkan semua entropy dihitung, kemudian atribut
information gain untuk setiap atribut yang dengan entropy minimum yang dipilih untuk
memberikan nilai atribut yang seragam. dilakukan perpecahan pohon (split). Berikut hasil
Berdasarkan pohon keputusan di atas atribut pengujian dengan menggunakan metode decision
semester 6, karena pada tahap penghitungan Tabel 3. hasil pengujian metode decision tree
Prediksi kelulusan mahasiswa tepat waktu menggunakan metode desicion ... ... (Eko Prasetiyo Rohmawan ) 27
3.4. Implementasi Metode Artificial Neural 3.5. Perbandingan hasil pengujian antara
Network dengan RapidMiner metode Decision Tree dan Artificial
Neural Network
Berikut hasil dari proses metode artificial
neural network dengan RapidMiner: Berdasarkan hasil dua pengujian
Tabel 4. Bobot dari unit output sebelumnya, berikut rekap perbandingan antara
CLASS metode decision tree dan artificial neural
NODE TEPAT TELAT
network.
Node 1 2.300 -2.270
Node 2 2.593 -2.596 Tabel 6. Perbandingan hasil pengujian
Node 3 1.693 -1.719 Metode Accuracy
Node 4 1.745 -1.770
Decision Tree 74,51%
Node 5 3.006 -2.999
1.781 -1.780 Neural Network 79,74%
Node 6
Node 7 3.239 -3.246
Node 8 2.334 -2.344
Berdasarkan tabel 6, prediksi kelulusan
Node 9 1.642 -1.658
1.789 -1.786
mahasiswa tepat waktu dengan menggunakan
Node 10
Node 11 1.772 -1.713 metode Artificial Neural Network memiliki
Node 12 5.488 -5.479 tingkat accuracy yang lebih tinggi jika
Threshold -1.809 1.809
dibandingkan dengan metode decision tree yaitu
Dan berikut hasil pengujian dengan : 79,74%.
menggunakan neural network
Tabel 5. Hasil pengujian metode artificial 3.6. Analisis Perbandingan hasil pengujian
neural network
antara metode Decision Tree dan
Accuracy: 79,74
Artificial Neural Network
True True class
TELAT TEPAT precision
Pred. 82 8 91,11%
TELAT Berdasarkan hasil pengujian di atas, dalam
Pred. 23 40 63,49% penelitian ini metode artificial neural network
TEPAT
memiliki tingkat akurasi sedikit lebih tinggi jika
Class 78,10% 83,33%
recall dibandingkan dengan metode decision tree.
Ada beberapa analisis yang menyebabkan
Hasil pengujian dengan menggunakan metode artificial neural network memiliki
neural network menunjukkan bahwa accuracy akurasi lebih tinggi, antara lain sebagai berikut:
yang dihasilkan adalah 79,74%, dengan rincian a. Dilihat dari karakteristik masing-masing
prediksi telat sebesar 91,11% , dan prediksi tepat metode. Metode decision tree bersifat
sebesar 63,49% eksploratif, metode ini akan mengeksplorasi
semua atribut yang terdapat dalam data. Dan
hasil yang didapatkan rata-rata lebih stabil.
4. SIMPULAN
Prediksi kelulusan mahasiswa tepat waktu menggunakan metode desicion ... ... (Eko Prasetiyo Rohmawan ) 29
DAFTAR RUJUKAN