Abstrak
Seleksi penerimaan mahasiswa dalam sebuah perguruan tinggi menghasilkan data yang melimpah dan
dapat dimanfaatkan untuk memperoleh informasi yang berguna bagi perguruan tinggi. Dalam penelitian
ini, data mahasiswa yang diambil oleh penulis adalah nomor induk mahasiswa, jalur masuk perguruan
tinggi, pendapatan orang tua dan indeks prestasi komulatif. Penggalian informasi pada sebuah data
berukuran besar tidak dapat dilakukan dengan mudah dan hal ini bisa dilakukan dengan teknologi data
mining. Data mining yang disebut juga dengan Knowledge Discovery in Database adalah sebuah proses
secara otomatis atas pencarian data didalam sebuah memori yang amat besar dari data untuk mengetahui
pola dengan menggunakan alat seperti klasifikasi hubungan (association) atau pengelompokan
(clustering). Dengan menggunakan metode k-means clustering, peneliti mencoba untuk mengekstrak
pengetahuan yang bisa menggambarkan kinerja prestasi akademik mahasiswa pada akhir semester dan
hasil dari penelitian tersebut menunjukkan bahwa dari semua jumlah cluster yang dimasukkan, untuk
cluster yang berjumlah 3 memiliki nilai silhouette coefficient yang paling mendekati nilai Si = 1, yaitu
dengan nilai 0,108690751. Selain itu pendapatan orang tua tidak mempengaruhi tingkat kinerja
akademik mahasiswa dan nilai akademis mahasiswa yang masuk melalui jalur reguler & jalur prestasi
akademik mempunyai nilai IPK rata-rata tertinggi. Sehingga, pihak fakultas dapat mempertimbangkan
untuk lebih memprioritaskan penerimaan mahasiswa baru melalui jalur reguler & prestasi akademik.
Kata Kunci : data mahasiswa, data mining, k-means clustering, jalur penerimaan mahasiswa
Abstract
Selection of student acceptance in a college produces abundant data and can be utilized to obtain useful
information for the college. In this study, student data taken by the authors are Student ID Number,
University Entrance Path, Parent Revenue and Student Achievement Index. Excavation of information
on a large data could not be done easily and this can be done with data mining technology. Data mining
also known as Knowledge Discovery in Database is an automated process of searching data in a very
large memory of data to know patterns by using tools such as association or clustering. By using k-
means clustering method, the researcher tries to extract the knowledge which can depict the
performance of student achievement at the end of semester and the result of the research indicates that
of all cluster quantities inserted, for clusters amounting to 3 (three) has the value of silhouette coefficient
closest to the value of 𝑆𝑖 = 1, that is with the value of 0.108690751. In addition, parental income does
not affect the level of academic performance of students and the academic value of students who enter
through the regular path & achievement paths have the value of the highest average GPA. Thus, the
faculty can consider to prioritize the acceptance of new students through regular channels &
achievement contract.
Keywords : student data, data mining, k-means clustering, student admission path
pada umumnya perguruan tinggi akan merupakan proses pengekstrakan informasi dari
memberikan soal-soal test yang harus calon jumlah kumpulan data yang besar dengan
mahasiswa selesaikan, yang bertujuan untuk menggunakan algoritma dan teknik gambar
mengetahui kemampuan dan pengetahuan statistic, mesin pembelajaran dan sistem
mereka. Setelah tahap seleksi selesai dan calon manajemen database (HAN, J & Kamber, M.
mahasiswa diterima dan mengalami proses 2001).
belajar mengajar, maka akan diketahui prestasi Data mining yang disebut juga dengan
mahasiswa disetiap akhir semester. Hal ini akan Knowledge Discovery in Database (KDD)
terjadi secara berulang pada sebuah perguruan adalah sebuah proses secara otomatis atas
tinggi setiap tahunnya, sehingga akan pencarian data didalam sebuah memori yang
menghasilkan banyak sekali data mahasiswa amat besar dari data untuk mengetahui pola
yang apabila diolah akan dapat memberikan dengan menggunakan alat seperti klasifikasi
informasi yang bermanfaat bagi pihak hubungan (association) atau pengelompokan
perguruan tinggi. (clustering). Untuk itu data mining dapat
Institusi pendidikan adalah bagian penting digunakan untuk mengevaluasi kinerja siswa.
dalam masyarakat dan memainkan peranan Dengan menggunakan algoritma yang ada
yang penting dalam pertumbuhan dan dalam data mining, dicoba untuk mengekstrak
pembangunan suatu bangsa. Selain itu institusi pengetahuan yang bisa menggambarkan kinerja
pendidikan juga berperan untuk mengontrol dan siswa pada akhir semester. Hasil ekstraksi ini
melakukan evaluasi serta prediksi prestasi dapat digunakan untuk membantu dalam
akademik siswanya. Prestasi akademik siswa mengidentifikasi siswa yang mungkin akan
dapat didasarkan pada berbagai faktor seperti putus sekolah dan membantu siswa yang
kepribadian, lingkungan sosial serta psikologi membutuhkan perhatian khusus serta
dari siswa tersebut. Educational data mining mengantisipasi keadaan tersebut dengan
mengimplementasikan algoritma data mining memberikan seorang profesor yang tepat untuk
untuk menemukan pengetahuan dari data yang membantu menasehati dan membimbing para
berasal dari domain pendidikan. Hasil siswa (Chuchra, R. 2012).
penelitian ini menyebutkan bahwa data mining Pada penelitian ini analisa data mining
dapat digunakan sebagai tool pengambilan dilakukan dengan menggunakan metode k-
suatu keputusan yang dapat menemukan suatu means clustering. Adapun alasan penggunaan
pengetahuan dari sejumlah besar data yang bisa metode k-means clustering adalah karena
digunakan dalam menilai prestasi siswa metode k-means clustering mampu
(Tiwari, M. Singh, R. Vimal, N. 2013). Dalam mengelompokkan data mahasiswa dengan
penelitian ini, data mahasiswa yang diambil kriteria yang bisa menjadi acuan untuk
oleh penulis adalah jenis kelamin, angkatan, mengetahui bagaimana kinerja akademik
asal sekolah (SMA / Sederajat), jalur masuk mahasiswa tersebut. K-means clustering juga
perguruan tinggi, pekerjaan orang tua, mampu mengelompokkan data dengan
penghasilan orang tua, penghasilan tambhan memaksimalkan kemiripan data antar cluster
orangtua, asal daerah, jumlah mata kuliah yang dan meminimalkan kemiripan data antar
diulang, jumlah mata kuliah semester pendek cluster, dimana ukuran kemiripan yang
yang diambil mahasiswa, indeks prestasi lulus digunakan dalam cluster adalah fungsi jarak,
dan beban per semster, jumlah SKS lulus dan sehingga pemaksimalan kemiripan data
beban per semester, jumlah mata kuliah lulus didapatkan berdasarkan jarak terpendek antara
dan beban per semester, Indeks prestasi data terhadap titik pusat. Dengan menggunakan
komulatif lulus dan beban per semester, jumlah metode ini, data-data yang telah didapatkan
SKS komulatif lulus dan beban per semester, dapat dikelompokkan kedalam beberapa cluster
jumlah mata kuliah komulatif lulus dan beban berdasarkan kemiripan dari data-data tersebut,
per semester, jumlah kehadiran mahasiswa per sehingga data-data yang memiliki karakteristik
semester. yang sama akan dikelompokkan dalam satu
Penggalian informasi pada sebuah data cluster dan yang memiliki karakteristik yang
berukuran besar tidak dapat dilakukan dengan berbeda akan dikelompokkan dalam cluster lain
mudah dan salah satu alat bantu yang dapat yang memiliki karakteristik yang sama (Ong, J
digunakan untuk menemukan pengetahuan / O. 2013).
informasi yang tersembunyi dalam database Dengan adanya pengelompokan data
adalah teknologi data mining. Data mining tersebut diharapkan dapat mengetahui kinerja
4. IMPLEMENTASI
Selesai
5.1 Pengujian
Pengujian dilakukan terhadap semua data
Gambar 3. Implementasi Halaman Algoritma mahasiswa dengan memasukkan beberapa titik
pusat yang kemudian dihitung nilai silhouette
4.3.3 Halaman Proses Clustering coefficien dari setiap titik pusat yang
Antarmuka halaman proses clustering dimasukkan tersebut. Berikut adalah tabel
merupakan halaman dimana pemprosesan proses pengujian terhadap data mahasiswa
dengan memasukkan tujuh cluster yang Cluster 1 terdiri dari 21 mahasiswa, dengan
berbeda seperti yang ditunjukkan pada Tabel 3. deskripsi sebagai berikut :
Tabel 3. Hasil Pengujian
a. Jalur masuk perguruan tinggi :
1) Minat dan kemampuan : 9
Jumlah Cluster Silhouette Coefficient mahasiswa
3 0,108690751 2) UB IV : 7 mahasiswa
4 -0,06494322 3) Jalur Prestasi Non Akademik : 5
5 -0,079308 mahasiswa
6 -0,08930547 b. Pendapatan orang tua :
7 -0,06812677 1) ≤1jt : 2 mhs
8 -0,07658779 2) >1jt s/d ≤2jt : 2 mhs
9 -0,10394574 3) >2jt s/d ≤3jt : 3 mhs
Dari tabel data hasil pengujian diatas 4) >3t s/d ≤4jt : 2 mhs
dapat dipetakan menjadi grafik hasil pengujian 5) >4jt s/d ≤5jt : 2 mhs
seperti ditunjukkan pada gambar 6. 6) >6jt s/d ≤7jt : 2 mhs
7) >7jt s/d ≤8jt : 2 mhs
8) >8jt s/d ≤9jt : 1 mhs
Grafik Hasil 9) >10jt : 5 mhs
c. Dengan rata-rata nilai IPK : 2.731
Pengujian 2. Pada hasil perhitungan di cluster 2, terlihat
0,10869
- - - - - - bahwa karakteristik mahasiswa pada cluster
0751
0,06494
0,07930 0,06812
0,08930 0,07658
0,10394 2 tidak ada jalur masuk perguruan tinggi
3 32174 5 6 7 8 9 yang mendominasi.
8003 547 6768 7792 5736
Cluster 2 terdiri dari 7 mahasiswa, dengan
Nilai Si deskripsi sebagai berikut :
a. Jalur masuk perguruan tinggi :
1) Kemitraan Instansi : 2 mhs
Gambar 6. Grafik Hasil Pengujian
2) Kemitraan Daerah : 2 mhs
3) Alih Program : 2 mhs
5.2 Analisis
4) Program Khusus Penyandang
Analisa yang dilakuan adalah dengan Disabilitas : 1 mhs
memilih salah satu dari ketujuh inputan yang b. Dari pendapatan orang tua :
dimasukkan tersebut dengan melihat nilai 1) ≤1jt : 1 mhs
silhouette coefficien yang terbaik. Nilai 2) >1jt s/d ≤2jt : 1 mhs
silhoutte dapat dikatakan baik apabila bernilai 3) >2jt s/d ≤3jt : 1 mhs
positif, hal ini berarti titik sudah berada di 4) >3t s/d ≤4jt : 1 mhs
dalam cluster yang tepat. Sedangkan jika 5) >10jt : 3 mhs
nilainya negative ini menandakan terjadinya c. Dengan rata-rata nilai IPK : 2.8775
overlapping sehingga titik berada di antara dua 3. Pada hasil perhitungan di cluster 3, terlihat
cluster. bahwa karakteristik mahasiswa pada cluster
Pada pengujian diatas bisa dilihat dan 3 terdiri dari mahasiswa yang masuk
diamati bahwa dari semua jumlah cluster yang melalui jalur Reguler dan Jalur Prestasi
dimasukkan untuk cluster yang berjumlah 3 Akademik.
(tiga) memiliki nilai silhouette coefficien yang
Cluster 3 terdiri dari 40 mahasiswa, dengan
paling mendekati nilai Si = 1, yaitu dengan nilai
deskripsi sebagai berikut :
0,108690751.
a. Jalur masuk perguruan tinggi :
Pada saat cluster terbagi menjadi 3 titik
1) Jalur Prestasi Akademik: 20 mhs
pusat diketahui bahawa:
2) Reguler : 20 mhs
1. Pada hasil perhitungan di cluster 1, terlihat b. Dari pendapatan orang tua :
bahwa karakteristik mahasiswa pada cluster 1) ≤1jt : 8 mhs
1 didominasi oleh mahasiswa dengan jalur 2) >1jt s/d ≤2jt : 5 mhs
masuk perguruan tinggi melalui Minat dan 3) >2jt s/d ≤3jt : 6 mhs
Kemampuan. 4) >3t s/d ≤4jt : 4 mhs
5) >4jt s/d ≤5jt : 4 mhs
6) >5jt s/d ≤6jt : 1 mhs Santoso, Budi. 2007. Data Mining: Teknik
7) >6jt s/d ≤7jt : 3 mhs Pemanfaatan Data untuk Keperluan
8) >7jt s/d ≤8jt : 3 mhs Bisnis. Graha Ilmu, Yogyakarta.
9) >8jt s/d ≤9jt : 1 mhs
Suyanto. 2000. IPS Ekonomi I. Gelora Aksara
10) >9jt s/d ≤10jt : 2 mhs
Pratama. Jakarta.
11) >10jt : 3 mhs
c. Dengan rata-rata nilai IPK : 3.471 Tiwari, M. Singh, R. Vimal, N. 2013. An
Empirical Study of Data Mining
6 KESIMPULAN Techniques for Predicting Student
Performance in Higher Education,
Kesimpulan yang dapat diambil dari
IJCSMC, Vol. 2, Issue 2.
penelitian tentang implementasi algoritma k-
means dalam menentukan klasterisasi kinerja Yuliana, Sudremi. 2007. Pengetahuan Sosial
akademik mahasiswa adalah sebagai berikut: Ekonomi Kelas X. BumiAksara. Jakarta.
1. Dari hasil 7 kali pengujian terhadap jumlah
Yusuf, S. 2012. Psikologi Perkembangan Anak
titik pusat dengan nilai 3, 4, 5, 6, 7, 8 dan 9
dan Remaja. Remaja Rosdakarya.
titik pusat, yang berjumlah 3 memiliki nilai
Bandung.
silhouette coefficien yang paling mendekati
nilai Si = 1, yaitu dengan nilai 0,108690751.
2. Setelah proses pengolahan data, hasil
clustering menunjukkan bahwa pendapatan
orang tua tidak mempengaruhi tingkat
kinerja akademik mahasiswa.
3. Nilai akademis mahasiswa yang masuk
perguruan tinggi melalui jalur reguler dan
jalur prestasi akademik mempunyai nilai
IPK rata-rata tertinggi
DAFTAR PUSTAKA
Chuchra, Rimmy. 2012, Use of Data Mining
Techniques for The Evaluation of
Student Performance : A Case Study,
International Journal of Computer
Science and Management Research, Vol
1.
Han, Jiawei; & Kamber, Micheline. 2001. Data
Mining Concepts and Techniques Second
Edition. San Francisco: Morgan
Kauffman
Hartaji, Damar Adi. 2012. Motivasi Berprestasi
Pada Mahasiswa yang Berkuliah Dengan
Jurusan Pilihan Orang tua. Fakultas
Psikologi Universitas Gunadarma.
Nuningsih, S. 2010. K-Means Clustering (Studi
Kasus Pada Data Pengujian Kualitas
Susu di Koperasi Peternakan Bandung
Selatan. Skripsi FPMIPA UPI, Bandung.
Ong, Johan Oscar. 2013. Implementasi
Algoritma K-Means Clustering Untuk
Menentukan Strategi Marketing
President University(12):10-20.