890 921 1 PB
890 921 1 PB
Narwati
Dosen Fakultas Teknologi Informasi
1. PENDAHULUAN
2. DASAR TEORI
Seleksi masuknya mahasiswa dalam sebuah perguruan tinggi
umumnya dengan memberikan soal-soal test yang harus 2.1 Data Mining
mereka kerjakan, untuk mengetahui Data mining merupakan proses pengekstrakan
kemampuan dan pengetahuan mereka. Setelah informasi dari jumlah kumpulan data yang besar dengan
mahasiswa mengalami proses belajar mengajar, maka menggunakan algoritma dan tehnik gambar dari statistik,
akan dapat diketahui prestasi mereka setiap akhir mesin pembelajaran dan sistem manajemen database [2].
semester. Hal ini akan terjadi secara berulang pada Data mining yang disebut juga dengan Knowledge-
sebuah perguruan tinggi. Jumlah data yang banyak ini Discovery in Database (KDD) adalah sebuah proses
membuka peluang untuk dihasilkan informasi yang secara otomatis atas pencarian data di dalam sebuah
berguna bagi pihak universitas. memori yang amat besar dari data untuk mengetahui pola
Penggalian informasi pada sebuah data yang dengan menggunakan alat seperti klasifikasi,
berukuran besar (mempunyai jumlah record dan jumlah hubungan (association) atau pengelompokan
field yang cukup banyak) tidak dapat dilakukan dengan (clustering).
mudah. Teknologi data mining merupakan salah satu alat Secara sederhana, data mining dapat diartikan sebagai
bantu untuk penggalian data pada basis data berukuran proses mengekstrak atau menggali pengetahuan yang
besar dan dengan spesifikasi tingkat kerumitan yang ada pada sekumpulan data. Banyak orang yang setuju
telah banyak digunakan pada banyak domain aplikasi bahwa data mining adalah sinonim dari Knowledge-
seperti perbankan maupun bidang telekomunikasi [1]. Discovery in Database atau yang biasa disebut KDD.
Algoritma K-Means merupakan algoritma teknik Dari sudut pandang yang lain, data mining dianggap
klustering yang berulang-ulang. Algoritma ini dimulai sebagai satu langkah yang penting didalam proses KDD.
dengan pemilihan secara acak K, yang merupakan Menurut Han, J. and Kamber, M, 2001, proses KDD ini
banyaknya kluster yang ingin dibentuk. Kemudian terdiri dari langkah-langkah sebagai berikut :
1. Data Cleaning, proses menghapus data yang digunakan formula Euclidean [2] seperti pada persamaan
tidak konsisten dan kotor (1), yaitu:
2. Data Integration, penggabungan beberapa m
sumber data d xc
2
..(1)
ik ij kj
3. Data Selection, pengambilan data yang akan j 1
benar.
Jumlah Kluster 1.1 Nilai Test
3.3 Implementasi/Coding Us er
Statistik
Proses
Klus tering
terkluster
IPK
Data
Mahasisw a
Mahasisw a
Pengelompokan
data berdasarkan
jarak terdekat
Tidak
EOF
Ya
Perubahan
centroid kluster
baru
Adakah data Ya
yang berpindah
Tidak
Selesai
Gambar 8. Output anggota kluster pada grafik Setelah 8 semester berjalan kemampuan mahasiswa
Histogram induk nilai test dan cabangnya dapat dilihat dari IPK yang dicapai. Sebanyak
90(9,615%) mahasiswa masuk kluster 1, 360 (38,462%)
mahasiswa masuk kluster 2 dan sebanyak 486(51,922%)
mahasiswa masuk kluster 3. Hal ini berarti ada
perubahan kemampuan mahasiswa antara
saat masuk kuliah dan setelah 8 semester berjalan. 5. Mahasiswa yang meningkat klusternya dari kluster 1
Apabila dilihat dari prosentase jumlah mahasiswa setiap ke kluster 3 mempunyai prosentase yang cukup kecil,
program studi, maka KA menempati urutan pertama sedangkan kenaikan jumlah prosentase terbanyak
dengan jumlah mahasiswa sebanyak 63 dari 78 adalah dari kluster 2 ke kluster 3. Hal ini berarti
mahasiswa (80,79%) berada di kluster 3. Hasil ini bahwa proses belajar mengajar bagi mahasiswa yang
menunjukkan bahwa kemampuan mahasiswa dari kemampuanya berada pada kluster 1 harus lebih
program studi KA adalah paling unggul dibandingkan ditingkatkan.
program studi lainnya. Untuk jenis SLTA dari Umum 6. Mahasiswa yang turun klusternya, paling tinggi
adalah yang paling unggul dan untuk asal SMA prosentasenya adalah dari kluster 3 ke kluster 2.
Semarang menempati tempat tertinggi dibanding yang Prosentase tertinggi untuk program studi adalah Tek-
lainnya. Untuk lebih jelasnya dapat dilihat pada tabel 2. Kom yang mengalami penurunan prosentase paling
banyak sebesar 40% dari jumlah mahasiswa yang
Tabel 2. Rekapitulasi Jumlah Mahasiswa Untuk Setiap Kluster ada..
dan Perubahannya
Kluster 1 2 3
DAFTAR PUSTAKA
Nilai Test 116 363 457
IPK 90 360 486
Tetap Pada 22 146 254 [1]. Jananto, Arief. 2010. Memprediksi Kinerja
Naik Kluster 1 ke 2 1 ke 3 2 ke 3 Mahasiswa Menggunakan Teknik Data Mining
52 42 190 (Studi kasus data akademik mahasiswa UNISBANK.
Turun Kluster 3 ke 2 3 ke 1 2 ke 1 Tesis Tidak Terpublikasi. Yogyakarta: Universitas
162 41 27
Gajah Mada.
5. KESIMPULAN [2].Han, Jiawei; & Kamber, Micheline. 2001. Data
Mining Concepts and Techniques Second Edition.
Dari hasil pembuatan aplikasi dapat disimpulkan hal-
hal sebagai berikut ; San Francisco: Morgan Kauffman.
1. Program aplikasi menghasilkan pola dari prestasi [3].Giyanto, Heribertus. 2008. Penerapan algoritma
mahasiswa yang klusternya tetap, turun dan naik. Clustering K-Means, K-Medoid, Gath Geva. Tesis
Pola mahasiswa tersebut dapat terlihat dari asal Tidak Terpublikasi. Yogyakarta: Universitas Gajah
program studi, asal kota dan asal SMA. Mada.
2. Pada hasil kluster untuk nilai tes prosentase terbesar [4].Tan, P; Steinbach; & Kumar, V. 2006. Introduction
adalah mahasiswa yang masuk kluster 3, dan ini to Data Mining. Pearson Education.
berarti bahwa sebagian mahasiswa yang masuk ke [5].Budiarti, Andina.; Sucahyo, Giri, Yudho.; &
Universitas ini adalah mempunyai kemampuan yang
tinggi berdasarkan hasil tes Ruldeviyani, Yova. 2006. Studi Karakteristik
3. Setelah mahasiswa menempuh kuliah selama 6 Kelulusan Peserta Didik Dengan Teknik Clustering.
semester untuk program diploma-3 dan 8 semester Seminar Nasional Sistem dan Informatika. Bali.
untuk program strata-1, mahasiswa yang berada di [6] Khoo, S.G, Christopher; & Ramaiah, K, Chennupati.
kluster 3 tetap dengan jumlah prosentase terbanyak, 2004. Profile of LIS Applicants Selecting Different
namun jumlah ini tidak semua berasal dari mahasiswa Specialisations. Libri, vol. 54, pp. 6781 Germany:
yang pada saat masuk berada pada kluster ini, karena
Printed.
ada mahasiswa dengan prestasinya menurun dan ada
yang naik.
4. Mahasiswa yang tetap pada klusternya, terutama
kluster 3 apabila dilihat dari program studinya,
Komputerisasi Akuntansi berada di urutan pertama
mahasiswa dengan kemampuan tetap di kluster tiga,
hal ini bisa disebabkan mereka mempunyai potensi
dan kecerdasan yang tinggi. Untuk jenis SMA,
prosentase tertinggi adalah mahasiswa yang berasal
dari jenis SMA Umum yang tetap di kluster 3.
Sedangkan untuk asal SMA masing masing wilayah
mempunyai prosentase yang sama.