net/publication/267757302
CITATIONS
READS
3
26,203
4 authors, including:
Aradea Dipalokareswara
Siliwangi University
45 PUBLICATIONS 55 CITATIONS
SEE PROFILE
Some of the authors of this publication are also working on these related projects:
All content following this page was uploaded by Aradea Dipalokareswara on 05 November 2014.
Abstrak
Penerimaan mahasiswa baru (PMB) adalah proses penyaringan calon mahasiswa
yang diterima pada suatu perguruan tinggi. Mengidentifikasi pola dari PMB dapat
memberikan informasi yang bermanfaat baik kepada perguruan tinggi dalam hal ini
program studi atau calon mahasiswa yang mendaftar pada suatu program studi.
Penentuan pola tersebut dapat dilakukan dengan model klasifikasi, model klasifikasi
dibuat dengan cara menganalisis training data, model yang dihasilkan nantinya dapat
digunakan untuk memprediksi kelas dari unknown data. Model klasifikasi dapat
digambarkan dalam berbagai bentuk, salah satunya adalah dengan menggunakan
Decision Tree. Dalam makalah ini akan dibahas model klasifikasi menggunakan Decision
Tree dengan algoritma Interactive Dichotomicer 3 (ID3), untuk penentuan pola dari
sebuah data PMB dengan mengacu pada parameter atribut yang digunakan pada saat
calon mahasiswa tersebut mendaftar dan melaksanakan ujian masuk. Dari hasil
pembahasan studi kasus didapatkan atribut yang berpengaruh pada penentuan pola data
PMB terdiri dari tiga atribut, yaitu prioritas pilihan program studi, skor ujian masuk dan
jurusan saat SMA.
Kata Kunci : Data Mining, Model Klasifikasi, Decision Tree, Algoritma ID3, Penerimaan
Mahasiswa Baru
dilaksanakan. Pada kasus ini model pola data untuk kelas status “diterima” atau
klasifikasi dibuat untuk mengidentifikasi “tidak diterima”, dari hasil penentuan pola
Jurnal Penelitian Sitrotika, 2011, Volume 7 Nomor 1, ISSN: 1693-9670
training data. Pola atau model dari besarnya kebutuhan akan nilai tambah
training data tersebut selanjutnya diuji dari database dengan skala besar. DM
dengan menggunakan test set data. adalah serangkaian proses untuk
Singkatnya Model klasifikasi dibuat menggali nilai tambah berupa
dengan cara menganalisis training data pengetahuan yang selama ini tidak
(terdiri dari variable variabel yang diketahui secara manual dari suatu
kelasnya sudah diketahui). Model yang kumpulan data. DM memiliki hubungan
dihasilkan kemudian akan digunakan dari bidang ilmu seperti artificial
untuk memprediksi kelas dari unknown intelligent, machine learning, statistik
data (variable-variabel yang kelasnya dan database. Beberapa teknik DM
belum diketahui), test set data digunakan antara lain: clustering, classification,
untuk pengujian dari model yang telah association rule mining, neural network,
didapatkan pada training data. Model genetic algorithm dan lain-lain.
klasifikasi yang digunakan dalam kasus
ini adalah Decision Tree. Perangkat lunak Proses Data Mining
bantu yang digunakan untuk DM dapat dibagi menjadi beberapa tahap
implementasi adalah WEKA 36.2. yang diilustrasikan pada Gambar 1
Diharapakan dengan dilakukannya model
klasifikasi ini program studi akan
menemukan pola dari data PMB yang
sudah dilaksanakan, sebagai dasar untuk
penentuan kebijakan bagi PMB yang
akan datang.
2. LANDASAN TEORI
Data Mining
Data Mining (DM) adalah salah satu
Gambar 1 Tahapan Data Mining
bidang yang berkembang pesat karena
Klasifikasi
Klasifikasi adalah proses untuk
menemukan model atau fungsi yang
menjelaskan atau membedakan konsep
atau kelas data, dengan tujuan untuk
dapat memperkirakan kelas dari suatu “jika-maka”, berupa decision tree, formula
objek yang labelnya tidak diketahui. matematis atau neural network. Proses
Model itu sendiri bisa berupa aturan classification biasanya dibagi menjadi dua
Jurnal Penelitian Sitrotika, 2011, Volume 7 Nomor 1, ISSN: 1693-9670
3 Asal 1 46 32 14 0.887
2 116 58 58 1.000 Gambar 2. Decision Tree
3 126 74 52 0.978 -3.762
4 654 428 226 0.930 Keterangan Gambar
Variabel Isi
5 30 20 10 0.918
Jurusan [ 2 | 3 ] / [ IPS | IPC ]
4 Rataan 1 20 12 8 0.971 Pilihan
2 654 392 262 0.971 -1.875 Jurusan SMA [ 1| 2 | 3 ] / [ IPA | IPS |
3 298 208 90 0.884 IPC ]
5
Pilihan
Ke 1 560 216 344 0.962 Asal [1|2|3|4|5]/[
0.262 -0.273 Banten | DKI | Jabar |
2 360 344 16
Jateng | Jatim ]
3 52 52 0 0.000
Rataan [1 | 2 | 3 ] / [ <6 | 6 – 8 |
6 Skor 1 316 316 0 0.000 8 – 10]
2 404 198 206 1.000
-1.674
Pilihan Ke [1|2|3]
3 202 90 112 0.991 Skor [ 1 | 2 | 3 | 4 ] / [ 0 – 25 |
4 50 8 42 0.634 25 – 50 | 50 – 75 | 75 –
100 ]
7 Diterima 0 612
0.951
1 360 NULL Data tidak tersedia
training data dan hasil evaluasi test set atribut yang ada, teridentifikasi bahwa
data digunakan perangkat lunak bantu atribut yang berpengaruh pada penentuan
WEKA. Dan hasil yang diperoleh seperti status akhir dari data terdapat tiga atribut
ditunjukan pada gambar 3. yaitu atribut prioritas pilihan program
studi, skor ujian masuk dan jurusan saat
SMA. Hasil evaluasi dari data test set,
didapatkan bahwa nilai keakuratan
penentuan dari pola menunjukan hasil
maksimal yaitu 100%, artinya setiap data
pada status akhir/ kelas tujuan semuanya
terpasang dengan benar. Dari data
confusion matrix data test set
menunjukan nilai klasifikasi sesuai dan
tidak terdapat kesalahan klasifikasi yaitu
a = 306 data dan b= 108 data untuk total
486 data tes set.
5. KESIMPULAN
Penentuan pola data PMB pada
pembahasan studi kasus penelitian ini
dapat diidentifikasi dengan model
klasifikasi menggunakan model Decision
Tree dengan algoritma ID3. Dari
Gambar 3. Output Decision Tree. pembahasan studi kasus pada penelitian
Pada gambar 3 output dari hasil ini klasifikasi yang dilakukan mengacu
pengolahan diketahui bahwa dari semua pada enam atribut data PMB, dan setelah
melakukan pengolahan atribut yang
berpengaruh pada penentuan pola untuk
mendapatkan status data final hanya
diperoleh tiga atribut saja yaitu : prioritas
pilihan program studi, skor ujian masuk
dan jurusan saat SMA. Akurasi hasil dari
studi kasus yang dibahas mencapai nilai
keakuratan yang maksimal yaitu 100%.
Penelitian lanjutan perlu dilakukan untuk
menambah cakupan atribut yang dapat
dijadikan penentu peningkatan nilai dari
status akhir data yang dibutuhkan,
misalnya dengan penambahan kelompok
atribut dari atribut hasil atau skor test
masuk, yang didekomposisi menjadi
beberapa atribut baru, misalnya skor nilai
kemampuan verbal, skor nilai
kemampuan kuantitatif, skor nilai
kemampuan logika, skor nilai test
psikologis, dan lain lain.
DAFTAR PUSTAKA