Anda di halaman 1dari 6

PENERAPAN TEKNIK DATA MINING UNTUK MENENTUKAN HASIL

SELEKSI MASUK SMAN 99 JAKARTA UNTUK SISWA/SISWI SMPN 9


JAKARTA MENGGUNAKAN DECISION TREE

Anindito Yoga Pratama1


Yuhilza Hanum2
1,2
TeknikInformatika, Universitas Gunadarma
1
anindito@staff.gunadarma.ac.id

Abstrak

Pertumbuhan yang pesat dari akumulasi data telah menciptakan kondisi kaya akan data
tapi minim informasi, seperti contoh informasi yang ditujukan kepada orang tua murid
tentang hasil seleksi masuk anaknya di sebuah SMA Negeri. Oleh karena itu, penelitian
ini dilakukan untuk membantu menyelesaikan permasalahan tersebut dengan teknik data
mining. Data mining itu senidiri adalah penambangan atau penemuan informasi baru
dengan mencari pola atau aturan tertentu dari sejumlah data dalam jumlah besar yang
diharapkan dapat mengatasi kondisi tersebut. Teknik data mining yang digunakan dalam
makalah ini adalah klasifikasi sedangkan metode klasifikasi yang digunakan adalah
Decision Tree (pohon keputusan). Algoritma yang dipakai sebagai algoritma pembentuk
pohon keputusannya adalah Algoritma C4.5. Makalah kali ini mencoba untuk
menemukan informasi yang berharga dari data menggunakan teknik data mining untuk
membantu pihak sekolah memberikan usulan kepada orang tua murid dalam hal
pengambilan keputusan apabila anaknya setelah menempuh pendidikan di SMPN 9
Jakarta yang menginginkan untuk masuk di SMAN 99 Jakarta.

Kata kunci : Data Mining, Hasil Seleksi Masuk, Decision Tree

APPLICATION OF DATA MINING TECHNIQUE TO DETERMINE 99


STATE HIGH SCHOOL JAKARTA ENROLLMENT TEST RESULTS
FOR STUDENTS OF 99 STATE JUNIOR HIGH SCHOOL BY
EMPLOYING DECISION TREE

Abstract

The rapid growth of data accumulation has created a rich condition of data but with
minimal information, for example information to students parents concerning enrollment
test result in a high school. Therefore, this research is conduct to help solve the problem
with data mining technique. Data mining is the mining or discovery of new information
by looking certain patterns or rules from a large amount of data that is expect to
overcome the condition. Data mining techniques used in this paper is classification while
the classification method used is Decision Tree (decision tree). The algorithm used as the
decision-making algorithm is Algorithm C4.5. This research has succeeded in collecting
and analyzing UN value data of SMPN 9 Jakarta 2011/2012 academic year, and
producing information result of SMAN 99 Jakarta selection can be used by the school in
decision making in academic field which then can be informed to parents information.

Keywords: Data Mining, Selection Entry Result, Decision Tree

Pratama, Hanum, Penerapan Teknik ... 49


PENDAHULUAN UN dilaksanakan oleh BNSP beker-
jasama dengan instansi terkait di ling-
Pemanfaatan data yang ada di da- kungan pemerintah, pemerintah provinsi,
lam sistem informasi untuk menunjang pemerintah kabupaten/kota, perguruan
kegiatan pengambilan keputusan, tidak tinggi dan satuan pendidikan. Mata pela-
cukup hanya mengandalkan data opera- jaran UN SMP meliputi Bahasa Indo-
sional saja, diperlukan suatu analisis data nesia, BahasaInggris, Matematikadan IPA
untuk menggali potensi-potensi informasi (MenteriPendidikan, 2010).
yang ada. Para pengambil keputusan Dengan memanfaatkan nilai UN
berusaha untuk memanfaatkan gudang SMPN 9 Jakarta tahun ajaran 2011/2012
data yang sudah dimiliki untuk menggali dan passing grade SMAN 99 Jakarta
informasi yang berguna membantu me- tahun-tahun sebelumnya, sehingga dapat
ngambil keputusan, hal ini mendorong diketahui informasi hasil seleksi masuk
munculnya cabang ilmu baru untuk SMAN 99 Jakarta melalui teknik data
mengatasi masalah penggalian informasi mining dengan metode decision tree,
atau pola yang penting atau menarik dari yang mana decision tree untuk menen-
data dalam jumlah besar, yang disebut tukan suatu obyek termasuk jenis buah
dengan data mining. Penggunaan teknik apa jika nilai tiap-tiap atribut diberikan
data mining diharapkan dapat mem- (Santosa, 2007).
berikan pengetahuan-pengetahuan yang
sebelumnya tersembunyi di dalam gudang METODE PENELITIAN
data sehingga menjadi informasi yang
berharga. Data yang digunakan adalah data
Data mining merupakan disiplin ilmu nilai UN SMPN 9 Jakarta tahun ajaran
yang masih bisa dibilang baru dan yang 2011/2012 yang berjumlah 317 instances
sedang berkembang didalam beberapa yang didapatkan secara online. Sebelum
tahun terakhir ini. Seiring dengan per- tahap selanjutnya (menentukan metode
kembangan teknologi informasi dan dan implementasi) dilakukan, dilakukan
komunikasi, teknologi data mining yang preprocessing terlebih dahulu terhadap
digunakan untuk menganalisa volume data Nilai UN dengan memisahkan tuples
data yang besar dan menjadi populer saat yang redun dan dan atribut yang tidak
ini. Data mining merupakan bidang ilmu diperlukan.
yang multidisiplin, termasuk didalamnya Metode data mining yang akan dipa-
adalah sistem basis data, statistik, kai adalah decision tree. Algoritma deci-
machine learning, visualisasi, and ilmu sion tree merupakan salah satu algoritma
informasi. Selain itu, berdasarkan jenis klasifikasi di dalam data mining yang be-
datanya sistem data mining merupakan kerja berdasarkan teori informasi (infor-
integrasi dari teknik-teknik lain seperti mation theory). Decision tree memiliki
analisis data spasial, temu kembali beberapa keunggulan yaitu mudah dalam
informasi, pattern recognition, pemro- pengembangan sebuah model, mudah
sesan sinyal, grafika komputer, teknologi dipahami oleh pengguna, dan mampu
Web, ekonomi, bisnis, bioinformatika, menangani noisy data dan unknown data
ataupsikologi. (Han J., et al, 2006).
Ujian Nasional (UN) adalah kegiatan Decision tree terdiri dari beberapa
pengukuran dan penilaian kompetensi bagian yaitu simpul dalam (inside nodes),
peserta didik secara nasional pada jenjang cabang (branches), dan simpul daun (leaf
SMP. Sedangkan Nilai UN (NUN) adalah nodes). Simpul teratas disebut juga
nilai yang diperoleh oleh peserta didik simpul akar (root nodes); simpul dalam
dalam mengikuti UN. mereprentasikan nilai dari suatu atribut.

50 Jurnal Teknologi Rekayasa Volume 21 No.1, April 2016


Pada tahap terakhir ini data yang Nilai UN SMPN 9 Jakarta tahun ajaran
sudah dikumpulkan akan diimple- 2011/2012 yang berjumlah 317 instances.
mentasikan dengan metode algoritma Sebelum proses data mining dimulai,
decision tree kedalam perangkat dilakukan preprocessing data Nilai UN
lunak WEKA yang bersifat Open dengan memisahkan tuples yang redun-
Source. dan dan atribut yang tidak diperlukan.
Setelah melalui proses pengumpulan
HASIL DAN PEMBAHASAN (collection), pembersihan (cleaning), dan
integrasi (integration) dan melalui proses
Data Preparation preprocessing, maka didapatkan dataset
Data utama yang digunakan pada seperti pada tabel 1.
penelitian ini berupa sekumpulan data

Tabel 1. Dataset yang Dihasilkan Setelah Melalui Preprocessing terhadap


Noisy Data dan Disorderly Data
Total Nilai UN KeteraganDiterima
36.9 Diterima
35.1 TidakDiterima
37.2 Diterima
36.95 Diterima
36.2 Diterima
37.25 Diterima
35.25 Diterima
34.1 TidakDiterima
31.3 TidakDiterima
… …

Tabel 2. Nilai Statistik Atribut Total Nilai UN setelah Tahapan Preprocessing


Statistik Nilai
Minimum 25.95
Maximum 39.1
Mean 35.392
StdDev 2.147

Gambar 1.Visualisasi Semua Atribut setelah Tahapan Preprocessing

Pratama, Hanum, Penerapan Teknik ... 51


Proses Tranining Algoritma C4.5 digunakan adalah 10-fold cross-valida-
Dalam makalah ini penulis meng- tion.
gunakan algoritma C4.5 untuk mem- Classifier model (full training set)
bangun sebuah decision tree. Penulis juga pada WEKA disebutkan bahwa model
menggunakan metode cross validation J48 pruned tree, didapatkan hasil sebagai
untuk menghitung estimasi kesalahan berikut :
(error) dari pohon yang telah dihasilkan 1. Total Nilai UN <= 35.15 : Tidak
(Bramer, 2007). Dengan kata lain, penulis Diterima (113.0)
memecahkan data secara acak kedalam 2. Total Nilai UN>35.15 : Diterima
10 bagian (folds) dan secara berulang, (204.0)
masing-masing folds tersebut diperuntuk- 3. Number of Leaves : 2
kan sebagai training data dan sisanya 4. Size of the tree : 3
sebagai test data seperti pada gambar 6. 5. Time taken to build model : 0 seconds
Pada bagian terakhir, kami banding-
kan hasilnya yang menggunakan WEKA Kesalahan yang dihasilkan selama
dengan menggunakan metode decision berlangsungnya proses training adalah
tree, dan hasil real yang didapat dari sebesar 0% dengan tingkat akurasi sebe-
website PPDB Jakarta (PPDB Jakarta, sar 100% dapat dilihat pada tabel 3.
2012). Untuk hasil summary yang lain
seperti Kappa statistic, Mean absolute
Hasil dengan Menggukan WEKA error, Root mean squared error, Relative
Pada perangkat lunak WEKA ini absolute error, Root relative squared error
dapat diidentifikasikan bahwa jumlah terlihat seperti pada tabel 4.
Instances yang digunakan sebanyak 317, Dengan algoritma C.45 (decision
untuk attributes yang digunakan sebanyak tree) dihasilkan pohon keputusan seperti
2 buah yaitu Total Nilai UN dan yang diperlihatkan pada gambar 4.
Keterangan Diterima, dan test mode yang

Gambar 2. Metode k-Folds Cross Validation, dengan k = 10

Tabel 3. Hasil untuk 10-folds Cross Validation


Instance Correctly Classified Incorrectly Classified
Instances Instances
317 317 (100%) 0 (0%)

52 Jurnal Teknologi Rekayasa Volume 21 No.1, April 2016


Tabel 4. Result dari Summary
Summary Result
Kappa statistic 1
Mean absolute error 0
Root mean squared error 0
Relative absolute error 0%
Root relative squared error 0 %

Gambar 3. Decision tree yang dihasilkandenganalgoritma C4.5

Tabel 5. Perbandingan Hasil WEKA dengan Hasil Real


Hasil Diterima TidakDiterima
Hasil WEKA 204 113
Hasil Real 64 253

Perbandingan Hasil WEKA dengan diterima di SMAN tersebut hanyalah 64


Hasil Real siswa/siswi.
Pada bagian ini akan dibahas per-
bandingan hasil yang didapat menggu- SIMPULAN DAN SARAN
nakan WEKA dengan hasil yang didapat
secara real (berdasarkan informasi dari Melalui teknik data mining yang
website PPDB Jakarta) seperti yang digunakan, makalah ini telah berhasil
terlihat pada tabel 5. mengumpulkan dan menganalisa data
Dapat dilihat dari hasil pada tabel 5 nilai UN SMPN 9 Jakarta tahun ajaran
perbandingan antara hasil WEKA dengan 2011/2012, dan menghasilkan informasi
hasil real sebesar 31,37 % bisa dikatakan hasil seleksi SMAN 99 Jakarta dapat
bahwa yang seharusnya siswa/siswi di digunakan oleh pihak sekolah dalam pe-
SMPN 9 Jakarta yang seharusnya bisa ngambilan keputusan di bidang akademik
diterima di SMAN 99 Jakarta, tetapi ada yang kemudian dapat diberitahukan infor-
sebagian dari mereka tidak berniat untuk masi tersebut kepada orang tua murid.
memilih SMAN tersebut sehingga yang

Pratama, Hanum, Penerapan Teknik ... 53


Dapat kita lihat dari bahasan sebe- DAFTARPUSTAKA
lumnya mengenai perbandingan hasil
WEKA dengan hasil real bisa disimpul- Bramer, M. (2007). Principles of Data
kan bahwa hasil dari perangkat lunak Mining, Springer-Verlag London
WEKA hanya bisa digunakan sesuai Limited.
dengan apa yang sudah kita latih meng- Han, J., et al. (2006).Data Mining:
gunakan data training, selain itu hasilnya Concepts and Techniques 2nd Edition,
juga hanya bisa digunakan sebagai pato- San Francisco, Morgan Kaufmann
kan buat orang tua murid apakah anaknya Publisher.
dapat masuk di sekolah SMAN 99 Jakarta Peraturan Menteri Pendidikan Nasional
dan dikembalikan lagi kepada orang tua Nomor 46 Tahun 2010.
murid dan siswa/siswi sebagai pertim- PPDB Jakarta, http://jakarta.siap-
bangan untuk dimasukkan di sekolah ppdb.com/, Diaksespadatanggal 19 Juli
SMAN 99 Jakarta. 2012 jam 21.18.
Penelitian lanjutan hendaknya dila- Santosa, B. (2007). Data Mining Teknik
kukan dengan menggabungkan metode Pemanfaatan Data untuk Keperluan
decision tree dengan metode lain seperti Bisnis, Yogyakarta, GrahaIlmu.
association rules, Bayesian, Neural Net- Bharati, M.,Ramageri. (2001). Data
work (NN) dan Support Vector Machine Mining Techniques And Applications.
(SVM), sehingga mampu memberikan Indian Journal of Computer Science
hasil yang lebih signifikan. and Engineering. Vol. 1 No. 4. pp
Selain yang disebutkan di atas 301-305
penulis berharap pada penelitian lanjutan Jain, N., Srivastava, V. (2013). Data
bisa ditambahkan objek Sekolah SMA Mining Techniques: A Survey Paper.
tujuan lainnya selain SMAN 99 Jakarta, IJRET: International Journal of
seperti SMAN 8 Jakarta, SMAN 98 Research in Engineering and
Jakarta, SMAN 81 Jakarta, SMAN 42 Technology. Volume: 02 Issue: 11 pp
Jakarta, dan lai-lain, sehingga tidak hanya 116-119.
satu sekolah yang dijadikan objek.

54 Jurnal Teknologi Rekayasa Volume 21 No.1, April 2016

Anda mungkin juga menyukai