Abstrak
Penelitian ini bertujuan untuk menyajikan model decision tree dengan algoritma
C4.5 dalam mengembangkan sistem rekomendasi pemilihan jurusan untuk calon siswa
baru Sekolah Menengah Kejuruan (SMK). Pendekatan yang digunakan adalah research
and development (R&D). Pengumpulan data dilakukan dengan teknik angket dan studi
dokumentasi. Variabel input yang digunakan dalam penelitian ini antara lain: minat, bakat
akademik, nilai ujian nasional, dan jenis kelamin. Pilihan jurusan menjadi variabel target.
Decision tree digunakan dalam menganalisis data siswa kelas 10 SMK se-Kecamatan
Batang. Algoritma C4.5 digunakan untuk membangun decision tree yang menggambarkan
hubungan antara variabel input dengan variabel target dalam bentuk pola. Pola tersebut
digunakan sebagai aturan untuk proses klasifikasi variabel input ke dalam variabel target.
Data penelitian dianalisis dengan cara membandingkan hasil output system dengan
data siswa kelas 10 dengan tiga besar ranking paralel sebagai data uji. Hasil uji sistem
menunjukkan bahwa sistem dapat memberikan rekomendasi yang tepat sebesar 83,33%
dari 48 data uji.
Kata kunci: rekomendasi, pemilihan minat, jurusan, algoritma C4.5
Abstract
This study was aimed at presenting decision tree model using C4.5 algorithm in
developing a major selection system for vocational schools. The study was reseach and
development using questionnaires and documentation as data collection instruments. The
input variables were: interest, academic talent, National Exam score, and gender. The target
variable was choice of majors. Decision trees were used to analyze the data from grade 10 of
vocational schools Batang in District. The C4.5 Algorithm was used to build decision trees
in describing the relationship between the input variables and the target variable in the form
of patterns. The patterns were used as a guide for the classification of the input variables into
the target variable. The data were analyzed by comparing results of the output system and
students’ highest parallel ranking. Results show that the system is able to provide appropriate
recommendations up to 83.33% out of the 48 tested data.
Keywords: recommendation system, major selection, vocational, algoritma C4.5
139
JURNAL KEPENDIDIKAN, Volume 1, Nomor 1, Juni 2017, Halaman 139-149
140
Indra M. P. & Subiyanto: Sistem Rekomendasi Penjurusan...
141
JURNAL KEPENDIDIKAN, Volume 1, Nomor 1, Juni 2017, Halaman 139-149
142
Indra M. P. & Subiyanto: Sistem Rekomendasi Penjurusan...
n : Jumlah Jurusan
(5)
Sv : Jumlah keseluruhan data siswa
dengan kondisi variabel input sama
Keterangan
dengan nilai variabel input
v : variabel input
Gk : nilai gain variabel input
Perhitungan nilai gain setiap variabel
SI : nilai split info variabel input
input dapat dilakukan dengan menggunakan
Persamaan (3), sesudah nilai entropy dari
Penentuan variabel input sebagai akar
semua nilai variabel diketahui.
dan cabang dengan cara membandingkan
(3) nilai gain ratio tiap variabel input. Variabel
input dengan nilai gain ratio terbesar
digunakan sebagai akar atau cabang dari
Keterangan: decision tree sistem rekomendasi SMK.
Gk : nilai gain variabel input Variabel input dengan nilai gain ratio
j : keseluruhan data siswa tertinggi juga digunakan sebagai syarat
v : variabel input kondisi dalam penggunaan data siswa
: nilai entropry keseluruhan data siswa pada iterasi berikutnya. Perhitungan iterasi
: nilai entropry dari nilai variabel pembentukan decision tree berhenti saat
input ke-i semua variabel input tidak tersisa atau
: jumlah keseluruhan data siswa tidak dapat dipartisi lagi dan jurusan yang
dengan kondisi varibel input sama memiliki jumlah data siswa tersisa atau
dengan nilai variebel input ke-i terbanyak dijadikan sebagai daun dari
S : jumlah keseluruhan data siswa decision tree.
n : jumlah nilai variabel input
HASIL PENELITIAN DAN PEMBAHASAN
Perhitungan nilai split info untuk
Tahap pertama dalam penelitian ini
tiap variabel input dengan Persamaan (4)
adalah tahap data selection. Pada tahap
dilakukan sebelum perhitungan gain ratio.
data selection dilakukan proses penentuan
(4) variabel data yang digunakan dalam
pembentukan decision tree. Data jurusan
Keterangan dipilih menjadi variabel keputusan dari
SI : nilai split info setiap variabel input pembentukan decision tree. Variabel
v : variabel input yang digunakan sebagai penentu dalam
: jumlah keseluruhan data siswa pembentukan decision tree terdiri dari
dengan kondisi variabel input sama minat, bakat, nilai UN, nama, dan jenis
dengan nilai variabel input ke-i kelamin.
S : jumlah keseluruhan data siswa Tahap kedua adalah data preprocessing
n : jumlah nilai varibel input untuk yang terdiri dari dua tahap, yaitu tahap data
setiap variabel input intergration dan data cleaning. Tahap data
intergration dilakukan penggabungan
Kita dapat mencari nilai gain ratio 4 database, yaitu identitas, nilai UN
untuk setiap variabel input menggunakan SMP, minat, dan bakat akademis siswa
persamaan (5), sesudah didapat nilai split berdasarkan NIS untuk setiap sekolah.
info untuk tiap variabel input. Selanjutnya, data delapan sekolah
143
JURNAL KEPENDIDIKAN, Volume 1, Nomor 1, Juni 2017, Halaman 139-149
144
Indra M. P. & Subiyanto: Sistem Rekomendasi Penjurusan...
Tabel 2
Variabel Input dan Target
No Nama Nilai
1 Jenis Kelamin Laki-laki, Perempuan
2 Minat (Librarians, Realistik (R), Investigatif (I), Artistik (A), Sosial (S),
2008) Enterprise (E), Convensional (C),
3 Bakat (Gunarto, 2014) Verbal, Kuantitatif, Penalaran
4 Nilai UN Matematika SB, B, C, K
5 Nilai UN IPA SB, B, C, K
6 Nilai UN B Indonesia SB, B, C, K
7 Nilai UN B Inggris SB, B, C, K
8 Jurusan (Varibel target) Akutansi (AK), Adminitrasi Perkantoran(AP),
Pemasaran (PM), Perbankan Syariah(PBS), Teknik
Komputer dan Jaringan (TKJ), Multimedia (MM),
Farmasi (F), Teknika Kapal Penangkap Ikan (TKPI),
Neutika Kapal Penangkap Ikan (NKPI), Teknik
Pemeliharaan Mekanik Industri (TPMI), Teknik
Sepeda Motor (TSM), Teknik Kendaraan Ringan
(TKR), Busana Butik (BB)
Tabel 3
Confusion Matrix Hasil Pengujian
Class
AK TKJ PM MM PBS TSM TPMI F TKR NKPI TKPI BB AP Precision
(%)
AK 6 0 0 0 0 0 0 0 0 0 0 0 0 100,0
TKJ 0 3 0 0 0 0 0 0 0 0 0 0 0 100,0
PM 0 0 3 0 0 0 0 0 0 0 0 0 0 100,0
MM 0 0 0 3 0 0 0 0 0 0 0 0 0 100,0
PBS 0 0 0 0 3 0 0 0 0 0 0 0 0 100,0
TSM 0 1 0 0 0 8 0 0 0 0 0 0 0 88,9
TPMI 0 0 0 0 0 1 2 0 0 0 0 0 0 67,3
F 0 0 0 0 0 0 0 3 0 0 0 0 0 100,0
TKR 0 0 0 0 0 0 0 0 3 0 0 0 0 100,0
NKPI 0 1 0 0 0 0 1 0 1 0 0 0 0 0
TKPI 0 1 0 1 0 0 1 0 0 0 0 0 0 0
BB 0 0 0 0 0 0 0 0 0 0 0 3 0 100,0
AP 0 0 0 0 0 0 0 0 0 0 0 0 3 100,0
Class
Recall 100 50 100 75 100 88,9 50 100 75 0 0 100 100
(%)
145
JURNAL KEPENDIDIKAN, Volume 1, Nomor 1, Juni 2017, Halaman 139-149
146
Indra M. P. & Subiyanto: Sistem Rekomendasi Penjurusan...
Berdasarkan confusion matrix, sistem sistem sebagai jurusan TKJ. Nilai akurasi
berhasil memberikan rekomendasi jurusan sistem dalam uji data dengan jurusan TSM
yang sesuai dengan data jurusan siswa adalah 88,9%. Keseluruhan data pengujian
akademis tiga besar berprestasi pada data dengan jurusan TKPI dan NKPI tidak
eksperimen sebanyak 40 data siswa. Jumlah dapat direkomendasikan sesuai dengan
data yang hasil rekomendasi jurusan dari data kenyataan jurusan siswa. Tiga data
sistem tidak sesuai dengan data jurusan dengan jurusan TKPI direkomendasikan
siswa berpretasi adalah 8 data. Dengan sistem sebagai jurusan TKR, TPMI, dan
demikian tingkat akurasi dari sistem TKJ. Tiga data dengan jurusan NKPI
rekomendasi jurusan SMK sebesar 83,33% direkomendasikan oleh sistem sebagai
dan error rate 16,67%. jurusan TPMI, MM, dan TKJ. Secara
Hasil rekomendasi jurusan yang tepat ringkas data dapat dilihat seperti pada
100% terjadi pada data pengujian dengan Gambar 3.
jurusan AK, TKJ, PM, MM, PBS , F, TKR, Artikel ini belum dapat menyajikan
BB, dan AP. Data pengujian dengan jurusan rekomendasi yang sesuai dengan beberapa
TPMI memiliki nilai akurasi rekomendasi jurusan karena artikel ini mempunyai
67,33% yaitu dua dari tiga memiliki hasil tujuan untuk pemanfaatan algoritma C4.5
rekomendasi yang sesuai dengan data dalam pengembangan sistem rekomendasi
kenyataan siswa, yaitu TPMI. Satu data jurusan SMK yang berada di wilayah
lain direkomendasikan jurusan TSM. Data Kecamatan Batang. Artikel penelitian
dengan jurusan TSM sebanyak sembilan selanjutnya diharapkan dapat mencakup
data dapat direkomendasikan sesuai dengan objek penelitian yang lebih luas dan besar
jurusan siswa sebanyak delapan data, untuk mengatasi masalah sedikitnya data
sedangkan satu data direkomendasikan oleh dari jurusan yang kurang populer.
147
JURNAL KEPENDIDIKAN, Volume 1, Nomor 1, Juni 2017, Halaman 139-149
148
Indra M. P. & Subiyanto: Sistem Rekomendasi Penjurusan...
149