ABSTRAKS
Ketidak kompetensi merupakan hal yang merugikan dari segi perusahaan maupun karyawan tersebut, apalagi
persaingan yang sangat ketat pada era sekarang ini yang harus mencari orang-orang berkompenten, oleh
karena itu dibutuhkan teknik klasifikasi dan prediksi data mining dalam memecahkan masalah tersebut.
Klasifikasi yang digunakan dalam data mining adalah Decision Tree dikarenakan merupakan teknik yang
banyak digunakan dan menghasilkan output yang dengan aturan yang ada, dengan hal tersebut dapat
menyajikan data ketidak kompetensi karyawan. Dalam penelitian ini menggunakan Algoritma C4.5 untuk
menghasilkan aturan klasifikasi ketidak kompentesi karyawan dan hasil akurasinya di dapat 78.75 %.
Kata Kunci: kompetensi karyawan, data mining, Decision Tree, Algoritma C4.5
1. PENDAHULUAN
1.1 Latar Belakang Masalah
Jumlah tenaga kerja di Indonesia pada tahun 2016 berjumlah 127 juta orang yang merupakan jumlah yang
sangat besar sedangkan jumlah lowongan pekerjaan di perusahaan di Indonesia tidak sebanding dengan jumlah
tenaga kerja. Maka dari itu perusahaan bagaimana mencari calon karyawan yang sesuai dengan kategori
perusahaan yang diinginkan. PT Hankook Tire Indonesia setiap tahun menerima calon karyawan belum lagi
mencari pengganti karyawan yang sudah masuk masa pensiun, namun mencari karyawan yang dibutuhkan
sangat sulit mengambil keputusan dan terutama butuh waktu yang cukup lama.
Karyawan merupakan terjemahan dari kata “performance” yang memiliki arti sebagai sebuah hasil kerja
seorang pegawai atau pekerja, sebuah proses manajemen yang mana hasil kerja tersebut harus memiliki sebuah
bukti konkret yang juga dapat diukur (Sedarmayanti, 2011). Penentuan karyawan disuatu perusahaan
mempunyai penilaian yang berbeda-beda seperti penyeleksian berkas, tes lisan atau tertulis maupun wawancara.
Cara tersebut biasa dan umum yang dilakukan dalam penentuan karyawan disuatu perusahaan.
Namun penilaian tersebut oleh tersebut intinya mencari karyawan yang berkompenten dalam menjalani atau
jabatan yang dibebankan kepada karyawan tersebut. Secara etimologi kompetensi dari kata “competency” yang
artinya kecakapan atau kemampuan (Echols dan Shadily, 2005). Namun kompetensi bukan hanya keahlian
maupun kecakapan dalam berkerja tetapi sebagai karakteristik yang mendasari seseorang dan berkaitan dengan
efektifitas kinerja individu dalam pekerjaannya (Spencer and Spencer, 1993).
15
Seminar Nasional Teknologi Informasi dan Komunikasi 2018 (SENTIKA 2018) ISSN: 2089-9815
Yogyakarta, 23-24 Maret 2018
Dari tahapan proses KDD adalah data mining, tahapan adalah sebagai berikut (Fayyad, 1996)
1. Data Selection, dimana data yang relevan dengan analasis yang diputuskan dan diambil dari lokasi data.
2. Data Preprocessing/Cleaning pada tahap ini dilakukan proses pembersihan data dan memeriksa jika ada
kekosongan atau tidak lengkap, duplikasi data maupun data yang tidak relevan.
3. Transformation, merupakan proses dalam pemilihan data yang telah dipilih, sehingga data tersebut sesuai
proses data mining.
4. Data Mining, proses dalam mencari pola yang sesuai dari data yang ingin ditampilkan dengan
menggunakan teknik maupun metode tertentu.
5. Interpertation/Evaluation, tahap ini merupakan menerjemahkan dari pola maupun metode yang telah
dihasilkan dari data mining dan juga bagaimana informasi tersebut bisa mudah dimengerti.
Dimana;
16
Seminar Nasional Teknologi Informasi dan Komunikasi 2018 (SENTIKA 2018) ISSN: 2089-9815
Yogyakarta, 23-24 Maret 2018
Dengan atribut yang nilai Gain Ration yang paling tertinggi dipilih sebagai atribut test untuk simpul.
Pendekatan ini menerapkan normalisasi pada information gain dengan menggunakan apa yang disebut dengan
split information, dengan rumus :
Dimana:
S = Ruang (data) sample yang digunakan untuk training.
A = Atribut.
Si = Jumlah sample untuk atribut i
Pada saat membangun pohon keputusan, mungkin adanya data yang noise maupun kosong pada training data.
Pemangkasan pohon dapat dilakukan untuk mengenali dan menghilangkan cabang tersebut agar pohon lebih
kecil dan lebih mudah dipahami agar lebih baik dalam melakukan klasifikasi.
Ada dua metode dalam melakukan pemakasan pohon keputusan yaitu:
a. Dengan Prepruning yaitu menghentikan pembangunan lebih awal pada subtree agar tidak sampai lebih
jauh dalam pemangkas data training. Rumus Prepruning :
Dimana :
r = nilai perbandingan error rate
n = total sample
z = Φ-1(c)
c= confidence level
b. Dengan Postpruning yaitu menyederhanakan pohon dengan membuang beberapa cabang subtree setelah
selesai dibangun. Metode ini sebagai bagian standard untuk Algoritma C4.5
17
Seminar Nasional Teknologi Informasi dan Komunikasi 2018 (SENTIKA 2018) ISSN: 2089-9815
Yogyakarta, 23-24 Maret 2018
2. PEMBAHASAN
2.1 Analisis Data
Dari proses klasifikasi dengan menggunakan Knowledge Discovery in Databases (KDD) kemudian
menganalisis kompetensi dari Kompentensi Umum, Kompentensi Khusus dan Kompetensi Teknikal.
Dari hasil yang ada kemudian dikategorikan dengan variabel, atribut dengan nilai kompetensi dan tidak
berkompetensi kemudian dijadikan data training dan data testing.
18
Seminar Nasional Teknologi Informasi dan Komunikasi 2018 (SENTIKA 2018) ISSN: 2089-9815
Yogyakarta, 23-24 Maret 2018
Maka terbentuk simpul-simpul diperoleh decision tree untuk klasifikasi prediksi kompetensi karyawan pada
gambar 3.
19
Seminar Nasional Teknologi Informasi dan Komunikasi 2018 (SENTIKA 2018) ISSN: 2089-9815
Yogyakarta, 23-24 Maret 2018
Metode klasifikasi bisa dievaluasi berdasarkan kriteria seperti tingkat akurasi, kecepatan, kehandalan, stabilitas
dan interpretabilitas (Vecellis, 2009). Setelah data diolah maka diuji tingkat akurasinya dari metode yang
digunakan dari metode Algoritma C4.5 dilakukan tingkat akurasi dengan confussion matrix dan kurva
ROC/AUC (Area Under Cover)
1. Confusion Matrix
Tabel 4. Perhitungan akurasi data training dari 164 data, 66 diklasifikasikan prediksi kompentensi dan ternyata
kompentensi, 15 data diprediksi kompetensi tetapi ternyata tidak kompentensi, 20 data diprediksi tidak
kompentesi tetapi ternyata kompetensi dan sebanyak 63 diprediksi sesuai tidak kompentensi, dengan nilai
accuracy sebesar 78.64%.
Tabel 5. Perhitungan akurasi berdasarkan recall, 66 diklasifikasikan prediksi kompentensi dan ternyata
kompentensi, 15 data diprediksi kompetensi tetapi ternyata tidak kompentensi, 20 data diprediksi tidak
kompentesi tetapi ternyata kompetensi dan sebanyak 63 diprediksi sesuai tidak kompentensi sebesar 80.95%
20
Seminar Nasional Teknologi Informasi dan Komunikasi 2018 (SENTIKA 2018) ISSN: 2089-9815
Yogyakarta, 23-24 Maret 2018
Tabel 6. Akurasi data testing dengan total data sebanyak 41 data, 7 diklasifikasikan prediksi komptensi dan
ternyata kompetensi, 7 data diprediksi kompetensi dan tetapi ternyata tidak kompetensi, 11 data diprediksi tidak
kompetensi tetapi ternyata kompetensi dan sebanyak 16 diprediksi sesuai tidak kompetensi, dengan nilai
akurasi sebesar 56%.
Tabel 7. Akurasi data testing dengan total data sebanyak 41, 7 diklasifikasikan prediksi komptensi dan ternyata
kompetensi, 7 data diprediksi kompetensi dan tetapi ternyata tidak kompetensi, 11 data diprediksi tidak
kompetensi tetapi ternyata kompetensi dan sebanyak 16 diprediksi sesuai tidak kompetensi, dengan nilai data
sebesar 71.67%.
Hasil yang didapat dari pengolahan ROC metode Algoritma C4.5 sebesar 0.907 menggunakan data training
dapat dilihat gambar 4 dengan tingkat akurasi Exellent Clasification.
Sedangkan dari pengolahan ROC menggunakan data testing sebesar 0.783 dapat dilihat digambar 5 dengan
tingkat akurasi Fair Clasification
21
Seminar Nasional Teknologi Informasi dan Komunikasi 2018 (SENTIKA 2018) ISSN: 2089-9815
Yogyakarta, 23-24 Maret 2018
3. KESIMPULAN
Dari hasil dan pembahasan dapat diambil beberapa kesimpulan sebagai berikut ;
1. Dengan menggunakan Algoritma C4.5 maka kompetensi karyawan dapat di prediksi dengan hal tersebut
dapat dijadikan konstribusi terhadap proses pengambilan keputusan bagi pihak perusahaan.
2. Penerapan decision tree dapat mempercepat dan tingkat keakuratan dalam pengambilan keputusan kepada
calon maupun karyawan yang sedang bekerja.
3. Evaluasi hasil klasifikasi dalam prediksi kompetensi menggunakan data training dengan Confusion
Matrix tingkat akurasi sebesar 78.64 % dan data testing tingkat akurasi sebesar 56.00%. Jika melihat
dengan kurva ROC menggunakan data training dengan akurasi Exellent Clasification sebesar 0.907 dan
data testing dengan akurasi Fair Clasification sebesar 0.783.
Berdasarkan hasil penelitian memberikan beberapa saran sebagai berikut;
1. Memaksimalkan atau menambah atribut yang lebih spesifik dan lebih banyak dalam menentukan prediksi
kompetensi karyawan seperti pengalaman kerja, pendidikan terakhir, berapa tahun bekerja dan lain
sebagainya oleh pihak perusahaan agar prediksi kompetensi semakin akurat.
2. Perlu adanya penelitian lebih lanjut dengan melakukan pengujian dengan metode lain maupun komparasi
seperti Naïve Bayes, Neural Network dan lain sebagainya agar memperoleh perbandingan dengan
tingkat akurasi yang paling tinggi dalam membuat kualifikasi prediksi kompetensi karyawan.
DAFTAR PUSTAKA
C.R.Kothari. 2004. Research Methology Methods and Techniques. India: New Age International Limited. ISBN
(13) : 978-81224-2488-1
Echols, John M. dan Hassan Shadily. 2005. Kamus Inggris Indonesia : An English – Indonesian Dictionary.
Jakarta: PT Gramedia.
Fayyad, Usama, 1996, Advances in Knowledge Discovery and Data Mining, MIT Press.
Giudici & Figini. 2009. Applied Data Mining for Business and Industry, 2nd Edition
Gorunescu.2011. Data Mining Concepts, Models and Techniques. Romania: Springer-Verlag Berlin Heidelberg
Han, J & Kamber, M. 2006. Data Mining Concept and Techniques. India: New Age International Limited
Larose, Daniel T. 2005 . Discovering Knowledge in Data : An Introduction to Data Mining. John Willey &
Sons, Inc
Riduwan. (2008). Metode dan Teknik Menyusun Tesis. Bandung: Alfabeta
Sedarmayanti.2011.Manajemen Sumber Daya Manusia, Reformasi Birokrasi dan Manajemen Pegawai Negeri
Sipil (cetakan kelima). Badung:PT Refika Aditama.
Spencer, Peter M., & Signe M.Spencer.1993. Competence at Work “Models for Superior Performace”. New
York : John Wiley & Sons Inc.
Vercellis, Carlo. 2009. Business Intelligence: Data Mining and Optimization for Decision Making. United
Kingdom: John Willey & Son
22