Anda di halaman 1dari 8

Seminar Nasional Teknologi Informasi dan Komunikasi 2018 (SENTIKA 2018) ISSN: 2089-9815

Yogyakarta, 23-24 Maret 2018

PREDIKSI KOMPETENSI KARYAWAN MENGGUNAKAN ALGORITMA C4.5


(STUDI KASUS : PT HANKOOK TIRE INDONESIA)
Aswan Supriyadi Sunge
Program Studi Teknik Informatika, Sekolah Tinggi Teknologi Pelita Bangsa
Jln. Inspeksi Kalimalang Tegal Danas Delta Mas, Cikarang Pusat Kabupaten Bekasi Provinsi Jawa Barat
E-mail: aswan.sunge@pelitabangsa.ac.id

ABSTRAKS
Ketidak kompetensi merupakan hal yang merugikan dari segi perusahaan maupun karyawan tersebut, apalagi
persaingan yang sangat ketat pada era sekarang ini yang harus mencari orang-orang berkompenten, oleh
karena itu dibutuhkan teknik klasifikasi dan prediksi data mining dalam memecahkan masalah tersebut.
Klasifikasi yang digunakan dalam data mining adalah Decision Tree dikarenakan merupakan teknik yang
banyak digunakan dan menghasilkan output yang dengan aturan yang ada, dengan hal tersebut dapat
menyajikan data ketidak kompetensi karyawan. Dalam penelitian ini menggunakan Algoritma C4.5 untuk
menghasilkan aturan klasifikasi ketidak kompentesi karyawan dan hasil akurasinya di dapat 78.75 %.
Kata Kunci: kompetensi karyawan, data mining, Decision Tree, Algoritma C4.5

1. PENDAHULUAN
1.1 Latar Belakang Masalah
Jumlah tenaga kerja di Indonesia pada tahun 2016 berjumlah 127 juta orang yang merupakan jumlah yang
sangat besar sedangkan jumlah lowongan pekerjaan di perusahaan di Indonesia tidak sebanding dengan jumlah
tenaga kerja. Maka dari itu perusahaan bagaimana mencari calon karyawan yang sesuai dengan kategori
perusahaan yang diinginkan. PT Hankook Tire Indonesia setiap tahun menerima calon karyawan belum lagi
mencari pengganti karyawan yang sudah masuk masa pensiun, namun mencari karyawan yang dibutuhkan
sangat sulit mengambil keputusan dan terutama butuh waktu yang cukup lama.
Karyawan merupakan terjemahan dari kata “performance” yang memiliki arti sebagai sebuah hasil kerja
seorang pegawai atau pekerja, sebuah proses manajemen yang mana hasil kerja tersebut harus memiliki sebuah
bukti konkret yang juga dapat diukur (Sedarmayanti, 2011). Penentuan karyawan disuatu perusahaan
mempunyai penilaian yang berbeda-beda seperti penyeleksian berkas, tes lisan atau tertulis maupun wawancara.
Cara tersebut biasa dan umum yang dilakukan dalam penentuan karyawan disuatu perusahaan.
Namun penilaian tersebut oleh tersebut intinya mencari karyawan yang berkompenten dalam menjalani atau
jabatan yang dibebankan kepada karyawan tersebut. Secara etimologi kompetensi dari kata “competency” yang
artinya kecakapan atau kemampuan (Echols dan Shadily, 2005). Namun kompetensi bukan hanya keahlian
maupun kecakapan dalam berkerja tetapi sebagai karakteristik yang mendasari seseorang dan berkaitan dengan
efektifitas kinerja individu dalam pekerjaannya (Spencer and Spencer, 1993).

1.2 Rumusan Masalah


Berdasarkan dari latar belakang diatas, maka dirumuskan beberapa permasalahan sebagai berikut ;
a. Apakah prediksi kompetensi menggunakan data mining memiliki tingkat akurat yang tinggi ?
b. Bagaimana akurasi dari Algoritma C4.5 dalam memprediksi kompetensi karyawan ?

1.3 Tinjauan Pustaka


1.3.1 Data Mining
Asal muasal data mining dari kata mining yang artinya tambang jika dikembangkan menggali data yang
telah lampau. Data mining merupakan proses terpadu dari analisis data yang terdiri dari serangkaian kegiatan
yang berjalan berdasarkan definisi tujuan yang akan dianalisis, dengan analisis datanya sampai interpretasi dan
evaluasi hasil (Giudici & Figini, 2009). Pengumpulan data mining bukan sekedar terkumpul data saja tetapi
mencakup analisis dan prediksi dari informasi yang ingin ditampilkan. Data yang dikumpulkan disimpan dalam
database kemudian diproses sehingga dapat dijadikan untuk pengambilan keputusan dalam melihat informasi
yang akan digunakan.
Data mining dan Knowledge Discovery in Databases (KDD) sering kali digunakan secara bergantian dalam
menjelaskan proses penggalian informasi dalam basis data yang sangat besar akan tetapi berkaitan satu sama
yang lain, skema proses KDD (Han & Kamber, 2006) digambarkan dibawah ini :

15
Seminar Nasional Teknologi Informasi dan Komunikasi 2018 (SENTIKA 2018) ISSN: 2089-9815
Yogyakarta, 23-24 Maret 2018

Gambar 1. Skema KDD

Dari tahapan proses KDD adalah data mining, tahapan adalah sebagai berikut (Fayyad, 1996)
1. Data Selection, dimana data yang relevan dengan analasis yang diputuskan dan diambil dari lokasi data.
2. Data Preprocessing/Cleaning pada tahap ini dilakukan proses pembersihan data dan memeriksa jika ada
kekosongan atau tidak lengkap, duplikasi data maupun data yang tidak relevan.
3. Transformation, merupakan proses dalam pemilihan data yang telah dipilih, sehingga data tersebut sesuai
proses data mining.
4. Data Mining, proses dalam mencari pola yang sesuai dari data yang ingin ditampilkan dengan
menggunakan teknik maupun metode tertentu.
5. Interpertation/Evaluation, tahap ini merupakan menerjemahkan dari pola maupun metode yang telah
dihasilkan dari data mining dan juga bagaimana informasi tersebut bisa mudah dimengerti.

1.3.2 Decision Tree / Pohon Keputusan


Salah satu penggunaan data mining digunakan adalah pohon keputusan, metode tersebut merupakan salah
satu teknik data mining yang sering digunakan. Fleksibilitas dari teknik ini membuatnya sangat menarik,
terutama karena menyajikan keuntungan dari visualisasi yang sangat mudah dimengerti dimana cabang-cabang
dari pohon merangkum klasifikasi (Goronescu, 2011).
Pohon keputusan mempunyai tiga pendekatan klasik ;
1. Pohon Klasifikasi, digunakan ketika hasil prediksi adalah keanggotaan kelas (misalnya, Algoritma C4.5)
2. Pohon Regresi, digunakan ketika hasil prediksi dianggap sebagai bilangan real (misalnya : harga minyak,
nilai kendaraan)
3. CART (C & RT) yaitu klasifikasi dan pohon regresi.
Pohon keputusan banyak sekali perkembangan tetapi yang sering dipakai adalah ID3 dan C4.5. Keduanya
mempunyai prinsip yang sama dikarenakan Algoritma C4.5 merupakan pengembangan dari ID3, tetapi
mempunyai perbedaan utama yaitu ;
 C4.5 dapat menangani atribut yang kontinyu dan diskrit dan juga dapat menangani data training dengan
nilai yang hilang atau data yang kosong.
 Hasil yang didapat dari Algoritma C4.5 akan terpangkas setelah dibentuk
 Pemilihan atribut yang dilakukan dengan menggunakan Gain Ratio
Algoritma C4.5 merupakan perbaikan dari ID3 menggunakan Gain Ratio untuk diperbaharui information
gain maka dengan rumus :

Dimana;

16
Seminar Nasional Teknologi Informasi dan Komunikasi 2018 (SENTIKA 2018) ISSN: 2089-9815
Yogyakarta, 23-24 Maret 2018

S = Ruang/Data Sample yang dipergunakan untuk data training


A = Atribut
Gain(S,A) = information gain pada atribut A
SplitInfo(S,A) = split information pada atribut A

Dengan atribut yang nilai Gain Ration yang paling tertinggi dipilih sebagai atribut test untuk simpul.
Pendekatan ini menerapkan normalisasi pada information gain dengan menggunakan apa yang disebut dengan
split information, dengan rumus :

Dimana:
S = Ruang (data) sample yang digunakan untuk training.
A = Atribut.
Si = Jumlah sample untuk atribut i

Pada saat membangun pohon keputusan, mungkin adanya data yang noise maupun kosong pada training data.
Pemangkasan pohon dapat dilakukan untuk mengenali dan menghilangkan cabang tersebut agar pohon lebih
kecil dan lebih mudah dipahami agar lebih baik dalam melakukan klasifikasi.
Ada dua metode dalam melakukan pemakasan pohon keputusan yaitu:
a. Dengan Prepruning yaitu menghentikan pembangunan lebih awal pada subtree agar tidak sampai lebih
jauh dalam pemangkas data training. Rumus Prepruning :

Dimana :
r = nilai perbandingan error rate
n = total sample
z = Φ-1(c)
c= confidence level

b. Dengan Postpruning yaitu menyederhanakan pohon dengan membuang beberapa cabang subtree setelah
selesai dibangun. Metode ini sebagai bagian standard untuk Algoritma C4.5

1.4 Metodologi Penelitian


Jenis penelitian ini menggunakan model eksperimen, merupakan menggunakan data dalam penelitian dan
menghasilkan kesimpulan yang mampu dibuktikan oleh pengamatan atau percobaan (Kothari, 2004).
Dalam pengumpulan data terdapat sumber data yang dihimpun langsung oleh peneliti disebut dengan
sumber primer, sedangkan apabila melalui tangan kedua disebut sumber sekunder (Riduwan, 2008). Data yang
diperoleh adalah data sekunder diperoleh dari data karyawan PT Hankook Tire Indonesia di Bekasi. Setelah data
dikumpulkan berjumlah 205 data kemudian dibagi 2 yaitu data training sejumlah 164 data dan data testing
sejumlah 41 data dengan perbandingan 80% dan 20%. Hasil data training digunakan untuk memperoleh hasil
klasifikasi kompetensi karyawan dalam bentuk pohon keputusan dan data testing digunakan tingkat akurasi dari
hasil klasifikasi tersebut.

17
Seminar Nasional Teknologi Informasi dan Komunikasi 2018 (SENTIKA 2018) ISSN: 2089-9815
Yogyakarta, 23-24 Maret 2018

Gambar 2. Kerangka Pemikiran

2. PEMBAHASAN
2.1 Analisis Data
Dari proses klasifikasi dengan menggunakan Knowledge Discovery in Databases (KDD) kemudian
menganalisis kompetensi dari Kompentensi Umum, Kompentensi Khusus dan Kompetensi Teknikal.

Tabel 1. Kategori Kompetensi Karyawan PT. Hankook Tire Indonesia

Dari hasil yang ada kemudian dikategorikan dengan variabel, atribut dengan nilai kompetensi dan tidak
berkompetensi kemudian dijadikan data training dan data testing.

18
Seminar Nasional Teknologi Informasi dan Komunikasi 2018 (SENTIKA 2018) ISSN: 2089-9815
Yogyakarta, 23-24 Maret 2018

Tabel 2. Data Training untuk prediksi kompetensi karyawan

2.2 Evaluasi Hasil


Untuk melihat GainRatio dengan menggunakan data training sebanyak 164 data, yang diketahui
berkompetensi berjumlah 86 orang dan tidak berkompetensi berjumlah 78 orang. Didapat nilai entropy sebesar
0.9982, ternyata atribut tertinggi yaitu C12 dengan information gain sebesar 0.211971, pada split info sebesar
0.3921 dan Gain Ratio sebesar 0.540485.

Tabel 3. Perhitungan Data Training

Maka terbentuk simpul-simpul diperoleh decision tree untuk klasifikasi prediksi kompetensi karyawan pada
gambar 3.

19
Seminar Nasional Teknologi Informasi dan Komunikasi 2018 (SENTIKA 2018) ISSN: 2089-9815
Yogyakarta, 23-24 Maret 2018

Gambar 3. Pohon Keputusan Kompetensi Karyawan

Metode klasifikasi bisa dievaluasi berdasarkan kriteria seperti tingkat akurasi, kecepatan, kehandalan, stabilitas
dan interpretabilitas (Vecellis, 2009). Setelah data diolah maka diuji tingkat akurasinya dari metode yang
digunakan dari metode Algoritma C4.5 dilakukan tingkat akurasi dengan confussion matrix dan kurva
ROC/AUC (Area Under Cover)

1. Confusion Matrix

Tabel 4. Perhitungan akurasi data training dari 164 data, 66 diklasifikasikan prediksi kompentensi dan ternyata
kompentensi, 15 data diprediksi kompetensi tetapi ternyata tidak kompentensi, 20 data diprediksi tidak
kompentesi tetapi ternyata kompetensi dan sebanyak 63 diprediksi sesuai tidak kompentensi, dengan nilai
accuracy sebesar 78.64%.

Tabel 5. Perhitungan akurasi berdasarkan recall, 66 diklasifikasikan prediksi kompentensi dan ternyata
kompentensi, 15 data diprediksi kompetensi tetapi ternyata tidak kompentensi, 20 data diprediksi tidak
kompentesi tetapi ternyata kompetensi dan sebanyak 63 diprediksi sesuai tidak kompentensi sebesar 80.95%

20
Seminar Nasional Teknologi Informasi dan Komunikasi 2018 (SENTIKA 2018) ISSN: 2089-9815
Yogyakarta, 23-24 Maret 2018

Tabel 6. Akurasi data testing dengan total data sebanyak 41 data, 7 diklasifikasikan prediksi komptensi dan
ternyata kompetensi, 7 data diprediksi kompetensi dan tetapi ternyata tidak kompetensi, 11 data diprediksi tidak
kompetensi tetapi ternyata kompetensi dan sebanyak 16 diprediksi sesuai tidak kompetensi, dengan nilai
akurasi sebesar 56%.

Tabel 7. Akurasi data testing dengan total data sebanyak 41, 7 diklasifikasikan prediksi komptensi dan ternyata
kompetensi, 7 data diprediksi kompetensi dan tetapi ternyata tidak kompetensi, 11 data diprediksi tidak
kompetensi tetapi ternyata kompetensi dan sebanyak 16 diprediksi sesuai tidak kompetensi, dengan nilai data
sebesar 71.67%.

2. ROC/AUC (Area Under Cover)


Performance keakurasian AUC (Gorunescu, 2010) dapat diklasifikasikan menjadi lima kelompok yaitu:
a. 0.90 – 1.00 = Exellent Clasification
b. 0.80 – 0.90 = Good Clasification
c. 0.70 – 0.80 = Fair Clasification
d. 0.60 – 0.70 = Poor Clasification
e. 0.50 – 0.60 = Failure

Hasil yang didapat dari pengolahan ROC metode Algoritma C4.5 sebesar 0.907 menggunakan data training
dapat dilihat gambar 4 dengan tingkat akurasi Exellent Clasification.

Gambar 4. Hasil Evaluasi Data Training ROC/AUC

Sedangkan dari pengolahan ROC menggunakan data testing sebesar 0.783 dapat dilihat digambar 5 dengan
tingkat akurasi Fair Clasification

21
Seminar Nasional Teknologi Informasi dan Komunikasi 2018 (SENTIKA 2018) ISSN: 2089-9815
Yogyakarta, 23-24 Maret 2018

Gambar 5. Hasil Evaluasi Data Testing ROC/AUC

3. KESIMPULAN
Dari hasil dan pembahasan dapat diambil beberapa kesimpulan sebagai berikut ;
1. Dengan menggunakan Algoritma C4.5 maka kompetensi karyawan dapat di prediksi dengan hal tersebut
dapat dijadikan konstribusi terhadap proses pengambilan keputusan bagi pihak perusahaan.
2. Penerapan decision tree dapat mempercepat dan tingkat keakuratan dalam pengambilan keputusan kepada
calon maupun karyawan yang sedang bekerja.
3. Evaluasi hasil klasifikasi dalam prediksi kompetensi menggunakan data training dengan Confusion
Matrix tingkat akurasi sebesar 78.64 % dan data testing tingkat akurasi sebesar 56.00%. Jika melihat
dengan kurva ROC menggunakan data training dengan akurasi Exellent Clasification sebesar 0.907 dan
data testing dengan akurasi Fair Clasification sebesar 0.783.
Berdasarkan hasil penelitian memberikan beberapa saran sebagai berikut;
1. Memaksimalkan atau menambah atribut yang lebih spesifik dan lebih banyak dalam menentukan prediksi
kompetensi karyawan seperti pengalaman kerja, pendidikan terakhir, berapa tahun bekerja dan lain
sebagainya oleh pihak perusahaan agar prediksi kompetensi semakin akurat.
2. Perlu adanya penelitian lebih lanjut dengan melakukan pengujian dengan metode lain maupun komparasi
seperti Naïve Bayes, Neural Network dan lain sebagainya agar memperoleh perbandingan dengan
tingkat akurasi yang paling tinggi dalam membuat kualifikasi prediksi kompetensi karyawan.

DAFTAR PUSTAKA
C.R.Kothari. 2004. Research Methology Methods and Techniques. India: New Age International Limited. ISBN
(13) : 978-81224-2488-1
Echols, John M. dan Hassan Shadily. 2005. Kamus Inggris Indonesia : An English – Indonesian Dictionary.
Jakarta: PT Gramedia.
Fayyad, Usama, 1996, Advances in Knowledge Discovery and Data Mining, MIT Press.
Giudici & Figini. 2009. Applied Data Mining for Business and Industry, 2nd Edition
Gorunescu.2011. Data Mining Concepts, Models and Techniques. Romania: Springer-Verlag Berlin Heidelberg
Han, J & Kamber, M. 2006. Data Mining Concept and Techniques. India: New Age International Limited
Larose, Daniel T. 2005 . Discovering Knowledge in Data : An Introduction to Data Mining. John Willey &
Sons, Inc
Riduwan. (2008). Metode dan Teknik Menyusun Tesis. Bandung: Alfabeta
Sedarmayanti.2011.Manajemen Sumber Daya Manusia, Reformasi Birokrasi dan Manajemen Pegawai Negeri
Sipil (cetakan kelima). Badung:PT Refika Aditama.
Spencer, Peter M., & Signe M.Spencer.1993. Competence at Work “Models for Superior Performace”. New
York : John Wiley & Sons Inc.
Vercellis, Carlo. 2009. Business Intelligence: Data Mining and Optimization for Decision Making. United
Kingdom: John Willey & Son

22

Anda mungkin juga menyukai