Penerapan Data Mining Dalam Menentukan Karyawan Berprestasi Dengan Metode Algoritma C4.5

PENERAPAN DATA MINING DALAM MENENTUKAN
KARYAWAN BERPRESTASI DENGAN METODE

ALGORITMA C4.5
Dwi Wanda Bayu Segara Aswan Supriyadi Sunge

Sekolah Tinggi Teknologi Pelita Bangsa Sekolah Tinggi Teknologi Pelita Bangsa
Teknik Informatika Teknik Informatika
Cikarang Pusat, Jawa Barat Cikarang Pusat, Jawa Barat
dsegara19@gmail.com aswan.sunge@pelitabangsa.ac.id
Abstrak
Peningkatan kualitas karyawan yang bekerja didalam sebuah perusahaan merupakan hal
penting yang harus dilakukan salah satunya dengan cara penilaian kinerja karyawan serta
memberikan apresiasi terhadap karyawan yang berprestasi agar dapat memacu kinerja
karyawan lainnya. Penilaian perlu dilakukan terhadap seluruh karyawan dan meliputi semua
aspek sehingga menghasilkan penilaian yang obyektif, maka dari itu diperlukan otomatisasi
penggalian data yang akurat dari data karyawan untuk menjadi acuhan dalam penetapan
keputusan. Penerapan data mining dengan metode Algoritma C4.5 dipilih dalam penelitian ini
untuk memprediksi karyawan berprestasi karena dapat mengeksplorasi data dalam jumlah yang
besar dan mengubahnya menjadi pohon keputusan yang mempresentasikan aturan dengan
pengembangan metode menggunakan alat bantu rapidminer. Hasil dari penelitian ini adalah
diketahui akurasi sebesar 75.67% dari data karyawan. Hal ini menunjukan bahwa kinerja
karyawan dalam aspek atribut-atribut berpengaruh didalam aturan yang dihasilkan pohon
keputusan Algoritma C4.5 masih rendah. Oleh karena itu, diperlukan penambahan atribut-
atribut berpengaruh serta penggunaan metode-metode data mining lainnya agar mendapatkan
tingkat akurasi yang lebih tinggi.
Kata kunci : Prestasi, Karyawan, Algoritma C4.5, RapidMiner
I. PENDAHULUAN penilai harus melihat kriteria – kriteria

1.1. Latar Belakang dengan teliti dan hati - hati. Manipulasi data
Berkembangnya perusahaan juga harus dapat terjadi karena sulitnya mengambil
diikuti oleh meningkatnya kualitas sumber keputusan dengan kriteria dan data yang
daya manusia yang tergabung didalamnya. begitu besar tanpa adanya otomatisasi
Sumber daya manusia yang berkualitas penggalian data. Sebagai dampaknya
ditandai dengan kemampuan setiap individu perusahaan tidak akan mendapatkan sumber
untuk menyelesaikan perkerjaan yang daya manusia yang kompetitif. Salah satu
menjadi tanggung jawabnya masing – caranya dengan mengembangkan metode
masing. Perusahaan juga akan memberikan penelitian baru yang dapat menambah
apresiasi terhadap karyawan yang keakuratan hasil keputusan yaitu
berprestasi agar dapat memacu kinerja penggunaan data mining.
karyawan lainnya. Menilai karyawan bukan
hal yang mudah bila jumlah karyawan
begitu banyak, Hal ini akan membuat tim
1.2. Perumusan Masalah 2. Menghindari manipulasi data maupun
Mendasar pada latar belakang yang cara yang subyektif dari pengambil
sudah dikemukakan diatas, rumusan keputusan agar karyawan juga merasa
masalah pada penelitian ini adalah keputusan yang diperoleh sudah sesuai
1. Bagaimana memanfaatkan penggalian data yang benar.
data untuk menghasilkan keputusan 3. Penelitian ini dapat dijadikan
penilaian karyawan dengan tingkat perbandingan bagi penelitian lain yang
keakuratan yang tinggi? berkaitan dengan pengambilan
2. Bagaimana memudahkan perusahaan keputusan.
untuk melakukan penilaian kinerja
II. TINJAUAN PUSTAKA
karyawan dengan kriteria dan proses
2.1. Kinerja Karyawan
yang sesuai?
Rivai dalam (Muhammad Sandy, 2015)
1.3. Batasan Masalah memberikan pengertian bahwa kinerja atau
Pembahasan penelitian ini dibatasi agar prestasi kerja adalah hasil atau tingkat
tidak menyimpang dari apa yang telah keberhasilan seseorang secara keseluruhan
dirumuskan, batasan masalah pada selama periode tertentu di dalam
penelitian ini sebagai berikut. melaksanakan tugas dibandingkan dengan
1. Karyawan yang akan diprediksikan berbagai kemungkinan, seperti standar hasil
dalam penelitian ini hanya pada bagian kerja, target atau sasaran atau kriteria yang
produksi. telah ditentukan terlebih dahulu dan
2. Penelitian ini hanya membahas tentang disepakati bersama.
prediksi karyawan berprestasi dengan Penilaian kinerja menurut Robin dalam
metode Algoritma C4.5. (Hamdiyah, Tri Haryono, & Fathoni, 2016)
pengertian penilaian pelaksanaan pekerjaan
1.4. Tujuan
yang bersifat komprehensip meliputi :
Tujuan yang hendak dicapai dalam
1. Kualitas dari hasil pekerjaan.
penelitian ini adalah
2. Jumlah hasil atau produk.
1. Menganalisa pencapaian kinerja
3. Pengetahuan mengenai perkerjaan dan
karyawan dengan menggali data – data
kreativitas karyawan dalam berkerja.
yang akurat untuk menjadi acuhan dalam
4. Ketergantungan untuk menghasilkan
penetapan keputusan.
produk yang ditetapkan perusahaan
2. Merancang sebuah perangkat lunak yang
berdasarkan standar kualitas, maupun
dapat melakukan pengambilan
efisiensi karyawan dalam berkerja.
keputusan sesuai dengan data dan
kriteria yang dimasukan dengan 2.2. Key Performance Indicator
melibatkan data dengan jumlah yang Key Performance Indicator (KPI)
besar. merupakan seperangkat ukuran yang fokus
terhadap aspek kinerja organisasi yang
1.5. Manfaat
paling kritis bagi kesuksesan organisasi saat
Manfaat yang diperoleh dari penelitian
ini maupun di masa yang akan datang
ini adalah
menurut Abdullah dalam (F.Hamid, 2015).
1. Mempermudah perusahaan dalam hal
Berdasarkan penelitian Eckerson
mengambil keputusan untuk
dalam Journal of Competitiveness
menentukan karyawan berprestasi secara
(2012:119) menjelaskan karakteristik KPI
obyektif berdasarkan kriteria – kriteria
yang baik, yaitu:
yang sesuai dan transparan.
a) Sparse: Semakin sedikit KPI maka menggunakan data-data yang telah
semakin baik. didapatkan dari beberapa minggu.
b) Drillable: Penggunanya dapat menggali
informasi secara terperinci. 2. Descriptive
c) Simple: Pengguna memahami KPI Descriptive dalam data mining
tersebut. merupakan proses untuk menemukan
d) Actionable: Pengguna tahu cara karakteristik penting dari data dalam
menggunakan KPI. suatu basis data. Tujuan dari tugas
e) Owned: KPI dimiliki oleh semua orang. deskriptif adalah untuk menurunkan
f) Referenced: Pengguna dapat melihat pola-pola (korelasi, trend, cluster,
sumber dan konteks awalnya. teritori, dan anomali) yang meringkas
g) Balanced: KPI mengandung baik ukuran hubungan yang pokok dalam data. Tugas
financial dan non-financial. data mining deskriptif sering merupakan
h) Aligned: KPI tidak meruntuhkan satu penyelidikan dan seringkali memerlukan
sama lain. teknik post-processing untuk validasi
dan penjelasan hasil.
2.3. Data Mining
Data mining merupakan suatu proses 2.4. Algoritma C4.5
untuk mengidentifikasi pola yang memiliki Algoritma yang dapat digunakan
potensi dan berguna untuk mengelola untuk memprediksi atau mengklarifikasi
dataset yang besar (Witten & Frank, 2011). suatu kejadian dengan pembentukan pohon
Menurut Han dan Kamber dalam keputusan antara lain C4.5, yang
(Yulianora et al., 2013) secara garis besar merupakan salah satu algoritma induksi
data mining dapat dikelompokkan menjadi pohon keputusan yang dikembangkan oleh
2 kategori utama, yaitu: J. Ross Quinlan.
1. Predictive Secara umum alur proses Algoritma
Predictive merupakan proses untuk C4.5 untuk membangun pohon keputusan
menemukan pola dari data dengan dalam data mining adalah Kusrini & Luthfi
menggunakan beberapa variabel lain di dalam (Dhika & Destiawati, 2015):
masa depan. Salah satu teknik yang 1. Pilih atribut sebagai simpul akar.
terdapat dalam predictive mining adalah 2. Buat cabang untuk tiap-tiap nilai.
klasifikasi. Tujuan dari tugas prediktif 3. Bagi kasus dalam cabang
adalah untuk memprediksi nilai dari 4. Ulangi proses untuk setiap cabang
atribut tertentu berdasarkan pada nilai sampai semua kasus pada cabang
atribut-atribut lain. Atribut yang memiliki kelas yang sama.
diprediksi umumnya dikenal sebagai Pemilihan atribut sebagai simpul, baik
target atau variable tak bebas, sedangkan simpul akar (root) atau simpul internal
atribut-atribut yang digunakan untuk didasarkan pada nilai Gain tertinggi dari
membuat prediksi dikenal sebagai atribut-atribut yang ada. Penghitungan nilai
explanatory atau variable bebas. Gain digunakan rumus seperti dalam
Contohnya, perusahaan retail dapat Persamaan 1.
menggunakan data mining untuk |𝑆𝑖|
Gain (S,A) = Entropy (S) – ∑𝑛
𝑖=1 *
memprediksikan penjualan dari produk |𝑆|
mereka di masa depan dengan Entropy (Si)
S : Himpunan kasus
A : Atribut proses pemodelan termasuk
n : Jumlah partisi atribut A menghapus dan memperbaiki data
|Si | : Jumlah kasus pada partisi ke-i yang rusak.
|S| : Jumlah kasus dalam S 3. Pemodelan dilakukan terhadap data yang
sudah disiapkan pada tahap sebelumnya,
untuk menghitung nilai Entropy dapat
pada tahap awal ditentukan jenis data
dilihat pada Persamaan 2.
mining yang akan digunakan yaitu
Entropy (S) = ∑𝑛 𝑖=1 − pi * 𝐿𝑜𝑔2 pi klasifikasi, serta menentukan jenis
n : Jumlah partisi S algoritma yang akan dipakai yaitu
pi : Proporsi dari Si terhadap S Algoritma C4.5. Selanjutnya, proses
pemasukan data ke tools yang akan
III. METODE PENELITIAN membantu dalam proses pemodelan
Tahapan penelitian yang digunakan yaitu rapidminer.
dalam penyusunan penelitian ini adalah : 4. Pengujian model mengunakan alat bantu
rapidminer, dalam tahap ini akan
dibentuk pohon keputusan dari data
training yang telah di import ke dalam
tools rapidminer.
5. Tahap terakhir adalah evaluasi dan
validasi dari penerapan metode
Algoritma C4.5. Pengujian dilakukan
menggunakan metode cross validation,
confusion matrix dan kurva ROC.
Gambar 3.1 Tahapan Penelitian IV. HASIL PENELITIAN DAN

PEMBAHASAN
1. Pengumpulan data dilakukan untuk
4.1. Pengujian Pemodelan
memperoleh sumber data karyawan yang
Pada tahap pertama pengujian ini adalah
akan diteliti, dalam tahap ini diperlukan
membentuk pohon keputusan melalui data
pembelajaran mengenai data awal agar
training yang di import ke dalam
dapat menemukan wawasan awal
rapidminer. Hasil pohon keputusan untuk
mengenai informasi yang ada
karyawan berprestasi adalah sebagai berikut
didalamnya.
ini:
2. Pengolahan data awal dilakukan untuk
mempersiapkan data sebelum masuk
proses pemodelan, tahapan tersebut
diantaranya:
a. Select data, yaitu memilih atribut
mana saja yang akan digunakan
didalam penelitian.
b. Trasformation, yaitu memodifikasi
sumber data ke format yang dapat
diterima pada proses pemodelan.
c. Cleaning, yaitu proses membersihkan Gambar 4.1 Pohon Algoritma C4.5 Karyawan
data agar layak untuk dilakukan Berprestasi
Dari pohon keputusan diatas dapat oleh sistem. Artinya bahwa, angka dari data
dijabarkan ada 9 rule yang terbentuk. 4 rule actual berprestasi yang terprediksi benar
mengelompokan sampel ke kelas prestasi oleh sistem akan dibandingkan dengan
dan 5 rule mengelompokan sampel ke kelas seluruh data yang terprediksi berprestasi
tidak prestasi. oleh sistem. Precision dari prediksi
karyawan tidak berprestasi sebesar 82.86%
4.2. Evaluasi dan Validasi
dan berprestasi sebesar 61.90%.
Evaluasi dan validasi pengujian metode
Setelah seluruh tahapan evaluasi untuk
Algoritma C4.5 pada penelitian ini
confusion matrix dilakukan maka
dilakukan dengan confusion matrix dan
selanjutnya dilakukan analisa evaluasi
kurva ROC. Setelah data diproses maka
pembanding yakni terhadap pengukuran
akan diperoleh tingkat akurasi data,
Receiver Operating Characteristic (ROC),
pengukuran tingkat akurasi data sebagai
ROC menunjukan akurasi dan
berikut:
membandingkan klasifikasi secara visual
dan mengekspresikan confusion matrix.
Gambar 4.2 Hasil Accuracy

Hasil pengukuran akurasi data bahwa
secara keseluruhan akurasi data yang
dimasukan mencapai 75.67%. Dari tabel
tersebut diketahui bahwa data karyawan
yang tidak berprestasi dengan terprediksi
benar tidak prestasi oleh sistem adalah 29 Gambar 4.4 AUC Normal
orang sedangkan yang terprediksi salah
oleh sistem adalah 8 orang, dengan tingkat V. KESIMPULAN DAN SARAN
recall sebesar 78.38%. 5.1. Kesimpulan
Sedangkan untuk data karyawan yang Adapun beberapa kesimpulan yang
berprestasi dengan terprediksi tidak prestasi diperoleh dari hasil penelitian ini adalah
oleh sistem sebanyak 6 orang dan 1. Pembentukan pohon keputusan
terprediksi benar prestasi oleh sistem ada 13 Algoritma C4.5 dalam penelitian ini
orang dengan tingkat recall sebesar dapat menghasilkan prediksi karyawan
68.42%. berprestasi dengan mengacu pada nilai
Pengukuran selanjutnya adalah tingkat dari masing-masing atribut yang muncul
precision data hasilnya sebagai berikut: pada pohon keputusan.
2. Penelitian data karyawan yang
berprestasi dengan menggunakan
metode Algoritma C4.5 dapat
menghasilkan tingkat akurasi
berdasarkan confusion matrix sebesar
Gambar 4.3 Hasil Precision 75.67%.
Precision merupakan ketepatan antara 3. Penggunaan rule/pola yang dihasilkan
informasi yang diminta oleh user, oleh penggalian data pada penelitian ini
dibanding dengan jawaban yang diberikan dapat dijadikan dasar dalam membangun
sebuah sistem perangkat lunak yang Sandang Nusantara (Persero) Dengan
akan memudahkan perusahaan dalam Pemberian Insentif Sebagai Variabel
menentukan berprestasi atau tidaknya Moderator. Magister Manajemen.
seorang karyawan secara obyektif, Tesis di Universitas Widyatama.
akurat dan efisien.
Hamdiyah, Tri Haryono, A., & Fathoni, A.
5.2. Saran (2016). Peningkatan Kinerja
Saran yang disampaikan berkenaan Karyawan Melalui Kompensasi,
dengan hasil penelitian ini adalah sebagai Lingkungan Kerja dan Gaya
berikut : Kepemimpinan di ADA Swalayan
1. Hasil penelitian ini diharapkan bisa Banyumanik Semarang, 2(2).
digunakan untuk meningkatkan
kepercayaan karyawan terhadap hasil Sandy Martha, Muhammad. 2015.
keputusan yang diambil oleh perusahaan Karakteristik Pekerjaan dan Kinerja
dalam hal memprediksi karyawan Dosen Luar Biasa UIN Sunan Gunung
berprestasi. Djati Bandung: Komitmen Organisasi
2. Dalam penelitian selanjutnya diharapkan Sebagai Variabel Moderating. Tesis di
dapat dilakukan penambahan atribut- Universitas Widayatama Bandung.
atribut untuk dapat mengetahui atribut
Sunge, Aswan Supriyadi “Prediksi
yang berpengaruh terhadap prestasi
Kompetensi Karyawan Menggunakan
karyawan sehingga tingkat akurasi
Algoritma C4.5 (Studi Kasus : PT
karyawan berprestasi dapat meningkat.
Hankook Tire Indonesia),” Vol. 2018,
3. Diharapkan penelitian ini dapat
no. Sentika, pp. 23–24, 2018.
dikembangkan dengan metode-metode
data mining lainnya agar didapat Witten, I. H., & Frank, E. (2011). Data
komparasi antar metode yang nantinya Mining: Practical Machine Learning
muncullah metode yang paling baik Tools and Techniques. Elsevier, San
untuk digunakan. Francisco (Vol. 3 edition). Morgan
Kaufmann.
DAFTAR PUSTAKA
https://doi.org/0120884070,
Dhika, H., & Destiawati, F. (2015). 9780120884070
Application Of Data Mining Algorithm
To Recipient Of Motorcycle Yulianora, F., Latif, M. H., & Febriana, R.
Installment. ComTech, 6(4), 569–579. J. (2013). Analisis Perbandingan
Algoritma Decision Tree J48 Dan
F.Hamid, M.Shobirin. 2015. Identifikasi Naive Bayes Dalam
Kompetensi Karyawan Yang Mengklasifikasikan Pola Penyakit.
Mempengaruhi Pencapaian Kinerja
Bidang Produksi Di PT.Industri

Penerapan Data Mining Dalam Menentukan Karyawan Berprestasi Dengan Metode Algoritma C4.5

Diunggah oleh

Informasi Dokumen

Deskripsi Asli:

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Penerapan Data Mining Dalam Menentukan Karyawan Berprestasi Dengan Metode Algoritma C4.5

Diunggah oleh

Hak Cipta:

Format Tersedia

PENERAPAN DATA MINING DALAM MENENTUKAN

KARYAWAN BERPRESTASI DENGAN METODE

Dwi Wanda Bayu Segara Aswan Supriyadi Sunge

I. PENDAHULUAN penilai harus melihat kriteria – kriteria

Gambar 3.1 Tahapan Penelitian IV. HASIL PENELITIAN DAN

Gambar 4.2 Hasil Accuracy

Anda mungkin juga menyukai