Abstrak
Penelitian ini dilakukan untuk menemukan hasil akurasi, ketelitian, dan tingkat
keberhasilan, dari aplikasi rapid miner dan weka dengan membandingkan nilai confusion
matrix, untuk memperoleh hasil yang dibutuhkan maka dilakukan pengujian data training yang
diperoleh dari data kinerja karyawan perusahaan yang bergerak di bidang Teknologi.
Pengujian data tersebut dilakukan untuk memprediksi kualitas kinerja karyawan dengan
algoritma C4.5. pendekatan yang dilakukan pada penenlitian ini dilakukan dengan pendekatan
kualitatif serta menggunakan teknik penelitian kajian Pustaka yang hasilnya dianalisis dengan
menggunakan metode analisa dari hasil perbandingan nilai confusion matrix. Dari hasil
analisis perbandingan yang telah dilakukan diperoleh hasil aplikasi rapid miner lebih unggul
dari segi Accuracy sebesar 94,12 % dan Recall 95,6 % sedangkan aplikasi weka lebih baik
hanya dari segi Recall sebesar 95,6 %. Pengujian dilakukan menggunakan aplikasi data
mining rapid miner versi 7.6.0.0.1 dan Aplikasi Weka versi 3.8.1.
Kata kunci—Analisis Perbandingan, Confusion Matrix, Aplikasi Data Mining, Algoritma C4.5
Abstract
This research was conduted find the results of accuracy, accuracy, and success rate,
from the rapid miner and weka aplications by comparing the value of the confusion matrix, to
obtain the required results, testing the training data obtained from employee performance data
at companies engaged in technology. Testing the data is carried out to predict the quality of
employee performance with the C4.5 algorithm. The approach taken in ths research is carried
out with a qualitatve approach and uses library research research techniques, the result of
which are analyzed using analytical method comparing the results of confusion matrix value.
From result of comparative analysis that has caried out, results of the rapid miner application
are superior in terms of Accuracy of 94.12% and Recall of 95.6%, while the Weka application is
better only in terms of Recall by 95.6%. The test was carried out using the rapid miner data
mining application version 7.6.0.0.1 and the Weka application version 3.8.1.
http://jurnal.mdp.ac.id jatisi@mdp.ac.id
Jatisi ISSN 2407-4322
Vol. 9, No. 2, Juni 2022, Hal. 1655-1665 E-ISSN 2503-2933 1656
1. PENDAHULUAN
ata mining adalah metode penggalian data dengan fungsi sebagai penggali informasi data
D yang saat ini tersimpan dengan jumlah yang sangat besar di perusahaan atau organisasi
yang terus berkembang, data dalam jumlah besar tersebut hanya tersimpan di dalam
database tanpa dilakukan analisis [1]. Data yang tersimpan tanpa dapat dimanfaatkan
keberadaannya hanya akan menambah pengeluaran tambahan bagi perusahaan terutama biaya
peremajaan serta penambahan partisi setiap tahun. Tujuan penelitian ini dilakukan agar
memperoleh manfaat dari keberadaan data kinerja karyawan dalam sebuah perusahaan. Data
yang akan dianalisis merupakan data kinerja karyawan yang diperoleh dari divisi Human
Resource Departemen. Dengan menganalisis data kinerja karyawan perusahaan dapat
mengoptimalisasi potensi yang ada pada setiap karyawan untuk mencapai tujuan perusahaan [2].
Dalam proses menggali dan menganalisis data kinerja karyawan penulis juga mengkaji
penelitian terdahulu untuk memperoleh pembaharuan pada penelitian yang sedang dilakukan.
Kajian terdahulu dilakukan pada beberapa jurnal terbaru dan terkait dengan perbandingan
perangkat lunak Data mining Rapid Miner dan Weka. Seperti Penelitian yang dilakukan oleh
Ainurrohmah (2021), dalam mengukur nilai akurasi data yang diproses dengan algoritma
klasifikasi menggunakan aplikasi data mining rapid miner dan weka. untuk menentukan
keakuratan nilai akurasi, maka peneletian ini menggunakan confusion matrix dengan hasil
aplikasi data mining weka lebih akurat dengan metode klasifikasi SVM, K-NN dan MLP [3].
Penulis juga menganalisis penelitian yang dilakukan oleh Devi Damayanti (2021), dengan
meprediksikan kelulusan tepat waktu mahasiswa Prodi Manajemen Fakultas Ekonomi
Universitas Sahid jakarta. dari hasil penelitian yang dilakukan perangkat lunak weka memiliki
keunggulan pada akurasi menggunakan algoritma K-NN [4].
Penelitian lainnya yang menjadi bahan kajian peneliti yakni penelitian yang dilakukan
oleh Faid, M., dkk. (2019), pada penelitian ini Aplikasi data mining Rapidminer lebih baik
dibandingkan dengan aplikasi data mining weka pada sisi kecepatan dengan selisih rata-rata
kecepatan 5,625 detik sedangkan tingkat akurasi weka lebih baik dibandingkan dengan
rapidminer dengan selsish rata-rata sebesar 2,60 % [5]. Bedasarkan kajian dari penelitian yang
pernah dilakukan maka peneliti melakukan pengujian pada data yang berbeda yakni data kinerja
karyawan menggunakan metode yang berbeda yakni C 4.5 serta versi aplikasi data mining yang
berbeda yakni Rapid Miner 7.6.0.0.1 dan Weka 3.8.1.
2. METODE PENELITIAN
Penenlitian perbandingan aplikasi data mining ini dilakukan dengan metode kajian
literatur yang mengumpulkan data kajian terdahulu dan telah digali sumber informasinya untuk
mencari perhitungan nilai Accuracy dari data yang akan diuji menggunakan algorimtma
klasifikasi tertentu.[6]
Hijrah, et., al [Analisis RapidMiner Dan Weka Dalam Memprediksi Kualitas Kinerja Karyawan Menggunakan
Metode Algoritma C4.5]
IJCCS Vol. x, No. x: frst_page–end_
1657 Jatisi ISSN 2407-4322
Vol. 9, No. 2, Juni 2022, Hal. 1655-1665 E-ISSN 2503-2933
begitu lama juga menjadi identitas khusus dari data mining. data mining juga dapat dikenali
bedasarkan deskripsi, klasifikasi, klusterisasi, asosiasi, estimasi dan prediksi [8].
2.3 Weka
Aplikasi weka memungkinkan para penggunanya mengenali informasi yang tersimpan
di dalam database. weka juga merupakan aplikasi yang memiliki visualisasi yang mudah
digunakan oleh pengguna nya [3]. Weka juga ditulis dengan tingkatan class java yang
berorientasi objek sehingga memungkinkan untuk digunakan di berbagai perangkat, weka juga
memiliki banyak metodelogi data mining dan sangat populer bagi penggunanya salah satunya
yakni metode pengenalan node dalam pengambilan keputusan dan lebih dikenal dengan pohon
keputusan[10]
2.4 C 4.5
C4.5 merupakan analisis logika aritmatika yang memiliki banyak kelebihan seperti
dalam pengolahan data numerik, atribut yang tidak memiliki nilai, serta dapat memiliki aturan
yang menghasilkan peforma yang lebih cepat dibandingkan dengan algoritma lainnya.
Penerapan algotitma C4.5 dalam mengukur kualitas kinerja karyawan pada penelitian ini
menggunakan sampel sebanyak 170 data karyawan yang diklasifikasi menjadi dua kelompok
yakni karyawan yang efektif dan tidak efektif setelah data diklasifikasi maka langkah
selanjutnya mencari nilai informasi dan selisih. Nilai informasi digunakan dalam mencari
ketidakaslian data acak pada sampel untuk mengidentifikasi kelas dari sampel yang digunakan,
semakin rendah nilai informasi maka data yang digunakan bernilai baik jika digunakan. berikut
rumus yang digunakan untuk mencari nilai entropy pada data yang diuji pada penelitian ini [11];
(
) = ∑ − . ……………………….. (1)
= (-154/170) * (154/170) + (-16/170) * (16/170)
= 0.2495
Sedangkan information gain digunakan untuk memisahkan attribut yang tidak relevan
agar peforma dari data mining bekerja secara optimal, atribut yang diproses diperoleh dari nilai
informasi yang sduah dipisahkan dalam menentukan nilai gaint maka rumus yang digunakan
yakni [12] :
|"|
ℎ (
, ) = (
) − ∑ |"| ∗ (
)………… (2)
= 0,2495 – ((140/170*0,2432) + (30/170*0,2814))
= 0.003499
Setelah nilai entropy ditentukan dan information gain diperoleh maka dilakukan
pemilihan atribut information gain yang terbesar sehingga semua atribut terisi. proses pemilihan
Hijrah, et., al [Analisis RapidMiner Dan Weka Dalam Memprediksi Kualitas Kinerja Karyawan Menggunakan
Metode Algoritma C4.5]
Jatisi ISSN 2407-4322
Vol. 9, No. 2, Juni 2022, Hal. 1655-1665 E-ISSN 2503-2933 1658
dan perhitungan dilakukan secara terus menereus dan berulang-ulang hingga semua data masuk
ke dalam kelompok yang sama [13].
Pengujian data dilakukan dengan pengumpulan, pemecahan jenis data serta dengan
cross validation. pada tahap pemecahan data terbagi dua jenis data yakni data yang
dimanfaatkan untuk melatih algoritma dan data untuk menguji algoritma [14]. Data yang
digunakan untuk membandingkan dua aplikasi data mining terdapat pada gambar 1
Tahapan pengujian data yang telah dilakukan selesai maka dilanjutkan dengan analisis
secara terstruktur dengan mengenali pola yang lengkap dan kompleks, proses analisis dilakukan
dengan proses pemilihan data terlebih dahulu baru selanjutnya dilakukan tahapan membersihkan
data serta menghilangkan gangguan yang ada di dalam data hingga proses terakhir yakni
mengubah bentuk data yang siap dilakukan penambangan informasi [15]. Proses menguji data
untuk memperoleh nilai confusion matrix dengan menggunankan aplikasi rapid miner terdapat
pada gambar 2
Hijrah, et., al [Analisis RapidMiner Dan Weka Dalam Memprediksi Kualitas Kinerja Karyawan Menggunakan
Metode Algoritma C4.5]
IJCCS Vol. x, No. x: frst_page–end_
1659 Jatisi ISSN 2407-4322
Vol. 9, No. 2, Juni 2022, Hal. 1655-1665 E-ISSN 2503-2933
Pada gambar 2 dapat dilihat data uji diimport dengan aplikasi rapidminer, data yang
sudah dimasukan tersebut akan divalidasi menggunakan Crossvalidation, yang merupakan
teknik validasi data agar tidak terjadi bias serta dapat meningkatkan kinerja akurasi model
aplikasi prediktif yang digunakan.
Hijrah, et., al [Analisis RapidMiner Dan Weka Dalam Memprediksi Kualitas Kinerja Karyawan Menggunakan
Metode Algoritma C4.5]
Jatisi ISSN 2407-4322
Vol. 9, No. 2, Juni 2022, Hal. 1655-1665 E-ISSN 2503-2933 1660
Setelah semua proses tahapan memasukan data dan pengujian data selesai dilakukan
maka nilai confusion matrix yang diperoleh dengan menggunakan aplikasi rapidminer yakni,
untuk nilai Accuracy sebesar 94,12 %, Precision 94,4 % dan Recall 95,6 %. Sedangkan untuk
gambaran pohon keputusan yang diperoleh menggunakan aplikasi rapidminer terdapat di
gambar 5
Decision tree yang ditunjukan pada gambar 5 merupakan hasil dari eksplorasi data yang
sudah diimport pada aplikasi rapidminer, dari pohon keputusan tersebut juga diketahui
hubungan dari variabel input dengan variabel target. dengan pemanfaatan algoritma tersebut
maka keputusan dapat diselesaikan dengan lebih sederhana[13]. Setelah dilakukan pengujian
data dengan aplikasi Rapidminer maka pengujian data selanjutnya dilakukan dengan aplikasi
weka, berikut adalah tahapan yang dilakukan pengujian data dengan menggunakan aplikasi
weka.
Hijrah, et., al [Analisis RapidMiner Dan Weka Dalam Memprediksi Kualitas Kinerja Karyawan Menggunakan
Metode Algoritma C4.5]
IJCCS Vol. x, No. x: frst_page–end_
1661 Jatisi ISSN 2407-4322
Vol. 9, No. 2, Juni 2022, Hal. 1655-1665 E-ISSN 2503-2933
Pada gambar 6 dapat dilihat proses import data yang akan diuji dengan aplikasi weka,
Pemodelan dengan aplikasi weka juga dilakukan dengan algoritma c4.5 untuk mengevaluasi
hasil analisis yang dilakukan dengan data training yang sudah diimport pada aplikasi data
mining tersebut [17]. Setelah data diimport maka dilakukan proses mining seperti pada gambar
7 untuk memperoleh informasi yang dibutuhkan dari data uji yang dianalisis.
Gambar diatas merupakan proses kalsifikasi dengan menggunakan weka, aplikasi weka
mendukung banyak proses klasifikasi pengguna aplikasi hanya mengimport data yang akan diuji
serta memilih algoritma pengujiannnya maka aplikasi akan meproses data serta menampilkan
Hijrah, et., al [Analisis RapidMiner Dan Weka Dalam Memprediksi Kualitas Kinerja Karyawan Menggunakan
Metode Algoritma C4.5]
Jatisi ISSN 2407-4322
Vol. 9, No. 2, Juni 2022, Hal. 1655-1665 E-ISSN 2503-2933 1662
tingkat akurasi, kegagalan dan proses klasifikasinya [18]. Sedangkan untuk output dari proses
mining yang dilakukan pada gambar 8 seperti dibawah ini.
Terbentuk dari data uji yang dimasukan pada aplikasi weka, perbedaan yang terlihat
diantara pohon keputusan pada weka dan rapidminer terlihat pada visualisasi gambarnya. Pohon
keputusan yang dihasilkan oleh aplikasi weka dinterpretasikan dengan angka sedangkan pada
pohon keputusan dengan menggunakan rapidminer dinterpretasikan dengan warna. Sedangkan
hasil perbandingaan dari kedua aplikasi data mining tersebut dapat dianalisis dengan grafik yang
dapat dilihat pada gambar 10.
Hijrah, et., al [Analisis RapidMiner Dan Weka Dalam Memprediksi Kualitas Kinerja Karyawan Menggunakan
Metode Algoritma C4.5]
IJCCS Vol. x, No. x: frst_page–end_
1663 Jatisi ISSN 2407-4322
Vol. 9, No. 2, Juni 2022, Hal. 1655-1665 E-ISSN 2503-2933
98,6
95,6
94,12 94,4
93,6
92,72
Dari grafik yang disajikan maka perolehan nilai dari kedua Aplikasi tersebut dapat
disimpulkan bahwa nilai Acuracy dan Recall yang diperoleh dari pencarian nilai confusion
matrix menggunakan Aplikasi rapid miner lebih besar dibandingkan dengan Aplikasi weka.
Sedangkan pada Aplikasi weka hanya nilai precision saja yang lebih tinggi jika di bandingkan
dengan Aplikasi rapid miner.
4. KESIMPULAN
Pengujian data kinerja karyawan pada penelitian ini dilakukan dengan metode C45, dari
pengujian menggunakan aplikasi data mining Rapid Miner 7.6.0.0.1 dan Weka 3.8.1. maka
diperoleh hasil aplikasi rapidminer lebih baik dari segi Accuracy sebesar 94,12 % dan Recall
95,6 %. Sedangkan aplikasi weka lebih unggul dari segi Precision 98,6 %.
5. SARAN
Pengujian aplikasi data mining ini dapat menghasilkan nilai yang berbeda jika
pengujiannya dilakukan dengan data uji yang berbeda serta algoritma yang digunakan juga
berbeda sehingga dibutuhkan lebih banyak pengujian lainnya untuk memperkuat penelitian yang
sudah dilakukan.
DAFTAR PUSTAKA
[1] S. Widaningsih, “Perbandingan Metode Data Mining Untuk Prediksi Nilai dan
Waktu Kelulusan Mahasiswa Prodi Teknik Informatika Dengan Algoritma C4,5,
Naïve Bayes, KNN dan SVM,” J. Tekno Insentif, Vol. 13, No. 1, pp. 16–25, 2019,
doi: 10.36787/jti.v13i1.78.
Hijrah, et., al [Analisis RapidMiner Dan Weka Dalam Memprediksi Kualitas Kinerja Karyawan Menggunakan
Metode Algoritma C4.5]
Jatisi ISSN 2407-4322
Vol. 9, No. 2, Juni 2022, Hal. 1655-1665 E-ISSN 2503-2933 1664
[2] S. N. Evita, W. O. Z. Muizu, and Raden Tri Wayu Atmojo, “Penilaian Kinerja
Karyawan Dengan Menggunakan Metode Behaviorally Anchor Rating Scale dan
Management By Objectives (Studi Kasus pada PT Qwords Company
International),” Pekbis J., Vol. 9, No. 1, pp. 18–32, 2017.
[5] M. Faid, M. Jasri, and T. Rahmawati, “Perbandingan Kinerja Tool Data Mining
Weka dan Rapidminer Dalam Algoritma Klasifikasi,” Teknika, Vol. 8, No. 1, pp.
11–16, 2019, doi: 10.34148/teknika.v8i1.95.
[6] A.- Arini, L. K. Wardhani, and D.- Octaviano, “Perbandingan Seleksi Fitur
Term Frequency & Tri-Gram Character Menggunakan Algoritma Naïve Bayes
Classifier (Nbc) pada Tweet Hashtag #2019gantipresiden,” Kilat, Vol. 9, No. 1,
pp. 103–114, 2020, doi: 10.33322/kilat.v9i1.878.
Hijrah, et., al [Analisis RapidMiner Dan Weka Dalam Memprediksi Kualitas Kinerja Karyawan Menggunakan
Metode Algoritma C4.5]
IJCCS Vol. x, No. x: frst_page–end_
1665 Jatisi ISSN 2407-4322
Vol. 9, No. 2, Juni 2022, Hal. 1655-1665 E-ISSN 2503-2933
[14] A. Saifudin, “Metode Data Mining Untuk Seleksi Calon Mahasiswa,” Vol. 10,
No. 1, pp. 25–36, 2018.
[15] I. Budiman and R. Ramadina, “Penerapan Fungsi Data Mining Klasifikasi Untuk
Prediksi Masa Studi Mahasiswa Tepat Waktu pada Sistem Informasi Akademik
Perguruan Tinggi,” Ijccs, Vol. X, No.X, No. 1, pp. 1–5, 2015.
Hijrah, et., al [Analisis RapidMiner Dan Weka Dalam Memprediksi Kualitas Kinerja Karyawan Menggunakan
Metode Algoritma C4.5]