Anda di halaman 1dari 60

LAPORAN PENUGASAN

ANALISIS KEPUTUSAN DATA MINING


MODUL KLASIFIKASI

Nama : Pipit Gupitan Kelompok : D-10


NIM : 16522071 Kelas : D
Nama : Tanggal Praktikum : 12 Desember 2018
NIM : Hari Praktikum : Rabu
Asisten : DM – 64 Dikumpulkan Tanggal :
Kriteria Penilaian Yogyakarta…………………..2018
Format :
Isi :
Analisa :
TOTAL : (DM - 64)

LABORATORIUM STASISTIKA INDUSTRI & OPTIMASI


JURUSAN TEKNIK INDUSTRI
FAKULTAS TEKNOLOGI INDUSTRI
UNIVERSITAS ISLAM INDONESIA
2018
BAB I PENDAHULUAN

1.1 Deskripsi Permasalahan


Sumber Daya Manusia (SDM) merupakan salah satu faktor strategis
perusahaan yang memberikan nilai tambah sebagai tolok ukur keberhasilan bisnis
suatu perusahaan. Kemampuan SDM merupakan competitive advantage dari
perusahaan. Untuk dapat menjadi tiang utama pembentuk daya saing perlu
dilakukan upaya peningkatan kinerja sumber daya manusia.
Menurut (Soetjipto, 2008), dalam suatu organisasi seringkali terjadi
pemutusan hubungan kerja (PHK), tidak cuma karyawan biasa, manajer pun
banyak yang menjadi korban. Dengan jumlah individu yang semakin sedikit,
seorang atasan kini rela untuk tidak memiliki bawahan sebanyak dulu. Kondisi
tersebut membuat semakin tingginya ketergantungan atasan pada bawahan.
Atasan menjadi sangat berkepentingan terhadap kinerja bawahan. Aspek yang
menjadi perhatian atasan bukanlah sekedar kinerja bawahan pada saat ini
melainkan lebih kepada bagaimana memperbaiki kinerja bawahan secara terus
menerus (continuous improvement).
Kinerja yang baik merupakan cerminan dari perilaku yang baik sehingga
dengan kinerja yang baik akan membuahkan produktivitas yang baik. Salah satu
upaya yang dapat dilakukan untuk meningkatkan kinerja sumber daya manusia
adalah dengan melakukan penilaian prestasi kerja. Penilaian prestasi kerja sangat
penting bagi suatu organisasi. Dengan penilaian prestasi kerja suatu organisasi
dapat melihat sejauh mana faktor manusia dapat menunjang tujuan suatu
organisasi. Selain itu melalui penilaian prestasi kerja organisasi dapat memilih
dan menempatkan orang yang tepat untuk menduduki suatu jabatan tertentu
secara objektif (Thoha, 2001).
Selain itu penilaian prestasi kerja dapat membantu seorang pimpinan
dalam mengantisipasi dan mencegah ketidakpuasan karyawan. Perubahan sikap
karyawan merupakan tanda-tanda adanya perubahan dalam kepuasan kerja
karyawan. Melihat pentingnya penilaian prestasi kerja baik bagi perusahaan
maupun karyawan maka proses penilaian prestasi kerja harus dilakukan secara
objektif dan menyeluruh. Penilaian prestasi kerja yang objektif akan memberikan
umpan balik antara atasan dan bawahan yang sinergi. Bawahan lambat laun akan
memahami objektifitas kerja dan mampu mendorong iklim produktivitas
perusahaan.
Pada studi kasus ini, terdapat beberapa variabel yang memengaruhi
penilaian evaluasi kinerja karyawan. Terdapat enam indikator yang memengaruhi,
yaitu kedisiplinan, manajerial, komunikasi, inisiatif, prestasi kerja, produktivitas,
dan komunikasi. Salah satu metode klasifikasi adalah metode decision tree. Pada
studi kasus ini metode decision tree digunakan untuk mengetahui rule apa saja
yang dihasilkan untuk memutuskan penilaian evaluasi kinerja terhadap karyawan
apakah karyawan tersebut layak atau tidak layak.

1.2 Rumusan Masalah


Rumusan masalah dari penelitian ini adalah :
1. Bagaimana rekomendasi dari rule yang terbentuk dari analisis klasifikasi
pada penilaian evaluasi kinerja terhadap karyawan menggunakan algoritma
Decision Tree?
2. Bagaimana perbandingan hasil prediksi menggunakan algoritma Decision
Tree?

1.3 Tujuan Penelitian


Tujuan dari penelitian ini adalah :
1. Mampu menjelaskan rekomendasi dari rule yang terbentuk dari analisis
klasifikasi pada penilaian evaluasi kinerja terhadap karyawan menggunakan
algoritma Decision Tree.
2. Mampu membandingkan hasil prediksi menggunakan algoritma Decision
Tree.
BAB II TINJAUAN PUSTAKA

2.1 Kajian Deduktif


2.1.1 Klasifikasi
Klasifikasi adalah proses untuk menemukan model atau fungsi yang
menjelaskan atau membedakan konsep atau kelas data, dengan tujuan untuk dapat
memperkirakan kelas dari suatu objek yang labelnya tidak diketahui. Model itu
sendiri bisa berupa aturan “jika-maka”, berupa decision tree, formula matematis atau
neural network. Proses classification biasanya dibagi menjadi dua fase, yaitu learning
dan test. Pada fase learning, sebagian data yang telah diketahui kelas datanya
diumpankan untuk membentuk model perkiraan. Kemudian pada fase test model
yang sudah terbentuk diuji dengan sebagian data lainnya untuk mengetahui akurasi
dari model tersebut. Bila akurasinya mencukupi model ini dapat dipakai untuk
prediksi kelas data yang belum diketahui. Menurut (Gorunescu, 2011), proses
klasifikasi didasarkan pada empat komponen dasar, yaitu :
a. Kelas (class) atau label kelas yaitu variabel dependen dari model yang
merupakan variabel kategori yang menjelaskan sebuah 'label' pada objek
setelah proses klasifikasi. Contoh : loyalitas pelanggan (label : loyal / tidak
loyal), kelas bintang (galaksi), dll.
b. Prediktor (predictor) atau atribut (attribute) yaitu variabel independen dari
model yang diwakili oleh karakteristik (atribut) dari data yang akan
diklasifikasikan dan berdasarkan klasifikasi yang dibuat. Contoh prediktor
tersebut adalah merokok, konsumsi alkohol, tekanan darah, frekuensi
pembelian, status perkawinan, dan kecepatan angin, musim, dll.
c. Training set atau dataset latihan (training dataset) yaitu merupakan kumpulan
data yang berisi nilai-nilai atau record untuk dua komponen sebelumnya
(kelas dan prediktor / atribut) dapat berupa variabel kontinyu maupun
kategoris, dan digunakan untuk 'pelatihan' atau pembangunan model untuk
menyesuaikan dengan kelasnya berdasarkan prediktor yang tersedia. Contoh
set tersebut adalah kelompok pasien diidentifikasi pada kasus serangan
jantung berdasarkan faktor-faktor yang mempengaruhinya, kelompok
pelanggan dari supermarket, dll.
d. Dataset pengujian (testing dataset) yaitu berisi data baru yang akan
diklasifikasikan oleh model klasifikasi (classifier) dan untuk mengukur
tingkat akurasi klasifikasi (kinerja model) sehingga performansi model
klasifikasi dapat dievaluasi.

2.1.2 Decision Tree


Decision Tree adalah sebuah struktur pohon, dimana setiap node pohon
merepresentasikan atribut yang telah diuji, setiap cabang merupakan suatu pembagian
hasil uji, dan node daun (leaf) merepresentasikan kelompok kelas tertentu. Level
node teratas dari sebuah Decision Tree adalah node akar (root) yang biasanya berupa
atribut yang paling memiliki pengaruh terbesar pada suatu kelas tertentu (Sabna,
2010). Pada umumnya Decision Tree melakukan strategi pencarian secara top-down
untuk solusinya. Pada proses mengklasifikasi data yang tidak diketahui, nilai atribut
akan diuji dengan cara melacak jalur dari node akar (root) sampai node akhir (daun)
dan kemudian akan diprediksi kelas yang dimiliki oleh suatu data baru tertentu.

Gambar 2.1 Susunan Pohon Keputusan

2.1.3 Entropy dan Information Gain


Sebuah obyek yang diklasifikasikan dalam pohon harus dites nilai entropinya.
Entropy adalah ukuran dari teori informasi yang dapat mengetahui karakteristik dari
kumpulan data. Dari nilai entropy tersebut kemudian dihitung nilai information gain
(IG) masing-masing atribut.

Setelah mendapat nilai entropy untuk suatu kumpulan data, maka kita dapat
mengukur efektivitas suatu atribut dalam mengklasifikasikan data. Ukuran efektifitas
ini disebut information gain.Secara matematis, infomation gain dari suatu atribut A,
dituliskan sebagai berikut :

2.2 Kajian Induktif


Tabel 2.1 Kajian Literatur

No. Judul Hasil Kesimpulan


1. ALGORITMA C4.5 Berdasarkan evaluasi yang Dengan adanya
UNTUK dilakukan dapat diketahui sistem, pengolahan
PENILAIAN bahwa proses pembentukan data meliputi
KINERJA pohon menggunakan teknik penempatan dan
KARYAWAN pruning memiliki kecepatan kinerja karyawan
(Julianto, 2014) yang lebih tinggi karena dapat dilakukan
penyederhanaan pohon, tetapi dengan mudah dan
tidak selalu memliki akurasi cepat yang
yang lebih besar. Perbedaan dilakukan pada
pohon keputusan yang proses monitoring
dihasilkan disebabkan oleh karyawan untuk
perbedaan jumlah data penentuan kenaikan
training yang digunakan pada gaji atau promosi
masing-masing partisi. jabatan.
Pohon keputusan Partisi A
menggunakan teknik pruning
dengan jumlah data training
lebih besar daripada data
testing memiliki akurasi
tertinggi dibandingkan
dengan
pohon keputusan yang lain,
yaitu mencapai 90 %.
2. PREDIKSI Evaluasi hasil klasifikasi Dengan
No. Judul Hasil Kesimpulan
KOMPETENSI dalam prediksi kompetensi menggunakan
KARYAWAN menggunakan data training Algoritma C4.5
MENGGUNAKAN dengan Confusion Matrix maka kompetensi
ALGORITMA C4.5 tingkat akurasi sebesar 78.64 karyawan dapat di
(STUDI KASUS : % dan data testing tingkat prediksi dengan hal
PT HANKOOK akurasi sebesar 56.00%. Jika tersebut dapat
TIRE INDONESIA) melihat dengan kurva ROC dijadikan
(Sunge, 2018) menggunakan data training konstribusi terhadap
dengan akurasi Exellent proses pengambilan
Clasification sebesar 0.907 keputusan bagi
dan data testing dengan pihak perusahaan.
akurasi Fair Clasification
sebesar 0.783.
3. Analisis assigment Dari hasil penelitian ini Dapat disimpulkan
problem disimpulkan bahwa bahwa hipotesis
berdasarkan penugasan yang dilakukan peneliti sudah
penilaian kinerja oleh perusahaan saat ini optimal karena
karyawan sudah optimal, berdasarkan sesuai dengan
menggunakan hasil produksi sebesar 378 alokasi penugasan
metode hungarian (ratusan ton) dan penilaian pada tahun 2015.
(Hungarian Method) kinerja dengan total skor 356.
dan pohon
keputusan (Decision
Tree)
(Husniati, 2017)
BAB III METODOLOGI PENELITIAN

3.1 Objek Penelitian


Topik yang diteliti oleh peneliti adalah penilaian evaluasi kinerja terhadap
karyawan. Pada penelitian ini peneliti mendapat studi kasus mengenai PT. ABC
yang bergerak di bidang jasa. PT. ABC ingin mengetahui apakah kedisiplinan,
manajerial, komunikasi, inisiatif, prestasi kerja, produktivitas dan komunikasi.
berpengaruh terhadap kinerja karyawan.

3.2 Metode Pengumpulan Data


Metode pengumpulan data yang dilakukan oleh peneliti adalah
pengumpulan data historis. Data historis merupakan data yang diperoleh dari hasil
pengamatan dari waktu ke watu selama periode yang telah ditentukan. Data
historis pada penelitian ini adalah data yang terdapat pada studi kasus PT. ABC.

3.3 Jenis Data


Jenis data yang digunakan pada penelitian ini adala jenis data sekunder.
Data sekunder pada penelitian ini didapatkan dari jurnal-jurnal dan juga data
historis yang terdapat pada studi kasus PT. ABC.
3.4 Alur Penelitian
Berikut merupakan alur penelitian :

Mulai

Data Historis

Tinjauan Pustaka

Preprocessing Data

Uji Independensi
(Chi-Square)

Training Set dan


Testing Set

Pengolahan Data

Decision Tree

Pembentukan Rule

Prediksi

Selesai

Gambar 3.2 Alur Penelitian

Berikut penjelasan alur penelitian :


1. Data Historis
Data historis yang didapatkan peneliti dari studi kasus PT. ABC.
2. Tinjauan Pustaka
Mencari jurnal yang berkaitan dengan penelitian ini.
3. Preprocessing
Pada tahap ini, peneliti melakukan data cleaning pada data noise, tetapi dari
data tersebut tidak ditemukan data noise. Lalu, peneliti melakukan data
transformasi.
4. Uji Independensi (ChiSquare)
Uji independensi dengan menggunakan software SPSS yang bertujuan untuk
mengetahui apakah terdapat hubungan antara atribut dengan label.
5. Training set dan Testing Set
Data training set digunakan untuk pembangunan model untuk menyesuaikan
kelasnya. Data testing set digunakan untuk mengetahui nilai akurasi dan error
dari model yang terbentuk.
6. Pengolahan Data
Pengolahan data pada penelitian ini dilakukan dengan Ms. Excel dan software
Rapid Miner.
7. Decision Tree
Penentukan decision tree pada studi kasus PT. ABC.
8. Pembentukan Rule
Setelah pembentukan decision tree, peneliti dapat mengetahui jumlah rule
yang didapatkan.
9. Prediksi
Berdasarkan rule yang terbentuk, peneliti dapat memprediksi setiap record
yang ada.
BAB IV HASIL DAN PEMBAHASAN

4.1 Hasil dan Analisis Preprocessing Data


Tabel 4.2 merupakan data awal yang tidak dilakukan proses cleaning dan noise karena data tersebut sudah complete. Data awal berjumlah
100 dengan rincian sebagai berikut :
Tabel 4.2 Data Awal

ID Pekerja Kedisiplinan Manajerial Komunikasi Inisiatif Prestasi Kerja Produktivitas (%) Keputusan
1 8 6 9 6 3 100 Buruk
2 9 9 6 10 3 126 Baik
3 8 10 6 10 0 114 Baik
4 6 10 5 8 1 119 Baik
5 6 6 9 7 3 95 Buruk
6 7 7 8 6 1 146 Baik
7 10 10 5 5 3 141 Buruk
8 5 5 8 7 2 111 Buruk
9 10 10 7 10 3 116 Baik
10 10 8 8 8 6 134 Baik
11 5 8 7 10 1 148 Baik
12 6 8 5 7 5 111 Buruk
ID Pekerja Kedisiplinan Manajerial Komunikasi Inisiatif Prestasi Kerja Produktivitas (%) Keputusan
13 10 7 8 10 6 136 Baik
14 9 5 9 7 6 100 Baik
15 5 6 10 10 1 100 Buruk
16 6 5 7 10 4 90 Buruk
17 7 5 10 6 4 90 Buruk
18 9 7 10 5 0 134 Baik
19 10 8 7 8 5 102 Baik
20 7 5 10 9 0 115 Baik
21 7 8 6 6 0 133 Buruk
22 9 7 5 6 2 95 Buruk
23 10 8 9 9 1 106 Baik
24 8 9 7 7 0 92 Baik
25 5 6 6 7 5 115 Buruk
26 6 8 6 6 0 129 Buruk
27 5 8 6 10 5 140 Buruk
28 6 8 6 6 4 135 Buruk
29 10 7 10 8 1 115 Baik
30 10 10 7 8 0 145 Baik
31 8 6 10 9 1 114 Baik
ID Pekerja Kedisiplinan Manajerial Komunikasi Inisiatif Prestasi Kerja Produktivitas (%) Keputusan
32 5 6 10 7 4 119 Buruk
33 10 7 7 9 5 109 Baik
34 9 5 5 5 1 122 Buruk
35 10 6 5 7 0 102 Buruk
36 7 7 6 9 2 131 Baik
37 5 8 9 8 2 143 Baik
38 10 10 6 7 5 143 Baik
39 7 10 8 5 0 117 Baik
40 6 8 7 9 4 120 Baik
41 7 9 7 7 6 129 Baik
42 7 9 6 7 3 107 Baik
43 7 8 8 8 3 110 Baik
44 10 8 7 6 5 120 Baik
45 9 8 9 5 5 111 Baik
46 8 7 5 7 0 139 Baik
47 7 5 9 8 2 136 Baik
48 6 10 9 5 2 110 Buruk
49 5 8 8 9 4 128 Baik
50 10 9 10 9 5 114 Baik
ID Pekerja Kedisiplinan Manajerial Komunikasi Inisiatif Prestasi Kerja Produktivitas (%) Keputusan
51 6 9 5 10 6 126 Baik
52 9 6 9 10 6 139 Baik
53 5 5 8 9 0 94 Buruk
54 10 5 8 8 4 118 Buruk
55 5 10 10 7 1 135 Baik
56 5 7 6 10 4 93 Buruk
57 8 7 6 7 0 115 Buruk
58 7 5 9 5 5 100 Buruk
59 10 7 7 8 2 119 Baik
60 7 8 7 9 5 107 Baik
61 10 6 9 7 1 133 Buruk
62 8 9 9 9 2 90 Baik
63 7 7 9 7 2 109 Baik
64 10 9 5 10 2 136 Baik
65 7 6 5 5 1 112 Buruk
66 7 6 5 9 6 140 Buruk
67 10 6 7 9 1 102 Buruk
68 10 9 9 5 0 120 Buruk
69 7 9 5 9 1 96 Buruk
ID Pekerja Kedisiplinan Manajerial Komunikasi Inisiatif Prestasi Kerja Produktivitas (%) Keputusan
70 6 6 10 6 2 138 Buruk
71 6 9 6 7 1 134 Buruk
72 7 6 7 7 4 147 Baik
73 5 10 6 8 3 96 Buruk
74 6 9 6 5 5 91 Buruk
75 7 6 10 10 6 107 Baik
76 5 9 10 6 6 115 Buruk
77 10 10 10 10 3 126 Baik
78 8 6 7 5 3 143 Buruk
79 9 8 10 7 0 115 Baik
80 9 9 9 6 4 127 Baik
81 9 8 9 6 3 103 Baik
82 6 8 9 5 2 128 Buruk
83 10 5 6 8 4 150 Baik
84 9 5 5 7 0 150 Buruk
85 10 5 10 8 2 134 Baik
86 10 6 5 6 2 115 Buruk
87 5 6 7 6 1 148 Buruk
88 7 6 7 8 1 102 Buruk
ID Pekerja Kedisiplinan Manajerial Komunikasi Inisiatif Prestasi Kerja Produktivitas (%) Keputusan
89 5 5 7 8 6 98 Buruk
90 6 6 8 10 0 132 Buruk
91 5 6 9 8 4 98 Buruk
92 6 6 5 9 6 94 Buruk
93 8 10 6 8 6 121 Baik
94 6 6 10 6 3 91 Buruk
95 6 6 7 10 1 135 Buruk
96 6 7 9 8 3 127 Baik
97 6 5 5 10 1 117 Buruk
98 7 5 10 7 3 139 Baik
99 5 6 6 10 6 142 Buruk
100 5 8 10 8 4 116 Baik

Tabel 4.3 merupakan data transformasi sebelum pengujian uji independensi. Berikut merupakan rincian datanya :
Tabel 4.3 Data Transformasi

ID Pekerja Kedisiplinan Manajerial Komunikasi Inisiatif Prestasi Kerja Produktivitas (%) Keputusan
1 Sedang Rendah Tinggi Rendah Sedang Sedang Buruk
2 Tinggi Tinggi Rendah Tinggi Sedang Tinggi Baik
ID Pekerja Kedisiplinan Manajerial Komunikasi Inisiatif Prestasi Kerja Produktivitas (%) Keputusan
3 Sedang Tinggi Rendah Tinggi Sedikit Sedang Baik
4 Rendah Tinggi Rendah Sedang Sedikit Sedang Baik
5 Rendah Rendah Tinggi Sedang Sedang Rendah Buruk
6 Sedang Sedang Sedang Rendah Sedikit Tinggi Baik
7 Tinggi Tinggi Rendah Rendah Sedang Tinggi Buruk
8 Rendah Rendah Sedang Sedang Sedang Sedang Buruk
9 Tinggi Tinggi Sedang Tinggi Sedang Sedang Baik
10 Tinggi Sedang Sedang Sedang Banyak Tinggi Baik
11 Rendah Sedang Sedang Tinggi Sedikit Tinggi Baik
12 Rendah Sedang Rendah Sedang Sedang Sedang Buruk
13 Tinggi Sedang Sedang Tinggi Banyak Tinggi Baik
14 Tinggi Rendah Tinggi Sedang Banyak Sedang Baik
15 Rendah Rendah Tinggi Tinggi Sedikit Sedang Buruk
16 Rendah Rendah Sedang Tinggi Sedang Rendah Buruk
17 Sedang Rendah Tinggi Rendah Sedang Rendah Buruk
18 Tinggi Sedang Tinggi Rendah Sedikit Tinggi Baik
19 Tinggi Sedang Sedang Sedang Sedang Sedang Baik
20 Sedang Rendah Tinggi Tinggi Sedikit Sedang Baik
21 Sedang Sedang Rendah Rendah Sedikit Tinggi Buruk
ID Pekerja Kedisiplinan Manajerial Komunikasi Inisiatif Prestasi Kerja Produktivitas (%) Keputusan
22 Tinggi Sedang Rendah Rendah Sedang Rendah Buruk
23 Tinggi Sedang Tinggi Tinggi Sedikit Sedang Baik
24 Sedang Tinggi Sedang Sedang Sedikit Rendah Baik
25 Rendah Rendah Rendah Sedang Sedang Sedang Buruk
26 Rendah Sedang Rendah Rendah Sedikit Tinggi Buruk
27 Rendah Sedang Rendah Tinggi Sedang Tinggi Buruk
28 Rendah Sedang Rendah Rendah Sedang Tinggi Buruk
29 Tinggi Sedang Tinggi Sedang Sedikit Sedang Baik
30 Tinggi Tinggi Sedang Sedang Sedikit Tinggi Baik
31 Sedang Rendah Tinggi Tinggi Sedikit Sedang Baik
32 Rendah Rendah Tinggi Sedang Sedang Sedang Buruk
33 Tinggi Sedang Sedang Tinggi Sedang Sedang Baik
34 Tinggi Rendah Rendah Rendah Sedikit Tinggi Buruk
35 Tinggi Rendah Rendah Sedang Sedikit Sedang Buruk
36 Sedang Sedang Rendah Tinggi Sedang Tinggi Baik
37 Rendah Sedang Tinggi Sedang Sedang Tinggi Baik
38 Tinggi Tinggi Rendah Sedang Sedang Tinggi Baik
39 Sedang Tinggi Sedang Rendah Sedikit Sedang Baik
40 Rendah Sedang Sedang Tinggi Sedang Sedang Baik
ID Pekerja Kedisiplinan Manajerial Komunikasi Inisiatif Prestasi Kerja Produktivitas (%) Keputusan
41 Sedang Tinggi Sedang Sedang Banyak Tinggi Baik
42 Sedang Tinggi Rendah Sedang Sedang Sedang Baik
43 Sedang Sedang Sedang Sedang Sedang Sedang Baik
44 Tinggi Sedang Sedang Rendah Sedang Sedang Baik
45 Tinggi Sedang Tinggi Rendah Sedang Sedang Baik
46 Sedang Sedang Rendah Sedang Sedikit Tinggi Baik
47 Sedang Rendah Tinggi Sedang Sedang Tinggi Baik
48 Rendah Tinggi Tinggi Rendah Sedang Sedang Buruk
49 Rendah Sedang Sedang Tinggi Sedang Tinggi Baik
50 Tinggi Tinggi Tinggi Tinggi Sedang Sedang Baik
51 Rendah Tinggi Rendah Tinggi Banyak Tinggi Baik
52 Tinggi Rendah Tinggi Tinggi Banyak Tinggi Baik
53 Rendah Rendah Sedang Tinggi Sedikit Rendah Buruk
54 Tinggi Rendah Sedang Sedang Sedang Sedang Buruk
55 Rendah Tinggi Tinggi Sedang Sedikit Tinggi Baik
56 Rendah Sedang Rendah Tinggi Sedang Rendah Buruk
57 Sedang Sedang Rendah Sedang Sedikit Sedang Buruk
58 Sedang Rendah Tinggi Rendah Sedang Sedang Buruk
59 Tinggi Sedang Sedang Sedang Sedang Sedang Baik
ID Pekerja Kedisiplinan Manajerial Komunikasi Inisiatif Prestasi Kerja Produktivitas (%) Keputusan
60 Sedang Sedang Sedang Tinggi Sedang Sedang Baik
61 Tinggi Rendah Tinggi Sedang Sedikit Tinggi Buruk
62 Sedang Tinggi Tinggi Tinggi Sedang Rendah Baik
63 Sedang Sedang Tinggi Sedang Sedang Sedang Baik
64 Tinggi Tinggi Rendah Tinggi Sedang Tinggi Baik
65 Sedang Rendah Rendah Rendah Sedikit Sedang Buruk
66 Sedang Rendah Rendah Tinggi Banyak Tinggi Buruk
67 Tinggi Rendah Sedang Tinggi Sedikit Sedang Buruk
68 Tinggi Tinggi Tinggi Rendah Sedikit Sedang Buruk
69 Sedang Tinggi Rendah Tinggi Sedikit Rendah Buruk
70 Rendah Rendah Tinggi Rendah Sedang Tinggi Buruk
71 Rendah Tinggi Rendah Sedang Sedikit Tinggi Buruk
72 Sedang Rendah Sedang Sedang Sedang Tinggi Baik
73 Rendah Tinggi Rendah Sedang Sedang Rendah Buruk
74 Rendah Tinggi Rendah Rendah Sedang Rendah Buruk
75 Sedang Rendah Tinggi Tinggi Banyak Sedang Baik
76 Rendah Tinggi Tinggi Rendah Banyak Sedang Buruk
77 Tinggi Tinggi Tinggi Tinggi Sedang Tinggi Baik
78 Sedang Rendah Sedang Rendah Sedang Tinggi Buruk
ID Pekerja Kedisiplinan Manajerial Komunikasi Inisiatif Prestasi Kerja Produktivitas (%) Keputusan
79 Tinggi Sedang Tinggi Sedang Sedikit Sedang Baik
80 Tinggi Tinggi Tinggi Rendah Sedang Tinggi Baik
81 Tinggi Sedang Tinggi Rendah Sedang Sedang Baik
82 Rendah Sedang Tinggi Rendah Sedang Tinggi Buruk
83 Tinggi Rendah Rendah Sedang Sedang Tinggi Baik
84 Tinggi Rendah Rendah Sedang Sedikit Tinggi Buruk
85 Tinggi Rendah Tinggi Sedang Sedang Tinggi Baik
86 Tinggi Rendah Rendah Rendah Sedang Sedang Buruk
87 Rendah Rendah Sedang Rendah Sedikit Tinggi Buruk
88 Sedang Rendah Sedang Sedang Sedikit Sedang Buruk
89 Rendah Rendah Sedang Sedang Banyak Rendah Buruk
90 Rendah Rendah Sedang Tinggi Sedikit Tinggi Buruk
91 Rendah Rendah Tinggi Sedang Sedang Rendah Buruk
92 Rendah Rendah Rendah Tinggi Banyak Rendah Buruk
93 Sedang Tinggi Rendah Sedang Banyak Tinggi Baik
94 Rendah Rendah Tinggi Rendah Sedang Rendah Buruk
95 Rendah Rendah Sedang Tinggi Sedikit Tinggi Buruk
96 Rendah Sedang Tinggi Sedang Sedang Tinggi Baik
97 Rendah Rendah Rendah Tinggi Sedikit Sedang Buruk
ID Pekerja Kedisiplinan Manajerial Komunikasi Inisiatif Prestasi Kerja Produktivitas (%) Keputusan
98 Sedang Rendah Tinggi Sedang Sedang Tinggi Baik
99 Rendah Rendah Rendah Tinggi Banyak Tinggi Buruk
100 Rendah Sedang Tinggi Sedang Sedang Sedang Baik

Tabel 4.4 merupakan aturan transformasi data pada studi kasus yang telah diberikan. Berikut merupakan rincian aturannya :
Tabel 4.4 Aturan Transformasi

Aturan Transformasi
Rendah <7 Rendah <7
Kedisiplinan Sedang 7-8 Inisiatif Sedang 7-8
Tinggi >8 Tinggi >8
Rendah <7 Sedikit <2
Prestasi
Manajerial Sedang 7-8 Sedang 3-5
Kerja
Tinggi >8 Banyak >5
Rendah <7 Rendah <100
Komunikasi Sedang 7-8 Produktivitas Sedang 100-120
Tinggi >8 Tinggi >120
Tabel 4.5 merupakan tabel training set. Jumlah atribut yang digunakan dalam training set ini sebanyak 5 atribut. Jumlah atribut ini
mengalami pengurangan dari data transformasi setelah dilakukannya uji independensi. Data training set digunakan untuk membentuk
sebuah model. Data training set berjumlah 50 dengan menggunakan data 1-50, berikut merupakan rincian datanya :
Tabel 4.5 Training Set

ID Pekerja Kedisiplinan Manajerial Komunikasi Inisiatif Produktivitas (%) Keputusan


1 Sedang Rendah Tinggi Rendah Sedang Buruk
2 Tinggi Tinggi Rendah Tinggi Tinggi Baik
3 Sedang Tinggi Rendah Tinggi Sedang Baik
4 Rendah Tinggi Rendah Sedang Sedang Baik
5 Rendah Rendah Tinggi Sedang Rendah Buruk
6 Sedang Sedang Sedang Rendah Tinggi Baik
7 Tinggi Tinggi Rendah Rendah Tinggi Buruk
8 Rendah Rendah Sedang Sedang Sedang Buruk
9 Tinggi Tinggi Sedang Tinggi Sedang Baik
10 Tinggi Sedang Sedang Sedang Tinggi Baik
11 Rendah Sedang Sedang Tinggi Tinggi Baik
12 Rendah Sedang Rendah Sedang Sedang Buruk
13 Tinggi Sedang Sedang Tinggi Tinggi Baik
14 Tinggi Rendah Tinggi Sedang Sedang Baik
ID Pekerja Kedisiplinan Manajerial Komunikasi Inisiatif Produktivitas (%) Keputusan
15 Rendah Rendah Tinggi Tinggi Sedang Buruk
16 Rendah Rendah Sedang Tinggi Rendah Buruk
17 Sedang Rendah Tinggi Rendah Rendah Buruk
18 Tinggi Sedang Tinggi Rendah Tinggi Baik
19 Tinggi Sedang Sedang Sedang Sedang Baik
20 Sedang Rendah Tinggi Tinggi Sedang Baik
21 Sedang Sedang Rendah Rendah Tinggi Buruk
22 Tinggi Sedang Rendah Rendah Rendah Buruk
23 Tinggi Sedang Tinggi Tinggi Sedang Baik
24 Sedang Tinggi Sedang Sedang Rendah Baik
25 Rendah Rendah Rendah Sedang Sedang Buruk
26 Rendah Sedang Rendah Rendah Tinggi Buruk
27 Rendah Sedang Rendah Tinggi Tinggi Buruk
28 Rendah Sedang Rendah Rendah Tinggi Buruk
29 Tinggi Sedang Tinggi Sedang Sedang Baik
30 Tinggi Tinggi Sedang Sedang Tinggi Baik
31 Sedang Rendah Tinggi Tinggi Sedang Baik
32 Rendah Rendah Tinggi Sedang Sedang Buruk
33 Tinggi Sedang Sedang Tinggi Sedang Baik
ID Pekerja Kedisiplinan Manajerial Komunikasi Inisiatif Produktivitas (%) Keputusan
34 Tinggi Rendah Rendah Rendah Tinggi Buruk
35 Tinggi Rendah Rendah Sedang Sedang Buruk
36 Sedang Sedang Rendah Tinggi Tinggi Baik
37 Rendah Sedang Tinggi Sedang Tinggi Baik
38 Tinggi Tinggi Rendah Sedang Tinggi Baik
39 Sedang Tinggi Sedang Rendah Sedang Baik
40 Rendah Sedang Sedang Tinggi Sedang Baik
41 Sedang Tinggi Sedang Sedang Tinggi Baik
42 Sedang Tinggi Rendah Sedang Sedang Baik
43 Sedang Sedang Sedang Sedang Sedang Baik
44 Tinggi Sedang Sedang Rendah Sedang Baik
45 Tinggi Sedang Tinggi Rendah Sedang Baik
46 Sedang Sedang Rendah Sedang Tinggi Baik
47 Sedang Rendah Tinggi Sedang Tinggi Baik
48 Rendah Tinggi Tinggi Rendah Sedang Buruk
49 Rendah Sedang Sedang Tinggi Tinggi Baik
50 Tinggi Tinggi Tinggi Tinggi Sedang Baik
Tabel 4.6 merupakan tabel testing set. Data testing set ini digunakan untuk mengetahui tingkat akurasi dari model yang telah terbentuk.
Data training set berjumlah 50 dengan menggunakan data 51-100. Berikut merupakan rincian datanya :
Tabel 4.6 Testing Data

ID Pekerja Kedisiplinan Manajerial Komunikasi Inisiatif Produktivitas (%) Keputusan


51 Rendah Tinggi Rendah Tinggi Tinggi Baik
52 Tinggi Rendah Tinggi Tinggi Tinggi Baik
53 Rendah Rendah Sedang Tinggi Rendah Buruk
54 Tinggi Rendah Sedang Sedang Sedang Buruk
55 Rendah Tinggi Tinggi Sedang Tinggi Baik
56 Rendah Sedang Rendah Tinggi Rendah Buruk
57 Sedang Sedang Rendah Sedang Sedang Buruk
58 Sedang Rendah Tinggi Rendah Sedang Buruk
59 Tinggi Sedang Sedang Sedang Sedang Baik
60 Sedang Sedang Sedang Tinggi Sedang Baik
61 Tinggi Rendah Tinggi Sedang Tinggi Buruk
62 Sedang Tinggi Tinggi Tinggi Rendah Baik
63 Sedang Sedang Tinggi Sedang Sedang Baik
64 Tinggi Tinggi Rendah Tinggi Tinggi Baik
65 Sedang Rendah Rendah Rendah Sedang Buruk
ID Pekerja Kedisiplinan Manajerial Komunikasi Inisiatif Produktivitas (%) Keputusan
66 Sedang Rendah Rendah Tinggi Tinggi Buruk
67 Tinggi Rendah Sedang Tinggi Sedang Buruk
68 Tinggi Tinggi Tinggi Rendah Sedang Buruk
69 Sedang Tinggi Rendah Tinggi Rendah Buruk
70 Rendah Rendah Tinggi Rendah Tinggi Buruk
71 Rendah Tinggi Rendah Sedang Tinggi Buruk
72 Sedang Rendah Sedang Sedang Tinggi Baik
73 Rendah Tinggi Rendah Sedang Rendah Buruk
74 Rendah Tinggi Rendah Rendah Rendah Buruk
75 Sedang Rendah Tinggi Tinggi Sedang Baik
76 Rendah Tinggi Tinggi Rendah Sedang Buruk
77 Tinggi Tinggi Tinggi Tinggi Tinggi Baik
78 Sedang Rendah Sedang Rendah Tinggi Buruk
79 Tinggi Sedang Tinggi Sedang Sedang Baik
80 Tinggi Tinggi Tinggi Rendah Tinggi Baik
81 Tinggi Sedang Tinggi Rendah Sedang Baik
82 Rendah Sedang Tinggi Rendah Tinggi Buruk
83 Tinggi Rendah Rendah Sedang Tinggi Baik
84 Tinggi Rendah Rendah Sedang Tinggi Buruk
ID Pekerja Kedisiplinan Manajerial Komunikasi Inisiatif Produktivitas (%) Keputusan
85 Tinggi Rendah Tinggi Sedang Tinggi Baik
86 Tinggi Rendah Rendah Rendah Sedang Buruk
87 Rendah Rendah Sedang Rendah Tinggi Buruk
88 Sedang Rendah Sedang Sedang Sedang Buruk
89 Rendah Rendah Sedang Sedang Rendah Buruk
90 Rendah Rendah Sedang Tinggi Tinggi Buruk
91 Rendah Rendah Tinggi Sedang Rendah Buruk
92 Rendah Rendah Rendah Tinggi Rendah Buruk
93 Sedang Tinggi Rendah Sedang Tinggi Baik
94 Rendah Rendah Tinggi Rendah Rendah Buruk
95 Rendah Rendah Sedang Tinggi Tinggi Buruk
96 Rendah Sedang Tinggi Sedang Tinggi Baik
97 Rendah Rendah Rendah Tinggi Sedang Buruk
98 Sedang Rendah Tinggi Sedang Tinggi Baik
99 Rendah Rendah Rendah Tinggi Tinggi Buruk
100 Rendah Sedang Tinggi Sedang Sedang Baik
4.2 Hasil dan Analisis Uji Independensi (Chi-Square) menggunakan SPSS
Uji independensi (Chi-Square) digunakan untuk mengetahui ada tidaknya
hubungan atribut dengan label kelas. Berikut merupakan hasil yang diperoleh dari
uji indendensi masing-masing atribut :
a. Kedisiplinan dengan Keputusan
Tabel 4.7 Kedisiplinan dengan Keputusan

Berdasarkan Tabel 4.7 diperoleh nilai signifikansi Pearson Chi-Square


sebesar 0,000 dimana nilai tersebut ≤ 0,05 sehingga Ho ditolak. Dari hasil
tersebut dapat disimpulkan bahwa terdapat hubungan atribut kedisiplinan
dengan keputusan yang diambil. Sehingga, atribut kedisiplinan dapat
digunakan dalam tahap pengolahan data selanjutnya.

b. Manajerial dengan Keputusan


Tabel 4.8 Manajerial dengan Keputusan

Berdasarkan Tabel 4.8 diperoleh nilai signifikansi Pearson Chi-Square


sebesar 0,000 dimana nilai tersebut ≤ 0,05 sehingga Ho ditolak. Dari hasil
tersebut dapat disimpulkan bahwa terdapat hubungan atribut manajerial
dengan keputusan yang diambil. Sehingga, atribut manajerial dapat
digunakan dalam tahap pengolahan data selanjutnya.

c. Komunikasi dengan Keputusan


Tabel 4.9 Komunikasi dengan Keputusan

Berdasarkan Tabel 4.9 diperoleh nilai signifikansi Pearson Chi-Square


sebesar 0,019 dimana nilai tersebut ≤ 0,05 sehingga Ho ditolak. Dari hasil
tersebut dapat disimpulkan bahwa terdapat hubungan atribut komunikasi
dengan keputusan yang diambil. Sehingga, atribut komunikasi dapat
digunakan dalam tahap pengolahan data selanjutnya.

d. Inisiatif dengan Keputusan


Tabel 4.10 Inisiatif dengan Keputusan

Berdasarkan Tabel 4.10 diperoleh nilai signifikansi Pearson Chi-Square


sebesar 0,006 dimana nilai tersebut ≤ 0,05 sehingga Ho ditolak. Dari hasil
tersebut dapat disimpulkan bahwa terdapat hubungan atribut inisiatif dengan
keputusan yang diambil. Sehingga, atribut inisiatif dapat digunakan dalam
tahap pengolahan data selanjutnya.

e. Prestasi Kerja dengan Keputusan


Tabel 4.11 Prestasi Kerja dengan Keputusan

Berdasarkan Tabel 4.11 diperoleh nilai signifikansi Pearson Chi-Square


sebesar 0,478 dimana nilai tersebut > 0,05 sehingga Ho diterima. Dari hasil
tersebut dapat disimpulkan bahwa tidak terdapat hubungan atribut prestasi
kerja dengan keputusan yang diambil. Sehingga, atribut prestasi kerja tidak
dapat digunakan dalam tahap pengolahan data selanjutnya.

f. Produktivitas dengan Keputusan


Tabel 4.12 Produktivitas dengan Keputusan

Berdasarkan Tabel 4.12 diperoleh nilai signifikansi Pearson Chi-Square


sebesar 0,005 dimana nilai tersebut ≤ 0,05 sehingga Ho ditolak. Dari hasil
tersebut dapat disimpulkan bahwa terdapat hubungan atribut produktivitas
dengan keputusan yang diambil. Sehingga, atribut produktivitas dapat
digunakan dalam tahap pengolahan data selanjutnya.
4.3 Hasil dan Analisis Klasifikasi menggunakan algoritma decision tree pada Ms. Excel
Berikut merupakan langkah-langkah dalam pemilihan root node, internal node, dan leaf node :
1. Pemilihan Root Node
Tabel 4.13 Perhitungan Atribut Kedisiplinan

Record dalam
Kedisiplinan Hasil Jumlah Q Enteropi Nilai Informasi Information Gain
Instance
Baik 5
Rendah 16 Q1 0,89604
Buruk 11
Baik 12
Sedang 15 Q2 0,72193 0,785455939 0,942683189 0,15722725
Buruk 3
Baik 15
Tinggi 19 Q3 0,74249
Buruk 4
TOTAL 50

Tabel 4.14 Perhitungan Atribut Manajerial

Record dalam
Manajerial Hasil Jumlah Q Enteropi Nilai Informasi Information Gain
Instance
Baik 4
Rendah 14 Q1 0,86312
Buruk 10
Baik 17
Sedang 23 Q2 0,82806 0,783618763 0,942683189 0,159064426
Buruk 6
Baik 11
Tinggi 13 Q3 0,61938
Buruk 2
TOTAL 50
Tabel 4.15 Perhitungan Atribut Komunikasi

Record dalam
Komunikasi Hasil Jumlah Q Enteropi Nilai Informasi Information Gain
Instance
Baik 7
Rendah 17 Q1 0,97742
Buruk 10
Baik 15
Sedang 17 Q2 0,52256 0,815411126 0,942683189 0,127272063
Buruk 2
Baik 10
Tinggi 16 Q3 0,95443
Buruk 6
TOTAL 50

Tabel 4.16 Perhitungan Atribut Komunikasi

Record dalam
Inisiatif Hasil Jumlah Q Enteropi Nilai Informasi Information Gain
Instance
Baik 5
Rendah 14 Q1 0,94029
Buruk 9
Baik 14
Sedang 20 Q2 0,88129 0,838584351 0,942683189 0,104098838
Buruk 6
Baik 13
Tinggi 16 Q3 0,69621
Buruk 3
TOTAL 50
Tabel 4.17 Perhitungan Atribut Produktivitas

Record dalam
Produktivitas Hasil Jumlah Q Enteropi Nilai Informasi Information Gain
Instance
Baik 1
Rendah 5 Q1 0,72193
Buruk 4
Baik 17
Sedang 25 Q2 0,90438 0,876899898 0,942683189 0,065783291
Buruk 8
Baik 14
Tinggi 20 Q3 0,88129
Buruk 6
TOTAL 50
Dari perhitungan tabel diatas, atribut dengan nilai information gain tertinggi adalah atribut manajerial. Sehingga, atribut manajerial
terpilih menjadi root node. Untuk manajerial rendah, sedang, dan tinggi belum bisa diputuskan.

2. Menentukan Internal Node saat Manajerial Rendah


Tabel 4.18 Perhitungan Atribut Kedisiplinan saat Manajerial Rendah

Record dalam
Kedisiplinan Hasil Jumlah Q Enteropi Nilai Informasi Information Gain
Instance
Baik 0
Rendah 6 Q1 0
Buruk 6
Baik 3
Sedang 5 Q2 0,97095 0,543545748 0,863120569 0,31957482
Buruk 2
Baik 1
Tinggi 3 Q3 0,9183
Buruk 2
TOTAL 14
Tabel 4.19 Perhitungan Atribut Komunikasi saat Manajerial Rendah

Record dalam
Komunikasi Hasil Jumlah Q Enteropi Nilai Informasi Information Gain
Instance
Baik 0
Rendah 3 Q1 0
Buruk 3
Baik 0
Sedang 2 Q2 0 0,637120324 0,863120569 0,226000244
Buruk 2
Baik 4
Tinggi 9 Q3 0,99108
Buruk 5
TOTAL 14

Tabel 4.20 Perhitungan Atribut Inisiatif saat Manajerial Rendah

Record dalam
Inisiatif Hasil Jumlah Q Enteropi Nilai Informasi Information Gain
Instance
Baik 0
Rendah 3 Q1 0
Buruk 3
Baik 2
Sedang 7 Q2 0,86312 0,71727457 0,863120569 0,145845999
Buruk 5
Baik 2
Tinggi 4 Q3 1
Buruk 2
TOTAL 14
Tabel 4.21 Perhitungan Atribut Produkivitas saat Manajerial Rendah

Record dalam
Produktivitas Hasil Jumlah Q Enteropi Nilai Informasi Information Gain
Instance
Baik 0
Rendah 3 Q1 0
Buruk 3
Baik 3
Sedang 9 Q2 0,9183 0,733190179 0,863120569 0,12993039
Buruk 6
Baik 1
Tinggi 2 Q3 1
Buruk 1
TOTAL 14
Dari perhitungan tabel diatas, atribut dengan nilai information gain tertinggi adalah atribut kedisiplinan. Sehingga, atribut
kedisiplinan terpilih menjadi internal node saat manajerial rendah. Tabel 4.18 menunjukkan bahwa saat kedisiplinan rendah
keputusaanya adalah buruk. Untuk kedisiplinan sedang dan tinggi belum bisa diputuskan.

3. Menentukan Internal Node saat Manajerial Rendah dan Kedisiplinan Sedang


Tabel 4.22 Perhitungan Atribut Komunikasi saat Manajerial Rendah dan Kedisiplinan Sedang

Record dalam
Komunikasi Hasil Jumlah Q Enteropi Nilai Informasi Information Gain
Instance
Baik 0
Rendah 0 Q1 0
Buruk 0
Baik 0 0,970950594 0,970950594 0
Sedang 0 Q2 0
Buruk 0
Tinggi Baik 3 5 Q3 0,97095
Record dalam
Komunikasi Hasil Jumlah Q Enteropi Nilai Informasi Information Gain
Instance
Buruk 2
TOTAL 5

Tabel 4.23 Perhitungan Atribut Inisiatif saat Manajerial Rendah dan Kedisiplinan Sedang

Record dalam
Inisiatif Hasil Jumlah Q Enteropi Nilai Informasi Information Gain
Instance
Baik 0
Rendah 2 Q1 0
Buruk 2
Baik 1
Sedang 1 Q2 0 0 0,970950594 0,970950594
Buruk 0
Baik 2
Tinggi 2 Q3 0
Buruk 0
TOTAL 5

Tabel 4.24 Perhitungan Atribut Produktivitas saat Manajerial Rendah dan Kedisiplinan Sedang

Record dalam
Produktivitas Hasil Jumlah Q Enteropi Nilai Informasi Information Gain
Instance
Baik 0
Rendah 1 Q1 0
Buruk 1
Baik 2 0,5509775 0,970950594 0,419973094
Sedang 3 Q2 0,9183
Buruk 1
Tinggi Baik 0 1 Q3 0
Record dalam
Produktivitas Hasil Jumlah Q Enteropi Nilai Informasi Information Gain
Instance
Buruk 1
TOTAL 5

Dari perhitungan tabel diatas, atribut dengan nilai information gain tertinggi adalah atribut inisiatif. Sehingga, atribut inisiatif terpilih
menjadi internal node saat manajerial rendah dan kedisiplinan sedang. Tabel 4.23 menunjukkan bahwa saat inisiatif rendah
keputusaanya adalah buruk, saat inisiatif sedang keputusannya adalah baik, dan saat inisiatif tinggi keputusannya adalah baik.

4. Menentukan Internal Node saat Manajerial Rendah dan Kedisiplinan Tinggi


Tabel 4.25 Perhitungan Atribut Komunikasi saat Manajerial Rendah dan Kedisiplinan Tinggi

Record dalam
Komunikasi Hasil Jumlah Q Enteropi Nilai Informasi Information Gain
Instance
Baik 0
Rendah 2 Q1 0
Buruk 2
Baik 0
Sedang 0 Q2 0 0 0,918295834 0,918295834
Buruk 0
Baik 1
Tinggi 1 Q3 0
Buruk 0
TOTAL 3
Tabel 4.26 Perhitungan Atribut Inisiatif saat Manajerial Rendah dan Kedisiplinan Tinggi
Record dalam
Inisiatif Hasil Jumlah Q Enteropi Nilai Informasi Information Gain
Instance
Baik 0
Rendah 1 Q1 0
Buruk 1
Baik 1
Sedang 2 Q2 1 0,666666667 0,918295834 0,251629167
Buruk 1
Baik 0
Tinggi 0 Q3 0
Buruk 0
TOTAL 3

Tabel 4.27 Perhitungan Atribut Produktivitas saat Manajerial Rendah dan Kedisiplinan Tinggi

Record dalam
Produktivitas Hasil Jumlah Q Enteropi Nilai Informasi Information Gain
Instance
Baik 0
Rendah 0 Q1 0
Buruk 0
Baik 1
Sedang 2 Q2 1 0,666666667 0,918295834 0,251629167
Buruk 1
Baik 0
Tinggi 1 Q3 0
Buruk 1
TOTAL 3
Dari perhitungan tabel diatas, atribut dengan nilai information gain tertinggi adalah atribut komunikasi. Sehingga, atribut komunikasi
terpilih menjadi internal node saat manajerial rendah dan kedisiplinan tinggi. Tabel 4.25 menunjukkan bahwa saat komunikasi
rendah keputusaanya adalah buruk dan saat komunikasi tinggi keputusannya adalah baik.

5. Menentukan Internal Node saat Manajerial Sedang


Tabel 4.28 Perhitungan Atribut Kedisiplinan saat Manajerial Sedang

Record dalam
Kedisiplinan Hasil Jumlah Q Enteropi Nilai Informasi Information Gain
Instance
Baik 4
Rendah 8 Q1 1
Buruk 4
Baik 4
Sedang 5 Q2 0,72193 0,708678105 0,828055725 0,119377621
Buruk 1
Baik 9
Tinggi 10 Q3 0,469
Buruk 1
TOTAL 23

Tabel 4.29 Perhitungan Atribut Komunikasi saat Manajerial Sedang

Record dalam
Komunikasi Hasil Jumlah Q Enteropi Nilai Informasi Information Gain
Instance

Baik 2
Rendah 8 Q1 0,81128
Buruk 6 0,282183695 0,828055725 0,54587203
Sedang Baik 10 10 Q2 0
Record dalam
Komunikasi Hasil Jumlah Q Enteropi Nilai Informasi Information Gain
Instance

Buruk 0
Baik 5
Tinggi 5 Q3 0
Buruk 0
TOTAL 23

Tabel 4.30 Perhitungan Atribut Inisiatif saat Manajerial Sedang

Record dalam
Inisiatif Hasil Jumlah Q Enteropi Nilai Informasi Information Gain
Instance
Baik 4
Rendah 8 Q1 1
Buruk 4
Baik 6
Sedang 7 Q2 0,59167 0,716966304 0,828055725 0,111089421
Buruk 1
Baik 7
Tinggi 8 Q3 0,54356
Buruk 1
TOTAL 23

Tabel 4.31 Perhitungan Atribut Produktivitas saat Manajerial Sedang

Record dalam
Produktivitas Hasil Jumlah Q Enteropi Nilai Informasi Information Gain
Instance
Baik 0
Rendah 1 Q1 0 0,700248536 0,828055725 0,127807189
Buruk 1
Record dalam
Produktivitas Hasil Jumlah Q Enteropi Nilai Informasi Information Gain
Instance
Baik 8
Sedang 9 Q2 0,50326
Buruk 1
Baik 9
Tinggi 13 Q3 0,89049
Buruk 4
TOTAL 23

Dari perhitungan tabel diatas, atribut dengan nilai information gain tertinggi adalah atribut komunikasi. Sehingga, atribut komunikasi
terpilih menjadi internal node saat manajerial sedang. Tabel 4.29 menunjukkan bahwa saat komunikasi sedang keputusaanya adalah
baik, saat komunikasi tinggi keputusannya adalah baik, dan saat komunikasi rendah belum bisa diputuskan.

6. Menentukan Internal Node saat Manajerial Sedang dan Komunikasi Rendah


Tabel 4.32 Perhitungan Atribut Kedisiplinan saat Manajerial Sedang dan Komunikasi Rendah

Record dalam
Kedisiplinan Hasil Jumlah Q Enteropi Nilai Informasi Information Gain
Instance
Baik 0
Rendah 4 Q1 0
Buruk 4
Baik 2
Sedang 3 Q2 0,9183 0,344360938 0,811278124 0,466917187
Buruk 1
Baik 0
Tinggi 1 Q3 0
Buruk 1
TOTAL 8
Tabel 4.33 Perhitungan Atribut Inisiatif saat Manajerial Sedang dan Komunikasi Rendah

Record dalam
Inisiatif Hasil Jumlah Q Enteropi Nilai Informasi Information Gain
Instance
Baik 0
Rendah 4 Q1 0
Buruk 4
Baik 1
Sedang 2 Q2 1 0,5 0,811278124 0,311278124
Buruk 1
Baik 1
Tinggi 2 Q3 1
Buruk 1
TOTAL 8

Tabel 4.34 Perhitungan Atribut Produktivitas saat Manajerial Sedang dan Komunikasi Rendah

Record dalam
Produktivitas Hasil Jumlah Q Enteropi Nilai Informasi Information Gain
Instance
Baik 0
Rendah 1 Q1 0
Buruk 1
Baik 0
Sedang 1 Q2 0 0,688721876 0,811278124 0,122556249
Buruk 1
Baik 2
Tinggi 6 Q3 0,9183
Buruk 4
TOTAL 8

Dari perhitungan tabel diatas, atribut dengan nilai information gain tertinggi adalah atribut kedisiplinan. Sehingga, atribut
kedisiplinan terpilih menjadi internal node saat manajerial sedang dan komunikasi rendah. Tabel 4.32 menunjukkan bahwa saat
kedisiplinan rendah keputusannya adalah buruk, saat kedisiplinan tinggi keputusannya adalah buruk, dan saat kedisiplinan sedang
belum bisa diputuskan.

7. Menentukan Internal Node saat Manajerial Sedang, Komunikasi Rendah, dan Kedisiplinan Sedang
Tabel 4.35 Perhitungan Atribut Inisiatif saat Manajerial Sedang, Komunikasi Rendah, dan Kedisiplinan Sedang

Record dalam
Inisiatif Hasil Jumlah Q Enteropi Nilai Informasi Information Gain
Instance
Baik 0
Rendah 1 Q1 0
Buruk 1
Baik 1
Sedang 1 Q2 0 0 0,918295834 0,918295834
Buruk 0
Baik 1
Tinggi 1 Q3 0
Buruk 0
TOTAL 3

Tabel 4.36 Perhitungan Atribut Produktivitas saat Manajerial Sedang, Komunikasi Rendah, dan Kedisiplinan Sedang

Record dalam
Produktivitas Hasil Jumlah Q Enteropi Nilai Informasi Information Gain
Instance
Baik 0
Rendah 0 Q1 0
Buruk 0
Baik 0 0,918295834 0,918295834 0
Sedang 0 Q2 0
Buruk 0
Tinggi Baik 2 3 Q3 0,9183
Record dalam
Produktivitas Hasil Jumlah Q Enteropi Nilai Informasi Information Gain
Instance
Buruk 1
TOTAL 3

Dari perhitungan tabel diatas, atribut dengan nilai information gain tertinggi adalah atribut inisiatif. Sehingga, atribut inisiatif terpilih
menjadi internal node saat manajerial sedang, komunikasi rendah, dan kedisiplinan sedang. Tabel 4.35 menunjukkan bahwa saat
inisiatif rendah keputusannya adalah buruk, saat inisiatif sedang keputusannya adalah baik, dan saat inisiatif tinggi keputusannya
adalah baik.

8. Menentukan Internal Node saat Manajerial Tinggi


Tabel 4.37 Perhitungan Atribut Kedisiplinan saat Manajerial Tinggi

Record dalam
Kedisiplinan Hasil Jumlah Q Enteropi Nilai Informasi Information Gain
Instance
Baik 1
Rendah 2 Q1 1
Buruk 1
Baik 5
Sedang 5 Q2 0 0,453856502 0,619382195 0,165525692
Buruk 0
Baik 5
Tinggi 6 Q3 0,65002
Buruk 1
TOTAL 13
Tabel 4.38 Perhitungan Atribut Komunikasi saat Manajerial Tinggi

Record dalam
Komunikasi Hasil Jumlah Q Enteropi Nilai Informasi Information Gain
Instance
Baik 5
Rendah 6 Q1 0,65002
Buruk 1
Baik 5
Sedang 5 Q2 0 0,453856502 0,619382195 0,165525692
Buruk 0
Baik 1
Tinggi 2 Q3 1
Buruk 1
TOTAL 13

Tabel 4.39 Perhitungan Atribut Inisiatif saat Manajerial Tinggi

Record dalam
Inisiatif Hasil Jumlah Q Enteropi Nilai Informasi Information Gain
Instance
Baik 1
Rendah 3 Q1 0,9183
Buruk 2
Baik 6
Sedang 6 Q2 0 0,211914423 0,619382195 0,407467771
Buruk 0
Baik 4
Tinggi 4 Q3 0
Buruk 0
TOTAL 13
Tabel 4.40 Perhitungan Atribut Produktivitas saat Manajerial Tinggi

Record dalam
Produktivitas Hasil Jumlah Q Enteropi Nilai Informasi Information Gain
Instance
Baik 1
Rendah 1 Q1 0
Buruk 0
Baik 6
Sedang 7 Q2 0,59167 0,596257687 0,619382195 0,023124508
Buruk 1
Baik 4
Tinggi 5 Q3 0,72193
Buruk 1
TOTAL 13

Dari perhitungan tabel diatas, atribut dengan nilai information gain tertinggi adalah atribut inisiatif. Sehingga, atribut inisiatif terpilih
menjadi internal node saat manajerial tinggi. Tabel 4.39 menunjukkan bahwa saat nisiatif sedang keputusannya adalah baik, saat
inisiatif tinggi keputusannya adalah baik, dan saat inisiatif rendah belum bisa diputuskan.

9. Menentukan Internal Node saat Manajerial Tinggi dan Inisiatif Rendah


Tabel 4.41 Perhitungan Atribut Kedisiplinan saat Manajerial Tinggi dan Inisiatif Rendah

Record dalam
Kedisiplinan Hasil Jumlah Q Enteropi Nilai Informasi Information Gain
Instance
Baik 0
Rendah 1 Q1 0
Buruk 1
0 0,918295834 0,918295834
Baik 1
Sedang 1 Q2 0
Buruk 0
Record dalam
Kedisiplinan Hasil Jumlah Q Enteropi Nilai Informasi Information Gain
Instance
Baik 0
Tinggi 1 Q3 0
Buruk 1
TOTAL 3

Tabel 4.42 Perhitungan Atribut Komunikasi saat Manajerial Tinggi dan Inisiatif Rendah

Record dalam
Komunikasi Hasil Jumlah Q Enteropi Nilai Informasi Information Gain
Instance
Baik 0
Rendah 1 Q1 0
Buruk 1
Baik 1
Sedang 1 Q2 0 0 0,918295834 0,918295834
Buruk 0
Baik 0
Tinggi 1 Q3 0
Buruk 1
TOTAL 3

Tabel 4.43 Perhitungan Atribut Produktivitas saat Manajerial Tinggi dan Inisiatif Rendah

Record dalam
Produktivitas Hasil Jumlah Q Enteropi Nilai Informasi Information Gain
Instance
Baik 0
Rendah 0 Q1 0
Buruk 0
0,666666667 0,918295834 0,251629167
Baik 1
Sedang 2 Q2 1
Buruk 1
Record dalam
Produktivitas Hasil Jumlah Q Enteropi Nilai Informasi Information Gain
Instance
Baik 0
Tinggi 1 Q3 0
Buruk 1
TOTAL 3

Dari perhitungan tabel diatas, atribut dengan nilai information gain tertinggi adalah atribut kedisiplinan. Sehingga, atribut
kedisiplinan terpilih menjadi internal node saat manajerial tinggi dan inisiatif rendah. Tabel 4.41 menunjukkan bahwa saat
kedisiplinan rendah keputusannya adalah buruk, saat kedisiplinan sedang keputusannya adalah baik, dan saat kedisiplinan tinggi
keputusannya adalah buruk.
Berdasarkan perhitungan pada tabel di atas, maka didapatkan decision tree sebagai berikut :

Gambar 4.3 Decision Tree


Berdasarkan gambar 4.3, terdapat 18 rule yang dihasilkan pada decision tree
dengan perhitungan Ms. Excel, yaitu sebagai berikut :
1. Jika manjerial rendah dan kedisiplinan rendah maka keputusannya adalah
buruk.
2. Jika manajerial rendah, kedisiplinan sedang, dan inisiatif rendah maka
keputusannya adalah buruk.
3. Jika manajerial rendah, kedisiplinan sedang, dan inisiatif sedang maka
keputusannya adalah baik.
4. Jika manajerial rendah, kedisiplinan sedang, dan inisiatif tinggi maka
keputusannya adalah baik.
5. Jika manajerial rendah, kedisiplinan tinggi, dan komunikasi rendah maka
keputusannya adalah buruk.
6. Jika manajerial rendah, kedisiplinan tinggi, dan komunikasi tinggi maka
keputusannya adalah baik.
7. Jika manajerial sedang, komunikasi rendah, dan kedisiplinan rendah maka
keputusannya adalah buruk.
8. Jika manajerial sedang, komunikasi rendah, kedisiplinan sedang, dan inisiatif
rendah maka keputusannya adalah buruk.
9. Jika manajerial sedang, komunikasi rendah, kedisiplinan sedang, dan inisiatif
sedang maka keputusannya adalah baik.
10. Jika manajerial sedang, komunikasi rendah, kedisiplinan sedang, dan inisiatif
tinggi maka keputusannya adalah baik.
11. Jika manajerial sedang, komunikasi rendah, kedisiplinan tinggi maka
keputusannya adalah baik.
12. Jika manajerial sedang dan komunikasi sedang maka keputusannya adalah
baik.
13. Jika manajerial sedang dan komunikasi tinggi maka keputusannya adalah
baik.
14. Jika manajerial tinggi, inisiatif rendah, dan kedisiplinan rendah maka
keputusannya adalah buruk.
15. Jika manajerial tinggi, inisiatif rendah, dan kedisiplinan sedang maka
keputusannya adalah baik.
16. Jika manajerial tinggi, inisiatif rendah, dan kedisiplinan tinggi maka
keputusannya adalah buruk.
17. Jika manajerial tinggi dan inisiatif sedang maka keputusannya adalah baik.
18. Jika manajerial tinggi dan inisiatif tinggi maka keputusannya adalah baik
Tabel 4.27 di bawah ini merupakan tabel prediksi menggunakan rumus IF THEN pada Ms. Excel, berikut merupakan rincian datanya :
ID
Kedisiplinan Manajerial Komunikasi Inisiatif Produktivitas (%) Keputusan Prediksi
Pekerja
51 Rendah Tinggi Rendah Tinggi Tinggi Baik Buruk
52 Tinggi Rendah Tinggi Tinggi Tinggi Baik Baik
53 Rendah Rendah Sedang Tinggi Rendah Buruk Buruk
54 Tinggi Rendah Sedang Sedang Sedang Buruk Buruk
55 Rendah Tinggi Tinggi Sedang Tinggi Baik Baik
56 Rendah Sedang Rendah Tinggi Rendah Buruk Buruk
57 Sedang Sedang Rendah Sedang Sedang Buruk Baik
58 Sedang Rendah Tinggi Rendah Sedang Buruk Buruk
59 Tinggi Sedang Sedang Sedang Sedang Baik Baik
60 Sedang Sedang Sedang Tinggi Sedang Baik Baik
61 Tinggi Rendah Tinggi Sedang Tinggi Buruk Baik
62 Sedang Tinggi Tinggi Tinggi Rendah Baik Buruk
63 Sedang Sedang Tinggi Sedang Sedang Baik Baik
64 Tinggi Tinggi Rendah Tinggi Tinggi Baik Buruk
65 Sedang Rendah Rendah Rendah Sedang Buruk Buruk
66 Sedang Rendah Rendah Tinggi Tinggi Buruk Baik
67 Tinggi Rendah Sedang Tinggi Sedang Buruk Buruk
68 Tinggi Tinggi Tinggi Rendah Sedang Buruk Buruk
69 Sedang Tinggi Rendah Tinggi Rendah Buruk Buruk
70 Rendah Rendah Tinggi Rendah Tinggi Buruk Buruk
ID
Kedisiplinan Manajerial Komunikasi Inisiatif Produktivitas (%) Keputusan Prediksi
Pekerja
71 Rendah Tinggi Rendah Sedang Tinggi Buruk Baik
72 Sedang Rendah Sedang Sedang Tinggi Baik Baik
73 Rendah Tinggi Rendah Sedang Rendah Buruk Baik
74 Rendah Tinggi Rendah Rendah Rendah Buruk Buruk
75 Sedang Rendah Tinggi Tinggi Sedang Baik Baik
76 Rendah Tinggi Tinggi Rendah Sedang Buruk Buruk
77 Tinggi Tinggi Tinggi Tinggi Tinggi Baik Buruk
78 Sedang Rendah Sedang Rendah Tinggi Buruk Buruk
79 Tinggi Sedang Tinggi Sedang Sedang Baik Baik
80 Tinggi Tinggi Tinggi Rendah Tinggi Baik Buruk
81 Tinggi Sedang Tinggi Rendah Sedang Baik Baik
82 Rendah Sedang Tinggi Rendah Tinggi Buruk Baik
83 Tinggi Rendah Rendah Sedang Tinggi Baik Buruk
84 Tinggi Rendah Rendah Sedang Tinggi Buruk Buruk
85 Tinggi Rendah Tinggi Sedang Tinggi Baik Baik
86 Tinggi Rendah Rendah Rendah Sedang Buruk Buruk
87 Rendah Rendah Sedang Rendah Tinggi Buruk Buruk
88 Sedang Rendah Sedang Sedang Sedang Buruk Baik
89 Rendah Rendah Sedang Sedang Rendah Buruk Buruk
90 Rendah Rendah Sedang Tinggi Tinggi Buruk Buruk
91 Rendah Rendah Tinggi Sedang Rendah Buruk Buruk
ID
Kedisiplinan Manajerial Komunikasi Inisiatif Produktivitas (%) Keputusan Prediksi
Pekerja
92 Rendah Rendah Rendah Tinggi Rendah Buruk Buruk
93 Sedang Tinggi Rendah Sedang Tinggi Baik Baik
94 Rendah Rendah Tinggi Rendah Rendah Buruk Buruk
95 Rendah Rendah Sedang Tinggi Tinggi Buruk Buruk
96 Rendah Sedang Tinggi Sedang Tinggi Baik Baik
97 Rendah Rendah Rendah Tinggi Sedang Buruk Buruk
98 Sedang Rendah Tinggi Sedang Tinggi Baik Baik
99 Rendah Rendah Rendah Tinggi Tinggi Buruk Buruk
100 Rendah Sedang Tinggi Sedang Sedang Baik Baik

Jumlah rule benar = 37


Jumlah rule salah = 13
Total rule = 50
𝟑𝟕
𝑨𝒌𝒖𝒓𝒂𝒔𝒊 = = 𝟎, 𝟕𝟒
𝟓𝟎
𝟏𝟑
𝑬𝒓𝒓𝒐𝒓 = = 𝟎, 𝟐𝟔
𝟓𝟎
Berdasarkan tabel 4.27 dapat diketahui bahwa jumlah rule benar sebanyak 37 rule dan rule yang salah sebanyak 23 rule. Hasil akurasi
yang diperoleh sebesar 74 % dan hasil error yang diperoleh sebesar 26 %.
4.4 Hasil dan Analisis Klasifikasi menggunakan algoritma decision tree pada
Rapid Miner

Gambar 4.4 Decision Tree


Gambar 4.4 merupakan decision tree yang diperoleh dari software Rapid Miner.
Root node pada decision tree di atas adalah atribut manajerial. Lalu, untuk internal
node adalah atribut kedisiplinan, komunikasi, dan inisiatif. Dari decision tree di
atas dapat ditentukan rule, yaitu sebagai berikut:
1. Jika manajerial rendah dan kedisiplinan rendah maka keputusannya adalah
buruk.
2. Jika manajerial rendah dan kedisiplinan sedang maka keputusannya adalah
baik.
3. Jika manajerial rendah dan kedisiplinan tinggi maka keputusannya adalah
buruk.
4. Jika manajerial sedang dan komunikasi rendah maka keputusannya adalah
buruk.
5. Jika manajerial sedang dan komunikasi sedang maka keputusannya adalah
baik.
6. Jika manajerial sedang dan komunikasi tinggi maka keputusannya adalah baik.
7. Jika manajerial tinggi dan inisiatif rendah maka keputusannya adalah buruk.
8. Jika manajerial tinggi dan inisiatif sedang maka keputusannya adalah baik.
9. Jika manajerial tinggi dan inisiatif tinggi maka keputusannya adalah baik.
Gambar 4.5 Performance
Gambar 4.5 menunjukkan output yang dihasilkan oleh software Rapid Miner,
dimana nilai akurasi yang didapatkan sebesar 74%. Jumlah prediksi yang benar
berdasarkan rule sebanyak 37 data dan jumlah prediksi yang salah berdasarkan
rule sebanyak 13 data.

4.5 Perbandingan Hasil Perhitungan Ms. Excel dengan Rapid Miner


Tabel 4.44 merupakan perbandingan hasil perhitungan menggunakan Ms. Excel
dan Rapid Miner :
Tabel 4.44 Perbandingan Perhitungan Ms. Excel dan Rapid Miner

Pembanding Ms. Excel Rapid Miner


Akurasi 74 % 74 %
Error 26 % 26 %
 Root Node : Manajerial  Root Node : Manajerial
 Internal Node : Kedisiplinan,  Internal Node : Kedisiplinan,
Decision
Komunikasi, dan Inisiatif Komunikasi, dan Inisiatif
Tree
 Rule yang terbentuk sebanyak  Rule yang terbentuk sebanyak
18 rule. 9 rule.
BAB V KESIMPULAN DAN REKOMENDASI

5.1 Kesimpulan
Kesimpulan yang didapatkan dari penelitian ini adalah :
1. Rule yang dihasilkan dari pengolahan data menggunakan metode klasifikasi
dengan perhitungan menggunakan Ms. Excel dan software Rapid Miner
menghasilkan perbedaan, dimana pada Ms. Excel terdapat 18 rule dan pada
software Rapid Miner terdapat 9 rule.
2. Hasil akurasi yang diperoleh dari perhitungan menggunakan Ms. Excel dan
software Rapid Miner sama, yaitu sebesar 74 %. Lalu, untuk decision tree
Ms. Excel dan software Rapid Miner atribut yang muncul sama, yaitu
berjumlah 4 atribut, dimana atribut tersebut adalah manajerial, kedisiplinan,
komunikasi, dan inisiatif.

5.2 Rekomendasi
Rekomendasi dari penelitian ini adalah:
1. Dengan ditemukannya rule dalam proses evaluasi kinerja karyawan,
diharapkan perusahaan menggunakan rule tersebut agar dapat memprediksi
hasil evaluasi kinerja karyawan.
2. Rekomendasi untuk peneliti selanjutnya adalah peneliti dapat menambahkan
atribut lain terkait evaluasi kinerja karyawan.
DAFTAR PUSTAKA

Gorunescu, F. (2011). Data Mining Concept Model and Techniques. Berlin: Springer.
Husniati, N. (2017). Analisis assigment problem berdasarkan penilaian kinerja
karyawan menggunakan metode hungarian (Hungarian Method) dan pohon
keputusan (Decision Tree). JURNAL MANAJEMEN Volume 9 (1), 48-54.
Julianto, W. (2014). ALGORITMA C4.5 UNTUK PENILAIAN KINERJA
KARYAWAN. SCAN VOL. IX NOMOR 2 Universitas Trunojoyo Madura.
Sabna, E. (2010). Aplikasi Data Mining Untuk Menganalisis Track Record Penyakit
Pasien Dengan Menggunakan Teknik Decision Tree. Fakultas Ilmu
KomputerUniversitas Putra Indonesia.
Soetjipto. (2008). Paradigm Baru Manajemen Sumber Daya Manusia. Yogyakarta:
Amara Book.
Sunge, A. S. (2018). PREDIKSI KOMPETENSI KARYAWAN MENGGUNAKAN
ALGORITMA C4.5 (STUDI KASUS : PT HANKOOK TIRE INDONESIA).
Seminar Nasional Teknologi Informasi dan Komunikasi 2018 (SENTIKA
2018).
Thoha, M. (2001). Perilaku Organisasi, Konsep Dasar dan Aplikasinya. Jakarta: Raja
Grafindo Persada.

Anda mungkin juga menyukai