Oleh:
M. ADLINUR MUJADID
112010090
TEKNIK INFORMATIKA
UNEVERSITAS ISLAM LAMONGAN
2022
i
KATA PENGANTAR
Puji syukur penulis panjatkan ke hadiran Allah SWT. yang telah melimpahkan
segala rahmat dan hidayah-Nya, sehingga tersusunlah Skripsi yang berjudul
“PENERAPAN METODE NAIVE BAYES UNTUK PREDIKSI MENENTUKAN
KARYAWAN TETAP PADA PT. YSP INDUSTRIES INDONESIA”.
Penulis sungguh sangat menyadari, bahwa penulisan Skripsi ini tidak akan
terwujud tanpa adanya dukungan dan bantuan dari berbagai pihak. Sudah
selayaknya, dalam kesempatan ini penulis menghaturkan penghargaan dan ucapan
terima kasih yang sebesar-besarnya kepada mahasiswa dan juga dosen matkul
analisah pemograman dan lain sebagianya.
.
Akhir kata, penulis mohon maaf atas kekeliruan dan kesalahan yang
terdapat dalam Skripsi ini dan berharap semoga Skripsi ini dapat memberikan
manfaat bagi khasanah pengetahuan Teknologi Informasi di lingkungan STT
Pelita Bangsa khususnya dan Indonesia pada umumnya.
M. adlinur mujadid
ii
DAFTAR ISI
DAFTAR TABEL
.................................................................................................viii DAFTAR
GAMBAR ............................................................................................. ix
ABSTRACT ............................................................................................................ x
ABSTRAK ........................................................................................................... xi
diantaranya yaitu:........................................................................................... 7
ii
1.6.3 Manfaat Bagi Pembaca.................................................................. 7
2.2.2 Karyawan..................................................................................... 13
iii
3.4 Pengumpulan Data ................................................................................. 24
iv
4.2.1 Menentukan Kriteria.................................................................... 38
5.1 Kesimpulan............................................................................................. 52
LAMPIRAN .......................................................................................................... 55
v
DAFTAR TABEL
Tabel 3. 1 Kriteria................................................................................................. 29
vi
DAFTAR GAMBAR
Gambar 3. 2 Pemodelan....................................................................................... 26
Gambar 4. 4 Akurasi............................................................................................ 48
vii
ABSTRACT
by the company where career development efforts for a contract employee have
been carried out during the contract agreement period. Good and qualified
employees certainly have a positive impact on the company they work for. The
method that can be used for this is the data mining method or the Naive Bayes
algorithm method. The Naive Bayes Classifier algorithm is one of the statistical
classifiers, where these classifiers can predict the probability of class membership
calculation. This analysis uses rapidminer which is a data analysis software with
several algorithm features that are easy to operate. Prediction results using
x
ABSTRAK
oleh perusahaan dimana usaha pengembangan karir bagi seorang pegawai kontrak
yang telah dijalaninya selama masa perjanjian kontrak. Pegawai yang baik dan
berkualitas tentu saja memiliki dampak yang positif terhadap perusahaan tempat
pegawai layak atau tidak untuk menjadi pegawai tetap yaitu absensi, kepribadian,
prestasi, dan lain sebagainya. Salah satu metode yang dapat digunakan untuk hal
ini adalah dengan metode data mining atau metode algoritma Naive Bayes.
suatu data yang akan masuk ke dalam kelas tertentu, sesuai dengan perhitungan
analisa data dengan fitur beberapa algoritma yang mudah untuk dioperasikan.
cepat dan akurat, dari pengujian yang dilakukan dengan membandingkan data
xi
BAB I
PENDAHULUAN
oleh perusahaan dimana usaha pengembangan karir bagi seorang pegawai kontrak
calon pegawai tetap dilakukan dalam suatu periode waktu tertentu dan pada
untuk menjadi pegawai tetap,hanya pegawai yang memiliki potensi dan prestasi
atau tidak untuk menjadi pegawai tetap yaitu absensi, kepribadian, prestasi, dan
baku sehingga terjadi penyamaan diantara kriteria tersebut. Padahal suatu kriteria
dapat menjadi lebih penting dari kriteria yang lain dengan berbagai pertimbangan
Pegawai yang baik dan berkualitas tentu saja memiliki dampak yang positif
terhadap perusahaan tempat mereka bekerja. Oleh karena itu perusahaan harus
menyeleksi orang-orang yang ingin masuk dan bekerja ke dalam perusahaan itu
dengan baik. Saat ini persaingan untuk mendapatkan pekerjaan semakin ketat,
1
1
dimana lapangan pekerjaan yang tersedia semakin sedikit dan proses perekrutan
bahwa tujuan utama dari seleksi pegawai tetap adalah untuk mendapatkan
orang yang tepat bagi suatu jabatan tertentu , sehingga orang tersebut mampu
bekerja secara optimal dan dapat bertahan di Instansi dalam jangka waktu lama.
pegawai tetap tersebut sangatlah kompleks , memakan waktu yang lama dan
sangat terbuka peluang untuk melakukan kesalahan dalam menentukan orang yang
tepat. Untuk mendapatkan karyawan yang bagus dibuatlah sebuah kontrak kerja
atau yang biasa disebut dengan Perjanjian kontrak Waktu Tertentu ( PKWT ) dan
Perjanjian kontrak Waktu Tidak Tentu ( PKWTT ), apabila PKWTT dibuat secara
lisan maka dapat mensyaratkan adanya masa percobaan kerja paling lama 3 bulan,
Bila ada yang mengatur lebih dari 3 bulan , maka demi hukum sejak bulan
dengan pengusaha atau pemberi kerja yang memuat syarat-syarat kerja, hak, dan
kewajiban para pihak. Ketentuan umum PKWT menurut Kepmenaker No. 100
kerja ada 2; Perjanjian kerja waktu tertentu ( PKWT )dan Perjanjian waktu tidak
orang yang tepat untuk sumber daya manusia yang baru. Terutama jika
membuat sebuah peraturan yang ketat dalam mencari karyawan tetap dengan
penilaian terhadap karyawan yang akan diangkat sebagai karyawan tetap, seperti
adanya karyawan yang memiliki beberapa absent, pengetahuan kerja yang kurang,
metode yang dapat digunakan untuk hal ini adalah dengan metode data mining
kelas suatu data yang akan masuk ke dalam kelas tertentu, sesuai dengan
ditemukan oleh Thomas Bayes pada abad ke-18. Dalam studi pembandingan
algoritma klasifikasi telah ditemukan simple bayesian atau yang biasa dikenal
dengan Naïve Bayes classifier. Naïve Bayes classifier menunjukkan akurasi dan
kecepatan yang tinggi bila diterapkan pada database yang besar. Metode ini sering
karena metode ini dikenal memiliki tingkat akurasi yang tinggi dengan
perhitungan
sederhana. Teorema bayes merupakan dasar aturan dari naive bayes
jumlah data pelatihan ( data training ) yang kecil untuk menentukan estimasi
sebagai variabel independent, maka hanya varians dari suatu variabel dalam
hal, diantaranya adalah menentukan karyawan terbaik. Sebelumnya juga telah ada
sudah cukup tinggi, oleh karena itu dapat disimpulkan algoritma ini cocok untuk
tetap.
digunakan pada penelitian ini karena algoritma ini lebih kuat daripada algoritma
lainnya. Data pegawai yang bekerja sebagai pegawai lapangan akan digunakan
saat ini masih kurang efektif dan tidak mudah untuk menentukan karyawan
tertentu, pegawai yang baik dan berkualitas tentu saja memiliki dampak yang
positif terhadap perusahaan tempat mereka bekerja, oleh karena itu perusahaan
harus menyeleksi orang-orang yang ingin masuk dan bekerja kedalam perusahaan
itu dengan baik, meskipun tujuannya terdengar sangat sederhana akan tetapi
yang lama dan sangat terbuka peluang untuk melakukan kesalahan dalam
menentukan orang yang tepat, berdasarkan latar belakang yang telah dipaparkan,
maka permasalahan yang akan dirumuskan dalam penelitian ini ialah sebagai
berikut.
calon pegawai tetap dengan metode Data Mining algoritma Naive Bayes.?
1.4 Batasan Masalah
maksud dan tujuan yang sebenarnya, maka penulis membatasi masalah pada
tetap saja.
Bayes .
3. Data yang digunakan sebagai uji coba adalah data di PT.YSP Industries
Indonesia.
department.
diantaranya yaitu:
1.6.1 Manfaat Bagi Akademik Manfaat penelitian ini bagi Akademik
diantaranya yaitu:
perkuliahan.
menyediakan
pengetahuan dan informasi yang bisa dijadikan acuan pihak PT untuk menilai
calon pegawai dengan record data yang ada untuk penilaian karyawan
selanjutnya.
BAB II
TINJAUAN PUSTAKA
yang sesuai dengan arti tersebut, suatu tinjauan pustaka berfungsi sebagai
yang berkaitan, tidak selalu harus tepat identik dengan bidang permasalahan yang
dihadapi tetapi termasuk yang seiring dan berkaitan. Fungsi peninjauan kembali
pustaka yang berkaitan merupakan hal yang mendasar dalam penelitian, seperti
dihadapi.
1. Kegunaan
teknologi informasi.
9
1
yang kita hadapi yang mungkin dapat dijadikan nara sumber atau dapat
8. mampu menambah percaya diri kita pada topik yang kita pilih karena telah
ada pihak-pihak lain yang sebelumnya juga tertarik pada topik tersebut dan
mereka telah mencurahkan tenaga, waktu dan biaya untuk meneliti topik
tersebut.
sebesar 82,08 %
Lingkar Aksi) Bayu Setyaji, Pujiono, SSi, M.kom Program Studi Sistem
dinus.ac.id (2012)
2.2 Dasar Teori
2.2.1 Prediksi
adalah suatu proses memperkirakan secara sistematis tentang sesuatu yang paling
mungkin terjadi di masa depan berdasarkan informasi masa lalu dan sekarang yang
dimiliki, agar selisih antara sesuatu yang terjadi dengan hasil perkiraan dapat
diperkecil. Prediksi tidak harus memberikan jawaban secara pasti kejadian yang
akan terjadi, melainkan berusaha untuk mencari jawaban sedekat mungkin yang
akan terjadi.
masa depan adalah suatu disiplin baru, barangkali orang telah menaruh perhatian
besar tentang apa yang akan terjadi kemudian semenjak manusia mulai
mengetahui sesuatu. Populasi tukang ramal dan tukang nujum pada zaman kuno
dan abad pertengahan merupakan satu manifestasi dari keinginan tahu orang
tentang masa depannya. Perhatian tentang masa depan ini berlangsung terus
bahkan berkembang menjadi kolom astrologi yang disindikatkan pada tahun 1973.
2.2.2 Karyawan
Mengenai Tenaga Kerja dalam pasal 1 dikatakan bahwa karyawan adalah tenaga
pengusaha yang mengerjakan dimana hasil karyanya itu sesuai dengan profesi
atau pekerjaan atas dasar keahlian sebagai mata pencariannya. Senada dengan hal
Kerja, tenaga kerja adalah tiap orang yang mampu melaksanakan pekerjaan, baik
di dalam maupun diluar hubungan kerja guna menghasilkan jasa atau barang
Karimah, 2012) karyawan adalah orang penjual jasa ( pikiran atau tenaga ) dan
Subri (dalam Karimah, 2012) karyawan adalah penduduk dalam usia kerja
(berusia
15-64 tahun) atau jumlah seluruh penduduk dalam suatu negara yang
memproduksi barang dan jasa jika ada permintaan terhadap tenaga mereka.
yang berusia 15-64 tahun yang mampu melaksanakan pekerjaan didalam maupun
dilaksanakan. Diantaranya :
kelangsungan perusahaan.
menerima atau mempercayai apa yang disarankan oleh karyawan yang telah
dapat dibagi menjadi dua jenis kelompok karyawan yaitu karyawan tetap dan
perjanjian atau kontrak dengan perusahaan atau lembaga tempat dia bekerja
dengan jangka waktu yang tidak di tetapkan dan disebut karyawan permanen.
Umumnya karyawan yang berstatus seperti ini mempunyai hak yang lebih
dibandingkan dengan karyawan yang statusnya tidak tetap. Karyawan tetap dapat
akan habis, di perpanjang atau tidak, sehingga karyawan tetap hanya tinggal fokus
untuk menyelesaikan pekerjaan pekerjaan rutin perusahaan, dan tidak ada jaminan
kontrak akan dipertahankan oleh perusahaan, namun jika prestasi kerjanya tidak
Kewajiban kerja karyawan kontrak terkadang hampir sama atau bahkan lebih berat
dari pada karyawan tetap. Namun dari segi gaji atau fasilitas lainnya tentu saja
sangat berbeda, termasuk tidak adanya ketentuan pesangon yang jelas apabila
tentang Ketenagakerjaan pasal 50 sampai dengan pasal 66. Sistem kerja kontrak
terjadi pada semua jenis industri dengan waktu yang tidak ditentukan.
memiliki potensi dan berguna untuk mengelola dataset yang besar (Witten &
Frank,
2011). Dalam data mining ada 10 algoritma teratas yang paling berpengaruh yang
dipilih oleh peneliti dalam komunitas data mining, dimana 6 (enam) diantaranya
AdaBoost, k Nearest Neighbor (kNN), Naive Bayes dan CART (Fayyad, Piatetsky-
data mining bukanlah suatu bidang yang sama sekali baru. Salah satu kesulitan
untuk mendefinisikan data mining adalah kenyataan bahwa data mining mewarisi
banyak aspek dan Teknik dari bidang-bidang ilmu yang sudah mapan terlebih
dahulu. Data mining memiliki akar yang Panjang dari bidang ilmu seperti
1. Klasifikasi
baru :
2. Klasterisasi
3. Regresi
atau deviasi yang mungkin sangat penting dan perlu investigasi lebih
lanjut.
5. Pemodelan adalah
6. Perangkuman
1. Deskripsi
untuk menggambarkan pola dan kecenderungan yang terdapat dalam data. Sebagai
atau fakta bahwa siapa yang tidak cukup professional akan sedikit didukung dalam
record lengkap yang menyediakan nilai dari variabel target sebagai nilai prediksi.
Selanjutnya, pada peninjauan berikutnya estimasi nilai dari variabel target dibuat
tekanan darah sistolik pada pasien rumah sakit berdasarkan umur pasien, jenis
kelamin, indeks berat badan , dan level sodium darah. Hubungan antara tekanan
darah sistolik dan nilai variabel prediksi dalam proses pembelajaran akan
3. Prediksi
4. Klasifikasi
Kluster adalah kumpulan record yang memiliki kemiripan satu dengan yang
mengestimasi, atau memprediksi nilai dari variabel target. Akan tetapi, algoritma
6. Asosiasi
Tugas asosiasi dalam data mining adalah menemukan atribut yang muncul
dalam satu waktu. Dalam dunia bisnis lebih umum disebut analisi keranjang
belanja.
ketergantungan yang diberikan oleh nilai pada variabel kelas. Naive bayes
saling bebas jika diberikan nilai output. Dengan kata lain, probabilitas mengamati
ini hanya membutuhkan jumlah data pelatihan (training data) yang kecil untuk
Naive Bayes sering bekerja jauh lebih baik dalam kebanyakan situasi dunia nyata
Masalah Tindakan
Penelitian
Data Karyawan
Data
Hasil
Metode merupakan kegiatan ilmiah yang berkaitan dengan suatu cara kerja
sistematis untuk memahami suatu subjek atau objek penelitian, sebagai upaya
Adapun pengertian penelitian adalah suatu proses pengumpulan dan analisis data
Pengumpulan dan analisis data dilakukan secara ilmiah, baik bersifat kuantitatif
non interaktif.
adalah suatu cara untuk memecahkan masalah ataupun cara mengembangkan ilmu
mendapatkan data yang valid, dengan tujuan dapat ditemukan, dikembangkan dan
Pada penelitian ini, data yang digunakan adalah data dari karyawan di PT.
YSP Indonesia, data nilai tersebut akan diolah menggunakan beberapa metode
data mining sehingga diperoleh satu metode yang paling akurat dan dapat
digunakan
22
1
Pengumpulan Data
1) Pengumpulan Data
a. Data Primer.
b. Data Sekunder.
Pada bagian ini di jelaskan tentang tahap awal data mining. Pengolahan
awal data meliputi proses input data dan format yang dibutuhkan dalam
validasi dan kemudian di evaluasi. Penjelasan mengenai hal ini akan di paparkan
3.3.1 Populasi
Populasi dalam penelitian ini adalah karyawan yang akan habis masa
3.3.2 Sampel
Sampel dalam penelitian ini adalah data karyawan di tahun 2017 dengan
Data yang digunakan dalam penelitian ini adalah data dari karyawan
PT.YSP Industries Indonesia, Sumber data berupa file excel dengan format.xlsx
Data yang diambil langsung dari objek penelitian. Data primer diperoleh
jawab pada pihak yang bersangkutan (wawancara). Data primer yang dipakai yaitu
data laporan karyawan kontrak berupa softcopy kemudian melakukan tanya jawab
2. Data Sekunder
Data yang mendukung penelitian yang didapat dari buku referensi dan
jurnal ilmiah yang berkaitan dengan penelitian. Adapun hal yang berkaitan di
dalamnya adalah data sejarah instansi, data visi misi instansi, dan data pustaka
penelitian ini bertujuan untuk memecahkan fenomena (masalah) yang ada pada
saat ini, pada penelitian ini kasus yang diambil adalah karyawan yang akan di
angkat menjadi karyawan tetap atau tidak tetap, Jenis penelitian deskriptif
klasifikasi dengan algoritma naive bayes. data dihitung dengan algoritma ini
sesuai dengan metodenya kemudian di cari hasil akurasinya. dalam tahapan ini
Gambar 3. 2 Pemodelan
dilihat tingkat akurasinya dari algoritma ini dan keterkaitan anatara setiap atribut,
prediksi pada atribut target, Naive bayes tidak memperhitungkan relasi antar
memperhitungkan relasi antar atribut. bentuk tugas dasar yang dilakukan oleh
3.7 Evaluasi
Melakukan pengecekan terhadap setiap nilai atribut dan model yang sudah
data mining. pada tahap ini juga merupakan tahapan dimana dilakukan perbaikan
kembali bila terjadi kekurangan.pada tahapan ini bisa saja kembali lagi ke tahap
yang pertama dan kemudian ke tahap berikutnya dengan tujuan perbaikan, sampai
telah membentuk tim marketing dan sales untuk veterinari dan verbal di
Indonesia, maka pada tahun 2004 kami telah mendirikan PT YSP Industries
Indonesia. Setelah diluluskan oleh Badan POM maka ini akan menjadi satu
terus menjaga kesehatan dan keselamatan kerja melalui cara kerja yang
baik dan pengawasan mutu yang tinggi serta berusaha keras untuk
efektif secara tepat waktu dan diikuti dengan perbaikan berkelanjutan untuk
1. Visi
2. Misi
kesehatan manusia.
susunan atau struktur organisasi. Dari struktur inilah kita dapat jalur kegiatan atau
wewenang apa saja yang dilaksanakan oleh masing-masing bagian serta kebijakan
dan tanggung jawab yang berbeda-beda dalam suatu organisasi. Struktur ini
mengandung unsur-unsur spesialisasi kerja, standarisasi atau disentralisasi dalam
President
Director
Director
Human Quality
General Factory Finance
Resources & Assurance
GA Manager Manager Manager
Section
Variabel penelitian yang akan digunakan sebagai atribut data untuk proses
terdapat pada tabel 3.1. dan kelas keputusan variabel target penelitian yang berisi
Tabel 3. 1 Kriteria
1. Pengetahuan kerja
Keterang Kriteria Nilai
Pengetahuan sangat baik pada an semua fase kerja sendiri dan
Sangat Baik A
terkait.
Informasi tentang pekerjaan sendiri dan pengetahuan yang
Baik B
baik tentang pekerjaan terkait.
Pengetahuan yang memuaskan tentang pekerjaan saat ini,
dengan pengetahuan yang cukup tentang pekerjaan terkait Cukup C
untuk menghasilkan koordinasi yang baik.
Pengetahuan yang memadai untuk pekerjaan saat ini, tetapi
Kurang D
tidak diinformasikan pada pekerjaan terkait.
2. Kemampuan Untuk Merencanakan dan Mengatur
Keterangan Kriteria Nilai
Keuntungan penggunaan NBC bahwa metode ini hanya membutuhkan jumlah data
pelatihan (training data) yang kecil untuk menentukan estimasi parameter yang
variabel independen, maka hanya varian dari suatu variabel dalam sebuah kelas
kovarians.
3.11 Persamaan Metode Neive Bayes
Bentuk umum atau persamaan dari teorema Bayes (Bustami, 2014) adalah :
𝑃(𝑋|𝐻). 𝑃(𝐻)
𝑃(𝐻|𝑋) =
𝑃(𝑋)
Keterangan :
probability)
P(X) : Probabilitas X
cocok bagi sample yang dianalisis tersebut. Karena itu, metode Naive Bayes di
𝑃 ( 𝐶) 𝑃 ( 𝐹1…𝐹𝑛|𝐶)
(𝐶|𝐹1…𝐹𝑛) = 𝑃(𝐹1…𝐹𝑛)
secara global (disebut juga evidence). rumus di atas dapat pula ditulis secara
�𝑟��𝑟 𝑥
Posterior =
������ℎ���
�𝑣�����
�
Nilai Evidence selalu tetap untuk setiap kelas pada satu sampel. Nilai dari
Penjabaran lebih lanjut rumus naïve bayes tersebut dilakukan dengan menjabarkan
(𝐶|𝐹1,…,= 𝑃(𝐶)𝑃(𝐹1,…,𝐹𝑛|𝐶)
= (𝐶)(𝐹1|𝐶)𝑃(𝐹2,…,𝐹𝑛|𝐶,𝐹1)
= 𝑃(𝐶)𝑃(𝐹1|𝐶)𝑃(𝐹2|𝐶,𝐹1 )𝑃(𝐹3,…,𝐹𝑛|𝐶,𝐹1,𝐹2
= (𝐶)𝑃(𝐹1|𝐶)𝑃(𝐹2|𝐶,𝐹1 )𝑃(𝐹3|𝐶,𝐹1,𝐹2)𝑃(𝐹4,…,𝐹𝑛|𝐶,𝐹1,𝐹2,𝐹3)
= 𝑃(𝐶)𝑃(𝐹1|𝐶)𝑃(𝐹2|𝐶,𝐹1)𝑃(𝐹3|𝐶,𝐹1,𝐹2)…𝑃(𝐹𝑛|𝐶,𝐹1,𝐹2,𝐹3,…,𝐹𝑛−1)
Dapat dilihat bahwa hasil penjabaran tersebut menyebabkan semakin
banyak dan semakin kompleksnya faktor - faktor syarat yang mempengaruhi nilai
(F1,F2...Fn) saling bebas (independent) satu sama lain. Dengan asumsi tersebut,
�
P(F1 … Fn | C) = ∏�= 𝑃 ( 𝐹� | 𝐶)
sebagai berikut :
1
∏� 𝑃 ( 𝐹� | 𝐶)
P(F1 … Fn | C) =
𝑃(𝐹1,𝐹2,… ,𝐹�) �=1
𝑃(𝐶) �
P(F1 … Fn | C) = ∏�= 𝑃 ( 𝐹� | 𝐶)
𝑍 1
adalah mempresentasikan evidence yang nilainya konstan untuk semua kelas pada
satu sample.
3.12 Alur Metode Naïve Bayes
Start
Solusi
Stop
a. Cari nilai mean dan standar deviasi dari masing masing parameter yang
∑𝑛1= 1 𝑥
µ=
𝑖
�
atau
𝑥 1 + 𝑥 2 + 𝑥 3 + .. .
µ=
+ 𝑥𝑛
�
dimana:
𝑛: Jumlah sample
Dan persamaan untuk menghitung nilai simpangan baku (standar
∑𝑛1=1( 𝑥 𝑖 − µ)
σ=√
�−1
dimana:
dari kategori yang sama dibagi dengan jumlah data pada kategori tersebut.
Dalam melakukan proses data mining ini, perangkat lunak yang akan
digunakan yaitu :
1. Rapidminer 7.6
penunjang untuk menentukan apakah karyawan akan di angkat atau tidak, data
1. Pengetahuan kerja.
4. Hubungan manusia.
5. Pencapaian tujuan.
7. Kehadiran.
8. Inovasi.
9. Penetapan sasaran/tujuan.
Setelah data diatas didapatkan, akan tetapi pada saat melakukan penyeleksian
karyawan yang akan di angkat atau tidak pada kenyataan nya tidak sesuai dengan
37
1
Data usulan ialah data yang diusulkan oleh penulis mengenai permasalahan
dari atasan kedalam beberapa data yang disebut atribut untuk digunakan
4.2 Pembahasan
untuk menjadi karyawan tetap, ada beberapa kriteria yang digunakan oleh pihak
Data yang digunakan adalah data training 380 record yang sudah di
metode naive bayes adalah dengan mencari probabilitas dari masing-masing kelas.
Dalam penentuan karyawan tetap akan ditentukan 2 kelas yaitu kelas "Di Angkat"
dan "Tidak". Cara perhitungannya adalah dengan mencari berapa jumlah data yang
ada pada kelas “di angkat” dan berapa jumlah pada kelas “Tidak” dari total
keseluruhan data training, lalu membaginya dengan total keseluruhan data. Hasil
- P (Ci)
- P( Di Angkat ) = 167/380 = 0,4395
Jumlah data "Di Angkat" pada kolom "Hasil" di bagi jumlah data
- P( Tidak ) = 213/380 = 0,5605
Jumlah data "Tidak" pada kolom "Hasil" di bagi jumlah data
atribut dari data testing dengan atribut dari data training. Berapa jumlah atribut
dengan kelas "Di Angkat" yang berada pada data training, kemudian bagi dengan
probabilitas kelas "Di Angkat". Begitu juga dengan mencari probabilitas untuk
kelas "Tidak".
1. Pengetahuan kerja
Kemampuan Untuk
di angkat tidak P ( di angkat ) P ( tidak )
Merencanakan dan Mengatur
A 68 63 68/167 63/213
B 90 23 90/167 23/213
C 8 81 8/167 81/213
D 1 46 1/167 46/213
Total 167 213 100% 100%
7. Kehadiran
menggunakan data training yang terdapat pada tabel 3.1. dan mengubahnya
menjadi nilai yang sudah ditentukan pada proses 4.2.4 sesuai atribut masing-
masing. Lalu dari masing- masing atribut dan nilai probabilitas kelas dikalikan.
Dari kedua hasil yang sudah ditentukan pada tiap kelas. bandingkan nilai yang
paling tinggi. Jika kelas "Di angkat" bernilai paling tinggi maka hasilnya “Di
A A B A B B B B A ?
- P (Ci)
- P( Di Angkat ) = 167/380 = 0,4395
Jumlah data "Di Angkat" pada kolom "Hasil" di bagi jumlah data
- P( Tidak ) = 213/380 = 0,5605
Jumlah data "Tidak" pada kolom "Hasil" di bagi jumlah data
Tahap ke 2 menghitung jumlah kasus yang sama dengan kelas yang sama :
P(X | Ci)
P ( | Keputusan = Di Angkat ) = 167
P (Pengetahuan kerja = A | Keputusan =di angkat)= 78/167 = 0,4671
P (Kemampuan untuk
= A | Keputusan =di angkat)= 101/167 = 0,6048
merencanakan dan mengatur
P (Penerimaan Tanggung jawab = B | Keputusan =di angkat)= 90/167 = 0,5389
P (Kerjasama/Hubungan
= A | Keputusan =di angkat)= 85/167 = 0,5090
Manusia
P (Pencapaian tujuan = B | Keputusan =di angkat)= 48/167 = 0,2874
P (Penilaian dan pengambilan
= B | Keputusan =di angkat)= 35/167 = 0,2096
keputusan
P (Kehadiran = B | Keputusan =di angkat)= 29/167 = 0,1737
P (Inovasi = B | Keputusan =di angkat)= 22/167 = 0,1317
P (Penetapan sasaran / tujuan = A | Keputusan =di angkat)= 143/167 = 0,8563
Mengkalikan semua hasil atribut " Di Angkat " = 0,0000914
P(X | Ci)
P ( | Keputusan = Tidak ) = 213
P (Pengetahuan kerja = A | Keputusan =Tidak )= 93/213 = 0,4366
P (Kemampuan untuk
= A | Keputusan =Tidak )= 55/213 = 0,2582
merencanakan dan mengatur
P (Penerimaan Tanggung
= B | Keputusan =Tidak )= 23/213 = 0,1080
jawab
P (Kerjasama/Hubungan
= A | Keputusan =Tidak )= 100/213 = 0,4695
Manusia
P (Pencapaian tujuan = B | Keputusan =Tidak )= 14/213 = 0,0657
P (Penilaian dan pengambilan
= B | Keputusan =Tidak )= 2/213 = 0,0094
keputusan
P (Kehadiran = B | Keputusan =Tidak )= 37/213 = 0,1737
P (Inovasi = B | Keputusan =Tidak )= 21/213 = 0,0986
P (Penetapan sasaran / tujuan = A | Keputusan =Tidak )= 149/213 = 0,6995
Mengkalikan semua hasil atribut " Tidak " = 0,00000004
Hasil (P|Di Angkat) = 0,00004018 lebih besar dari (P|Tidak) = 0,00000002 maka
Rapid Miner Studion 7.6 adalah salah satu tool untuk melakukan prediksi
dan Analisa data mining. Berikut adalah uji coba yang dilakukan pada 50 data
testing yang sudah ditentukan. Data testing tersebut akan dicari nilai prediksinya
1. Menambahkan dua operator read excel untuk memasukan data training dan
data testing.
akan di prediksi.
penelitian.
Setelah dijalankan didapatkan hasil yang sama dengan kasus perhitungan manual.
Gambar 4. 2 Hasil Prediksi Rapid Miner
Dari keterangan gambar 4.2 hasil testing data yang dilakukan dengan
1. Menambahkan dua operator read excel untuk memasukan data training dan
data testing.
penelitian.
Setelah itu didapatkan akurasi hasil prediksi sebesar 94,00% dari hasil data testing.
Pengujian berdasarkan pengukuran Confusion Matrix menghasilkan nilai
accurasy, precision dan recall yang tinggi dengan nilai accurasy sebesar 94.00%,
precision sebesar 90.48% dan recall sebesar 95.00% . Dimana sebelumnya data
belum diketahui tingkat akurasinya, dan sekarang sudah dapat dilihat seberapa
tinggi nilai akurasi yang diperoleh. Dan pengujian berdasarkan pengukuran kurva
ROC/ AUC sebesar 0.937 dengan tingkat akurasi Excellent Classification. Dengan
menjadi lebih mudah dan tepat sasaran karena memiliki tingkat akurasi yang
hampir sempurna.
1. Akurasi
dapat diketahui akurasi hasil prdiksinya 94.00% dari hasil data testing.
Gambar 4. 4 Akurasi
Hasil analisa antara data yang di testing dengan data training di Rapid
berikut:
= (19+28) / (19+28+1+2)*100%
= 94%
= (1+2) / (19+28+1+2)*100%
= 6%
2. Precision
Gambar 4. 5 Precision
= (19) / (19+2)*100%
= 90.48%
3. Recall
Gambar 4. 6 Recall
= (19) / (19+1)*100%
= 95.00%
mewakili nilai false positive dan garis vertikal mewakili nilai true positive. Dari
4.5 dapat diketahui bahwa nilai Area Under Curve (AUC) model algoritma naive
bayes
0.937, hal ini menunjukan bahwa model algoritma naive bayes mencapai
5.1 Kesimpulan
metode naive bayes untuk prediksi menentukan karyawan tetap pada PT. YSP
hasil prediksi menentukan karyawan tetap dengan cepat dan akurat, dari
klasifikasi yang dilakukan oleh metode naive bayes itu sendiri, naïve bayes
5.2 Saran
Penelitian yang dilakukan tentunya tak lepas dari sebuah kekurangan. Oleh
karena itu, ada beberapa saran yang penulis berikan sebagai acuan dalam
penelitian selanjutnya.
52
53
karena pola data training tersebut akan dijadikan sebagai rule untuk
Naïve Bayes, apabila nol maka probabilitas prediksi akan bernilai nol juga.
Fayyad, U., Piatetsky-Shapiro, G., & Smyth, P. (1996). From data mining to
knowledge discovery in databases. AI Magazine, 37–54.
https://doi.org/10.1145/240455.240463
Ridwan, M., Suyono, H., & Sarosa, M. (2013). Penerapan Data mining Untuk
Evaluasi Kinerja Akademik Mahasiswa Menggunakan Algoritma Naive
Bayes Classifier, 7(1), 59–64.
Rohmawati, F., Rohman, G., & Mujilahwati, S. (2017). Sistem Prediksi Jumlah
Pengunjung Wisata Wego Kec.Sugio Kab.Lamongan Menggunakan Metode
Fuzzy Time Series, 3(2).
Witten, I. H., & Frank, E. (2011). Data mining: Practical Machine Learning Tools
and Techniques. Elsevier, San Francisco, 3 edition, 629.
https://doi.org/0120884070, 9780120884070
54
LAMPIRAN
Lampiran 1
55
1
42 B B B B A D A A C tidak
43 B B C C C A C A A tidak
44 A B A A B A A A A di angkat
45 B A B B B B B A A di angkat
46 B B C C C C C A C tidak
47 B B B B B B A A A di angkat
48 B B B B A A A C A di angkat
49 B B C C C A C C A tidak
50 B A B B B A A C A di angkat
51 B B C C A A C A C tidak
52 A A B B A A B A C tidak
53 A A B B A B C A A di angkat
54 B D A A A D C A A tidak
55 B B B B A A C A A di angkat
56 B A B A A C C A A tidak
57 B D A A A A B C A tidak
58 B D A B A A B A A tidak
59 D B D B A A C A A tidak
60 B B A A A D B A A tidak
61 B B A A A A B A C di angkat
62 B A A A A A B C A di angkat
63 B A A A A A C A A di angkat
64 A B B B A D B C C tidak
65 A B C C C C C A A tidak
66 D B D B A D C B A tidak
67 A C D B A A C A A tidak
68 A B C A A A C A A tidak
69 A B C C C A C B A tidak
70 A A B B B A B A A di angkat
71 A C A A A A B A B di angkat
72 A C D A A A C A A tidak
73 A B C C A A C A A tidak
74 A A B B A A C A C tidak
75 A A B B A D C A A tidak
76 A A A C A A B A A di angkat
77 D C D A A A C A A tidak
78 C B C A A C A C A tidak
79 C A B A A C A C B tidak
80 C A B A B C A C A tidak
81 A D D A A A A A A tidak
82 A B A C A A B A A di angkat
83 A B C C C C B A C tidak
84 A B A A A D B A B di angkat
85 A C A A A B B A A di angkat
86 A A A A A C B A A di angkat
87 A D A A C A B A A tidak
88 A A B A A A B A A di angkat
89 A A D B A A B A A tidak
90 A A D A A A B A A tidak
91 A A B B A A B A A di angkat
92 A B C C A A B A A tidak
93 A B C C A A B A C tidak
94 A B C C C A A A A tidak
95 C C A A C D A C C tidak
96 A C A A A D A C A tidak
97 B A A B A A A A A di angkat
98 B B A A A B A A A di angkat
99 A B C C C A A C A tidak
100 B A A A A A A C A di angkat
101 B A A A B A A A A di angkat
102 B A B A A A A A A di angkat
103 B A A A A A A B A di angkat
104 B A B B A A A A A di angkat
105 A A B B B A A A B di angkat
106 B A B B B A A A A di angkat
107 B B C C C B A A A tidak
108 B B C C C A A A A tidak
109 B A A A D A A A A di angkat
110 B A B B B B A A B di angkat
111 B B C C C C A A A tidak
112 B A D A C D A C A tidak
113 B B C C C C C C A tidak
114 B A D A C D A A C tidak
115 B A D A C D A A A tidak
116 B A A C C A A A A di angkat
117 B A B B B B A A A di angkat
118 B B C C C C B A A tidak
119 B A A C C D A A C tidak
120 B C D C C D A A A tidak
121 A A A A B A A A A di angkat
122 A D A A C A A A A tidak
123 A D A A A C A A A tidak
124 A A A A A A C A A di angkat
125 A B B A A A A A A di angkat
126 A C A A A D A A A tidak
127 A A B A A A A A A di angkat
128 A A B A A D A A C tidak
129 A A B B B B B C A di angkat
130 A A B A A A C A A di angkat
131 A A B A A A A B A di angkat
132 A B B B A A A A A di angkat
133 A C B A A B A A A di angkat
134 A C B A A A A A A di angkat
135 A C B A A A A C A di angkat
136 A C B A C A A A B di angkat
137 A C D A A A A A A tidak
138 C B A A B C A C A tidak
139 A B A A A B A A A di angkat
140 C B A A A C A C A tidak
141 A B A A A A A A A di angkat
142 A D A C A A A A A tidak
143 A B A A A D A A A di angkat
144 A A B B A A A A A di angkat
145 A B C C A D A A A tidak
146 A B A C A A A A A di angkat
147 A B C C C A A A C tidak
148 A B A C B A A B A di angkat
149 C A B B B B A B A di angkat
150 A B A C B D A A A tidak
151 A B A C B D A A B tidak
152 A A B B B B B A B di angkat
153 A A A C A A A A A di angkat
154 A B A A B A A C A di angkat
155 A C A A B D A A A tidak
156 A B C C C C C C B tidak
157 B A A A A A A A B di angkat
158 B D A A A A A A C tidak
159 B C A A C A A A A di angkat
160 B A A A A B A A A di angkat
161 B C D A A A A A A tidak
162 B C D B B A B A A tidak
163 B C D B B D A A C tidak
164 B B C C C C C C C tidak
165 A C A A A A A A A di angkat
166 A B B A B A A A A di angkat
167 B C D B B A A A A tidak
168 A D A A A D A A A tidak
169 A A B A B A A A A di angkat
170 A A B B A A A C A di angkat
171 A B B A A A A B A di angkat
172 A C D B A A A A A tidak
173 A A B B B A A C A di angkat
174 A C D B B C A A A tidak
175 A A B B B B A C A di angkat
176 A A B B B D A A C tidak
177 A B C C C C C A C tidak
178 A A B B B B B A C di angkat
179 B D D A A A A B A tidak
180 B A B A A A A C A di angkat
181 B A C A A C A A A di angkat
182 B A C B B A A A A di angkat
183 B B C C C A A A B tidak
184 A A A A A A A C A di angkat
185 A B D A A C A A A tidak
186 C A A A A C A C A tidak
187 A D A C B A A A A tidak
188 A D A A D A A A A tidak
189 C A D A A A A C A tidak
190 A B A B A A A A A di angkat
191 C A B A A C A C A tidak
192 A B C C A A A C A tidak
193 A A C B C D A A C tidak
194 B B A A A A A C A di angkat
195 B A B B A A A C A di angkat
196 B A A B C A A A A di angkat
197 B B C C C D A A A tidak
198 B A B B B B A C A di angkat
199 C B C A A A A C A tidak
200 A C B A D A A A C tidak
201 A A D A A A C A A tidak
202 A A B B B A A A A di angkat
203 A A B D B A A A A di angkat
204 A A A B C D A A A tidak
205 B B A A A A C A A di angkat
206 B D A C A A A A A tidak
207 B A A B A D A A C tidak
208 B A A B D C A A A tidak
209 B A B B B B B A B di angkat
210 B A A A D D A B C tidak
211 A A A A C A A A C di angkat
212 A A B B C A A A A di angkat
213 A A D A A D A A A tidak
214 A A D A A B A A B di angkat
215 A B C C C C C B A tidak
216 B A A A D C A A A tidak
217 B D A A A A B A A tidak
218 B B C C A C A A A tidak
219 B B C C C A A A C tidak
220 B A A A A D A A C tidak
221 A A C A A A C A C tidak
222 A A A A A C A C C tidak
223 A B A A C D A A C tidak
224 A A B B A A C A A di angkat
225 A A B B B B C A A di angkat
226 B A B D A A A A A di angkat
227 B A D A A A B A A tidak
228 B A B B B B B B A di angkat
229 A A A B A A A A A di angkat
230 A B A A C D A A A tidak
231 A A A A A C A C A di angkat
232 C B A A A D A C A tidak
233 C A A A A D A B A tidak
234 C A A A A D A A A tidak
235 A B C C C C C C C tidak
236 B A B A A A B A A di angkat
237 B B A A C A A A A di angkat
238 B A D A A A A A C tidak
239 B B C C C C A B A tidak
240 B B C C C C C C B tidak
241 B A B A A A C A A di angkat
242 A B C C C C A B A tidak
243 A A B B B B A A D di angkat
244 A A D A A D C A A tidak
245 A A D A A D B A A tidak
246 A A A A C D A B A tidak
247 C B C A C A A A A tidak
248 A B C C C C C C A tidak
249 A B C C C A C A A tidak
250 A A A A C D A C A tidak
251 C A D A C A A A A tidak
252 C A C A C A A A A tidak
253 A A A A C D A A A tidak
254 C A D A C A A B A tidak
255 C A D A C A A A B tidak
256 C B A A A D A A A tidak
257 A B A A C C A C A tidak
258 A B C A C C A C A tidak
259 A C C A D A A A A tidak
260 A B A A A A C A A di angkat
261 A B A A A A A B A di angkat
262 A C A B A A A A A di angkat
263 A C A A B A A A A di angkat
264 A B A A A A A A B di angkat
265 A C B A A A A B A di angkat
266 A D A A A A A C A tidak
267 A D A A A A A A C tidak
268 A A D A A C A A A tidak
269 A B C A B A C B A tidak
270 A B A A D A A A A di angkat
271 D B B A A A A B A di angkat
272 A B A A C A A A A di angkat
273 A A A A A B A A A di angkat
274 A D B B A C A A A tidak
275 A A B B A A A B A di angkat
276 A A B B A A A A B di angkat
277 A B C C A C A A A tidak
278 A B A C A A A B A di angkat
279 A B A C A A A A B di angkat
280 A B C C A A A A C tidak
281 A C A A C A A A A di angkat
282 D B A A A C A A A tidak
283 A A B B C D A A A tidak
284 A A B B B A C A A di angkat
285 A A B B B A A B A di angkat
286 A B C C C B A A A tidak
287 A B C C C D A A A tidak
288 A B C C C A A A B tidak
289 A B D A D A B A A tidak
290 D B B A A A A A A di angkat
291 A A B B B B A A B di angkat
292 A B C C C C A C A tidak
293 A B C C C C A A B tidak
294 A B B B A D B A A tidak
295 A B C C C C C A B tidak
296 A B B B A D B A B tidak
297 A B B B A D B B A tidak
298 A B B B A D B B B tidak
299 A B B B A D B B C tidak
300 B A A A C A A A A di angkat
301 B A A A A A C A B di angkat
302 B B A B A A A A A di angkat
303 B B A D A B A A A di angkat
304 B B A A A A A B A di angkat
305 B B A A B A A A A di angkat
306 B B A A A A B A A di angkat
307 B D B A A A A A A di angkat
308 B D A A A D A A A tidak
309 B A B A B A A A A di angkat
310 B A B A A B A A A di angkat
311 B A B A A A A B A di angkat
312 C A B A A A B A C tidak
313 B B C D A C A A A tidak
314 D B A A A B A A A di angkat
315 B C B B A A A A A di angkat
316 B C B A B A A A A di angkat
317 B C B A C A A A A di angkat
318 B C B A A A A A A di angkat
319 B C B A A B A A A di angkat
320 B C B A A D A A A tidak
321 B C D A A A B A A tidak
322 B C D A A A C A A tidak
323 B A A D A A A A A di angkat
324 B D A A A A A C A tidak
325 B D A A A A A A D tidak
326 B A B B C A A A A di angkat
327 B A B B A B A A A di angkat
328 B A B B A A B A A di angkat
329 B A B B A A A A B di angkat
330 C A B B A A B A D tidak
331 B B A B B A A A A di angkat
332 B B C C A D A A A tidak
333 B B C C A A B A A tidak
334 B B C C A A C A A tidak
335 B B A C A A A A A di angkat
336 B B C C A A A C A tidak
337 B B C C A A A A C tidak
338 B A B B D C A A A tidak
339 B A D B A A C A A tidak
340 B A C B A A A B A di angkat
341 B A C B A A A A A di angkat
342 B A C D A A A A B tidak
343 B A C D A A A A C tidak
344 B A C D A A A A D tidak
345 B A B D B A A A A di angkat
346 B A B B B B C A A di angkat
347 B A B B B A C A A di angkat
348 B A B B B A A B A di angkat
349 B A B B B A A A B di angkat
350 B A B B B A B A A di angkat
351 B B C C C A B A A tidak
352 B B C C C A A B A tidak
353 B B C C C A A A D tidak
354 B A C C C A A A A tidak
355 B A C C C D A A A tidak
356 B A C C C A C A A tidak
357 B A C A C A A A A di angkat
358 B A C A C A A B A di angkat
359 B A C A C A A A B di angkat
360 B A B B B B A B A di angkat
361 B B C C C C A C A tidak
362 B B C C C C A A B tidak
363 B B C C C C A A D tidak
364 B A C A C D A A A tidak
365 B C D A C D B A A tidak
366 B C D A A D A A A tidak
367 B C D A A D A B A tidak
368 B C A A D D A B A tidak
369 B C A A A D A A B tidak
370 B A B B B B B C A di angkat
371 B B C C C C C B A tidak
372 B B C C C C C A B tidak
373 B B C C C C C A D tidak
374 B B A A A D C A A tidak
375 B B A A A D C B A tidak
376 B B A C A D C C A tidak
377 B B A C A D C A B tidak
378 B B A C A D C A C tidak
379 B B C C C C C C D tidak
380 B C A D D D C B B tidak
Lampiran 2
Kemampu Kerjasa
Penerim penilaian dan
Prediksi Prediksi an Untuk ma / pencapai penetapan
Pengetahu aan pengambilan Kehadiri inovasi
No Rapid data sasaran /
an kerja Merencana Tanggun Hubunga an tujuan keputusan an
miner testing kan dan n tujuan
g Jawab
Mengatur Manusia
1 Tidak Tidak A B C D C B B C A
2 Tidak Tidak C A C D C B B C C
Di
3 Tidak C B A D C B B C D
Angkat
4 Tidak Tidak C A B C D A B B D
Di Di
5 A B B B A B A B A
Angkat Angkat
6 Tidak Tidak B A A A A D A B C
Di Di
7 B B A A A B A C C
Angkat Angkat
Di Di
8 B B A B A B B B B
Angkat Angkat
9 Tidak Tidak A C D C B B B C A
Di Di
10 B A B A A A A A D
Angkat Angkat
Di Di
11 A B A B B A B B C
Angkat Angkat
Di Di
12 B B A B B B A A C
Angkat Angkat
Di Di
13 B B B B B B A B B
Angkat Angkat
14 Tidak Tidak B C D A C C B A D
Di Di
15 B B A B B C B B A
Angkat Angkat
16 Tidak Tidak A B B B B C B B C
17 Tidak Tidak A B A B B C A A D
Di Di
18 B B B B B B B A B
Angkat Angkat
Di Di
19 B B A B A B A B B
Angkat Angkat
20 Tidak Tidak C A D C B B B B B
21 Tidak Tidak C B A A B D B B D
Di Di
22 B B B D A B A B A
Angkat Angkat
Di Di
23 A B A B B B B B B
Angkat Angkat
24 Tidak Tidak A A B C D A B A C
Di Di
25 B B A A A B A B B
Angkat Angkat
63
64
Di Di
26 A B B B D A A B A
Angkat Angkat
27 Tidak Tidak B B B A D D A A D
28 Tidak Tidak A A C D A D B C D
29 Tidak Tidak C D A D C C B C C
30 Tidak Tidak C C B D A D A C B
31 Tidak Tidak A A A A D D B A D
32 Tidak Tidak B B B D A C A B A
33 Tidak Tidak A B C D C B B C D
Di Di
34 C B B B C B A A A
Angkat Angkat
35 Tidak Tidak C A C D C B B C A
Di
36 Tidak A B A B C B B A A
Angkat
37 Tidak Tidak C A B C D D B A C
38 Tidak Tidak B A A C C D B A B
39 Tidak Tidak C B A A A A B C B
Di Di
40 B B A B C A B A B
Angkat Angkat
41 Tidak Tidak A C D C B B B C D
42 Tidak Tidak C B C A A B B D A
43 Tidak Tidak C A C D A D A A D
44 Tidak Tidak D B B B C D C B B
45 Tidak Tidak B B D A A D A B C
46 Tidak Tidak A D B B D C A D B
Di Di
47 A A A D A B A B D
Angkat Angkat
Di
48 Tidak B A B B B B A A D
Angkat
Di Di
49 A A A B A B A B A
Angkat Angkat
Di Di
50 A A B A B B B B A
Angkat Angkat