BAB I
PENDAHULUAN
Kemajuan teknologi adalah sesuatu yang tidak bisa dihindari dalam kehidupan
ini, karena kemajuan teknologi akan berjalan sesuai dengan kemajuan ilmu
pengetahuan. Dengan adanya teknologi yang berkembang pesat pada saat ini
Daya Manusia (SDM) yang merupakan aset perusahaan yang sangat berharga dan
harus dikelola dengan baik agar dapat memberikan kontribusi yang optimal dalam
kemajuan perusahaan atau instansi. Keberadaan karyawan adalah salah satu alasan
kerja karyawan di perusahaan merupakan hal yang penting dan perlu diperhatikan
seorang karyawan itu layak untuk diperpanjang kontrak kerjanya atau diputus
seperti sikap kerja dan attitude karyawan tersebut juga perlu diperhatikan (Priyono
karena frekuensi tatap muka antara Human Resources Department (HRD) dan
karyawan sangat minim (Windy, Rika, & Kautsar, 2014). Keputusan seorang
HRD adalah hal yang sangat vital pada perusahaan khususnya dalam mengelola
karyawan harus dilakukan secara obyektif dan efisien agar proses seleksi dapat
berjalan sesuai dengan yang diharapkan perusahaan. PT. Siantar Media Pers yang
bergerak di bidang berita memiliki karyawan kontrak lebih dari 120 karyawan
penyaringan karyawan yang masih layak dan memenuhi syarat untuk dilakukan
karyawan, sangat ditentukan oleh fungsi seleksi ini. Jika fungsi ini tidak
dilaksanakan dengan baik maka dengan sendirinya akan berakibat fatal terhadap
objek berdasarkan informasi yang diperoleh dari data yang menjelaskan hubungan
antar objek dengan prinsip untuk memaksimalkan kesamaan antar anggota satu
clustering data mining memiliki beberapa algoritma salah satunya yaitu algoritma
menggunakan algoritma C.45 yang dapat mengelola nilai inputan yang sesuai
dalam sebuah data set yang berguna untuk proses analisis data.
seleksi Pengangkatan Karyawan Tetap pada PT. Siantar Media Pers. Penelitian ini
membentuk model pengelompokan pohon keputusan menggunakan metode
pada proses seleksi Pengangkatan Karyawan Tetap di PT. Siantar Media Pers.
MEDIA PERS”
untuk menilai kinerja karyawan terbaik dengan pengelompokan data yang tepat,
kebutuhan perusahaan.
Adapun
Mempermudah menganalisis data untuk hasil yang lebih tepat dan efisien
karyawan tetap.
menganalisis data.
1.5.2 Bagi Objek Penelitian (PT. Siantar Media Pers)
Adapun manfaat dari penelitian ini adalah membantu mempermudah HRD dalam
melakukan analisis data dengan tepat sehingga dalam proses seleksi Pengangkatan
BAB I PENDAHULUAN
Bab ini berisi latar belakang, perumusan masalah, batasan masalah, tujuan,
Bab ini berisi tentang uraian mengenai teori-teori dasar yang akan
Bab ini berisi tentang gambaran umum teknik data mining, berisi tentang
Pada bab ini berisikan beberapa kesimpulan dan saran dari hasil pengolahan
BAB II
LANDASAN TEORI
Pada Bab ini, akan dibahas mengenai teori tentang konsumen dan pelayanan
yang diharapkan konsumen. Machine learning dan cara kerja machine learning
kepada data empiris, seperti dari sensor data pada basis data. Sistem pembelajaran
dapat memanfaatkan contoh (data) untuk menangkap ciri yang diperlukan dari
probabilitas yang mendasarinya (yang tidak iketahui). Data dapat dilihat sebagai
contoh yang menggambarkan hubungan antara variabel yang diamati. Fokus besar
karena himpunan semua perilaku yang mungkin, dari semua masukan yang
perilaku dari contoh yang ada untuk menghasilkan keluaran yang berguna dalam
bagaimana caranya agar komputer dapat belajar dari pengalaman. Hal tersebut
terbukti pada tahun 1952, Arthur Samuel menciptakan sebuah program, game of
proses komputer untuk belajar dari data (learn from data). Tanpa adanya data,
komputer tidak akan bisa belajar apa-apa. Oleh karena itu jika kita ingin belajar
machine learning, pasti akan terus berinteraksi dengan data. Semua pengetahuan
machine learning pasti akan melibatkan data. Data bisa saja sama, akan tetapi
membentuk keputusannya.
pembangunan sistem yang berdasarkan pada data. Banyak hal yang dipelajari,
akan tetapi pada dasarnya ada 4 hal pokok yang dipelajari dalam machine
masa lalu.
yang dihasilkan.
algoritma ini akan memberikan poin (reward) saat model yang diberikan
semakin baik atau mengurangi poin (error) saat model yang dihasilkan
dari suatu kumpulan data berupa pengetahuan yang selama ini tidak
2. Data mining adalah analisis otomatis dari data yang berjumlah besar
mencakup analisis dan prediksi dari informasi yang ingin ditampilkan. Data yang
dalam basis data yang sangat besar akan tetapi berkaitan satu sama yang lain,
1. Data Selection
Data hasil seleksi yang akan digunakan untuk proses data mining,
2. Pre-processing/ Cleaning
a. Pemprosesan pendahuluan dan pembersihan data merupakan operasi
sudah ada dengan data atau informasi lain yang relevan dan
3. Pre-processing/ Cleaning
sehingga data tersebut sesuai untuk proses data mining. Proses ini
merupakan proses kreatif dan sangat tergantung pada jenis atau pola
4. Data mining
5. Interpretation/ Evaluation
berkepentingan.
2.5 Klasifikasi
Klasifikasi adalah suatu bentuk analisis data yang mengekstrak model yang
menggambarkan kelas data penting. Model seperti itu, yang disebut penggolong,
memprediksi label kelas kategoris (diskrit, tidak berurutan). Misalnya, kita bisa
berisiko analisis semacam itu dapat membantu kami memahami data dengan lebih
baik besar. Banyak metode klasifikasi yang telah diajukan oleh peneliti dalam
memori penduduk, biasanya dengan asumsi ukuran data yang kecil. Penelitian
data mining terbaru telah dibangun di atas pekerjaan semacam itu, berkembang
klasifikasi terukur dan teknik prediksi yang mampu menangani sejumlah besar
data disk- resident. Klasifikasi memiliki banyak aplikasi, termasuk deteksi
(Adhika, 2017).
yang sangat kuat dan terkenal. Metode pohon keputusa mengubah fakta yang
dapat dengan mudah dipahami dengan bahasa alami. Dan mereka juga dapat
ini mempunyai input berupa training samples dan samples. Training samples
berupa data contoh yang akan digunakan untuk membangun sebuah tree yang
(Sunjana, 2010).
adalah ID3 dan C4.5. Keduanya mempunyai prinsip yang sama dikarenakan
utama yaitu :
1. C4.5 dapat menangani atribut yang kontinyu dan diskrit dan juga dapat
menangani data training dengan nilai yang hilang atau data yang kosong.
2. Hasil yang didapat dari Algoritma C4.5 akan terpangkas setelah dibentuk
Gain (S . A)
GainRatio ( S . A )=
SplitInfo(S . A)
Gambar 2.2 Rumus Gain Ratio
Sumber: Quinlan
Dimana:
A = Atribut
Gain(S,A) = information gain pada atribut A
Dengan atribut yang nilai Gain Ration yang paling tertinggi dipilih sebagai
information gain dengan menggunakan apa yang disebut dengan split information,
dengan rumus :
i
SI S
SplitInfo ( S . A )=−∑log 2 i
i=1 S S
Gambar 2.3 Rumus Split Information
Sumber: Quinlan
Dimana:
A = Atribut.
Pada saat membangun pohon keputusan, mungkin adanya data yang noise
maupun kosong pada training data. Pemangkasan pohon dapat dilakukan untuk
mengenali dan menghilangkan cabang tersebut agar pohon lebih kecil dan lebih
mudah dipahami agar lebih baik dalam melakukan klasifikasi. Ada dua metode
subtree agar tidak sampai lebih jauh dalam pemangkas data training.
Rumus Prepruning :
2
Z
r+ + Z √❑
2n
e=
❑
Gambar 2.4 Rumus Prepruning
Sumber: Quinlan
Dimana :
n = total sample
z = Φ-1(c)
c= confidence level
BAB III
METODOLOGI PENELITIAN
perangkat lunak, kebutuhan perangkat keras serta desain kuesioner beserta skala
pengukuran.
berikut :
kuesioner
sebagai berikut :
2. Ram 2 Gb
data diperoleh dengan menyebarkan kuesioner. Kuesioner adalah alat ukur yang
1. Loyalitas Karyawan
diberikan hingga pekerjaan tersebut tuntas tepat waktu dan tepat guna.
Data variabel tersebut dikonversi ke bentuk angka yang diambil dari skala
yang terdapat pada kuesioner. Secara umum, ada 2 (dua) skala pengukuran yang
1. Umur
2. Jenis Kelamin
3. Status Pernikahan
4. Dan Sebagainya
2. Skala Interval
sebagai berikut :
karyawan pada PT. Siantar Media Pers yang dilakukan pada bulan Mei - Juli
2022.
40 (empat puluh) Orang sampel data. Pada Kuesioner yang disebarkan terdapat
form isian yang akan dijawab oleh Calon Karyawan tetap dan diisi HRD yang
sudah selesai diisi. Diperlukan data yang terpercaya dari responden, data yang
jawaban yang sudah disediakan oleh peneliti untuk di pilih oleh responden.
karyawan, inisiatif dalam bekerja, dan tanggung jawab dalam bekerja pada PT.
dari suatu penelitian, karena analisa data berfungsi untuk menyimpulkan hasil
penelitian (Ekhomawaty, 2017). Teknik analisis data dibagi menjadi dua, yaitu
teknik analisis data kuantitatif dan teknik analisis data kualitatif. Teknik analisis
data dibagi menjadi dua, yaitu teknik analisis data kuantitatif dan teknik analisis
Data yang digunakan dalam penelitian ini adalah data berdasarkan pada
melalui HRD terhadap calon karyawan tetap PT. Siantar Media Pers. Metode
penelitian ini yaitu data kuisioner calon karyawan tetap PT Siantar Media
Pers.
Siantar Media Pers dengan menghapus data yang tidak digunakan atau yang
PT. Siantar Media Pers . Sebagian data yang ada pada Tabel 3.2 dibawah ini,
dalam bekerja, dan tanggung jawab dalam bekerja sedangkan pada kolom
Hasil Keputusan yaitu berisi “Ya” dan “Tidak”. Kemudian langkah tersebut
data dianalisis.
6. Hasil dari pengolahan atau perhitungan menggunakan Algoritma C4.5
untuk menghitung Entrophy dan Gain dari seluruh atribut yang ada. Nilai
10. Evaluasi dan Validasi Dalam tahap ini dilakukan validasi dan evaluasi
DAFTAR PUSTAKA
Arifin. (2015). Metode Data Mining Untuk Klasifikasi Data Sel Nukleus Dan Sel Radang
CITEE, 257.
Harryanto, F.F, & Hansun, Seng. (2017). Penerapan Algoritma C4.5 untuk Memprediksi
Hasibuan, Malayu S.P. 2006, Manajemen Sumber Daya Manusia, edisi Revisi. Jakarta. Bumi
Aksara.
Iriadi, Nandang & Nuraeni. (2016). Kajian Penerapan Metode Klasifikasi Data Mining
Algoritma C4.5 Untuk Prediksi Kelayakan Kredit Pada Bank Mayapada Jakarta: Jurnal Teknik
Lumbantoruan & Kennedy. (2015). Analisis Data Mining Dan Warehousing: Jurnal Ilmiah