Bernando Hutajulu Bab I - Iii & Daftar Pustaka

2
BAB I
PENDAHULUAN
1.1. Latar Belakang
Kemajuan teknologi adalah sesuatu yang tidak bisa dihindari dalam kehidupan
ini, karena kemajuan teknologi akan berjalan sesuai dengan kemajuan ilmu
pengetahuan. Dengan adanya teknologi yang berkembang pesat pada saat ini
tentunya akan mempengaruhi dalam dunia pekerjaan. Karyawan adalah Sumber
Daya Manusia (SDM) yang merupakan aset perusahaan yang sangat berharga dan
harus dikelola dengan baik agar dapat memberikan kontribusi yang optimal dalam
kemajuan perusahaan atau instansi. Keberadaan karyawan adalah salah satu alasan
perusahaan dalam menentukan keberlangsungan aktivitas usaha. Status kontrak
kerja karyawan di perusahaan merupakan hal yang penting dan perlu diperhatikan
demi tercapainya tujuan perusahaan. Dalam hal untuk menentukan apakah
seorang karyawan itu layak untuk diperpanjang kontrak kerjanya atau diputus
kontraknya sering terjadi kesulitan dalam menentukan hal tersebut, di samping
banyaknya kriteria penilaian yang diperlukan untuk memutuskan, faktor lain
seperti sikap kerja dan attitude karyawan tersebut juga perlu diperhatikan (Priyono
& Indrajit, 2017).
Pada perusahaan kegiatan penilaian kinerja karyawan sulit dilaksanakan
karena frekuensi tatap muka antara Human Resources Department (HRD) dan
karyawan sangat minim (Windy, Rika, & Kautsar, 2014). Keputusan seorang
HRD adalah hal yang sangat vital pada perusahaan khususnya dalam mengelola
karyawan untuk dampak selanjutnya. Karena itulah dalam penilaian kinerja
karyawan harus dilakukan secara obyektif dan efisien agar proses seleksi dapat
berjalan sesuai dengan yang diharapkan perusahaan. PT. Siantar Media Pers yang
bergerak di bidang berita memiliki karyawan kontrak lebih dari 120 karyawan
sehingga perusahaan kesulitan melakukan proses seleksi karyawan atau
penyaringan karyawan yang masih layak dan memenuhi syarat untuk dilakukan
proses perpanjangan kontrak kerja. Diperpanjang atau tidaknya kontrak kerja
karyawan, sangat ditentukan oleh fungsi seleksi ini. Jika fungsi ini tidak
dilaksanakan dengan baik maka dengan sendirinya akan berakibat fatal terhadap
pencapaian tujuan-tujuan perusahaan.
Data mining mempunyai fungsi yang penting untuk membantu mendapatkan
informasi yang berguna bagi perusahaan. Banyaknya parameter dalam
menentukan diperpanjang atau tidaknya kontrak kerja karyawan menyebabkan
ketepatan dan kecepatan dalam penilaian kerja kurang terpenuhi. Metode
clustering data mining merupakan proses pengelompokan atau penggolongan
objek berdasarkan informasi yang diperoleh dari data yang menjelaskan hubungan
antar objek dengan prinsip untuk memaksimalkan kesamaan antar anggota satu
kelas dan meminimumkan kesamaan antar kelas / cluster. Adapun metode
clustering data mining memiliki beberapa algoritma salah satunya yaitu algoritma
C. 45. Penyeleksian ini dilakukan sesuai kriteria-kriteria clustering utama dengan
menggunakan algoritma C.45 yang dapat mengelola nilai inputan yang sesuai
dengan kriteria-kriteria pada penilaian kinerja karyawan yang mempunyai nilai
prioritas tertentu. Algoritma C.45 digunakan untuk menemukan pola distribusi di
dalam sebuah data set yang berguna untuk proses analisis data.
Berdasarkan uraian di atas maka penulis tertarik untuk menganalisis proses
seleksi Pengangkatan Karyawan Tetap pada PT. Siantar Media Pers. Penelitian ini
membentuk model pengelompokan pohon keputusan menggunakan metode
algoritma C.45 guna membantu mengatasi beberapa permasalahan yang terjadi
pada proses seleksi Pengangkatan Karyawan Tetap di PT. Siantar Media Pers.
Maka dalam penyusunan SKRIPSI penulis mengambil judul “PREDIKSI
PENGANGKATAN KARYAWAN TIDAK TETAP MENJADI
KARYAWAN TETAP MENGGUNAKAN C.45 PADA PT SIANTAR
MEDIA PERS”
1.2. Rumusan Masalah
Berdasarkan latar belakang diatas maka rumusan masalah yang didapat
adalah bagaimana mengaplikasikan data mining dengan metode algoritma C.45
untuk menilai kinerja karyawan terbaik dengan pengelompokan data yang tepat,
sehingga dapat membantu proses seleksi pengangkatan karyawan tetap sesuai
kebutuhan perusahaan.
1.3. Batasan Masalah
Karena keterbatasan waktu dan mengingat banyaknya permasalahan yang
dihadapi oleh perusahaan maka penulis melakukan pembatasan masalah.
Adapun
batasan masalah ini adalah:
1. Penulis hanya membahas penggunaan data mining untuk menentukan
karyawan yang layak untuk diangkat menjadi karyawan tetap di PT.
Siantar Media Pers. dengan menggunakan metode algoritma C.45 agar
tidak terjadi lagi subjektifitas dalam proses penilaian untuk
pengangkatan karyawan tetap.
2. Pengolahan data menggunakan tools RAPID MINER sebagai perangkat

lunak bantuan untuk menentukan karyawan tidak tetap yang layak
diangkat menjadi karyawan tetap di PT. Siantar Media Pers.
1.4. Tujuan Penelitian
1.4.1 Bagi Penulis
Untuk memenuhi salah satu syarat memperoleh gelar Sarjana Teknik
Informatika dan untuk menambah ilmu pengetahuan, pengalaman, dan
pengamatan tentang penerapan data mining kedalam suatu data penelitian.
1.4.2 Bagi Objek Penelitian (PT. Siantar Media Pers)
Mempermudah menganalisis data untuk hasil yang lebih tepat dan efisien
sehingga dapat membantu perusahaan dalam proses seleksi pengangkatan
karyawan tetap.
1.5. Manfaat Penelitian
1.5.1 Bagi Penulis
Menambah wawasan atau pengetahuan tentang penerapan data mining
menggunakan metode algoritma C.45 sebagai bentuk implementasi nyata
menganalisis data.
1.5.2 Bagi Objek Penelitian (PT. Siantar Media Pers)
Adapun manfaat dari penelitian ini adalah membantu mempermudah HRD dalam
melakukan analisis data dengan tepat sehingga dalam proses seleksi Pengangkatan
Karyawan Tetap bisa lebih tepat dan efisien.
1.6 Sistematika Penulisan
Sistematika penulisan dalam tugas akhir ini, disusun sebagai berikut :
BAB I PENDAHULUAN
Bab ini berisi latar belakang, perumusan masalah, batasan masalah, tujuan,
manfaat dan sistematika penulisan.
BAB II LANDASAN TEORI
Bab ini berisi tentang uraian mengenai teori-teori dasar yang akan
mendukung pembahasan masalah, Uraian tersebut menjelaskan tentang
Algoritma C4.5 dalam teknik pengolahan data mining.
BAB III METODOLOGI PENELITIAN
Bab ini berisi tentang gambaran umum teknik data mining, berisi tentang
gambaran umum tentang algoritma C4.5 beserta langkah-langkahnya serta
penerapannya dengan aplikasi pengolah data mining.
BAB IV ANALISIS DAN PEMBAHASAN

Pada bab ini merupakan penjelasan mengenai uji coba dan analisa dari
penghitungan yang dilakukan dengan teknik data mining.
BAB V KESIMPULAN DAN SARAN
Pada bab ini berisikan beberapa kesimpulan dan saran dari hasil pengolahan
data karyawan PT. Siantar Media Pers.

8
BAB II
LANDASAN TEORI
Pada Bab ini, akan dibahas mengenai teori tentang konsumen dan pelayanan
yang diharapkan konsumen. Machine learning dan cara kerja machine learning
serta teori data mining lebih khususnya menggunakan metode C4.5.
2.1 Machine Learning
Machine learning adalah cabang dari kecerdasan buatan, merupakan disiplin
ilmu yang mencakup perancangan dan pengembangan algoritma yang
memungkinkan komputer untuk mengembangkan perilaku yang didasarkan
kepada data empiris, seperti dari sensor data pada basis data. Sistem pembelajaran
dapat memanfaatkan contoh (data) untuk menangkap ciri yang diperlukan dari
probabilitas yang mendasarinya (yang tidak iketahui). Data dapat dilihat sebagai
contoh yang menggambarkan hubungan antara variabel yang diamati. Fokus besar
penelitian Machine learning adalah bagaimana mengenali secara otomatis pola
kompleks dan membuat keputusan cerdas berdasarkan data. Kesukarannya terjadi
karena himpunan semua perilaku yang mungkin, dari semua masukan yang
dimungkinkan, terlalu besar untuk diliput oleh himpunan contoh pengamatan
(data pelatihan). Karena itu Machine learning harus merampatkan (generalisasi)
perilaku dari contoh yang ada untuk menghasilkan keluaran yang berguna dalam
kasus-kasus baru (Purnamasari, 2015).
Sejak pertama kali komputer diciptakan manusia sudah memikirkan
bagaimana caranya agar komputer dapat belajar dari pengalaman. Hal tersebut
terbukti pada tahun 1952, Arthur Samuel menciptakan sebuah program, game of
checkers, pada sebuah komputer IBM. Program tersebut dapat mempelajari
gerakan untuk memenangkan permainan checkers dan menyimpan gerakan
tersebut kedalam memorinya. Istilah machine learning pada dasarnya adalah
proses komputer untuk belajar dari data (learn from data). Tanpa adanya data,
komputer tidak akan bisa belajar apa-apa. Oleh karena itu jika kita ingin belajar
machine learning, pasti akan terus berinteraksi dengan data. Semua pengetahuan
machine learning pasti akan melibatkan data. Data bisa saja sama, akan tetapi
algoritma dan pendekatan nya berbeda-beda untuk mendapatkan hasil yang
optimal. (Purnamasari, 2015).
2.2 Bagian Machine Learning
Ada beberapa bagian pada machine learning, sistem pembelajaran mesin
terdiri dari tiga bagian utama, yaitu (Tom Mitcel,1997):
1. Model: sistem yang membentuk prediksi atau identifikasi.
2. Parameter: sinyal atau faktor yang digunakan oleh model untuk
membentuk keputusannya.
3. Pembelajaran: sistem yang menyesuaikan parameter dan model dalam
prediksi versus hasil aktual.
Machine learning merupakan salah satu cabang dari disiplin ilmu
Kecerdasan Buatan (Artificial Intellegence) yang membahas mengenai
pembangunan sistem yang berdasarkan pada data. Banyak hal yang dipelajari,
akan tetapi pada dasarnya ada 4 hal pokok yang dipelajari dalam machine
learning (Tom Mitcel, 1997):

1. Supervised machine learning algorithms
Supervised machine learning adalah algoritma machine learning yang
dapat menerapkan informasi yang telah ada pada data dengan
memberikan label tertentu, misalnya data yang telah diklasifikasikan
sebelumnya (terarah). Algoritma ini mampu memberikan target terhadap
output yang dilakukan dengan membandingkan pengalaman belajar di
masa lalu.
2. Unsupervised machine learning algorithms
Unsupervised machine learning adalah algoritma machine learning yang
digunakan pada data yang tidak mempunyai informasi yang dapat
diterapkan secara langsung (tidak terarah). Algoritma ini diharapkan
mampu menemukan struktur tersembunyi pada data yang tidak berlabel.
3. Semi-supervised machine learning algorithms
Semi-supervised machine learning adalah algoritma yang digunakan
untuk melakukan pemebelajaran data berlabel dan tanpa label. Sistem
yang menggunakan metode ini dapat meningkatkan efesiensi output
yang dihasilkan.
4. Reinforcement machine learning algorithms
Reinforcement machine learning adalah algoritma yang mempunyai
kemampuan untuk bertinteraksi dengan proses belajar yang dilakukan,
algoritma ini akan memberikan poin (reward) saat model yang diberikan
semakin baik atau mengurangi poin (error) saat model yang dihasilkan
semakin buruk. Salah satu penerapannya adalah pada mesin pencari.

2.3 Data Mining
Berikut ini beberapa definisi dari data mining:
1. Data mining adalah serangkaian proses untuk menggali nilai tambah
dari suatu kumpulan data berupa pengetahuan yang selama ini tidak
diketahui secara manual (Pramudiono, 2016).
2. Data mining adalah analisis otomatis dari data yang berjumlah besar
atau kompleks dengan tujuan untuk menemukan pola atau
kecenderungan yang penting yang biasanya tidak disadari
keberadaannya (Pramudiono, 2016).
3. Data mining merupakan analisis dari peninjauan kumpulan data untuk
menemukan hubungan ynag tidak diduga dan meringkas data dengan
cara yang berbeda dengan sebelumnya, yang dapat dipahami dan
bermanfaat bagi pemilik data (Larose, 2015).
4. Data mining merupakan bidang dari beberapa bidang keilmuan yang
menyatukan teknik dari pembelajaran mesin, pengenalan pola, statistik,
basis data, dan visualisasi untuk penanganan permasalahan pengambilan
informasi dari basis data yang besar (Larose, 2015).
Pengumpulan data mining bukan sekedar terkumpul data saja tetapi
mencakup analisis dan prediksi dari informasi yang ingin ditampilkan. Data yang
dikumpulkan disimpan dalam database kemudian diproses sehingga dapat
dijadikan untuk pengambilan keputusan dalam melihat informasi yang akan
digunakan. Data mining dan Knowledge Discovery in Databases (KDD) sering

kali digunakan secara bergantian dalam menjelaskan proses penggalian informasi
dalam basis data yang sangat besar akan tetapi berkaitan satu sama yang lain,
skema proses KDD (Han & Kamber, 2016).
2.4 Tahapan Data Mining
Tahap- tahap data mining adalah sebagai berikut (Fayyad, 1996):
Gambar 2.1 Tahap Data Mining (Fayyad, 1996)
1. Data Selection
a. Menciptakan himpunan data target , pemilihan himpunan data, atau
memfokuskan pada subset variabel atau sampel data, dimana
penemuan (discovery) akan dilakukan.
b. Pemilihan (seleksi) data dari sekumpulan data operasional perlu
dilakukan sebelum tahap penggalian informasi dalam KDD dimulai.
Data hasil seleksi yang akan digunakan untuk proses data mining,
disimpan dalam suatu berkas, terpisah dari basis data operasional.
2. Pre-processing/ Cleaning
a. Pemprosesan pendahuluan dan pembersihan data merupakan operasi
dasar seperti penghapusan noise dilakukan.
b. Sebelum proses data mining dapat dilaksanakan, perlu dilakukan
proses cleaning pada data yang menjadi fokus KDD.
c. Proses cleaning mencakup antara lain membuang duplikasi data,
memeriksa data yang inkonsisten, dan memperbaiki kesalahan pada
data, seperti kesalahan cetak (tipografi).
d. Dilakukan proses enrichment, yaitu proses “memperkaya” data yang
sudah ada dengan data atau informasi lain yang relevan dan
diperlukan untuk KDD, seperti data atau informasi eksternal.
3. Pre-processing/ Cleaning
a. Pencarian fitur-fitur yang berguna untuk mempresentasikan data
bergantung kepada goal yang ingin dicapai.
b. Merupakan proses transformasi pada data yang telah dipilih,
sehingga data tersebut sesuai untuk proses data mining. Proses ini
merupakan proses kreatif dan sangat tergantung pada jenis atau pola
informasi yang akan dicari dalam basis data.
4. Data mining
a. Pemilihan tugas data mining; pemilihan goal dari proses KDD
misalnya klasifikasi, regresi, clustering, dan lain-lain.
b. Pemilihan algoritma data mining untuk pencarian (searching).
c. Proses Data mining yaitu proses mencari pola atau informasi
menarik dalam data terpilih dengan menggunakan teknik atau

metode tertentu. Teknik, metode, atau algoritma dalam data mining
sangat bervariasi. Pemilihan metode atau algoritma yang tepat sangat
bergantung pada tujuan dan proses KDD secara keseluruhan
5. Interpretation/ Evaluation
a. Penerjemahan pola-pola yang dihasilkan dari data mining.
b. Pola informasi yang dihasilkan dari proses data mining perlu
ditampilkan dalam bentuk yang mudah mimengerti oleh pihak yang
berkepentingan.
c. Tahap ini merupakan bagian dari proses KDD yang mencakup
pemeriksaan apakah pola atau informasi yang ditemukan
bertentangan dengan fakta atau hipotesa yang ada sebelumnya.
2.5 Klasifikasi
Klasifikasi adalah suatu bentuk analisis data yang mengekstrak model yang
menggambarkan kelas data penting. Model seperti itu, yang disebut penggolong,
memprediksi label kelas kategoris (diskrit, tidak berurutan). Misalnya, kita bisa
membangun klasifikasi untuk mengkategorikan aplikasi pinjaman bank aman atau
berisiko analisis semacam itu dapat membantu kami memahami data dengan lebih
baik besar. Banyak metode klasifikasi yang telah diajukan oleh peneliti dalam
pembelajaran mesin, pengenalan pola, dan statistik. Kebanyakan algoritma adalah
memori penduduk, biasanya dengan asumsi ukuran data yang kecil. Penelitian
data mining terbaru telah dibangun di atas pekerjaan semacam itu, berkembang
klasifikasi terukur dan teknik prediksi yang mampu menangani sejumlah besar
data disk- resident. Klasifikasi memiliki banyak aplikasi, termasuk deteksi
kecurangan, target pemasaran, prediksi kinerja, manufaktur, dan diagnosis medis
(Adhika, 2017).
Klasifikasi adalah proses pengelompokan benda berdasarkan ciri-ciri
persamaan dan perbedaan. Dalam klasifikasi, terdapat terget variabel kategori.
sebagai contoh, penggolongan pendapatan dapat dipisahkan dalam tiga kategori
yaitu: pendapatan tinggi, pendapatan sedang, dan pendapatan rendah (Adhika,
2017). Contoh lain klasifikasi dalam bisnis dan penelitian adalah:
1. Menentukan apakah suatu transaksi kartu kredit merupakan transaksi yang
curang atau bukan.
2. Memperkirakan apakah suatu pengajuan hipotek oleh nasabah merupakan
suatu kredit yang baik atau buruk.
3. Mendiagnosis penyakit seorang pasien untuk mendapatkan termasuk
kategori penyakit apa.
2.6 Algoritma C.45
Algoritma C4.5 merupakan algortima yang digunakan untuk membentuk
pohon keputusan. Pohon keputusan merupakan metodeklasifikasi dan prediksi
yang sangat kuat dan terkenal. Metode pohon keputusa mengubah fakta yang
sangat besar menjadi pohon keputusanyang merepresentasikan aturan. Aturan
dapat dengan mudah dipahami dengan bahasa alami. Dan mereka juga dapat
diekspresikan dalam bentukbahasa basis data seperti Structured Query Language
untuk mencari record pada kategori tertentu (Kusrini, 2009).

Algoritma C4.5 merupakan kelompok algoritma Decision Tree. Algoritma
ini mempunyai input berupa training samples dan samples. Training samples
berupa data contoh yang akan digunakan untuk membangun sebuah tree yang
telah diuji kebenarannya. Sedangkan samplesmerupakan field-field data yang
nantinya akan digunakan sebagai parameter dalam melakukan klasifikasi data
(Sunjana, 2010).
Pohon keputusan banyak sekali perkembangan tetapi yang sering dipakai
adalah ID3 dan C4.5. Keduanya mempunyai prinsip yang sama dikarenakan
Algoritma C4.5 merupakan pengembangan dari ID3, tetapi mempunyai perbedaan
utama yaitu :
1. C4.5 dapat menangani atribut yang kontinyu dan diskrit dan juga dapat
menangani data training dengan nilai yang hilang atau data yang kosong.
2. Hasil yang didapat dari Algoritma C4.5 akan terpangkas setelah dibentuk
3. Pemilihan atribut yang dilakukan dengan menggunakan Gain Ratio.
Algoritma C4.5 merupakan perbaikan dari ID3 menggunakan Gain Ratio
untuk diperbaharui information gain maka dengan rumus :
Gain (S . A)
GainRatio ( S . A )=
SplitInfo(S . A)
Gambar 2.2 Rumus Gain Ratio
Sumber: Quinlan
Dimana:
S = Ruang/Data Sample yang dipergunakan untuk data training
A = Atribut
Gain(S,A) = information gain pada atribut A
SplitInfo(S,A) = split information pada atribut A
Dengan atribut yang nilai Gain Ration yang paling tertinggi dipilih sebagai
atribut test untuk simpul. Pendekatan ini menerapkan normalisasi pada
information gain dengan menggunakan apa yang disebut dengan split information,
dengan rumus :
i
SI S
SplitInfo ( S . A )=−∑log 2 i
i=1 S S
Gambar 2.3 Rumus Split Information
Sumber: Quinlan
Dimana:
S = Ruang (data) sample yang digunakan untuk training.
A = Atribut.
Si = Jumlah sample untuk atribut i
Pada saat membangun pohon keputusan, mungkin adanya data yang noise
maupun kosong pada training data. Pemangkasan pohon dapat dilakukan untuk
mengenali dan menghilangkan cabang tersebut agar pohon lebih kecil dan lebih
mudah dipahami agar lebih baik dalam melakukan klasifikasi. Ada dua metode
dalam melakukan pemakasan pohon keputusan yaitu:

1. Dengan Prepruning yaitu menghentikan pembangunan lebih awal pada
subtree agar tidak sampai lebih jauh dalam pemangkas data training.
Rumus Prepruning :
2
Z
r+ + Z √❑
2n
e=
❑
Gambar 2.4 Rumus Prepruning
Sumber: Quinlan
Dimana :
r = nilai perbandingan error rate
n = total sample
z = Φ-1(c)
c= confidence level
2. Dengan Postpruning yaitu menyederhanakan pohon dengan membuang
beberapa cabang subtree setelah selesai dibangun. Metode ini sebagai
bagian standard untuk Algoritma C4.5.

19
BAB III
METODOLOGI PENELITIAN
3.1 Instrumen Penelitian
Pada Penelitian ini, dibutuhkan beberapa instrumen agar penelitian dapat
berjalan sesuai kaidah ilmiah. Instrumen tersebut diantaranya, kebutuhan
perangkat lunak, kebutuhan perangkat keras serta desain kuesioner beserta skala
pengukuran.
3.1.1 Kebutuhan Perangkat Lunak
Perangkat lunak yang digunakan dalam penelitian ini adalah sebagai
berikut :
1. Sistem Operasi Windows 10
2. Microsoft Word sebagai alat dalam penulisan laporan dan desain
kuesioner
3. Microsft Excel sebagai aplikasi pengolah angka
4. Rapid Miner sebagai aplikasi pengujian data
3.1.2 Kebutuhan Perangkat Keras
Spesifikasi perangkat keras yang digunakan dalam penelitian ini adalah
sebagai berikut :
1. Prosesor Intel Core i3 - 6006U 2.06 GHz
2. Ram 2 Gb
3. Harddisk Drive 500 GB
4. 32-bit Architecture Operating System

3.1.3 Desain Kueisioner dan Skala Pengukuran
Data tentang variabel penelitian ini berguna sebagai instrumen penelitian,
data diperoleh dengan menyebarkan kuesioner. Kuesioner adalah alat ukur yang
terdiri dari sejumlah pertanyaan yang harus diisi oleh responden.
Variable Kuisioner pada Penelitian ini terdiri dari :
1. Loyalitas Karyawan
Bagaimana tingkat loyalitas karyawan diukur dari minat dan
keseriusan menjadi karyawan tetap di PT Siantar Media Pers.
2. Tingkat Disiplin Karyawan
Bagaimana tingkat disiplin karyawan dalam kehadirannya di Kantor
PT Siantar Media Pers.
3. Inisiatif dalam Bekerja
Bagaimana peran Staf Karyawan dalam menyelesaikan pekerjaan baik
yang merupakan tanggung jawab karyawan maupun diluar kewajiban
sebagai peran tim membantu pekerjaan.
4. Tanggung Jawab dalam Bekerja
Bagaimana tanggung jawab Staf Karyawan terhadap pekerjaan yang
diberikan hingga pekerjaan tersebut tuntas tepat waktu dan tepat guna.
Data variabel tersebut dikonversi ke bentuk angka yang diambil dari skala
yang terdapat pada kuesioner. Secara umum, ada 2 (dua) skala pengukuran yang
lazim digunakan yaitu;

1. Skala Nominal
Skala yang sederhana dalam penggunaannya dan tanpa pembobotan
sehingga tidak memungkinkan untuk dimasukkan dalam pengolahan
data. Skala ini berfungsi sebagai skala pendukung pada Penelitian.
Skala Nominal yang dipakai pada penelitian ini diantaranya, adalah :
1. Umur
2. Jenis Kelamin
3. Status Pernikahan
4. Dan Sebagainya
2. Skala Interval
Skala yang digunakan menggunakan Metode Skala Likert. Metode ini
mengukur ke dalam bentuk angka setiap penilaian responden melalui
pemberian bobot pada setiap jawaban pertanyaan, dengan pembobotan
sebagai berikut :
1. Sangat Tidak Baik, dengan Bobot 1
2. Tidak Baik, dengan Bobot 2
3. Netral, dengan Bobot 3
4. Baik, dengan Bobot 4
5. Sangat Baik, dengan Bobot 5

3.2 Objek Penelitian
Data Objek Penelitian pada Penelitian ini adalah 40 data kuesioner
karyawan pada PT. Siantar Media Pers yang dilakukan pada bulan Mei - Juli
2022.
3.3 Metode Pengumpulan Data
Pengumpulan data dengan menyebarkan kuesioner yang diberikan kepada
40 (empat puluh) Orang sampel data. Pada Kuesioner yang disebarkan terdapat
form isian yang akan dijawab oleh Calon Karyawan tetap dan diisi HRD yang
menjadi responden penelitian. Kuesioner disebarkan oleh Peneliti dan diterima
secara langsung oleh responden dan kuesioner dikumpulkan kembali apabila
sudah selesai diisi. Diperlukan data yang terpercaya dari responden, data yang
terpercaya dapat meningkatkan akurasi penelitian.
Kuesioner terdiri dari 21 Pertanyaan dan 4 Kategori dan jawaban –
jawaban yang sudah disediakan oleh peneliti untuk di pilih oleh responden.
Untuk Atribut kuesioner terdiri dari loyalitas karyawan, tingkat disiplin
karyawan, inisiatif dalam bekerja, dan tanggung jawab dalam bekerja pada PT.
Siantar Media Pers.
3.4 Teknik Analisis Data
Teknik analisa data merupakan suatu langkah yang paling menentukan
dari suatu penelitian, karena analisa data berfungsi untuk menyimpulkan hasil
penelitian (Ekhomawaty, 2017). Teknik analisis data dibagi menjadi dua, yaitu
teknik analisis data kuantitatif dan teknik analisis data kualitatif. Teknik analisis
data dibagi menjadi dua, yaitu teknik analisis data kuantitatif dan teknik analisis
data kualitatif (Ifadah, 2014).
Data yang digunakan dalam penelitian ini adalah data berdasarkan pada
survey yang dilakukan dilapangan dengan membuat kuesioner yang diberikan
melalui HRD terhadap calon karyawan tetap PT. Siantar Media Pers. Metode
yang digunakan untuk penelitian ini yaitu dengan menggunakan metode
Algoritma C4.5. Dengan prosedur perhitungan sebagai berikut :
3.5 Contoh Kasus Penelitian
Keterangan dari perosedur penelitian diatas adalah:
1. Penulis membuat kuisioner dengan jumlah yang dibutuhkan pada
penelitian ini, yaitu sebanyak 40 kuisioner dan selanjutnya data kuisioner
tersebut digunakan sebagai data awal.
2. Menghitung Hasil dari Kuisioner yang dibagikan di lapangan melalui HRD
untuk calon karyawan tetap PT Siantar Media Pers.
3. Data Selection, memilih himpunan data yang akan digunakan pada
penelitian ini yaitu data kuisioner calon karyawan tetap PT Siantar Media
Pers.
4. Cleaning, yaitu membersihkan data kuisioner calon karyawan tetap PT
Siantar Media Pers dengan menghapus data yang tidak digunakan atau yang
tidak memiliki nilai attribute lengkap (missing value).
5. Hasil jumlah dari perhitungan data kuisioner di masukan atau di olah
menggunakan rumus Algoritma C4.5.

Masing-masing atribut memiliki tingkatan tertentu seperti ditunjukkan
pada Tabel 3.1 berikut ini.
Tabel 3.1 Atribut dan Tingkatannya
Nama Atribut Tingkatan Atribut

Loyalitas Karyawan
Kurang Loyal
Cukup Loyal
Sangat Loyal
Tingkat Disiplin Karyawan
Kurang Disiplin
Cukup Disiplin
Sangat Disiplin
Inisiatif dalam Bekerja
Kurang Inisiatif
Cukup Inisiatif
Sangat Inisiatif
Tanggung Jawab dalam Bekerja
Kurang Bertanggung Jawab
Cukup Bertanggung Jawab
Sangat Bertanggung Jawab
Berikut ini adalah uraian langkah-langkah dalam Algoritma C4.5 untuk
menyelesaikan kasus penentuan prediksi pengangkatan karyawan tetap pada
PT. Siantar Media Pers . Sebagian data yang ada pada Tabel 3.2 dibawah ini,
akan digunakan untuk membentuk pohon keputusan. Atribut-atribut yang
digunakan adalah loyalitas karyawan, tingkat disiplin karyawan, inisiatif
dalam bekerja, dan tanggung jawab dalam bekerja sedangkan pada kolom
Hasil Keputusan yaitu berisi “Ya” dan “Tidak”. Kemudian langkah tersebut
data dianalisis.
6. Hasil dari pengolahan atau perhitungan menggunakan Algoritma C4.5
untuk menghitung Entrophy dan Gain dari seluruh atribut yang ada. Nilai
Gain yang terbesar menjadi node akar (root node).
7. Peneliti menggunakan Rapidminer untuk menghitung data kuisioner
menggunakan Algoritma C4.5.
8. Untuk mengetahui tingkat akurasi terhadap hasil perhitungan/ pengolahan
menggnakan RapidMiner. Pengujian pada data dilakukan sebanyak 3 kali
dengan pembagian data training dan data testing yang berbeda.
9. Hasil dari penelitian ini menghasilkan prediksi keputusan pengangkatan
karyawan tetap pada PT. Siantar Media Pers.
10. Evaluasi dan Validasi Dalam tahap ini dilakukan validasi dan evaluasi
untuk mengukur tingkat akurasi data prediksi keputusan pengangkatan karyawan
tetap menggunakan beberapa teknik yang terdapat dalam framework RapidMiner.
DAFTAR PUSTAKA
Arifin. (2015). Metode Data Mining Untuk Klasifikasi Data Sel Nukleus Dan Sel Radang
Berdasarkan Analisa Tekstur. Jurnal Informatika. Vol.II. No.2

Defiyanti, Sofi. (2017). Integrasi Metode Clustering dan Klasifikasi untuk Data Numerik. Jurnal
CITEE, 257.
Harryanto, F.F, & Hansun, Seng. (2017). Penerapan Algoritma C4.5 untuk Memprediksi
Penerimaan Calon Pegawai Baru di PT WISE. Jurnal Jatisi, Vol 3, 95-103.
Hasibuan, Malayu S.P. 2006, Manajemen Sumber Daya Manusia, edisi Revisi. Jakarta. Bumi
Aksara.
Iriadi, Nandang & Nuraeni. (2016). Kajian Penerapan Metode Klasifikasi Data Mining
Algoritma C4.5 Untuk Prediksi Kelayakan Kredit Pada Bank Mayapada Jakarta: Jurnal Teknik
Komputer Amik BSI. Vol.II. No.1.
Lumbantoruan & Kennedy. (2015). Analisis Data Mining Dan Warehousing: Jurnal Ilmiah
Buletin Ekonomi. Vol.19. No.1.

Bernando Hutajulu Bab I - Iii & Daftar Pustaka

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Bernando Hutajulu Bab I - Iii & Daftar Pustaka

Diunggah oleh

Hak Cipta:

Format Tersedia

2

1.1. Latar Belakang

tentunya akan mempengaruhi dalam dunia pekerjaan. Karyawan adalah Sumber

perusahaan dalam menentukan keberlangsungan aktivitas usaha. Status kontrak

demi tercapainya tujuan perusahaan. Dalam hal untuk menentukan apakah

kontraknya sering terjadi kesulitan dalam menentukan hal tersebut, di samping

banyaknya kriteria penilaian yang diperlukan untuk memutuskan, faktor lain

& Indrajit, 2017).

Pada perusahaan kegiatan penilaian kinerja karyawan sulit dilaksanakan

karyawan untuk dampak selanjutnya. Karena itulah dalam penilaian kinerja

sehingga perusahaan kesulitan melakukan proses seleksi karyawan atau

proses perpanjangan kontrak kerja. Diperpanjang atau tidaknya kontrak kerja

pencapaian tujuan-tujuan perusahaan.

Data mining mempunyai fungsi yang penting untuk membantu mendapatkan

informasi yang berguna bagi perusahaan. Banyaknya parameter dalam

menentukan diperpanjang atau tidaknya kontrak kerja karyawan menyebabkan

ketepatan dan kecepatan dalam penilaian kerja kurang terpenuhi. Metode

clustering data mining merupakan proses pengelompokan atau penggolongan

kelas dan meminimumkan kesamaan antar kelas / cluster. Adapun metode

C. 45. Penyeleksian ini dilakukan sesuai kriteria-kriteria clustering utama dengan

dengan kriteria-kriteria pada penilaian kinerja karyawan yang mempunyai nilai

prioritas tertentu. Algoritma C.45 digunakan untuk menemukan pola distribusi di

Berdasarkan uraian di atas maka penulis tertarik untuk menganalisis proses

algoritma C.45 guna membantu mengatasi beberapa permasalahan yang terjadi

Maka dalam penyusunan SKRIPSI penulis mengambil judul “PREDIKSI

PENGANGKATAN KARYAWAN TIDAK TETAP MENJADI

KARYAWAN TETAP MENGGUNAKAN C.45 PADA PT SIANTAR

1.2. Rumusan Masalah

Berdasarkan latar belakang diatas maka rumusan masalah yang didapat

adalah bagaimana mengaplikasikan data mining dengan metode algoritma C.45

sehingga dapat membantu proses seleksi pengangkatan karyawan tetap sesuai

1.3. Batasan Masalah

Karena keterbatasan waktu dan mengingat banyaknya permasalahan yang

dihadapi oleh perusahaan maka penulis melakukan pembatasan masalah.

batasan masalah ini adalah:

1. Penulis hanya membahas penggunaan data mining untuk menentukan

karyawan yang layak untuk diangkat menjadi karyawan tetap di PT.

Siantar Media Pers. dengan menggunakan metode algoritma C.45 agar

tidak terjadi lagi subjektifitas dalam proses penilaian untuk

pengangkatan karyawan tetap.

2. Pengolahan data menggunakan tools RAPID MINER sebagai perangkat

diangkat menjadi karyawan tetap di PT. Siantar Media Pers.

1.4. Tujuan Penelitian

1.4.1 Bagi Penulis

Untuk memenuhi salah satu syarat memperoleh gelar Sarjana Teknik

Informatika dan untuk menambah ilmu pengetahuan, pengalaman, dan

pengamatan tentang penerapan data mining kedalam suatu data penelitian.

1.4.2 Bagi Objek Penelitian (PT. Siantar Media Pers)

sehingga dapat membantu perusahaan dalam proses seleksi pengangkatan

1.5. Manfaat Penelitian

1.5.1 Bagi Penulis

Menambah wawasan atau pengetahuan tentang penerapan data mining

menggunakan metode algoritma C.45 sebagai bentuk implementasi nyata

Karyawan Tetap bisa lebih tepat dan efisien.

1.6 Sistematika Penulisan

Sistematika penulisan dalam tugas akhir ini, disusun sebagai berikut :

manfaat dan sistematika penulisan.

BAB II LANDASAN TEORI

mendukung pembahasan masalah, Uraian tersebut menjelaskan tentang

Algoritma C4.5 dalam teknik pengolahan data mining.

BAB III METODOLOGI PENELITIAN

gambaran umum tentang algoritma C4.5 beserta langkah-langkahnya serta

penerapannya dengan aplikasi pengolah data mining.