Anda di halaman 1dari 25

2

BAB I

PENDAHULUAN

1.1. Latar Belakang

Kemajuan teknologi adalah sesuatu yang tidak bisa dihindari dalam kehidupan

ini, karena kemajuan teknologi akan berjalan sesuai dengan kemajuan ilmu

pengetahuan. Dengan adanya teknologi yang berkembang pesat pada saat ini

tentunya akan mempengaruhi dalam dunia pekerjaan. Karyawan adalah Sumber

Daya Manusia (SDM) yang merupakan aset perusahaan yang sangat berharga dan

harus dikelola dengan baik agar dapat memberikan kontribusi yang optimal dalam

kemajuan perusahaan atau instansi. Keberadaan karyawan adalah salah satu alasan

perusahaan dalam menentukan keberlangsungan aktivitas usaha. Status kontrak

kerja karyawan di perusahaan merupakan hal yang penting dan perlu diperhatikan

demi tercapainya tujuan perusahaan. Dalam hal untuk menentukan apakah

seorang karyawan itu layak untuk diperpanjang kontrak kerjanya atau diputus

kontraknya sering terjadi kesulitan dalam menentukan hal tersebut, di samping

banyaknya kriteria penilaian yang diperlukan untuk memutuskan, faktor lain

seperti sikap kerja dan attitude karyawan tersebut juga perlu diperhatikan (Priyono

& Indrajit, 2017).

Pada perusahaan kegiatan penilaian kinerja karyawan sulit dilaksanakan

karena frekuensi tatap muka antara Human Resources Department (HRD) dan

karyawan sangat minim (Windy, Rika, & Kautsar, 2014). Keputusan seorang

HRD adalah hal yang sangat vital pada perusahaan khususnya dalam mengelola

karyawan untuk dampak selanjutnya. Karena itulah dalam penilaian kinerja

karyawan harus dilakukan secara obyektif dan efisien agar proses seleksi dapat
berjalan sesuai dengan yang diharapkan perusahaan. PT. Siantar Media Pers yang

bergerak di bidang berita memiliki karyawan kontrak lebih dari 120 karyawan

sehingga perusahaan kesulitan melakukan proses seleksi karyawan atau

penyaringan karyawan yang masih layak dan memenuhi syarat untuk dilakukan

proses perpanjangan kontrak kerja. Diperpanjang atau tidaknya kontrak kerja

karyawan, sangat ditentukan oleh fungsi seleksi ini. Jika fungsi ini tidak

dilaksanakan dengan baik maka dengan sendirinya akan berakibat fatal terhadap

pencapaian tujuan-tujuan perusahaan.

Data mining mempunyai fungsi yang penting untuk membantu mendapatkan

informasi yang berguna bagi perusahaan. Banyaknya parameter dalam

menentukan diperpanjang atau tidaknya kontrak kerja karyawan menyebabkan

ketepatan dan kecepatan dalam penilaian kerja kurang terpenuhi. Metode

clustering data mining merupakan proses pengelompokan atau penggolongan

objek berdasarkan informasi yang diperoleh dari data yang menjelaskan hubungan

antar objek dengan prinsip untuk memaksimalkan kesamaan antar anggota satu

kelas dan meminimumkan kesamaan antar kelas / cluster. Adapun metode

clustering data mining memiliki beberapa algoritma salah satunya yaitu algoritma

C. 45. Penyeleksian ini dilakukan sesuai kriteria-kriteria clustering utama dengan

menggunakan algoritma C.45 yang dapat mengelola nilai inputan yang sesuai

dengan kriteria-kriteria pada penilaian kinerja karyawan yang mempunyai nilai

prioritas tertentu. Algoritma C.45 digunakan untuk menemukan pola distribusi di

dalam sebuah data set yang berguna untuk proses analisis data.

Berdasarkan uraian di atas maka penulis tertarik untuk menganalisis proses

seleksi Pengangkatan Karyawan Tetap pada PT. Siantar Media Pers. Penelitian ini
membentuk model pengelompokan pohon keputusan menggunakan metode

algoritma C.45 guna membantu mengatasi beberapa permasalahan yang terjadi

pada proses seleksi Pengangkatan Karyawan Tetap di PT. Siantar Media Pers.

Maka dalam penyusunan SKRIPSI penulis mengambil judul “PREDIKSI

PENGANGKATAN KARYAWAN TIDAK TETAP MENJADI

KARYAWAN TETAP MENGGUNAKAN C.45 PADA PT SIANTAR

MEDIA PERS”

1.2. Rumusan Masalah

Berdasarkan latar belakang diatas maka rumusan masalah yang didapat

adalah bagaimana mengaplikasikan data mining dengan metode algoritma C.45

untuk menilai kinerja karyawan terbaik dengan pengelompokan data yang tepat,

sehingga dapat membantu proses seleksi pengangkatan karyawan tetap sesuai

kebutuhan perusahaan.

1.3. Batasan Masalah

Karena keterbatasan waktu dan mengingat banyaknya permasalahan yang

dihadapi oleh perusahaan maka penulis melakukan pembatasan masalah.

Adapun

batasan masalah ini adalah:

1. Penulis hanya membahas penggunaan data mining untuk menentukan

karyawan yang layak untuk diangkat menjadi karyawan tetap di PT.

Siantar Media Pers. dengan menggunakan metode algoritma C.45 agar

tidak terjadi lagi subjektifitas dalam proses penilaian untuk

pengangkatan karyawan tetap.

2. Pengolahan data menggunakan tools RAPID MINER sebagai perangkat


lunak bantuan untuk menentukan karyawan tidak tetap yang layak

diangkat menjadi karyawan tetap di PT. Siantar Media Pers.

1.4. Tujuan Penelitian

1.4.1 Bagi Penulis

Untuk memenuhi salah satu syarat memperoleh gelar Sarjana Teknik

Informatika dan untuk menambah ilmu pengetahuan, pengalaman, dan

pengamatan tentang penerapan data mining kedalam suatu data penelitian.

1.4.2 Bagi Objek Penelitian (PT. Siantar Media Pers)

Mempermudah menganalisis data untuk hasil yang lebih tepat dan efisien

sehingga dapat membantu perusahaan dalam proses seleksi pengangkatan

karyawan tetap.

1.5. Manfaat Penelitian

1.5.1 Bagi Penulis

Menambah wawasan atau pengetahuan tentang penerapan data mining

menggunakan metode algoritma C.45 sebagai bentuk implementasi nyata

menganalisis data.
1.5.2 Bagi Objek Penelitian (PT. Siantar Media Pers)

Adapun manfaat dari penelitian ini adalah membantu mempermudah HRD dalam

melakukan analisis data dengan tepat sehingga dalam proses seleksi Pengangkatan

Karyawan Tetap bisa lebih tepat dan efisien.

1.6 Sistematika Penulisan

Sistematika penulisan dalam tugas akhir ini, disusun sebagai berikut :

BAB I PENDAHULUAN

Bab ini berisi latar belakang, perumusan masalah, batasan masalah, tujuan,

manfaat dan sistematika penulisan.

BAB II LANDASAN TEORI

Bab ini berisi tentang uraian mengenai teori-teori dasar yang akan

mendukung pembahasan masalah, Uraian tersebut menjelaskan tentang

Algoritma C4.5 dalam teknik pengolahan data mining.

BAB III METODOLOGI PENELITIAN

Bab ini berisi tentang gambaran umum teknik data mining, berisi tentang

gambaran umum tentang algoritma C4.5 beserta langkah-langkahnya serta

penerapannya dengan aplikasi pengolah data mining.

BAB IV ANALISIS DAN PEMBAHASAN


Pada bab ini merupakan penjelasan mengenai uji coba dan analisa dari

penghitungan yang dilakukan dengan teknik data mining.

BAB V KESIMPULAN DAN SARAN

Pada bab ini berisikan beberapa kesimpulan dan saran dari hasil pengolahan

data karyawan PT. Siantar Media Pers.


8

BAB II

LANDASAN TEORI

Pada Bab ini, akan dibahas mengenai teori tentang konsumen dan pelayanan

yang diharapkan konsumen. Machine learning dan cara kerja machine learning

serta teori data mining lebih khususnya menggunakan metode C4.5.

2.1 Machine Learning

Machine learning adalah cabang dari kecerdasan buatan, merupakan disiplin

ilmu yang mencakup perancangan dan pengembangan algoritma yang

memungkinkan komputer untuk mengembangkan perilaku yang didasarkan

kepada data empiris, seperti dari sensor data pada basis data. Sistem pembelajaran

dapat memanfaatkan contoh (data) untuk menangkap ciri yang diperlukan dari

probabilitas yang mendasarinya (yang tidak iketahui). Data dapat dilihat sebagai

contoh yang menggambarkan hubungan antara variabel yang diamati. Fokus besar

penelitian Machine learning adalah bagaimana mengenali secara otomatis pola

kompleks dan membuat keputusan cerdas berdasarkan data. Kesukarannya terjadi

karena himpunan semua perilaku yang mungkin, dari semua masukan yang

dimungkinkan, terlalu besar untuk diliput oleh himpunan contoh pengamatan

(data pelatihan). Karena itu Machine learning harus merampatkan (generalisasi)

perilaku dari contoh yang ada untuk menghasilkan keluaran yang berguna dalam

kasus-kasus baru (Purnamasari, 2015).

Sejak pertama kali komputer diciptakan manusia sudah memikirkan

bagaimana caranya agar komputer dapat belajar dari pengalaman. Hal tersebut
terbukti pada tahun 1952, Arthur Samuel menciptakan sebuah program, game of

checkers, pada sebuah komputer IBM. Program tersebut dapat mempelajari

gerakan untuk memenangkan permainan checkers dan menyimpan gerakan

tersebut kedalam memorinya. Istilah machine learning pada dasarnya adalah

proses komputer untuk belajar dari data (learn from data). Tanpa adanya data,

komputer tidak akan bisa belajar apa-apa. Oleh karena itu jika kita ingin belajar

machine learning, pasti akan terus berinteraksi dengan data. Semua pengetahuan

machine learning pasti akan melibatkan data. Data bisa saja sama, akan tetapi

algoritma dan pendekatan nya berbeda-beda untuk mendapatkan hasil yang

optimal. (Purnamasari, 2015).

2.2 Bagian Machine Learning

Ada beberapa bagian pada machine learning, sistem pembelajaran mesin

terdiri dari tiga bagian utama, yaitu (Tom Mitcel,1997):

1. Model: sistem yang membentuk prediksi atau identifikasi.

2. Parameter: sinyal atau faktor yang digunakan oleh model untuk

membentuk keputusannya.

3. Pembelajaran: sistem yang menyesuaikan parameter dan model dalam

prediksi versus hasil aktual.

Machine learning merupakan salah satu cabang dari disiplin ilmu

Kecerdasan Buatan (Artificial Intellegence) yang membahas mengenai

pembangunan sistem yang berdasarkan pada data. Banyak hal yang dipelajari,

akan tetapi pada dasarnya ada 4 hal pokok yang dipelajari dalam machine

learning (Tom Mitcel, 1997):


1. Supervised machine learning algorithms

Supervised machine learning adalah algoritma machine learning yang

dapat menerapkan informasi yang telah ada pada data dengan

memberikan label tertentu, misalnya data yang telah diklasifikasikan

sebelumnya (terarah). Algoritma ini mampu memberikan target terhadap

output yang dilakukan dengan membandingkan pengalaman belajar di

masa lalu.

2. Unsupervised machine learning algorithms

Unsupervised machine learning adalah algoritma machine learning yang

digunakan pada data yang tidak mempunyai informasi yang dapat

diterapkan secara langsung (tidak terarah). Algoritma ini diharapkan

mampu menemukan struktur tersembunyi pada data yang tidak berlabel.

3. Semi-supervised machine learning algorithms

Semi-supervised machine learning adalah algoritma yang digunakan

untuk melakukan pemebelajaran data berlabel dan tanpa label. Sistem

yang menggunakan metode ini dapat meningkatkan efesiensi output

yang dihasilkan.

4. Reinforcement machine learning algorithms

Reinforcement machine learning adalah algoritma yang mempunyai

kemampuan untuk bertinteraksi dengan proses belajar yang dilakukan,

algoritma ini akan memberikan poin (reward) saat model yang diberikan

semakin baik atau mengurangi poin (error) saat model yang dihasilkan

semakin buruk. Salah satu penerapannya adalah pada mesin pencari.


2.3 Data Mining

Berikut ini beberapa definisi dari data mining:

1. Data mining adalah serangkaian proses untuk menggali nilai tambah

dari suatu kumpulan data berupa pengetahuan yang selama ini tidak

diketahui secara manual (Pramudiono, 2016).

2. Data mining adalah analisis otomatis dari data yang berjumlah besar

atau kompleks dengan tujuan untuk menemukan pola atau

kecenderungan yang penting yang biasanya tidak disadari

keberadaannya (Pramudiono, 2016).

3. Data mining merupakan analisis dari peninjauan kumpulan data untuk

menemukan hubungan ynag tidak diduga dan meringkas data dengan

cara yang berbeda dengan sebelumnya, yang dapat dipahami dan

bermanfaat bagi pemilik data (Larose, 2015).

4. Data mining merupakan bidang dari beberapa bidang keilmuan yang

menyatukan teknik dari pembelajaran mesin, pengenalan pola, statistik,

basis data, dan visualisasi untuk penanganan permasalahan pengambilan

informasi dari basis data yang besar (Larose, 2015).

Pengumpulan data mining bukan sekedar terkumpul data saja tetapi

mencakup analisis dan prediksi dari informasi yang ingin ditampilkan. Data yang

dikumpulkan disimpan dalam database kemudian diproses sehingga dapat

dijadikan untuk pengambilan keputusan dalam melihat informasi yang akan

digunakan. Data mining dan Knowledge Discovery in Databases (KDD) sering


kali digunakan secara bergantian dalam menjelaskan proses penggalian informasi

dalam basis data yang sangat besar akan tetapi berkaitan satu sama yang lain,

skema proses KDD (Han & Kamber, 2016).

2.4 Tahapan Data Mining

Tahap- tahap data mining adalah sebagai berikut (Fayyad, 1996):

Gambar 2.1 Tahap Data Mining (Fayyad, 1996)

1. Data Selection

a. Menciptakan himpunan data target , pemilihan himpunan data, atau

memfokuskan pada subset variabel atau sampel data, dimana

penemuan (discovery) akan dilakukan.

b. Pemilihan (seleksi) data dari sekumpulan data operasional perlu

dilakukan sebelum tahap penggalian informasi dalam KDD dimulai.

Data hasil seleksi yang akan digunakan untuk proses data mining,

disimpan dalam suatu berkas, terpisah dari basis data operasional.

2. Pre-processing/ Cleaning
a. Pemprosesan pendahuluan dan pembersihan data merupakan operasi

dasar seperti penghapusan noise dilakukan.

b. Sebelum proses data mining dapat dilaksanakan, perlu dilakukan

proses cleaning pada data yang menjadi fokus KDD.

c. Proses cleaning mencakup antara lain membuang duplikasi data,

memeriksa data yang inkonsisten, dan memperbaiki kesalahan pada

data, seperti kesalahan cetak (tipografi).

d. Dilakukan proses enrichment, yaitu proses “memperkaya” data yang

sudah ada dengan data atau informasi lain yang relevan dan

diperlukan untuk KDD, seperti data atau informasi eksternal.

3. Pre-processing/ Cleaning

a. Pencarian fitur-fitur yang berguna untuk mempresentasikan data

bergantung kepada goal yang ingin dicapai.

b. Merupakan proses transformasi pada data yang telah dipilih,

sehingga data tersebut sesuai untuk proses data mining. Proses ini

merupakan proses kreatif dan sangat tergantung pada jenis atau pola

informasi yang akan dicari dalam basis data.

4. Data mining

a. Pemilihan tugas data mining; pemilihan goal dari proses KDD

misalnya klasifikasi, regresi, clustering, dan lain-lain.

b. Pemilihan algoritma data mining untuk pencarian (searching).

c. Proses Data mining yaitu proses mencari pola atau informasi

menarik dalam data terpilih dengan menggunakan teknik atau


metode tertentu. Teknik, metode, atau algoritma dalam data mining

sangat bervariasi. Pemilihan metode atau algoritma yang tepat sangat

bergantung pada tujuan dan proses KDD secara keseluruhan

5. Interpretation/ Evaluation

a. Penerjemahan pola-pola yang dihasilkan dari data mining.

b. Pola informasi yang dihasilkan dari proses data mining perlu

ditampilkan dalam bentuk yang mudah mimengerti oleh pihak yang

berkepentingan.

c. Tahap ini merupakan bagian dari proses KDD yang mencakup

pemeriksaan apakah pola atau informasi yang ditemukan

bertentangan dengan fakta atau hipotesa yang ada sebelumnya.

2.5 Klasifikasi

Klasifikasi adalah suatu bentuk analisis data yang mengekstrak model yang

menggambarkan kelas data penting. Model seperti itu, yang disebut penggolong,

memprediksi label kelas kategoris (diskrit, tidak berurutan). Misalnya, kita bisa

membangun klasifikasi untuk mengkategorikan aplikasi pinjaman bank aman atau

berisiko analisis semacam itu dapat membantu kami memahami data dengan lebih

baik besar. Banyak metode klasifikasi yang telah diajukan oleh peneliti dalam

pembelajaran mesin, pengenalan pola, dan statistik. Kebanyakan algoritma adalah

memori penduduk, biasanya dengan asumsi ukuran data yang kecil. Penelitian

data mining terbaru telah dibangun di atas pekerjaan semacam itu, berkembang

klasifikasi terukur dan teknik prediksi yang mampu menangani sejumlah besar
data disk- resident. Klasifikasi memiliki banyak aplikasi, termasuk deteksi

kecurangan, target pemasaran, prediksi kinerja, manufaktur, dan diagnosis medis

(Adhika, 2017).

Klasifikasi adalah proses pengelompokan benda berdasarkan ciri-ciri

persamaan dan perbedaan. Dalam klasifikasi, terdapat terget variabel kategori.

sebagai contoh, penggolongan pendapatan dapat dipisahkan dalam tiga kategori

yaitu: pendapatan tinggi, pendapatan sedang, dan pendapatan rendah (Adhika,

2017). Contoh lain klasifikasi dalam bisnis dan penelitian adalah:

1. Menentukan apakah suatu transaksi kartu kredit merupakan transaksi yang

curang atau bukan.

2. Memperkirakan apakah suatu pengajuan hipotek oleh nasabah merupakan

suatu kredit yang baik atau buruk.

3. Mendiagnosis penyakit seorang pasien untuk mendapatkan termasuk

kategori penyakit apa.

2.6 Algoritma C.45

Algoritma C4.5 merupakan algortima yang digunakan untuk membentuk

pohon keputusan. Pohon keputusan merupakan metodeklasifikasi dan prediksi

yang sangat kuat dan terkenal. Metode pohon keputusa mengubah fakta yang

sangat besar menjadi pohon keputusanyang merepresentasikan aturan. Aturan

dapat dengan mudah dipahami dengan bahasa alami. Dan mereka juga dapat

diekspresikan dalam bentukbahasa basis data seperti Structured Query Language

untuk mencari record pada kategori tertentu (Kusrini, 2009).


Algoritma C4.5 merupakan kelompok algoritma Decision Tree. Algoritma

ini mempunyai input berupa training samples dan samples. Training samples

berupa data contoh yang akan digunakan untuk membangun sebuah tree yang

telah diuji kebenarannya. Sedangkan samplesmerupakan field-field data yang

nantinya akan digunakan sebagai parameter dalam melakukan klasifikasi data

(Sunjana, 2010).

Pohon keputusan banyak sekali perkembangan tetapi yang sering dipakai

adalah ID3 dan C4.5. Keduanya mempunyai prinsip yang sama dikarenakan

Algoritma C4.5 merupakan pengembangan dari ID3, tetapi mempunyai perbedaan

utama yaitu :

1. C4.5 dapat menangani atribut yang kontinyu dan diskrit dan juga dapat

menangani data training dengan nilai yang hilang atau data yang kosong.

2. Hasil yang didapat dari Algoritma C4.5 akan terpangkas setelah dibentuk

3. Pemilihan atribut yang dilakukan dengan menggunakan Gain Ratio.

Algoritma C4.5 merupakan perbaikan dari ID3 menggunakan Gain Ratio

untuk diperbaharui information gain maka dengan rumus :

Gain (S . A)
GainRatio ( S . A )=
SplitInfo(S . A)
Gambar 2.2 Rumus Gain Ratio

Sumber: Quinlan

Dimana:

S = Ruang/Data Sample yang dipergunakan untuk data training

A = Atribut
Gain(S,A) = information gain pada atribut A

SplitInfo(S,A) = split information pada atribut A

Dengan atribut yang nilai Gain Ration yang paling tertinggi dipilih sebagai

atribut test untuk simpul. Pendekatan ini menerapkan normalisasi pada

information gain dengan menggunakan apa yang disebut dengan split information,

dengan rumus :
i
SI S
SplitInfo ( S . A )=−∑log 2 i
i=1 S S
Gambar 2.3 Rumus Split Information

Sumber: Quinlan

Dimana:

S = Ruang (data) sample yang digunakan untuk training.

A = Atribut.

Si = Jumlah sample untuk atribut i

Pada saat membangun pohon keputusan, mungkin adanya data yang noise

maupun kosong pada training data. Pemangkasan pohon dapat dilakukan untuk

mengenali dan menghilangkan cabang tersebut agar pohon lebih kecil dan lebih

mudah dipahami agar lebih baik dalam melakukan klasifikasi. Ada dua metode

dalam melakukan pemakasan pohon keputusan yaitu:


1. Dengan Prepruning yaitu menghentikan pembangunan lebih awal pada

subtree agar tidak sampai lebih jauh dalam pemangkas data training.

Rumus Prepruning :
2
Z
r+ + Z √❑
2n
e=

Gambar 2.4 Rumus Prepruning

Sumber: Quinlan

Dimana :

r = nilai perbandingan error rate

n = total sample

z = Φ-1(c)

c= confidence level

2. Dengan Postpruning yaitu menyederhanakan pohon dengan membuang

beberapa cabang subtree setelah selesai dibangun. Metode ini sebagai

bagian standard untuk Algoritma C4.5.


19

BAB III

METODOLOGI PENELITIAN

3.1 Instrumen Penelitian

Pada Penelitian ini, dibutuhkan beberapa instrumen agar penelitian dapat

berjalan sesuai kaidah ilmiah. Instrumen tersebut diantaranya, kebutuhan

perangkat lunak, kebutuhan perangkat keras serta desain kuesioner beserta skala

pengukuran.

3.1.1 Kebutuhan Perangkat Lunak

Perangkat lunak yang digunakan dalam penelitian ini adalah sebagai

berikut :

1. Sistem Operasi Windows 10

2. Microsoft Word sebagai alat dalam penulisan laporan dan desain

kuesioner

3. Microsft Excel sebagai aplikasi pengolah angka

4. Rapid Miner sebagai aplikasi pengujian data

3.1.2 Kebutuhan Perangkat Keras

Spesifikasi perangkat keras yang digunakan dalam penelitian ini adalah

sebagai berikut :

1. Prosesor Intel Core i3 - 6006U 2.06 GHz

2. Ram 2 Gb

3. Harddisk Drive 500 GB

4. 32-bit Architecture Operating System


3.1.3 Desain Kueisioner dan Skala Pengukuran

Data tentang variabel penelitian ini berguna sebagai instrumen penelitian,

data diperoleh dengan menyebarkan kuesioner. Kuesioner adalah alat ukur yang

terdiri dari sejumlah pertanyaan yang harus diisi oleh responden.

Variable Kuisioner pada Penelitian ini terdiri dari :

1. Loyalitas Karyawan

Bagaimana tingkat loyalitas karyawan diukur dari minat dan

keseriusan menjadi karyawan tetap di PT Siantar Media Pers.

2. Tingkat Disiplin Karyawan

Bagaimana tingkat disiplin karyawan dalam kehadirannya di Kantor

PT Siantar Media Pers.

3. Inisiatif dalam Bekerja

Bagaimana peran Staf Karyawan dalam menyelesaikan pekerjaan baik

yang merupakan tanggung jawab karyawan maupun diluar kewajiban

sebagai peran tim membantu pekerjaan.

4. Tanggung Jawab dalam Bekerja

Bagaimana tanggung jawab Staf Karyawan terhadap pekerjaan yang

diberikan hingga pekerjaan tersebut tuntas tepat waktu dan tepat guna.

Data variabel tersebut dikonversi ke bentuk angka yang diambil dari skala

yang terdapat pada kuesioner. Secara umum, ada 2 (dua) skala pengukuran yang

lazim digunakan yaitu;


1. Skala Nominal

Skala yang sederhana dalam penggunaannya dan tanpa pembobotan

sehingga tidak memungkinkan untuk dimasukkan dalam pengolahan

data. Skala ini berfungsi sebagai skala pendukung pada Penelitian.

Skala Nominal yang dipakai pada penelitian ini diantaranya, adalah :

1. Umur

2. Jenis Kelamin

3. Status Pernikahan

4. Dan Sebagainya

2. Skala Interval

Skala yang digunakan menggunakan Metode Skala Likert. Metode ini

mengukur ke dalam bentuk angka setiap penilaian responden melalui

pemberian bobot pada setiap jawaban pertanyaan, dengan pembobotan

sebagai berikut :

1. Sangat Tidak Baik, dengan Bobot 1

2. Tidak Baik, dengan Bobot 2

3. Netral, dengan Bobot 3

4. Baik, dengan Bobot 4

5. Sangat Baik, dengan Bobot 5


3.2 Objek Penelitian

Data Objek Penelitian pada Penelitian ini adalah 40 data kuesioner

karyawan pada PT. Siantar Media Pers yang dilakukan pada bulan Mei - Juli

2022.

3.3 Metode Pengumpulan Data

Pengumpulan data dengan menyebarkan kuesioner yang diberikan kepada

40 (empat puluh) Orang sampel data. Pada Kuesioner yang disebarkan terdapat

form isian yang akan dijawab oleh Calon Karyawan tetap dan diisi HRD yang

menjadi responden penelitian. Kuesioner disebarkan oleh Peneliti dan diterima

secara langsung oleh responden dan kuesioner dikumpulkan kembali apabila

sudah selesai diisi. Diperlukan data yang terpercaya dari responden, data yang

terpercaya dapat meningkatkan akurasi penelitian.

Kuesioner terdiri dari 21 Pertanyaan dan 4 Kategori dan jawaban –

jawaban yang sudah disediakan oleh peneliti untuk di pilih oleh responden.

Untuk Atribut kuesioner terdiri dari loyalitas karyawan, tingkat disiplin

karyawan, inisiatif dalam bekerja, dan tanggung jawab dalam bekerja pada PT.

Siantar Media Pers.

3.4 Teknik Analisis Data

Teknik analisa data merupakan suatu langkah yang paling menentukan

dari suatu penelitian, karena analisa data berfungsi untuk menyimpulkan hasil

penelitian (Ekhomawaty, 2017). Teknik analisis data dibagi menjadi dua, yaitu

teknik analisis data kuantitatif dan teknik analisis data kualitatif. Teknik analisis
data dibagi menjadi dua, yaitu teknik analisis data kuantitatif dan teknik analisis

data kualitatif (Ifadah, 2014).

Data yang digunakan dalam penelitian ini adalah data berdasarkan pada

survey yang dilakukan dilapangan dengan membuat kuesioner yang diberikan

melalui HRD terhadap calon karyawan tetap PT. Siantar Media Pers. Metode

yang digunakan untuk penelitian ini yaitu dengan menggunakan metode

Algoritma C4.5. Dengan prosedur perhitungan sebagai berikut :

3.5 Contoh Kasus Penelitian

Keterangan dari perosedur penelitian diatas adalah:

1. Penulis membuat kuisioner dengan jumlah yang dibutuhkan pada

penelitian ini, yaitu sebanyak 40 kuisioner dan selanjutnya data kuisioner

tersebut digunakan sebagai data awal.

2. Menghitung Hasil dari Kuisioner yang dibagikan di lapangan melalui HRD

untuk calon karyawan tetap PT Siantar Media Pers.

3. Data Selection, memilih himpunan data yang akan digunakan pada

penelitian ini yaitu data kuisioner calon karyawan tetap PT Siantar Media

Pers.

4. Cleaning, yaitu membersihkan data kuisioner calon karyawan tetap PT

Siantar Media Pers dengan menghapus data yang tidak digunakan atau yang

tidak memiliki nilai attribute lengkap (missing value).

5. Hasil jumlah dari perhitungan data kuisioner di masukan atau di olah

menggunakan rumus Algoritma C4.5.


Masing-masing atribut memiliki tingkatan tertentu seperti ditunjukkan

pada Tabel 3.1 berikut ini.

Tabel 3.1 Atribut dan Tingkatannya

Nama Atribut Tingkatan Atribut


Loyalitas Karyawan
Kurang Loyal
Cukup Loyal
Sangat Loyal
Tingkat Disiplin Karyawan
Kurang Disiplin
Cukup Disiplin
Sangat Disiplin
Inisiatif dalam Bekerja
Kurang Inisiatif
Cukup Inisiatif
Sangat Inisiatif
Tanggung Jawab dalam Bekerja
Kurang Bertanggung Jawab
Cukup Bertanggung Jawab
Sangat Bertanggung Jawab

Berikut ini adalah uraian langkah-langkah dalam Algoritma C4.5 untuk

menyelesaikan kasus penentuan prediksi pengangkatan karyawan tetap pada

PT. Siantar Media Pers . Sebagian data yang ada pada Tabel 3.2 dibawah ini,

akan digunakan untuk membentuk pohon keputusan. Atribut-atribut yang

digunakan adalah loyalitas karyawan, tingkat disiplin karyawan, inisiatif

dalam bekerja, dan tanggung jawab dalam bekerja sedangkan pada kolom

Hasil Keputusan yaitu berisi “Ya” dan “Tidak”. Kemudian langkah tersebut

data dianalisis.
6. Hasil dari pengolahan atau perhitungan menggunakan Algoritma C4.5

untuk menghitung Entrophy dan Gain dari seluruh atribut yang ada. Nilai

Gain yang terbesar menjadi node akar (root node).

7. Peneliti menggunakan Rapidminer untuk menghitung data kuisioner

menggunakan Algoritma C4.5.

8. Untuk mengetahui tingkat akurasi terhadap hasil perhitungan/ pengolahan

menggnakan RapidMiner. Pengujian pada data dilakukan sebanyak 3 kali

dengan pembagian data training dan data testing yang berbeda.

9. Hasil dari penelitian ini menghasilkan prediksi keputusan pengangkatan

karyawan tetap pada PT. Siantar Media Pers.

10. Evaluasi dan Validasi Dalam tahap ini dilakukan validasi dan evaluasi

untuk mengukur tingkat akurasi data prediksi keputusan pengangkatan karyawan

tetap menggunakan beberapa teknik yang terdapat dalam framework RapidMiner.

DAFTAR PUSTAKA

Arifin. (2015). Metode Data Mining Untuk Klasifikasi Data Sel Nukleus Dan Sel Radang

Berdasarkan Analisa Tekstur. Jurnal Informatika. Vol.II. No.2


Defiyanti, Sofi. (2017). Integrasi Metode Clustering dan Klasifikasi untuk Data Numerik. Jurnal

CITEE, 257.

Harryanto, F.F, & Hansun, Seng. (2017). Penerapan Algoritma C4.5 untuk Memprediksi

Penerimaan Calon Pegawai Baru di PT WISE. Jurnal Jatisi, Vol 3, 95-103.

Hasibuan, Malayu S.P. 2006, Manajemen Sumber Daya Manusia, edisi Revisi. Jakarta. Bumi

Aksara.

Iriadi, Nandang & Nuraeni. (2016). Kajian Penerapan Metode Klasifikasi Data Mining

Algoritma C4.5 Untuk Prediksi Kelayakan Kredit Pada Bank Mayapada Jakarta: Jurnal Teknik

Komputer Amik BSI. Vol.II. No.1.

Lumbantoruan & Kennedy. (2015). Analisis Data Mining Dan Warehousing: Jurnal Ilmiah

Buletin Ekonomi. Vol.19. No.1.

Anda mungkin juga menyukai