Anda di halaman 1dari 107

ANALISIS ALGORITMA C4.

5 UNTUK
MENENTUKAN TINGKAT PROFIT USAHA PADA PT
MEGACIPTA SEJATI

SKRIPSI

Oleh:
Harina
161510006

PROGRAM STUDI SISTEM INFORMASI


FAKULTAS TEKNIK DAN KOMPUTER
UNIVERSITAS PUTERA BATAM
2020
ANALISIS ALGORITMA C4.5 UNTUK
MENENTUKAN TINGKAT PROFIT USAHA PADA PT
MEGACIPTA SEJATI

SKRIPSI

Untuk memenuhi salah satu syarat


guna memperoleh gelar Sarjana

Oleh:
Harina
161510006

PROGRAM STUDI SISTEM INFORMASI


FAKULTAS TEKNIK DAN KOMPUTER
UNIVERSITAS PUTERA BATAM
2020
SURAT PERNYATAAN ORISINALITAS

Yang bertanda tangan di bawah ini saya:


Nama : Harina
NPM/NIP : 161510006
Fakultas : Teknik dan Komputer

Program Studi : Sistem Informasi

Menyatakan bahwa “ Skripsi ” yang saya buat dengan judul:

Analisis Algoritma C4.5 Untuk Menentukan Tingkat Profit Usaha Pada PT Megacipta Sejati

Adalah hasil karya sendiri dan bukan “duplikasi” dari karya orang lain.
Sepengetahuan saya, didalam naskah Skripsi ini tidak terdapat karya

ilmiah atau pendapat yang pernah ditulis atau diterbitkan oleh orang lain, kecuali
yang secara tertulis dikutip didalam naskah ini dan disebutkan dalam sumber
kutipan dan daftar pustaka.
Apabila ternyata di dalam naskah Skripsi ini dapat dibuktikan

terdapat unsur-unsur PLAGIASI, saya bersedia naskah Skripsi ini

digugurkan dan gelar akademik yang saya peroleh dibatalkan, serta diproses

sesuai dengan peraturan perundang-undangan yang berlaku.


Demikian pernyataan ini saya buat dengan sebenarnya tanpa ada paksaan dari
siapapun.

Batam, 11 Juli 2020

Materai 6000
Harina
161510006
ANALISIS ALGORITMA C4.5 UNTUK
MENENTUKAN TINGKAT PROFIT USAHA PADA PT
MEGACIPTA SEJATI

Oleh
Harina
161510006

SKRIPSI

Untuk memenuhi salah satu syarat


guna memperoleh gelar Sarjana

Telah disetujui oleh Pembimbing pada tanggal


seperti tertera di bawah ini

Batam, 11 Juli 2020

Rika Harman, S.Kom., M.SI.


Pembimbing
ABSTRAK

Perkembangan asrama di Batam dari tahun ke tahun menunjukkan peningkatan


yang signifikan. Banyak orang yang datang dari kota yang jauh dan banyak juga
orang yang meninggalkan kampung halaman untuk datang dan mencari kerja di
kota batam sehingga tidak memiliki tempat tinggal membuat banyak perusahaan
yang sedang mencari pekerja memberikan fasilitas tempat tinggal seperti asrama
untuk para pekerja. PT Megacipta Sejati merupakan perusahaan yang bergerak
dibidang sewa dormitory kepada perusahaan yang memberikan fasilitas tempat
tinggal seperti asrama untuk para pekerjanya. Selama ini perusahaan memiliki
sekumpulan data terkait percapaian kinerja perusahaan yang telah menghabiskan
banyak biaya namun data tersebut belum dapat dimanfaatkan dengan baik.
Melalui penerapan teknologi data mining, sekumpulan data yang belum
dimanfaatkan tersebut akan diproses dan menghasilkan new knowlage
(pengetahuan baru) yang menjadi sesuatu yang berharga dan berguna bagi
perusahaan terutama dalam peningkatan profit. Berdasarkan permasalahan
tersebut, saya sebagai peneliti tertarik untuk meneliti analisa algoritma c4.5 untuk
menentukan tingkat profit usaha pada PT Megacipta Sejati. Data Mining
merupakan penambangan atau penemuan informasi baru dengan mencari pola
atau aturan tertentu dari sejumlah data dalam jumlah besar yang diharapkan dapat
mengatasi kondisi tersebut. Data Mining sendiri memiliki beberapa teknik salah
satunya klasifikasi. Teknik klasifikasi terdiri beberapa metode, dan decision tree
adalah bagian dari metode klasifikasi. Kemudian metode decision tree memiliki
algoritma, algoritma C4.5 adalah salah satu dari algoritma yang memiliki decision
tree. Hasil dari penelitian ini akan menghasilkan rule-rule keputusan profit dan
kerugian perusahaan.

Kata Kunci: Algoritma C4.5, Data Mining, Pohon Keputusan, Profit.

v
ABSTRACT

The development of boarding houses in Batam from year to year shows a


significant increase. Many people come from distant cities and many people leave
their hometowns to come and look for work in Batam, so they do not have a place
to live. Many companies are looking for workers to provide housing facilities
such as dormitories for workers. PT Megacipta Sejati is a company engaged in
the rental of dormitory to companies that provide housing facilities such as
dormitories for their workers. During this time the company has a set of data
related to the achievement of company performance which has cost a lot but the
data cannot be utilized properly. Through the application of data mining
technology, a collection of untapped data will be processed and produce new
knowledge that becomes valuable and useful for companies, especially in
increasing profits. Based on these problems, I as a researcher are interested in
researching the c4.5 algorithm analysis to determine the level of business profit at
PT Megacipta Sejati. Data Mining is mining or finding new information by
looking for certain patterns or rules from a large amount of data that is expected
to overcome these conditions. Data Mining itself has several techniques, one of
which is classification. The classification technique consists of several methods,
and the decision tree is part of the classification method. Then the decision tree
method has an algorithm, C4.5 algorithm is one of the algorithms that has a
decision tree. The results of this study will produce rules for the company's profit
and loss decisions.

Keywords: Algorithm C4.5, Data Mining, Decision Tree, Profit.

vi
KATA PENGANTAR

Dengan mengucapkan puji dan syukur kepada Tuhan yang Maha Esa yang
telah melimpahkan segala rahmat dan karunianya, sehingga penulis dapat
menyelesaikan skripsi yang merupakan salah satu persyaratan untuk
menyelesaikan program studi strata satu (S1) pada Program Studi Sistem
Informasi Universitas Putera Batam.
Penulis menyadari bahwa skripsi ini masih jauh dari sempurna. Karena itu,
kritik dan saran akan senantiasa penulis terima dengan senang hati.
Dengan segala keterbatasan, penulis menyadari pula bahwa skripsi ini
takkan terwujud tanpa bantuan, bimbingan, dan dorongan dari berbagai pihak.
Untuk itu, dengan segala kerendahan hati, penulis menyampaikan ucapan terima
kasih kepada:
1. Ibu Dr. Nur Elfi Husda, S.Kom., M.SI, selaku Rektor Universitas Putera
Batam.
2. Bapak Welly Sugianto, S.T., M.M, selaku Dekan Fakultas Teknik Dan
Komputer Universitas Putera Batam.
3. Bapak Muhammad Rasyid Ridho, S.Kom., M.SI., selaku Ketua Program
Studi Sistem Informasi Universitas Putera Batam.
4. Bapak Rika Harman, S.Kom., M.SI., sebagai pembimbing skripsi yang
telah menyediakan waktu dalam memberikan bimbingan dan petunjuk
sampai selesainya skripsi ini.
5. Seluruh dosen dan staff Universitas Putera Batam.
6. Dan pihak-pihak yang telah memberikan dukungannya hingga tersusunnya
penelitian ini yang tidak dapat disebutkan oleh penulis satu persatu.

Semoga Tuhan YME membalas kebaikan dan selalu mencurahkan hidayah


serta taufik-Nya, Amin.
Batam, 11 Juli 2020

Penulis

vii
DAFTAR ISI

Halaman
HALAMAN SAMPUL
HALAMAN JUDUL
HALAMAN PERNYATAAN ORISINALITAS
HALAMAN PENGESAHAN
ABSTRAK...............................................................................................................v
ABSTRACT..............................................................................................................vi
KATA PENGANTAR...........................................................................................vii
DAFTAR ISI........................................................................................................ viii
DAFTAR GAMBAR...............................................................................................x
DAFTAR TABEL...................................................................................................xi
DAFTAR RUMUS................................................................................................xii
BAB I PENDAHULUAN
Pembatasan Masalah
TINJAUAN PUSTAKA
Teori Khusus
Profit
Waikato Environment for Knowlwdge Analysis (WEKA)
Hipotesis Penelitian
Penelitian Terdahulu
METODE PENELITIAN
Desain Penelitian
Objek Penelitian
Lokasi Penelitian
Jadwal Penelitian
Populasi dan Sampel
Populasi
Sampel
Variabel Penelitian
Teknik Pengumpulan Data
Model Penelitian
Hasil
Pembahasan
Melakukan Pra Proses Data Penelitian
Analisa Data
Pembersihan Data
Seleksi Data
Transformasi Data
Pohon Keputusan

viii
Keputusan Hasil Pengujian
Pengujian Menggunakan WEKA
LAMPIRAN

ix
DAFTAR GAMBAR
Halaman
Gambar 1.1 Data Penghuni 3
Gambar 2.1 Pengelompokan Teknik Klasifikasi 17
Gambar 2.2 Pohon Keputusan Identifikasi 19
Gambar 2.3 Tampilan Utama WEKA 25
Gambar 2.4 Kerangka Berpikir 28
Gambar 3.1 Desain Penelitian 31
Gambar 4.1 Pohon Keputusan Node 1 58
Gambar 4.2 Pohon Keputusan Node 2 67
Gambar 4.3 Pohon Keputusan Node 3 74
Gambar 4.4 Data Variabel Pada Aplikasi Microsoft Excel 76
Gambar 4.5 Data Variabel Pada Aplikasi Notepad 77
Gambar 4.6 Tampilan Awal Aplikasi WEKA 78
Gambar 4.7 Tampilan Pemilihan File Pengujian WEKA 79
Gambar 4.8 Tampilan Pemilihan Atribut Pengujian WEKA 80
Gambar 4.9 Tampilan Tab Menu Classify 80
Gambar 4.10 Tampilan Pemilihan Classifier 81
Gambar 4.11 Tampilan Pemilihan Classifer 82
Gambar 4.12 Tampilan Visualisasi Pohon 83
Gambar 4.13 Tampilan Hasil Pengujian WEKA 83

x
DAFTAR TABEL
Halaman
Tabel 3.1 Jadwal Penelitian 33
Tabel 4.1 Format Pra Proses Data Profit Usaha 41
Tabel 4.2 Biaya Tenaga Kerja 44
Tabel 4.3 Biaya Operasional 45
Tabel 4.4 Biaya Perlengkapan 45
Tabel 4.5 Biaya Perawatan 45
Tabel 4.6 Biaya Pajak 46
Tabel 4.7 Biaya Legalitas 46
Tabel 4.8 Format Data Akhir Profit Usaha 47
Tabel 4.9 Hasil Perhitungan Manual Node 1 56
Tabel 4.10 Hasil Perhitungan Manual Node 2 65
Tabel 4.11 Hasil Perhitungan Manual Node 3 73

xi
DAFTAR RUMUS
Halaman
Rumus 2.1 Perhitungan Gain 20
Rumus 2.2 Rumus Perhitungan Entropy 21

xii
BAB I
PENDAHULUAN

1.1 Latar Belakang

Perkembangan teknologi dan informasi ternyata membawa

perubahan dalam segala bidang termasuk kepada perkembangan dunia

bisnis. Tidak dapat dipungkiri lagi perkembangan teknologi yang pesat

saat ini banyak menarik perhatian masyarakat luas. Demikian pula pada

perkembangan komputer yang dinamis diiringi perkembangan zaman

dapat menghasilkan informasi yang cepat dan akurat dan tidak

memerlukan waktu yang lama dalam menggali informasi yang dibutuhkan,

termasuk pada perusahaan-perusahaan yang bergerak dalam jasa sewa

asrama atau dormitory dimana kegiatan usahanya yeng selalu

membutuhkan perhitungan yang signifikan terhadap informasi untuk

menjalankan sebuah perencanaan usaha yang mereka kelola setiap

tahunnya.

Perkembangan asrama di Batam dari tahun ke tahun menunjukan

peningkatan yang signifikan. Kota Batam sebagai kota industri terdapat

banyak kawasan industri, ini menjadi perhatian banyak orang yang berada

diluar kota batam untuk datang mencari pekerjaan dikota ini. Banyak

orang yang datang dari kota yang jauh dan banyak juga orang yang

meninggalkan kampung halaman untuk datang dan mencari kerja di kota

1
batam sehingga tidak memiliki tempat tinggal membuat banyak

perusahaan yang sedang mencari pekerja memberikan fasilitas

2
3

tempat tinggal seperti asrama untuk para pekerja. Definisi Asrama adalah

bangunan tempat tinggal bagi orang – orang yang bersifat homogen,

(Departemen Pendidikan dan Kebudayaan, 1993, 53), Sedangkan menurut

wikipedia.org (2009), asrama adalah suatu tempat penginapan yang

ditujukan untuk anggota suatu kelompok, umumnya murid – murid

sekolah. Asrama biasanya merupakan sebuah bangunan dengan kamar –

kamar yang dapat ditempati oleh beberapa penghuni di setiap kamarnya.

Para penghuni menginap di asrama untuk jangka waktu yang lebih lama

dari pada di hotel atau losmen. Alasan untuk memilih menghuni sebuah

asrama bisa berupa tempat tinggal asal yang terlalu jauh, maupun untuk

biayanya yang terbilang lebih murah dibandingkan bentuk penginapan

lain, misalnya apartemen.

Menurut The Enyclopedia Americana, asrama yang dikenal dengan

istilah Dormitory, adalah berasal dari kata Dormotorius (Latin), yang

berarti a sleeping place, dengan pengertian bahwa dormitory merupakan

keseluruhan bangunan dalam hubungannya dengan bangunan pendidikan,

yang terbagi atas kamar tidur dan meja belajar bagi penghuninya.

Dormitory dalam perusahaan atau organisasi lebih dikenal dengan sebutan

mess yaitu kamar yang dibangun untuk tempat tinggal karyawan dan

pegawai. Dormitory pada perusahaan atau organisasi biasanya kamar yang

memiliki tempat tidur yang banyak agar dapat menampung orang yang

banyak. Tarif sewa di tentukan oleh perusahaan atau organisasi yang

terkadang gratis atau sudah termasuk dalam paket tertentu. Namun


4

dormitory terkadang disediakan oleh perusahaan untuk karyawan dengan

jangka waktu yang cukup lama atau selama masih menjadi karyawan

perusahaan tersebut dengan sewa murah.

PT Megacipta Sejati merupakan perusahaan yang bergerak

dibidang sewa dormitory kepada perusahaan yang memberikan fasilitas

tempat tinggal seperti asrama untuk para pekerjanya sejak tahun 2012

yang beralamat di Jalan Hang Kesturi belakang Cammo Industrial Esate

Blok B, Batam, Kepulauan Riau. Dalam 1 bulan PT Megacipta Sejati

memiliki punghuni sekitar 300 penghuni sampai dengan 400 penghuni

yang tinggal di dormitory. Demikian grafik data penghuni perusahaan PT

Megacipta Sejati di Kota Batam, sebagai berikut:

DATA PENGHUNI 2020


DATA PENGHUNI 2020
450
400400 389
350 362

300
250
222
200
150
100
50
0
Januari Februari Maret April

Gambar 1.1 Data Penghuni

0)
5

Berdasarkan gambar dari grafik data penghuni yang tinggal di PT

Megacipta Sejati Tahun 2020, pada bulan Januari hingga Februari

mengalami penurunan yang tidak cukup besar yaitu sekitar 11 penghuni.

Kemudian pada bulan Maret ke April terjadi penurunan penghuni yang

cukup besar yaitu sekitar 140 penghuni namun dapat disimpulkan dalam

tahun 2020 sejak bulan Januari hingga bulan April PT Megacipta Sejati

rata-rata mengalami penurunan dalam penghuni setiap bulan pada tahun

2020.

Selama ini perusahaan memiliki sekumpulan data terkait

percapaian kinerja perusahaan yang telah menghabiskan banyak biaya

namun data tersebut belum dapat dimanfaatkan dengan baik. Melalui

penerapan teknologi data mining, sekumpulan data yang belum

dimanfaatkan tersebut akan diproses dan menghasilkan new knowlage

(pengetahuan baru) yang menjadi sesuatu yang berharga dan berguna bagi

perusahaan terutama dalam peningkatan profit.

Berdasarkan masalah diatas melalui penerapan teknologi data

mining dengan algoritma C4.5 maka sekumpulan data anggaran biaya

yang belum dimanfaatkan tersebut akan diproses dan menghasilkan new

knowladge yang menjadi sesuatu yang berharga dan berguna bagi

perusahaan terutama dalam peningkatan profit. Data Mining merupakan

penambangan atau penemuan informasi baru dengan mencari pola atau

aturan tertentu dari sejumlah data dalam jumlah besar yang diharapkan

dapat mengatasi kondisi tersebut. Data Mining sendiri memiliki beberapa


6

teknik salah satunya klasifikasi. Teknik klasifikasi terdiri beberapa

metode, dan decision tree adalah bagian dari metode klasifikasi. Kemudian

metode decision tree memiliki algoritma, algoritma C4.5 adalah salah satu

dari algoritma yang memiliki decision tree.

Pada penerapannya didunia usaha, teknik datamining dengan

algoritma C4.5 pada penelitian (Nofitri, 2017) yang meneliti tentang

analisa algoritma C4.5 dalam memprediksi pencapaian profit menyatakan

data mining merupakan proses analisa data untuk menemukan suatu pola

dari kumpulan data tersebut. Data mining mampu menganalisa data yang

besar menjadi informasi berupa pola yang mempunyai arti bagi pendukung

keputusan. Sedangkan, pada penelitian yang pernah dilakukan oleh (Elisa,

2018) yang meneliti tentang prediksi profit pada perusahaan dengan

klasifikasi algoritma C4.5 mengatakan bahwa algoritma C4.5 merupakan

sebuah algoritma yang digunakan untuk membangun decision tree

(pengambilan keputusan), menunjukkan bahwa faktor-faktor yang

menyebabkan pencapaian profit adalah biaya tenaga ahli, biaya tenaga

teknik, biaya tenaga pendukung, biaya operasional kantor, biaya peralatan,

biaya pelaporan dan dokumen, dan biaya mobilisasi. Dengan

menggunakan metode klasifikasi yaitu algoritma C4.5 nantinya diharapkan

dapat digunakan untuk membantu pengambilan keputusan dalam

menentukan tingkat profit usaha.

Berdasarkan uraian latar belakang diatas, maka saya sebagai peneliti

tertarik untuk meneliti melalui skripsi saya yang berjudul “ANALISIS


7

ALGORITMA C4.5 UNTUK MENENTUKAN TINGKAT PROFIT

USAHA PADA PT MEGACIPTA SEJATI”.

1.2 Identifikasi Masalah

Berdasarkan uraian latar belakang diatas, maka peneliti

mengidentifikasi beberapa masalah sebagai berikut:

1. Tidak adanya teknik atau cara yang digunakan oleh perusahan untuk

mengetahui kenaikan dan penurunan profit perusahaan dalam hal ini

dalam pemamfaatan dari data perusahaan yang sudah ada.

2. Tidak adanya acuan atau standar yang resmi yang dibuat oleh perusahaan

dalam menentukan tingkat profit pada perusahaan, sehingga menyulitkan

pihak manajemen perusahaan dalam menentukannya.

1.3 Pembatasan Masalah

Untuk lebih terarahnya pembahasan penelitian ini, maka peneliti

menentukan batasan masalah yang akan diteliti yaitu:

1. Penelitian ini dilakukan pada PT Megacipta Sejati dengan mengelola serta

menganalisa data profit usaha yang sedang berjalan.

2. Penelitian ini menggunakan metode Allgortima C.45 dengan software

WEKA 3.8.3. yang akan digunakan untuk mengidentifikasi dan

menentukan profit usaha.


8

3. Penelitian ini dilakukan pada PT Mega Cipta Sejati dengan mengelola

data transaksi sewa dormitory selama 3 bulan terakhir yaitu Maret,

April dan Juni.

4. Penelitian ini akan memamfaatkan pola yang dihasiilkan dari hasil

pengujian WEKA 3.8.3 dan pencarian manual dengan Microsoft Excel

berbentuk pohon keputusan yang akan dipakai sebagai bahan

pengambilan keputusan.

1.4 Perumusan Masalah

Berdasarkan identifikasi masalah tersebut, maka peneliti

merumuskan masalah sebagai berikut:

1. Bagaimanakah penerapan Data Mining khususnya teknik klasifikasi

menggunakan Algoritma C4.5 dalam menentukan tingkat profit usaha

pada PT Megacipta sejati?

2. Apakah teknik klarifikasi menggunakan Algoritma C4.5 dapat

menemukan pola dalam menentukan tingkat profit usaha?

3. Bagaimanakah cara mengimplementasikan teknik klarifikasi Algoritma

C4.5 sebagai alat untuk menemukan pola yang digunakan dalam

menentukan tingkat profit usaha?

4. Bagaimanakah tindakan kedepannya dengan adanya hasil yang

diperoleh dari proses penelitian yang dilakukan mengenai tingkat profit

usaha sehingga kedepannya minim kesalahan?


9

1.5 Tujuan Penelitian

Berdasarkan pada uraian masalah diatas, adapun tujuan dari

pelaksanaan penelitian ini adalah untuk:

1. Menerapkan Data Mining khususnya teknik klasifikasi menggunakan

algoritma C.45 dalam menentukan kenaikan dan penurunan profit usaha

pada PT Megacipta.

2. Pengujian Teknik Klasifikasi dan Algoritma C.45 dalam wujud

penerapan dari datamining yang digunakan dalam menentukan

kenaikan dan penurunan profit usaha pada PT Megacipta.

3. Pengujian Algorima C4.5 menggunakan software data Mining WEKA

dalam menentukan kenaikan dan penurunan profit usaha pada PT

Megacipta.

4. Menguji dan menganalisa penerapan Data Mining teknik klasifikasi

menggunakan algoritma C4.5 dalam menentukan kenaikan dan

penurunan profit usaha pada PT Megacipta.

1.6 Manfaat Penelitian

Penelitian ini diharapkan bermanfaat bagi pembaca. Manfaat dari

penelitian yang dilakukan adalah sebagai berikut:

1.6.1 Manfaat Teoritis

Manfaat teoritis yang diharapkan dapat diperoleh dari penelitian ini

adalah sebagai berikut:


10

1. Menguatkan teori tentang algoritma C4.5 dalam menentukan tingkat profit

usaha.

2. Sebagai referensi pada penelitian – penelitian selanjutnya yang berhubungan

dengan teknik datamining dengan metode algoritma C4.5.

1.6.2 Manfaat Praktis

Selain manfaat teoritis, manfaat praktis yang diharapkan dapat diperoleh

dari penelitian ini adalah sebagai berikut:

1. Bagi Mahasiswa

Dapat digunakan sebagai bahan referensi untuk penelitian selanjutnya

juga sebagai acuan informasi dan dapat menambah pengetahuan

mengenai datamining khususnya algortima C.45.

2. Bagi Peneliti

Mampu meningkatkan pemahaman dan dapat memberikan pengalaman

bagi peneliti sehingga penelitian ini dapat dijadikan bekal dalam

melakukan penelitian selanjutnya. Dan diharapkan juga menjeadi

referensi dari peneliti yang lain.

3. Bagi Perushaan

Diharapkan dapat memberi kontribusi positif kepada PT Megacipta

dalam hal menentukan profit usaha, yang selama ini sangat sulit untuk

ditentukan oleh pihak manajemen perusahaan.


BAB II
TINJAUAN PUSTAKA

2.1 Teori

Berikut adalah uraian tentang teori-teori yang digunakan didalam

penelitian ini, adapun teori yang dimaksud terdiri atas dua teori besar yaitu teori

umum dan teori khusus, adapun uraiannya adalah sebagai berikut:

2.1.1 Teori Umun

Berikut adalah uraian tentang teori umum yang digunakan pada

proposal penelitian ini, teori umum ini dimaksudkan untuk memperkuat isi

dari teori yang ada hal ini dimaksudkan supaya penelitian yang dilakukan

hasilnya lebih baik. Adapun isi dari teori umum tersebut dapat dijelaskan

sebagai berikut:

2.1.1.1 Knowledge Discovery in Database (KDD)

KDD (Knowledge Discovery in Database) adalah kegiatan yang dilakukan

secara teratur dan terorganisir yang ditujukan kepada kegiatan mengidentifikasi

pola-pola yang terdapat didalam tumpukkan data yang sangat besar dan kompleks,

yang mana pola tersebut mempunyai spesifikasi seperti bersifat sah, baru dan

dapat bermanfaat dan dapat dimengerti oleh orang-orang yang berkecimpung

dengan data tersebut Maimon & Rokach (2010). Menurut pendapat Ramamahon

(2013) Data Mining, juga dikenal sebagai Knowledge Discovery in Database

yang mengacu kepada proses penemuan data dengan jalan digali atau ditambang

dari tumpukkan

11
12

data dalam jumlah yang sangat besar sehingga dapt ditemukan pengetahuan dari

dalam data tersebut dalam jumlah yang sangat besar. Jadi berdasarkan dari kedua

pendapat di atas dapat disimpulkan bahwa KDD adalah proses pencarian

informasi atau pengetahuan dari kumpulan data yang sangat besar (database)

yang mungkin selama ini disia-disiakan atau tidak diperdulikan.

Menurut Feelders, Daniels, dan Holsheimer dalam Gunadi (2008) Data

Mining adalah proses pemisahan informasi dari kumpulan data yang sangat besar

melalui pemamfaatan algoritma dan teknik tertentu yang melibatkan bidang teknik

seperti statistik, matematika, mesin pembelajaran, dan sistem manajemen

database. Data Mining dapat digunakan untuk memisahkan informasi dan

pengetahuan penting yang tersembunyi dari dataset yang besar. Dengan adanya

Data Mining, maka akan dimungkinkan untuk mendapatkan harta berharga berupa

pengetahuan didalam kumpulan data. Kumpulan data ini biasanya oleh organisasi

oleh perusahaan sering diabaikan atau dianggap tidak berguna, padahal jika

dikelola dengan baik dan benar dapat menjadi data yang sangat penting bagi

keberlangsungan dari organisasai atau perusahaan tersebut.

Hampir senada dengan Gunadi, Benni (2014) mendefinisikan Data Mining

sebagai proses kegiatan dalam hal penemuan pola yang menarik dari data yang

berjumlah besar (menggudang), dimana data tersebut dapat disimpan dalam

database, data warehouse, atau penyimpanan informasi lainnya yang dipunyai

oleh organisasi atau perusahaan. Pada dasarnya pola yang didapat adalah pola

yang menarik, sangat berharga dan sangat penting dalam memberikan nilai

tambah atau keuntungan kepada pemilik data dalam hal ini adalah pemilik
13

perusahaan atau organisasi. Perdapat yang mirip diungkapkan juga oleh Geetha

dan Manimekalai (2013) bahwa Data mining adalah proses yang menggunakan

berbagai alat analis data untuk menemukan pola dan hubungan dalam data yang

dapat digunakan untuk membuat prediksi yang valid.

Dari berbagai pendapat di atas dapat disimpulkan bahwa data mining

adalah serangkaian proses dalam menemukan pengetahuan tersembunyi dan

berharga dari sekumpulan data yang dapat digunakan untuk membuat prediksi

yang valid pada berbagai bidang, baik sosial, ekonomi, pendidikan, budaya

bahkan sampai bidang pemerintahan. Menurut Feelders, Daniels, dan Holsheimer

dalam Gunadi (2008) Data Mining adalah proses ekstraksi informasi dari

kumpulan data melalui penggunaan algoritma dan teknik yang melibatkan bidang

teknik statistik, matematika, mesin pembelajaran, dan sistem manajemen

database. Data Mining dapat digunakan untuk mengekstrak informasi dan

pengetahuan penting yang tersembunyi dari dataset yang besar. Dengan adanya

Data Mining, maka akan dimungkinkan untuk mendapatkan harta berharga berupa

pengetahuan didalam kumpulan data.

Hampir senada dengan Gunadi, Benni (2014) mendefinisikan Data

Mining sebagai kegiatan menemukan pola yang menarik dari data yang

berjumlah besar, data dapat disimpan dalam database, data warehouse,

atau penyimpanan informasi lainnya. Pola yang ditemukan merupakan

pola yang menarik, berharga dan penting dalam memberikan keuntungan

kepada pemilik data. Perdapat yang mirip diungkapkan juga oleh Geetha

dan Manimekalai (2013) bahwa Data mining adalah proses yang


14

menggunakan berbagai alat analis data untuk menemukan pola dan

hubungan dalam data yang dapat digunakan untuk membuat prediksi yang

valid. Dari berbagai pendapat di atas dapat disimpulkan bahwa data

mining adalah serangkaian proses dalam menemukan pengetahuan

tersembunyi dan berharga dari sekumpulan data yang dapat digunakan

untuk membuat prediksi yang valid pada berbagai bidang, baik sosial,

ekonomi, pendidikan, budaya bahkan sampai bidang pemerintahan.

2.1.1.2 Data Mining

Data Mining adalah proses yang memperkerjakan satu atau lebih

tiknik pembelajaran computer (machine learning) untuk menganalisis dan

mengekstrasi pengetahuan (knowledge) secara otomatis. Definisi lain

diantaranya adalah pembelajaran berbasis induksi (induction-

basedlearning) adalah proses pembentukan definisi-definisi konsep umum

yang dilakukan dengancara mengobservasi contoh-contoh spesifik dari

konsep-konsep yang akan dipelajari. Knowledge Discovery in Database

(KDD) adalah penerapan metode saintifik pada data mining. Dalam

konteks ini data mining merupakan satu langkah dari proses KDD (Eska

J., 2016).

Selain beberapa penjelasan diatas, ada juga yang menjelaskan

bahwa “Data mining merupakan prosesekstraksi data menjadi informasi

yang sebelumnya belum tersampaikan, dengan teknik yang tepat proses

data mining akan memberikan hasil yang optimal (Abdillah G.,Putra F. A.

and Renaldi F., 2016)”. Data mining juga didefinisikan sebagai sebuah
15

proses untuk menemukan hubungan, pola dan tren baru yang bermakna

dengan menyaring data yang sangat besar, yang tersimpan dalam

penyimpanan, menggunakan teknik pengenalan pola seperti teknik

Statistik dan Matematika. Data mining bukanlah suatu bidang yang sama

sekalibaru. Salah satu kesulitan untuk mendefinisikan data mining adalah

kenyataan bahwa data mining mewarisi banyak aspek dan teknik dari

bidang-bidang ilmu yang sudah mapan terlebih dahulu. Berawal dari

beberapa disiplin ilmu, data mining bertujuan untuk memperbaiki teknik

tradisional sehingga bisa menangani:

1. Jumlah data yang sangat besar

2. Dimensi data yang tinggi

3. Data yang heterogen dan berbeda sifat

Sedangkan menurut para ahli, data mining merupakan sebuah

analisa dari observasi data dalam jumlah besar untuk menemukan

hubungan yang tidakdiketahui sebelumnya dan dua metode baru untuk

meringkas data agar mudah dipahami serta kegunaannya untuk pemilih

data (Kamagi D. H dan Seng Hansun,2014). Maka dapat disimpulkan

bahwa, Sementara menurut Turban, E. dkk 2005, data mining merupakan

sebuah proses yang menggunakan teknik statistik, matematika, kecerdasan

buatan, dan machine learning untuk mengekstrasi dan mengidentifikasi

informasi yang bermanfaat dan pengetahuan yang terkait dari berbagai

database besar (Hendrian S, 2018). Secara garis besar datamining dapat

dikelompokkan menjadi 2 kategori utama,yaitu:


16

1. Descriptive mining, yaitu proses untuk menemukan karakteristik

penting dari data dalam suatu basis data. Teknik data mining yang

termasuk dalam descriptive mining adalah clustering, association, dan

sequential mining.

2. Predictive, yaitu proses untuk menemukan pola dari data dengan

menggunakan beberapa variabel lain di masa depan. Salah satu teknik

yang terdapat dalam predictive mining adalah klasifikasi (Andri,

Kunang Y. N. and Murniati S., 2013).Berdasarkan defenisi-defenisi

yang telah disampaikan, halpenting yang terkait dengan data mining

adalah:

a. Data mining merupakan suatu proses otomatis terhadap data

yang sudah ada.

b. Data yang akan diproses berupa data yang sangat besar.

c. Tujuan data mining adalah mendapatkan hubungan atau pola

yang mungkin memberikan indikasi yang bermanfaat.

2.1.1.3 Pengelompokan Data Mining

Pengelompokan Data Mining dibagi menjadi beberapa kelompok,

menurut Kusrini dan Luthfi (2009) dalam Jumanto (2014), yaitu:

1. Deskripsi

Deskripsi merupakan cara untuk menggambarkan pola dan

kecenderungan yang terdapat dalam data yang dimiliki.

2. Estimasi
17

Estimasi hampir sama dengan klasifikasi, kecuali variable target

estimasi lebih ke arah numerik daripada ke arah kategori. Model yang

dibangun menggunakan record lengkap yang menyediakan nilai

variable target sebagai nilai prediksi.

3. Prediksi

Prediksi menerka sebuah nilai yang belum diketahui dan juga

memperkirakan nilai untuk masa mendatang.

4. Klasifikasi

Dalam klasifikasi terdapat target variable kategori, misal

penggolongan pendapatan dapat dipisahkan dalam tiga kategori, yaitu

tinggi, sedang, dan rendah.

5. Pengklasteran

Merupakan pengelompokan record, pengamatan, atau memperhatikan

dan membentuk kelas objek-objek yang memiliki kemiripan.

6. Asosiasi

Asosiasi bertugas menemukan atribut yang muncul dalam satu waktu.

Dalam dunia bisnis lebih umum disebut analisis keranjang belanja.

2.1.1.4 Klasifikasi

Teknik klasifikasi adalah pendekatan sistematis untuk membangun

model klasifikasi dari kumpulan data masukan. Misalnya, teknik pohon

keputusan, Bayesian (Naive Bayesian dan Bayesian Belief Networks),

Jaringan Saraf Tiruan (Backpropagation), teknik yang berbasis konsep

dari penambangan aturan-aturan asosiasi, dan teknik lain (K-Nearest


18

Neighboor, algoritma genetik, teknik dengan pendekatan himpunan rough

dan fuzzy). Setiap teknik mengadopsi algoritma pembelajaran untuk

mengidentifikasi model yang paling sesuai dengan hubungan antara label

atribut set dan kelas input data (Patil, 2014). Setiap teknik juga memiliki

kelebihan dan kekurangannya sendiri. Data dengan profil tertentu mungkin

paling optimal jika diklasifikasi dengan teknik tertentu, atau dengan kata

lain, profil data tertentu dapat mendukung termanfaatkannya kelebihan

dari teknik ini.

Gambar 2.1 Pengelompokan Teknik Klasifikasi

Sumber: (Della, 2017)

Secara umum, proses klasifikasi dapat dilakukan dalam dua tahap,

yaitu proses belajar dari data pelatihan dan klasifikasi kasus baru. Pada

proses belajar, Algoritma klasifikasi mengolah data training untuk


19

menghasilkan sebuah model. Setelah model diuji dan dapat diterima, pada

tahap klasifikasi, model tersebut digunakan untuk memprediksi kelas dari

kasus baru untuk membantu proses pengambilan keputusan (Han, 2001)

dalam (Piko, 2011). Kelas yang dapat diperdiksi adalah kelas – kelas yang

sudah terdefinisi pada data pelatihan. Karena proses klasifikasi kasus baru

cukup sederhana, penelitian lebih banyak ditujukan untuk memperbaiki

teknik – teknik pada proses belajar.

2.1.1.5 Pohon Keputusan

Metode ini merupakan salah satu metode yang ada pada teknik

klasifikasi dalam Data Mining. Metode pohon keputusan mengubah fakta

yang sangat besar menjadi pohon keputusan yang mempresentasikan

aturan. Aturan dapat dengan mudah dipahami dengan bahasa alami. Dan

mereka juga dapat diekpresikan dalam bentuk bahasa basis data seperti

Strutuctured Query Language untuk mencari record pada kategori tertentu

(Utari, 2015).

Pohon keputusan menggunakan representasi struktur pohon (tree) dimana

setiap node merepresentasikan atribut, cabangnya merepresentasikan nilai dari

atribut dan daun merepresentasikan kelas. Node yang paling atas dari pohon

keputusan disebut sebagai root. Pohon keputusan merupakan metode klasifikasi

yang paling populer digunakan. Selain karena pembangunannya relatif cepat, hasil

dari model yang dibangun mudah untuk dipahami (Sijabat, 2015). Data dalam

pohon keputusan biasanya dinyatakan dalam bentuk tabel dengan atribut dan

record. Atribut menyatakan suatu parameter yang disebut sebagai kriteria dalam
20

pembentukan pohon. Manfaat utama dari penggunaan pohon keputusan adalah

kemampuannya untuk mem-break down proses pengambilan keputusan yang

kompleks menjadi lebih simpel sehingga pengambil keputusan akan lebih

menginterpretasikan solusi dari permasalahan (Hanik, 2011).

Contoh dari pohon keputusan dapat dilihat di Gambar 2.3 yang merupakan

identifikasi pembeli komputer, dari pohon keputusan tersebut diketahui bahwa

salah satu kelompok yang potensial membeli komputer adalah orang yang berusia

di bawah 30 tahun dan juga pelajar (Fatayat, 2013).

Gambar 2.2 Pohon Keputusan Identifikasi

Sumber: (Pramudiono, 2008)

Dengan pohon keputusan, dapat dengan mudah mengidentifikasi

dan melihat hubungan antara faktor-faktor yang mempengaruhi suatu

masalah dan dapat mencari penyelesaian terbaik dengan memperhitungkan

faktor-faktor tersebut. Pohon keputusan ini juga dapat menganalisa nilai


21

resiko dan nilai suatu informasi yang terdapat dalam suatu alternatif

pemecahan masalah. Peranan pohon keputusan sebagai alat bantu dalam

mengambil keputusan (decision supporttool) telah dikembangkan oleh

manusia sejak perkembangan teori pohon yang dilandaskan pada teori

Graf. Kegunaan pohon keputusan yang sangat banyak ini membuatnya

telah dimanfaatkan oleh manusia dalam berbagai macam sistem

pengambilan keputusan. Banyak algoritma yang dapat dipakai dalam

pembentukan pohon keputusan, antara lain ID3, C4.5, CART.

2.1.1.6 Algoritma C4.5

Algoritma C4.5 yaitu sebuah algoritma yang digunakan untuk

membangun decisiontree (pengambilan keputusan). AlgoritmaC.45 adalah

salah satu algoritma induksipohon keputusan yaitu ID3

(IterativeDichotomiser 3). ID3 dikembangkan oleh J.Ross Quinlan. Dalam

prosedur algoritmaID3, input berupa sampel training, labeltraining dan

atribut. Algoritma C4.5merupakan pengembangan dari ID3. Beberapa

pengembangan yang dilakukan pada C4.5adalah sebagai antara lain bisa

mengatasi missing value, bisa mengatasi continue data, dan pruning

(Fadillah, 2013). Menurut (Rahman, 2015), algoritma C4.5 adalah suatu

metode untuk membuat pohon keputusan berdasarkan data yang ada. Ide

dasar dari algoritma ini adalah pembuatan pohon keputusan

berdasarkan pemilihan atribut yang memiliki prioritas tertinggi atau dapat

disebut memiliki nilai gain tertinggi berdasarkan nilai entropy atribut


22

tersebut sebagai proses atribut klasifikasi. Untuk mencari gain tertinggi

menggunakan rumus berikut.

n
|Si|
Gain ( S , A )=Entropy ( S )−∑ ∗Entropy (Si)
i=1 |S|

Rumus 2.1 Perhitungan Gain

Dimana:

S : himpunan kasus

A : atribut

N : jumlah patisi atribut A

|Si| : jumlah kasus pada partisi ke-i

|S| : jumlah kasus dalam S

Sementara itu, perhitungan nilai entropy dapat dilihat pada persamaan 2

berikut.

n
Entropy ( S ) =∑ − pi∗log 2 pi
i=1

Rumus 2.2 Perhitungan Entropy

Dimana :

S: himpunan kasus

A : fitur

N : jumlah partisi S
23

Pi : proporsi dari Si terdapat S

Pengujian hasil perhitungan gain dan entropy ini dapat diuji melalui

software Waikato Environment for Knowledge Analysis (WEKA). Didalam

penelitian (Rifqo & Arzi, 2016), secara umum algoritma C4.5 untuk

membangun pohon keputusan adalah sebagai berikut:

1. Pilih atribut sebagai akar, merupakan atribut yang tidak memiliki

cabang masukan dan berpengaruh paling besar pada suatu kelas

tertentu.

2. Buat cabang untuk tiap-tiap nilai, adalah membuat struktur cabang dari

decision tree yang sudah berisi nilai-nilai.

3. Bagi kasus dalam cabang, adalah melakukan pembagian atau

pengelompokkan dari permasalahan yang terdapat pada struktur

cabang dari decision tree.

4. Ulangi proses untuk setiap cabang sampai kasus pada cabang memiliki

kelas yang sama, adalah melakukan proses pengulangan yang ada pada

tahapan pertama hingga ketiga sampai seluruh cabang pada struktur

decision tree memiliki kelas dan kategori yang sama.

2.1.2 Teori Khusus

Berikut adalah adalah teori khusus yang digunakan, dimana

penjelasannya dapat diuraikan yang antara lain adalah sebagai berikut:


24

2.1.2.1 Profit

Menurut (Elisa, 2018), profit atau disebut juga dengan laba

menurut Martono dan Harijito menjelaskan bahwa konsep laba

merupakan konsep yang menghubungkan Antara pendapatan atau

penghasilan yang diperoleh oleh perusahaan di satu pihak, dan biaya yang

harus ditanggung atau dikeluarkan oleh pihak lain. Untung atau laba

didefinisikan sebagai kenaikan modal saham dari transaksi yang bersifat

insidental dan bukan meruapakan kegiatan pokok perusahaan dan dari

transaksi lainnya yang mempengaruhi perusahaan dalam periode tertentu.

Sedangkan profit bersih atau laba bersih merupakan laba dari bisnis

perusahaan yang sedang berjalan setelah bunga dan pajak.

Menurut (Elisa, 2018), Sistem yang akan dirancang dan digunakan

dalam Prediksi Pencapaian Profit Pada Perusahaan. Data awal numeric

maupun nonnumeric akan dibagi perkelas untuk memudahkan analisa

berikutnya. Setelah semua data yang akan dimasukkan dibagi perkelas,

maka dilakukan proses klasifikasi dengan membuat pohon keputusan

sebagai output. Proses pengambilan keputusan untuk prediksi pencapaian

profit pada perusahaan adalah sebagai berikut:

A. Biaya Langsung Personil

1. Biaya Tenaga Ahli

2. Biaya Tenaga Teknik

3. Biaya Tenaga Pendukung


25

B. Biaya Langsung Non Personil

1. Biaya Operasional Kantor

2. Biaya Peralatan

3. Biaya Pelaporan & Dokumen

4. Biaya Mobilisasi

Variabel yang akan menjadi keputusan adalah BAIK dan TIDAK BAIK.

2.1.2.2 Waikato Environment for Knowlwdge Analysis (WEKA)

WEKA merupakan sebuah sistem data mining yang dikembangkan

oleh Universitas Waikato di Selandia Baru yang mengimplementasikan

algoritma data mining (Aksenova, 2004: 2). WEKA adalah sebuah koleksi

mesin pembelajaran algoritma untuk tugas-tugas data mining.

Algoritmanya dapat diterapkan secara langsung ke data set atau dipanggil

dari kode Java sendiri. WEKA berisi alat-alat untuk data pra-pengolahan

(pre-processing), klasifikasi, regresi, clustering, aturan asosiasi, dan

visualisasi. WEKA juga sesuai untuk mengembangkan skema

pembelajaran mesin baru (www.cs.waikato.ac.nz). WEKA menyediakan

inplementasi dari pembelajaran algoritma yang dapat dengan mudah untuk

diterapkan pada dataset. Implementasi tersebut juga mencakup bebagai

alat untuk mengubah dataset, pre-process dataset, memberikan skema

pembelajaraan, dan menganalisis klasifikasi yang dihasilkan dan

kinerjanya tanpa harus menuliskan kode program (Witten, 2011: 403)


26

Salah satu penggunaan WEKA adalah untuk menerapkan metode

pembelajaran untuk dataset dan menganalisis output untuk mempelajari

data secara lebih lanjut. Penggunaan lainnya adalah digunakan sebagai

model pembelajaran untuk memprediksi pada sebuah kasus baru.

Penerapan lainnya dilakukan pada beberapa pembelajaran yang berbeda

dan membandingkan kinerja dari mereka dan dipilih salah satu untuk

digunakan dalam memprediksi. Pada tampilan utama dapat anda pilih

metode pembelajaran yang diinginkan pada menu. Banyak metode yang

memiliki parameter yang selaras, yang dapat diakses melalui lembar

properti atau editor objek. Sebuah modul evaluasi umum digunakan untuk

mengukur kinerja semua pengklasifikasian (Witten, 2011: 404). Berikut

tampilan utama pada WEKA ditunjukkan pada gambar

Gambar 2.3 Tampilan Utama WEKA

Sumber: (Witten, 2011)


27

Seperti yang ditunjukkan pada Gambar 2.4 WEKA GUI Chooser

memiliki empat tombol utama, yaitu:

1. Explore

Explore merupakan sebuah pilihan bidang untuk menjelajahi data

dengan WEKA. Explore memiliki enam jenis tab didalamnya dengan

tugas sebagai berikut (Witten, 2011: 404-416)

a. Preprocess merupakan bidang pemilihan data set dan

modifikasinya dengan berbagai cara..

b. Classify pelatihan pembelajaran skema yang melaksanakan

klasifikas atau regresi dan evaluasinya.

c. Cluster merupakan pembelajaran cluster atau pengelompokan

untuk dataset.

d. Associate merupakan pembelajaran aturan asosiasi untuk data

dan evaluasinya.

e. Select attribute merupakan bidang pemilihan aspek yang paling

relevan dalam dataset.

f. Visualize merupakan bidang tampilan plot dari dua dimensi

yang berbeda dari data tersebut dan interaksinya

2. Experimenter

Experimenter merupakan sebuah pilihan bidang untuk melakukan

eksperimen dan melakukan uji statistik antara skema pembelajaran.

Experimenter memungkinkan pengguna untuk membuat percobaan

dalam skala besar., mulai dari percobaan dijalankan sampai percobaan


28

selesai hingga dilakukan analisis kinerja secara statistik terhadap apa

yang telah diperoleh.

3. Knowledge Flow

Knowledge Flow merupakan sebuah pilihan bidang yang mendukung

fungsi dasar yang sama seperti explore tetapi dengan antarmuka drag

dan drop. Salah satu keuntungannya adalah knowledge flow

mendukung adanya pembelajaran tambahan. Pada tampilan utama

knowledge flow ini pengguna dapat melihat tata letak sebuah kinerja

dari proses yang dilakukannya, pengguna dihubungkan kedalam

sebuah graf berarah yang memproses dan menganalisis data. Pada

bagian ini merupakan gambaran secara jelas bagaimana data berjalan

dalam sistem dimana tidak disediakan dalam explore.

4. Simple CLI

Simple CLI merupakan sebuah pilihan bidang yang memberikan

tampilan garis perintah sederhana yang memungkinkan adanya

perintah langsung eksekusi dari WEKA untuk sistem operasi yang tidak

memberikan tampilan garis perintahnya sendiri. Dibalik tampilan

interaktif explore, experimenter, knowledge flow pada WEKA terdapat

fungsi dasar yang dapat diakses secara langsung pada tampilan garis

perintah. Garis perintah terdapat pada simple CLI, pada tampilan utama

WEKA panel simple CLI terletak disebelah kanan bawah.

WEKA sebagai mesin pembelajaran yang memiliki tugas dalam

penggunaan sebuah metode, WEKA memiliki beberapa metode utama


29

dalam permasalahan data mining, yaitu regresi, klasifikasi, clustering,

association rule mining, dan pemilihan atribut. Pengenalan data

merupakan bagian yang tidak terpisahkan dari sebuah pekerjaan, dan

banyak fasilitas visualisasi data dan alat data preprocessing yang

disediakan. Semua algoritma dalam WEKA mengambil input dalam bentuk

tabel relasional tunggal dalam format Attribute Relation File Format

(ARFF), yang dapat dibaca dari sebuah file atau dihasilkan oleh

permintaan basis data (Singhal & Jena, 2013), (Witten, 2011:407-519).

2.2 Kerangka Berpikir

Pada sub bab ini akan diuraikan kerangka berfikir penelitian, yang

merupakan langkah-langkah yang akan dilakukan dalam penyelesaian

masalah dari penelitian yang ada, adapun kerangka berfikirnya adalah

sebagai berikut:
30

Gambar 2.4 Kerangka Berpikir

Sumber: (Hasil Penelitian, 2020)

2.3 Hipotesis Penelitian

Hipotesis atau dugaan sementara terhadap hasil penelitian yang

masih harus diuji kebenarannya. Hipotesis peneliti dalam penelitian ini

anatara lain adalah sebagai berikut:

1. Teknik datamining dengan algoritma C4.5 dapat menganalisis data

dari profit usaha.

2. Hasil penelitian dapat membantu menentukan tingkat profit usaha pada

PT Megacipta Sejati.
31

2.4 Penelitian Terdahulu

Berikut adalah beberapa penelitian terdahulu yang dijadikan sebagai acuan

dari penelitian yang dilakukan. Tujuan dari mencamtumkan penelitian terdahulu

adalah agar penelitian yang dilakukan mendapatkan hasil yang optimal dan valid.

Berikut adalah beberapa penelitian yabg dijadikan acuan.

1. Anu And Chauhan Harvinder (2013) penelitian yang berjudul

“Implementation Of Decision Tree Algoritma C4.5” yang menunjukkan

hasil yang lebih akurat dan pengimplementasian pohon keputusan

dengan metode algoritma C4.5 sangat mudah dan cepat. Algoritma ini

lebih cocok untuk data sets yang mengandung tidak terlalu banyak

data.

2. Jambur (2016) penelitian yang “Menganalisa jumlah pelanggan aktif

dengan menerapkan teknik datamining metode algoritma C4.5” yang

menunjukkan bahwa pelanggan dengan jumlah bayar tinggi, pembelian

pertahun sedang, diskon rendah maka merupakan pelanggan aktif.

Penelitian ini dapat membantu perusahaan dalam menyortir pelanggan yang

aktif dan tidak aktif.

3. Pujiono et al., (2013) penelitian tentang penggunaan WEKA untuk

menganalisis kepuasan publik dalam mewujudkan good governance di

kota Yogyakarta yang menunjukkan bahwa pelayanan yang diberikan Dinas

Perizinan selama ini cukup baik sehingga pelaksanaan good governance

dapat disimpulkan akan berjalan dengan baik.


32

4. Harman (2018) penelitian tentang “Memprediksi indikator website yang

baik dengan menerapkan teknik datamining metode algoritma C4.5” yang

menunjukkan bahwa yang paling mempengaruhi indikator website yang baik

adalah navigasi, selanjutnya adalah graphic design.

5. Mardin (2017) penelitian tentang “klasifikasi menggunakan algoritma

C4.5” yang menghasilkan bahwa dengan menggunakan metode klasifkasi

yaitu algoritma C4.5 dapat menghasilkan pohon keputusan yang dapat

memberikan informasi yang dibutuhkan.

6. Chen, Zhang, Li, & Shahabi, (2018) penelitian yang berjudul “Perfomance

evaluation of the GIS-based datamining techniques of best-first

decision tree, random forest, and naive bayes tree for landslide

suspecttibility modeling” yang menghasilkan bahwa random forest model

merupakan yang paling akurat prediksinya.

7. Elisa (2018) penelitian tentang “Memprediksi profit pada perusahaan dengan

menggunakan teknik datamining metode algoritma C4.5” yang

menghasilkan bahwa biaya mobilisasi dan biaya tenaga kerja

merupakan biaya yang paling banyak mempengaruhi profit perusahaan.

Penelitian ini dapat dijadikan referensi bagi perusahaan yang ingin

meningkatkan profitnya dengan cara saving cost.

8. Azwanti (2018) penelitian tentang “Memprediksi mahasiswa yang

mengulang mata kuliah menggunakan teknik datamining metode

algoritma C4.5 ini dilakukan di AMIK Labuhan Batu menyimpulkan

bahwa algoritma C4.5 merupakan algoritma yang sangat membantu


33

dalam mengklasifikasi data karena dapat memperoleh dengan jelas

karakteristik data yang diklasifikasi baik dalam bentuk pohon keputusan

maupun if-then.
BAB III
METODE PENELITIAN

3.1 Desain Penelitian

Desain Penelitian adalah memberikan prosedur untuk mendapatkan

informasi yang diperlukan untuk menyusun atau menyelesaikan masalah

dalam penelitian.

Gambar 3.1 Desain Penelitian

Sumber : (Hasil Penelitian, 2020

34
35

Berdasarkan Desain Penelitian pada gambar 3.1 maka masing –

masing langkahnya dapat diuraikan seperti berikut :

1. Mendeskripsikan Masalah, melakukan mendeskripsikan masalah yang

akan teliti perlu ditentukan terlebih dahulu yaitu menentukan dan

mendefinisikan batasan masalah yang akan diteliti, sehingga dapat

mengetahui kenaikan dan penurunan profit usaha.

2. Mempelajari Literatur, membantu peneliti dalam proses mencari

literatur serta sumber-sumber pustaka yang perlu digunakan dalam

penelitian.

3. Pengumpulan Data, proses dalam pengumpulan data yang diperlukan

untuk diproses dalam penelitian pengumpulan data,sehingga dapat

menentukan tingkat profit usaha pada PT Megacipta sejati.

4. Melakukan Analisa Teknik Pengolah Data Menggunakan algoritma

C4.5, peneliti pada tahap ini dilakukan pengolahan menggunakan

algoritma C4.5 untuk meghasilkan pohon keputusan dan menghasilkan

rule tingkat profit usaha PT Megacipta Sejati.

5. Mengimplementasikan Algoritma C4.5, dalam langkah ini, peneliti

mengimplementasikan algoritma C4.5 yang dilakukan menentukan

tingkat profit usaha berdasarkan data yang telah menganalisa.

6. Melakukan Hasil Pengujian, peneliti melakukan pengujian dan hasil

dari pengolahan dan implementasi dengan menggunakan Software

Data Mining open source WEKA.


36

3.2 Objek Penelitian

Pada sub bab ini penulis menjelaskan keterangan lokasi penelitian dan

penjelaskan jadwal penelitian sebagai beriut :

3.2.1 Lokasi Penelitian

Penelitian dilaksanakan di PT Megacipta Sejati adalah salah satu

perusahaan yang sewa dormitory yang ada di Kota Batam dengan alamat

Jalan Hang Kesturi belakang Cammo Industrial Esate Blok B, Batam,

Kepulauan Riau.

3.2.2 Jadwal Penelitian

Demikian penjelasan penulis mengenai rencana waktu yang akan

dilakukan

dalam melaksanakan kegiatan analisa mengenai kepuasan pelanggan, sebagai

berikut :

Tabel 3.1 Jadwal Penelitian

Bulan
No Maret April Mei Juni Juli
Kegiatan
. 2020 2020 2020 2020 2020
1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4
1. Penentuan

Judul
2. Bimbingan
3. Identifikasi

Masalah
4. Studi
37

Literatur
5. Pengumpula

n Data
6. Pengolahan

Data
7. Pengujian

Hasil
8. Penyusunan

Laporan
Sumber: Hasil Penelitian (2020)

3.3 Populasi dan Sampel

Penelitian menjelaskan tentang keterangan yang dimiliki oleh

populasi dan sampel yang akan dijadikan bahan dalam pelaksanaan

penelitian sebagai berikut:

3.3.1 Populasi

Dalam penelitian ini populasi yang diambil oleh penulis adalah

data transaksi sewa dormitory di PT Megacipta Sejati pada periode Maret

2020 sampai dengan Mei 2020.

3.3.2 Sampel

Berdasarkan populasi diatas maka sampel yang diambil dalam

penelitian ini menggunakan sebanyak 50 data sampel dari populasi data

transaksi sewa dormitory di PT Megacipta Sejati pada periode Maret 2020

sampai dengan Mei 2020.


38

3.4 Variabel Penelitian

Menurut (Sugiyono, 2001) variabel penelitian adalah suatu atribut

atau sifat dari nilai. Untuk menganalisis data dalam sebuah penelitian

memerlukan variabel variabel, data yang akan diolah adalah data profit

usaha yang sedang berjalan dengan variabel penilaian tingkat profit usaha

sebagai berikut:

1. Biaya Tenaga Kerja

Biaya yang dikeluarkan untuk membayar para pekerja dan pegawai yang

bekerja pada suatu perusahaan.

2. Biaya Operasional

Biaya yang berupa pengeluaran uang untuk melaksanakan kegiatan pokok,

yaitu berupa biaya penjualan dan administrasi untuk memperoleh

pendapatan,

3. Biaya Perlengkapan

Biaya yang berupa barang-barang yang dimiliki perusahaan yang bersifat

habis dipakai atau bisa dipakai berulang kali.

4. Biaya Administrasi

Biaya yang dikeluarkan untuk membayar semua biaya bank dan pajak

yang secara langsung berhubungan dengan kegiatan operasional.

5. Biaya Perawatan

Biaya yang dikeluarkan perusahaan untuk merawat aset serta sistem dalam

masa operasinya
39

6. Biaya Legalitas

Biaya yang dikeluarkan perusahaan untuk membayar biaya surat izin dan

dokumen yang secara langsung berhubungan dengan operasional.

Variabel yang akan menjadi keputusan adalah profit dan defisit.

3.5 Teknik Pengumpulan Data

Teknik pengumpulan data yang digunakan dalam penelitian ini

merupakan data informasi yang membutuhkan agar penulis dapat untuk

mencapai tujuan penelitian yaitu:

1. Teknik Studi Literatur

Dengan melakukan studi literatur ada buku-buku, jurnal, dan penelitian

telah dilakukan data yang didapat dari studi literatur ini akan

digunakan sebagai acuan untuk membuat penelitian .

2. Teknik Observasi

Teknik observasi dilakukan penelitian untuk mengetahui data – data

dormitory mulai dari bulan Januari 2020 sampai April 2020 dari PT

Megacipta Sejati.

3. Teknik Dokumentasi

Dalam teknik dokumentasi penulis mengumpulkan dokumen –

dokumen dari dormitory mulai dari bulan Januari 2020 – April 2020

dari PT Megacipta Sejati.

4. Teknik Wawancara
40

Teknik wawancara dilakukan penulis proses bertanya jawab kepada

pemilik PT Megacipta Sejati.

3.6 Model Penelitian

Model penelitian penulis menggunakan datamining dan algoritma

C4.5 dalam metode penelitian ini data yang akan di klasifikasi sesuai

dengan kategorinya, sebelum mendapatkan nilai gain dan entropy harus

menghitung klasifikasi terlebih dahulu sesuai dengan kategorinya supaya

bisa dapatkan hasil nilai gain dan entropy untuk membentuk suatu pohon

keputusan. Dalam proses pencarian nilai akan dilakukan berulang – ulang

kali sehingga bisa dapatkan node pada pohon keputusan sehingga tidak

memiliki turunan sampai didapatkan pola aturan – aturan dasar keputusan

yang dijadikan acuan dalam penelian menentukan tingkat profit usaha

pada PT Megacipta Sejati.


BAB IV
HASIL DAN PEMBAHASAN

4.1 Hasil

Pada sub bab ini akan dijelaskan mengenai hasil penelitian yang

dilakukan dimana dari pengujian yang telah dikerjakan maka didapat hasil

penelitian diantaranya adalah adalah sebagai berikut:

1. Untuk menentukan tingkat profit usaha pada PT. Megacipta Sejati

akan dipengaruhi oleh tiga faktor utama yaitu biaya operasional, biaya

perlengkapan, dan biaya perawatan.

2. Jika dilihat dari biaya operasional maka dari 50 data transaksi sewa

dormitory PT. Megacipta Sejati yang biaya operasionalnya melebihi

anggaran yang telah ditetapkan (pass) dalam hal ini diwakili oleh 19

data dari 50 data yang ada maka dapat dikategorikan perusahaan ini

akan mengalami kerugian (defisit) artinya jika biaya operasional pada

perusahaan tersebut melebihi anggaran yang telah ditetapkan (pass)

maka perusahaan tersebut akan mengalami kerugian (defisit).

3. Sedangkan 31 data lainnya masih perlu dilihat lagi biaya

perlengkapannya, jika biaya perlengkapannya melebihi anggaran yang

telah ditetapkan (pass) dalam hal ini diwakili oleh 6 data dari 32 data

yang ada maka dapat dikategorikan juga perushaan ini akan mengalami

kerugian (defisit). Artinya walaupun biaya operasional masih dibawah

anggaran/tidak

41
42

melebihi anggaran yang telah ditetapkan (budget) tetapi biaya

perlengkapannya melebihi anggaran yang telah ditetapkan (pass) maka

perusahaan akan mengalami kerugian (defisit).

4. Sedangkan 25 data lainnya masih perlu dilihat lagi biaya

perawatannya, jika biaya perawatannya melebihi anggaran yang telah

ditetapkan (pass) dalam hal ini diwakili oleh 2 data dari 25 data yang

ada maka dapat dikategorikan juga perushaan ini akan mengalami

kerugian (defisit). Artinya walaupun biaya operasional masih dibawah

anggaran/tidak melebihi anggaran yang telah ditetapkan (budget) dan

biaya perlengkapan masih dibawah anggaran/tidak melebihi anggaran

yang telah ditetapkan (budget) tetapi biaya perawatannya melebihi

anggaran yang telah ditetapkan (pass) maka perusahaan akan

mengalami kerugian (defisit).

5. Sedangkan 23 dari 25 data yang ada lainnya dapat dikategorikan

perusahaan ini akan mengalami keuntungan (profit), atau dapat

diartikan jika biaya operasional masih dibawah anggaran/tidak

melebihi anggaran yang telah ditetapkan (budget), biaya perlengkapan

masih dibawah anggaran/tidak melebihi anggaran yang telah

ditetapkan (budget), dan biaya perawatannya juga masih dibawah

anggaran/tidak melebihi anggaran yang telah ditetapkan (budget),

maka perusahaan akan mengalami keuntungan (profit)

6. Jadi kategori perusahaan tersebut akan mengalami kerugian (defisit)

adalah jika biaya operasionalnya masih dibawah/tidak melebihi


43

anggaran yang telah ditentukan (budget) ditambah lagi dengan biaya

perlengkapannya masih dibawah/tidak melebihi anggaran yang telah

ditentukan (budget) dan ditambah lagi dengan biaya perawatannya

masih dibawah/tidak melebihi anggaran yang telah ditentukan

(budget).

7. Sedangkan kategori perusahaan tersebut akan mengalami keuntungan

(profit) adalah jika biaya operasionalnya melebihi anggaran yang telah

ditentukan (pass) ditambah lagi dengan biaya perlengkapannya

melebihi anggaran yang telah ditentukan (pass) dan ditambah lagi

dengan biaya perawatannya melebihi anggaran yang telah ditentukan

(pass).

4.2 Pembahasan

Kegiatan awal dalam proses pengumpulan data untuk pembahasan hasil

penelitian ini adalah melakukan semacam pembelajaran kembali dari data yang

sudah ada dan seterusnya pembelajaran langsung kepada obyek penelitian dalam

hal ini adalah PT. Megacipta Sejati. Disini akan dilakukan wawancara terhadap

pegawai yang ada (pegawai aktif pada PT. Megacipta Sejati). Adapun tujuan dari

proses wawancara ini adalah sebagai dasar dalam penyusunan kembali data

penelitian baru artinya akan terjadi semacam proses pencocokan data dan akan

dilihat kembali apakah data yang ada ini masih sesuai antara fakta dengan data

yang ada dilapangan. Perlu diketahui juga proses ini harus dilakukan untuk

memastikan data yang ada harus valid dan juga harus dijamin kebenarannya
44

supaya keputusan yang dihasilkan benar-benar bisa dijamin keabsahannya.

Selanjutnya data tersebut akan diolah kembali menyesuaikan dengan data dari PT.

Megacipta Sejati yang berisikan tentang data profit usaha yang profit atau untung,

dan begitu juga sebaliknya. Adapun kirteria dari data yang akan diolah

mempunyai beberapa kriteria yang merupakan syarat dalam pengolahan Data

Mining dengan menggunakan teknik algoritma C.45. Dimulai dengan perhitungan

Entropy dan Gain untuk menentukan akar (root) dari pohon keputusan, sampai

terbentuknya pohon keputusan dan dapat memberikan keputusan dalam

menentukan tingkat profit usaha.

4.2.1 Melakukan Pra Proses Data Penelitian

Dari variabel-variabel yang sudah dipilih berdasarkan kebutuhan

penelitian maka dapat ditetapkan format untuk data-data yang sudah

terpilih dapat dilihat pada tabel 4.1 berikut.

Tabel 4.1 Format Pra Proses Data Profit Usaha

Biaya Biaya Biaya Biaya Biaya


Biaya Tingkat
No. Tenaga Operas Perlen Perawa Legalit
Pajak Profit
Kerja ional gkapan tan as
1 Pass Budget Pass Budget Budget Budget Defisit
2 Enough Budget Budget Budget Pass Budget Profit
3 Budget Budget Budget Budget Budget Budget Profit
4 Budget Budget Budget Budget Budget Budget Profit
5 Enough Pass Pass Pass Budget Pass Defisit
6 Pass Pass Pass Pass Pass Pass Defisit
7 Enough Budget Budget Budget Budget Budget Profit
8 Enough Budget Budget Pass Budget Budget Defisit
9 Enough Budget Budget Budget Budget Budget Profit
10 Pass Pass Budget Pass Pass Pass Defisit
11 Enough Pass Pass Pass Budget Pass Defisit
45

12 Budget Budget Budget Budget Budget Budget Profit


13 Budget Budget Budget Budget Pass Budget Profit
14 Enough Budget Pass Pass Budget Budget Defisit
15 Enough Budget Budget Budget Budget Pass Profit
16 Budget Budget Pass Budget Budget Budget Defisit
17 Enough Budget Budget Budget Budget Budget Profit
18 Pass Pass Budget Pass Pass Pass Defisit
19 Budget Pass Budget Budget Budget Budget Defisit
20 Enough Budget Budget Budget Budget Pass Profit
21 Pass Budget Budget Pass Budget Budget Defisit
22 Pass Pass Budget Pass Pass Pass Defisit
23 Budget Budget Budget Budget Budget Budget Profit
24 Budget Pass Budget Budget Budget Budget Defisit
25 Budget Pass Pass Budget Pass Budget Defisit
26 Budget Budget Pass Pass Budget Budget Defisit
27 Enough Pass Pass Budget Budget Pass Defisit
28 Pass Pass Pass Budget Pass Budget Defisit
29 Enough Budget Budget Budget Budget Pass Profit
30 Enough Pass Budget Budget Budget Budget Defisit
31 Budget Pass Budget Budget Budget Budget Defisit
32 Budget Budget Budget Budget Pass Budget Profit
33 Enough Pass Pass Budget Budget Budget Defisit
34 Enough Budget Budget Budget Budget Pass Profit
35 Budget Budget Budget Budget Budget Budget Profit
36 Pass Budget Pass Budget Budget Budget Defisit
37 Enough Pass Pass Budget Pass Budget Defisit
38 Budget Pass Budget Budget Budget Budget Defisit
39 Enough Pass Pass Pass Budget Pass Defisit
40 Enough Pass Pass Pass Budget Pass Defisit
41 Enough Budget Budget Budget Budget Pass Profit
42 Budget Budget Budget Budget Pass Budget Profit
43 Enough Budget Budget Budget Pass Budget Profit
44 Enough Budget Budget Budget Budget Budget Profit
45 Budget Pass Pass Budget Pass Budget Defisit
46 Enough Budget Pass Budget Budget Budget Defisit
47 Budget Budget Budget Budget Budget Budget Profit
48 Budget Budget Budget Budget Pass Budget Profit
49 Enough Budget Budget Budget Pass Budget Profit
50 Enough Budget Budget Budget Budget Budget Profit
Sumber: (Penulis, 2020)
46

4.2.2 Analisa Data

Agar pembahasan menjadi lebih jelas, penulis akan menguraikan

beberapa proses dalam menentukan tingkat profit usaha, sebagai berikut:

4.2.2.1 Pembersihan Data

Penulis melakukan pembersihan data dengan menghapus atau

menghilangkan indikator dari variabel yang tidak digunakan dalam

penelitian, dengan menghapus biaya administrasi dan umum.

4.2.2.2 Seleksi Data

Data yang dikumpulkan dari data transaksi sewa dormitory di PT

Megacipta Sejati pada periode Maret 2020 sampai dengan Mei 2020 yang

merupakan populasi penelitian. Lalu mengambil sampel secara acak sebanyak 50

data.

4.2.2.3 Transformasi Data

1. Atribut Biaya Tenaga Kerja

Attribut ini mengelompokkan biaya berdasarkan tingkat pengeluaran

yang dikeluarkan untuk membayar tenaga kerja, klarifikasi tingkat

pengeluaran tersebut dapat dikelompokkan seperti tabel 4.2 dibawah

ini:

Tabel 4.2 Biaya Tenaga Kerja

Biaya Tenaga Kerja Klasifikasi


Budget BG
Enough EU
Pass PS
Sumber: (Penulis, 2020)

2. Atribut Biaya Operasional


47

Attribut ini mengelompokkan biaya berdasarkan tingkat pengeluaran

yang dikeluarkan untuk keperluan operasional, klarifikasi tingkat

pengeluaran tersebut dapat dikelompokkan seperti tabel 4.3 dibawah

ini:

Tabel 4.3 Biaya Operasional

Biaya Operasional Klasifikasi


Budget BG
Pass PS
Sumber: (Penulis, 2020)

3. Biaya Perlengkapan

Attribut ini mengelompokkan biaya berdasarkan tingkat pengeluaran

yang dikeluarkan untuk membeli perlengkapan, klarifikasi tingkat

pengeluaran tersebut dapat dikelompokkan seperti tabel 4.4 dibawah

ini:

Tabel 4.4 Biaya Perlengkapan

Biaya Perlengkapan Klasifikasi


Budget BG
Pass PS
Sumber: (Penulis, 2020)

4. Biaya Perawatan

Attribut ini mengelompokkan biaya berdasarkan tingkat pengeluaran

yang dikeluarkan untuk keperluan perawatan, klarifikasi tingkat

pengeluaran tersebut dapat dikelompokkan seperti tabel 4.5 dibawah

ini:

Tabel 4.5 Biaya Perawatan


48

Biaya Perawatan Klasifikasi


Budget BG
Pass PS
Sumber: (Penulis, 2020)

5. Biaya Pajak

Attribut ini mengelompokkan biaya berdasarkan tingkat pengeluaran

yang dikeluarkan untuk membayar pajak, klarifikasi tingkat

pengeluaran tersebut dapat dikelompokkan seperti tabel 4.6 dibawah

ini:

Tabel 4.6 Biaya Pajak

Biaya Pajak Klasifikasi


Budget BG
Pass PS
Sumber: (Penulis, 2020)

6. Biaya Legalitas

Attribut ini mengelompokkan biaya berdasarkan tingkat pengeluaran

yang dikeluarkan untuk keperluan legalitas, klarifikasi tingkat

pengeluaran tersebut dapat dikelompokkan seperti tabel 4.7 dibawah

ini:

Tabel 4.7 Biaya Legalitas

Biaya Legalitas Klasifikasi


Budget BG
Pass PS
Sumber: (Penulis, 2020)

Berdasarkan pengelompokkan data diatas dapat dilakukan

pengelompokkan terhadap data yang baru, data tersebut yang akan


49

dijadikan sebagai sumber pengolahan data untuk proses selanjutnya,

pengelompokkan ini sendiri bertujuan untuk memudahkan dalam proses

perhitungan kedalam proses berikutnya, untuk lebih jelasnya dapat

ditampilkan format data akhir setelah dilakukan pra-proses tampak seperti

tabel 4.8 yang antara lain adalah sebagai berikut ini:

Tabel 4.8 Format Data Akhir Profit Usaha

Biaya Biaya Biaya Biaya


Biaya Biaya Tingkat
No. Tenaga Opera Perleng Pera
Pajak Legalitas Profit
Kerja sional kapan watan
1 PS BG PS BG BG BG Defisit
2 EU BG BG BG PS BG Profit
3 BG BG BG BG BG BG Profit
4 BG BG BG BG BG BG Profit
5 EU PS PS PS BG PS Defisit
6 PS PS PS PS PS PS Defisit
7 EU BG BG BG BG BG Profit
8 EU BG BG PS BG BG Defisit
9 EU BG BG BG BG BG Profit
10 PS PS BG PS PS PS Defisit
11 EU PS PS PS BG PS Defisit
12 BG BG BG BG BG BG Profit
13 BG BG BG BG PS BG Profit
14 EU BG PS PS BG BG Defisit
15 EU BG BG BG BG PS Profit
16 BG BG PS BG BG BG Defisit
17 EU BG BG BG BG BG Profit
18 PS PS BG PS PS PS Defisit
19 BG PS BG BG BG BG Defisit
20 EU BG BG BG BG PS Profit
21 PS BG BG PS BG BG Defisit
22 PS PS BG PS PS PS Defisit
23 BG BG BG BG BG BG Profit
24 BG PS BG BG BG BG Defisit
50

25 BG PS PS BG PS BG Defisit
26 BG BG PS PS BG BG Defisit
27 EU PS PS BG BG PS Defisit
28 PS PS PS BG PS BG Defisit
29 EU BG BG BG BG PS Profit
30 EU PS BG BG BG BG Defisit
31 BG PS BG BG BG BG Defisit
32 BG BG BG BG PS BG Profit
33 EU PS PS BG BG BG Defisit
34 EU BG BG BG BG PS Profit
35 BG BG BG BG BG BG Profit
36 PS BG PS BG BG BG Defisit
37 EU PS PS BG PS BG Defisit
38 BG PS BG BG BG BG Defisit
39 EU PS PS PS BG PS Defisit
40 EU PS PS PS BG PS Defisit
41 EU BG BG BG BG PS Profit
42 BG BG BG BG PS BG Profit
43 EU BG BG BG PS BG Profit
44 EU BG BG BG BG BG Profit
45 BG PS PS BG PS BG Defisit
46 EU BG PS BG BG BG Defisit
47 BG BG BG BG BG BG Profit
48 BG BG BG BG PS BG Profit
49 EU BG BG BG PS BG Profit
50 EU BG BG BG BG BG Profit
Sumber: (Penulis, 2020)

Pada Format data akhir pada tabel didapat berdasarkan dari atribut yang

sudah dikelompokkan atau diklasifikasi, misalnya biaya tenaga kerja diklasifikasi

kan menjadi 3 (tiga) bagian yaitu "Budget" apabila biaya dibawah dari anggaran,

"enough" apabila biaya sesuai dengan anggaran, “Past" apabila biaya melewati

anggaran yang telah ditetapkan begitupun dengan atribut lainnya.


51

4.2.3 Pohon Keputusan

Dari format data akhir profit usaha diatas, maka dilakukan klasifikasi data

Algoritma C4.5 dengan membuat pohon keputusan untuk menentukan tingkat

profit usaha berdasarkan atribut yang ada yaitu biaya tenaga kerja, biaya

operasional, biaya perlengkapan, biaya perawatan, biaya pajak, dan biaya

legalitas. Untuk memilih atribut sebagai root node, didasarkan pada nilai gain

tertinggi dari seluruh atribut yang ada.

Pencarian gain dilakukan secara berulang untuk memperoleh

internal node dan leaf node hingga tidak bisa diturunkan lagi. Adapun

tahap awal dalam membangun sebuah pohon keputusan adalah melakukan

perhitungan secara manual. Dari data pada tabel variabel profit usaha akan

dicari entropy total dengan menggunakan rumus dan cara perhitungan

sebagai berikut.

−23 23 −27 27
Entropy ( total )= ( 50 ( )) (
∗log 2
50
+
50 ( ))
∗log 2
50
=0.9954

Data yang menyatakan profit adalah 23 kasus dan defisit adalah 27 kasus.

Dengan jumlah keseluruhan kasus adalah 50 data. Diperoleh entropy total 0,9954.

Lalu dilanjutkan mencari entropy dari masing-masing atribut sebagai berikut:

1. Atribut Biaya Tenaga Kerja

Atribut biaya tenaga kerja memiliki tiga klasifikasi yaitu budget (BG),

enough (EU) dan pass (PS) dan dari data format variabel profit usaha

diketahui nilai dari klasifikasi budget (BG) ada sebanyak 24 kasus

dengan keputusan profit terdapat 13 kasus sedangkan dengan

keputusan defisit terdapat 11 kasus. Setelah itu dari klasifikasi enough


52

(EU) ada sebanyak 14 kasus dengan keputusan profit terdapat 6 kasus

dan sedangkan dengan keputusan defisit terdapat 8 kasus. Kemudian

yang terakhir dari klasifikasi pass (PS) ada sebanyak 12 kasus dengan

keputusan profit terdapat 4 kasus dan sedangkan dengan keputusan

deficit terdapat 8 kasus. Demikian penjelasan masing-masing entropy

dari pernyataan tersebut.

−13 13 −11 11
Entropy ( BG )= ( 24 ( )) (
∗log 2
24
+
24 ( ))
∗log 2
24
=0.9950

−6 6 −8 8
Entropy ( EN )= ( 14 ( )) (
∗log 2
14
+
14 ( ))
∗log 2
14
=0.9852

−4 4 −8 8
Entropy ( PS ) = ( 12 ( )) (
∗log 2
12
+
12 ( ))
∗log 2
12
=1

2. Atribut Biaya Operasional

Atribut biaya operasional memiliki dua klasifikasi yaitu budget (BG)

dan pass (PS) dan dari data format variabel profit usaha diketahui nilai

dari klasifikasi budget (BG) ada sebanyak 31 kasus dengan keputusan

profit terdapat 23 kasus sedangkan dengan keputusan defisit terdapat 8

kasus. Setelah itu dari klasifikasi pass (PS) ada sebanyak 19 kasus

dengan keputusan profit terdapat 0 kasus dan sedangkan dengan

keputusan defisit terdapat 19 kasus. Demikian penjelasan masing-

masing entropy dari pernyataan tersebut.

−23 23 −8 8
Entropy ( BG )= ( 31 ( )) (
∗log 2
31
+
31 ( ))
∗log 2
31
=0.8238

−0 0 −19 19
Entropy ( PS ) = ( 19 ( )) (
∗log 2
19
+
19 ( ))
∗log 2
19
=0
53

3. Atribut Biaya Perlengkapan

Atribut biaya perlengkapan memiliki dua klasifikasi yaitu budget (BG)

dan pass (PS) dan dari data format variabel profit usaha diketahui nilai

dari klasifikasi budget (BG) ada sebanyak 33 kasus dengan keputusan

profit terdapat 23 kasus sedangkan dengan keputusan defisit terdapat

10 kasus. Setelah itu dari klasifikasi pass (PS) ada sebanyak 17 kasus

dengan keputusan profit terdapat 0 kasus dan sedangkan dengan

keputusan defisit terdapat 17 kasus. Demikian penjelasan masing-

masing entropy dari pernyataan tersebut.

−23 23 −10 10
Entropy ( BG )= ( 33 ( )) (
∗log 2
33
+
33 ( ))
∗log 2
33
=0.8850

−0 0 −17 17
(
Entropy ( PS ) =
17
∗log 2 ( )) (
17
+
17
∗log 2 ( ))
17
=0

4. Atribut Biaya Perawatan

Atribut biaya perawatan memiliki dua klasifikasi yaitu budget (BG)

dan pass (PS) dan dari data format variabel profit usaha diketahui nilai

dari klasifikasi budget (BG) ada sebanyak 38 kasus dengan keputusan

profit terdapat 23 kasus sedangkan dengan keputusan defisit terdapat

15 kasus. Setelah itu dari klasifikasi pass (PS) ada sebanyak 12 kasus

dengan keputusan profit terdapat 0 kasus dan sedangkan dengan

keputusan defisit terdapat 12 kasus. Demikian penjelasan masing-

masing entropy dari pernyataan tersebut.

−23 23 −15 15
Entropy ( BG )= ( 38 ( )) (
∗log 2
38
+
38 ( ))
∗log 2
38
=0.9678
54

−0 0 −12 12
Entropy ( PS ) =( 12
∗log 2 ( )) (
12
+
12
∗log 2
12 ( ))
=0

5. Atribut Biaya Pajak

Atribut biaya pajak memiliki dua klasifikasi yaitu budget (BG) dan

pass (PS) dan dari data format variabel profit usaha diketahui nilai dari

klasifikasi budget (BG) ada sebanyak 39 kasus dengan keputusan

profit terdapat 20 kasus sedangkan dengan keputusan defisit terdapat

19 kasus. Setelah itu dari klasifikasi pass (PS) ada sebanyak 11 kasus

dengan keputusan profit terdapat 3 kasus dan sedangkan dengan

keputusan defisit terdapat 8 kasus. Demikian penjelasan masing-

masing entropy dari pernyataan tersebut.

−20 20 −19 19
Entropy ( BG )= ( 39
∗log 2( )) (
39
+
39
∗log 2 ( ))
39
=0.9995

−3 3 −8 8
(
Entropy ( PS ) =
11
∗log 2
11 ( )) (
+
11
∗log 2
11 ( ))
=0.8454

6. Atribut Biaya Legalitas

Atribut biaya legalitas memiliki dua klasifikasi yaitu budget (BG) dan

pass (PS) dan dari data format variabel profit usaha diketahui nilai dari

klasifikasi budget (BG) ada sebanyak 34 kasus dengan keputusan

profit terdapat 19 kasus sedangkan dengan keputusan defisit terdapat

15 kasus. Setelah itu dari klasifikasi pass (PS) ada sebanyak 16 kasus

dengan keputusan profit terdapat 4 kasus dan sedangkan dengan

keputusan defisit terdapat 12 kasus. Demikian penjelasan masing-

masing entropy dari pernyataan tersebut.


55

−19 19 −15 15
Entropy ( BG )= ( 34 ( )) (
∗log 2
34
+
34
∗log 2( ))
34
=1

−4 4 −12 12
Entropy ( PS ) =( 16
∗log 2 ( )) (
16
+
16
∗log 2
16( ))
=0.8113

Selanjutnya penulis akan menjelaskan rumus dan perhitungan dari

nilai gain pada setiap atribut dari variabel profit usaha, sebagai berikut.

1. Gain total atribut biaya tenaga kerja

Perhitungan nilai gain total atribut biaya tenaga kerja dihitung dengan

mengurangi nilai entropy total sebesar 0,9954 dengan total data pada

atribut biaya tenaga kerja dengan klasifikasi budget (BG) adalah 24

kasus, klasifikasi enough (EU) adalah 14 kasus, dan klasifikasi pass

(PS) adalah 12 kasus kemudian dikalikan dengan nilai entropy masing-

masing klasifikasi dari atribut, dalam hal ini entropy dengan klasifikasi

budget (BG) adalah 0,9950, klasifikasi enough (EU) adalah 0,9852,

dan klasifikasi pass (PS) adalah 1 dengan perhitungan gain sebagai

berikut.

24 14 12
¿ 0,9954− (( 50
∗0,9950 +
50)(
∗0,9852 + )(
50 ))
∗1 =0,2419

2. Gain total atribut biaya operasional

Perhitungan nilai gain total atribut biaya operasional dihitung dengan

mengurangi nilai entropy total sebesar 0,9954 dengan total data pada

atribut biaya operasional dengan klasifikasi budget (BG) adalah 31

kasus dan klasifikasi pass (PS) adalah 19 kasus kemudian dikalikan

dengan nilai entropy masing-masing klasifikasi dari atribut, dalam hal


56

ini entropy dengan klasifikasi budget (BG) adalah 0,8238 dan

klasifikasi pass (PS) adalah 0 dengan perhitungan gain sebagai berikut.

31 19
¿ 0,9954− (( 50 )(
∗0,8238 +
50 ))
∗0 =0,4846

3. Gain total atribut biaya perlengkapan

Perhitungan nilai gain total atribut biaya perlengkapan dihitung dengan

mengurangi nilai entropy total sebesar 0,9954 dengan total data pada

atribut biaya perlengkapan dengan klasifikasi budget (BG) adalah 33

kasus dan klasifikasi pass (PS) adalah 17 kasus kemudian dikalikan

dengan nilai entropy masing-masing klasifikasi dari atribut, dalam hal

ini entropy dengan klasifikasi budget (BG) adalah 0,8850 dan

klasifikasi pass (PS) adalah 0 dengan perhitungan gain sebagai berikut.

33 17
¿ 0,9954− (( 50 )(
∗0,8850 +
50 ))
∗0 =0,4113

4. Gain total atribut biaya perawatan

Perhitungan nilai gain total atribut biaya perawatan dihitung dengan

mengurangi nilai entropy total sebesar 0,9954 dengan total data pada

atribut biaya perawatan dengan klasifikasi budget (BG) adalah 38

kasus dan klasifikasi pass (PS) adalah 12 kasus kemudian dikalikan

dengan nilai entropy masing-masing klasifikasi dari atribut, dalam hal

ini entropy dengan klasifikasi budget (BG) adalah 0,9678 dan

klasifikasi pass (PS) adalah 0 dengan perhitungan gain sebagai berikut.

¿ 0,9954− (( 3850 ∗0,9678 )+( 1250∗0))=0,2599


57

5. Gain total atribut biaya pajak

Perhitungan nilai gain total atribut biaya pajak dihitung dengan

mengurangi nilai entropy total sebesar 0,9954 dengan total data pada

atribut biaya pajak dengan klasifikasi budget (BG) adalah 39 kasus dan

klasifikasi pass (PS) adalah 11 kasus kemudian dikalikan dengan nilai

entropy masing-masing klasifikasi dari atribut, dalam hal ini entropy

dengan klasifikasi budget (BG) adalah 0,9995 dan klasifikasi pass (PS)

adalah 0,8454 dengan perhitungan gain sebagai berikut.

¿ 0,9954− (( 3950 ∗0,9995 )+( 1150 ∗0,8454 ))=0,0298


6. Gain total atribut biaya legalitas

Perhitungan nilai gain total atribut biaya legalitas dihitung dengan

mengurangi nilai entropy total sebesar 0,9954 dengan total data pada

atribut biaya legalitas dengan klasifikasi budget (BG) adalah 34 kasus

dan klasifikasi pass (PS) adalah 16 kasus kemudian dikalikan dengan

nilai entropy masing-masing klasifikasi dari atribut, dalam hal ini

entropy dengan klasifikasi budget (BG) adalah 1 dan klasifikasi pass

(PS) adalah 0,8113 dengan perhitungan gain sebagai berikut.

34 16
¿ 0,9954− (( ) (
50
∗1 +
50 ))
∗0,8113 =0,0626

Setelah penulis selesai menjelaskan nilai dari masing-masing

atribut yaitu nilai dari entropy dan nilai dari gain, penulis membuat

penjelasan hasil yang sudah didapatkan menggunakan tabel seperti berikut.


58

Tabel 4. 9 Hasil Perhitungan Manual Node 1

Entrop
 
Tingkat Profit Profit Defisit y Gain
TOTAL   50 23 27 0,9954  
             
Biaya Tenaga

Kerja            
Budget BG 24 13 11 0,9950
Enough EU 14 6 8 0,9852 0,2419
Pass PS 12 4 8 1
    50        
Biaya

Operasional            
Budget BG 31 23 8 0,8238
0,4846
Pass PS 19 0 19 0
    50        
Biaya

Perlengkapan            
Budget BG 33 23 10 0,8850
0,4113
Pass PS 17 0 17 0
    50        
Biaya

Perawatan            
Budget BG 38 23 15 0,9678
0,2599
Pass PS 12 0 12 0
    50        
Biaya Pajak            
Budget BG 39 20 19 0,9995
0,0298
Pass PS 11 3 8 0,8454
    50        
Biaya

Legalitas            
Budget BG 34 19 15 1
0,0626
Pass PS 16 4 12 0,8113
    50        
Sumber: (Penulis, 2020)
59

Dari penjelasan penulis berdasarkan tabel diatas, dapat diketahui

bahwa atribut ketersediaan memiliki nilai dengan gain tertinggi, yaitu

0,4846 dengan demikian maka penulis membuat root node pada pohon

keputusan sementara dari atribut ketersediaan sebagai berikut

Gambar 4.1 Pohon Keputusan Node 1

Sumber: (Penulis, 2020)

Dari gambar diatas dapat diketahui bahwa root node mempunyai 2

dua cabang, dimana salah satu cabang yang berasal dari atribut biaya

operasional dengan klasifikasi pass (PS) tidak memiliki turunan karena

ditandai dengan nilai entropynya yang bernilai 0 sehingga menjadi leaf

node. Sedangkan klasifikasi budget (BG) dari atribut biaya operasional

masih memiliki turunan karena ditandai dengan nilai entropynya yang

bernilai 0,8238 sehingga memiliki turunan pada node kedua. Selanjutnya

dilakukan lagi perhitungan yang sama dengan cara perhitungan pada node

pertama yaitu dengan melakukan perhitungan nilai dari entropy dan nilai

dari gain dengan atribut yang tersisa atau atribut selain biaya operasional
60

yaitu atribut dari biaya tenaga kerja, biaya perlengkapan, biaya perawatan,

biaya pajak, dan biaya legalitas.

Berdasarkan data pada tabel variabel profit usaha akan dicari

entropy total dari atribut biaya operasional dengan klasifikasi budget (BG)

menggunakan rumus dan cara perhitungan sebagai berikut.

−23 23 −8 8
Entropy ( total )= ( 31 ( )) (
∗log 2
31
+
31 ( ))
∗log 2
31
=0.8238

Dari perhitungan diatas dapat dilihat kasus yang menyatakan profit

adalah 23 kasus dan defisit adalah 8 kasus dengan jumlah keseluruhan

kasus adalah 31 kasus dan kemudian diperoleh entropy total 0,8238. Lalu

dilanjutkan mencari entropy dari masing-masing atribut sebagai berikut:

1. Atribut Biaya Tenaga Kerja

Atribut biaya tenaga kerja memiliki tiga klasifikasi yaitu budget (BG),

enough (EU) dan pass (PS) dan dari data format variabel profit usaha

diketahui atribut biaya operasional dengan klasifikasi budget (BG) dan

atribut biaya tenaga kerja dengan klasifikasi budget (BG) ada sebanyak

15 kasus dengan keputusan profit terdapat 13 kasus sedangkan dengan

keputusan defisit terdapat 2 kasus. Setelah itu dari klasifikasi enough

(EU) ada sebanyak 9 kasus dengan keputusan profit terdapat 6 kasus

dan sedangkan dengan keputusan defisit terdapat 3 kasus. Kemudian

yang terakhir dari klasifikasi pass (PS) ada sebanyak 7 kasus dengan

keputusan profit terdapat 4 kasus dan sedangkan dengan keputusan


61

deficit terdapat 3 kasus. Demikian penjelasan masing-masing entropy

dari pernyataan tersebut.

−13 13 −2 2
Entropy ( BG )= ( 15 ( )) (
∗log 2
15
+
15 ( ))
∗log 2
15
=0.5665

−6 6 −3 3
Entropy ( EN )= ( 9 ( )) (
∗log 2
9
+
9 ( ))
∗log 2
9
=0.9183

−4 4 −3 3
Entropy ( PS ) = ( 7
∗log 2( )) (
7
+
7
∗log 2( ))
7
=1

2. Atribut Biaya Perlengkapan

Atribut biaya perlengkapan memiliki dua klasifikasi yaitu budget (BG)

dan pass (PS) dan dari data format variabel profit usaha diketahui

atribut biaya operasional dengan klasifikasi budget (BG) dan atribut

biaya perlengkapan dengan klasifikasi budget (BG) ada sebanyak 25

kasus dengan keputusan profit terdapat 23 kasus sedangkan dengan

keputusan defisit terdapat 2 kasus. Setelah itu dari klasifikasi pass (PS)

ada sebanyak 6 kasus dengan keputusan profit terdapat 0 kasus dan

sedangkan dengan keputusan defisit terdapat 6 kasus. Demikian

penjelasan masing-masing entropy dari pernyataan tersebut.

−23 23 −2 2
Entropy ( BG )= ( 25 ( )) (
∗log 2
25
+
25 ( ))
∗log2
25
=0.4022

−0 0 −6 6
Entropy ( PS ) = ( 6
∗log 2( )) (
6
+
6
∗log 2( ))
6
=0

3. Atribut Biaya Perawatan

Atribut biaya perawatan memiliki dua klasifikasi yaitu budget (BG)

dan pass (PS) dan dari data format variabel profit usaha diketahui
62

atribut biaya operasional dengan klasifikasi budget (BG) dan atribut

biaya perawatan dengan klasifikasi budget (BG) ada sebanyak 27

kasus dengan keputusan profit terdapat 23 kasus sedangkan dengan

keputusan defisit terdapat 4 kasus. Setelah itu dari klasifikasi pass (PS)

ada sebanyak 4 kasus dengan keputusan profit terdapat 0 kasus dan

sedangkan dengan keputusan defisit terdapat 4 kasus. Demikian

penjelasan masing-masing entropy dari pernyataan tersebut.

−23 23 −4 4
Entropy ( BG )=
( 27 ( )) (
∗log 2
27
+
27 ( ))
∗log 2
27
=0.6052

−0 0 −4 4
(
Entropy ( PS ) =
4
∗log 2
4( )) (
+
4
∗log 2
4( ))
=0

4. Atribut Biaya Pajak

Atribut biaya pajak memiliki dua klasifikasi yaitu budget (BG) dan

pass (PS) dan dari data format variabel profit usaha diketahui atribut

biaya operasional dengan klasifikasi budget (BG) dan atribut biaya

pajak dengan klasifikasi budget (BG) ada sebanyak 28 kasus dengan

keputusan profit terdapat 20 kasus sedangkan dengan keputusan defisit

terdapat 8 kasus. Setelah itu dari klasifikasi pass (PS) ada sebanyak 3

kasus dengan keputusan profit terdapat 3 kasus dan sedangkan dengan

keputusan defisit terdapat 0 kasus. Demikian penjelasan masing-

masing entropy dari pernyataan tersebut.

−20 20 −8 8
Entropy ( BG )= ( 28 ( )) (
∗log 2
28
+
28 ( ))
∗log 2
28
=0.8631
63

−3 3 −0 0
Entropy ( PS ) = ( 3 ( )) (
∗log 2
3
+
3 ( ))
∗log 2
3
=0

5. Atribut Biaya Legalitas

Atribut biaya legalitas memiliki dua klasifikasi yaitu budget (BG) dan

pass (PS) dan dari data format variabel profit usaha diketahui atribut

biaya operasional dengan klasifikasi budget (BG) dan atribut biaya

legalitas dengan klasifikasi budget (BG) ada sebanyak 25 kasus dengan

keputusan profit terdapat 19 kasus sedangkan dengan keputusan defisit

terdapat 6 kasus. Setelah itu dari klasifikasi pass (PS) ada sebanyak 6

kasus dengan keputusan profit terdapat 4 kasus dan sedangkan dengan

keputusan defisit terdapat 2 kasus. Demikian penjelasan masing-

masing entropy dari pernyataan tersebut.

−19 19 −6 6
Entropy ( BG )= ( 25 ( )) (
∗log 2
25
+
25
∗log 2( ))
25
=1

−4 4 −2 2
Entropy ( PS ) =( 6
∗log 2
6( )) (
+
6
∗log 2
6( ))
=0.9183

Selanjutnya penulis akan menjelaskan rumus dan perhitungan dari

nilai gain pada setiap atribut dari variabel profit usaha, sebagai berikut.

1. Gain total atribut biaya tenaga kerja

Perhitungan nilai gain total atribut biaya tenaga kerja dihitung dengan

mengurangi nilai entropy total sebesar 0,8238 dengan total data pada

atribut biaya tenaga kerja dengan klasifikasi budget (BG) adalah 15

kasus, klasifikasi enough (EU) adalah 9 kasus, dan klasifikasi pass

(PS) adalah 7 kasus kemudian dikalikan dengan nilai entropy masing-


64

masing klasifikasi dari atribut, dalam hal ini entropy dengan klasifikasi

budget (BG) adalah 0,5665, klasifikasi enough (EU) adalah 0,9183,

dan klasifikasi pass (PS) adalah 1 dengan perhitungan gain sebagai

berikut.

15 9 7
¿ 0,8238− (( 31 )(
∗0,5665 +
31
∗0,9183 +)(
31 ))
∗1 =0,2831

2. Gain total atribut biaya perlengkapan

Perhitungan nilai gain total atribut biaya perlengkapan dihitung dengan

mengurangi nilai entropy total sebesar 0,8238 dengan total data pada

atribut biaya perlengkapan dengan klasifikasi budget (BG) adalah 25

kasus dan klasifikasi pass (PS) adalah 6 kasus kemudian dikalikan

dengan nilai entropy masing-masing klasifikasi dari atribut, dalam hal

ini entropy dengan klasifikasi budget (BG) adalah 0,4022 dan

klasifikasi pass (PS) adalah 0 dengan perhitungan gain sebagai berikut.

25 6
¿ 0,8238− (( 31 )(
∗0,4022 +
31 ))
∗0 =0,4995

3. Gain total atribut biaya perawatan

Perhitungan nilai gain total atribut biaya perawatan dihitung dengan

mengurangi nilai entropy total sebesar 0,8238 dengan total data pada

atribut biaya perawatan dengan klasifikasi budget (BG) adalah 27

kasus dan klasifikasi pass (PS) adalah 4 kasus kemudian dikalikan

dengan nilai entropy masing-masing klasifikasi dari atribut, dalam hal

ini entropy dengan klasifikasi budget (BG) adalah 0,6052 dan

klasifikasi pass (PS) adalah 0 dengan perhitungan gain sebagai berikut.


65

27 4
¿ 0,8238− (( 31 )(
∗0,6052 +
31 ))
∗0 =0,2967

4. Gain total atribut biaya pajak

Perhitungan nilai gain total atribut biaya pajak dihitung dengan

mengurangi nilai entropy total sebesar 0,8238 dengan total data pada

atribut biaya pajak dengan klasifikasi budget (BG) adalah 28 kasus dan

klasifikasi pass (PS) adalah 3 kasus kemudian dikalikan dengan nilai

entropy masing-masing klasifikasi dari atribut, dalam hal ini entropy

dengan klasifikasi budget (BG) adalah 0,8631 dan klasifikasi pass (PS)

adalah 0 dengan perhitungan gain sebagai berikut.

¿ 0,8238− (( 2831 ∗0,8631)+( 313 ∗0))=0,0442


5. Gain total atribut biaya legalitas

Perhitungan nilai gain total atribut biaya legalitas dihitung dengan

mengurangi nilai entropy total sebesar 0,8238 dengan total data pada

atribut biaya legalitas dengan klasifikasi budget (BG) adalah 25 kasus

dan klasifikasi pass (PS) adalah 6 kasus kemudian dikalikan dengan

nilai entropy masing-masing klasifikasi dari atribut, dalam hal ini

entropy dengan klasifikasi budget (BG) adalah 1 dan klasifikasi pass

(PS) adalah 0,9183 dengan perhitungan gain sebagai berikut.

25 6
¿ 0,8238− (( ) (
31
∗1 +
31 ))
∗0.9183 =0,0049
66

Setelah penulis selesai menjelaskan nilai dari masing-masing

atribut yaitu nilai dari entropy dan nilai dari gain, penulis membuat

penjelasan hasil yang sudah didapatkan menggunakan tabel seperti berikut.

Tabel 4. 10 Hasil Perhitungan Manual Node 2

Entrop
 
Tingkat Profit Profit Defisit y Gain
TOTAL   31 23 8 0,8238  
             
Biaya Tenaga

Kerja            
Budget BG 15 13 2 0,5665
Enough EU 9 6 3 0,9183 0,2831
Pass PS 7 4 3 1
    31        
Biaya

Perlengkapan            
Budget BG 25 23 2 0,4022
0,4995
Pass PS 6 0 6 0
    31        
Biaya

Perawatan            
Budget BG 27 23 4 0,6052
0,2967
Pass PS 4 0 4 0
    31        
Biaya Pajak            
Budget BG 28 20 8 0,8631
0,0442
Pass PS 3 3 0 0
    31        
Biaya

Legalitas            
Budget BG 25 19 6 1
0,0049
Pass PS 6 4 2 0,9183
    31        
67

Sumber: (Penulis, 2020)

Dari penjelasan penulis berdasarkan tabel diatas, dapat diketahui

bahwa atribut ketersediaan memiliki nilai dengan gain tertinggi, yaitu

0,4995 dengan demikian maka penulis membuat root node pada pohon

keputusan sementara dari atribut perlengkapan sebagai berikut

Gambar 4.2 Pohon Keputusan Node 2

Sumber: (Penulis, 2020)

Dari gambar diatas dapat diketahui bahwa root node mempunyai 2

dua cabang, dimana salah satu cabang yang berasal dari atribut biaya

perlengkapan dengan klasifikasi pass (PS) tidak memiliki turunan karena

ditandai dengan nilai entropynya yang bernilai 0 sehingga menjadi leaf

node. Sedangkan klasifikasi budget (BG) dari atribut biaya perlengkapan

masih memiliki turunan karena ditandai dengan nilai entropynya yang

bernilai 0,4022 sehingga memiliki turunan pada node ketiga. Selanjutnya


68

dilakukan lagi perhitungan yang sama dengan cara perhitungan pada node

pertama dan kedua yaitu dengan melakukan perhitungan nilai dari entropy

dan nilai dari gain dengan atribut yang tersisa atau atribut selain biaya

perlengkapan yaitu atribut dari biaya tenaga kerja, biaya perawatan, biaya

pajak, dan biaya legalitas.

Berdasarkan data pada tabel variabel profit usaha akan dicari

entropy total dari atribut biaya perlengkapan dengan klasifikasi budget

(BG) menggunakan rumus dan cara perhitungan sebagai berikut.

−23 23 −2 2
Entropy ( total )= ( 25 ( )) (
∗log 2
25
+
25 ( ))
∗log 2
25
=0.4022

Dari perhitungan diatas dapat dilihat kasus yang menyatakan profit

adalah 23 kasus dan defisit adalah 2 kasus dengan jumlah keseluruhan

kasus adalah 25 kasus dan kemudian diperoleh entropy total 0,4022. Lalu

dilanjutkan mencari entropy dari masing-masing atribut sebagai berikut:

1. Atribut Biaya Tenaga Kerja

Atribut biaya tenaga kerja memiliki tiga klasifikasi yaitu budget (BG),

enough (EU) dan pass (PS) dan dari data format variabel profit usaha

diketahui atribut biaya perlengkapan dengan klasifikasi budget (BG)

dan atribut biaya tenaga kerja dengan klasifikasi budget (BG) ada

sebanyak 13 kasus dengan keputusan profit terdapat 13 kasus

sedangkan dengan keputusan defisit terdapat 0 kasus. Setelah itu dari

klasifikasi enough (EU) ada sebanyak 7 kasus dengan keputusan profit

terdapat 6 kasus dan sedangkan dengan keputusan defisit terdapat 1


69

kasus. Kemudian yang terakhir dari klasifikasi pass (PS) ada sebanyak

5 kasus dengan keputusan profit terdapat 4 kasus dan sedangkan

dengan keputusan deficit terdapat 1 kasus. Demikian penjelasan

masing-masing entropy dari pernyataan tersebut.

−13 13 −0 0
Entropy ( BG )= ( 13 ( )) (
∗log 2
13
+
13 ( ))
∗log 2
13
=0

−6 6 −1 1
Entropy ( EN )= ( 7 ( )) (
∗log 2
7
+
7 ( ))
∗log 2
7
=0.5917

−4 4 −1 1
Entropy ( PS ) =( 5
∗log 2 ( )) (
5
+
5
∗log 2 ( ))
5
=1

2. Atribut Biaya Perawatan

Atribut biaya perawatan memiliki dua klasifikasi yaitu budget (BG)

dan pass (PS) dan dari data format variabel profit usaha diketahui

atribut biaya perlengkapan dengan klasifikasi budget (BG) dan atribut

biaya perawatan dengan klasifikasi budget (BG) ada sebanyak 23

kasus dengan keputusan profit terdapat 23 kasus sedangkan dengan

keputusan defisit terdapat 0 kasus. Setelah itu dari klasifikasi pass

(PS) ada sebanyak 2 kasus dengan keputusan profit terdapat 0 kasus

dan sedangkan dengan keputusan defisit terdapat 2 kasus. Demikian

penjelasan masing-masing entropy dari pernyataan tersebut.

−23 23 −0 0
Entropy ( BG )= ( 23 ( )) (
∗log 2
23
+
23 ( ))
∗log 2
23
=0

−0 0 −2 2
Entropy ( PS ) =( 2
∗log 2 ( )) (
2
+
2
∗log 2 ( ))
2
=0

3. Atribut Biaya Pajak


70

Atribut biaya pajak memiliki dua klasifikasi yaitu budget (BG) dan

pass (PS) dan dari data format variabel profit usaha diketahui atribut

biaya perlengkapan dengan klasifikasi budget (BG) dan atribut biaya

pajak dengan klasifikasi budget (BG) ada sebanyak 22 kasus dengan

keputusan profit terdapat 20 kasus sedangkan dengan keputusan

defisit terdapat 2 kasus. Setelah itu dari klasifikasi pass (PS) ada

sebanyak 3 kasus dengan keputusan profit terdapat 3 kasus dan

sedangkan dengan keputusan defisit terdapat 0 kasus. Demikian

penjelasan masing-masing entropy dari pernyataan tersebut.

−20 20 −2 2
Entropy ( BG )= ( 22 ( )) (
∗log 2
22
+
22 ( ))
∗log2
22
=0.4395

−3 3 −0 0
Entropy ( PS ) =( 3
∗log 2 ( )) (
3
+
3
∗log 2( ))
3
=0

4. Atribut Biaya Legalitas

Atribut biaya legalitas memiliki dua klasifikasi yaitu budget (BG) dan

pass (PS) dan dari data format variabel profit usaha diketahui atribut

biaya perlengkapan dengan klasifikasi budget (BG) dan atribut biaya

legalitas dengan klasifikasi budget (BG) ada sebanyak 20 kasus

dengan keputusan profit terdapat 19 kasus sedangkan dengan

keputusan defisit terdapat 1 kasus. Setelah itu dari klasifikasi pass

(PS) ada sebanyak 5 kasus dengan keputusan profit terdapat 4 kasus

dan sedangkan dengan keputusan defisit terdapat 1 kasus. Demikian

penjelasan masing-masing entropy dari pernyataan tersebut.


71

−19 19 −1 1
Entropy ( BG )= ( 20 ( )) (
∗log 2
20
+
20
∗log 2( ))
20
=1

−4 4 −1 1
Entropy ( PS ) = ( 5 ( )) (
∗log 2
5
+
5
∗log 2( ))
5
=1

Selanjutnya penulis akan menjelaskan rumus dan perhitungan dari

nilai gain pada setiap atribut dari variabel profit usaha, sebagai berikut.

1. Gain total atribut biaya tenaga kerja

Perhitungan nilai gain total atribut biaya tenaga kerja dihitung dengan

mengurangi nilai entropy total sebesar 0,4022 dengan total data pada

atribut biaya tenaga kerja dengan klasifikasi budget (BG) adalah 13

kasus, klasifikasi enough (EU) adalah 7 kasus, dan klasifikasi pass

(PS) adalah 5 kasus kemudian dikalikan dengan nilai entropy masing-

masing klasifikasi dari atribut, dalam hal ini entropy dengan

klasifikasi budget (BG) adalah 0, klasifikasi enough (EU) adalah

0,5917, dan klasifikasi pass (PS) adalah 1 dengan perhitungan gain

sebagai berikut.

13 7 5
¿ 0,4022− (( 25 )(
∗0 +
25
∗0,5917 + )(
25 ))
∗1 =0,2365

2. Gain total atribut biaya perawatan

Perhitungan nilai gain total atribut biaya perawatan dihitung dengan

mengurangi nilai entropy total sebesar 0,4022 dengan total data pada

atribut biaya perawatan dengan klasifikasi budget (BG) adalah 23

kasus dan klasifikasi pass (PS) adalah 2 kasus kemudian dikalikan

dengan nilai entropy masing-masing klasifikasi dari atribut, dalam hal


72

ini entropy dengan klasifikasi budget (BG) adalah 0 dan klasifikasi

pass (PS) adalah 0 dengan perhitungan gain sebagai berikut.

23 2
¿ 0,4022− (( 25 )(
∗0 +
25 ))
∗0 =0,4022

3. Gain total atribut biaya pajak

Perhitungan nilai gain total atribut biaya pajak dihitung dengan

mengurangi nilai entropy total sebesar 0,4022 dengan total data pada

atribut biaya pajak dengan klasifikasi budget (BG) adalah 22 kasus

dan klasifikasi pass (PS) adalah 3 kasus kemudian dikalikan dengan

nilai entropy masing-masing klasifikasi dari atribut, dalam hal ini

entropy dengan klasifikasi budget (BG) adalah 0,4395 dan klasifikasi

pass (PS) adalah 0 dengan perhitungan gain sebagai berikut.

22 3
¿ 0,4022− (( 25 )(
∗0.4395 +
25 ))
∗0 =0,0154

4. Gain total atribut biaya legalitas

Perhitungan nilai gain total atribut biaya legalitas dihitung dengan

mengurangi nilai entropy total sebesar 0,4022 dengan total data pada

atribut biaya legalitas dengan klasifikasi budget (BG) adalah 20 kasus

dan klasifikasi pass (PS) adalah 5 kasus kemudian dikalikan dengan

nilai entropy masing-masing klasifikasi dari atribut, dalam hal ini

entropy dengan klasifikasi budget (BG) adalah 1 dan klasifikasi pass

(PS) adalah 1 dengan perhitungan gain sebagai berikut.

¿ 0,4022− (( 2025∗1)++( 255 ∗1))=0,0287


73

Setelah penulis selesai menjelaskan nilai dari masing-masing

atribut yaitu nilai dari entropy dan nilai dari gain, penulis membuat

penjelasan hasil yang sudah didapatkan menggunakan tabel seperti berikut.

Tabel 4. 11 Hasil Perhitungan Manual Node 3

Entrop
 
Tingkat Profit Profit Defisit y Gain
TOTAL   25 23 2 0,4022  
             
Biaya Tenaga

Kerja            
Budget BG 13 13 0 0
Enough EU 7 6 1 0,5917 0,2365
Pass PS 5 4 1 1
    25        
Biaya

Perawatan            
Budget BG 23 23 0 0
0,4022
Pass PS 2 0 2 0
    25        
Biaya Pajak            
Budget BG 22 20 2 0,4395
0,0154
Pass PS 3 3 0 0
    25        
Biaya

Legalitas            
Budget BG 20 19 1 0
0,0287
Pass PS 5 4 1 0,7219
    25        
Sumber: (Penulis, 2020)

Dari penjelasan penulis berdasarkan tabel diatas, dapat diketahui

bahwa atribut ketersediaan memiliki nilai dengan gain tertinggi, yaitu

0,4022 dengan demikian maka penulis membuat root node pada pohon

keputusan sementara dari atribut perlengkapan sebagai berikut


74

Gambar 4.3 Pohon Keputusan Node 3

Sumber: (Penulis, 2020)

4.2.4 Keputusan Hasil Pengujian

Berdasarkan pohon keputusan pada gambar 4.3 dapat disampulkan

aturan atau rule yang dihasilkan oleh pohon keputusan akhir yaitu:

1. Melalui gambar 4.3 dan rules yang dihasilkan dapat disimpulkan

bahwa yang menjadi faktor-faktor utama untuk menentukan tingkat

profit usaha pada PT Megacipta sejati adalah biaya operasional, biaya

perlengkapan, dan biaya perawatan.

2. Jika biaya operasional pass, maka perushaan defisit.

3. Jika biaya opersional budget dan biaya perlengkapan pass maka

perusahaan defisit.
75

4. Jika biaya opersional budget, biaya perlengkapan budget, dan biaya

perlengkapan pass maka perusahaan defisit.

5. Jika biaya opersional budget, biaya perlengkapan budget, dan biaya

perawatan budget, maka perusahaan profit.

4.2.5 Pengujian Menggunakan WEKA

Setelah perhitungan manual yang dilakukan untuk menghasilkan

pohon keputusan, sangat diperlukan untuk melakukan pengujian terhadap

kebenaran hasil perhitungan untuk memastikan apakah hasil analisa

tersebut benar atau tidak. Dalam penelitian ini peneliti mengujian

kebenaran hasil perhitungan dengan menggunakan software yaitu WEKA

versi 3.8.4 dengan langkah-langkah sebagai berikut:

1. Membuat sebuah data dengan menggunakan aplikasi microsft excel berisi

data seluruh variabel-variabel yang digunakan untuk menentukan tingkat

profit usaha dan simpan dengan nama file weka.csv seperti yang dapat

dilihat pada gambar 4.4 berikut.


76

Gambar 4.4 Data Variabel Pada Aplikasi Microsoft Excel

Sumber: (Penulis, 2020)

2. Kemudian membuka file weka.csv yang berisi data seluruh variabel-

variabel yang digunakan untuk menentukan tingkat profit usaha tersebut

dengan aplikasi notepad dan mengubah tanda titik koma (;) menjadi tanda

koma (,) agar dapat terbaca dengan aplikasi WEKA seperti yang dapat

dilihat pada gambar 4.5 berikut.

Gambar 4.5 Data Variabel Pada Aplikasi Notepad

Sumber: (Penulis, 2020)

3. Selanjutnya, aktifkan atau jalankan aplikasi WEKA dengan versi 3.8.4

tersebut dengan melakukan klik dua kali pada shortcut dari WEKA.

4. Setelah aplikasi WEKA terbuka, lakukan klik sebanyak satu kali pada

pilihan menu WEKA yaitu explorer seperti kotak dialog pada gambar 4.6

berikut.
77

Gambar 4.6 Tampilan Awal Aplikasi WEKA

Sumber: (Penulis, 2020)

5. Pada WEKA explorer pilih open file, cari tempat penyimpanan file

weka.csv, kemudian ganti tipe file nya menjadi csv, lalu klik open dibagian

bawah kanan kotak dialog seperti gambar 4.7 berikut.


78

Gambar 4.7 Tampilan Pemilihan File Pengujian WEKA

Sumber: (Penulis, 2020)

6. Kemudian pilih atribut yang digunakan dalam penelitian seperti pada

penjelasan gambar 4.8 berikut.


79

Gambar 4.8 Tampilan Pemilihan Atribut Pengujian WEKA

Sumber: (Penulis, 2020)

7. Kemudian berpindah ke Tab Classify lalu klik choose seperti yang terlihat

pada penjelasan gambar 4.9 berikut.

Gambar 4.9 Tampilan Tab Menu Classify

Sumber: (Penulis, 2020)

8. Kemudian pilih dan klik trees pada tab menu classify kemudian pilih dan

klik menu J48 seperti pada penjelasan gambar 4.10 berikut.


80

Gambar 4.10 Tampilan Pemilihan Classifier

Sumber: (Penulis, 2020)

9. Klik menu start lalu akan muncul output dibagian kanan yang merupakan

hasil pengujian WEKA. Informasi yang dimunculkan oleh classify output

adalah jumlah kasus dan keputusannya dan banyak cabang dari pohon

keputusan seperti penjelasan pada gambar 4.11 berikut.


81

Gambar 4.11 Tampilan Output Classifer

Sumber: (Penulis, 2020)

10. Langkah terakhir untuk melihat hasil pohon keputusan dilakukan dengan

cara klik kanan pada result list dan kemudian pilih dan klik visualize tree

seperti penjelasan gambar 4.12 berikut.


82

Gambar 4.12 Tampilan Visualisasi Pohon

Sumber: (Penulis, 2020)

11. Dan demikian tampilan akhir dari pohon keputusan menggunakan aplikasi

WEKA seperti pada gambar berikut.


83

Gambar 4.13 Tampilan Hasil Pengujian WEKA

Sumber: (Penulis, 2020)

Dari pohon keputusan menggunakan aplikasi Weka, maka penulis akan

menjelaskan mengenai aturan yang dihasilkan sebagai berikut.

1. IF Biaya Operasional = Pass, THEN Keputusan = Defisit

2. IF Biaya Opersional = Budget AND Biaya Perlengkapan = Pass,

THEN Keputusan = Defisit

3. IF Biaya Operasional = Budget AND Biaya Perlengkapan = Budget

AND Biaya Perawatan = Pass, THEN Keputusan = Defisit

4. IF Biaya Operasional = Budget AND Biaya Perlengkapan = Budget

AND Biaya Perawatan = Budget, THEN Keputusan = Profit


BAB V
SIMPULAN DAN SARAN

Berdasarkan penelitian yang dilakukan pada PT. Megacipta Sejati

tentang menentukan tingkat profit usaha dengan algoritma C4.5 serta

ditambah lagi dengan memperhitungkan beberapa atribut seperti biaya

tenaga kerja, biaya operasional, biaya perlengkapan, biaya perawatan,

biaya pajak, dan biaya legalitas. Maka dapat dirumuskan beberapa

kesimpulan dan saran yang antara lain adalah sebagai berikut.

5.1 Simpulan

Berdasarkan dengan hasil analisa mengenai tingkat profit usaha

setelah melakukan pembahasan, perhitungan dan pengujian baik

perhitungan secara manual menggunakan pohon keputusan yang telah

dilakukan pada bab-bab sebelumnya dengan menggunakan teknik

datamining dan metode klasifikasi yaitu algoritma C4.5 dan pengujian

menggunakan software WEKA 3.8.4 didalam penelitian ini dalam hal

menentukan tingkat profit usaha adalah sukses (berhasil) hal ini dapat

dibuktikan dengan terbentuknya beberapa jalur keputusan yang dapat

diambil yang antara lain adalah sebagai berikut:

1. Teknik datamining dengan klasifikasi menggunakan jenis algoritma C4.5

untuk menentukan tingkat profit usaha menggunakan data yang berasal

84
dari data transaksi sewa PT. Megacipta Sejati dapat menemukan rules atau

aturan

85
86

keputusan untuk digunakan sebagai acuan atau standar dalam menentukan

tingkat profit usaha. Rules yang dihasilkan adalah:

a. Jika biaya operasional melebihi anggaran yang telah ditetapkan

(pass), maka perusahaan akan mengalami kerugian (defisit).

b. Jika biaya opersional masih dibawah anggaran yang telah

ditetapkan (budget) dan biaya perlengkapan melebihi anggaran

yang telah ditetapkan (pass) maka perusahaan akan mengalami

kerugian (defisit).

c. Jika biaya opersional masih dibawah anggaran yang telah

ditetapkan (budget) dan biaya perlengkapan masih dibawah

anggaran yang telah ditetapkan (budget) tetapi biaya perlengkapan

melebihi anggaran yang telah ditetapkan (pass) maka perusahaan

akan mengalami kerugian (defisit).

d. Jika biaya opersional masih dibawah anggaran yang telah

ditetapkan (budget), biaya perlengkapan masih dibawah anggaran

yang telah ditetapkan (budget), dan biaya perlengkapan masih

dibawah anggaran yang telah ditetapkan (budget), maka

perusahaan akan mengalami keuntungan (profit).

2. Pohon keputusan yang dihasilkan oleh perhitungan algoritma C4.5

menunujukkan bahwa variabel yang memiliki gain tertinggi atau yang

merupakan faktor utama yang mempengaruhi tingkat profit usaha adalah

biaya operasional, biaya perlengkapan, dan biaya perawatan. Setelahnya,

pengujian menggunakan software WEKA 3.8.4 juga menghasilkan hasil


87

yang sama yaitu variabel yang menjadi faktor utama yang mempengaruhi

tingkat profit usaha adalah biaya operasional, biaya perlengkapan, dan

biaya perawatan.

5.2 Saran

Dikarenakan oleh keterbatasan peneliti dalam pengetahuan, waktu

ataupun pemikiran, peneliti sadar bahwa penelitian ini masih bisa

dikembangkan sehingga, peneliti memberikan beberapa saran yang dapat

digunakan untuk menentukan tingkat profit usaha dimasa yang akan

datang. Berikut adalah beberapa saran yang peneliti anggap perlu sebagai

berikut:

1. Untuk survei waktu penelitian dapat dilakukan dengan rentang

waktu yang cukup lama sehingga data yang dijadikan sebagai

obyek penelitian lebih banyak dan bervariasi dan hasil penelitian

yang diharapkan lebih baik dan baik lagi.

2. Dari segi jumlah data yang akan diolah berbanding lurus dengan

waktu survei artinya waktu survei lebih lama maka data yang

diambil akan lebih banyak sehingga hasil penelitian lebih

maksimal.

3. Jumlah atribut yang dipakai untuk menguji data hendaknya

ditambah sehingga hasil atau jalur keputusan yang dihasilkan lebih

variatif dan banyak manampilkan keputusan yang dapat diambil,

sehingga hasil akhir keputusan lebih baik


88

4. Penelitian ini menggunakan Data Mining dengan Teknik

klasifikasi menggunakan algoritma C.45, hendaknya diperkaya lagi

dengan Algortima-algoritma yang lain (masih dalam cakupan data

mining) seperti naïve bayes sehingga proses yang dilakukan lebih

kaya lagi dan menambah wawasan pembaca atau peneliti dimasa

yang akan datang. Hal ini jelas akan memperkaya ranah keilmuan

dibidang Data Mining.


DAFTAR PUSTAKA

Augusto, T., & Char, A. S. (2014). Performance improvement of datamining in

Weka through GPU acceleration, 32, 93–100.

Azwanti, N. (2018). Algoritma C4.5 untuk Memprediksi Mahasiswa yang

Mengulang Mata Kuliah (studi kasus di AMIK Labuhan Batu), 9(1), 11–

22.

Azwanti, N. (2018). Analisa Algoritma C4 . 5 untuk Memprediksi Penjualan

Motor Pada PT. Capella Dinamik Nusantara, 13(1), 33–38.

Chauhan, H., & Chauhan, A. (2013). Implementation of decision tree algorithm

c4. 5. International Journal of Scientific and Research Publications, 3(10),

4–6.

Chen, W., Zhang, S., Li, R., & Shahabi, H. (2018). Science of the Total

Environment Performance evaluation of the GIS-based datamining

techniques of best- fi rst decision tree , random forest , and naïve Bayes

tree for landslide susceptibility modeling. Science of the Total

Environment, 644, 1006–1018.

Elisa, E. (2017). Analisa dan Penerapan Algoritma C4 . 5 Dalam Datamining

Untuk Mengidentifikasi Faktor-Faktor Penyebab Kecelakaan Kerja

Kontruksi PT . Arupadhatu Adisesanti, 2(1), 36–41.

89
Elisa, E. (2018). Prediksi Profit Pada Perusahaan Dengan Klasifikasi Algoritma

C4.5, 05(02), 179–189.

90
91

Faradillah, S. (2013). Implementasi Data Mining Untuk Pengenalan Karakteristik

Transaksi Customer Dengan, 63–70.

Fitria Harahap. 2015. Penerapan Data Mining dalam Memprediksi Pembelian cat.

Konferensi Nasional Sistem & Informatika 2015. Bali: STMIK STIKOM.

Gamarra, C., Guerrero, J. M., & Montero, E. (2016). A knowledge discovery in

databases approach for industrial microgrid planning. Renewable and

Sustainable Energy Reviews, 60, 615–630.

Gunadi Goldie.dkk. 2012. Penerapan Metode Data Mining Market Basket

Analysis Terhadap Data Penjualan Produk Buku Dengan Menggunakan

Algoritma Apriori dan Frequent Pattern Growth (FP-Growth) Studi Kasus

Percetakan PT. Gramedia. Jurnal Telematika..Volume 4. Hal 118 – 132.

Harman, R. (2018). Penerapan Algoritma C4.5 untuk Memprediksi Indikator

Website yang Baik, 6, 9.

Haryati, S., Sudarsono, A., & Suryana, E. (2015). Implementasi Datamining

Untuk Memprediksi Masa Studi Mahasiswa menggunakan Algoritma C4 .

5, 11(2), 130–138.

Jamhur, A. I. (2016). Penerapan Datamining untuk Menganalisa Jumlah

Pelanggan Aktif dengan Menggunakan Algoritma C4.5, 23(2), 12–20.

Kamagi, D. H., & Hansun, S. (2014). Implementasi Datamining dengan

Algoritma C4 . 5 untuk Memprediksi Tingkat Kelulusan Mahasiswa,

VI(1), 15–20.
92

Khasanah, S. N. (2017). Penerapan algortima c4.5 untuk penentuan kelayakan

kredit, XIV(1), 9–14.

Lestari, S., & Suryadi, A. (2014). Model Klasifikasi Kinerja Dan Seleksi dosen

Berprestasi Dengan. Proseding Seminar Bisnis & Teknologi, 15–16.

Lorena, S., Zarman, W., & Hamidah, I. (2014). Analisis Dan Penerapan

Algoritma C4.5 Dalam Datamining Untuk Memprediksi Masa Studi

Mahasiswa Berdasarkan Data Nilai Akademik. Prosiding Seminar

Nasional Aplikasi Sains Dan Teknologi (SNAST), (November), 263–272.

Lusinia, Armonitha. 2014. Algoritma C4.5 Dalam Menganalisa Kelayakan Kredit

(Studi Kasus di Koperasi Pegawai Republik Indonesia Lengayang Pesisir

Selatan, Painan, Sumatera Barat). Jurnal KomTekInfo. Vol 1. No 2. Hal 6-

10.

Mardi, Y. (2017). Jurnal Edik Informatika Data Mining : Klasifikasi

MenggunakaN Algoritma C4 . 5 Datamining merupakan bagian dari

tahapan proses Knowledge Discovery in Database ( KDD ) . Jurnal Edik

Informatika.

Meythi dan Selvy Hartono. 2012. Pengaruh Informasi Laba dan Arus Kas

Terhadap Harga Saham. Jurnal Akuntansi. 57– 59.

Pambudi, R. H., Setiawan, B. D., & Indriati. (2018). Penerapan Algoritma C4 . 5

Untuk Memprediksi Nilai Kelulusan Siswa Sekolah Menengah

Berdasarkan Faktor Eksternal, 2(7), 2637–2643.


93

Rahman, M. A. (2015). Algoritma C45 untuk Menentukan Mahasiswa Penerima

Beasiswa (Studi Kasus : PPS IAIN Raden Intan Bandar Lampung), 01(02),

118–128.

Rifqo, muhammad husni, & Arzi, T. (2016). Implementasi Algoritma C4.5 Untuk

Menentukan Calon Debitur dengan Mengukur Tingkat Risiko Kredit Bank

BRI Cabang Curup, 8.

Rismayanti. (2016). Implementasi algoritma c4.5 untuk menentukan penerima

beasiswa di stt harapan medan, 12(2), 116–120.

Santoso, teguh budi. (2014). Analisa dan penerapan metode C4.5 untuk prediksi

loyalitas pelanggan, 10(1).

Song, Y., & Lu, Y. (2015). Decision tree methods : applications for classification

and prediction, 27(2), 130–135.

Subekti Mujiasih. 2011. Pemanfaatan Data Mining untuk Prakiraan Cuaca.

Volume 12. 189 – 195.

Sulastri, H., & Gufroni, A. irham. (2017). Penerapan Datamining Dalam

Pengelompokkan Penderita Thalassaemia, 02, 299–305.

Wira, D., & Putra, T. (2016). Algoritma c4.5 untuk menentukan tingkat kelayakan

motor bekas yang akan dijual, 4(1), 7.

Zaman, K. (2016). Penerapan Datamining Menggunakan Algoritma C4 . 5 Untuk

Menentukan Kelayakan Penerima Bantuan Rehabilitas Sosial Rumah


94

Tidak Layak Huni ( Studi Kasus di Pemerintahan Kabupaten Solok

Selatan), 3(2), 12–24.

Zulkifli, A. (2016). Metode C45 Untuk Mengklarifikasi Pelanggan Perusahaan

Telekomunikasi Seluler, 2(1), 65–76.

Anda mungkin juga menyukai