5 UNTUK
MENENTUKAN TINGKAT PROFIT USAHA PADA PT
MEGACIPTA SEJATI
SKRIPSI
Oleh:
Harina
161510006
SKRIPSI
Oleh:
Harina
161510006
Analisis Algoritma C4.5 Untuk Menentukan Tingkat Profit Usaha Pada PT Megacipta Sejati
Adalah hasil karya sendiri dan bukan “duplikasi” dari karya orang lain.
Sepengetahuan saya, didalam naskah Skripsi ini tidak terdapat karya
ilmiah atau pendapat yang pernah ditulis atau diterbitkan oleh orang lain, kecuali
yang secara tertulis dikutip didalam naskah ini dan disebutkan dalam sumber
kutipan dan daftar pustaka.
Apabila ternyata di dalam naskah Skripsi ini dapat dibuktikan
digugurkan dan gelar akademik yang saya peroleh dibatalkan, serta diproses
Materai 6000
Harina
161510006
ANALISIS ALGORITMA C4.5 UNTUK
MENENTUKAN TINGKAT PROFIT USAHA PADA PT
MEGACIPTA SEJATI
Oleh
Harina
161510006
SKRIPSI
v
ABSTRACT
vi
KATA PENGANTAR
Dengan mengucapkan puji dan syukur kepada Tuhan yang Maha Esa yang
telah melimpahkan segala rahmat dan karunianya, sehingga penulis dapat
menyelesaikan skripsi yang merupakan salah satu persyaratan untuk
menyelesaikan program studi strata satu (S1) pada Program Studi Sistem
Informasi Universitas Putera Batam.
Penulis menyadari bahwa skripsi ini masih jauh dari sempurna. Karena itu,
kritik dan saran akan senantiasa penulis terima dengan senang hati.
Dengan segala keterbatasan, penulis menyadari pula bahwa skripsi ini
takkan terwujud tanpa bantuan, bimbingan, dan dorongan dari berbagai pihak.
Untuk itu, dengan segala kerendahan hati, penulis menyampaikan ucapan terima
kasih kepada:
1. Ibu Dr. Nur Elfi Husda, S.Kom., M.SI, selaku Rektor Universitas Putera
Batam.
2. Bapak Welly Sugianto, S.T., M.M, selaku Dekan Fakultas Teknik Dan
Komputer Universitas Putera Batam.
3. Bapak Muhammad Rasyid Ridho, S.Kom., M.SI., selaku Ketua Program
Studi Sistem Informasi Universitas Putera Batam.
4. Bapak Rika Harman, S.Kom., M.SI., sebagai pembimbing skripsi yang
telah menyediakan waktu dalam memberikan bimbingan dan petunjuk
sampai selesainya skripsi ini.
5. Seluruh dosen dan staff Universitas Putera Batam.
6. Dan pihak-pihak yang telah memberikan dukungannya hingga tersusunnya
penelitian ini yang tidak dapat disebutkan oleh penulis satu persatu.
Penulis
vii
DAFTAR ISI
Halaman
HALAMAN SAMPUL
HALAMAN JUDUL
HALAMAN PERNYATAAN ORISINALITAS
HALAMAN PENGESAHAN
ABSTRAK...............................................................................................................v
ABSTRACT..............................................................................................................vi
KATA PENGANTAR...........................................................................................vii
DAFTAR ISI........................................................................................................ viii
DAFTAR GAMBAR...............................................................................................x
DAFTAR TABEL...................................................................................................xi
DAFTAR RUMUS................................................................................................xii
BAB I PENDAHULUAN
Pembatasan Masalah
TINJAUAN PUSTAKA
Teori Khusus
Profit
Waikato Environment for Knowlwdge Analysis (WEKA)
Hipotesis Penelitian
Penelitian Terdahulu
METODE PENELITIAN
Desain Penelitian
Objek Penelitian
Lokasi Penelitian
Jadwal Penelitian
Populasi dan Sampel
Populasi
Sampel
Variabel Penelitian
Teknik Pengumpulan Data
Model Penelitian
Hasil
Pembahasan
Melakukan Pra Proses Data Penelitian
Analisa Data
Pembersihan Data
Seleksi Data
Transformasi Data
Pohon Keputusan
viii
Keputusan Hasil Pengujian
Pengujian Menggunakan WEKA
LAMPIRAN
ix
DAFTAR GAMBAR
Halaman
Gambar 1.1 Data Penghuni 3
Gambar 2.1 Pengelompokan Teknik Klasifikasi 17
Gambar 2.2 Pohon Keputusan Identifikasi 19
Gambar 2.3 Tampilan Utama WEKA 25
Gambar 2.4 Kerangka Berpikir 28
Gambar 3.1 Desain Penelitian 31
Gambar 4.1 Pohon Keputusan Node 1 58
Gambar 4.2 Pohon Keputusan Node 2 67
Gambar 4.3 Pohon Keputusan Node 3 74
Gambar 4.4 Data Variabel Pada Aplikasi Microsoft Excel 76
Gambar 4.5 Data Variabel Pada Aplikasi Notepad 77
Gambar 4.6 Tampilan Awal Aplikasi WEKA 78
Gambar 4.7 Tampilan Pemilihan File Pengujian WEKA 79
Gambar 4.8 Tampilan Pemilihan Atribut Pengujian WEKA 80
Gambar 4.9 Tampilan Tab Menu Classify 80
Gambar 4.10 Tampilan Pemilihan Classifier 81
Gambar 4.11 Tampilan Pemilihan Classifer 82
Gambar 4.12 Tampilan Visualisasi Pohon 83
Gambar 4.13 Tampilan Hasil Pengujian WEKA 83
x
DAFTAR TABEL
Halaman
Tabel 3.1 Jadwal Penelitian 33
Tabel 4.1 Format Pra Proses Data Profit Usaha 41
Tabel 4.2 Biaya Tenaga Kerja 44
Tabel 4.3 Biaya Operasional 45
Tabel 4.4 Biaya Perlengkapan 45
Tabel 4.5 Biaya Perawatan 45
Tabel 4.6 Biaya Pajak 46
Tabel 4.7 Biaya Legalitas 46
Tabel 4.8 Format Data Akhir Profit Usaha 47
Tabel 4.9 Hasil Perhitungan Manual Node 1 56
Tabel 4.10 Hasil Perhitungan Manual Node 2 65
Tabel 4.11 Hasil Perhitungan Manual Node 3 73
xi
DAFTAR RUMUS
Halaman
Rumus 2.1 Perhitungan Gain 20
Rumus 2.2 Rumus Perhitungan Entropy 21
xii
BAB I
PENDAHULUAN
saat ini banyak menarik perhatian masyarakat luas. Demikian pula pada
tahunnya.
banyak kawasan industri, ini menjadi perhatian banyak orang yang berada
diluar kota batam untuk datang mencari pekerjaan dikota ini. Banyak
orang yang datang dari kota yang jauh dan banyak juga orang yang
1
batam sehingga tidak memiliki tempat tinggal membuat banyak
2
3
tempat tinggal seperti asrama untuk para pekerja. Definisi Asrama adalah
Para penghuni menginap di asrama untuk jangka waktu yang lebih lama
dari pada di hotel atau losmen. Alasan untuk memilih menghuni sebuah
asrama bisa berupa tempat tinggal asal yang terlalu jauh, maupun untuk
yang terbagi atas kamar tidur dan meja belajar bagi penghuninya.
mess yaitu kamar yang dibangun untuk tempat tinggal karyawan dan
memiliki tempat tidur yang banyak agar dapat menampung orang yang
jangka waktu yang cukup lama atau selama masih menjadi karyawan
tempat tinggal seperti asrama untuk para pekerjanya sejak tahun 2012
300
250
222
200
150
100
50
0
Januari Februari Maret April
0)
5
cukup besar yaitu sekitar 140 penghuni namun dapat disimpulkan dalam
tahun 2020 sejak bulan Januari hingga bulan April PT Megacipta Sejati
2020.
(pengetahuan baru) yang menjadi sesuatu yang berharga dan berguna bagi
aturan tertentu dari sejumlah data dalam jumlah besar yang diharapkan
metode, dan decision tree adalah bagian dari metode klasifikasi. Kemudian
metode decision tree memiliki algoritma, algoritma C4.5 adalah salah satu
data mining merupakan proses analisa data untuk menemukan suatu pola
dari kumpulan data tersebut. Data mining mampu menganalisa data yang
besar menjadi informasi berupa pola yang mempunyai arti bagi pendukung
1. Tidak adanya teknik atau cara yang digunakan oleh perusahan untuk
2. Tidak adanya acuan atau standar yang resmi yang dibuat oleh perusahaan
pengambilan keputusan.
pada PT Megacipta.
Megacipta.
usaha.
1. Bagi Mahasiswa
2. Bagi Peneliti
3. Bagi Perushaan
dalam hal menentukan profit usaha, yang selama ini sangat sulit untuk
2.1 Teori
penelitian ini, adapun teori yang dimaksud terdiri atas dua teori besar yaitu teori
proposal penelitian ini, teori umum ini dimaksudkan untuk memperkuat isi
dari teori yang ada hal ini dimaksudkan supaya penelitian yang dilakukan
hasilnya lebih baik. Adapun isi dari teori umum tersebut dapat dijelaskan
sebagai berikut:
pola-pola yang terdapat didalam tumpukkan data yang sangat besar dan kompleks,
yang mana pola tersebut mempunyai spesifikasi seperti bersifat sah, baru dan
dengan data tersebut Maimon & Rokach (2010). Menurut pendapat Ramamahon
yang mengacu kepada proses penemuan data dengan jalan digali atau ditambang
dari tumpukkan
11
12
data dalam jumlah yang sangat besar sehingga dapt ditemukan pengetahuan dari
dalam data tersebut dalam jumlah yang sangat besar. Jadi berdasarkan dari kedua
informasi atau pengetahuan dari kumpulan data yang sangat besar (database)
Mining adalah proses pemisahan informasi dari kumpulan data yang sangat besar
melalui pemamfaatan algoritma dan teknik tertentu yang melibatkan bidang teknik
pengetahuan penting yang tersembunyi dari dataset yang besar. Dengan adanya
Data Mining, maka akan dimungkinkan untuk mendapatkan harta berharga berupa
pengetahuan didalam kumpulan data. Kumpulan data ini biasanya oleh organisasi
oleh perusahaan sering diabaikan atau dianggap tidak berguna, padahal jika
dikelola dengan baik dan benar dapat menjadi data yang sangat penting bagi
sebagai proses kegiatan dalam hal penemuan pola yang menarik dari data yang
oleh organisasi atau perusahaan. Pada dasarnya pola yang didapat adalah pola
yang menarik, sangat berharga dan sangat penting dalam memberikan nilai
tambah atau keuntungan kepada pemilik data dalam hal ini adalah pemilik
13
perusahaan atau organisasi. Perdapat yang mirip diungkapkan juga oleh Geetha
dan Manimekalai (2013) bahwa Data mining adalah proses yang menggunakan
berbagai alat analis data untuk menemukan pola dan hubungan dalam data yang
berharga dari sekumpulan data yang dapat digunakan untuk membuat prediksi
yang valid pada berbagai bidang, baik sosial, ekonomi, pendidikan, budaya
dalam Gunadi (2008) Data Mining adalah proses ekstraksi informasi dari
kumpulan data melalui penggunaan algoritma dan teknik yang melibatkan bidang
pengetahuan penting yang tersembunyi dari dataset yang besar. Dengan adanya
Data Mining, maka akan dimungkinkan untuk mendapatkan harta berharga berupa
Mining sebagai kegiatan menemukan pola yang menarik dari data yang
kepada pemilik data. Perdapat yang mirip diungkapkan juga oleh Geetha
hubungan dalam data yang dapat digunakan untuk membuat prediksi yang
untuk membuat prediksi yang valid pada berbagai bidang, baik sosial,
konteks ini data mining merupakan satu langkah dari proses KDD (Eska
J., 2016).
and Renaldi F., 2016)”. Data mining juga didefinisikan sebagai sebuah
15
proses untuk menemukan hubungan, pola dan tren baru yang bermakna
Statistik dan Matematika. Data mining bukanlah suatu bidang yang sama
kenyataan bahwa data mining mewarisi banyak aspek dan teknik dari
penting dari data dalam suatu basis data. Teknik data mining yang
sequential mining.
adalah:
1. Deskripsi
2. Estimasi
17
3. Prediksi
4. Klasifikasi
5. Pengklasteran
6. Asosiasi
2.1.1.4 Klasifikasi
atribut set dan kelas input data (Patil, 2014). Setiap teknik juga memiliki
paling optimal jika diklasifikasi dengan teknik tertentu, atau dengan kata
yaitu proses belajar dari data pelatihan dan klasifikasi kasus baru. Pada
menghasilkan sebuah model. Setelah model diuji dan dapat diterima, pada
dalam (Piko, 2011). Kelas yang dapat diperdiksi adalah kelas – kelas yang
sudah terdefinisi pada data pelatihan. Karena proses klasifikasi kasus baru
Metode ini merupakan salah satu metode yang ada pada teknik
aturan. Aturan dapat dengan mudah dipahami dengan bahasa alami. Dan
mereka juga dapat diekpresikan dalam bentuk bahasa basis data seperti
(Utari, 2015).
atribut dan daun merepresentasikan kelas. Node yang paling atas dari pohon
yang paling populer digunakan. Selain karena pembangunannya relatif cepat, hasil
dari model yang dibangun mudah untuk dipahami (Sijabat, 2015). Data dalam
pohon keputusan biasanya dinyatakan dalam bentuk tabel dengan atribut dan
record. Atribut menyatakan suatu parameter yang disebut sebagai kriteria dalam
20
Contoh dari pohon keputusan dapat dilihat di Gambar 2.3 yang merupakan
salah satu kelompok yang potensial membeli komputer adalah orang yang berusia
resiko dan nilai suatu informasi yang terdapat dalam suatu alternatif
metode untuk membuat pohon keputusan berdasarkan data yang ada. Ide
n
|Si|
Gain ( S , A )=Entropy ( S )−∑ ∗Entropy (Si)
i=1 |S|
Dimana:
S : himpunan kasus
A : atribut
berikut.
n
Entropy ( S ) =∑ − pi∗log 2 pi
i=1
Dimana :
S: himpunan kasus
A : fitur
N : jumlah partisi S
23
Pengujian hasil perhitungan gain dan entropy ini dapat diuji melalui
penelitian (Rifqo & Arzi, 2016), secara umum algoritma C4.5 untuk
tertentu.
2. Buat cabang untuk tiap-tiap nilai, adalah membuat struktur cabang dari
4. Ulangi proses untuk setiap cabang sampai kasus pada cabang memiliki
kelas yang sama, adalah melakukan proses pengulangan yang ada pada
2.1.2.1 Profit
penghasilan yang diperoleh oleh perusahaan di satu pihak, dan biaya yang
harus ditanggung atau dikeluarkan oleh pihak lain. Untung atau laba
Sedangkan profit bersih atau laba bersih merupakan laba dari bisnis
2. Biaya Peralatan
4. Biaya Mobilisasi
Variabel yang akan menjadi keputusan adalah BAIK dan TIDAK BAIK.
algoritma data mining (Aksenova, 2004: 2). WEKA adalah sebuah koleksi
dari kode Java sendiri. WEKA berisi alat-alat untuk data pra-pengolahan
dan membandingkan kinerja dari mereka dan dipilih salah satu untuk
properti atau editor objek. Sebuah modul evaluasi umum digunakan untuk
1. Explore
untuk dataset.
dan evaluasinya.
2. Experimenter
3. Knowledge Flow
fungsi dasar yang sama seperti explore tetapi dengan antarmuka drag
knowledge flow ini pengguna dapat melihat tata letak sebuah kinerja
4. Simple CLI
perintah langsung eksekusi dari WEKA untuk sistem operasi yang tidak
fungsi dasar yang dapat diakses secara langsung pada tampilan garis
perintah. Garis perintah terdapat pada simple CLI, pada tampilan utama
(ARFF), yang dapat dibaca dari sebuah file atau dihasilkan oleh
Pada sub bab ini akan diuraikan kerangka berfikir penelitian, yang
sebagai berikut:
30
PT Megacipta Sejati.
31
adalah agar penelitian yang dilakukan mendapatkan hasil yang optimal dan valid.
dengan metode algoritma C4.5 sangat mudah dan cepat. Algoritma ini
lebih cocok untuk data sets yang mengandung tidak terlalu banyak
data.
6. Chen, Zhang, Li, & Shahabi, (2018) penelitian yang berjudul “Perfomance
decision tree, random forest, and naive bayes tree for landslide
maupun if-then.
BAB III
METODE PENELITIAN
dalam penelitian.
34
35
penelitian.
Pada sub bab ini penulis menjelaskan keterangan lokasi penelitian dan
perusahaan yang sewa dormitory yang ada di Kota Batam dengan alamat
Kepulauan Riau.
dilakukan
berikut :
Bulan
No Maret April Mei Juni Juli
Kegiatan
. 2020 2020 2020 2020 2020
1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4
1. Penentuan
Judul
2. Bimbingan
3. Identifikasi
Masalah
4. Studi
37
Literatur
5. Pengumpula
n Data
6. Pengolahan
Data
7. Pengujian
Hasil
8. Penyusunan
Laporan
Sumber: Hasil Penelitian (2020)
3.3.1 Populasi
3.3.2 Sampel
atau sifat dari nilai. Untuk menganalisis data dalam sebuah penelitian
memerlukan variabel variabel, data yang akan diolah adalah data profit
usaha yang sedang berjalan dengan variabel penilaian tingkat profit usaha
sebagai berikut:
Biaya yang dikeluarkan untuk membayar para pekerja dan pegawai yang
2. Biaya Operasional
pendapatan,
3. Biaya Perlengkapan
4. Biaya Administrasi
Biaya yang dikeluarkan untuk membayar semua biaya bank dan pajak
5. Biaya Perawatan
Biaya yang dikeluarkan perusahaan untuk merawat aset serta sistem dalam
masa operasinya
39
6. Biaya Legalitas
Biaya yang dikeluarkan perusahaan untuk membayar biaya surat izin dan
telah dilakukan data yang didapat dari studi literatur ini akan
2. Teknik Observasi
dormitory mulai dari bulan Januari 2020 sampai April 2020 dari PT
Megacipta Sejati.
3. Teknik Dokumentasi
dokumen dari dormitory mulai dari bulan Januari 2020 – April 2020
4. Teknik Wawancara
40
C4.5 dalam metode penelitian ini data yang akan di klasifikasi sesuai
bisa dapatkan hasil nilai gain dan entropy untuk membentuk suatu pohon
kali sehingga bisa dapatkan node pada pohon keputusan sehingga tidak
4.1 Hasil
Pada sub bab ini akan dijelaskan mengenai hasil penelitian yang
dilakukan dimana dari pengujian yang telah dikerjakan maka didapat hasil
akan dipengaruhi oleh tiga faktor utama yaitu biaya operasional, biaya
2. Jika dilihat dari biaya operasional maka dari 50 data transaksi sewa
anggaran yang telah ditetapkan (pass) dalam hal ini diwakili oleh 19
data dari 50 data yang ada maka dapat dikategorikan perusahaan ini
telah ditetapkan (pass) dalam hal ini diwakili oleh 6 data dari 32 data
yang ada maka dapat dikategorikan juga perushaan ini akan mengalami
anggaran/tidak
41
42
ditetapkan (pass) dalam hal ini diwakili oleh 2 data dari 25 data yang
(budget).
(pass).
4.2 Pembahasan
penelitian ini adalah melakukan semacam pembelajaran kembali dari data yang
sudah ada dan seterusnya pembelajaran langsung kepada obyek penelitian dalam
hal ini adalah PT. Megacipta Sejati. Disini akan dilakukan wawancara terhadap
pegawai yang ada (pegawai aktif pada PT. Megacipta Sejati). Adapun tujuan dari
proses wawancara ini adalah sebagai dasar dalam penyusunan kembali data
penelitian baru artinya akan terjadi semacam proses pencocokan data dan akan
dilihat kembali apakah data yang ada ini masih sesuai antara fakta dengan data
yang ada dilapangan. Perlu diketahui juga proses ini harus dilakukan untuk
memastikan data yang ada harus valid dan juga harus dijamin kebenarannya
44
Selanjutnya data tersebut akan diolah kembali menyesuaikan dengan data dari PT.
Megacipta Sejati yang berisikan tentang data profit usaha yang profit atau untung,
dan begitu juga sebaliknya. Adapun kirteria dari data yang akan diolah
Entropy dan Gain untuk menentukan akar (root) dari pohon keputusan, sampai
Megacipta Sejati pada periode Maret 2020 sampai dengan Mei 2020 yang
data.
ini:
ini:
3. Biaya Perlengkapan
ini:
4. Biaya Perawatan
ini:
5. Biaya Pajak
ini:
6. Biaya Legalitas
ini:
25 BG PS PS BG PS BG Defisit
26 BG BG PS PS BG BG Defisit
27 EU PS PS BG BG PS Defisit
28 PS PS PS BG PS BG Defisit
29 EU BG BG BG BG PS Profit
30 EU PS BG BG BG BG Defisit
31 BG PS BG BG BG BG Defisit
32 BG BG BG BG PS BG Profit
33 EU PS PS BG BG BG Defisit
34 EU BG BG BG BG PS Profit
35 BG BG BG BG BG BG Profit
36 PS BG PS BG BG BG Defisit
37 EU PS PS BG PS BG Defisit
38 BG PS BG BG BG BG Defisit
39 EU PS PS PS BG PS Defisit
40 EU PS PS PS BG PS Defisit
41 EU BG BG BG BG PS Profit
42 BG BG BG BG PS BG Profit
43 EU BG BG BG PS BG Profit
44 EU BG BG BG BG BG Profit
45 BG PS PS BG PS BG Defisit
46 EU BG PS BG BG BG Defisit
47 BG BG BG BG BG BG Profit
48 BG BG BG BG PS BG Profit
49 EU BG BG BG PS BG Profit
50 EU BG BG BG BG BG Profit
Sumber: (Penulis, 2020)
Pada Format data akhir pada tabel didapat berdasarkan dari atribut yang
kan menjadi 3 (tiga) bagian yaitu "Budget" apabila biaya dibawah dari anggaran,
"enough" apabila biaya sesuai dengan anggaran, “Past" apabila biaya melewati
Dari format data akhir profit usaha diatas, maka dilakukan klasifikasi data
profit usaha berdasarkan atribut yang ada yaitu biaya tenaga kerja, biaya
legalitas. Untuk memilih atribut sebagai root node, didasarkan pada nilai gain
internal node dan leaf node hingga tidak bisa diturunkan lagi. Adapun
perhitungan secara manual. Dari data pada tabel variabel profit usaha akan
sebagai berikut.
−23 23 −27 27
Entropy ( total )= ( 50 ( )) (
∗log 2
50
+
50 ( ))
∗log 2
50
=0.9954
Data yang menyatakan profit adalah 23 kasus dan defisit adalah 27 kasus.
Dengan jumlah keseluruhan kasus adalah 50 data. Diperoleh entropy total 0,9954.
Atribut biaya tenaga kerja memiliki tiga klasifikasi yaitu budget (BG),
enough (EU) dan pass (PS) dan dari data format variabel profit usaha
yang terakhir dari klasifikasi pass (PS) ada sebanyak 12 kasus dengan
−13 13 −11 11
Entropy ( BG )= ( 24 ( )) (
∗log 2
24
+
24 ( ))
∗log 2
24
=0.9950
−6 6 −8 8
Entropy ( EN )= ( 14 ( )) (
∗log 2
14
+
14 ( ))
∗log 2
14
=0.9852
−4 4 −8 8
Entropy ( PS ) = ( 12 ( )) (
∗log 2
12
+
12 ( ))
∗log 2
12
=1
dan pass (PS) dan dari data format variabel profit usaha diketahui nilai
kasus. Setelah itu dari klasifikasi pass (PS) ada sebanyak 19 kasus
−23 23 −8 8
Entropy ( BG )= ( 31 ( )) (
∗log 2
31
+
31 ( ))
∗log 2
31
=0.8238
−0 0 −19 19
Entropy ( PS ) = ( 19 ( )) (
∗log 2
19
+
19 ( ))
∗log 2
19
=0
53
dan pass (PS) dan dari data format variabel profit usaha diketahui nilai
10 kasus. Setelah itu dari klasifikasi pass (PS) ada sebanyak 17 kasus
−23 23 −10 10
Entropy ( BG )= ( 33 ( )) (
∗log 2
33
+
33 ( ))
∗log 2
33
=0.8850
−0 0 −17 17
(
Entropy ( PS ) =
17
∗log 2 ( )) (
17
+
17
∗log 2 ( ))
17
=0
dan pass (PS) dan dari data format variabel profit usaha diketahui nilai
15 kasus. Setelah itu dari klasifikasi pass (PS) ada sebanyak 12 kasus
−23 23 −15 15
Entropy ( BG )= ( 38 ( )) (
∗log 2
38
+
38 ( ))
∗log 2
38
=0.9678
54
−0 0 −12 12
Entropy ( PS ) =( 12
∗log 2 ( )) (
12
+
12
∗log 2
12 ( ))
=0
Atribut biaya pajak memiliki dua klasifikasi yaitu budget (BG) dan
pass (PS) dan dari data format variabel profit usaha diketahui nilai dari
19 kasus. Setelah itu dari klasifikasi pass (PS) ada sebanyak 11 kasus
−20 20 −19 19
Entropy ( BG )= ( 39
∗log 2( )) (
39
+
39
∗log 2 ( ))
39
=0.9995
−3 3 −8 8
(
Entropy ( PS ) =
11
∗log 2
11 ( )) (
+
11
∗log 2
11 ( ))
=0.8454
Atribut biaya legalitas memiliki dua klasifikasi yaitu budget (BG) dan
pass (PS) dan dari data format variabel profit usaha diketahui nilai dari
15 kasus. Setelah itu dari klasifikasi pass (PS) ada sebanyak 16 kasus
−19 19 −15 15
Entropy ( BG )= ( 34 ( )) (
∗log 2
34
+
34
∗log 2( ))
34
=1
−4 4 −12 12
Entropy ( PS ) =( 16
∗log 2 ( )) (
16
+
16
∗log 2
16( ))
=0.8113
nilai gain pada setiap atribut dari variabel profit usaha, sebagai berikut.
Perhitungan nilai gain total atribut biaya tenaga kerja dihitung dengan
mengurangi nilai entropy total sebesar 0,9954 dengan total data pada
masing klasifikasi dari atribut, dalam hal ini entropy dengan klasifikasi
berikut.
24 14 12
¿ 0,9954− (( 50
∗0,9950 +
50)(
∗0,9852 + )(
50 ))
∗1 =0,2419
mengurangi nilai entropy total sebesar 0,9954 dengan total data pada
31 19
¿ 0,9954− (( 50 )(
∗0,8238 +
50 ))
∗0 =0,4846
mengurangi nilai entropy total sebesar 0,9954 dengan total data pada
33 17
¿ 0,9954− (( 50 )(
∗0,8850 +
50 ))
∗0 =0,4113
mengurangi nilai entropy total sebesar 0,9954 dengan total data pada
mengurangi nilai entropy total sebesar 0,9954 dengan total data pada
atribut biaya pajak dengan klasifikasi budget (BG) adalah 39 kasus dan
dengan klasifikasi budget (BG) adalah 0,9995 dan klasifikasi pass (PS)
mengurangi nilai entropy total sebesar 0,9954 dengan total data pada
34 16
¿ 0,9954− (( ) (
50
∗1 +
50 ))
∗0,8113 =0,0626
atribut yaitu nilai dari entropy dan nilai dari gain, penulis membuat
Entrop
Tingkat Profit Profit Defisit y Gain
TOTAL 50 23 27 0,9954
Biaya Tenaga
Kerja
Budget BG 24 13 11 0,9950
Enough EU 14 6 8 0,9852 0,2419
Pass PS 12 4 8 1
50
Biaya
Operasional
Budget BG 31 23 8 0,8238
0,4846
Pass PS 19 0 19 0
50
Biaya
Perlengkapan
Budget BG 33 23 10 0,8850
0,4113
Pass PS 17 0 17 0
50
Biaya
Perawatan
Budget BG 38 23 15 0,9678
0,2599
Pass PS 12 0 12 0
50
Biaya Pajak
Budget BG 39 20 19 0,9995
0,0298
Pass PS 11 3 8 0,8454
50
Biaya
Legalitas
Budget BG 34 19 15 1
0,0626
Pass PS 16 4 12 0,8113
50
Sumber: (Penulis, 2020)
59
0,4846 dengan demikian maka penulis membuat root node pada pohon
dua cabang, dimana salah satu cabang yang berasal dari atribut biaya
dilakukan lagi perhitungan yang sama dengan cara perhitungan pada node
pertama yaitu dengan melakukan perhitungan nilai dari entropy dan nilai
dari gain dengan atribut yang tersisa atau atribut selain biaya operasional
60
yaitu atribut dari biaya tenaga kerja, biaya perlengkapan, biaya perawatan,
entropy total dari atribut biaya operasional dengan klasifikasi budget (BG)
−23 23 −8 8
Entropy ( total )= ( 31 ( )) (
∗log 2
31
+
31 ( ))
∗log 2
31
=0.8238
kasus adalah 31 kasus dan kemudian diperoleh entropy total 0,8238. Lalu
Atribut biaya tenaga kerja memiliki tiga klasifikasi yaitu budget (BG),
enough (EU) dan pass (PS) dan dari data format variabel profit usaha
atribut biaya tenaga kerja dengan klasifikasi budget (BG) ada sebanyak
yang terakhir dari klasifikasi pass (PS) ada sebanyak 7 kasus dengan
−13 13 −2 2
Entropy ( BG )= ( 15 ( )) (
∗log 2
15
+
15 ( ))
∗log 2
15
=0.5665
−6 6 −3 3
Entropy ( EN )= ( 9 ( )) (
∗log 2
9
+
9 ( ))
∗log 2
9
=0.9183
−4 4 −3 3
Entropy ( PS ) = ( 7
∗log 2( )) (
7
+
7
∗log 2( ))
7
=1
dan pass (PS) dan dari data format variabel profit usaha diketahui
keputusan defisit terdapat 2 kasus. Setelah itu dari klasifikasi pass (PS)
−23 23 −2 2
Entropy ( BG )= ( 25 ( )) (
∗log 2
25
+
25 ( ))
∗log2
25
=0.4022
−0 0 −6 6
Entropy ( PS ) = ( 6
∗log 2( )) (
6
+
6
∗log 2( ))
6
=0
dan pass (PS) dan dari data format variabel profit usaha diketahui
62
keputusan defisit terdapat 4 kasus. Setelah itu dari klasifikasi pass (PS)
−23 23 −4 4
Entropy ( BG )=
( 27 ( )) (
∗log 2
27
+
27 ( ))
∗log 2
27
=0.6052
−0 0 −4 4
(
Entropy ( PS ) =
4
∗log 2
4( )) (
+
4
∗log 2
4( ))
=0
Atribut biaya pajak memiliki dua klasifikasi yaitu budget (BG) dan
pass (PS) dan dari data format variabel profit usaha diketahui atribut
terdapat 8 kasus. Setelah itu dari klasifikasi pass (PS) ada sebanyak 3
−20 20 −8 8
Entropy ( BG )= ( 28 ( )) (
∗log 2
28
+
28 ( ))
∗log 2
28
=0.8631
63
−3 3 −0 0
Entropy ( PS ) = ( 3 ( )) (
∗log 2
3
+
3 ( ))
∗log 2
3
=0
Atribut biaya legalitas memiliki dua klasifikasi yaitu budget (BG) dan
pass (PS) dan dari data format variabel profit usaha diketahui atribut
terdapat 6 kasus. Setelah itu dari klasifikasi pass (PS) ada sebanyak 6
−19 19 −6 6
Entropy ( BG )= ( 25 ( )) (
∗log 2
25
+
25
∗log 2( ))
25
=1
−4 4 −2 2
Entropy ( PS ) =( 6
∗log 2
6( )) (
+
6
∗log 2
6( ))
=0.9183
nilai gain pada setiap atribut dari variabel profit usaha, sebagai berikut.
Perhitungan nilai gain total atribut biaya tenaga kerja dihitung dengan
mengurangi nilai entropy total sebesar 0,8238 dengan total data pada
masing klasifikasi dari atribut, dalam hal ini entropy dengan klasifikasi
berikut.
15 9 7
¿ 0,8238− (( 31 )(
∗0,5665 +
31
∗0,9183 +)(
31 ))
∗1 =0,2831
mengurangi nilai entropy total sebesar 0,8238 dengan total data pada
25 6
¿ 0,8238− (( 31 )(
∗0,4022 +
31 ))
∗0 =0,4995
mengurangi nilai entropy total sebesar 0,8238 dengan total data pada
27 4
¿ 0,8238− (( 31 )(
∗0,6052 +
31 ))
∗0 =0,2967
mengurangi nilai entropy total sebesar 0,8238 dengan total data pada
atribut biaya pajak dengan klasifikasi budget (BG) adalah 28 kasus dan
dengan klasifikasi budget (BG) adalah 0,8631 dan klasifikasi pass (PS)
mengurangi nilai entropy total sebesar 0,8238 dengan total data pada
25 6
¿ 0,8238− (( ) (
31
∗1 +
31 ))
∗0.9183 =0,0049
66
atribut yaitu nilai dari entropy dan nilai dari gain, penulis membuat
Entrop
Tingkat Profit Profit Defisit y Gain
TOTAL 31 23 8 0,8238
Biaya Tenaga
Kerja
Budget BG 15 13 2 0,5665
Enough EU 9 6 3 0,9183 0,2831
Pass PS 7 4 3 1
31
Biaya
Perlengkapan
Budget BG 25 23 2 0,4022
0,4995
Pass PS 6 0 6 0
31
Biaya
Perawatan
Budget BG 27 23 4 0,6052
0,2967
Pass PS 4 0 4 0
31
Biaya Pajak
Budget BG 28 20 8 0,8631
0,0442
Pass PS 3 3 0 0
31
Biaya
Legalitas
Budget BG 25 19 6 1
0,0049
Pass PS 6 4 2 0,9183
31
67
0,4995 dengan demikian maka penulis membuat root node pada pohon
dua cabang, dimana salah satu cabang yang berasal dari atribut biaya
dilakukan lagi perhitungan yang sama dengan cara perhitungan pada node
pertama dan kedua yaitu dengan melakukan perhitungan nilai dari entropy
dan nilai dari gain dengan atribut yang tersisa atau atribut selain biaya
perlengkapan yaitu atribut dari biaya tenaga kerja, biaya perawatan, biaya
−23 23 −2 2
Entropy ( total )= ( 25 ( )) (
∗log 2
25
+
25 ( ))
∗log 2
25
=0.4022
kasus adalah 25 kasus dan kemudian diperoleh entropy total 0,4022. Lalu
Atribut biaya tenaga kerja memiliki tiga klasifikasi yaitu budget (BG),
enough (EU) dan pass (PS) dan dari data format variabel profit usaha
dan atribut biaya tenaga kerja dengan klasifikasi budget (BG) ada
kasus. Kemudian yang terakhir dari klasifikasi pass (PS) ada sebanyak
−13 13 −0 0
Entropy ( BG )= ( 13 ( )) (
∗log 2
13
+
13 ( ))
∗log 2
13
=0
−6 6 −1 1
Entropy ( EN )= ( 7 ( )) (
∗log 2
7
+
7 ( ))
∗log 2
7
=0.5917
−4 4 −1 1
Entropy ( PS ) =( 5
∗log 2 ( )) (
5
+
5
∗log 2 ( ))
5
=1
dan pass (PS) dan dari data format variabel profit usaha diketahui
−23 23 −0 0
Entropy ( BG )= ( 23 ( )) (
∗log 2
23
+
23 ( ))
∗log 2
23
=0
−0 0 −2 2
Entropy ( PS ) =( 2
∗log 2 ( )) (
2
+
2
∗log 2 ( ))
2
=0
Atribut biaya pajak memiliki dua klasifikasi yaitu budget (BG) dan
pass (PS) dan dari data format variabel profit usaha diketahui atribut
defisit terdapat 2 kasus. Setelah itu dari klasifikasi pass (PS) ada
−20 20 −2 2
Entropy ( BG )= ( 22 ( )) (
∗log 2
22
+
22 ( ))
∗log2
22
=0.4395
−3 3 −0 0
Entropy ( PS ) =( 3
∗log 2 ( )) (
3
+
3
∗log 2( ))
3
=0
Atribut biaya legalitas memiliki dua klasifikasi yaitu budget (BG) dan
pass (PS) dan dari data format variabel profit usaha diketahui atribut
−19 19 −1 1
Entropy ( BG )= ( 20 ( )) (
∗log 2
20
+
20
∗log 2( ))
20
=1
−4 4 −1 1
Entropy ( PS ) = ( 5 ( )) (
∗log 2
5
+
5
∗log 2( ))
5
=1
nilai gain pada setiap atribut dari variabel profit usaha, sebagai berikut.
Perhitungan nilai gain total atribut biaya tenaga kerja dihitung dengan
mengurangi nilai entropy total sebesar 0,4022 dengan total data pada
sebagai berikut.
13 7 5
¿ 0,4022− (( 25 )(
∗0 +
25
∗0,5917 + )(
25 ))
∗1 =0,2365
mengurangi nilai entropy total sebesar 0,4022 dengan total data pada
23 2
¿ 0,4022− (( 25 )(
∗0 +
25 ))
∗0 =0,4022
mengurangi nilai entropy total sebesar 0,4022 dengan total data pada
22 3
¿ 0,4022− (( 25 )(
∗0.4395 +
25 ))
∗0 =0,0154
mengurangi nilai entropy total sebesar 0,4022 dengan total data pada
atribut yaitu nilai dari entropy dan nilai dari gain, penulis membuat
Entrop
Tingkat Profit Profit Defisit y Gain
TOTAL 25 23 2 0,4022
Biaya Tenaga
Kerja
Budget BG 13 13 0 0
Enough EU 7 6 1 0,5917 0,2365
Pass PS 5 4 1 1
25
Biaya
Perawatan
Budget BG 23 23 0 0
0,4022
Pass PS 2 0 2 0
25
Biaya Pajak
Budget BG 22 20 2 0,4395
0,0154
Pass PS 3 3 0 0
25
Biaya
Legalitas
Budget BG 20 19 1 0
0,0287
Pass PS 5 4 1 0,7219
25
Sumber: (Penulis, 2020)
0,4022 dengan demikian maka penulis membuat root node pada pohon
aturan atau rule yang dihasilkan oleh pohon keputusan akhir yaitu:
perusahaan defisit.
75
profit usaha dan simpan dengan nama file weka.csv seperti yang dapat
dengan aplikasi notepad dan mengubah tanda titik koma (;) menjadi tanda
koma (,) agar dapat terbaca dengan aplikasi WEKA seperti yang dapat
tersebut dengan melakukan klik dua kali pada shortcut dari WEKA.
4. Setelah aplikasi WEKA terbuka, lakukan klik sebanyak satu kali pada
pilihan menu WEKA yaitu explorer seperti kotak dialog pada gambar 4.6
berikut.
77
5. Pada WEKA explorer pilih open file, cari tempat penyimpanan file
weka.csv, kemudian ganti tipe file nya menjadi csv, lalu klik open dibagian
7. Kemudian berpindah ke Tab Classify lalu klik choose seperti yang terlihat
8. Kemudian pilih dan klik trees pada tab menu classify kemudian pilih dan
9. Klik menu start lalu akan muncul output dibagian kanan yang merupakan
adalah jumlah kasus dan keputusannya dan banyak cabang dari pohon
10. Langkah terakhir untuk melihat hasil pohon keputusan dilakukan dengan
cara klik kanan pada result list dan kemudian pilih dan klik visualize tree
11. Dan demikian tampilan akhir dari pohon keputusan menggunakan aplikasi
5.1 Simpulan
menentukan tingkat profit usaha adalah sukses (berhasil) hal ini dapat
84
dari data transaksi sewa PT. Megacipta Sejati dapat menemukan rules atau
aturan
85
86
kerugian (defisit).
yang sama yaitu variabel yang menjadi faktor utama yang mempengaruhi
biaya perawatan.
5.2 Saran
datang. Berikut adalah beberapa saran yang peneliti anggap perlu sebagai
berikut:
2. Dari segi jumlah data yang akan diolah berbanding lurus dengan
waktu survei artinya waktu survei lebih lama maka data yang
maksimal.
yang akan datang. Hal ini jelas akan memperkaya ranah keilmuan
Mengulang Mata Kuliah (studi kasus di AMIK Labuhan Batu), 9(1), 11–
22.
4–6.
Chen, W., Zhang, S., Li, R., & Shahabi, H. (2018). Science of the Total
techniques of best- fi rst decision tree , random forest , and naïve Bayes
89
Elisa, E. (2018). Prediksi Profit Pada Perusahaan Dengan Klasifikasi Algoritma
90
91
Fitria Harahap. 2015. Penerapan Data Mining dalam Memprediksi Pembelian cat.
5, 11(2), 130–138.
VI(1), 15–20.
92
Lestari, S., & Suryadi, A. (2014). Model Klasifikasi Kinerja Dan Seleksi dosen
Lorena, S., Zarman, W., & Hamidah, I. (2014). Analisis Dan Penerapan
10.
Informatika.
Meythi dan Selvy Hartono. 2012. Pengaruh Informasi Laba dan Arus Kas
Beasiswa (Studi Kasus : PPS IAIN Raden Intan Bandar Lampung), 01(02),
118–128.
Rifqo, muhammad husni, & Arzi, T. (2016). Implementasi Algoritma C4.5 Untuk
Santoso, teguh budi. (2014). Analisa dan penerapan metode C4.5 untuk prediksi
Song, Y., & Lu, Y. (2015). Decision tree methods : applications for classification
Wira, D., & Putra, T. (2016). Algoritma c4.5 untuk menentukan tingkat kelayakan