Anda di halaman 1dari 70

ANALISA DATA MINING DENGAN METODE

KLASIFIKASI UNTUK PRODUK CACAT PADA PT.


SHUANGYING INTERNATIONAL INDONESIA

SKRIPSI

Oleh :

RANI YULIANI WULANDARI

311421111

TEKNIK INFORMATIKA
SEKOLAH TINGGI TEKNOLOGI PELITA BANGSA
BEKASI
2018
ANALISA DATA MINING DENGAN METODE
KLASIFIKASI UNTUK PRODUK CACAT PADA PT.
SHUANGYING INTERNATIONAL INDONESIA

SKRIPSI

Diajukan Sebagai Salah Satu Syarat Untuk Menyelesaikan


Program Strata Satu (S1) pada Program Studi Teknik Informatika

Oleh :

RANI YULIANI WULANDARI

311421111

TEKNIK INFORMATIKA
SEKOLAH TINGGI TEKNOLOGI PELITA BANGSA
BEKASI
2018
PERSETUJUAN

SKRIPSI

ANALISA DATA MINING DENGAN METODE KLASIFIKASI UNTUK


PRODUK CACAT PADA PT. SHUANGYING INTERNATIONAL
INDONESIA

Yang disusun oleh

RANI YULIANI WULANDARI


311421111

telah disetujui oleh Dosen Pembimbing Skripsi


pada tanggal 20 Oktober 2018

Dosen Pembimbing 1 Dosen Pembimbing 2

Aswan S. Sunge, S.E., M.Kom Nisa Nurhidayanti, S.Pd., M.T


NIDN: 0426018003 NIDN: 0420028902

Menyetujui
Kaprodi Teknik Informatika

Aswan S. Sunge, S.E., M.Kom


NIDN: 0426018003

i
PENGESAHAN

SKRIPSI

ANALISA DATA MINING DENGAN METODE KLASIFIKASI UNTUK


PRODUK CACAT PADA PT. SHUANGYING INTERNATIONAL
INDONESIA
Diajukan Sebagai Syarat Memperoleh Gelar Sarjana Teknik Informatika

Yang disusun oleh:


RANI YULIANI WULANDARI
311421111

Dosen Penguji 1 Dosen Penguji 2

Abdul Halim Anshor, S.Kom.,M.Kom Ir. Tri Ngudi Wiyatno, M.T


NIDN: 041406810 NIDN: 042508650

Dosen Pembimbing 1 Dosen Pembimbing 2

Aswan S. Sunge, S.E., M.Kom Nisa Nurhidayanti, S.Pd., M.T


NIDN: 0426018003 NIDN: 0420028902

Menyetujui
Kaprodi Teknik Informatika

Aswan S. Sunge, S.E., M.Kom


NIDN: 0426018003

Mengetahui
Ketua STT Pelita Bangsa

Dr. Ir. Supriyanto, M.P


NIDN: 0401066605

ii
PERNYATAAN KEASLIAN PENELITIAN

Saya yang bertanda tangan dibawah ini menyatakan bahwa, skripsi ini merupakan
karya saya sendiri (ASLI), dan isi dalam skripsi ini tidak terdapat karya yang pernah
diajukan oleh orang lain untuk memperoleh gelar akademis di suatu institusi
pendidikan tinggi mana pun, dan sepanjang pengetahuan saya juga tidak terdapat
karya atau pendapat yang pernah ditulis dan/atau diterbitkan oleh orang lain,
kecuali yang secara tertulis diacu dalam naskah ini dan disebutkan dalam daftar
pustaka.

Segala sesuatu yang terkait dengan naskah dan karya yang telah dibuat adalah
menjadi tanggungjawab saya pribadi.

Bekasi, 20 Oktober 2018

Materai 6.000

RANI YULIANI
WULANDARI

NIM : 311421111

iii
KATA PENGANTAR

Puji syukur penulis panjatkan kehadiran Allah SWT. yang telah


melimpahkan segala rahmat dan hidayah-Nya, sehingga tersusun lah Skripsi yang
berjudul “ANALISA DATA MINING DENGAN METODE KLASIFIKASI
PRODUK CACAT PADA PT. SHUANGYING INTERNATIONAL
INDONESIA”.

Skripsi tersusun dalam rangka melengkapi salah satu persyaratan dalam


rangka menempuh ujian akhir untuk memperoleh gelar Sarjana Komputer (S.Kom.)
pada Program Studi Teknik Informatika di Sekolah Tinggi Teknologi Pelita Bangsa.

Penulis sungguh sangat menyadari, bahwa penulisan Skripsi ini tidak akan
terwujud tanpa adanya dukungan dan bantuan dari berbagai pihak. Sudah
selayaknya, dalam kesempatan ini penulis menghaturkan penghargaan dan ucapan
terima kasih yang sebesar-besarnya kepada:
a. Bapak Dr. Ir. Supriyanto, M.P selaku Ketua STT Pelita Bangsa
b. Bapak Aswan S. Sunge, S.Kom, M.Kom selaku Ketua Program Studi Teknik
Informatika STT Pelita Bangsa.
c. Bapak Aswan S. Sunge, S.Kom, M.Kom selaku Dosen Pembimbing 1 yang
telah banyak memberikan arahan dan bimbingan kepada penulis dalam
penyusunan Skripsi ini.
d. Ibu Nisa Nurhidayanti, S.Pd, M.T selaku Dosen Pembimbing 2 yang telah
banyak memberikan arahan dan bimbingan kepada penulis dalam penyusunan
Skripsi ini.
e. Seluruh Dosen STT Pelita Bangsa yang telah membekali penulis dengan
wawasan dan ilmu di bidang teknik informatika.
f. Seluruh staf STT Pelita Bangsa yang telah memberikan pelayanan terbaiknya
kepada penulis selama perjalanan studi jenjang Strata 1.
g. Rekan-rekan mahasiswa STT Pelita Bangsa, khususnya angkatan 2014, yang
telah banyak memberikan inspirasi dan semangat kepada penulis untuk dapat
menyelesaikan studi jenjang Strata 1.

iv
h. Ibu, Bapak, Adik-adik, Suami, dan Anak-anak tercinta yang senantiasa
mendoakan dan memberikan semangat dalam perjalanan studi Strata 1 maupun
dalam kehidupan penulis.

Akhir kata, penulis mohon maaf atas kekeliruan dan kesalahan yang terdapat
dalam Skripsi ini dan berharap semoga Skripsi ini dapat memberikan manfaat bagi
khasanah pengetahuan Teknologi Informasi di lingkungan STT Pelita Bangsa
khususnya dan Indonesia pada umumnya.

Bekasi, 20 Oktober 2018

Penulis

Rani Yuliani Wulandari

v
DAFTAR ISI

PERSETUJUAN ...................................................................................................... i

PENGESAHAN ...................................................................................................... ii

PERNYATAAN KEASLIAN PENELITIAN ....................................................... iii

KATA PENGANTAR ........................................................................................... iv

DAFTAR ISI .......................................................................................................... vi

DAFTAR TABEL .................................................................................................. ix

DAFTAR GAMBAR .............................................................................................. x

ABSTRAK ............................................................................................................. xi

ABSTRACT ............................................................................................................ xii

BAB I PENDAHULUAN ....................................................................................... 1

1.1 Latar Belakang ......................................................................................... 1

1.2 Identifikasi Masalah ................................................................................. 3

1.3 Rumusan Masalah .................................................................................... 4

1.4 Batasan Masalah ....................................................................................... 4

1.5 Tujuan dan Manfaat Penelitian................................................................. 5

1.5.1 Tujuan Penelitian .............................................................................. 5

1.5.2 Manfaat Penelitian ............................................................................ 5

1.6 Sistematika Penulisan ............................................................................... 6

BAB II TINJAUAN PUSTAKA............................................................................. 8

vi
2.1 Tinjauan Penelitian ................................................................................... 8

2.2 Kajian Pustaka ........................................................................................ 11

2.2.1 Produk Cacat ................................................................................... 11

2.2.2 Knowledge Discovery in Databases (KDD) ................................... 11

2.2.3 Pengertian Data Mining .................................................................. 13

2.2.4 Pengelompokan Data Mining.......................................................... 14

2.2.5 Metode Klasifikasi .......................................................................... 15

2.2.6 Decision Tree (Pohon Keputusan) .................................................. 17

2.2.7 Algoritma C4.5 ................................................................................ 19

2.2.8 Keuntungan dan Kerugian Algoritma C4.5 .................................... 19

2.2.9 Tahapan Membangun Algoritma C4.5 ............................................ 20

BAB III METODOLOGI PENELITIAN.............................................................. 25

3.1 Objek Penelitian ..................................................................................... 25

3.1.1 Gambaran Umum ............................................................................ 25

3.1.2 Visi dan Misi ................................................................................... 26

3.1.3 Struktur Organisasi ......................................................................... 26

3.1.4 Departement dalam Struktur Organisasi ......................................... 28

3.2 Waktu Penelitian .................................................................................... 29

3.3 Pengumpulan dan Pengolahan Data ....................................................... 29

3.4 Peralatan ................................................................................................. 30

3.4 Kerangka Pemikiran ............................................................................... 31

vii
BAB IV HASIL DAN PEMBAHASAN .............................................................. 32

4.1 Hasil Penelitian....................................................................................... 32

4.2 Pembahasan ............................................................................................ 40

BAB V KESIMPULAN ........................................................................................ 46

5.1 Kesimpulan ............................................................................................. 46

5.2 Saran ....................................................................................................... 46

DAFTAR PUSTAKA ........................................................................................... 48

LAMPIRAN .......................................................................................................... 51

viii
DAFTAR TABEL

Tabel 2.1 Rangkuman Tinjauan Penelitian ............................................................ 9

Tabel 2.2 Confusion Table ................................................................................... 23

Tabel 4.1 Kategori Produk Cacat Pada PT. Shuangying International Indonesia..32

Tabel 4.2 Data Training Untuk Produk Cacat........................................................32

Tabel 4.3 Penghitungan Data Training..................................................................37

Tabel 4.4 Confusion Matrix Penghitungan Accuracy............................................41

Tabel 4.5 Confusion Matrix Penghitungan Recall..................................................43

Tabel 4.6 Confusion Matrix Penghitungan Precision.............................................44

ix
DAFTAR GAMBAR

Gambar 2.1 Proses KDD ..................................................................................... 12

Gambar 2.2 Data Mining Berdasarkan Fungsionalitas ....................................... 14

Gambar 2.3 Algoritma Klasifikasi....................................................................... 16

Gambar 2.4 Contoh Decision Tree ...................................................................... 18

Gambar 3.1 Lokasi Tempat Penelitian PT. Shuangying International Indonesia..25

Gambar 3.2 Struktur Organisasi PT. Shuangying International Indonesia............27

Gambar 3.3 Departement Technical Quality.........................................................29

Gambar 3.4 Kerangka Pemikiran..........................................................................31

Gambar 4.1 Model Read Excel Dengan Decision Tree C.45.................................38

Gambar 4.2 Model Cross Validation Dengan Decision Tree C4.5........................38

Gambar 4.3 Pohon Keputusan Produk Cacat.........................................................39

Gambar 4.4 Deskripsi Permodelan Decision Tree C4.5........................................40

Gambar 4.5 Hasil Accuracy (Data Training) Decision Tree C4.5.........................41

Gambar 4.6 Hasil Recall (Data Training) Decision Tree C4.5..............................42

Gambar 4.7 Hasil Precision (Data Training) Decision Tree C4.5.........................44

Gambar 4.8 Hasil Evaluasi Data Training ROC/AUC..........................................45

x
ABSTRAK

PT. Shuangying International Indonesia adalah perusahaan dari negara China


pembuat produk plastik otomotif (komponen interior dan eksterior mobil) yang
berdiri pada tahun 2000 di negara China, sedangkan di indonesia mulai beroperasi
pada 23 maret 2016. Perkembangan produk otomotif di Indonesia sangat
berkembang, hal itu terlihat banyaknya jenis kendaraan otomotif dari luar negeri
yang berproduksi dan berbisnis di Indonesia. Pada perusahaan terdapat sebuah
bagian pemeriksaan pada Departemen Quality yang bertugas untuk memeriksa
produk sebelum dikirim ke pelanggan. Banyaknya produk cacat pada saat proses
produksi terbuang karena tidak memiliki pengambilan keputusan secara klasifikasi
untuk produk cacat yang bisa membantu mempermudah proses pemeriksaan.
Tujuan penelitian ini adalah untuk menganalisa data mining dengan metode
klasifikasi untuk produk cacat pada PT. Shuangying International Indonesia dengan
algoritma C4.5. Dalam penelitian ini, hasil yang didapatkan dari beberapa atribut
menghasilkan sebab-akibat produk cacat dalam mengklasifikasikan menjadi
produk OK dan NOK. Penelitian ini diharapkan dapat membantu pihak perusahaan
untuk meningkatkan laba perusahaan tersebut. Metode klasifikasi yang digunakan
dalam data mining adalah Decision Tree karena dapat menghasilkan output sesuai
dengan aturan yang ada, dapat menyajikan data produk cacat. Penelitian
menggunakan Algoritma C4.5 untuk menghasilkan aturan klasifikasi produk cacat
dari data 90 data training diperoleh produk OK (37), NOK (57) dan hasil akurasi
sebesar 95.56%, yang menunjukan bahwa algoritma C4.5 cocok digunakan untuk
mengukur produk cacat pada suatu perusahaan.

Kata kunci: algoritma C4.5, data mining, decision tree, produk cacat

xi
ABSTRACT

PT. Shuangying International Indonesia is a company from China that


manufactures automotive plastic products (interior and exterior components of
cars) which was established in 2000 in China, while in Indonesia it began operating
on March 23, 2016. The development of automotive products in Indonesia is very
developed, it is seen a lot types of automotive vehicles from abroad that produce
and do business in Indonesia. At the company there is an inspection section at the
Quality Department whose duty is to inspect products before they are sent to
customers. The number of defective products when the production process is wasted
because it does not have a classification decision for defective products that can
help simplify the inspection process. The purpose of this study is to analyze data
mining with the classification method for defective products at PT. Shuangying
International Indonesia with the C4.5 algorithm. In this study, the results obtained
from several attributes produce a causal product of defects in classifying OK and
NOK products. This research is expected to help the company to increase the
company's profits. The classification method used in data mining is Decision Tree
because it can produce output according to existing rules, can present defective
product data. The research uses C4.5 algorithm to produce defective product
classification rules from data 90 training data obtained by the product OK (37),
NOK (57) and the accuracy of 95.56%, which indicates that the C4.5 algorithm is
suitable for measuring defective products on a company.
Keyword: C4.5 algorithms, data mining, decision tree, defective products

xii
BAB I
PENDAHULUAN

1.1 Latar Belakang

Perkembangan produk otomotif di Indonesia sangat berkembang, hal itu

terlihat banyaknya jenis kendaraan otomotif dari luar negeri yang berproduksi dan

berbisnis di Indonesia. Seiring perkembangan tersebut maka dibutuhkan pula

perkembangan teknologi informasi untuk menembus batas-batas ilmu pengetahuan

dan menyerbu pelosok ke seluruh dunia. Revolusi informasi dan komunikasi zaman

ini melahirkan peradaban baru yaitu tidak dibatasi oleh waktu, informasi dapat kita

peroleh kapan saja dan dimana saja. Begitu pula halnya dalam dunia bisnis,

kemajuan teknologi informasi tersebut mengakibatkan perubahan yang signifikan

dengan telah banyaknya mengubah dan mempermudah sistem kerja para pelaku

bisnis.

Setiap aktivitas dan kegiatan dalam kehidupan berbisnis, komputer

dijadikan sebagai suatu perangkat pengolahan data elektronik untuk menghasilkan

data informasi dengan cepat dan mudah. Informasi merupakan salah satu jalan

untuk mengambil keputusan terhadap apa yang akan dilakukan pada tahap

selanjutnya. Sistem informasi yang baik akan meningkatkan efisiensi dan

efektivitas kerja.

Dengan banyaknya produk otomotif maka mutu dijadikan sebagai landasan

utama. Apapun jenis produk suatu perusahaan tentunya membutuhkan jasa Quality

Assurance atau Quality Control dalam suatu divisi. Walaupun keduanya memiliki

definisi yang berbeda tetapi sama-sama memilki acuan pada mutu. Cukup disebut

1
Departemen Quality didalamnya ada kegiatan pemeriksaan dan merancang jaminan

produk bahwa sudah terpenuhi persyaratan mutu tersebut.

Secara strategi pun kualitas atau mutu didefinisikan sebagai segala sesuatu

yang mampu memenuhi keinginan atau kebutuhan pelanggan (meeting the needs of

customer). Keunggulan suatu produk terukur melalui tingkat kepuasan pelanggan

maka, diperlukan juga perkembangan dunia teknologi informasi untuk kebutuhan

akan data dan informasi berbasiskan komputer. Data dan informasi sangat

dibutuhkan suatu perusahaan yang berskala besar, sedang, dan kecil. Sistem

informasi terkomputerisasi terbukti mampu mempercepat kinerja, sehingga

meningkatkan keuntungan.

Teknologi data sistem informasi merupakan sebuah teknologi interaktif

yang dapat digunakan sebagai sarana informasi yang dapat di akses oleh semua

pihak, baik pihak umum maupun pihak yang mempunyai akses. Sebuah perusahaan

menggunakan atau menerapkan Teknologi Informasi untuk memudahkan

berlangsungnya proses kerja baik untuk semua karyawan, maupun karyawan

administrasi dalam hal pengaksesan data dan informasi.

PT. Shuangying International Indonesia adalah sebuah perusahaan

manufaktur asal China yang bergerak di bidang pembuatan komponen plastik

(interior dan exterior) otomotif untuk kendaraan mobil yang beroperasi di kawasan

industri Grendland Deltamas Cikarang Pusat. Pada perusahaan ini terdapat sebuah

bagian pemeriksaan pada Departemen Quality yang bertugas untuk memeriksa

produk sebelum dikirim ke pelanggan. Akan tetapi pada proses pemeriksaan,

inspector mengalami kesulitan dalam prosesnya. Banyaknya produk cacat pada saat

proses produksi terbuang karena tidak memiliki pengambilan keputusan secara

2
klasifikasi produk cacat yang bisa membantu mempermudah proses pemeriksaan,

sehingga inspector kesulitan dalam mencari limit produk cacat ataupun membuat

laporan pemeriksaan setiap harinya. Selain itu lamanya dalam proses pemeriksaan

bisa mengurangi hasil produksi dan tentunya hal ini bisa menjadi kerugian untuk

perusahaan. Penyediaan data yang cepat dan akurat juga menjadi kendala utama

disebabkan ketiadaan sistem informasi yang akurat. Hal tersebut menyulitkan

perusahaan dalam mengontrol hasil produksi setiap harinya. Dari beberapa alasan

tersebut maka diperlukan sebuah akurasi yang diharapkan mampu mengatasi

masalah-masalah yang selama ini menjadi kendala dan mempermudah karyawan

untuk menyusun data.

Melihat dari permasalahan, khususnya bagian pemeriksaan pada

Departemen Quality penulis bermaksud untuk memberi solusi agar masalah-

masalah tersebut dapat terminimalisir. Maka dari itu diperlukan sebuah akurasi

yang diharapkan mampu mengatasi masalah-masalah yang selama ini menjadi

kendala dan mempermudah pemeriksaan produk cacat sehingga dapat memberikan

solusi dari permasalahan yang dihadapi oleh pihak perusahaan.

Berdasarkan latar belakang masalah di atas maka penulis mengambil judul

“ANALISA DATA MINING DENGAN METODE KLASIFIKASI UNTUK

PRODUK CACAT PADA PT. SHUANGYING INTERNATIONAL

INDONESIA”.

1.2 Identifikasi Masalah

Dari uraian latar belakang masalah di atas, dapat mengindentifikasikan

masalah sebagai berikut:

3
1. Pengolahan dan pencarian produk cacat memakan waktu yang lama

karena belum terklasifikasi secara terperinci.

2. Produktivitas tenaga kerja masih rendah karena inspector kesulitan dalam

mencari limit produk cacat yang tersimpan dalam suatu tempat.

3. Banyaknya produk cacat yang terbuang banyak karena sering terjadi

salah pengambilan keputusan.

4. Banyaknya limit produk cacat yang hilang atau rusak menyebabkan

kesulitan untuk pengambilan keputusan produk.

5. Belum adanya suatu akurasi atau metode dalam melihat suatu data dalam

menganalisis suatu klasifikasi produk cacat.

1.3 Rumusan Masalah

Berdasarkan identifikasi masalah diatas, maka dirumuskan permasalahan,

yaitu : “Bagaimana menganalisa data mining untuk produk cacat pada PT.

Shuangying International Indonesia dengan menggunakan metode Klasifikasi

(C4.5)?”.

1.4 Batasan Masalah

Supaya pembahasan masalah yang dilakukan dapat terarah dengan baik dan

tidak menyimpang dari pokok permasalahan, maka penulis membatasi

permasalahan yang akan dibahas, yakni :

1. Proses yang akan diteliti berkisar pada penyediaan data pada bagian

pemeriksaan.

2. Departemen Quality di bagian pemeriksaan.

4
3. Pemeriksaan limit produk cacat diperiksa oleh Departemen Quality.

4. Tidak semua laporan pemeriksaan produk cacat dibuat data, produk cacat

biasanya langsung dibuang dianggap sudah tidak bagus (NOK).

1.5 Tujuan dan Manfaat Penelitian

Penulisan ini mempunyai beberapa tujuan dan manfaat antara lain sebagai

berikut:

1.5.1 Tujuan Penelitian

Berdasarkan rumusan masalah yang telah diuraikan, maka tujuan

dari penelitian ini adalah untuk menganalisa data mining untuk produk cacat

pada PT. Shuangying International Indonesia dengan menggunakan metode

Klasifikasi (C4.5).

1.5.2 Manfaat Penelitian

Penulis berharap bahwa tugas skripsi ini dapat memberikan

kontribusi lebih yang dapat dirasakan oleh berbagai pihak, khususnya bagi

penulis dan umumnya bagi semua pihak yang terlibat maupun tidak terlibat

dalam penulisan tugas skripsi ini, Adapun manfaat penulisan tugas ini

adalah sebagai berikut:

1. Bagi Penulis

Sebagai tambahan dan penerapan ilmu pada program studi Teknik

Informatika dengan kajian data mining dan metode klasifikasi.

5
2. Bagi Program Studi Teknik Informatika STT Pelita Bangsa

Memberikan kontribusi kepada Program Studi mengenai penelitian

data mining metode klasifikasi (C4.5) sebagai referensi bagi

mahasiswa angkatan berikutnya.

3. Bagi Perusahaan

Memberikan kontribusi bagi perusahaan sebagai cara pengambilan

keputusan akurasi yang lebih baik pada PT. Shuangying

International Indonesia.

1.6 Sistematika Penulisan

Penyusunan skripsi ini menggunakan kerangka pembahasan yang terbentuk

dalam susunan bab, dengan uraian sebagai berikut:

BAB I PENDAHULUAN

Bab ini menjelaskan informasi umum tentang latar belakang,

identifikasi masalah, rumusan masalah, batasan masalah, tujuan

dan manfaat penelitian, dan sistematika penulisan.

BAB II TINJAUAN PUSTAKA

Bab ini berisi tinjauan pustaka dan kumpulan penelitian

terdahulu.

BAB III METODOLOGI PENELITIAN

Bab ini menjelaskan metode yang digunakan untuk

menyelesaikan permasalahan dalam penelitian dan perangkat

lunak yang digunakan.

6
BAB IV HASIL DAN PEMBAHASAN

Pada bab ini menjelaskan hasil dari penelitian dan pembahasan

yang telah dilakukan.

BAB V PENUTUP

Bab ini menjelaskan tentang kesimpulan dan saran dari hasil

penyusunan laporan tugas akhir yang telah di susun atau dapat

digunakan untuk penelitian selanjutnya.

7
BAB II
TINJAUAN PUSTAKA

2.1 Tinjauan Penelitian

Dari penelitian yang berkaitan dengan skripsi ini terutama dalam hal

klasifikasi produk cacat, yaitu:

1. Prediksi Kompetensi Karyawan Menggunakan Algoritma C4.5 (Studi Kasus :

PT. Hankook Tire Indonesia ) (Sunge, 2018). Penelitian ini membahas

kompetensi karyawan menggunakan model eksperimen data diperoleh dari data

sekunder yang diperoleh dari data PT Hankook Tire Indonesia di Bekasi yang

datanya dikumpulkan berjumlah 205 data kemudian dibagi menjadi 2 data yaitu

data training sejumlah 164 data dan data testing sejumlah 41 data dengan

perbandingan 80% dan 20% diproses dengan menggunakan algoritma C4.5

dengan akurasi yang didapat sebesar 78,75%.

2. Prediksi Kebangkrutan Perusahaan Menggunakan Algoritma C4.5 Berbasis

Forward Selection (Saleh, 2017). Penelitian ini membahas kebangkrutan

perusahaan dengan menggunakan eksperimen data diperoleh dari dataset global

yang datanya bervariasi jumlah recordnya yang berjumlah 250 record dan 150

record diproses dengan menggunakan algoritma C4.5 dengan akurasi yang

didapat sebesar 99.60%.

3. Penerapan Algoritma C4.5 Untuk Prediksi Tingkat Kompetensi Karyawan PT

Multi Strada Arah Sarana (Wahyono dkk, 2018). Penelitian ini membahas

kompetensi karyawan dengan menggunakan eksperimen data diperoleh dari

hasil tes kompetensi karyawan PT Multistrada Arah Sarana yang datanya

8
dikumpulkan berjumlah 257 data karyawan kemudian dibagi menjadi 2 data

yaitu data training sejumlah 206 data dan data testing sejumlah 51 data dengan

perbandingan 80% dan 20% diproses dengan menggunakan algoritma C4.5

dengan akurasi yang didapat sebesar 80,39%.

4. Penerapan Algoritma Klasifikasi Data Mining C4.5 Pada Dataset Cuaca

Wilayah Bekasi (Novandya dkk, 2017). Penelitian ini membahas cuaca wilayah

bekasi dengan menggunakan eksperimen data diperoleh dari situs World

Weather Online diproses dengan menggunakan algoritma C4.5 dengan akurasi

yang didapat sebesar 88,89%.

Dari uraian diatas, maka penulis menyusun tabel rangkuman tinjauan penelitian

yaitu sebagai berikut:

Tabel 2.1 Rangkuman Tinjauan Penelitian

No Tahun Judul Kesimpulan


1. 2018 Prediksi Kompetensi Menggunakan algoritma C4.5

Karyawan Menggunakan dengan menggunakan kategori

Algoritma C4.5 (Studi Kasus : kompetensi umum, kompetensi

PT Hankook Tire Indonesia) khusus, dan kompetensi teknikal.

2 2017 Prediksi Kebangkrutan Menggunakan algoritma C4.5

Perusahaan Menggunakan berbasis forward selection

Algoritma C4.5 Berbasis dengan menggunakan kriteria

Forward Selection. seperti IR, MR, FF, Credibilty,

Competitivenes, dan Operation

Risk.

9
No Tahun Judul Kesimpulan
3 2018 Penerapan Algoritma C4.5 Menggunakan algoritma C4.5

Untuk Prediksi Tingkat dengan menggunakan kriteria

Kompetensi Karyawan PT mengetahui dasar-dasar

Multistrada Arah Sarana. pengetahuan ban, mengetahui

proses manufaktur ban,

mengetahui secara umum

ISO/TS 16949:2009 dan control

dokumen, memahami konsep

dasar perbaikan berkelanjutan,

memahami dasar K3 (kesehatan

dan keselamatan kerja),

memahami cara membaca spec,

memahami pengisian checksheet

operator TBM, memahami

sistem FIFO, memahami

punching sistem, mampu

melakukan proses assembly

sesuai standar, memahami cara

ganti size, memahami UPH &

cycle time, memahami barcode

sistem, memahami cara venting

GT, memahami macam-macam

defect, memahami offset

10
parameter mesin dan mengerti

pemilahan recycle.

4 2017 Penerapan Algoritma Menggunaka algoritma C4.5

Klasifikasi Data Mining C4.5 dengan menggunakan kriteria

pada Dataset Cuaca Wilayah date, time, desc, weather, temp,

Bekasi. rain, wid, dir, cloud, humadity

dan pressure.

2.2 Kajian Pustaka

2.2.1 Produk Cacat

Produk cacat adalah produk yang belum sesuai dengan spesifikasi yang

ditetapkan oleh suatu standar atau defect product (Dewi, 2012).

Terjadinya produk cacat apabila tidak tepat dalam menentukan setting parameter

didalam suatu proses pada tekanan injeksi, temperatur injeksi dan waktu

pendinginan. Dari hasil simulasi yang didapat menunjukan bahwa kecenderungan

terlalu rendah untuk nilai tekanan injeksi bisa menyebabkan cacat produk

diantaranya short shot, sink mark, dan sedangkan nilai tinggi bisa menyebabkan

produk flashing (Cahyadi, 2014). Misalkan untuk produk cacat short shot tidak

semuanya dinyatakan produk tidak bisa digunakan, dengan cara klasifikasi masih

bisa menentukan short shot dari ukuran cacatnya.

2.2.2 Knowledge Discovery in Databases (KDD)

Knowledge Discovery in Databases (KDD) adalah proses non-sepele untuk

mengidentifikasi pola baru, valid, berpotensi berguna, dan akhirnya dapat

dimengerti dalam data (Gullo, 2015).

11
Interpretation
Selection Preprocessing Tranformation Data Mining /Evaluation

....... ........
Data ....... ........ Knowledge

Target Data Preprocessed Transformed Paterns


Data Data

Gambar 2.1. Proses KDD

Sumber : (Gullo, 2015)

Proses KDD adalah urutan berulang dan interaktif dari langkah-langkah

utama berikut, (Gullo, 2015):

• Data Selection, yang tujuan utamanya adalah untuk membuat kumpulan data

target dari data asli, yaitu, memilih subset variable atau sample data, dimana

penemuan harus dilakukan;

• Data Preprocessing, yang bertujuan untuk “membersihkan” data dengan

melakukan berbagai operasi, seperti pemodelan kebisingan dan pengulangan,

mendefinisikan strategi yang tepat untuk menangani bidang data yang hilang,

akuntansi untuk informasi urutan waktu;

• Data Transformasi, yang bertugas mengurangi dan memproyeksikan data,

dalam rangka untuk memperoleh representasi yang sesuai untuk tugas spesifik

yang akan dilakukan; ini biasanya dilakukan dengan melibatkan teknik

transformasi atau metode yang mampu menemukan representasi data yang tidak

berubah;

• Data Mining, yang berkaitan dengan pengambilan pola yang menarik dengan

memilih metode data mining tertentu atau tugas (misalnya, summarization,

12
classification, clustering, regression, dan sebagainya), algoritma yang tepat

untuk melakukan tugas di tangan, dan representatif yang tepat dari hasil output;

• Data Interpretation/Evaluation, yang di eksploitasi oleh pengguna untuk

menafsirkan dan mengekstrak pengetahuan dari pola yang ditambang, dengan

menvisualisasikan pola. Interpretasi ini biasanya dilakukan dengan

memvisualisasikan pola, model, atau data yang diberikan model tersebut dan,

dalam kasus, secara iteratif melihat kembali langkah-langkah sebelumnya dari

proses.

2.2.3 Pengertian Data Mining

Data Mining atau penambangan data adalah teknik yang relatif cepat dan

mudah untuk menemukan pengetahuan, pola dan atau relasi antar data, secara

otomatis. Dengan menggabungkan empat disiplin ilmu komputer seperti pada

definisi di atas, pengetahuan bisa diketemukan dalam lima proses berurutan:

seleksi, pra pemrosesan, transformasi, data mining, dan interpretasi/evaluasi

(Suyanto, 2017).

Data Mining adalah proses menemukan pola-pola menarik dari jumlah data

yang sangat kecil. Sebagai proses penemuan pengetahuan, biasanya melibatkan

pembersihan data, integrasi data, pemilihan data, transformasi data, penemuan pola,

evaluasi pola, dan presentasi pengetahuan (Han et al, 2012).

Data mining merupakan suatu proses untuk mengidentifikasi pola yang

memiliki potensi dan berguna untuk mengelola dataset yang besar (Witten et al,

2011). Data Mining merupakan penggalian makna yang tersembunyi dari

kumpulan data yang sangat besar. Karena itu data mining sebenarnya memiliki akar

13
yang panjang dari bidang ilmu seperti kecerdasan buatan (artficial intelligent),

machine leraning, statistik dan basis data (Aprilla C dkk, 2013).

Dapat disimpulkan bahwa data mining adalah proses analisa dengan

menggali informasi dalam basis data dengan cara mengekstraksi untuk menemukan

suatu pola pengetahuan baru yang tidak diketahui sebelumnya dan akan bermanfaat

pada masa yang akan datang.

2.2.4 Pengelompokan Data Mining

Secara menyeluruh, kegunaan data mining dapat dibagi menjadi dua:

deskriptif dan prediktif (Suyanto, 2017). Deskriptif berarti data mining digunakan

untuk mencari pola-pola yang dapat dipahami manusia yang menjelaskan

karakteristik data. Sedangkan prediktif adalah data mining digunakan untuk

membentuk sebuah model pengetahuan yang akan digunakan untuk melakukan

prediksi.

Berdasarkan fungsionalitasnya, tugas-tugas data mining bisa

dikelompokkan kedalam delapan kelompok (Kotu et al, 2015), berikut ini adalah:

REGRESSION
CLASSIFICATION CLUSTERING

FEATURE
DATA MINING ASSOCIATION
SELECTION

ANOMALY
TEXT MINING
DETECTION
TIME SERIES
FORECASTING

Gambar 2.2 Data Mining Berdasarkan Fungsionalitas

Sumber : (Kotu et al, 2015)

14
• Klasifikasi (classification): menggeneralisasi struktur yang diketahui untuk

diaplikasikan pada data-data baru.

• Regresi (regression): menemukan suatu fungsi yang memodelkan data

dengan galat (kesalahan prediksi) seminimal mungkin.

• Klasterisasi (clustering) : mengelompokkan data, yang tidak diketahui label

kelasnya, ke dalam sejumlah kelompok tertentu sesuai dengan ukuran

kemiripannya.

• Pembelajaran aturan asosiasi (association rule learning) atau pemodelan ke

bergantungan (dependency modeling): mencari relasi antar variable.

• Deteksi anomali (anomaly detection): mengidentifikasi data yang tidak

umum, bisa berupa outlier (pencilan), perubahan atau deviasi yang mungkin

sangat penting dan perlu investigasi lebih lanjut.

• Peramalan Seri Waktu (Time Series Forecasting): Proses data mining

dimana akan membentuk model untuk memprediksi nilai suatu masa depan

dengan melihat atau menganalisa model di masa yang lalu.

• Penambangan Teks (Text Mining): Perbatasan baru analisis prediktif dan

domain dari data mining tidak terstruktur.

• Seleksi Fitur (Feature Selection): Proses identifikasi beberapa variable atau

atribut yang paling penting dalam model untuk prediksi yang akurat.

2.2.5 Metode Klasifikasi

Klasifikasi adalah wilayah penelitian yang sudah lama di mana kebanyakan

pendekatan dan algoritma yang berbeda telah ada didefinisikan, termasuk K Nearest

Neighbors (KNN), Decision Tress, Support Vector Machines (SVM), Neural

Networks, Gradient Boosted Decision Trees (GDBT) (Gullo, 2015).

15
Klasifikasi adalah suatu teknik dengan melihat pada kelakuan dan atribut

dari kelompok yang telah didefinisikan. Teknik ini dapat memberikan klasifikasi

pada data baru dengan memanipulasi data yang telah diklasifikasi dan dengan

menggunakan hasilnya untuk memberikan sejumlah aturan (Aprilla C dkk, 2013).

Klasifikasi adalah proses menemukan model (atau fungsi) yang

menggambarkan dan membedakan kelas atau konsep data. Model diturunkan

berdasarkan analisis satu set data pelatihan (yaitu, objek data yang dikenal oleh

label kelas). Model ini digunakan untuk memprediksi label kelas objek yang label

kelasnya tidak diketahui (Han et al, 2012).

Klasifikasi merupakan penentuan sebuah record data baru ke salah satu

beberapa kategori dimana telah ditentukan sebelumnya (Sinambela dkk, 2016).

KLASIFIKASI

Support Vector k Nearest


C4.5 AdaBoost Naive Bayes CART
Machine Neighbor

Gambar 2.3 Algoritma Klasifikasi

Sumber : (Sinambela dkk, 2016)

Untuk membuat suatu data dalam klasifikasi diantaranya:

1. Kelas, merupakan variable tidak bebas atau dapat dikatakan hasil dari

klasifikasi.

2. Prediktor, merupakan variable bebas yang digunakan untuk menentukan

pola atau karakteristik data yang akan diklasifikasikan.

16
3. Set data training, merupakan sekumpulan data yang berisi kelas dan

prediktor yang akan diuji untuk mendapat pengelompokan sesuai dengan

kelas yang tepat.

4. Set Data Uji, merupakan data-data baru yang akan di kelompokkan oleh

model guna mengetahui akurasi dari model yang telah dibuat.

2.2.6 Decision Tree (Pohon Keputusan)

Diantara beberapa metode yang dapat digunakan untuk klasifikasi adalah

metode pohon keputusan atau decision tree. Metode pohon keputusan merupakan

sebuah metode yang dapat mengubah fakta yang sangat besar menjadi sebuah

pohon keputusan yang merepresentasikan aturan.

Sebuah pohon keputusan adalah sebuah struktur yang dapat digunakan

untuk membagi kumpulan-kumpulan data yang besar menjadi himpunan-himpunan

record yang lebih kecil dengan menerapkan serangkaian aturan keputusan. Dengan

masing-masing rangkaian pembagi, anggota himpunan hasil menjadi mirip satu

dengan yang lainnya. Data dalam pohon keputusan biasanya dinyatakan dalam

bentuk tabel dengan atribut dan record. Atribut menyatakan suatu parameter yang

dibuat sebagai kriteria dalam pembentukan pohon. Proses pada pohon keputusan

adalah mengubah bentuk data (tabel) menjadi model pohon, mengubah model

pohon menjadi rule, dan menyederhanakan rule. Beberapa Algoritma yang bisa

digunakan dalam pembentukan pohon keputusan, diantaranya IDE3, CART, dan

C4.5. Algoritma C4.5 merupakan pengembangan dari algoritma ID (Mardi, 2017).

Pohon keputusan adalah salah satu metode yang paling populer untuk

klasifikasi dalam berbagai aplikasi data mining dan membantu proses pengambilan

keputusan. Pohon keputusan adalah pohon terarah dengan simpul akar yang tidak

17
memiliki tepi masuk dan semua simpul lainnya dengan tepat satu ujung yang

masuk, yang dikenal sebagai simpul keputusan. Pada tahap pelatihan, setiap simpul

internal membagi ruang contoh menjadi dua atau lebih bagian dengan tujuan

mengoptimalkan kinerja pengklasifikasi. Setelah itu, setiap jalur dari simpul akar

ke simpul daun membentuk aturan keputusan untuk menentukan kelas mana yang

merupakan turunan baru (Dai et al, 2014).

Pohon keputusan khas terdiri dari node internal, tepi dan simpul daun.

Setiap simpul internal disebut simpul keputusan yang mewakili pengujian pada

atribut atau subkumpulan atribut, dan setiap sisi diberi label dengan nilai atau

rentang nilai tertentu dari atribut masukan. Dengan cara ini, node internal yang

terkait dengan tepiannya membagi ruang instance menjadi dua atau lebih partisi.

Setiap simpul daun adalah simpul terminal pohon dengan label kelas. Misalnya,

Gambar 2.4 memberikan ilustrasi dari pohon keputusan dasar, dimana lingkaran

berarti simpul keputusan dan persegi berarti simpul daun. Dalam contoh ini,

memiliki tiga atribut pemisahan, yaitu usia, jenis kelamin, dan kriteria 3, bersama

dengan dua label kelas, yaitu, YA dan TIDAK. Setiap jalur dari simpul akar ke daun

node membentuk aturan klasifikasi (Dai et al, 2014).

age
≥20 <20

NO
gender
female <20

YES
criteria 3
yes no

YES NO

Gambar 2.4 Contoh Decision Tree

Sumber : (Dai et al, 2014)

18
2.2.7 Algoritma C4.5

Salah satu algoritma yang dapat digunakan untuk membuat pohon

keputusan (decision tree) adalah algoritma C4.5. Algoritmaa C4.5 merupakan

algoritma yang sangat popular yang digunakan oleh banyak peneliti di dunia, hal

ini dijelaskan oleh Algoritmaa C4.5 merupakan pengembangan dari algoritma ID3

yang diciptakan oleh J. Rose Quinlan (Mardi, 2017).

Secara Umum algoritma C4.5 untuk membangun pohon keputusan adalah sebagai

berikut:

1. Pilih atribut sebagai akar

2. Buat cabang untuk tiap-tiap nilai

3. Bagi kasus dalam cabang

4. Ulangi proses untuk setiap cabang sampai semua kasus pada cabang

memiliki kelas yang sama.

Untuk memilih atribut sebagai akar, didasarkan pada nilai gain tertinggi dari

atribut-atribut yang ada.

2.2.8 Keuntungan dan Kerugian Algoritma C4.5

Algoritma C4.5 memungkinkan pemangkasan pohon keputusan yang

dihasilkan. Hal ini meningkatkan tingkat kesalahan pada data pelatihan, tetapi yang

lebih penting, menurunkan tingkat kesalahan pada data pengujian yang tidak

terlihat. Algoritma C4.5 juga dapat menangani atribut numerik, nilai yang hilang,

data noise. Dan memiliki kelebihan dasn kerugian (Singh et al, 2014), sebagai

berikut :

19
• Keuntungan, yaitu :

1. C4.5 dapat menangani atribut kontinyu dan diskrit

2. C.45 memungkinkan nilai atribut yang hilang diubah menjadi tanda

“?”, Nilai atribut yang hilang tidak digunakan dalam penghitungan

gain dan entropy.

3. C4.5 melalui pohon yang sudah dibuat dan dicoba untuk menghapus

cabang yang tidak membantu dengan menggantinya dengan simpul

daun.

• Kerugian, yaitu :

1. C4.5 dapat membangun cabang kosong yang nilainya tidak

berkontribusi untuk menghasilkan aturan.

2. Terjadi overfitting akibat dari noise data.

3. Noise data yang rentan terjadi pada C.45

2.2.9 Tahapan Membangun Algoritma C4.5

Untuk membangun tahapan sebuah pohon keputusan dengan algoritma C4.5

(Rohman, 2016) dan (Raharja, 2014), adalah sebagai berikut :

• Awal, mempersiapkan data training, data diambil dari data history yang

pernah terjadi sebelumnya dan sudah dikelompokan dalam kelas-kelas

tertentu.

• Entropy, yaitu konsep yang menyatakan tingkat impurity dari kumpulan

objek atau suatu himpunan, menentukan nilai entropy dapat dihitung dengan

rumus berikut :

𝐸𝑛𝑡𝑟𝑜𝑝𝑦 (𝑆) = ∑ − 𝑃𝑗 𝑙𝑜𝑔2 𝑃𝑗 (2.1)


𝑗=1

20
Keterangan dari persamaan (2.1):

S : Himpunan Kasus

n : Jumlah Partisi S

Pj : Jumlah probabilitas yang di dapat dari kelas dibagi total kasus

• Information Gain, yaitu kriteria yang digunakan untuk memilih suatu atribut

yang populer, dapat dihitung dengan cara pengelompokan berdasarkan

masing-masing atribut dalam suatu data. Notasi information gain adalah

Gain (S,A) yang berarti dalam data atribut A relatif terhadap output S,

menentukan nilai information gain dapat dihitung sebagai berikut :

𝑛
|𝑆𝑖|
𝐺𝑎𝑖𝑛 (𝑆, 𝐴) = 𝐸𝑛𝑡𝑟𝑜𝑝𝑦 (𝑆) − ∑ ∗ 𝐸𝑛𝑡𝑟𝑜𝑝𝑦 (𝑆𝑖) (2.2)
|𝑆|
𝑖=1

Keterangan dari persamaan (2.2):

S : Himpunan Kasus

n : Jumlah Partisi S

A : Atribut

Si : Jumlah kasus pada atribut A yang memiliki partisi ke-i

• Split Information, yaitu nilai split pada tiap atribut atau term baru sebelum

menentukan gain ratio, menentukan nilai split information dapat dihitung

sebagai berikut :

𝑛
𝑆𝑖 𝑆𝑖
𝑆𝑝𝑙𝑖𝑡 𝐼𝑛𝑓𝑜𝑟𝑚𝑎𝑡𝑖𝑜𝑛 (𝑆, 𝐴) = − ∑ ∗ 𝑙𝑜𝑔2 ∗ (2.3)
𝑆 𝑆
𝑖=1

21
Keterangan dari persamaan (2.3):

S : Himpunan Kasus

n : Jumlah Partisi S

A : Atribut

Si : Jumlah kasus pada atribut A yang memiliki partisi ke-i

• Gain Ratio, yaitu nilai yang dipilih untuk menjadi akar pohon, menentukan

nilai gain ratio dapat dihitung sebagai berikut :

𝐺𝑎𝑖𝑛 (𝑆, 𝐴)
𝐺𝑎𝑖𝑛 𝑅𝑎𝑡𝑖𝑜 (𝑆, 𝐴) = (2.4)
𝑆𝑝𝑙𝑖𝑡 𝐼𝑛𝑓𝑜𝑟𝑚𝑎𝑡𝑖𝑜𝑛 (𝑆, 𝐴)

Keterangan dari persamaan (2.4):

S : Himpunan Kasus

A : Atribut

Dengan mengetahui rumus-rumus diatas, data yang telah diperoleh dapat

dimasukkan dan diproses dengan algoritma C4.5.

Setelah itu dilanjutkan proses evaluasi dengan confusion table dan ROC

curve. Hasil confusion table digunakan untuk menyajikan accuracy, recall, dan

precision dalam algoritma klasifikasi. Accuracy merupakan persentase antara nilai

prediksi dengan nilai sebenarnya yang ada. Recall merupakan persentase nilai

kinerja keberhasilan algoritma yang dipakai. Precision merupakan nilai akurasi

dengan kelas yang telah diprediksi.

22
Tabel 2.2 Confusion Table

Nilai Sebenarnya

TRUE FALSE

TP FP
TRUE (True Positive) (False Negative)
Correct Result Unexpeted Result
Nilai
Prediksi
FN TN
FALSE (False negative) (True Negative)
Missing Result Correct Absence of Result

𝑇𝑃+𝑇𝑁
Rumus Accuracy = 𝑇𝑃+𝑇𝑁+𝐹𝑃+𝐹𝑁 ∗ 100%

𝑇𝑃
Rumus Recall = 𝑇𝑃+𝐹𝑁 ∗ 100%

𝑇𝑃
Rumus Precision = 𝑇𝑃+𝐹𝑃 ∗ 100%

Keterangan : TP = True Positive FP = False Positive

TN = True Negative FN = False Negative

Receiver Operating Characteristic (ROC) digunakan untuk mengevaluasi

hasil akurasi dalam bentuk grafik. ROC merupakan kurva yang akan menghasilkan

nilai Area Under Cover (AUC). AUC merupakan nilai akurasi area dibawah kurva

yang dihasilkan oleh ROC (Saifudin dkk, 2015). Performance keakurasian nilai

AUC dapat diklasifikasikan menjadi lima kelompok (Silalahi dkk, 2017), yaitu :

1. 0.90 – 1.00 = Excellent Clasification

2. 0.80 – 0.90 = Good Clasification

3. 0.70 – 0.80 = Fair Clasification

23
4. 0.60 – 0.70 = Poor Clasification

5. 0.50 – 0.60 = Failure

24
BAB III
METODOLOGI PENELITIAN

3.1 Objek Penelitian

3.1.1 Gambaran Umum

PT. Shuangying International Indonesia mulai beroperasi pada 23 Maret

2016 dan fokus pada pasar indonesia dan ekspor ke benua Asia. Di negara China

nya sendiri berdiri perusahaan pada tahun 2000 dan sudah memiliki 11 perusahaan.

Pabrik kami berlokasi di kawasan Cikarang Pusat, Jawa Barat. Berjarak 70km dari

Ibukota Jakarta. Produksi yang dibuat adalah produk Otomotif (Komponen Interior,

dan Exterior). Kami akan menyerap sekitar 1.00 tenaga kerja lokal pada tahun

pertama produksi, dan akan tumbuh menjadi sekitar 3.00 dalam 5 tahun produksi

dalam rencana kami.

Gambar 3.1 Lokasi Tempat Penelitian PT. Shuangying International Indonesia

Sumber : (Google Maps, 2018)

25
3.1.2 Visi dan Misi

Adapun visi dan misi dari PT. Shuangying International adalah sebagai berikut:

1. Visi PT. Shuangying International Indonesia

Pada saat menjadi supplier maka akan menjadi supplier terbaik,

Pada saat menjadi customer maka akan menjadi customer terbaik.

2. Misi PT. Shuangying International Indonesia

Berlandaskan pada kualitas dan keterampilan unggul, menghasilkan produk

dengan biaya terjangkau & superioritas nilai yang tinggi untuk

mengembangkan masyarakat, melampaui antusiasme pelanggan dan staf.

3.1.3 Struktur Organisasi

Pengorganisasian (organizing) merupakan proses penyusunan stuktur

organisasi yang sesuai dengan tujuan organisasi, sumber daya manusia yang

dimilikinya dan lingkungan yang melingkupinya. Dua aspek dalam penyusunan

struktur organisasi adalah departemen dan pembagian kerja. Departemen

merupakan pengelompokan kegiatan-kegiatan kerja suatu organisasi agar kegiatan-

kegiatan sejenis dapat saling berhubungan dikerjakan secara bersama. Hal ini akan

tercermin pada struktur formal suatu organisasi, dan tampak atau ditunjukkan oleh

suatu bagan organisasi.

Pembagian kerja adalah perincian tugas pekerjaan agar setiap individu

dalam organisasi bertanggung jawab untuk melaksanakan sekumpulan kegiatan

terbatas. Struktur organisasi menunjukkan kerangka dan susunan perwujudan pola

tetap hubungan-hubungan diantara fungsi-fungsi, bagian-bagian atau posisi,

maupun orang-orang yang menunjukkan kedudukan, tugas wewenang dan

tanggung jawab yang berbeda-beda dalam suatu organisasi.

26
Struktur ini mengandung unsur-unsur spesialisasi kerja, standarisasi kerja,

koordinasi, sentralisasi atau desentralisasi dalam pembuatan keputusan dan besaran

(ukuran) satuan kerja. Untuk itu agar tujuan organisasi pada PT. Shuangying

International Indonesia tercapai dengan baik maka perlu dibuatkan bagan

organisasi.

Bagan organisasi menggambarkan lima aspek utama suatu struktur

organisai, yaitu:

1. Pembagian Kerja

2. Manajer dan bawahan atau rantai perintah

3. Tipe pekerjaan yang diperintahkan

4. Pengelompokkan segmen-segmen pekerjaan

5. Tingkatan manajemen

Structure Organization
PT. Shuangying International Indonesia

Director of Operation

Vice Director Ass. Director

LOGISTIK &
HRD FINANCE TECHNICAL QUALITY PURCHASING
PRODUCTION

Gambar 3.2 Struktur Organisasi PT. Shuangying International Indonesia

Sumber : (Data Primer, 2018)

27
3.1.4 Departement dalam Struktur Organisasi

Struktur organisasi perusahaan dapat diartikan sebagai sebuah garis

bertingkat (hierarki), yang berisi komponen-komponen penyusun perusahaan.

Struktur tersebut akan menggambarkan dengan jelas departement, fungsi, hak dan

kewajiban dari masing-masing posisi yang ada dalam lingkup perusahaan tersebut,

diantaranya sebagai berikut:

1. HRD (Sumber Daya Manusia/SDM) bertanggung jawab menangani

berbagai masalah pada ruang lingkup karyawan, pegawai, buruh, manajer

dan tenaga kerja lainnya untuk dapat menunjang aktifitas organisasi atau

perusahaan.

2. Finance (keuangan) bertanggung jawab terhadap segala aktivitas keuangan,

baik dari pengelolaan, penerimaan, transaksi, pencatatan dan laporan

perusahaan.

3. Logistik bertanggung jawab mengatur sistem pemasukan, pengeluaran, dan

penyimpanan produk pada perusahaan.

4. Produksi bertanggung jawab memproduksi atau membuat barang sesuai

dengan yang direncanakan. Di departement ini komponen dirakit menjadi

sub-rakitan (sub-assembly), kemudian sub-rakitan dirakit lagi menjadi

barang jadi atau finish good ataupun hasil akhir dari perusahaan adalah sub-

rakitan yang langsung dijual ke customer.

5. Technical Quality bertanggung jawab terhadap sistim kualitas produk dan

sistemnya. Perlu digaris bawahi bahwa semua orang di perusahaan

bertanggung jawab terhadap kualitas di areanya masing-masing, tanggung

jawab Technical Quality Department disini adalah tanggung jawab official.

28
Department Technical Quality Department

Quality Manager
Chen Zongyu

Product Engineer QE
Ridwan F Rani Yuliani W

Leader
1 Person

Quality Control
Shift 1 : 2 Person
Shift 2 : 2 Person

Note : Quality Control Jobdesc : Inspection Line, Assembly Line & Handling Internal Problem

Gambar 3.3 Department Technical Quality

Sumber : (Data Primer, 2018)

6. Purchasing (Pembelian) bertanggung jawab dalam pembelian material,

mesin-mesin, peralatan, dan perlengkapan beserta fasilitas-fasilitas lainnya

yang mendukung kelancaran proses produksi.

3.2 Waktu Penelitian

Penelitian ini dilaksanakan selama 4 bulan pada bulan Juni 2018 sampai

dengan September 2018 di PT. Shuangying International Indonesia yang beralamat

di Kawasan Greendland International Industrial Center (GIIC) Blok BA No.2 Kota

Deltamas Desa Sukamahi Kecamatan Cikarang Pusat Kabupaten Bekasi 17530.

3.3 Pengumpulan dan Pengolahan Data

Jenis penelitian ini menggunakan model eksperimen, merupakan

mengunakan data dalam penelitian dan menghasilkan kesimpulan yang mampu

dibuktikan oleh pengamatan atau percobaan (Sunge, 2018).

29
Penelitian ini menggunakan data primer yang diperoleh secara langsung di

PT. Shuangying International Indonesia karena peneliti bekerja sebagai karyawan

di PT. Shuangying International Indonesia. Setelah data dikumpulkan berjumlah

112 data kemudian dibagi menjadi 2 yaitu data training sejumlah 90 data dan data

testing sejumlah 22 data dengan perbandingan 80% dan 20%. Hasil data training

digunakan untuk memperoleh hasil klasifikasi untuk prediksi pengendalian kualitas

dalam bentuk pohon keputusan dan data testing digunakan tingkat akurasi dari hasil

klasifikasi tersebut.

3.4 Peralatan

Penelitian yang dilakukan memerlukan peralatan untuk mendukung

pelaksanaan penelitian. Peralatan-peralatan tersebut berupa kebutuhan perangkat

lunak (software) dan perangkat keras (hardware), sebagai berikut :

• Kebutuhan software

1. Sistem Operasi Windows 8 versi 64 bit, untuk menjalankan program

data mining tools.

2. Rapidminer versi 5.3, sebagai data mining tools untuk menjalankan

tahap-tahap data mining, serta menghitung hasil akurasi.

• Kebutuhan hardware

1. Laptop Type Lenovo

2. Processor Intel Core i3

3. Memory Ram 4 GB

4. Hardisk 500 GB

30
3.4 Kerangka Pemikiran

Adapun kerangka pemikiran dari penelitian yang dilakukan adalah sebagai berikut:

Identifikasi Masalah Metode Pengembangan Impelementasinya Pengukuran

Belum ada
prediksi yang Dataset Produk
akurat dalam Confusion
pengambilan Matrix
Framework Produk
keputusan
RapidMiner OK dan NOK
dalam Algoritma Kurva ROC
klasifikasi Klasifikasi
untuk produk
cacat C4.5

Gambar 3.4 Kerangka Pemikiran

Sumber : (Data Primer, 2018)

31
BAB IV
HASIL DAN PEMBAHASAN

4.1 Hasil Penelitian

Dari proses klasifikasi dengan menggunakan Knowledge Discovery in

Databases (KDD) kemudian menganalisa produk cacat.

Tabel 4.1 Kategori Produk Cacat pada PT. Shuangying International Indonesia.

No Atribut Penentuan Calon Cabang


1 Berat Produk Berat Besar Berat Sedang Berat Kecil
2 Bentuk Produk Bentuk Besar Bentuk Sedang Bentuk Kecil
3 Pengukuran Pengukuran ada Pengukuran tidak ada
4 Ukuran Cacat Ukuran Besar Ukuran Kecil Ukuran tidak ada
5 Posisi Posisi Luar Posisi Dalam
6 Area Area Lock Area rib Area no lock & rib

Dari hasil yang ada kemudian dikategorikan dengan variable, atribut

dengan nilai produk cacat kemudian dijadikan data training dan data testing.

Tabel 4.2 Data Training untuk produk cacat

Berat Bentuk Penguku Ukuran


Produk Posisi Area Hasil
Produk Produk ran Cacat
produk
lock
1 kecil besar ada besar luar NOK
produk
lock
2 sedang besar ada kecil luar NOK
produk
lock
3 kecil besar ada besar dalam NOK
produk
lock
4 sedang besar ada kecil dalam NOK
produk tidak
lock
5 besar besar ada ada luar OK
produk no lock
6 sedang besar ada kecil luar & rib NOK
produk
lock
7 kecil besar ada besar dalam NOK

32
Berat Bentuk Penguku Ukuran
Produk Posisi Area Hasil
Produk Produk ran Cacat
produk
lock
8 sedang besar ada kecil dalam NOK
produk tidak no lock
9 besar besar ada ada luar & rib OK
produk tidak
lock
10 besar besar ada ada dalam OK
produk no lock
11 kecil besar ada besar luar & rib NOK
produk no lock
12 sedang besar ada kecil luar & rib NOK
produk
lock
13 kecil besar ada besar dalam NOK
produk tidak
lock
14 besar besar ada ada dalam OK
produk no lock
15 kecil besar ada besar luar & rib NOK
produk no lock
16 sedang besar ada kecil luar & rib NOK
produk
lock
17 kecil besar ada besar dalam NOK
produk
lock
18 sedang besar ada kecil dalam NOK
produk tidak no lock
19 besar besar ada ada luar & rib OK
produk tidak
lock
20 besar besar ada ada Dalam OK
produk
lock
21 kecil kecil ada Besar Dalam NOK
produk
lock
22 sedang kecil ada Kecil Dalam NOK
produk
rib
23 kecil kecil ada Besar Dalam OK
produk no lock
24 sedang kecil ada Kecil Luar & rib NOK
produk tidak no lock
25 besar kecil ada ada Luar & rib OK
produk tidak
lock
26 besar kecil ada ada Dalam OK
produk tidak
rib
27 besar kecil ada ada Dalam OK
produk Tidak
lock
28 kecil kecil Ada Besar Dalam NOK
produk Tidak
lock
29 sedang kecil Ada Kecil Dalam NOK

33
Berat Bentuk Penguku Ukuran
Produk Posisi Area Hasil
Produk Produk ran Cacat
produk Tidak
rib
30 kecil kecil Ada Besar Dalam OK
produk Tidak no lock
31 sedang kecil Ada Kecil Luar & rib NOK
produk Tidak tidak no lock
32 besar kecil Ada ada Luar & rib OK
produk Tidak tidak
lock
33 besar kecil Ada ada Dalam OK
produk Tidak tidak
rib
34 besar kecil Ada ada Dalam OK
produk Tidak no lock
35 kecil sedang Ada Besar Luar & rib NOK
produk Tidak no lock
36 sedang sedang Ada Kecil Dalam & rib NOK
produk Tidak tidak no lock
37 besar sedang Ada ada Luar & rib NOK
produk Tidak tidak no lock
38 besar sedang Ada ada Dalam & rib NOK
produk Tidak
lock
39 kecil kecil Ada Besar Dalam NOK
produk Tidak
lock
40 sedang kecil Ada Kecil Dalam NOK
produk Tidak
rib
41 kecil kecil Ada Besar Dalam OK
produk Tidak
rib
42 sedang kecil Ada Kecil Dalam OK
produk Tidak tidak no lock
43 besar kecil Ada ada Luar & rib OK
produk Tidak tidak
lock
44 besar kecil Ada ada Dalam OK
produk Tidak tidak
rib
45 besar kecil Ada ada Dalam OK
produk Tidak no lock
46 kecil sedang Ada Besar Luar & rib NOK
produk Tidak no lock
47 sedang sedang Ada Kecil Luar & rib NOK
produk Tidak
lock
48 kecil sedang Ada Besar Dalam NOK
produk Tidak
rib
49 sedang sedang Ada Kecil Dalam OK
produk Tidak tidak no lock
50 besar sedang Ada ada Luar & rib OK
produk Tidak tidak
lock
51 besar sedang Ada ada Dalam OK

34
Berat Bentuk Penguku Ukuran
Produk Posisi Area Hasil
Produk Produk ran Cacat
produk Tidak tidak
rib
52 besar sedang Ada ada Dalam OK
produk Tidak no lock
53 kecil sedang Ada Besar Luar & rib NOK
produk Tidak no lock
54 sedang sedang Ada Kecil Luar & rib NOK
produk Tidak
lock
55 kecil sedang Ada Besar Dalam NOK
produk Tidak
rib
56 sedang sedang Ada Kecil Dalam OK
produk Tidak tidak no lock
57 besar sedang Ada ada Luar & rib OK
produk Tidak tidak
lock
58 besar sedang Ada ada Dalam OK
produk Tidak tidak
rib
59 besar sedang Ada ada Dalam OK
produk
lock
60 kecil besar ada Besar Luar NOK
produk
lock
61 sedang besar ada Kecil Luar NOK
produk
lock
62 kecil besar ada Besar Dalam NOK
produk
lock
63 sedang besar ada Kecil Dalam NOK
produk
lock
64 kecil besar ada Besar Luar NOK
produk
lock
65 sedang besar ada Kecil Luar NOK
produk
lock
66 kecil besar ada Besar Dalam NOK
produk
lock
67 sedang besar ada Kecil Dalam NOK
produk tidak
lock
68 besar besar ada ada Luar OK
produk tidak
lock
69 besar besar ada ada Dalam OK
produk no lock
70 kecil sedang ada Besar Luar & rib NOK
produk no lock
71 sedang sedang ada Kecil Luar & rib NOK
produk
lock
72 kecil sedang ada Besar Dalam NOK
produk
rib
73 sedang sedang ada Kecil Dalam OK

35
Berat Bentuk Penguku Ukuran
Produk Posisi Area Hasil
Produk Produk ran Cacat
produk tidak no lock
74 besar sedang ada ada Luar & rib OK
produk tidak
lock
75 besar sedang ada ada Dalam OK
produk tidak
rib
76 besar sedang ada ada Dalam OK
produk
lock
77 kecil besar ada Besar Luar NOK
produk
lock
78 sedang besar ada Kecil Luar NOK
produk
lock
79 kecil besar ada Besar Dalam NOK
produk tidak
lock
80 besar besar ada ada Dalam OK
produk
lock
81 kecil besar ada Besar Luar NOK
produk
lock
82 sedang besar ada Kecil Luar NOK
produk
lock
83 kecil besar ada Besar Dalam NOK
produk
lock
84 sedang besar ada Kecil Dalam NOK
produk tidak
lock
85 besar besar ada ada Luar OK
produk Tidak
lock
86 sedang kecil Ada Kecil Luar NOK
produk Tidak
lock
87 kecil kecil Ada Besar Dalam NOK
produk Tidak
lock
88 sedang kecil Ada Kecil Dalam NOK
produk Tidak tidak
lock
89 besar kecil Ada ada Luar OK
produk Tidak tidak
lock
90 besar kecil Ada ada Dalam OK

Tabel 4.2 menunjukan bahwa dari data training sebanyak 90 data, yang

diperoleh kelas OK berjumlah 37 produk dan NOK berjumlah 53 produk. Didapat

nilai entropy sebesar 0,97708, ternyata atribut tertinggi yaitu Berat dengan

information gain sebesar 0,516041, pada split info sebesar 1,583376 dan Gain Ratio

sebesar 0,325912

36
Tabel 4.3 Penghitungan Data Training

JML
OK NOK INFORMATION
ATRIBUT PRODUK ENTROPY SPLIT INFO GAIN
(Si) (Si) GAIN
(S)

TOTAL 90 37 53 0,977080223

BERAT 0,516041835 1,583376455 0,325912283

Besar 32 30 2 0,337290067

Sedang 29 4 25 0,578794625

Kecil 29 3 26 0,479832024

Entropy :

37 37 53 53
= ((− ) ∗ 𝑙𝑜𝑔2 ( ) + (− ) ∗ 𝑙𝑜𝑔2 ( ))
90 90 90 90

= 0,977080

Information Gain :

32 29 29
= (0,977080) − (( ) ∗ 0,337290) − (( ) ∗ 0,578794) − (( ) ∗ 0,479832)
90 90 90

= 0,516041

Split Information :

32 32 29 29 29 29
= −(( ) ∗ (𝑙𝑜𝑔2 ( ))) + ( ) ∗ (𝑙𝑜𝑔2 ( ))) + ( ) ∗ (𝑙𝑜𝑔2 ( ))))
90 90 90 90 90 90

= 1,583376

Gain Ratio :

0,516041
= = 0,325912
1,583376

37
Pada penelitian ini dilakukan proses read excel, berikut permodelan yang

didalam read excel :

Gambar 4.1 Model Read Excel dengan Decision Tree C4.5

Sumber : (Data Primer, 2018)

Dan dilanjutkan penelitian untuk dilakukan proses validasi menggunakan

fitur cross validation. Berikut merupakan permodelan yang ada didalam cross

validation :

Gambar 4.2 Model Cross Validation dengan Decision Tree C4.5

Sumber : (Data Primer, 2018)

Pada permodelan cross validation didalamnya terdapat dua bagian, yaitu bagian

training (digunakan untuk algoritma klasifikasi Decision Tree) dan testing bagian

testing (menggunakan fitur Apply Model untuk mengaplikasikan model pada data

38
testing dan fitur Performance untuk menampilkan confusion table, yang diigunakan

untuk menampilkan hasil dari accuracy, recall, precision, dan nilai AUC.

Maka terbentuk simpul-simpul diperoleh decision tree untuk klasifikasi

prediksi produk cacat pada gambar 4.3

Gambar 4.3 Pohon Keputusan Produk Cacat

Sumber : (Data Primer, 2018)

39
Berikut deskripsi dari permodelan yang dihasilkan decision tree :

Gambar 4.4 Deskripsi Permodelan Decision Tree C4.5

Sumber : (Data Primer, 2018)

4.2 Pembahasan

Banyaknya produk cacat pada saat proses produksi terbuang karena tidak

memiliki pengambilan keputusan secara klasifikasi produk cacat yang bisa

membantu mempermudah proses pemeriksaan, sehingga inspector kesulitan dalam

mencari limit produk cacat ataupun membuat laporan pemeriksaan setiap harinya.

Selain itu lamanya dalam proses pemeriksaan bisa mengurangi hasil produksi dan

tentunya hal ini bisa menjadi kerugian untuk perusahaan.

Berdasarkan penelitian yang telah dilakukan, maka hasil penelitian sebagai

berikut, setelah data diolah maka diuji tingkat akurasinya dari metode yang

40
digunakan dari metode Algoritma C4.5 dilakukan tingkat akurasi dengan confusion

matrix dan kurva ROC/AUC (Area Under Cover).

Perhitungan akurasi data training dari 90 data, 51 data diklasifikasikan

prediksi NOK dan ternyata NOK, 2 data diprediksi NOK tetapi ternyata OK, 2 data

diprediksi OK tetapi ternyata NOK dan sebanyak 35 data diprediksi sesuai OK,

dengan nilai accuracy sebesar 95,56%.

Gambar 4.5 Hasil Accuracy (Data Training) Decision Tree C4.5

Sumber : (Data Primer, 2018)

Penghitungan Accuracy :

Tabel 4.4 Confusion Matrix Penghitungan Accuracy

Nilai Sebenarnya

TRUE FALSE

TP FP
TRUE
51 2
Nilai
Prediksi
FN TN
FALSE
2 35

41
𝑇𝑃 + 𝑇𝑁
𝐴𝑐𝑐𝑢𝑟𝑎𝑐𝑦 = ∗ 100%
𝑇𝑃 + 𝑇𝑁 + 𝐹𝑃 + 𝐹𝑁

51 + 35
= ∗ 100%
51 + 35 + 2 + 2

86
= ∗ 100%
90

= 0,95555 ∗ 100%

= 95,56%

Perhitungan akurasi berdasarkan recall, 51 data diklasifikasikan prediksi

NOK dan ternyata NOK, 2 data diprediksi NOK tetapi ternyata OK, 2 data

diprediksi OK tetapi ternyata NOK dan sebanyak 35 data diprediksi sesuai OK,

dengan nilai recall sebesar 95,00%.

Gambar 4.6 Hasil Recall (Data Training) Decision Tree C4.5

Sumber : (Data Primer, 2018)

42
Penghitungan Recall :

Tabel 4.5 Confusion Matrix Penghitungan Recall

Nilai Sebenarnya

TRUE FALSE

TP FP
TRUE
51 2
Nilai
Prediksi
FN TN
FALSE
2 35

𝑇𝑃
𝑅𝑒𝑐𝑎𝑙𝑙 = ∗ 100%
𝑇𝑃 + 𝐹𝑁

51
= ∗ 100%
51 + 2

51
= ∗ 100%
53

= 0,96225 ∗ 100%

= 96,23%

Perhitungan akurasi berdasarkan precision, 51 data diklasifikasikan prediksi

NOK dan ternyata NOK, 2 data diprediksi NOK tetapi ternyata OK, 2 data

diprediksi OK tetapi ternyata NOK dan sebanyak 35 data diprediksi sesuai OK,

dengan nilai precision sebesar 95.00%.

43
Gambar 4.7 Hasil Precision (Data Training) Decision Tree C4.5

Sumber : (Data Primer, 2018)

Penghitungan Precision :

Tabel 4.6 Confusion Matrix Penghitungan Precision

Nilai Sebenarnya

TRUE FALSE

TP FP
TRUE
51 2
Nilai
Prediksi
FN TN
FALSE
2 35

𝑇𝑃
𝑃𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛 = ∗ 100%
𝑇𝑃 + 𝐹𝑃

51
= ∗ 100%
51 + 2

51
= ∗ 100%
53

= 0,96225 ∗ 100%

= 96,23%

44
Hasil yang didapat dari pengolahan ROC metode Algoritma C4.5 sebesar

1.000 menggunakan data training dapat dilihat gambar 4.11 dengan tingkat akurasi

Excellent Clasification.

Gambar 4.8 Hasil Evaluasi Data Training ROC/AUC

Sumber : (Data Primer, 2018)

45
BAB V
KESIMPULAN

5.1 Kesimpulan

Kesimpulan dari penelitian ini adalah hasil analisa data mining dari produk

cacat pada PT. Shuangying International Indonesia dengan metode

klasifikasi (C4.5).

Data mining dapat diaplikasikan sebagai pengetahuan, informasi untuk

mengatasi masalah yang telah terindentifikasi pada penelitian ini. Dari hasil

data mining produk cacat, dapat terurai menjadi pengetahuan dan prediksi

sehingga hasil dari pengolahan data dapat menjadi sumber informasi dalam

produk cacat. Dari 90 data training diperoleh menjadi produk OK (37) dan

NOK (57). Berdasarkan evaluasi dan pengujian prediksi yang telah

dilakukan, analisa data mining dengan metode klasifikasi untuk produk

cacat pada PT. Shuangying International Indonesia, menggunakan

Algoritma C4.5 dengan Confusion Matrix menghasilkan accuracy sebesar

95,56%, recall sebesar 95,00%, dan precision sebesar 95,00%. Hasil yang

didapat dari pengolahan kurva ROC sebesar 1.000 menggunakan data

training dengan tingkat akurasi Excellent Clasification.

5.2 Saran

Berdasarkan penelitian yang dilakukan, penulis dapat memberikan beberapa

saran sebagai berikut:

1. Memaksimalkan atau menambah atribut yang lebih spesifik dan lebih

banyak dalam menentukan prediksi produk cacat seperti parameter

46
setting, jenis material, campuran material dan lain sebagainya oleh

bagian pemeriksa agar prediksi produk cacat lebih akurat.

2. Perlu adanya penelitian lebih lanjut dengan melakukan pengujian

dengan metode lain maupun komparasi seperti Naïve Bayes, Neural

Network dan lain sebagainya agar memperoleh perbandingan dengan

tingkat akurasi yang paling tinggi dalam membuat kualifikasi prediksi

produk cacat.

47
DAFTAR PUSTAKA

Aprilla C, Dennis., Baskoro, Donny Aji., Ambarwati, Lia., Wicaksana, I Wayan

Simri. (2013). Belajar Data Mining Dengan RapidMiner, 5(4), 1–5.

https://doi.org/10.1007/s13398-014-0173-7.2

Cahyadi, D. (2014). Analisis Parameter Operasi Pada Proses Plastik Injection

Molding Untuk Pengendalian Cacat Produk. Jurnal Mesin Teknologi, 8(2), 8–

16. Retrieved from

https://jurnal.umj.ac.id/index.php/sintek/article/view/161/143

Dai, Wei., Ji, W. (2014). A Map Reduce Implementation of C4.5 Decision Tree

Algorithm, 7(1), 49–60.

Dewi, Shanty Kusuma. (2012). Minimasi Defect Produk Dengan Konsep Six Sigma.

Jurnal Teknik Industri, 13, 43–50.

Gullo, Francesco. (2015). From Patterns in Data to Knowledge Discovery: What

Data Mining Can Do. Physics Procedia, 62, 18–22.

https://doi.org/10.1016/j.phpro.2015.02.005

Han, Jiawei., Kamber, Micheline ., Pei, Jian. (2012). Data Mining: Concepts and

Techniques. San Francisco, CA, itd: Morgan Kaufmann.

https://doi.org/10.1016/B978-0-12-381479-1.00001-0

Kotu, Vijay., Deshpanda, Bala. (2015). Predictive Analytics and Data Mining. In

Predictive Analytics and Data Mining (pp. 1–16). Morgan Kaufmann.

https://doi.org/10.1016/B978-0-12-801460-8.00001-X

Mardi, Yuli. (2017). Data Mining : Klasifikasi Menggunakan Algoritma C4.5.

48
Jurnal Edik Informatika, 2(2), 213–219.

Novandya, Adhika., Oktria, Isni. (2017). Penerapan Algoritma Klasifikasi Data

Mining C4.5 Pada Dataset Cuaca Wilayah Bekasi. Jurnal Format, 6(2), 98–

106.

Raharja, Yosoa Putra. (2014). Rancang Bangun Sistem Rekomendasi Beasiswa

Menggunakan ALgoritma Klasifikasi C4.5 pada Universitas Dian

Nuswantoro. Undinus, 1–4. Retrieved from http://eprints.dinus.ac.id/13408/

Rohman, Abdul. (2016). Komporasi Metode Klasifikasi Data Mining Untuk

Prediksi Penyakit Jantung. Neo Teknika, 2(2), 21–28.

Saifudin, Aries., Wahono, Romi Satrio. (2015). Penerapan Teknik Ensemble untuk

Menangani Ketidakseimbangan Kelas pada Prediksi Cacat Software. Journal

of Software Engineering, 1(1), 28–37. https://doi.org/10.1016/S1896-

1126(14)00030-3

Saleh, Hamsir. (2017). Prediksi Kebangrutan Perusahaan Menggunakan

Algoritma C4.5 Berbasis Forward Selection, 9, 173–180.

Silalahi, Kristiani Desri., Murfi, Hendri., Satria, Yudi. (2017). Studi Perbandingan

Pemilihan Fitur untuk Support Vector Machine pada Klasifikasi Penilaian

Risiko Kredit, 1(2), 119–136.

Sinambela, Mutiara Shany., Mayadewi, RA Paramita., Rosely, Ely. (2016). Sistem

Pendukung Keputusan Peminatan Jurusan Siswa Di SMA Menggunakan

Algoritma Klasifikasi Data Mining C4.5, 2(3), 858–866.

Singh, Sonia., Gupta, Prinyanka. (2014). Comparative Study ID3 , CART And C4.5

Decision Tree Algorithm : A Survey, 27(27), 97–103.

49
Sunge, Aswan Supriyadi. (2018). Prediksi Kompetensi Karyawan Menggunakan

Algoritma C4.5 ( Studi Kasus : PT Hankook Tire Indonesia ), 2018(Sentika),

23–24.

Suyanto. (2017). Data Mining Untuk Klasifikasi Dan Klasterisasi Data. Penerbit:

Informatika Bandung. (ISBN): 978-602-6232-36-6.

Wahyono., Nugroho, Agung. (2018). Penerapan Algoritma C4.5 Untuk Prediksi

Tingkat Kompetensi Karyawan PT Multistrada Arah Sarana, 3(1), 1–6.

Witten, Ian H., Frank, Eibe. (2011). Data Mining: Practical Machine Learning

Tools and Techniques (Google eBook). Complementary literature None.

https://doi.org/0120884070, 9780120884070

50
LAMPIRAN

Data Set :

Berat Bentuk Ukuran


Produk Pengukuran Posisi Area Hasil
Produk Produk Cacat
produk
lock
1 kecil Besar ada Besar Luar NOK
produk
lock
2 sedang Besar ada Kecil Luar NOK
produk
lock
3 kecil Besar ada Besar Dalam NOK
produk
lock
4 sedang Besar ada Kecil Dalam NOK
produk tidak
lock
5 besar Besar ada ada Luar OK
produk tidak
lock
6 besar Besar ada ada Dalam OK
produk no lock
7 kecil Besar ada Besar Luar & rib NOK
produk no lock
8 sedang Besar ada Kecil Luar & rib NOK
produk
lock
9 kecil Besar ada Besar Dalam NOK
produk
lock
10 sedang Besar ada Kecil Dalam NOK
produk tidak no lock
11 besar Besar ada ada Luar & rib OK
produk tidak
lock
12 besar Besar ada ada Dalam OK
produk no lock
13 kecil Besar ada Besar Luar & rib NOK
produk no lock
14 sedang Besar ada Kecil Luar & rib NOK
produk
lock
15 kecil Besar ada Besar Dalam NOK
produk
lock
16 sedang Besar ada Kecil Dalam NOK
produk tidak no lock
17 besar Besar ada ada Luar & rib OK
produk tidak
lock
18 besar Besar ada ada Dalam OK
produk no lock
19 kecil Besar ada Besar Luar & rib NOK
produk no lock
20 sedang Besar ada Kecil Luar & rib NOK

51
Berat Bentuk Ukuran
Produk Pengukuran Posisi Area Hasil
Produk Produk Cacat
produk
lock
21 kecil Besar ada Besar Dalam NOK
produk
lock
22 sedang Besar ada Kecil Dalam NOK
produk tidak no lock
23 besar Besar ada ada Luar & rib OK
produk tidak
lock
24 besar Besar ada ada Dalam OK
produk
lock
25 kecil Kecil ada Besar Dalam NOK
produk
lock
26 sedang Kecil ada Kecil Dalam NOK
produk
rib
27 kecil Kecil ada Besar Dalam OK
produk
rib
28 sedang Kecil ada Kecil Dalam OK
produk no lock
29 kecil Kecil ada Besar Luar & rib NOK
produk no lock
30 sedang Kecil ada Kecil Luar & rib NOK
produk tidak no lock
31 besar Kecil ada ada Luar & rib OK
produk tidak
lock
32 besar Kecil ada ada Dalam OK
produk tidak
rib
33 besar Kecil ada ada Dalam OK
produk
lock
34 kecil Kecil Tidak Ada Besar Dalam NOK
produk
lock
35 sedang Kecil Tidak Ada Kecil Dalam NOK
produk
rib
36 kecil Kecil Tidak Ada Besar Dalam OK
produk
rib
37 sedang Kecil Tidak Ada Kecil Dalam OK
produk no lock
38 kecil Kecil Tidak Ada Besar Luar & rib NOK
produk no lock
39 sedang Kecil Tidak Ada Kecil Luar & rib NOK
produk tidak no lock
40 besar Kecil Tidak Ada ada Luar & rib OK
produk tidak
lock
41 besar Kecil Tidak Ada ada Dalam OK
produk tidak
rib
42 besar Kecil Tidak Ada ada Dalam OK
produk no lock
43 kecil Sedang Tidak Ada Besar Luar & rib NOK

52
Berat Bentuk Ukuran
Produk Pengukuran Posisi Area Hasil
Produk Produk Cacat
produk no lock
44 sedang Sedang Tidak Ada Kecil Dalam & rib NOK
produk tidak no lock
45 besar Sedang Tidak Ada ada Luar & rib NOK
produk tidak no lock
46 besar Sedang Tidak Ada ada Dalam & rib NOK
produk no lock
47 kecil Kecil Tidak Ada Besar luar & rib NOK
produk no lock
48 sedang Kecil Tidak Ada Kecil Luar & rib NOK
produk
lock
49 kecil Kecil Tidak Ada Besar Dalam NOK
produk
lock
50 sedang Kecil Tidak Ada Kecil Dalam NOK
produk
rib
51 kecil Kecil Tidak Ada Besar Dalam OK
produk
rib
52 sedang Kecil Tidak Ada Kecil Dalam OK
produk tidak no lock
53 besar Kecil Tidak Ada ada Luar & rib OK
produk tidak
lock
54 besar Kecil Tidak Ada ada Dalam OK
produk tidak
rib
55 besar Kecil Tidak Ada ada Dalam OK
produk no lock
56 kecil Sedang Tidak Ada Besar Luar & rib NOK
produk no lock
57 sedang Sedang Tidak Ada Kecil Luar & rib NOK
produk
lock
58 kecil Sedang Tidak Ada Besar Dalam NOK
produk
lock
59 sedang Sedang Tidak Ada Kecil Dalam NOK
produk
rib
60 kecil Sedang Tidak Ada Besar Dalam OK
produk
rib
61 sedang Sedang Tidak Ada Kecil Dalam OK
produk tidak no lock
62 besar Sedang Tidak Ada ada Luar & rib OK
produk tidak
lock
63 besar Sedang Tidak Ada ada Dalam OK
produk tidak
rib
64 besar Sedang Tidak Ada ada Dalam OK
produk no lock
65 kecil Sedang Tidak Ada Besar Luar & rib NOK
produk no lock
66 sedang Sedang Tidak Ada Kecil Luar & rib NOK

53
Berat Bentuk Ukuran
Produk Pengukuran Posisi Area Hasil
Produk Produk Cacat
produk
lock
67 kecil Sedang Tidak Ada Besar Dalam NOK
produk
lock
68 sedang Sedang Tidak Ada Kecil Dalam NOK
produk
rib
69 kecil Sedang Tidak Ada Besar Dalam OK
produk
rib
70 sedang Sedang Tidak Ada Kecil Dalam OK
produk tidak no lock
71 besar Sedang Tidak Ada ada Luar & rib OK
produk tidak
lock
72 besar Sedang Tidak Ada ada Dalam OK
produk tidak
rib
73 besar Sedang Tidak Ada ada Dalam OK
produk
lock
74 kecil Besar ada Besar Luar NOK
produk
lock
75 sedang Besar ada Kecil Luar NOK
produk
lock
76 kecil Besar ada Besar Dalam NOK
produk
lock
77 sedang Besar ada Kecil Dalam NOK
produk tidak
lock
78 besar Besar ada ada Luar OK
produk tidak
lock
79 besar Besar ada ada Dalam OK
produk
lock
80 kecil Besar ada Besar Luar NOK
produk
lock
81 sedang Besar ada Kecil Luar NOK
produk
lock
82 kecil Besar ada Besar Dalam NOK
produk
lock
83 sedang Besar ada Kecil Dalam NOK
produk tidak
lock
84 besar Besar ada ada Luar OK
produk tidak
lock
85 besar Besar ada ada Dalam OK
produk no lock
86 kecil Sedang ada Besar Luar & rib NOK
produk no lock
87 sedang Sedang ada Kecil Luar & rib NOK
produk
lock
88 kecil Sedang ada Besar Dalam NOK
produk
lock
89 sedang Sedang ada Kecil Dalam NOK

54
Berat Bentuk Ukuran
Produk Pengukuran Posisi Area Hasil
Produk Produk Cacat
produk
rib
90 kecil Sedang ada Besar Dalam OK
produk
rib
91 sedang Sedang ada Kecil Dalam OK
produk tidak no lock
92 besar Sedang ada ada Luar & rib OK
produk tidak
lock
93 besar Sedang ada ada Dalam OK
produk tidak
rib
94 besar Sedang ada ada Dalam OK
produk
lock
95 kecil Besar ada Besar Luar NOK
produk
lock
96 sedang Besar ada Kecil Luar NOK
produk
lock
97 kecil Besar ada Besar Dalam NOK
produk
lock
98 sedang Besar ada Kecil Dalam NOK
produk tidak
lock
99 besar Besar ada ada Luar OK
produk tidak
lock
100 besar Besar ada ada Dalam OK
produk
lock
101 kecil Besar ada Besar Luar NOK
produk
lock
102 sedang Besar ada Kecil Luar NOK
produk
lock
103 kecil Besar ada Besar Dalam NOK
produk
lock
104 sedang Besar ada Kecil Dalam NOK
produk tidak
lock
105 besar Besar ada ada Luar OK
produk tidak
lock
106 besar Besar ada ada Dalam OK
produk
lock
107 kecil Kecil Tidak Ada Besar Luar NOK
produk
lock
108 sedang Kecil Tidak Ada Kecil Luar NOK
produk
lock
109 kecil Kecil Tidak Ada Besar Dalam NOK
produk
lock
110 sedang Kecil Tidak Ada Kecil Dalam NOK
produk tidak
lock
111 besar Kecil Tidak Ada ada Luar OK
produk tidak
lock
112 besar Kecil Tidak Ada ada Dalam OK

55
Hasil Uji Plagiat :

56

Anda mungkin juga menyukai