SKRIPSI
Oleh :
311421111
TEKNIK INFORMATIKA
SEKOLAH TINGGI TEKNOLOGI PELITA BANGSA
BEKASI
2018
ANALISA DATA MINING DENGAN METODE
KLASIFIKASI UNTUK PRODUK CACAT PADA PT.
SHUANGYING INTERNATIONAL INDONESIA
SKRIPSI
Oleh :
311421111
TEKNIK INFORMATIKA
SEKOLAH TINGGI TEKNOLOGI PELITA BANGSA
BEKASI
2018
PERSETUJUAN
SKRIPSI
Menyetujui
Kaprodi Teknik Informatika
i
PENGESAHAN
SKRIPSI
Menyetujui
Kaprodi Teknik Informatika
Mengetahui
Ketua STT Pelita Bangsa
ii
PERNYATAAN KEASLIAN PENELITIAN
Saya yang bertanda tangan dibawah ini menyatakan bahwa, skripsi ini merupakan
karya saya sendiri (ASLI), dan isi dalam skripsi ini tidak terdapat karya yang pernah
diajukan oleh orang lain untuk memperoleh gelar akademis di suatu institusi
pendidikan tinggi mana pun, dan sepanjang pengetahuan saya juga tidak terdapat
karya atau pendapat yang pernah ditulis dan/atau diterbitkan oleh orang lain,
kecuali yang secara tertulis diacu dalam naskah ini dan disebutkan dalam daftar
pustaka.
Segala sesuatu yang terkait dengan naskah dan karya yang telah dibuat adalah
menjadi tanggungjawab saya pribadi.
Materai 6.000
RANI YULIANI
WULANDARI
NIM : 311421111
iii
KATA PENGANTAR
Penulis sungguh sangat menyadari, bahwa penulisan Skripsi ini tidak akan
terwujud tanpa adanya dukungan dan bantuan dari berbagai pihak. Sudah
selayaknya, dalam kesempatan ini penulis menghaturkan penghargaan dan ucapan
terima kasih yang sebesar-besarnya kepada:
a. Bapak Dr. Ir. Supriyanto, M.P selaku Ketua STT Pelita Bangsa
b. Bapak Aswan S. Sunge, S.Kom, M.Kom selaku Ketua Program Studi Teknik
Informatika STT Pelita Bangsa.
c. Bapak Aswan S. Sunge, S.Kom, M.Kom selaku Dosen Pembimbing 1 yang
telah banyak memberikan arahan dan bimbingan kepada penulis dalam
penyusunan Skripsi ini.
d. Ibu Nisa Nurhidayanti, S.Pd, M.T selaku Dosen Pembimbing 2 yang telah
banyak memberikan arahan dan bimbingan kepada penulis dalam penyusunan
Skripsi ini.
e. Seluruh Dosen STT Pelita Bangsa yang telah membekali penulis dengan
wawasan dan ilmu di bidang teknik informatika.
f. Seluruh staf STT Pelita Bangsa yang telah memberikan pelayanan terbaiknya
kepada penulis selama perjalanan studi jenjang Strata 1.
g. Rekan-rekan mahasiswa STT Pelita Bangsa, khususnya angkatan 2014, yang
telah banyak memberikan inspirasi dan semangat kepada penulis untuk dapat
menyelesaikan studi jenjang Strata 1.
iv
h. Ibu, Bapak, Adik-adik, Suami, dan Anak-anak tercinta yang senantiasa
mendoakan dan memberikan semangat dalam perjalanan studi Strata 1 maupun
dalam kehidupan penulis.
Akhir kata, penulis mohon maaf atas kekeliruan dan kesalahan yang terdapat
dalam Skripsi ini dan berharap semoga Skripsi ini dapat memberikan manfaat bagi
khasanah pengetahuan Teknologi Informasi di lingkungan STT Pelita Bangsa
khususnya dan Indonesia pada umumnya.
Penulis
v
DAFTAR ISI
PERSETUJUAN ...................................................................................................... i
PENGESAHAN ...................................................................................................... ii
ABSTRAK ............................................................................................................. xi
vi
2.1 Tinjauan Penelitian ................................................................................... 8
vii
BAB IV HASIL DAN PEMBAHASAN .............................................................. 32
LAMPIRAN .......................................................................................................... 51
viii
DAFTAR TABEL
Tabel 4.1 Kategori Produk Cacat Pada PT. Shuangying International Indonesia..32
ix
DAFTAR GAMBAR
x
ABSTRAK
Kata kunci: algoritma C4.5, data mining, decision tree, produk cacat
xi
ABSTRACT
xii
BAB I
PENDAHULUAN
terlihat banyaknya jenis kendaraan otomotif dari luar negeri yang berproduksi dan
dan menyerbu pelosok ke seluruh dunia. Revolusi informasi dan komunikasi zaman
ini melahirkan peradaban baru yaitu tidak dibatasi oleh waktu, informasi dapat kita
peroleh kapan saja dan dimana saja. Begitu pula halnya dalam dunia bisnis,
dengan telah banyaknya mengubah dan mempermudah sistem kerja para pelaku
bisnis.
data informasi dengan cepat dan mudah. Informasi merupakan salah satu jalan
untuk mengambil keputusan terhadap apa yang akan dilakukan pada tahap
efektivitas kerja.
utama. Apapun jenis produk suatu perusahaan tentunya membutuhkan jasa Quality
Assurance atau Quality Control dalam suatu divisi. Walaupun keduanya memiliki
definisi yang berbeda tetapi sama-sama memilki acuan pada mutu. Cukup disebut
1
Departemen Quality didalamnya ada kegiatan pemeriksaan dan merancang jaminan
Secara strategi pun kualitas atau mutu didefinisikan sebagai segala sesuatu
yang mampu memenuhi keinginan atau kebutuhan pelanggan (meeting the needs of
akan data dan informasi berbasiskan komputer. Data dan informasi sangat
dibutuhkan suatu perusahaan yang berskala besar, sedang, dan kecil. Sistem
meningkatkan keuntungan.
yang dapat digunakan sebagai sarana informasi yang dapat di akses oleh semua
pihak, baik pihak umum maupun pihak yang mempunyai akses. Sebuah perusahaan
(interior dan exterior) otomotif untuk kendaraan mobil yang beroperasi di kawasan
industri Grendland Deltamas Cikarang Pusat. Pada perusahaan ini terdapat sebuah
inspector mengalami kesulitan dalam prosesnya. Banyaknya produk cacat pada saat
2
klasifikasi produk cacat yang bisa membantu mempermudah proses pemeriksaan,
sehingga inspector kesulitan dalam mencari limit produk cacat ataupun membuat
laporan pemeriksaan setiap harinya. Selain itu lamanya dalam proses pemeriksaan
bisa mengurangi hasil produksi dan tentunya hal ini bisa menjadi kerugian untuk
perusahaan. Penyediaan data yang cepat dan akurat juga menjadi kendala utama
perusahaan dalam mengontrol hasil produksi setiap harinya. Dari beberapa alasan
masalah tersebut dapat terminimalisir. Maka dari itu diperlukan sebuah akurasi
INDONESIA”.
3
1. Pengolahan dan pencarian produk cacat memakan waktu yang lama
5. Belum adanya suatu akurasi atau metode dalam melihat suatu data dalam
yaitu : “Bagaimana menganalisa data mining untuk produk cacat pada PT.
(C4.5)?”.
Supaya pembahasan masalah yang dilakukan dapat terarah dengan baik dan
1. Proses yang akan diteliti berkisar pada penyediaan data pada bagian
pemeriksaan.
4
3. Pemeriksaan limit produk cacat diperiksa oleh Departemen Quality.
4. Tidak semua laporan pemeriksaan produk cacat dibuat data, produk cacat
Penulisan ini mempunyai beberapa tujuan dan manfaat antara lain sebagai
berikut:
dari penelitian ini adalah untuk menganalisa data mining untuk produk cacat
Klasifikasi (C4.5).
kontribusi lebih yang dapat dirasakan oleh berbagai pihak, khususnya bagi
penulis dan umumnya bagi semua pihak yang terlibat maupun tidak terlibat
dalam penulisan tugas skripsi ini, Adapun manfaat penulisan tugas ini
1. Bagi Penulis
5
2. Bagi Program Studi Teknik Informatika STT Pelita Bangsa
3. Bagi Perusahaan
International Indonesia.
BAB I PENDAHULUAN
terdahulu.
6
BAB IV HASIL DAN PEMBAHASAN
BAB V PENUTUP
7
BAB II
TINJAUAN PUSTAKA
Dari penelitian yang berkaitan dengan skripsi ini terutama dalam hal
sekunder yang diperoleh dari data PT Hankook Tire Indonesia di Bekasi yang
datanya dikumpulkan berjumlah 205 data kemudian dibagi menjadi 2 data yaitu
data training sejumlah 164 data dan data testing sejumlah 41 data dengan
yang datanya bervariasi jumlah recordnya yang berjumlah 250 record dan 150
Multi Strada Arah Sarana (Wahyono dkk, 2018). Penelitian ini membahas
8
dikumpulkan berjumlah 257 data karyawan kemudian dibagi menjadi 2 data
yaitu data training sejumlah 206 data dan data testing sejumlah 51 data dengan
Wilayah Bekasi (Novandya dkk, 2017). Penelitian ini membahas cuaca wilayah
Dari uraian diatas, maka penulis menyusun tabel rangkuman tinjauan penelitian
Risk.
9
No Tahun Judul Kesimpulan
3 2018 Penerapan Algoritma C4.5 Menggunakan algoritma C4.5
10
parameter mesin dan mengerti
pemilahan recycle.
dan pressure.
Produk cacat adalah produk yang belum sesuai dengan spesifikasi yang
Terjadinya produk cacat apabila tidak tepat dalam menentukan setting parameter
didalam suatu proses pada tekanan injeksi, temperatur injeksi dan waktu
terlalu rendah untuk nilai tekanan injeksi bisa menyebabkan cacat produk
diantaranya short shot, sink mark, dan sedangkan nilai tinggi bisa menyebabkan
produk flashing (Cahyadi, 2014). Misalkan untuk produk cacat short shot tidak
semuanya dinyatakan produk tidak bisa digunakan, dengan cara klasifikasi masih
11
Interpretation
Selection Preprocessing Tranformation Data Mining /Evaluation
....... ........
Data ....... ........ Knowledge
• Data Selection, yang tujuan utamanya adalah untuk membuat kumpulan data
target dari data asli, yaitu, memilih subset variable atau sample data, dimana
mendefinisikan strategi yang tepat untuk menangani bidang data yang hilang,
dalam rangka untuk memperoleh representasi yang sesuai untuk tugas spesifik
transformasi atau metode yang mampu menemukan representasi data yang tidak
berubah;
• Data Mining, yang berkaitan dengan pengambilan pola yang menarik dengan
12
classification, clustering, regression, dan sebagainya), algoritma yang tepat
untuk melakukan tugas di tangan, dan representatif yang tepat dari hasil output;
memvisualisasikan pola, model, atau data yang diberikan model tersebut dan,
proses.
Data Mining atau penambangan data adalah teknik yang relatif cepat dan
mudah untuk menemukan pengetahuan, pola dan atau relasi antar data, secara
(Suyanto, 2017).
Data Mining adalah proses menemukan pola-pola menarik dari jumlah data
pembersihan data, integrasi data, pemilihan data, transformasi data, penemuan pola,
memiliki potensi dan berguna untuk mengelola dataset yang besar (Witten et al,
kumpulan data yang sangat besar. Karena itu data mining sebenarnya memiliki akar
13
yang panjang dari bidang ilmu seperti kecerdasan buatan (artficial intelligent),
menggali informasi dalam basis data dengan cara mengekstraksi untuk menemukan
suatu pola pengetahuan baru yang tidak diketahui sebelumnya dan akan bermanfaat
deskriptif dan prediktif (Suyanto, 2017). Deskriptif berarti data mining digunakan
prediksi.
dikelompokkan kedalam delapan kelompok (Kotu et al, 2015), berikut ini adalah:
REGRESSION
CLASSIFICATION CLUSTERING
FEATURE
DATA MINING ASSOCIATION
SELECTION
ANOMALY
TEXT MINING
DETECTION
TIME SERIES
FORECASTING
14
• Klasifikasi (classification): menggeneralisasi struktur yang diketahui untuk
kemiripannya.
umum, bisa berupa outlier (pencilan), perubahan atau deviasi yang mungkin
dimana akan membentuk model untuk memprediksi nilai suatu masa depan
atribut yang paling penting dalam model untuk prediksi yang akurat.
pendekatan dan algoritma yang berbeda telah ada didefinisikan, termasuk K Nearest
15
Klasifikasi adalah suatu teknik dengan melihat pada kelakuan dan atribut
dari kelompok yang telah didefinisikan. Teknik ini dapat memberikan klasifikasi
pada data baru dengan memanipulasi data yang telah diklasifikasi dan dengan
berdasarkan analisis satu set data pelatihan (yaitu, objek data yang dikenal oleh
label kelas). Model ini digunakan untuk memprediksi label kelas objek yang label
KLASIFIKASI
1. Kelas, merupakan variable tidak bebas atau dapat dikatakan hasil dari
klasifikasi.
16
3. Set data training, merupakan sekumpulan data yang berisi kelas dan
4. Set Data Uji, merupakan data-data baru yang akan di kelompokkan oleh
metode pohon keputusan atau decision tree. Metode pohon keputusan merupakan
sebuah metode yang dapat mengubah fakta yang sangat besar menjadi sebuah
record yang lebih kecil dengan menerapkan serangkaian aturan keputusan. Dengan
dengan yang lainnya. Data dalam pohon keputusan biasanya dinyatakan dalam
bentuk tabel dengan atribut dan record. Atribut menyatakan suatu parameter yang
dibuat sebagai kriteria dalam pembentukan pohon. Proses pada pohon keputusan
adalah mengubah bentuk data (tabel) menjadi model pohon, mengubah model
pohon menjadi rule, dan menyederhanakan rule. Beberapa Algoritma yang bisa
Pohon keputusan adalah salah satu metode yang paling populer untuk
klasifikasi dalam berbagai aplikasi data mining dan membantu proses pengambilan
keputusan. Pohon keputusan adalah pohon terarah dengan simpul akar yang tidak
17
memiliki tepi masuk dan semua simpul lainnya dengan tepat satu ujung yang
masuk, yang dikenal sebagai simpul keputusan. Pada tahap pelatihan, setiap simpul
internal membagi ruang contoh menjadi dua atau lebih bagian dengan tujuan
mengoptimalkan kinerja pengklasifikasi. Setelah itu, setiap jalur dari simpul akar
ke simpul daun membentuk aturan keputusan untuk menentukan kelas mana yang
Pohon keputusan khas terdiri dari node internal, tepi dan simpul daun.
Setiap simpul internal disebut simpul keputusan yang mewakili pengujian pada
atribut atau subkumpulan atribut, dan setiap sisi diberi label dengan nilai atau
rentang nilai tertentu dari atribut masukan. Dengan cara ini, node internal yang
terkait dengan tepiannya membagi ruang instance menjadi dua atau lebih partisi.
Setiap simpul daun adalah simpul terminal pohon dengan label kelas. Misalnya,
Gambar 2.4 memberikan ilustrasi dari pohon keputusan dasar, dimana lingkaran
berarti simpul keputusan dan persegi berarti simpul daun. Dalam contoh ini,
memiliki tiga atribut pemisahan, yaitu usia, jenis kelamin, dan kriteria 3, bersama
dengan dua label kelas, yaitu, YA dan TIDAK. Setiap jalur dari simpul akar ke daun
age
≥20 <20
NO
gender
female <20
YES
criteria 3
yes no
YES NO
18
2.2.7 Algoritma C4.5
algoritma yang sangat popular yang digunakan oleh banyak peneliti di dunia, hal
ini dijelaskan oleh Algoritmaa C4.5 merupakan pengembangan dari algoritma ID3
Secara Umum algoritma C4.5 untuk membangun pohon keputusan adalah sebagai
berikut:
4. Ulangi proses untuk setiap cabang sampai semua kasus pada cabang
Untuk memilih atribut sebagai akar, didasarkan pada nilai gain tertinggi dari
dihasilkan. Hal ini meningkatkan tingkat kesalahan pada data pelatihan, tetapi yang
lebih penting, menurunkan tingkat kesalahan pada data pengujian yang tidak
terlihat. Algoritma C4.5 juga dapat menangani atribut numerik, nilai yang hilang,
data noise. Dan memiliki kelebihan dasn kerugian (Singh et al, 2014), sebagai
berikut :
19
• Keuntungan, yaitu :
3. C4.5 melalui pohon yang sudah dibuat dan dicoba untuk menghapus
daun.
• Kerugian, yaitu :
• Awal, mempersiapkan data training, data diambil dari data history yang
tertentu.
objek atau suatu himpunan, menentukan nilai entropy dapat dihitung dengan
rumus berikut :
20
Keterangan dari persamaan (2.1):
S : Himpunan Kasus
n : Jumlah Partisi S
• Information Gain, yaitu kriteria yang digunakan untuk memilih suatu atribut
Gain (S,A) yang berarti dalam data atribut A relatif terhadap output S,
𝑛
|𝑆𝑖|
𝐺𝑎𝑖𝑛 (𝑆, 𝐴) = 𝐸𝑛𝑡𝑟𝑜𝑝𝑦 (𝑆) − ∑ ∗ 𝐸𝑛𝑡𝑟𝑜𝑝𝑦 (𝑆𝑖) (2.2)
|𝑆|
𝑖=1
S : Himpunan Kasus
n : Jumlah Partisi S
A : Atribut
• Split Information, yaitu nilai split pada tiap atribut atau term baru sebelum
sebagai berikut :
𝑛
𝑆𝑖 𝑆𝑖
𝑆𝑝𝑙𝑖𝑡 𝐼𝑛𝑓𝑜𝑟𝑚𝑎𝑡𝑖𝑜𝑛 (𝑆, 𝐴) = − ∑ ∗ 𝑙𝑜𝑔2 ∗ (2.3)
𝑆 𝑆
𝑖=1
21
Keterangan dari persamaan (2.3):
S : Himpunan Kasus
n : Jumlah Partisi S
A : Atribut
• Gain Ratio, yaitu nilai yang dipilih untuk menjadi akar pohon, menentukan
𝐺𝑎𝑖𝑛 (𝑆, 𝐴)
𝐺𝑎𝑖𝑛 𝑅𝑎𝑡𝑖𝑜 (𝑆, 𝐴) = (2.4)
𝑆𝑝𝑙𝑖𝑡 𝐼𝑛𝑓𝑜𝑟𝑚𝑎𝑡𝑖𝑜𝑛 (𝑆, 𝐴)
S : Himpunan Kasus
A : Atribut
Setelah itu dilanjutkan proses evaluasi dengan confusion table dan ROC
curve. Hasil confusion table digunakan untuk menyajikan accuracy, recall, dan
prediksi dengan nilai sebenarnya yang ada. Recall merupakan persentase nilai
22
Tabel 2.2 Confusion Table
Nilai Sebenarnya
TRUE FALSE
TP FP
TRUE (True Positive) (False Negative)
Correct Result Unexpeted Result
Nilai
Prediksi
FN TN
FALSE (False negative) (True Negative)
Missing Result Correct Absence of Result
𝑇𝑃+𝑇𝑁
Rumus Accuracy = 𝑇𝑃+𝑇𝑁+𝐹𝑃+𝐹𝑁 ∗ 100%
𝑇𝑃
Rumus Recall = 𝑇𝑃+𝐹𝑁 ∗ 100%
𝑇𝑃
Rumus Precision = 𝑇𝑃+𝐹𝑃 ∗ 100%
hasil akurasi dalam bentuk grafik. ROC merupakan kurva yang akan menghasilkan
nilai Area Under Cover (AUC). AUC merupakan nilai akurasi area dibawah kurva
yang dihasilkan oleh ROC (Saifudin dkk, 2015). Performance keakurasian nilai
AUC dapat diklasifikasikan menjadi lima kelompok (Silalahi dkk, 2017), yaitu :
23
4. 0.60 – 0.70 = Poor Clasification
24
BAB III
METODOLOGI PENELITIAN
2016 dan fokus pada pasar indonesia dan ekspor ke benua Asia. Di negara China
nya sendiri berdiri perusahaan pada tahun 2000 dan sudah memiliki 11 perusahaan.
Pabrik kami berlokasi di kawasan Cikarang Pusat, Jawa Barat. Berjarak 70km dari
Ibukota Jakarta. Produksi yang dibuat adalah produk Otomotif (Komponen Interior,
dan Exterior). Kami akan menyerap sekitar 1.00 tenaga kerja lokal pada tahun
pertama produksi, dan akan tumbuh menjadi sekitar 3.00 dalam 5 tahun produksi
25
3.1.2 Visi dan Misi
Adapun visi dan misi dari PT. Shuangying International adalah sebagai berikut:
organisasi yang sesuai dengan tujuan organisasi, sumber daya manusia yang
kegiatan sejenis dapat saling berhubungan dikerjakan secara bersama. Hal ini akan
tercermin pada struktur formal suatu organisasi, dan tampak atau ditunjukkan oleh
26
Struktur ini mengandung unsur-unsur spesialisasi kerja, standarisasi kerja,
(ukuran) satuan kerja. Untuk itu agar tujuan organisasi pada PT. Shuangying
organisasi.
organisai, yaitu:
1. Pembagian Kerja
5. Tingkatan manajemen
Structure Organization
PT. Shuangying International Indonesia
Director of Operation
LOGISTIK &
HRD FINANCE TECHNICAL QUALITY PURCHASING
PRODUCTION
27
3.1.4 Departement dalam Struktur Organisasi
Struktur tersebut akan menggambarkan dengan jelas departement, fungsi, hak dan
kewajiban dari masing-masing posisi yang ada dalam lingkup perusahaan tersebut,
dan tenaga kerja lainnya untuk dapat menunjang aktifitas organisasi atau
perusahaan.
perusahaan.
barang jadi atau finish good ataupun hasil akhir dari perusahaan adalah sub-
28
Department Technical Quality Department
Quality Manager
Chen Zongyu
Product Engineer QE
Ridwan F Rani Yuliani W
Leader
1 Person
Quality Control
Shift 1 : 2 Person
Shift 2 : 2 Person
Note : Quality Control Jobdesc : Inspection Line, Assembly Line & Handling Internal Problem
Penelitian ini dilaksanakan selama 4 bulan pada bulan Juni 2018 sampai
29
Penelitian ini menggunakan data primer yang diperoleh secara langsung di
112 data kemudian dibagi menjadi 2 yaitu data training sejumlah 90 data dan data
testing sejumlah 22 data dengan perbandingan 80% dan 20%. Hasil data training
dalam bentuk pohon keputusan dan data testing digunakan tingkat akurasi dari hasil
klasifikasi tersebut.
3.4 Peralatan
• Kebutuhan software
• Kebutuhan hardware
3. Memory Ram 4 GB
4. Hardisk 500 GB
30
3.4 Kerangka Pemikiran
Adapun kerangka pemikiran dari penelitian yang dilakukan adalah sebagai berikut:
Belum ada
prediksi yang Dataset Produk
akurat dalam Confusion
pengambilan Matrix
Framework Produk
keputusan
RapidMiner OK dan NOK
dalam Algoritma Kurva ROC
klasifikasi Klasifikasi
untuk produk
cacat C4.5
31
BAB IV
HASIL DAN PEMBAHASAN
Tabel 4.1 Kategori Produk Cacat pada PT. Shuangying International Indonesia.
dengan nilai produk cacat kemudian dijadikan data training dan data testing.
32
Berat Bentuk Penguku Ukuran
Produk Posisi Area Hasil
Produk Produk ran Cacat
produk
lock
8 sedang besar ada kecil dalam NOK
produk tidak no lock
9 besar besar ada ada luar & rib OK
produk tidak
lock
10 besar besar ada ada dalam OK
produk no lock
11 kecil besar ada besar luar & rib NOK
produk no lock
12 sedang besar ada kecil luar & rib NOK
produk
lock
13 kecil besar ada besar dalam NOK
produk tidak
lock
14 besar besar ada ada dalam OK
produk no lock
15 kecil besar ada besar luar & rib NOK
produk no lock
16 sedang besar ada kecil luar & rib NOK
produk
lock
17 kecil besar ada besar dalam NOK
produk
lock
18 sedang besar ada kecil dalam NOK
produk tidak no lock
19 besar besar ada ada luar & rib OK
produk tidak
lock
20 besar besar ada ada Dalam OK
produk
lock
21 kecil kecil ada Besar Dalam NOK
produk
lock
22 sedang kecil ada Kecil Dalam NOK
produk
rib
23 kecil kecil ada Besar Dalam OK
produk no lock
24 sedang kecil ada Kecil Luar & rib NOK
produk tidak no lock
25 besar kecil ada ada Luar & rib OK
produk tidak
lock
26 besar kecil ada ada Dalam OK
produk tidak
rib
27 besar kecil ada ada Dalam OK
produk Tidak
lock
28 kecil kecil Ada Besar Dalam NOK
produk Tidak
lock
29 sedang kecil Ada Kecil Dalam NOK
33
Berat Bentuk Penguku Ukuran
Produk Posisi Area Hasil
Produk Produk ran Cacat
produk Tidak
rib
30 kecil kecil Ada Besar Dalam OK
produk Tidak no lock
31 sedang kecil Ada Kecil Luar & rib NOK
produk Tidak tidak no lock
32 besar kecil Ada ada Luar & rib OK
produk Tidak tidak
lock
33 besar kecil Ada ada Dalam OK
produk Tidak tidak
rib
34 besar kecil Ada ada Dalam OK
produk Tidak no lock
35 kecil sedang Ada Besar Luar & rib NOK
produk Tidak no lock
36 sedang sedang Ada Kecil Dalam & rib NOK
produk Tidak tidak no lock
37 besar sedang Ada ada Luar & rib NOK
produk Tidak tidak no lock
38 besar sedang Ada ada Dalam & rib NOK
produk Tidak
lock
39 kecil kecil Ada Besar Dalam NOK
produk Tidak
lock
40 sedang kecil Ada Kecil Dalam NOK
produk Tidak
rib
41 kecil kecil Ada Besar Dalam OK
produk Tidak
rib
42 sedang kecil Ada Kecil Dalam OK
produk Tidak tidak no lock
43 besar kecil Ada ada Luar & rib OK
produk Tidak tidak
lock
44 besar kecil Ada ada Dalam OK
produk Tidak tidak
rib
45 besar kecil Ada ada Dalam OK
produk Tidak no lock
46 kecil sedang Ada Besar Luar & rib NOK
produk Tidak no lock
47 sedang sedang Ada Kecil Luar & rib NOK
produk Tidak
lock
48 kecil sedang Ada Besar Dalam NOK
produk Tidak
rib
49 sedang sedang Ada Kecil Dalam OK
produk Tidak tidak no lock
50 besar sedang Ada ada Luar & rib OK
produk Tidak tidak
lock
51 besar sedang Ada ada Dalam OK
34
Berat Bentuk Penguku Ukuran
Produk Posisi Area Hasil
Produk Produk ran Cacat
produk Tidak tidak
rib
52 besar sedang Ada ada Dalam OK
produk Tidak no lock
53 kecil sedang Ada Besar Luar & rib NOK
produk Tidak no lock
54 sedang sedang Ada Kecil Luar & rib NOK
produk Tidak
lock
55 kecil sedang Ada Besar Dalam NOK
produk Tidak
rib
56 sedang sedang Ada Kecil Dalam OK
produk Tidak tidak no lock
57 besar sedang Ada ada Luar & rib OK
produk Tidak tidak
lock
58 besar sedang Ada ada Dalam OK
produk Tidak tidak
rib
59 besar sedang Ada ada Dalam OK
produk
lock
60 kecil besar ada Besar Luar NOK
produk
lock
61 sedang besar ada Kecil Luar NOK
produk
lock
62 kecil besar ada Besar Dalam NOK
produk
lock
63 sedang besar ada Kecil Dalam NOK
produk
lock
64 kecil besar ada Besar Luar NOK
produk
lock
65 sedang besar ada Kecil Luar NOK
produk
lock
66 kecil besar ada Besar Dalam NOK
produk
lock
67 sedang besar ada Kecil Dalam NOK
produk tidak
lock
68 besar besar ada ada Luar OK
produk tidak
lock
69 besar besar ada ada Dalam OK
produk no lock
70 kecil sedang ada Besar Luar & rib NOK
produk no lock
71 sedang sedang ada Kecil Luar & rib NOK
produk
lock
72 kecil sedang ada Besar Dalam NOK
produk
rib
73 sedang sedang ada Kecil Dalam OK
35
Berat Bentuk Penguku Ukuran
Produk Posisi Area Hasil
Produk Produk ran Cacat
produk tidak no lock
74 besar sedang ada ada Luar & rib OK
produk tidak
lock
75 besar sedang ada ada Dalam OK
produk tidak
rib
76 besar sedang ada ada Dalam OK
produk
lock
77 kecil besar ada Besar Luar NOK
produk
lock
78 sedang besar ada Kecil Luar NOK
produk
lock
79 kecil besar ada Besar Dalam NOK
produk tidak
lock
80 besar besar ada ada Dalam OK
produk
lock
81 kecil besar ada Besar Luar NOK
produk
lock
82 sedang besar ada Kecil Luar NOK
produk
lock
83 kecil besar ada Besar Dalam NOK
produk
lock
84 sedang besar ada Kecil Dalam NOK
produk tidak
lock
85 besar besar ada ada Luar OK
produk Tidak
lock
86 sedang kecil Ada Kecil Luar NOK
produk Tidak
lock
87 kecil kecil Ada Besar Dalam NOK
produk Tidak
lock
88 sedang kecil Ada Kecil Dalam NOK
produk Tidak tidak
lock
89 besar kecil Ada ada Luar OK
produk Tidak tidak
lock
90 besar kecil Ada ada Dalam OK
Tabel 4.2 menunjukan bahwa dari data training sebanyak 90 data, yang
nilai entropy sebesar 0,97708, ternyata atribut tertinggi yaitu Berat dengan
information gain sebesar 0,516041, pada split info sebesar 1,583376 dan Gain Ratio
sebesar 0,325912
36
Tabel 4.3 Penghitungan Data Training
JML
OK NOK INFORMATION
ATRIBUT PRODUK ENTROPY SPLIT INFO GAIN
(Si) (Si) GAIN
(S)
TOTAL 90 37 53 0,977080223
Besar 32 30 2 0,337290067
Sedang 29 4 25 0,578794625
Kecil 29 3 26 0,479832024
Entropy :
37 37 53 53
= ((− ) ∗ 𝑙𝑜𝑔2 ( ) + (− ) ∗ 𝑙𝑜𝑔2 ( ))
90 90 90 90
= 0,977080
Information Gain :
32 29 29
= (0,977080) − (( ) ∗ 0,337290) − (( ) ∗ 0,578794) − (( ) ∗ 0,479832)
90 90 90
= 0,516041
Split Information :
32 32 29 29 29 29
= −(( ) ∗ (𝑙𝑜𝑔2 ( ))) + ( ) ∗ (𝑙𝑜𝑔2 ( ))) + ( ) ∗ (𝑙𝑜𝑔2 ( ))))
90 90 90 90 90 90
= 1,583376
Gain Ratio :
0,516041
= = 0,325912
1,583376
37
Pada penelitian ini dilakukan proses read excel, berikut permodelan yang
fitur cross validation. Berikut merupakan permodelan yang ada didalam cross
validation :
Pada permodelan cross validation didalamnya terdapat dua bagian, yaitu bagian
training (digunakan untuk algoritma klasifikasi Decision Tree) dan testing bagian
testing (menggunakan fitur Apply Model untuk mengaplikasikan model pada data
38
testing dan fitur Performance untuk menampilkan confusion table, yang diigunakan
untuk menampilkan hasil dari accuracy, recall, precision, dan nilai AUC.
39
Berikut deskripsi dari permodelan yang dihasilkan decision tree :
4.2 Pembahasan
Banyaknya produk cacat pada saat proses produksi terbuang karena tidak
mencari limit produk cacat ataupun membuat laporan pemeriksaan setiap harinya.
Selain itu lamanya dalam proses pemeriksaan bisa mengurangi hasil produksi dan
berikut, setelah data diolah maka diuji tingkat akurasinya dari metode yang
40
digunakan dari metode Algoritma C4.5 dilakukan tingkat akurasi dengan confusion
prediksi NOK dan ternyata NOK, 2 data diprediksi NOK tetapi ternyata OK, 2 data
diprediksi OK tetapi ternyata NOK dan sebanyak 35 data diprediksi sesuai OK,
Penghitungan Accuracy :
Nilai Sebenarnya
TRUE FALSE
TP FP
TRUE
51 2
Nilai
Prediksi
FN TN
FALSE
2 35
41
𝑇𝑃 + 𝑇𝑁
𝐴𝑐𝑐𝑢𝑟𝑎𝑐𝑦 = ∗ 100%
𝑇𝑃 + 𝑇𝑁 + 𝐹𝑃 + 𝐹𝑁
51 + 35
= ∗ 100%
51 + 35 + 2 + 2
86
= ∗ 100%
90
= 0,95555 ∗ 100%
= 95,56%
NOK dan ternyata NOK, 2 data diprediksi NOK tetapi ternyata OK, 2 data
diprediksi OK tetapi ternyata NOK dan sebanyak 35 data diprediksi sesuai OK,
42
Penghitungan Recall :
Nilai Sebenarnya
TRUE FALSE
TP FP
TRUE
51 2
Nilai
Prediksi
FN TN
FALSE
2 35
𝑇𝑃
𝑅𝑒𝑐𝑎𝑙𝑙 = ∗ 100%
𝑇𝑃 + 𝐹𝑁
51
= ∗ 100%
51 + 2
51
= ∗ 100%
53
= 0,96225 ∗ 100%
= 96,23%
NOK dan ternyata NOK, 2 data diprediksi NOK tetapi ternyata OK, 2 data
diprediksi OK tetapi ternyata NOK dan sebanyak 35 data diprediksi sesuai OK,
43
Gambar 4.7 Hasil Precision (Data Training) Decision Tree C4.5
Penghitungan Precision :
Nilai Sebenarnya
TRUE FALSE
TP FP
TRUE
51 2
Nilai
Prediksi
FN TN
FALSE
2 35
𝑇𝑃
𝑃𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛 = ∗ 100%
𝑇𝑃 + 𝐹𝑃
51
= ∗ 100%
51 + 2
51
= ∗ 100%
53
= 0,96225 ∗ 100%
= 96,23%
44
Hasil yang didapat dari pengolahan ROC metode Algoritma C4.5 sebesar
1.000 menggunakan data training dapat dilihat gambar 4.11 dengan tingkat akurasi
Excellent Clasification.
45
BAB V
KESIMPULAN
5.1 Kesimpulan
Kesimpulan dari penelitian ini adalah hasil analisa data mining dari produk
klasifikasi (C4.5).
mengatasi masalah yang telah terindentifikasi pada penelitian ini. Dari hasil
data mining produk cacat, dapat terurai menjadi pengetahuan dan prediksi
sehingga hasil dari pengolahan data dapat menjadi sumber informasi dalam
produk cacat. Dari 90 data training diperoleh menjadi produk OK (37) dan
95,56%, recall sebesar 95,00%, dan precision sebesar 95,00%. Hasil yang
5.2 Saran
46
setting, jenis material, campuran material dan lain sebagainya oleh
produk cacat.
47
DAFTAR PUSTAKA
https://doi.org/10.1007/s13398-014-0173-7.2
https://jurnal.umj.ac.id/index.php/sintek/article/view/161/143
Dai, Wei., Ji, W. (2014). A Map Reduce Implementation of C4.5 Decision Tree
Dewi, Shanty Kusuma. (2012). Minimasi Defect Produk Dengan Konsep Six Sigma.
https://doi.org/10.1016/j.phpro.2015.02.005
Han, Jiawei., Kamber, Micheline ., Pei, Jian. (2012). Data Mining: Concepts and
https://doi.org/10.1016/B978-0-12-381479-1.00001-0
Kotu, Vijay., Deshpanda, Bala. (2015). Predictive Analytics and Data Mining. In
https://doi.org/10.1016/B978-0-12-801460-8.00001-X
48
Jurnal Edik Informatika, 2(2), 213–219.
Mining C4.5 Pada Dataset Cuaca Wilayah Bekasi. Jurnal Format, 6(2), 98–
106.
Saifudin, Aries., Wahono, Romi Satrio. (2015). Penerapan Teknik Ensemble untuk
1126(14)00030-3
Silalahi, Kristiani Desri., Murfi, Hendri., Satria, Yudi. (2017). Studi Perbandingan
Singh, Sonia., Gupta, Prinyanka. (2014). Comparative Study ID3 , CART And C4.5
49
Sunge, Aswan Supriyadi. (2018). Prediksi Kompetensi Karyawan Menggunakan
23–24.
Suyanto. (2017). Data Mining Untuk Klasifikasi Dan Klasterisasi Data. Penerbit:
Witten, Ian H., Frank, Eibe. (2011). Data Mining: Practical Machine Learning
https://doi.org/0120884070, 9780120884070
50
LAMPIRAN
Data Set :
51
Berat Bentuk Ukuran
Produk Pengukuran Posisi Area Hasil
Produk Produk Cacat
produk
lock
21 kecil Besar ada Besar Dalam NOK
produk
lock
22 sedang Besar ada Kecil Dalam NOK
produk tidak no lock
23 besar Besar ada ada Luar & rib OK
produk tidak
lock
24 besar Besar ada ada Dalam OK
produk
lock
25 kecil Kecil ada Besar Dalam NOK
produk
lock
26 sedang Kecil ada Kecil Dalam NOK
produk
rib
27 kecil Kecil ada Besar Dalam OK
produk
rib
28 sedang Kecil ada Kecil Dalam OK
produk no lock
29 kecil Kecil ada Besar Luar & rib NOK
produk no lock
30 sedang Kecil ada Kecil Luar & rib NOK
produk tidak no lock
31 besar Kecil ada ada Luar & rib OK
produk tidak
lock
32 besar Kecil ada ada Dalam OK
produk tidak
rib
33 besar Kecil ada ada Dalam OK
produk
lock
34 kecil Kecil Tidak Ada Besar Dalam NOK
produk
lock
35 sedang Kecil Tidak Ada Kecil Dalam NOK
produk
rib
36 kecil Kecil Tidak Ada Besar Dalam OK
produk
rib
37 sedang Kecil Tidak Ada Kecil Dalam OK
produk no lock
38 kecil Kecil Tidak Ada Besar Luar & rib NOK
produk no lock
39 sedang Kecil Tidak Ada Kecil Luar & rib NOK
produk tidak no lock
40 besar Kecil Tidak Ada ada Luar & rib OK
produk tidak
lock
41 besar Kecil Tidak Ada ada Dalam OK
produk tidak
rib
42 besar Kecil Tidak Ada ada Dalam OK
produk no lock
43 kecil Sedang Tidak Ada Besar Luar & rib NOK
52
Berat Bentuk Ukuran
Produk Pengukuran Posisi Area Hasil
Produk Produk Cacat
produk no lock
44 sedang Sedang Tidak Ada Kecil Dalam & rib NOK
produk tidak no lock
45 besar Sedang Tidak Ada ada Luar & rib NOK
produk tidak no lock
46 besar Sedang Tidak Ada ada Dalam & rib NOK
produk no lock
47 kecil Kecil Tidak Ada Besar luar & rib NOK
produk no lock
48 sedang Kecil Tidak Ada Kecil Luar & rib NOK
produk
lock
49 kecil Kecil Tidak Ada Besar Dalam NOK
produk
lock
50 sedang Kecil Tidak Ada Kecil Dalam NOK
produk
rib
51 kecil Kecil Tidak Ada Besar Dalam OK
produk
rib
52 sedang Kecil Tidak Ada Kecil Dalam OK
produk tidak no lock
53 besar Kecil Tidak Ada ada Luar & rib OK
produk tidak
lock
54 besar Kecil Tidak Ada ada Dalam OK
produk tidak
rib
55 besar Kecil Tidak Ada ada Dalam OK
produk no lock
56 kecil Sedang Tidak Ada Besar Luar & rib NOK
produk no lock
57 sedang Sedang Tidak Ada Kecil Luar & rib NOK
produk
lock
58 kecil Sedang Tidak Ada Besar Dalam NOK
produk
lock
59 sedang Sedang Tidak Ada Kecil Dalam NOK
produk
rib
60 kecil Sedang Tidak Ada Besar Dalam OK
produk
rib
61 sedang Sedang Tidak Ada Kecil Dalam OK
produk tidak no lock
62 besar Sedang Tidak Ada ada Luar & rib OK
produk tidak
lock
63 besar Sedang Tidak Ada ada Dalam OK
produk tidak
rib
64 besar Sedang Tidak Ada ada Dalam OK
produk no lock
65 kecil Sedang Tidak Ada Besar Luar & rib NOK
produk no lock
66 sedang Sedang Tidak Ada Kecil Luar & rib NOK
53
Berat Bentuk Ukuran
Produk Pengukuran Posisi Area Hasil
Produk Produk Cacat
produk
lock
67 kecil Sedang Tidak Ada Besar Dalam NOK
produk
lock
68 sedang Sedang Tidak Ada Kecil Dalam NOK
produk
rib
69 kecil Sedang Tidak Ada Besar Dalam OK
produk
rib
70 sedang Sedang Tidak Ada Kecil Dalam OK
produk tidak no lock
71 besar Sedang Tidak Ada ada Luar & rib OK
produk tidak
lock
72 besar Sedang Tidak Ada ada Dalam OK
produk tidak
rib
73 besar Sedang Tidak Ada ada Dalam OK
produk
lock
74 kecil Besar ada Besar Luar NOK
produk
lock
75 sedang Besar ada Kecil Luar NOK
produk
lock
76 kecil Besar ada Besar Dalam NOK
produk
lock
77 sedang Besar ada Kecil Dalam NOK
produk tidak
lock
78 besar Besar ada ada Luar OK
produk tidak
lock
79 besar Besar ada ada Dalam OK
produk
lock
80 kecil Besar ada Besar Luar NOK
produk
lock
81 sedang Besar ada Kecil Luar NOK
produk
lock
82 kecil Besar ada Besar Dalam NOK
produk
lock
83 sedang Besar ada Kecil Dalam NOK
produk tidak
lock
84 besar Besar ada ada Luar OK
produk tidak
lock
85 besar Besar ada ada Dalam OK
produk no lock
86 kecil Sedang ada Besar Luar & rib NOK
produk no lock
87 sedang Sedang ada Kecil Luar & rib NOK
produk
lock
88 kecil Sedang ada Besar Dalam NOK
produk
lock
89 sedang Sedang ada Kecil Dalam NOK
54
Berat Bentuk Ukuran
Produk Pengukuran Posisi Area Hasil
Produk Produk Cacat
produk
rib
90 kecil Sedang ada Besar Dalam OK
produk
rib
91 sedang Sedang ada Kecil Dalam OK
produk tidak no lock
92 besar Sedang ada ada Luar & rib OK
produk tidak
lock
93 besar Sedang ada ada Dalam OK
produk tidak
rib
94 besar Sedang ada ada Dalam OK
produk
lock
95 kecil Besar ada Besar Luar NOK
produk
lock
96 sedang Besar ada Kecil Luar NOK
produk
lock
97 kecil Besar ada Besar Dalam NOK
produk
lock
98 sedang Besar ada Kecil Dalam NOK
produk tidak
lock
99 besar Besar ada ada Luar OK
produk tidak
lock
100 besar Besar ada ada Dalam OK
produk
lock
101 kecil Besar ada Besar Luar NOK
produk
lock
102 sedang Besar ada Kecil Luar NOK
produk
lock
103 kecil Besar ada Besar Dalam NOK
produk
lock
104 sedang Besar ada Kecil Dalam NOK
produk tidak
lock
105 besar Besar ada ada Luar OK
produk tidak
lock
106 besar Besar ada ada Dalam OK
produk
lock
107 kecil Kecil Tidak Ada Besar Luar NOK
produk
lock
108 sedang Kecil Tidak Ada Kecil Luar NOK
produk
lock
109 kecil Kecil Tidak Ada Besar Dalam NOK
produk
lock
110 sedang Kecil Tidak Ada Kecil Dalam NOK
produk tidak
lock
111 besar Kecil Tidak Ada ada Luar OK
produk tidak
lock
112 besar Kecil Tidak Ada ada Dalam OK
55
Hasil Uji Plagiat :
56