Metode Klasifikasi Itudeh

ANALISA DATA MINING DENGAN METODE
KLASIFIKASI UNTUK PRODUK CACAT PADA PT.

SHUANGYING INTERNATIONAL INDONESIA
SKRIPSI
Oleh :
RANI YULIANI WULANDARI
311421111
TEKNIK INFORMATIKA
SEKOLAH TINGGI TEKNOLOGI PELITA BANGSA
BEKASI
2018
ANALISA DATA MINING DENGAN METODE
KLASIFIKASI UNTUK PRODUK CACAT PADA PT.
SHUANGYING INTERNATIONAL INDONESIA
SKRIPSI
Diajukan Sebagai Salah Satu Syarat Untuk Menyelesaikan

Program Strata Satu (S1) pada Program Studi Teknik Informatika
Oleh :
311421111
TEKNIK INFORMATIKA
SEKOLAH TINGGI TEKNOLOGI PELITA BANGSA
BEKASI
2018
PERSETUJUAN
SKRIPSI
ANALISA DATA MINING DENGAN METODE KLASIFIKASI UNTUK

PRODUK CACAT PADA PT. SHUANGYING INTERNATIONAL
INDONESIA
Yang disusun oleh

311421111
telah disetujui oleh Dosen Pembimbing Skripsi

pada tanggal 20 Oktober 2018
Dosen Pembimbing 1 Dosen Pembimbing 2
Aswan S. Sunge, S.E., M.Kom Nisa Nurhidayanti, S.Pd., M.T

NIDN: 0426018003 NIDN: 0420028902
Menyetujui
Kaprodi Teknik Informatika
Aswan S. Sunge, S.E., M.Kom

NIDN: 0426018003
i
PENGESAHAN
SKRIPSI
ANALISA DATA MINING DENGAN METODE KLASIFIKASI UNTUK

INDONESIA
Diajukan Sebagai Syarat Memperoleh Gelar Sarjana Teknik Informatika
Yang disusun oleh:

311421111
Dosen Penguji 1 Dosen Penguji 2
Abdul Halim Anshor, S.Kom.,M.Kom Ir. Tri Ngudi Wiyatno, M.T

NIDN: 041406810 NIDN: 042508650
Dosen Pembimbing 1 Dosen Pembimbing 2
Aswan S. Sunge, S.E., M.Kom Nisa Nurhidayanti, S.Pd., M.T

NIDN: 0426018003 NIDN: 0420028902
Menyetujui
Kaprodi Teknik Informatika
Aswan S. Sunge, S.E., M.Kom

NIDN: 0426018003
Mengetahui
Ketua STT Pelita Bangsa
Dr. Ir. Supriyanto, M.P

NIDN: 0401066605
ii
PERNYATAAN KEASLIAN PENELITIAN
Saya yang bertanda tangan dibawah ini menyatakan bahwa, skripsi ini merupakan
karya saya sendiri (ASLI), dan isi dalam skripsi ini tidak terdapat karya yang pernah
diajukan oleh orang lain untuk memperoleh gelar akademis di suatu institusi
pendidikan tinggi mana pun, dan sepanjang pengetahuan saya juga tidak terdapat
karya atau pendapat yang pernah ditulis dan/atau diterbitkan oleh orang lain,
kecuali yang secara tertulis diacu dalam naskah ini dan disebutkan dalam daftar
pustaka.
Segala sesuatu yang terkait dengan naskah dan karya yang telah dibuat adalah
menjadi tanggungjawab saya pribadi.
Bekasi, 20 Oktober 2018
Materai 6.000
RANI YULIANI
WULANDARI
NIM : 311421111
iii
KATA PENGANTAR
Puji syukur penulis panjatkan kehadiran Allah SWT. yang telah

melimpahkan segala rahmat dan hidayah-Nya, sehingga tersusun lah Skripsi yang
berjudul “ANALISA DATA MINING DENGAN METODE KLASIFIKASI
INDONESIA”.
Skripsi tersusun dalam rangka melengkapi salah satu persyaratan dalam

rangka menempuh ujian akhir untuk memperoleh gelar Sarjana Komputer (S.Kom.)
pada Program Studi Teknik Informatika di Sekolah Tinggi Teknologi Pelita Bangsa.
Penulis sungguh sangat menyadari, bahwa penulisan Skripsi ini tidak akan
terwujud tanpa adanya dukungan dan bantuan dari berbagai pihak. Sudah
selayaknya, dalam kesempatan ini penulis menghaturkan penghargaan dan ucapan
terima kasih yang sebesar-besarnya kepada:
a. Bapak Dr. Ir. Supriyanto, M.P selaku Ketua STT Pelita Bangsa
b. Bapak Aswan S. Sunge, S.Kom, M.Kom selaku Ketua Program Studi Teknik
Informatika STT Pelita Bangsa.
c. Bapak Aswan S. Sunge, S.Kom, M.Kom selaku Dosen Pembimbing 1 yang
telah banyak memberikan arahan dan bimbingan kepada penulis dalam
penyusunan Skripsi ini.
d. Ibu Nisa Nurhidayanti, S.Pd, M.T selaku Dosen Pembimbing 2 yang telah
banyak memberikan arahan dan bimbingan kepada penulis dalam penyusunan
Skripsi ini.
e. Seluruh Dosen STT Pelita Bangsa yang telah membekali penulis dengan
wawasan dan ilmu di bidang teknik informatika.
f. Seluruh staf STT Pelita Bangsa yang telah memberikan pelayanan terbaiknya
kepada penulis selama perjalanan studi jenjang Strata 1.
g. Rekan-rekan mahasiswa STT Pelita Bangsa, khususnya angkatan 2014, yang
telah banyak memberikan inspirasi dan semangat kepada penulis untuk dapat
menyelesaikan studi jenjang Strata 1.
iv
h. Ibu, Bapak, Adik-adik, Suami, dan Anak-anak tercinta yang senantiasa
mendoakan dan memberikan semangat dalam perjalanan studi Strata 1 maupun
dalam kehidupan penulis.
Akhir kata, penulis mohon maaf atas kekeliruan dan kesalahan yang terdapat
dalam Skripsi ini dan berharap semoga Skripsi ini dapat memberikan manfaat bagi
khasanah pengetahuan Teknologi Informasi di lingkungan STT Pelita Bangsa
khususnya dan Indonesia pada umumnya.
Bekasi, 20 Oktober 2018
Penulis
Rani Yuliani Wulandari
v
DAFTAR ISI
PERSETUJUAN ...................................................................................................... i
PENGESAHAN ...................................................................................................... ii
PERNYATAAN KEASLIAN PENELITIAN ....................................................... iii
KATA PENGANTAR ........................................................................................... iv
DAFTAR ISI .......................................................................................................... vi
DAFTAR TABEL .................................................................................................. ix
DAFTAR GAMBAR .............................................................................................. x
ABSTRAK ............................................................................................................. xi
ABSTRACT ............................................................................................................ xii
BAB I PENDAHULUAN ....................................................................................... 1
1.1 Latar Belakang ......................................................................................... 1
1.2 Identifikasi Masalah ................................................................................. 3
1.3 Rumusan Masalah .................................................................................... 4
1.4 Batasan Masalah ....................................................................................... 4
1.5 Tujuan dan Manfaat Penelitian................................................................. 5
1.5.1 Tujuan Penelitian .............................................................................. 5
1.5.2 Manfaat Penelitian ............................................................................ 5
1.6 Sistematika Penulisan ............................................................................... 6
BAB II TINJAUAN PUSTAKA............................................................................. 8
vi
2.1 Tinjauan Penelitian ................................................................................... 8
2.2 Kajian Pustaka ........................................................................................ 11
2.2.1 Produk Cacat ................................................................................... 11
2.2.2 Knowledge Discovery in Databases (KDD) ................................... 11
2.2.3 Pengertian Data Mining .................................................................. 13
2.2.4 Pengelompokan Data Mining.......................................................... 14
2.2.5 Metode Klasifikasi .......................................................................... 15
2.2.6 Decision Tree (Pohon Keputusan) .................................................. 17
2.2.7 Algoritma C4.5 ................................................................................ 19
2.2.8 Keuntungan dan Kerugian Algoritma C4.5 .................................... 19
2.2.9 Tahapan Membangun Algoritma C4.5 ............................................ 20
BAB III METODOLOGI PENELITIAN.............................................................. 25
3.1 Objek Penelitian ..................................................................................... 25
3.1.1 Gambaran Umum ............................................................................ 25
3.1.2 Visi dan Misi ................................................................................... 26
3.1.3 Struktur Organisasi ......................................................................... 26
3.1.4 Departement dalam Struktur Organisasi ......................................... 28
3.2 Waktu Penelitian .................................................................................... 29
3.3 Pengumpulan dan Pengolahan Data ....................................................... 29
3.4 Peralatan ................................................................................................. 30
3.4 Kerangka Pemikiran ............................................................................... 31
vii
BAB IV HASIL DAN PEMBAHASAN .............................................................. 32
4.1 Hasil Penelitian....................................................................................... 32
4.2 Pembahasan ............................................................................................ 40
BAB V KESIMPULAN ........................................................................................ 46
5.1 Kesimpulan ............................................................................................. 46
5.2 Saran ....................................................................................................... 46
DAFTAR PUSTAKA ........................................................................................... 48
LAMPIRAN .......................................................................................................... 51
viii
DAFTAR TABEL
Tabel 2.1 Rangkuman Tinjauan Penelitian ............................................................ 9
Tabel 2.2 Confusion Table ................................................................................... 23
Tabel 4.1 Kategori Produk Cacat Pada PT. Shuangying International Indonesia..32
Tabel 4.2 Data Training Untuk Produk Cacat........................................................32
Tabel 4.3 Penghitungan Data Training..................................................................37
Tabel 4.4 Confusion Matrix Penghitungan Accuracy............................................41
Tabel 4.5 Confusion Matrix Penghitungan Recall..................................................43
Tabel 4.6 Confusion Matrix Penghitungan Precision.............................................44
ix
DAFTAR GAMBAR
Gambar 2.1 Proses KDD ..................................................................................... 12
Gambar 2.2 Data Mining Berdasarkan Fungsionalitas ....................................... 14
Gambar 2.3 Algoritma Klasifikasi....................................................................... 16
Gambar 2.4 Contoh Decision Tree ...................................................................... 18
Gambar 3.1 Lokasi Tempat Penelitian PT. Shuangying International Indonesia..25
Gambar 3.2 Struktur Organisasi PT. Shuangying International Indonesia............27
Gambar 3.3 Departement Technical Quality.........................................................29
Gambar 3.4 Kerangka Pemikiran..........................................................................31
Gambar 4.1 Model Read Excel Dengan Decision Tree C.45.................................38
Gambar 4.2 Model Cross Validation Dengan Decision Tree C4.5........................38
Gambar 4.3 Pohon Keputusan Produk Cacat.........................................................39
Gambar 4.4 Deskripsi Permodelan Decision Tree C4.5........................................40
Gambar 4.5 Hasil Accuracy (Data Training) Decision Tree C4.5.........................41
Gambar 4.6 Hasil Recall (Data Training) Decision Tree C4.5..............................42
Gambar 4.7 Hasil Precision (Data Training) Decision Tree C4.5.........................44
Gambar 4.8 Hasil Evaluasi Data Training ROC/AUC..........................................45
x
ABSTRAK
PT. Shuangying International Indonesia adalah perusahaan dari negara China

pembuat produk plastik otomotif (komponen interior dan eksterior mobil) yang
berdiri pada tahun 2000 di negara China, sedangkan di indonesia mulai beroperasi
pada 23 maret 2016. Perkembangan produk otomotif di Indonesia sangat
berkembang, hal itu terlihat banyaknya jenis kendaraan otomotif dari luar negeri
yang berproduksi dan berbisnis di Indonesia. Pada perusahaan terdapat sebuah
bagian pemeriksaan pada Departemen Quality yang bertugas untuk memeriksa
produk sebelum dikirim ke pelanggan. Banyaknya produk cacat pada saat proses
produksi terbuang karena tidak memiliki pengambilan keputusan secara klasifikasi
untuk produk cacat yang bisa membantu mempermudah proses pemeriksaan.
Tujuan penelitian ini adalah untuk menganalisa data mining dengan metode
klasifikasi untuk produk cacat pada PT. Shuangying International Indonesia dengan
algoritma C4.5. Dalam penelitian ini, hasil yang didapatkan dari beberapa atribut
menghasilkan sebab-akibat produk cacat dalam mengklasifikasikan menjadi
produk OK dan NOK. Penelitian ini diharapkan dapat membantu pihak perusahaan
untuk meningkatkan laba perusahaan tersebut. Metode klasifikasi yang digunakan
dalam data mining adalah Decision Tree karena dapat menghasilkan output sesuai
dengan aturan yang ada, dapat menyajikan data produk cacat. Penelitian
menggunakan Algoritma C4.5 untuk menghasilkan aturan klasifikasi produk cacat
dari data 90 data training diperoleh produk OK (37), NOK (57) dan hasil akurasi
sebesar 95.56%, yang menunjukan bahwa algoritma C4.5 cocok digunakan untuk
mengukur produk cacat pada suatu perusahaan.
Kata kunci: algoritma C4.5, data mining, decision tree, produk cacat
xi
ABSTRACT
PT. Shuangying International Indonesia is a company from China that

manufactures automotive plastic products (interior and exterior components of
cars) which was established in 2000 in China, while in Indonesia it began operating
on March 23, 2016. The development of automotive products in Indonesia is very
developed, it is seen a lot types of automotive vehicles from abroad that produce
and do business in Indonesia. At the company there is an inspection section at the
Quality Department whose duty is to inspect products before they are sent to
customers. The number of defective products when the production process is wasted
because it does not have a classification decision for defective products that can
help simplify the inspection process. The purpose of this study is to analyze data
mining with the classification method for defective products at PT. Shuangying
International Indonesia with the C4.5 algorithm. In this study, the results obtained
from several attributes produce a causal product of defects in classifying OK and
NOK products. This research is expected to help the company to increase the
company's profits. The classification method used in data mining is Decision Tree
because it can produce output according to existing rules, can present defective
product data. The research uses C4.5 algorithm to produce defective product
classification rules from data 90 training data obtained by the product OK (37),
NOK (57) and the accuracy of 95.56%, which indicates that the C4.5 algorithm is
suitable for measuring defective products on a company.
Keyword: C4.5 algorithms, data mining, decision tree, defective products
xii
BAB I
PENDAHULUAN
1.1 Latar Belakang
Perkembangan produk otomotif di Indonesia sangat berkembang, hal itu
terlihat banyaknya jenis kendaraan otomotif dari luar negeri yang berproduksi dan
berbisnis di Indonesia. Seiring perkembangan tersebut maka dibutuhkan pula
perkembangan teknologi informasi untuk menembus batas-batas ilmu pengetahuan
dan menyerbu pelosok ke seluruh dunia. Revolusi informasi dan komunikasi zaman
ini melahirkan peradaban baru yaitu tidak dibatasi oleh waktu, informasi dapat kita
peroleh kapan saja dan dimana saja. Begitu pula halnya dalam dunia bisnis,
kemajuan teknologi informasi tersebut mengakibatkan perubahan yang signifikan
dengan telah banyaknya mengubah dan mempermudah sistem kerja para pelaku
bisnis.
Setiap aktivitas dan kegiatan dalam kehidupan berbisnis, komputer
dijadikan sebagai suatu perangkat pengolahan data elektronik untuk menghasilkan
data informasi dengan cepat dan mudah. Informasi merupakan salah satu jalan
untuk mengambil keputusan terhadap apa yang akan dilakukan pada tahap
selanjutnya. Sistem informasi yang baik akan meningkatkan efisiensi dan
efektivitas kerja.
Dengan banyaknya produk otomotif maka mutu dijadikan sebagai landasan
utama. Apapun jenis produk suatu perusahaan tentunya membutuhkan jasa Quality
Assurance atau Quality Control dalam suatu divisi. Walaupun keduanya memiliki
definisi yang berbeda tetapi sama-sama memilki acuan pada mutu. Cukup disebut
1
Departemen Quality didalamnya ada kegiatan pemeriksaan dan merancang jaminan
produk bahwa sudah terpenuhi persyaratan mutu tersebut.
Secara strategi pun kualitas atau mutu didefinisikan sebagai segala sesuatu
yang mampu memenuhi keinginan atau kebutuhan pelanggan (meeting the needs of
customer). Keunggulan suatu produk terukur melalui tingkat kepuasan pelanggan
maka, diperlukan juga perkembangan dunia teknologi informasi untuk kebutuhan
akan data dan informasi berbasiskan komputer. Data dan informasi sangat
dibutuhkan suatu perusahaan yang berskala besar, sedang, dan kecil. Sistem
informasi terkomputerisasi terbukti mampu mempercepat kinerja, sehingga
meningkatkan keuntungan.
Teknologi data sistem informasi merupakan sebuah teknologi interaktif
yang dapat digunakan sebagai sarana informasi yang dapat di akses oleh semua
pihak, baik pihak umum maupun pihak yang mempunyai akses. Sebuah perusahaan
menggunakan atau menerapkan Teknologi Informasi untuk memudahkan
berlangsungnya proses kerja baik untuk semua karyawan, maupun karyawan
administrasi dalam hal pengaksesan data dan informasi.
PT. Shuangying International Indonesia adalah sebuah perusahaan
manufaktur asal China yang bergerak di bidang pembuatan komponen plastik
(interior dan exterior) otomotif untuk kendaraan mobil yang beroperasi di kawasan
industri Grendland Deltamas Cikarang Pusat. Pada perusahaan ini terdapat sebuah
bagian pemeriksaan pada Departemen Quality yang bertugas untuk memeriksa
produk sebelum dikirim ke pelanggan. Akan tetapi pada proses pemeriksaan,
inspector mengalami kesulitan dalam prosesnya. Banyaknya produk cacat pada saat
proses produksi terbuang karena tidak memiliki pengambilan keputusan secara
2
klasifikasi produk cacat yang bisa membantu mempermudah proses pemeriksaan,
sehingga inspector kesulitan dalam mencari limit produk cacat ataupun membuat
laporan pemeriksaan setiap harinya. Selain itu lamanya dalam proses pemeriksaan
bisa mengurangi hasil produksi dan tentunya hal ini bisa menjadi kerugian untuk
perusahaan. Penyediaan data yang cepat dan akurat juga menjadi kendala utama
disebabkan ketiadaan sistem informasi yang akurat. Hal tersebut menyulitkan
perusahaan dalam mengontrol hasil produksi setiap harinya. Dari beberapa alasan
tersebut maka diperlukan sebuah akurasi yang diharapkan mampu mengatasi
masalah-masalah yang selama ini menjadi kendala dan mempermudah karyawan
untuk menyusun data.
Melihat dari permasalahan, khususnya bagian pemeriksaan pada
Departemen Quality penulis bermaksud untuk memberi solusi agar masalah-
masalah tersebut dapat terminimalisir. Maka dari itu diperlukan sebuah akurasi
yang diharapkan mampu mengatasi masalah-masalah yang selama ini menjadi
kendala dan mempermudah pemeriksaan produk cacat sehingga dapat memberikan
solusi dari permasalahan yang dihadapi oleh pihak perusahaan.
Berdasarkan latar belakang masalah di atas maka penulis mengambil judul
“ANALISA DATA MINING DENGAN METODE KLASIFIKASI UNTUK
INDONESIA”.
1.2 Identifikasi Masalah
Dari uraian latar belakang masalah di atas, dapat mengindentifikasikan
masalah sebagai berikut:
3
1. Pengolahan dan pencarian produk cacat memakan waktu yang lama
karena belum terklasifikasi secara terperinci.
2. Produktivitas tenaga kerja masih rendah karena inspector kesulitan dalam
mencari limit produk cacat yang tersimpan dalam suatu tempat.
3. Banyaknya produk cacat yang terbuang banyak karena sering terjadi
salah pengambilan keputusan.
4. Banyaknya limit produk cacat yang hilang atau rusak menyebabkan
kesulitan untuk pengambilan keputusan produk.
5. Belum adanya suatu akurasi atau metode dalam melihat suatu data dalam
menganalisis suatu klasifikasi produk cacat.
1.3 Rumusan Masalah
Berdasarkan identifikasi masalah diatas, maka dirumuskan permasalahan,
yaitu : “Bagaimana menganalisa data mining untuk produk cacat pada PT.
Shuangying International Indonesia dengan menggunakan metode Klasifikasi
(C4.5)?”.
1.4 Batasan Masalah
Supaya pembahasan masalah yang dilakukan dapat terarah dengan baik dan
tidak menyimpang dari pokok permasalahan, maka penulis membatasi
permasalahan yang akan dibahas, yakni :
1. Proses yang akan diteliti berkisar pada penyediaan data pada bagian
pemeriksaan.
2. Departemen Quality di bagian pemeriksaan.
4
3. Pemeriksaan limit produk cacat diperiksa oleh Departemen Quality.
4. Tidak semua laporan pemeriksaan produk cacat dibuat data, produk cacat
biasanya langsung dibuang dianggap sudah tidak bagus (NOK).
1.5 Tujuan dan Manfaat Penelitian
Penulisan ini mempunyai beberapa tujuan dan manfaat antara lain sebagai
berikut:
1.5.1 Tujuan Penelitian
Berdasarkan rumusan masalah yang telah diuraikan, maka tujuan
dari penelitian ini adalah untuk menganalisa data mining untuk produk cacat
pada PT. Shuangying International Indonesia dengan menggunakan metode
Klasifikasi (C4.5).
1.5.2 Manfaat Penelitian
Penulis berharap bahwa tugas skripsi ini dapat memberikan
kontribusi lebih yang dapat dirasakan oleh berbagai pihak, khususnya bagi
penulis dan umumnya bagi semua pihak yang terlibat maupun tidak terlibat
dalam penulisan tugas skripsi ini, Adapun manfaat penulisan tugas ini
adalah sebagai berikut:
1. Bagi Penulis
Sebagai tambahan dan penerapan ilmu pada program studi Teknik
Informatika dengan kajian data mining dan metode klasifikasi.
5
2. Bagi Program Studi Teknik Informatika STT Pelita Bangsa
Memberikan kontribusi kepada Program Studi mengenai penelitian
data mining metode klasifikasi (C4.5) sebagai referensi bagi
mahasiswa angkatan berikutnya.
3. Bagi Perusahaan
Memberikan kontribusi bagi perusahaan sebagai cara pengambilan
keputusan akurasi yang lebih baik pada PT. Shuangying
International Indonesia.
1.6 Sistematika Penulisan
Penyusunan skripsi ini menggunakan kerangka pembahasan yang terbentuk
dalam susunan bab, dengan uraian sebagai berikut:
BAB I PENDAHULUAN
Bab ini menjelaskan informasi umum tentang latar belakang,
identifikasi masalah, rumusan masalah, batasan masalah, tujuan
dan manfaat penelitian, dan sistematika penulisan.
BAB II TINJAUAN PUSTAKA
Bab ini berisi tinjauan pustaka dan kumpulan penelitian
terdahulu.
BAB III METODOLOGI PENELITIAN
Bab ini menjelaskan metode yang digunakan untuk
menyelesaikan permasalahan dalam penelitian dan perangkat
lunak yang digunakan.
6
BAB IV HASIL DAN PEMBAHASAN
Pada bab ini menjelaskan hasil dari penelitian dan pembahasan
yang telah dilakukan.
BAB V PENUTUP
Bab ini menjelaskan tentang kesimpulan dan saran dari hasil
penyusunan laporan tugas akhir yang telah di susun atau dapat
digunakan untuk penelitian selanjutnya.
7
BAB II
TINJAUAN PUSTAKA
2.1 Tinjauan Penelitian
Dari penelitian yang berkaitan dengan skripsi ini terutama dalam hal
klasifikasi produk cacat, yaitu:
1. Prediksi Kompetensi Karyawan Menggunakan Algoritma C4.5 (Studi Kasus :
PT. Hankook Tire Indonesia ) (Sunge, 2018). Penelitian ini membahas
kompetensi karyawan menggunakan model eksperimen data diperoleh dari data
sekunder yang diperoleh dari data PT Hankook Tire Indonesia di Bekasi yang
datanya dikumpulkan berjumlah 205 data kemudian dibagi menjadi 2 data yaitu
data training sejumlah 164 data dan data testing sejumlah 41 data dengan
perbandingan 80% dan 20% diproses dengan menggunakan algoritma C4.5
dengan akurasi yang didapat sebesar 78,75%.
2. Prediksi Kebangkrutan Perusahaan Menggunakan Algoritma C4.5 Berbasis
Forward Selection (Saleh, 2017). Penelitian ini membahas kebangkrutan
perusahaan dengan menggunakan eksperimen data diperoleh dari dataset global
yang datanya bervariasi jumlah recordnya yang berjumlah 250 record dan 150
record diproses dengan menggunakan algoritma C4.5 dengan akurasi yang
didapat sebesar 99.60%.
3. Penerapan Algoritma C4.5 Untuk Prediksi Tingkat Kompetensi Karyawan PT
Multi Strada Arah Sarana (Wahyono dkk, 2018). Penelitian ini membahas
kompetensi karyawan dengan menggunakan eksperimen data diperoleh dari
hasil tes kompetensi karyawan PT Multistrada Arah Sarana yang datanya
8
dikumpulkan berjumlah 257 data karyawan kemudian dibagi menjadi 2 data
yaitu data training sejumlah 206 data dan data testing sejumlah 51 data dengan
perbandingan 80% dan 20% diproses dengan menggunakan algoritma C4.5
dengan akurasi yang didapat sebesar 80,39%.
4. Penerapan Algoritma Klasifikasi Data Mining C4.5 Pada Dataset Cuaca
Wilayah Bekasi (Novandya dkk, 2017). Penelitian ini membahas cuaca wilayah
bekasi dengan menggunakan eksperimen data diperoleh dari situs World
Weather Online diproses dengan menggunakan algoritma C4.5 dengan akurasi
yang didapat sebesar 88,89%.
Dari uraian diatas, maka penulis menyusun tabel rangkuman tinjauan penelitian
yaitu sebagai berikut:
Tabel 2.1 Rangkuman Tinjauan Penelitian
No Tahun Judul Kesimpulan

1. 2018 Prediksi Kompetensi Menggunakan algoritma C4.5
Karyawan Menggunakan dengan menggunakan kategori
Algoritma C4.5 (Studi Kasus : kompetensi umum, kompetensi
PT Hankook Tire Indonesia) khusus, dan kompetensi teknikal.
2 2017 Prediksi Kebangkrutan Menggunakan algoritma C4.5
Perusahaan Menggunakan berbasis forward selection
Algoritma C4.5 Berbasis dengan menggunakan kriteria
Forward Selection. seperti IR, MR, FF, Credibilty,
Competitivenes, dan Operation
Risk.
9
No Tahun Judul Kesimpulan
3 2018 Penerapan Algoritma C4.5 Menggunakan algoritma C4.5
Untuk Prediksi Tingkat dengan menggunakan kriteria
Kompetensi Karyawan PT mengetahui dasar-dasar
Multistrada Arah Sarana. pengetahuan ban, mengetahui
proses manufaktur ban,
mengetahui secara umum
ISO/TS 16949:2009 dan control
dokumen, memahami konsep
dasar perbaikan berkelanjutan,
memahami dasar K3 (kesehatan
dan keselamatan kerja),
memahami cara membaca spec,
memahami pengisian checksheet
operator TBM, memahami
sistem FIFO, memahami
punching sistem, mampu
melakukan proses assembly
sesuai standar, memahami cara
ganti size, memahami UPH &
cycle time, memahami barcode
sistem, memahami cara venting
GT, memahami macam-macam
defect, memahami offset
10
parameter mesin dan mengerti
pemilahan recycle.
4 2017 Penerapan Algoritma Menggunaka algoritma C4.5
Klasifikasi Data Mining C4.5 dengan menggunakan kriteria
pada Dataset Cuaca Wilayah date, time, desc, weather, temp,
Bekasi. rain, wid, dir, cloud, humadity
dan pressure.
2.2 Kajian Pustaka
2.2.1 Produk Cacat
Produk cacat adalah produk yang belum sesuai dengan spesifikasi yang
ditetapkan oleh suatu standar atau defect product (Dewi, 2012).
Terjadinya produk cacat apabila tidak tepat dalam menentukan setting parameter
didalam suatu proses pada tekanan injeksi, temperatur injeksi dan waktu
pendinginan. Dari hasil simulasi yang didapat menunjukan bahwa kecenderungan
terlalu rendah untuk nilai tekanan injeksi bisa menyebabkan cacat produk
diantaranya short shot, sink mark, dan sedangkan nilai tinggi bisa menyebabkan
produk flashing (Cahyadi, 2014). Misalkan untuk produk cacat short shot tidak
semuanya dinyatakan produk tidak bisa digunakan, dengan cara klasifikasi masih
bisa menentukan short shot dari ukuran cacatnya.
2.2.2 Knowledge Discovery in Databases (KDD)
Knowledge Discovery in Databases (KDD) adalah proses non-sepele untuk
mengidentifikasi pola baru, valid, berpotensi berguna, dan akhirnya dapat
dimengerti dalam data (Gullo, 2015).
11
Interpretation
Selection Preprocessing Tranformation Data Mining /Evaluation
....... ........
Data ....... ........ Knowledge
Target Data Preprocessed Transformed Paterns

Data Data
Gambar 2.1. Proses KDD
Sumber : (Gullo, 2015)
Proses KDD adalah urutan berulang dan interaktif dari langkah-langkah
utama berikut, (Gullo, 2015):
• Data Selection, yang tujuan utamanya adalah untuk membuat kumpulan data
target dari data asli, yaitu, memilih subset variable atau sample data, dimana
penemuan harus dilakukan;
• Data Preprocessing, yang bertujuan untuk “membersihkan” data dengan
melakukan berbagai operasi, seperti pemodelan kebisingan dan pengulangan,
mendefinisikan strategi yang tepat untuk menangani bidang data yang hilang,
akuntansi untuk informasi urutan waktu;
• Data Transformasi, yang bertugas mengurangi dan memproyeksikan data,
dalam rangka untuk memperoleh representasi yang sesuai untuk tugas spesifik
yang akan dilakukan; ini biasanya dilakukan dengan melibatkan teknik
transformasi atau metode yang mampu menemukan representasi data yang tidak
berubah;
• Data Mining, yang berkaitan dengan pengambilan pola yang menarik dengan
memilih metode data mining tertentu atau tugas (misalnya, summarization,
12
classification, clustering, regression, dan sebagainya), algoritma yang tepat
untuk melakukan tugas di tangan, dan representatif yang tepat dari hasil output;
• Data Interpretation/Evaluation, yang di eksploitasi oleh pengguna untuk
menafsirkan dan mengekstrak pengetahuan dari pola yang ditambang, dengan
menvisualisasikan pola. Interpretasi ini biasanya dilakukan dengan
memvisualisasikan pola, model, atau data yang diberikan model tersebut dan,
dalam kasus, secara iteratif melihat kembali langkah-langkah sebelumnya dari
proses.
2.2.3 Pengertian Data Mining
Data Mining atau penambangan data adalah teknik yang relatif cepat dan
mudah untuk menemukan pengetahuan, pola dan atau relasi antar data, secara
otomatis. Dengan menggabungkan empat disiplin ilmu komputer seperti pada
definisi di atas, pengetahuan bisa diketemukan dalam lima proses berurutan:
seleksi, pra pemrosesan, transformasi, data mining, dan interpretasi/evaluasi
(Suyanto, 2017).
Data Mining adalah proses menemukan pola-pola menarik dari jumlah data
yang sangat kecil. Sebagai proses penemuan pengetahuan, biasanya melibatkan
pembersihan data, integrasi data, pemilihan data, transformasi data, penemuan pola,
evaluasi pola, dan presentasi pengetahuan (Han et al, 2012).
Data mining merupakan suatu proses untuk mengidentifikasi pola yang
memiliki potensi dan berguna untuk mengelola dataset yang besar (Witten et al,
2011). Data Mining merupakan penggalian makna yang tersembunyi dari
kumpulan data yang sangat besar. Karena itu data mining sebenarnya memiliki akar
13
yang panjang dari bidang ilmu seperti kecerdasan buatan (artficial intelligent),
machine leraning, statistik dan basis data (Aprilla C dkk, 2013).
Dapat disimpulkan bahwa data mining adalah proses analisa dengan
menggali informasi dalam basis data dengan cara mengekstraksi untuk menemukan
suatu pola pengetahuan baru yang tidak diketahui sebelumnya dan akan bermanfaat
pada masa yang akan datang.
2.2.4 Pengelompokan Data Mining
Secara menyeluruh, kegunaan data mining dapat dibagi menjadi dua:
deskriptif dan prediktif (Suyanto, 2017). Deskriptif berarti data mining digunakan
untuk mencari pola-pola yang dapat dipahami manusia yang menjelaskan
karakteristik data. Sedangkan prediktif adalah data mining digunakan untuk
membentuk sebuah model pengetahuan yang akan digunakan untuk melakukan
prediksi.
Berdasarkan fungsionalitasnya, tugas-tugas data mining bisa
dikelompokkan kedalam delapan kelompok (Kotu et al, 2015), berikut ini adalah:
REGRESSION
CLASSIFICATION CLUSTERING
FEATURE
DATA MINING ASSOCIATION
SELECTION
ANOMALY
TEXT MINING
DETECTION
TIME SERIES
FORECASTING
Gambar 2.2 Data Mining Berdasarkan Fungsionalitas
Sumber : (Kotu et al, 2015)
14
• Klasifikasi (classification): menggeneralisasi struktur yang diketahui untuk
diaplikasikan pada data-data baru.
• Regresi (regression): menemukan suatu fungsi yang memodelkan data
dengan galat (kesalahan prediksi) seminimal mungkin.
• Klasterisasi (clustering) : mengelompokkan data, yang tidak diketahui label
kelasnya, ke dalam sejumlah kelompok tertentu sesuai dengan ukuran
kemiripannya.
• Pembelajaran aturan asosiasi (association rule learning) atau pemodelan ke
bergantungan (dependency modeling): mencari relasi antar variable.
• Deteksi anomali (anomaly detection): mengidentifikasi data yang tidak
umum, bisa berupa outlier (pencilan), perubahan atau deviasi yang mungkin
sangat penting dan perlu investigasi lebih lanjut.
• Peramalan Seri Waktu (Time Series Forecasting): Proses data mining
dimana akan membentuk model untuk memprediksi nilai suatu masa depan
dengan melihat atau menganalisa model di masa yang lalu.
• Penambangan Teks (Text Mining): Perbatasan baru analisis prediktif dan
domain dari data mining tidak terstruktur.
• Seleksi Fitur (Feature Selection): Proses identifikasi beberapa variable atau
atribut yang paling penting dalam model untuk prediksi yang akurat.
2.2.5 Metode Klasifikasi
Klasifikasi adalah wilayah penelitian yang sudah lama di mana kebanyakan
pendekatan dan algoritma yang berbeda telah ada didefinisikan, termasuk K Nearest
Neighbors (KNN), Decision Tress, Support Vector Machines (SVM), Neural
Networks, Gradient Boosted Decision Trees (GDBT) (Gullo, 2015).
15
Klasifikasi adalah suatu teknik dengan melihat pada kelakuan dan atribut
dari kelompok yang telah didefinisikan. Teknik ini dapat memberikan klasifikasi
pada data baru dengan memanipulasi data yang telah diklasifikasi dan dengan
menggunakan hasilnya untuk memberikan sejumlah aturan (Aprilla C dkk, 2013).
Klasifikasi adalah proses menemukan model (atau fungsi) yang
menggambarkan dan membedakan kelas atau konsep data. Model diturunkan
berdasarkan analisis satu set data pelatihan (yaitu, objek data yang dikenal oleh
label kelas). Model ini digunakan untuk memprediksi label kelas objek yang label
kelasnya tidak diketahui (Han et al, 2012).
Klasifikasi merupakan penentuan sebuah record data baru ke salah satu
beberapa kategori dimana telah ditentukan sebelumnya (Sinambela dkk, 2016).
KLASIFIKASI
Support Vector k Nearest

C4.5 AdaBoost Naive Bayes CART
Machine Neighbor
Gambar 2.3 Algoritma Klasifikasi
Sumber : (Sinambela dkk, 2016)
Untuk membuat suatu data dalam klasifikasi diantaranya:
1. Kelas, merupakan variable tidak bebas atau dapat dikatakan hasil dari
klasifikasi.
2. Prediktor, merupakan variable bebas yang digunakan untuk menentukan
pola atau karakteristik data yang akan diklasifikasikan.
16
3. Set data training, merupakan sekumpulan data yang berisi kelas dan
prediktor yang akan diuji untuk mendapat pengelompokan sesuai dengan
kelas yang tepat.
4. Set Data Uji, merupakan data-data baru yang akan di kelompokkan oleh
model guna mengetahui akurasi dari model yang telah dibuat.
2.2.6 Decision Tree (Pohon Keputusan)
Diantara beberapa metode yang dapat digunakan untuk klasifikasi adalah
metode pohon keputusan atau decision tree. Metode pohon keputusan merupakan
sebuah metode yang dapat mengubah fakta yang sangat besar menjadi sebuah
pohon keputusan yang merepresentasikan aturan.
Sebuah pohon keputusan adalah sebuah struktur yang dapat digunakan
untuk membagi kumpulan-kumpulan data yang besar menjadi himpunan-himpunan
record yang lebih kecil dengan menerapkan serangkaian aturan keputusan. Dengan
masing-masing rangkaian pembagi, anggota himpunan hasil menjadi mirip satu
dengan yang lainnya. Data dalam pohon keputusan biasanya dinyatakan dalam
bentuk tabel dengan atribut dan record. Atribut menyatakan suatu parameter yang
dibuat sebagai kriteria dalam pembentukan pohon. Proses pada pohon keputusan
adalah mengubah bentuk data (tabel) menjadi model pohon, mengubah model
pohon menjadi rule, dan menyederhanakan rule. Beberapa Algoritma yang bisa
digunakan dalam pembentukan pohon keputusan, diantaranya IDE3, CART, dan
C4.5. Algoritma C4.5 merupakan pengembangan dari algoritma ID (Mardi, 2017).
Pohon keputusan adalah salah satu metode yang paling populer untuk
klasifikasi dalam berbagai aplikasi data mining dan membantu proses pengambilan
keputusan. Pohon keputusan adalah pohon terarah dengan simpul akar yang tidak
17
memiliki tepi masuk dan semua simpul lainnya dengan tepat satu ujung yang
masuk, yang dikenal sebagai simpul keputusan. Pada tahap pelatihan, setiap simpul
internal membagi ruang contoh menjadi dua atau lebih bagian dengan tujuan
mengoptimalkan kinerja pengklasifikasi. Setelah itu, setiap jalur dari simpul akar
ke simpul daun membentuk aturan keputusan untuk menentukan kelas mana yang
merupakan turunan baru (Dai et al, 2014).
Pohon keputusan khas terdiri dari node internal, tepi dan simpul daun.
Setiap simpul internal disebut simpul keputusan yang mewakili pengujian pada
atribut atau subkumpulan atribut, dan setiap sisi diberi label dengan nilai atau
rentang nilai tertentu dari atribut masukan. Dengan cara ini, node internal yang
terkait dengan tepiannya membagi ruang instance menjadi dua atau lebih partisi.
Setiap simpul daun adalah simpul terminal pohon dengan label kelas. Misalnya,
Gambar 2.4 memberikan ilustrasi dari pohon keputusan dasar, dimana lingkaran
berarti simpul keputusan dan persegi berarti simpul daun. Dalam contoh ini,
memiliki tiga atribut pemisahan, yaitu usia, jenis kelamin, dan kriteria 3, bersama
dengan dua label kelas, yaitu, YA dan TIDAK. Setiap jalur dari simpul akar ke daun
node membentuk aturan klasifikasi (Dai et al, 2014).
age
≥20 <20
NO
gender
female <20
YES
criteria 3
yes no
YES NO
Gambar 2.4 Contoh Decision Tree
Sumber : (Dai et al, 2014)
18
2.2.7 Algoritma C4.5
Salah satu algoritma yang dapat digunakan untuk membuat pohon
keputusan (decision tree) adalah algoritma C4.5. Algoritmaa C4.5 merupakan
algoritma yang sangat popular yang digunakan oleh banyak peneliti di dunia, hal
ini dijelaskan oleh Algoritmaa C4.5 merupakan pengembangan dari algoritma ID3
yang diciptakan oleh J. Rose Quinlan (Mardi, 2017).
Secara Umum algoritma C4.5 untuk membangun pohon keputusan adalah sebagai
berikut:
1. Pilih atribut sebagai akar
2. Buat cabang untuk tiap-tiap nilai
3. Bagi kasus dalam cabang
4. Ulangi proses untuk setiap cabang sampai semua kasus pada cabang
memiliki kelas yang sama.
Untuk memilih atribut sebagai akar, didasarkan pada nilai gain tertinggi dari
atribut-atribut yang ada.
2.2.8 Keuntungan dan Kerugian Algoritma C4.5
Algoritma C4.5 memungkinkan pemangkasan pohon keputusan yang
dihasilkan. Hal ini meningkatkan tingkat kesalahan pada data pelatihan, tetapi yang
lebih penting, menurunkan tingkat kesalahan pada data pengujian yang tidak
terlihat. Algoritma C4.5 juga dapat menangani atribut numerik, nilai yang hilang,
data noise. Dan memiliki kelebihan dasn kerugian (Singh et al, 2014), sebagai
berikut :
19
• Keuntungan, yaitu :
1. C4.5 dapat menangani atribut kontinyu dan diskrit
2. C.45 memungkinkan nilai atribut yang hilang diubah menjadi tanda
“?”, Nilai atribut yang hilang tidak digunakan dalam penghitungan
gain dan entropy.
3. C4.5 melalui pohon yang sudah dibuat dan dicoba untuk menghapus
cabang yang tidak membantu dengan menggantinya dengan simpul
daun.
• Kerugian, yaitu :
1. C4.5 dapat membangun cabang kosong yang nilainya tidak
berkontribusi untuk menghasilkan aturan.
2. Terjadi overfitting akibat dari noise data.
3. Noise data yang rentan terjadi pada C.45
2.2.9 Tahapan Membangun Algoritma C4.5
Untuk membangun tahapan sebuah pohon keputusan dengan algoritma C4.5
(Rohman, 2016) dan (Raharja, 2014), adalah sebagai berikut :
• Awal, mempersiapkan data training, data diambil dari data history yang
pernah terjadi sebelumnya dan sudah dikelompokan dalam kelas-kelas
tertentu.
• Entropy, yaitu konsep yang menyatakan tingkat impurity dari kumpulan
objek atau suatu himpunan, menentukan nilai entropy dapat dihitung dengan
rumus berikut :
𝐸𝑛𝑡𝑟𝑜𝑝𝑦 (𝑆) = ∑ − 𝑃𝑗 𝑙𝑜𝑔2 𝑃𝑗 (2.1)

𝑗=1
20
Keterangan dari persamaan (2.1):
S : Himpunan Kasus
n : Jumlah Partisi S
Pj : Jumlah probabilitas yang di dapat dari kelas dibagi total kasus
• Information Gain, yaitu kriteria yang digunakan untuk memilih suatu atribut
yang populer, dapat dihitung dengan cara pengelompokan berdasarkan
masing-masing atribut dalam suatu data. Notasi information gain adalah
Gain (S,A) yang berarti dalam data atribut A relatif terhadap output S,
menentukan nilai information gain dapat dihitung sebagai berikut :
𝑛
|𝑆𝑖|
𝐺𝑎𝑖𝑛 (𝑆, 𝐴) = 𝐸𝑛𝑡𝑟𝑜𝑝𝑦 (𝑆) − ∑ ∗ 𝐸𝑛𝑡𝑟𝑜𝑝𝑦 (𝑆𝑖) (2.2)
|𝑆|
𝑖=1
S : Himpunan Kasus
A : Atribut
Si : Jumlah kasus pada atribut A yang memiliki partisi ke-i
• Split Information, yaitu nilai split pada tiap atribut atau term baru sebelum
menentukan gain ratio, menentukan nilai split information dapat dihitung
sebagai berikut :
𝑛
𝑆𝑖 𝑆𝑖
𝑆𝑝𝑙𝑖𝑡 𝐼𝑛𝑓𝑜𝑟𝑚𝑎𝑡𝑖𝑜𝑛 (𝑆, 𝐴) = − ∑ ∗ 𝑙𝑜𝑔2 ∗ (2.3)
𝑆 𝑆
𝑖=1
21
S : Himpunan Kasus
A : Atribut
Si : Jumlah kasus pada atribut A yang memiliki partisi ke-i
• Gain Ratio, yaitu nilai yang dipilih untuk menjadi akar pohon, menentukan
nilai gain ratio dapat dihitung sebagai berikut :
𝐺𝑎𝑖𝑛 (𝑆, 𝐴)
𝐺𝑎𝑖𝑛 𝑅𝑎𝑡𝑖𝑜 (𝑆, 𝐴) = (2.4)
𝑆𝑝𝑙𝑖𝑡 𝐼𝑛𝑓𝑜𝑟𝑚𝑎𝑡𝑖𝑜𝑛 (𝑆, 𝐴)
S : Himpunan Kasus
A : Atribut
Dengan mengetahui rumus-rumus diatas, data yang telah diperoleh dapat
dimasukkan dan diproses dengan algoritma C4.5.
Setelah itu dilanjutkan proses evaluasi dengan confusion table dan ROC
curve. Hasil confusion table digunakan untuk menyajikan accuracy, recall, dan
precision dalam algoritma klasifikasi. Accuracy merupakan persentase antara nilai
prediksi dengan nilai sebenarnya yang ada. Recall merupakan persentase nilai
kinerja keberhasilan algoritma yang dipakai. Precision merupakan nilai akurasi
dengan kelas yang telah diprediksi.
22
Tabel 2.2 Confusion Table
Nilai Sebenarnya
TRUE FALSE
TP FP
TRUE (True Positive) (False Negative)
Correct Result Unexpeted Result
Nilai
Prediksi
FN TN
FALSE (False negative) (True Negative)
Missing Result Correct Absence of Result
𝑇𝑃+𝑇𝑁
Rumus Accuracy = 𝑇𝑃+𝑇𝑁+𝐹𝑃+𝐹𝑁 ∗ 100%
𝑇𝑃
Rumus Recall = 𝑇𝑃+𝐹𝑁 ∗ 100%
𝑇𝑃
Rumus Precision = 𝑇𝑃+𝐹𝑃 ∗ 100%
Keterangan : TP = True Positive FP = False Positive
TN = True Negative FN = False Negative
Receiver Operating Characteristic (ROC) digunakan untuk mengevaluasi
hasil akurasi dalam bentuk grafik. ROC merupakan kurva yang akan menghasilkan
nilai Area Under Cover (AUC). AUC merupakan nilai akurasi area dibawah kurva
yang dihasilkan oleh ROC (Saifudin dkk, 2015). Performance keakurasian nilai
AUC dapat diklasifikasikan menjadi lima kelompok (Silalahi dkk, 2017), yaitu :
1. 0.90 – 1.00 = Excellent Clasification
2. 0.80 – 0.90 = Good Clasification
3. 0.70 – 0.80 = Fair Clasification
23
4. 0.60 – 0.70 = Poor Clasification
5. 0.50 – 0.60 = Failure
24
BAB III
METODOLOGI PENELITIAN
3.1 Objek Penelitian
3.1.1 Gambaran Umum
PT. Shuangying International Indonesia mulai beroperasi pada 23 Maret
2016 dan fokus pada pasar indonesia dan ekspor ke benua Asia. Di negara China
nya sendiri berdiri perusahaan pada tahun 2000 dan sudah memiliki 11 perusahaan.
Pabrik kami berlokasi di kawasan Cikarang Pusat, Jawa Barat. Berjarak 70km dari
Ibukota Jakarta. Produksi yang dibuat adalah produk Otomotif (Komponen Interior,
dan Exterior). Kami akan menyerap sekitar 1.00 tenaga kerja lokal pada tahun
pertama produksi, dan akan tumbuh menjadi sekitar 3.00 dalam 5 tahun produksi
dalam rencana kami.
Gambar 3.1 Lokasi Tempat Penelitian PT. Shuangying International Indonesia
Sumber : (Google Maps, 2018)
25
3.1.2 Visi dan Misi
Adapun visi dan misi dari PT. Shuangying International adalah sebagai berikut:
1. Visi PT. Shuangying International Indonesia
Pada saat menjadi supplier maka akan menjadi supplier terbaik,
Pada saat menjadi customer maka akan menjadi customer terbaik.
2. Misi PT. Shuangying International Indonesia
Berlandaskan pada kualitas dan keterampilan unggul, menghasilkan produk
dengan biaya terjangkau & superioritas nilai yang tinggi untuk
mengembangkan masyarakat, melampaui antusiasme pelanggan dan staf.
3.1.3 Struktur Organisasi
Pengorganisasian (organizing) merupakan proses penyusunan stuktur
organisasi yang sesuai dengan tujuan organisasi, sumber daya manusia yang
dimilikinya dan lingkungan yang melingkupinya. Dua aspek dalam penyusunan
struktur organisasi adalah departemen dan pembagian kerja. Departemen
merupakan pengelompokan kegiatan-kegiatan kerja suatu organisasi agar kegiatan-
kegiatan sejenis dapat saling berhubungan dikerjakan secara bersama. Hal ini akan
tercermin pada struktur formal suatu organisasi, dan tampak atau ditunjukkan oleh
suatu bagan organisasi.
Pembagian kerja adalah perincian tugas pekerjaan agar setiap individu
dalam organisasi bertanggung jawab untuk melaksanakan sekumpulan kegiatan
terbatas. Struktur organisasi menunjukkan kerangka dan susunan perwujudan pola
tetap hubungan-hubungan diantara fungsi-fungsi, bagian-bagian atau posisi,
maupun orang-orang yang menunjukkan kedudukan, tugas wewenang dan
tanggung jawab yang berbeda-beda dalam suatu organisasi.
26
Struktur ini mengandung unsur-unsur spesialisasi kerja, standarisasi kerja,
koordinasi, sentralisasi atau desentralisasi dalam pembuatan keputusan dan besaran
(ukuran) satuan kerja. Untuk itu agar tujuan organisasi pada PT. Shuangying
International Indonesia tercapai dengan baik maka perlu dibuatkan bagan
organisasi.
Bagan organisasi menggambarkan lima aspek utama suatu struktur
organisai, yaitu:
1. Pembagian Kerja
2. Manajer dan bawahan atau rantai perintah
3. Tipe pekerjaan yang diperintahkan
4. Pengelompokkan segmen-segmen pekerjaan
5. Tingkatan manajemen
Structure Organization
PT. Shuangying International Indonesia
Director of Operation
Vice Director Ass. Director
LOGISTIK &
HRD FINANCE TECHNICAL QUALITY PURCHASING
PRODUCTION
Gambar 3.2 Struktur Organisasi PT. Shuangying International Indonesia
Sumber : (Data Primer, 2018)
27
3.1.4 Departement dalam Struktur Organisasi
Struktur organisasi perusahaan dapat diartikan sebagai sebuah garis
bertingkat (hierarki), yang berisi komponen-komponen penyusun perusahaan.
Struktur tersebut akan menggambarkan dengan jelas departement, fungsi, hak dan
kewajiban dari masing-masing posisi yang ada dalam lingkup perusahaan tersebut,
diantaranya sebagai berikut:
1. HRD (Sumber Daya Manusia/SDM) bertanggung jawab menangani
berbagai masalah pada ruang lingkup karyawan, pegawai, buruh, manajer
dan tenaga kerja lainnya untuk dapat menunjang aktifitas organisasi atau
perusahaan.
2. Finance (keuangan) bertanggung jawab terhadap segala aktivitas keuangan,
baik dari pengelolaan, penerimaan, transaksi, pencatatan dan laporan
perusahaan.
3. Logistik bertanggung jawab mengatur sistem pemasukan, pengeluaran, dan
penyimpanan produk pada perusahaan.
4. Produksi bertanggung jawab memproduksi atau membuat barang sesuai
dengan yang direncanakan. Di departement ini komponen dirakit menjadi
sub-rakitan (sub-assembly), kemudian sub-rakitan dirakit lagi menjadi
barang jadi atau finish good ataupun hasil akhir dari perusahaan adalah sub-
rakitan yang langsung dijual ke customer.
5. Technical Quality bertanggung jawab terhadap sistim kualitas produk dan
sistemnya. Perlu digaris bawahi bahwa semua orang di perusahaan
bertanggung jawab terhadap kualitas di areanya masing-masing, tanggung
jawab Technical Quality Department disini adalah tanggung jawab official.
28
Department Technical Quality Department
Quality Manager
Chen Zongyu
Product Engineer QE
Ridwan F Rani Yuliani W
Leader
1 Person
Quality Control
Shift 1 : 2 Person
Shift 2 : 2 Person
Note : Quality Control Jobdesc : Inspection Line, Assembly Line & Handling Internal Problem
Gambar 3.3 Department Technical Quality
6. Purchasing (Pembelian) bertanggung jawab dalam pembelian material,
mesin-mesin, peralatan, dan perlengkapan beserta fasilitas-fasilitas lainnya
yang mendukung kelancaran proses produksi.
3.2 Waktu Penelitian
Penelitian ini dilaksanakan selama 4 bulan pada bulan Juni 2018 sampai
dengan September 2018 di PT. Shuangying International Indonesia yang beralamat
di Kawasan Greendland International Industrial Center (GIIC) Blok BA No.2 Kota
Deltamas Desa Sukamahi Kecamatan Cikarang Pusat Kabupaten Bekasi 17530.
3.3 Pengumpulan dan Pengolahan Data
Jenis penelitian ini menggunakan model eksperimen, merupakan
mengunakan data dalam penelitian dan menghasilkan kesimpulan yang mampu
dibuktikan oleh pengamatan atau percobaan (Sunge, 2018).
29
Penelitian ini menggunakan data primer yang diperoleh secara langsung di
PT. Shuangying International Indonesia karena peneliti bekerja sebagai karyawan
di PT. Shuangying International Indonesia. Setelah data dikumpulkan berjumlah
112 data kemudian dibagi menjadi 2 yaitu data training sejumlah 90 data dan data
testing sejumlah 22 data dengan perbandingan 80% dan 20%. Hasil data training
digunakan untuk memperoleh hasil klasifikasi untuk prediksi pengendalian kualitas
dalam bentuk pohon keputusan dan data testing digunakan tingkat akurasi dari hasil
klasifikasi tersebut.
3.4 Peralatan
Penelitian yang dilakukan memerlukan peralatan untuk mendukung
pelaksanaan penelitian. Peralatan-peralatan tersebut berupa kebutuhan perangkat
lunak (software) dan perangkat keras (hardware), sebagai berikut :
• Kebutuhan software
1. Sistem Operasi Windows 8 versi 64 bit, untuk menjalankan program
data mining tools.
2. Rapidminer versi 5.3, sebagai data mining tools untuk menjalankan
tahap-tahap data mining, serta menghitung hasil akurasi.
• Kebutuhan hardware
1. Laptop Type Lenovo
2. Processor Intel Core i3
3. Memory Ram 4 GB
4. Hardisk 500 GB
30
3.4 Kerangka Pemikiran
Adapun kerangka pemikiran dari penelitian yang dilakukan adalah sebagai berikut:
Identifikasi Masalah Metode Pengembangan Impelementasinya Pengukuran
Belum ada
prediksi yang Dataset Produk
akurat dalam Confusion
pengambilan Matrix
Framework Produk
keputusan
RapidMiner OK dan NOK
dalam Algoritma Kurva ROC
klasifikasi Klasifikasi
untuk produk
cacat C4.5
Gambar 3.4 Kerangka Pemikiran
31
BAB IV
HASIL DAN PEMBAHASAN
4.1 Hasil Penelitian
Dari proses klasifikasi dengan menggunakan Knowledge Discovery in
Databases (KDD) kemudian menganalisa produk cacat.
Tabel 4.1 Kategori Produk Cacat pada PT. Shuangying International Indonesia.
No Atribut Penentuan Calon Cabang

1 Berat Produk Berat Besar Berat Sedang Berat Kecil
2 Bentuk Produk Bentuk Besar Bentuk Sedang Bentuk Kecil
3 Pengukuran Pengukuran ada Pengukuran tidak ada
4 Ukuran Cacat Ukuran Besar Ukuran Kecil Ukuran tidak ada
5 Posisi Posisi Luar Posisi Dalam
6 Area Area Lock Area rib Area no lock & rib
Dari hasil yang ada kemudian dikategorikan dengan variable, atribut
dengan nilai produk cacat kemudian dijadikan data training dan data testing.
Tabel 4.2 Data Training untuk produk cacat
Berat Bentuk Penguku Ukuran

Produk Posisi Area Hasil
Produk Produk ran Cacat
produk
lock
1 kecil besar ada besar luar NOK
produk
lock
2 sedang besar ada kecil luar NOK
produk
lock
3 kecil besar ada besar dalam NOK
produk
lock
4 sedang besar ada kecil dalam NOK
produk tidak
lock
5 besar besar ada ada luar OK
produk no lock
6 sedang besar ada kecil luar & rib NOK
produk
lock
32
produk
lock
produk tidak no lock
9 besar besar ada ada luar & rib OK
produk tidak
lock
10 besar besar ada ada dalam OK
produk no lock
11 kecil besar ada besar luar & rib NOK
produk no lock
produk
lock
produk tidak
lock
14 besar besar ada ada dalam OK
produk no lock
15 kecil besar ada besar luar & rib NOK
produk no lock
produk
lock
produk
lock
19 besar besar ada ada luar & rib OK
produk tidak
lock
20 besar besar ada ada Dalam OK
produk
lock
21 kecil kecil ada Besar Dalam NOK
produk
lock
22 sedang kecil ada Kecil Dalam NOK
produk
rib
23 kecil kecil ada Besar Dalam OK
produk no lock
24 sedang kecil ada Kecil Luar & rib NOK
25 besar kecil ada ada Luar & rib OK
produk tidak
lock
26 besar kecil ada ada Dalam OK
produk tidak
rib
27 besar kecil ada ada Dalam OK
produk Tidak
lock
28 kecil kecil Ada Besar Dalam NOK
produk Tidak
lock
29 sedang kecil Ada Kecil Dalam NOK
33
produk Tidak
rib
30 kecil kecil Ada Besar Dalam OK
produk Tidak no lock
31 sedang kecil Ada Kecil Luar & rib NOK
produk Tidak tidak no lock
32 besar kecil Ada ada Luar & rib OK
produk Tidak tidak
lock
33 besar kecil Ada ada Dalam OK
produk Tidak tidak
rib
35 kecil sedang Ada Besar Luar & rib NOK
36 sedang sedang Ada Kecil Dalam & rib NOK
37 besar sedang Ada ada Luar & rib NOK
38 besar sedang Ada ada Dalam & rib NOK
produk Tidak
lock
produk Tidak
lock
produk Tidak
rib
41 kecil kecil Ada Besar Dalam OK
produk Tidak
rib
42 sedang kecil Ada Kecil Dalam OK
43 besar kecil Ada ada Luar & rib OK
produk Tidak tidak
lock
produk Tidak tidak
rib
47 sedang sedang Ada Kecil Luar & rib NOK
produk Tidak
lock
48 kecil sedang Ada Besar Dalam NOK
produk Tidak
rib
49 sedang sedang Ada Kecil Dalam OK
50 besar sedang Ada ada Luar & rib OK
produk Tidak tidak
lock
51 besar sedang Ada ada Dalam OK
34
produk Tidak tidak
rib
54 sedang sedang Ada Kecil Luar & rib NOK
produk Tidak
lock
55 kecil sedang Ada Besar Dalam NOK
produk Tidak
rib
56 sedang sedang Ada Kecil Dalam OK
57 besar sedang Ada ada Luar & rib OK
produk Tidak tidak
lock
produk Tidak tidak
rib
produk
lock
60 kecil besar ada Besar Luar NOK
produk
lock
61 sedang besar ada Kecil Luar NOK
produk
lock
62 kecil besar ada Besar Dalam NOK
produk
lock
63 sedang besar ada Kecil Dalam NOK
produk
lock
produk
lock
produk
lock
produk
lock
produk tidak
lock
68 besar besar ada ada Luar OK
produk tidak
lock
produk no lock
70 kecil sedang ada Besar Luar & rib NOK
produk no lock
71 sedang sedang ada Kecil Luar & rib NOK
produk
lock
72 kecil sedang ada Besar Dalam NOK
produk
rib
73 sedang sedang ada Kecil Dalam OK
35
74 besar sedang ada ada Luar & rib OK
produk tidak
lock
75 besar sedang ada ada Dalam OK
produk tidak
rib
76 besar sedang ada ada Dalam OK
produk
lock
produk
lock
produk
lock
produk tidak
lock
produk
lock
produk
lock
produk
lock
produk
lock
produk tidak
lock
85 besar besar ada ada Luar OK
produk Tidak
lock
86 sedang kecil Ada Kecil Luar NOK
produk Tidak
lock
produk Tidak
lock
produk Tidak tidak
lock
89 besar kecil Ada ada Luar OK
produk Tidak tidak
lock
Tabel 4.2 menunjukan bahwa dari data training sebanyak 90 data, yang
diperoleh kelas OK berjumlah 37 produk dan NOK berjumlah 53 produk. Didapat
nilai entropy sebesar 0,97708, ternyata atribut tertinggi yaitu Berat dengan
information gain sebesar 0,516041, pada split info sebesar 1,583376 dan Gain Ratio
sebesar 0,325912
36
Tabel 4.3 Penghitungan Data Training
JML
OK NOK INFORMATION
ATRIBUT PRODUK ENTROPY SPLIT INFO GAIN
(Si) (Si) GAIN
(S)
TOTAL 90 37 53 0,977080223
BERAT 0,516041835 1,583376455 0,325912283
Besar 32 30 2 0,337290067
Sedang 29 4 25 0,578794625
Kecil 29 3 26 0,479832024
Entropy :
37 37 53 53
= ((− ) ∗ 𝑙𝑜𝑔2 ( ) + (− ) ∗ 𝑙𝑜𝑔2 ( ))
90 90 90 90
= 0,977080
Information Gain :
32 29 29
= (0,977080) − (( ) ∗ 0,337290) − (( ) ∗ 0,578794) − (( ) ∗ 0,479832)
90 90 90
= 0,516041
Split Information :
32 32 29 29 29 29
= −(( ) ∗ (𝑙𝑜𝑔2 ( ))) + ( ) ∗ (𝑙𝑜𝑔2 ( ))) + ( ) ∗ (𝑙𝑜𝑔2 ( ))))
90 90 90 90 90 90
= 1,583376
Gain Ratio :
0,516041
= = 0,325912
1,583376
37
Pada penelitian ini dilakukan proses read excel, berikut permodelan yang
didalam read excel :
Gambar 4.1 Model Read Excel dengan Decision Tree C4.5
Dan dilanjutkan penelitian untuk dilakukan proses validasi menggunakan
fitur cross validation. Berikut merupakan permodelan yang ada didalam cross
validation :
Gambar 4.2 Model Cross Validation dengan Decision Tree C4.5
Pada permodelan cross validation didalamnya terdapat dua bagian, yaitu bagian
training (digunakan untuk algoritma klasifikasi Decision Tree) dan testing bagian
testing (menggunakan fitur Apply Model untuk mengaplikasikan model pada data
38
testing dan fitur Performance untuk menampilkan confusion table, yang diigunakan
untuk menampilkan hasil dari accuracy, recall, precision, dan nilai AUC.
Maka terbentuk simpul-simpul diperoleh decision tree untuk klasifikasi
prediksi produk cacat pada gambar 4.3
Gambar 4.3 Pohon Keputusan Produk Cacat
39
Berikut deskripsi dari permodelan yang dihasilkan decision tree :
Gambar 4.4 Deskripsi Permodelan Decision Tree C4.5
4.2 Pembahasan
Banyaknya produk cacat pada saat proses produksi terbuang karena tidak
memiliki pengambilan keputusan secara klasifikasi produk cacat yang bisa
membantu mempermudah proses pemeriksaan, sehingga inspector kesulitan dalam
mencari limit produk cacat ataupun membuat laporan pemeriksaan setiap harinya.
Selain itu lamanya dalam proses pemeriksaan bisa mengurangi hasil produksi dan
tentunya hal ini bisa menjadi kerugian untuk perusahaan.
Berdasarkan penelitian yang telah dilakukan, maka hasil penelitian sebagai
berikut, setelah data diolah maka diuji tingkat akurasinya dari metode yang
40
digunakan dari metode Algoritma C4.5 dilakukan tingkat akurasi dengan confusion
matrix dan kurva ROC/AUC (Area Under Cover).
Perhitungan akurasi data training dari 90 data, 51 data diklasifikasikan
prediksi NOK dan ternyata NOK, 2 data diprediksi NOK tetapi ternyata OK, 2 data
diprediksi OK tetapi ternyata NOK dan sebanyak 35 data diprediksi sesuai OK,
dengan nilai accuracy sebesar 95,56%.
Gambar 4.5 Hasil Accuracy (Data Training) Decision Tree C4.5
Penghitungan Accuracy :
Tabel 4.4 Confusion Matrix Penghitungan Accuracy
Nilai Sebenarnya
TRUE FALSE
TP FP
TRUE
51 2
Nilai
Prediksi
FN TN
FALSE
2 35
41
𝑇𝑃 + 𝑇𝑁
𝐴𝑐𝑐𝑢𝑟𝑎𝑐𝑦 = ∗ 100%
𝑇𝑃 + 𝑇𝑁 + 𝐹𝑃 + 𝐹𝑁
51 + 35
= ∗ 100%
51 + 35 + 2 + 2
86
= ∗ 100%
90
= 0,95555 ∗ 100%
= 95,56%
Perhitungan akurasi berdasarkan recall, 51 data diklasifikasikan prediksi
NOK dan ternyata NOK, 2 data diprediksi NOK tetapi ternyata OK, 2 data
dengan nilai recall sebesar 95,00%.
Gambar 4.6 Hasil Recall (Data Training) Decision Tree C4.5
42
Penghitungan Recall :
Tabel 4.5 Confusion Matrix Penghitungan Recall
Nilai Sebenarnya
TRUE FALSE
TP FP
TRUE
51 2
Nilai
Prediksi
FN TN
FALSE
2 35
𝑇𝑃
𝑅𝑒𝑐𝑎𝑙𝑙 = ∗ 100%
𝑇𝑃 + 𝐹𝑁
51
= ∗ 100%
51 + 2
51
= ∗ 100%
53
= 0,96225 ∗ 100%
= 96,23%
Perhitungan akurasi berdasarkan precision, 51 data diklasifikasikan prediksi
NOK dan ternyata NOK, 2 data diprediksi NOK tetapi ternyata OK, 2 data
dengan nilai precision sebesar 95.00%.
43
Gambar 4.7 Hasil Precision (Data Training) Decision Tree C4.5
Penghitungan Precision :
Tabel 4.6 Confusion Matrix Penghitungan Precision
Nilai Sebenarnya
TRUE FALSE
TP FP
TRUE
51 2
Nilai
Prediksi
FN TN
FALSE
2 35
𝑇𝑃
𝑃𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛 = ∗ 100%
𝑇𝑃 + 𝐹𝑃
51
= ∗ 100%
51 + 2
51
= ∗ 100%
53
= 0,96225 ∗ 100%
= 96,23%
44
Hasil yang didapat dari pengolahan ROC metode Algoritma C4.5 sebesar
1.000 menggunakan data training dapat dilihat gambar 4.11 dengan tingkat akurasi
Excellent Clasification.
Gambar 4.8 Hasil Evaluasi Data Training ROC/AUC
45
BAB V
KESIMPULAN
5.1 Kesimpulan
Kesimpulan dari penelitian ini adalah hasil analisa data mining dari produk
cacat pada PT. Shuangying International Indonesia dengan metode
klasifikasi (C4.5).
Data mining dapat diaplikasikan sebagai pengetahuan, informasi untuk
mengatasi masalah yang telah terindentifikasi pada penelitian ini. Dari hasil
data mining produk cacat, dapat terurai menjadi pengetahuan dan prediksi
sehingga hasil dari pengolahan data dapat menjadi sumber informasi dalam
produk cacat. Dari 90 data training diperoleh menjadi produk OK (37) dan
NOK (57). Berdasarkan evaluasi dan pengujian prediksi yang telah
dilakukan, analisa data mining dengan metode klasifikasi untuk produk
cacat pada PT. Shuangying International Indonesia, menggunakan
Algoritma C4.5 dengan Confusion Matrix menghasilkan accuracy sebesar
95,56%, recall sebesar 95,00%, dan precision sebesar 95,00%. Hasil yang
didapat dari pengolahan kurva ROC sebesar 1.000 menggunakan data
training dengan tingkat akurasi Excellent Clasification.
5.2 Saran
Berdasarkan penelitian yang dilakukan, penulis dapat memberikan beberapa
saran sebagai berikut:
1. Memaksimalkan atau menambah atribut yang lebih spesifik dan lebih
banyak dalam menentukan prediksi produk cacat seperti parameter
46
setting, jenis material, campuran material dan lain sebagainya oleh
bagian pemeriksa agar prediksi produk cacat lebih akurat.
2. Perlu adanya penelitian lebih lanjut dengan melakukan pengujian
dengan metode lain maupun komparasi seperti Naïve Bayes, Neural
Network dan lain sebagainya agar memperoleh perbandingan dengan
tingkat akurasi yang paling tinggi dalam membuat kualifikasi prediksi
produk cacat.
47
DAFTAR PUSTAKA
Aprilla C, Dennis., Baskoro, Donny Aji., Ambarwati, Lia., Wicaksana, I Wayan
Simri. (2013). Belajar Data Mining Dengan RapidMiner, 5(4), 1–5.
https://doi.org/10.1007/s13398-014-0173-7.2
Cahyadi, D. (2014). Analisis Parameter Operasi Pada Proses Plastik Injection
Molding Untuk Pengendalian Cacat Produk. Jurnal Mesin Teknologi, 8(2), 8–
16. Retrieved from
https://jurnal.umj.ac.id/index.php/sintek/article/view/161/143
Dai, Wei., Ji, W. (2014). A Map Reduce Implementation of C4.5 Decision Tree
Algorithm, 7(1), 49–60.
Dewi, Shanty Kusuma. (2012). Minimasi Defect Produk Dengan Konsep Six Sigma.
Jurnal Teknik Industri, 13, 43–50.
Gullo, Francesco. (2015). From Patterns in Data to Knowledge Discovery: What
Data Mining Can Do. Physics Procedia, 62, 18–22.
https://doi.org/10.1016/j.phpro.2015.02.005
Han, Jiawei., Kamber, Micheline ., Pei, Jian. (2012). Data Mining: Concepts and
Techniques. San Francisco, CA, itd: Morgan Kaufmann.
https://doi.org/10.1016/B978-0-12-381479-1.00001-0
Kotu, Vijay., Deshpanda, Bala. (2015). Predictive Analytics and Data Mining. In
Predictive Analytics and Data Mining (pp. 1–16). Morgan Kaufmann.
https://doi.org/10.1016/B978-0-12-801460-8.00001-X
Mardi, Yuli. (2017). Data Mining : Klasifikasi Menggunakan Algoritma C4.5.
48
Jurnal Edik Informatika, 2(2), 213–219.
Novandya, Adhika., Oktria, Isni. (2017). Penerapan Algoritma Klasifikasi Data
Mining C4.5 Pada Dataset Cuaca Wilayah Bekasi. Jurnal Format, 6(2), 98–
106.
Raharja, Yosoa Putra. (2014). Rancang Bangun Sistem Rekomendasi Beasiswa
Menggunakan ALgoritma Klasifikasi C4.5 pada Universitas Dian
Nuswantoro. Undinus, 1–4. Retrieved from http://eprints.dinus.ac.id/13408/
Rohman, Abdul. (2016). Komporasi Metode Klasifikasi Data Mining Untuk
Prediksi Penyakit Jantung. Neo Teknika, 2(2), 21–28.
Saifudin, Aries., Wahono, Romi Satrio. (2015). Penerapan Teknik Ensemble untuk
Menangani Ketidakseimbangan Kelas pada Prediksi Cacat Software. Journal
of Software Engineering, 1(1), 28–37. https://doi.org/10.1016/S1896-
1126(14)00030-3
Saleh, Hamsir. (2017). Prediksi Kebangrutan Perusahaan Menggunakan
Algoritma C4.5 Berbasis Forward Selection, 9, 173–180.
Silalahi, Kristiani Desri., Murfi, Hendri., Satria, Yudi. (2017). Studi Perbandingan
Pemilihan Fitur untuk Support Vector Machine pada Klasifikasi Penilaian
Risiko Kredit, 1(2), 119–136.
Sinambela, Mutiara Shany., Mayadewi, RA Paramita., Rosely, Ely. (2016). Sistem
Pendukung Keputusan Peminatan Jurusan Siswa Di SMA Menggunakan
Algoritma Klasifikasi Data Mining C4.5, 2(3), 858–866.
Singh, Sonia., Gupta, Prinyanka. (2014). Comparative Study ID3 , CART And C4.5
Decision Tree Algorithm : A Survey, 27(27), 97–103.
49
Sunge, Aswan Supriyadi. (2018). Prediksi Kompetensi Karyawan Menggunakan
Algoritma C4.5 ( Studi Kasus : PT Hankook Tire Indonesia ), 2018(Sentika),
23–24.
Suyanto. (2017). Data Mining Untuk Klasifikasi Dan Klasterisasi Data. Penerbit:
Informatika Bandung. (ISBN): 978-602-6232-36-6.
Wahyono., Nugroho, Agung. (2018). Penerapan Algoritma C4.5 Untuk Prediksi
Tingkat Kompetensi Karyawan PT Multistrada Arah Sarana, 3(1), 1–6.
Witten, Ian H., Frank, Eibe. (2011). Data Mining: Practical Machine Learning
Tools and Techniques (Google eBook). Complementary literature None.
https://doi.org/0120884070, 9780120884070
50
LAMPIRAN
Data Set :
Berat Bentuk Ukuran

Produk Pengukuran Posisi Area Hasil
Produk Produk Cacat
produk
lock
1 kecil Besar ada Besar Luar NOK
produk
lock
2 sedang Besar ada Kecil Luar NOK
produk
lock
3 kecil Besar ada Besar Dalam NOK
produk
lock
4 sedang Besar ada Kecil Dalam NOK
produk tidak
lock
5 besar Besar ada ada Luar OK
produk tidak
lock
6 besar Besar ada ada Dalam OK
produk no lock
7 kecil Besar ada Besar Luar & rib NOK
produk no lock
8 sedang Besar ada Kecil Luar & rib NOK
produk
lock
produk
lock
11 besar Besar ada ada Luar & rib OK
produk tidak
lock
produk no lock
produk no lock
produk
lock
produk
lock
produk tidak
lock
produk no lock
produk no lock
51
Berat Bentuk Ukuran
Produk Produk Cacat
produk
lock
produk
lock
produk tidak
lock
produk
lock
25 kecil Kecil ada Besar Dalam NOK
produk
lock
26 sedang Kecil ada Kecil Dalam NOK
produk
rib
27 kecil Kecil ada Besar Dalam OK
produk
rib
28 sedang Kecil ada Kecil Dalam OK
produk no lock
29 kecil Kecil ada Besar Luar & rib NOK
produk no lock
30 sedang Kecil ada Kecil Luar & rib NOK
31 besar Kecil ada ada Luar & rib OK
produk tidak
lock
32 besar Kecil ada ada Dalam OK
produk tidak
rib
33 besar Kecil ada ada Dalam OK
produk
lock
34 kecil Kecil Tidak Ada Besar Dalam NOK
produk
lock
35 sedang Kecil Tidak Ada Kecil Dalam NOK
produk
rib
36 kecil Kecil Tidak Ada Besar Dalam OK
produk
rib
37 sedang Kecil Tidak Ada Kecil Dalam OK
produk no lock
38 kecil Kecil Tidak Ada Besar Luar & rib NOK
produk no lock
39 sedang Kecil Tidak Ada Kecil Luar & rib NOK
40 besar Kecil Tidak Ada ada Luar & rib OK
produk tidak
lock
41 besar Kecil Tidak Ada ada Dalam OK
produk tidak
rib
produk no lock
43 kecil Sedang Tidak Ada Besar Luar & rib NOK
52
Berat Bentuk Ukuran
Produk Produk Cacat
produk no lock
44 sedang Sedang Tidak Ada Kecil Dalam & rib NOK
45 besar Sedang Tidak Ada ada Luar & rib NOK
46 besar Sedang Tidak Ada ada Dalam & rib NOK
produk no lock
47 kecil Kecil Tidak Ada Besar luar & rib NOK
produk no lock
48 sedang Kecil Tidak Ada Kecil Luar & rib NOK
produk
lock
produk
lock
produk
rib
51 kecil Kecil Tidak Ada Besar Dalam OK
produk
rib
52 sedang Kecil Tidak Ada Kecil Dalam OK
53 besar Kecil Tidak Ada ada Luar & rib OK
produk tidak
lock
produk tidak
rib
produk no lock
produk no lock
57 sedang Sedang Tidak Ada Kecil Luar & rib NOK
produk
lock
58 kecil Sedang Tidak Ada Besar Dalam NOK
produk
lock
59 sedang Sedang Tidak Ada Kecil Dalam NOK
produk
rib
60 kecil Sedang Tidak Ada Besar Dalam OK
produk
rib
61 sedang Sedang Tidak Ada Kecil Dalam OK
62 besar Sedang Tidak Ada ada Luar & rib OK
produk tidak
lock
63 besar Sedang Tidak Ada ada Dalam OK
produk tidak
rib
produk no lock
produk no lock
66 sedang Sedang Tidak Ada Kecil Luar & rib NOK
53
Berat Bentuk Ukuran
Produk Produk Cacat
produk
lock
67 kecil Sedang Tidak Ada Besar Dalam NOK
produk
lock
68 sedang Sedang Tidak Ada Kecil Dalam NOK
produk
rib
69 kecil Sedang Tidak Ada Besar Dalam OK
produk
rib
70 sedang Sedang Tidak Ada Kecil Dalam OK
71 besar Sedang Tidak Ada ada Luar & rib OK
produk tidak
lock
produk tidak
rib
produk
lock
produk
lock
produk
lock
produk
lock
produk tidak
lock
produk tidak
lock
produk
lock
produk
lock
produk
lock
produk
lock
produk tidak
lock
produk tidak
lock
produk no lock
86 kecil Sedang ada Besar Luar & rib NOK
produk no lock
87 sedang Sedang ada Kecil Luar & rib NOK
produk
lock
88 kecil Sedang ada Besar Dalam NOK
produk
lock
89 sedang Sedang ada Kecil Dalam NOK
54
Berat Bentuk Ukuran
Produk Produk Cacat
produk
rib
90 kecil Sedang ada Besar Dalam OK
produk
rib
91 sedang Sedang ada Kecil Dalam OK
92 besar Sedang ada ada Luar & rib OK
produk tidak
lock
93 besar Sedang ada ada Dalam OK
produk tidak
rib
94 besar Sedang ada ada Dalam OK
produk
lock
produk
lock
produk
lock
produk
lock
produk tidak
lock
produk tidak
lock
produk
lock
produk
lock
produk
lock
produk
lock
produk tidak
lock
produk tidak
lock
produk
lock
107 kecil Kecil Tidak Ada Besar Luar NOK
produk
lock
108 sedang Kecil Tidak Ada Kecil Luar NOK
produk
lock
produk
lock
produk tidak
lock
111 besar Kecil Tidak Ada ada Luar OK
produk tidak
lock
55
Hasil Uji Plagiat :
56

Metode Klasifikasi Itudeh

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Metode Klasifikasi Itudeh

Diunggah oleh

Hak Cipta:

Format Tersedia

ANALISA DATA MINING DENGAN METODE

KLASIFIKASI UNTUK PRODUK CACAT PADA PT.

RANI YULIANI WULANDARI

Diajukan Sebagai Salah Satu Syarat Untuk Menyelesaikan

RANI YULIANI WULANDARI

ANALISA DATA MINING DENGAN METODE KLASIFIKASI UNTUK

Yang disusun oleh

RANI YULIANI WULANDARI

telah disetujui oleh Dosen Pembimbing Skripsi

Dosen Pembimbing 1 Dosen Pembimbing 2

Aswan S. Sunge, S.E., M.Kom Nisa Nurhidayanti, S.Pd., M.T

Aswan S. Sunge, S.E., M.Kom

ANALISA DATA MINING DENGAN METODE KLASIFIKASI UNTUK

Yang disusun oleh:

Dosen Penguji 1 Dosen Penguji 2

Abdul Halim Anshor, S.Kom.,M.Kom Ir. Tri Ngudi Wiyatno, M.T

Dosen Pembimbing 1 Dosen Pembimbing 2

Aswan S. Sunge, S.E., M.Kom Nisa Nurhidayanti, S.Pd., M.T

Aswan S. Sunge, S.E., M.Kom

Dr. Ir. Supriyanto, M.P

Bekasi, 20 Oktober 2018

Puji syukur penulis panjatkan kehadiran Allah SWT. yang telah

Skripsi tersusun dalam rangka melengkapi salah satu persyaratan dalam

Bekasi, 20 Oktober 2018

Rani Yuliani Wulandari

PERNYATAAN KEASLIAN PENELITIAN ....................................................... iii

KATA PENGANTAR ........................................................................................... iv

DAFTAR ISI .......................................................................................................... vi

DAFTAR TABEL .................................................................................................. ix

DAFTAR GAMBAR .............................................................................................. x

ABSTRACT ............................................................................................................ xii

BAB I PENDAHULUAN ....................................................................................... 1

1.1 Latar Belakang ......................................................................................... 1

1.2 Identifikasi Masalah ................................................................................. 3

1.3 Rumusan Masalah .................................................................................... 4

1.4 Batasan Masalah ....................................................................................... 4

1.5 Tujuan dan Manfaat Penelitian................................................................. 5

1.5.1 Tujuan Penelitian .............................................................................. 5

1.5.2 Manfaat Penelitian ............................................................................ 5

1.6 Sistematika Penulisan ............................................................................... 6

BAB II TINJAUAN PUSTAKA............................................................................. 8

2.2 Kajian Pustaka ........................................................................................ 11

2.2.1 Produk Cacat ................................................................................... 11

2.2.2 Knowledge Discovery in Databases (KDD) ................................... 11

2.2.3 Pengertian Data Mining .................................................................. 13

2.2.4 Pengelompokan Data Mining.......................................................... 14

2.2.5 Metode Klasifikasi .......................................................................... 15

2.2.6 Decision Tree (Pohon Keputusan) .................................................. 17

2.2.7 Algoritma C4.5 ................................................................................ 19

2.2.8 Keuntungan dan Kerugian Algoritma C4.5 .................................... 19

2.2.9 Tahapan Membangun Algoritma C4.5 ............................................ 20

BAB III METODOLOGI PENELITIAN.............................................................. 25

3.1 Objek Penelitian ..................................................................................... 25

3.1.1 Gambaran Umum ............................................................................ 25

3.1.2 Visi dan Misi ................................................................................... 26

3.1.3 Struktur Organisasi ......................................................................... 26

3.1.4 Departement dalam Struktur Organisasi ......................................... 28

3.2 Waktu Penelitian .................................................................................... 29

3.3 Pengumpulan dan Pengolahan Data ....................................................... 29

3.4 Peralatan ................................................................................................. 30

3.4 Kerangka Pemikiran ............................................................................... 31

4.1 Hasil Penelitian....................................................................................... 32

4.2 Pembahasan ............................................................................................ 40