Telah disetujui untuk disidangkan pada Sidang Tesis pada Program Pasca Sarjana
(S2) Magister Komputer, Program Studi Teknik Informatika Sekolah Tinggi
Manajemen Informatika dan Komputer Eresha.
i
PENGESAHAN TESIS
Telah disidangkan dan dinyatakan Lulus Sidang Tesis pada Program Pasca Sarjana (S2)
Magister Komputer, Program Studi Teknik Informatika Sekolah Tinggi Manajemen
Informatika dan Komputer Eresha pada tanggal 30 Juli 2013
Mengetahui :
Ketua Program Studi
Pasca Sarjana
ii
PERNYATAAN KEASLIAN TESIS
Dengan ini saya menyatakan bahwa dalam Tesis ini tidak terdapat karya
yang pernah diajukan untuk memperoleh gelar kesarjanaan di suatu Perguruan
Tinggi, dan sepanjang pengetahuan saya juga tidak terdapat karya atau pendapat
yang pernah ditulis atau diterbitkan oleh orang lain, kecuali yang secara tertulis
diacu dalam naskah ini dan disebutkan dalam daftar pustaka.
iii
RUSMAN HENDRO SUSANTO, 3612091106
ABSTRAK
Kata kunci :
decision tree, algoritma C4.5, peserta didik, penerimaan peserta didik baru
iv
RUSMAN HENDRO SUSANTO, 3612091106
Application of C45 Algorithm for Students Admision at SMK 1 Pandeglang;
Under the guidance from Dr. Rufman Iman Akbar E, MM., M.Kom, and Ahmad
Fitriansyah , M.Kom.
ABSTRACT
Key word:
Decision Tree, C4.5 Algorithms, Student, Admission New Students
v
KATA PENGANTAR
Dengan memanjatkan puji syukur kehadiran Tuhan Yang Maha Esa yang
telah melimpahkan segala rahmat dan hidayahnya kepada penulis, sehingga
tersusunlah tesis yang berjudul “Penerapan Algoritma C45 Untuk Penentuan
Hasil Penerimaan Peserta Didik Baru (PPDB) SMKN 1 Pandeglang Di Kabupaten
Pandeglang”.
Tesis tersebut melengkapi salah satu persyaratan yang diajukan dalam
rangka menempuh ujian akhir untuk memperoleh gelar Magister Komputer
(M.Kom.) pada Program Pasca Sarjana (S2), Program Studi Teknik Informatika
di Sekolah Tinggi Manajemen Informatika dan Komputer Eresha
Penulis sungguh sangat menyadari, bahwa penulisan tesis ini tidak akan
terwujud tanpa adanya dukungan dan bantuan dari perbagai pihak. Maka, dalam
kesempatan ini penulis menghaturkan penghargaan dan ucapan terima kasih yang
sebesar-besarnya kepada yang telah memberikan dukungan, yang terhormat :
1. Bapak Ir. Damsiruddin Siregar, MM, selaku Ketua STMIK Eresha.
2. Bapak Dr. Rufman Iman Akbar E., MM, M.Kom, selaku Ketua Program
Studi Pasca Sarjana STMIK Eresha yang sekaligus menjadi dosen
pembimbing Utama yang telah banyak membantu memberikan saran-saran
perbaikan dalam penulisan tesis ini.
3. Bapak Didik Setiyadi, M.Kom, selaku Puket II STMIK Eresha.
4. Bapak Bobby Reza, S.Kom., MM, selaku Puket III STMIK Eresha.
5. Bapak Ahmad Fitriansyah, M.Kom, selaku dosen pembimbing pendamping
yang telah banyak membantu memberikan ide dan saran-saran dalam
penulisan tesis ini.
6. Bapak Ahmad Wihya Dipyana, S.P., M.Si, selaku Kepala SMK Negeri 1
Pandeglang yang telah memberikan izin dan dukungan untuk suksesi
penelitian ini.
7. Bapak/Ibu dosen STMIK Eresha yang telah memberikan ilmunya selama
pengajarannya.
vi
8. Ibu/Bapak orang tua, Mertua, Istri dan seluruh keluarga besar yang telah
memberikan bantuan, dorongan dan motivasi baik moril maupun spirituil.
9. Rekan-rekan seperjuangan Andrianto, Basuki, Noppy H, Susilawati, yang
telah berbagi suka dan duka mulai dari awal perkuliahan sampai selesainya
tesis ini.
10. Teman–teman keluarga besar SMKN 1 Pandeglang dan UNMA Banten dan
semua pihak yang tidak dapat satu persatu.
Akhir kata mohon maaf atas kekeliruan dan kesalahan yang ada dalam
tesis ini, baik yang disengaja maupun tidak disengaja dan berharap semoga tesis
ini dapat memberikan manfaat bagi khasanah pengetahuan teknologi informasi di
Indonesia.
Penulis
vii
DAFTAR ISI
Hal
Persetujuan Tesis............................................................................................ i
Pengesahan Tesis ........................................................................................... ii
Pernyataan Keaslian Tesis.............................................................................. iii
Abstrak ........................................................................................................... iv
Abstract .......................................................................................................... v
Kata Pengantar ............................................................................................... vi
Daftar Isi......................................................................................................... viii
Daftar Tabel .................................................................................................. xi
Daftar Gambar................................................................................................ xii
Daftar Lampiran ............................................................................................. xiv
BAB I PENDAHULUAN
1.1 Latar Belakang ................................................................................. 1
1.2 Permasalahan Penelitian .................................................................... 3
1.2.1 Identifikasi Masalah .................................................................. 3
1.2.2 Ruang Lingkup Masalah ........................................................... 3
1.2.3 Rumusan Masalah ..................................................................... 4
1.3 Tujuan dan Manfaat Penelitian .......................................................... 4
1.3.1 Tujuan Penelitian ...................................................................... 4
1.3.2 Manfaat Penelitian ................................................................... 4
1.4 Sistematika Penulisan......................................................................... 4
BAB II LANDASAN TEORI DAN KERANGKA PEMIKIRAN
2.1 Tinjauan Pustaka ........................................................................ 6
2.2 Landasan Teori ........................................................................... 9
2.2.1Data Mining ......................................................................... 9
2.2.2Klasifikasi ............................................................................ 12
2.2.3Algoritma C45...................................................................... 14
2.3 Studi Kasus .................................................................................... 18
2.4 Rapid Miner................................................................................... 24
2.5 Kerangka Pemikiran ...................................................................... 25
viii
BAB III METODE PENELITIAN
2 ...................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................
3 ...................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................
ix
BAB V KESIMPULAN DAN SARAN
5.1 Kesimpulan.................................................................................. 81
5.2 Saran ........................................................................................... 82
DAFTAR PUSTAKA ................................................................................... 83
DAFTAR RIWAYAT HIDUP ...................................................................... 85
LAMPIRAN-LAMPIRAN ............................................................................ 86
x
DAFTAR TABEL
Hal
Tabel 2.1. Dataset Attribute Penelitian A Decision Tree Classification
Model for University Admission System : (Mashat, Fouad,
Yu & Gharib:2012)..........................................................................6
Tabel 2.2. Keputusan Bermain Tenis ..............................................................18
Tabel 2.3. Perhitungan Node 1 ........................................................................19
Tabel 2.4. Perhitungan Node 1.1. ....................................................................21
Tabel 2.5. Penghitungan Node 1.1.2 ...............................................................22
Tabel 3.1. Kategori Atribut..............................................................................29
Tabel 3.2. Data Data Pendaftaran Peserta Didik Baru SMK Negeri 1
Pandeglang (Diolah Dari Laporan PPDB
2011:(SMKN1Pandeglang:2012) ...................................................30
Tabel 3.3. Tabel Perhitungan Node 1 (Total)..................................................53
Tabel 3.4. Tabel Perhitungn Node 1.1, Node 1.2, Node 1.3, dan Node
1.4 ...................................................................................................54
Tabel 3.5. Tabel Perhitungan Node 1.2.1, Node 1.3.1 ....................................55
Tabel 3.6. Rule Keputusan PPDB SMKN 1 Pandeglang ................................57
Tabel 4.1. Rule Keputusan Uji Data PPDB SMKN 1 Pandeglang..................65
Tabel 4.2. Data Testing PPDB Tahun 2013 Jalur Regular ..............................66
Tabel 4.3. Hasil Pengujian Dengan Algoritma C4.5 .......................................71
Tabel 4.4. Tabel Model Confusion Matric nilai true positives, false
negatives, false positives, dan true negativesdidapat dari data
uji (Han & Kamber, 2006)..............................................................77
Tabel 4.5. Tabel Model Confusion Matric Pengujian Model..........................77
xi
DAFTAR GAMBAR
Hal
Gambar 2.1 Data Mining Adalah Tahapan Dari Proses Penggalian Ilmu
Pengetahuan (Sumber: Han & Kamber:2006)................................11
Gambar 2.2. Pengelompokan Teknik Klasifikasi (Sumber:Kusrini &
Lutfi:2009)......................................................................................12
Gambar 2.3. (a) Tahap learning: data training dianalisa oleh algoritma
klasifikasi dan menghasilkan sejumlah aturan. dan (b) tahap
klasifikasi: menguji akurasi dari algoritma klasifikasi dengan
memasukkan sejumlah data. (sumber : Han&Kamber:2006).........13
Gambar 2.4 Menggambarkan pohon keputusan untuk memprediksi
apakah seseorang membeli komputer. Node internal
disimbolkan dengan persegi, cabang disimbolkan dengan
garis, dan daun disimbolkan dengan oval (Sumber:
Han&Kamber:2006) .......................................................................16
Gambar 2.5 Pohon Keputusan Hasil Perhitungan Node 1 .................................20
Gambar 2.6 Pohon Keputusan Hasil Perhitungan 1.1 ........................................22
Gambar 2.7. Pohon Keputusa Hasil Penghitungan Node 1.1.2...........................23
Gambar 2.8 Tampilan area kerja Rapid Miner. Yang dimasukkan yaitu
data training dan model yaitu decision tree. ..................................24
Gambar 2.9 Kerangka Pemikiran .......................................................................25
Gambar 3.1 Pohon Keputusan Setelah Eksekusi Melalui Rapid Miner
Untuk Data PPDB Sebagaimana Tabel 3.2 Dengan Metode
Information Gain Pohon Yang Terbentuk Belum Dilakukan
Pruning ...........................................................................................56
Gambar 3.2: Icon Rapid Miner............................................................................58
Gambar 3.3: Tampilan Awal Program Rapid Miner ..........................................59
Gambar 3.4: Tampilan Read Excel Pada Rapid Miner .......................................59
xii
Gambar 3.5: Tampilan Buka File Excel ..............................................................60
Gambar 3.6: Tampilan Wijard import configuration wijard 1............................60
Gambar 3.7: Tampilan Wijard import configuration wijard 2............................61
Gambar 3.8: Tampilan Wijard import configuration wijard 3............................61
Gambar 3.9: Tampilan Menggunakan Modeling Decision Tree.........................62
Gambar 3.10: Tampilan Setting Criterion ............................................................62
Gambar 3.11: Start Eksekusi Rapid Miner ...........................................................63
Gambar 3.12: Pohon Keputusan PPDB SMKN 1 Pandeglang .............................63
Gambar 4.1: Decisin Tree Data PPDB SMK ......................................................65
Gambar 4.2: Pengujian Model Dengan Confusion Matrix Menggunakan
Rapidminer .....................................................................................78
Gambar 4.3: Nilai AUC dalam Grafik ROC Metode Pemilihan Atribut
Information Gain ............................................................................79
xiii
DAFTAR LAMPIRAN
Hal
1. Surat Izin Penelitian ...................................................................................86
2. Data Training PPDB SMKN 1 Pandeglang ...............................................87
3. Data Testing PPDB SMKN 1 Pandeglang ...............................................106
xiv