Anda di halaman 1dari 14

PERSETUJUAN TESIS

Nama : RUSMAN HENDRO SUSANTO


NPM : 3612091106
Konsentrasi : Rekayasa Perangkat Lunak
Judul tesis : Penerapan Algoritma C45 Untuk Penentuan Hasil
Penerimaan Peserta Didik Baru (PPDB) SMKN 1
Pandeglang Di Kabupaten Pandeglang

Telah disetujui untuk disidangkan pada Sidang Tesis pada Program Pasca Sarjana
(S2) Magister Komputer, Program Studi Teknik Informatika Sekolah Tinggi
Manajemen Informatika dan Komputer Eresha.

Jakarta, 30 Juli 2013

Pembimbing Utama Pembimbing Pendamping

Dr. Rufman Iman Akbar E, MM, M.Kom Ahmad Fitriansyah, M.Kom.

Ketua Ketua Program Studi


Pasca Sarjana

Ir. Damsiruddin Siregar, MM Dr. Rufman Iman Akbar E, MM, M.Kom

i
PENGESAHAN TESIS

Nama : RUSMAN HENDRO SUSANTO


NPM : 3612091106
Konsentrasi : Rekayasa Perangkat Lunak
Judul tesis : Penerapan Algoritma C45 Untuk Penentuan Hasil
Penerimaan Peserta Didik Baru (PPDB) SMKN 1
Pandeglang Di Kabupaten Pandeglang

Telah disidangkan dan dinyatakan Lulus Sidang Tesis pada Program Pasca Sarjana (S2)
Magister Komputer, Program Studi Teknik Informatika Sekolah Tinggi Manajemen
Informatika dan Komputer Eresha pada tanggal 30 Juli 2013

Nama Penguji Tanda Tangan

Ahmad Fitriansyah, M. Kom. .........................................

Ir. Damsirudin Siregar, MM. .........................................

Ir. Tony Hb Ongko, SE, ME.Sc. .............................................

Mengetahui :
Ketua Program Studi
Pasca Sarjana

Dr. Rufman Iman Akbar E, MM, M.Kom.

ii
PERNYATAAN KEASLIAN TESIS

Nama : RUSMAN HENDRO SUSANTO


NPM : 3612091106
Konsentrasi : Rekayasa Perangkat Lunak
Judul tesis : Penerapan Algoritma C45 Untuk Penentuan Hasil
Penerimaan Peserta Didik Baru (PPDB) SMKN 1
Pandeglang Di Kabupaten Pandeglang

Dengan ini saya menyatakan bahwa dalam Tesis ini tidak terdapat karya
yang pernah diajukan untuk memperoleh gelar kesarjanaan di suatu Perguruan
Tinggi, dan sepanjang pengetahuan saya juga tidak terdapat karya atau pendapat
yang pernah ditulis atau diterbitkan oleh orang lain, kecuali yang secara tertulis
diacu dalam naskah ini dan disebutkan dalam daftar pustaka.

Jakarta, 24 September 2013

Rusman Hendro Susanto

iii
RUSMAN HENDRO SUSANTO, 3612091106

Penerapan Algoritma C45 Untuk Penentuan Hasil Penerimaan Peserta Didik


Baru (PPDB) SMKN 1 Pandeglang Di Kabupaten Pandeglang; di bawah
bimbingan Dr. Rufman Iman Akbar E, MM, M.Kom dan Ahmad Fitriansyah,
M.Kom.

110 + xiv hal / 16 tabel / 24 gambar / 3 lampiran / 13 pustaka ( 2006 – 2013 )

ABSTRAK

SMK Negeri 1 Pandeglang sebagai sekolah paforit perlu selektif dalam


proses Penerimaan Peserta Didik Baru (PPDB) sebagai row input siswa, hal ini
bisa dibuktikan dengan selalu menjadi sekolah peserta pendaftar terbanyak dalam
setiap PPDB.
Algoritma C4.5 dengan atribut data TEST, SKHUN, dan Wawancara
mampu menguji kesesuain aturan yang terbentuk oleh data data training dari data
PPDB tahun 2008-2012, dan data uji data PPDB tahun 2013. Model ini dipilih
karena proses learning dan klasifikasi pada algoritma C4.5 sederhana dan cepat
dan mempunyai akurasi tinggi.
Data training sebanyak 852 dilakukan eksperimen dengan Cross-Standard
Industry for Data Mining (CRISP-DM) dengan tahapan Tahap Businnes
Understanding, tahap data understanding, tahap data preparation, tahap data
preprocessing dengan entropy total di dapat 0,96683, dan gain SKHUN 0,27765,
gain TEST 0,49132, gain wawancara 0,10466 dan didapat TEST sebagai root
untuk menghasilkan tree berikutnya, selanjutnya dari tree model ini akan
menghasilkan rule yang terbentuk, lalu diterapkan dengan rapidminer. Tahapan
akhir adalah proses evaluasi dengan data testing yang bersumber dari data PPDB
tahun 2013 dengan crossvalidation dari hasil evaluasi diperoleh akurasi 94.48%.
Dari 163 data testing hasilnya adalah 153 merupakan correct prediction dan 9
record data wrong prediction.
Dengan terbentuknya rule model yang dihasilkan dan telah teruji
akurasinya dengan Algoritma C4.5, SMK dapat menerapkan dalam penentuan
hasil pada PPDB SMK dengan akurat dan benar.

Kata kunci :
decision tree, algoritma C4.5, peserta didik, penerimaan peserta didik baru

iv
RUSMAN HENDRO SUSANTO, 3612091106
Application of C45 Algorithm for Students Admision at SMK 1 Pandeglang;
Under the guidance from Dr. Rufman Iman Akbar E, MM., M.Kom, and Ahmad
Fitriansyah , M.Kom.

xiv + 10 page / 16 tables / 24 images / 3 enclosure / 13 references ( 2006-2013)

ABSTRACT

SMK Negeri 1 Pandeglang as paforit schools need to be selective in the


process of Students New Admission as an input row of students , it can be proved
to always be the most registrants participating schools in each PPDB .
C4.5 algorithm with data attributes TEST, SKHUN, and interviews were
able to test specific rules formed by the data from the data PPDB training data
from 2008-2012, and test data PPDB the data in 2013. This model was chosen
because of the process of learning and C4.5 classification algorithm is simple,
fast and has high accuracy.
Training data as much as 852 performed experiments with the Cross-
Industry Standard for Data Mining (CRISP-DM ) to the stages of Phase Business
Understanding , understanding the data phase , the data preparation phase , the
data preprocessing stage with a total entropy can be 0.96683 , and gain SKHUN
0 , 27765 , TEST gain 0.49132 , 0.10466 and gain interview obtained TEST as
root to generate the next tree , then from the model tree will produce a rule that is
formed , and then applied with RapidMiner . The final stage is the process of
evaluating the testing data is sourced from the data PPDB in 2013 with
crossvalidation of evaluation results obtained 94.48 % accuracy . Data of 163
153 testing result is a correct prediction and 9 record the data wrong prediction .
With the establishment of the rule and the resulting models have been
tested for accuracy by C4.5 algorithm , CMS may apply in determining outcomes
in vocational PPDB accurately and correctly .

Key word:
Decision Tree, C4.5 Algorithms, Student, Admission New Students

v
KATA PENGANTAR

Dengan memanjatkan puji syukur kehadiran Tuhan Yang Maha Esa yang
telah melimpahkan segala rahmat dan hidayahnya kepada penulis, sehingga
tersusunlah tesis yang berjudul “Penerapan Algoritma C45 Untuk Penentuan
Hasil Penerimaan Peserta Didik Baru (PPDB) SMKN 1 Pandeglang Di Kabupaten
Pandeglang”.
Tesis tersebut melengkapi salah satu persyaratan yang diajukan dalam
rangka menempuh ujian akhir untuk memperoleh gelar Magister Komputer
(M.Kom.) pada Program Pasca Sarjana (S2), Program Studi Teknik Informatika
di Sekolah Tinggi Manajemen Informatika dan Komputer Eresha
Penulis sungguh sangat menyadari, bahwa penulisan tesis ini tidak akan
terwujud tanpa adanya dukungan dan bantuan dari perbagai pihak. Maka, dalam
kesempatan ini penulis menghaturkan penghargaan dan ucapan terima kasih yang
sebesar-besarnya kepada yang telah memberikan dukungan, yang terhormat :
1. Bapak Ir. Damsiruddin Siregar, MM, selaku Ketua STMIK Eresha.
2. Bapak Dr. Rufman Iman Akbar E., MM, M.Kom, selaku Ketua Program
Studi Pasca Sarjana STMIK Eresha yang sekaligus menjadi dosen
pembimbing Utama yang telah banyak membantu memberikan saran-saran
perbaikan dalam penulisan tesis ini.
3. Bapak Didik Setiyadi, M.Kom, selaku Puket II STMIK Eresha.
4. Bapak Bobby Reza, S.Kom., MM, selaku Puket III STMIK Eresha.
5. Bapak Ahmad Fitriansyah, M.Kom, selaku dosen pembimbing pendamping
yang telah banyak membantu memberikan ide dan saran-saran dalam
penulisan tesis ini.
6. Bapak Ahmad Wihya Dipyana, S.P., M.Si, selaku Kepala SMK Negeri 1
Pandeglang yang telah memberikan izin dan dukungan untuk suksesi
penelitian ini.
7. Bapak/Ibu dosen STMIK Eresha yang telah memberikan ilmunya selama
pengajarannya.

vi
8. Ibu/Bapak orang tua, Mertua, Istri dan seluruh keluarga besar yang telah
memberikan bantuan, dorongan dan motivasi baik moril maupun spirituil.
9. Rekan-rekan seperjuangan Andrianto, Basuki, Noppy H, Susilawati, yang
telah berbagi suka dan duka mulai dari awal perkuliahan sampai selesainya
tesis ini.
10. Teman–teman keluarga besar SMKN 1 Pandeglang dan UNMA Banten dan
semua pihak yang tidak dapat satu persatu.
Akhir kata mohon maaf atas kekeliruan dan kesalahan yang ada dalam
tesis ini, baik yang disengaja maupun tidak disengaja dan berharap semoga tesis
ini dapat memberikan manfaat bagi khasanah pengetahuan teknologi informasi di
Indonesia.

Penulis

vii
DAFTAR ISI

Hal
Persetujuan Tesis............................................................................................ i
Pengesahan Tesis ........................................................................................... ii
Pernyataan Keaslian Tesis.............................................................................. iii
Abstrak ........................................................................................................... iv
Abstract .......................................................................................................... v
Kata Pengantar ............................................................................................... vi
Daftar Isi......................................................................................................... viii
Daftar Tabel .................................................................................................. xi
Daftar Gambar................................................................................................ xii
Daftar Lampiran ............................................................................................. xiv
BAB I PENDAHULUAN
1.1 Latar Belakang ................................................................................. 1
1.2 Permasalahan Penelitian .................................................................... 3
1.2.1 Identifikasi Masalah .................................................................. 3
1.2.2 Ruang Lingkup Masalah ........................................................... 3
1.2.3 Rumusan Masalah ..................................................................... 4
1.3 Tujuan dan Manfaat Penelitian .......................................................... 4
1.3.1 Tujuan Penelitian ...................................................................... 4
1.3.2 Manfaat Penelitian ................................................................... 4
1.4 Sistematika Penulisan......................................................................... 4
BAB II LANDASAN TEORI DAN KERANGKA PEMIKIRAN
2.1 Tinjauan Pustaka ........................................................................ 6
2.2 Landasan Teori ........................................................................... 9
2.2.1Data Mining ......................................................................... 9
2.2.2Klasifikasi ............................................................................ 12
2.2.3Algoritma C45...................................................................... 14
2.3 Studi Kasus .................................................................................... 18
2.4 Rapid Miner................................................................................... 24
2.5 Kerangka Pemikiran ...................................................................... 25

viii
BAB III METODE PENELITIAN
2 ...................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................
3 ...................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................................

3.1 Analisa Kebutuhan ...................................................................... 26


a. Metode Pemilihan Sampel .......................................................... 27
b. Metode Pengumpulan Data ......................................................... 27
3.2 Perancangan Penelitian dan Teknik Analisis .............................. 28
3.2.1 Variabel Penelitian .............................................................. 28
3.2.2 Alat Bantu Penelitian .......................................................... 28
3.2.3 Tahapan Experimen ............................................................. 28
a. Tahap Business Understanding .................................... 29
b. Tahap Data Understanding ........................................... 29
c. Tahap Data Preparation ................................................ 30
d. Tahap Data Preprocessing ............................................ 52
1) Data Cleaning .......................................................... 52
2) Data Integration ....................................................... 52
3) Data Reduction ......................................................... 52
4) Tahap Modeling ...................................................... 52
5) Menghitung Jumlah Kasus Class ............................. 52
6) Menghitung Jumlah Gain ......................................... 53
7) Penerapan Rapid Miner ............................................ 58
e. Tahap Evaluation .......................................................... 63
BAB IV HASIL DAN PEMBAHASAN
4.1. Hasil ........................................................................................... 64
4.1.1. Klasifikasi Hasil PPDB dengan Algoritma C4.5 ............... 64
4.1.2. Pengujian Model ............................................................... 66
4.2. Pembahasan ................................................................................ 76
4.2.1. Pengujian Model Dengan 10 Folds Cross Validation
Menggunakan Confusion Matrix...................................... 78
4.2.2. Pengukuran AUC dengan ROC Curve............................... 78
4.3. Implikasi Penelitian..................................................................... 79
4.3.1. Aspek Manajerial............................................................... 79
4.3.2. Aspek Teknis Sistem ......................................................... 80
4.3.3. Aspek Penelitian Lanjutan ................................................ 80

ix
BAB V KESIMPULAN DAN SARAN
5.1 Kesimpulan.................................................................................. 81
5.2 Saran ........................................................................................... 82
DAFTAR PUSTAKA ................................................................................... 83
DAFTAR RIWAYAT HIDUP ...................................................................... 85
LAMPIRAN-LAMPIRAN ............................................................................ 86

x
DAFTAR TABEL

Hal
Tabel 2.1. Dataset Attribute Penelitian A Decision Tree Classification
Model for University Admission System : (Mashat, Fouad,
Yu & Gharib:2012)..........................................................................6
Tabel 2.2. Keputusan Bermain Tenis ..............................................................18
Tabel 2.3. Perhitungan Node 1 ........................................................................19
Tabel 2.4. Perhitungan Node 1.1. ....................................................................21
Tabel 2.5. Penghitungan Node 1.1.2 ...............................................................22
Tabel 3.1. Kategori Atribut..............................................................................29
Tabel 3.2. Data Data Pendaftaran Peserta Didik Baru SMK Negeri 1
Pandeglang (Diolah Dari Laporan PPDB
2011:(SMKN1Pandeglang:2012) ...................................................30
Tabel 3.3. Tabel Perhitungan Node 1 (Total)..................................................53
Tabel 3.4. Tabel Perhitungn Node 1.1, Node 1.2, Node 1.3, dan Node
1.4 ...................................................................................................54
Tabel 3.5. Tabel Perhitungan Node 1.2.1, Node 1.3.1 ....................................55
Tabel 3.6. Rule Keputusan PPDB SMKN 1 Pandeglang ................................57
Tabel 4.1. Rule Keputusan Uji Data PPDB SMKN 1 Pandeglang..................65
Tabel 4.2. Data Testing PPDB Tahun 2013 Jalur Regular ..............................66
Tabel 4.3. Hasil Pengujian Dengan Algoritma C4.5 .......................................71
Tabel 4.4. Tabel Model Confusion Matric nilai true positives, false
negatives, false positives, dan true negativesdidapat dari data
uji (Han & Kamber, 2006)..............................................................77
Tabel 4.5. Tabel Model Confusion Matric Pengujian Model..........................77

xi
DAFTAR GAMBAR

Hal
Gambar 2.1 Data Mining Adalah Tahapan Dari Proses Penggalian Ilmu
Pengetahuan (Sumber: Han & Kamber:2006)................................11
Gambar 2.2. Pengelompokan Teknik Klasifikasi (Sumber:Kusrini &
Lutfi:2009)......................................................................................12
Gambar 2.3. (a) Tahap learning: data training dianalisa oleh algoritma
klasifikasi dan menghasilkan sejumlah aturan. dan (b) tahap
klasifikasi: menguji akurasi dari algoritma klasifikasi dengan
memasukkan sejumlah data. (sumber : Han&Kamber:2006).........13
Gambar 2.4 Menggambarkan pohon keputusan untuk memprediksi
apakah seseorang membeli komputer. Node internal
disimbolkan dengan persegi, cabang disimbolkan dengan
garis, dan daun disimbolkan dengan oval (Sumber:
Han&Kamber:2006) .......................................................................16
Gambar 2.5 Pohon Keputusan Hasil Perhitungan Node 1 .................................20
Gambar 2.6 Pohon Keputusan Hasil Perhitungan 1.1 ........................................22
Gambar 2.7. Pohon Keputusa Hasil Penghitungan Node 1.1.2...........................23
Gambar 2.8 Tampilan area kerja Rapid Miner. Yang dimasukkan yaitu
data training dan model yaitu decision tree. ..................................24
Gambar 2.9 Kerangka Pemikiran .......................................................................25
Gambar 3.1 Pohon Keputusan Setelah Eksekusi Melalui Rapid Miner
Untuk Data PPDB Sebagaimana Tabel 3.2 Dengan Metode
Information Gain Pohon Yang Terbentuk Belum Dilakukan
Pruning ...........................................................................................56
Gambar 3.2: Icon Rapid Miner............................................................................58
Gambar 3.3: Tampilan Awal Program Rapid Miner ..........................................59
Gambar 3.4: Tampilan Read Excel Pada Rapid Miner .......................................59

xii
Gambar 3.5: Tampilan Buka File Excel ..............................................................60
Gambar 3.6: Tampilan Wijard import configuration wijard 1............................60
Gambar 3.7: Tampilan Wijard import configuration wijard 2............................61
Gambar 3.8: Tampilan Wijard import configuration wijard 3............................61
Gambar 3.9: Tampilan Menggunakan Modeling Decision Tree.........................62
Gambar 3.10: Tampilan Setting Criterion ............................................................62
Gambar 3.11: Start Eksekusi Rapid Miner ...........................................................63
Gambar 3.12: Pohon Keputusan PPDB SMKN 1 Pandeglang .............................63
Gambar 4.1: Decisin Tree Data PPDB SMK ......................................................65
Gambar 4.2: Pengujian Model Dengan Confusion Matrix Menggunakan
Rapidminer .....................................................................................78
Gambar 4.3: Nilai AUC dalam Grafik ROC Metode Pemilihan Atribut
Information Gain ............................................................................79

xiii
DAFTAR LAMPIRAN

Hal
1. Surat Izin Penelitian ...................................................................................86
2. Data Training PPDB SMKN 1 Pandeglang ...............................................87
3. Data Testing PPDB SMKN 1 Pandeglang ...............................................106

xiv

Anda mungkin juga menyukai