Bayu Aji Prasetyo Skripsi

SKRIPSI
PENERAPAN STRATIFIED SAMPLING PADA KASUS

PENENTUAN JURUSAN SEKOLAH MENENGAH ATAS
GUNA MENINGKATKAN KINERJA ALGORITMA NAIVE
BAYES
Oleh:
BAYU AJI PRASETYO

NIM: 4116075
PROGRAM STUDI SISTEM INFORMASI

FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS PESANTREN TINGGI DARUL ULUM
JOMBANG
2020
PENERAPAN STRATIFIED SAMPLING PADA KASUS
PENENTUAN JURUSAN SEKOLAH MENENGAH ATAS
GUNA MENINGKATKAN KINERJA ALGORITMA NAIVE
BAYES
SKRIPSI
Diajukan sebagai salah satu syarat untuk menyelesaikan

Program Sarjana Komputer
Oleh:
BAYU AJI PRASETYO

NIM: 4116075
PROGRAM STUDI SISTEM INFORMASI

FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS PESANTREN TINGGI DARUL ULUM
JOMBANG
2020
ii
HALAMAN MOTTO
“Rahasia keberhasilan adalah kerja keras dan belajar dari

kegagalan”
“Kecil Terbina, Muda Berkarya, Hidup Sejahtera, Tua

Berwibawa, Mati Masuk Surga”
iii
HALAMAN PERSEMBAHAN
Puji Syukur Kehadirat Allah SWT dan Sholawat Kepada

Nabi Muhammad SAW. Dalam Penulisan Skripsi ini penulis
mengucapkan banyak terima kasih dan mempersembahkan
skripsi ini untuk :
1. Kedua orang tuaku tercinta yang telah memberikan
dukungan, semangat dan do’a serta keikhlasan
memberikan dukungan materi, moral dan spiritual yang
tak terhitung. sehingga penulis dapat menyelesaikan
skripsi ini dengan tepat waktu untuk kesuksesan dimasa
mendatang.
2. Kepada kakak-kakak dan adik-adik diucapkan terima
kasih atas doa dukungan guna untuk mendukung
kesuksesan penulis ini.
3. Kepada seluruh sahabat yang senantiasa menemani
kesana kemari untuk mengerjakan tugas skripsi ini.
Untuk teman teman seperjuangan Fakultas Teknik
tahun 2016 Unipdu khususnya keluarga besar kelas C. yang
senantiasa saling membantu satu sama lain, semoga
kabaikan dan keikhlasan kalian akan dibalas dengan kebaikan
yang lebih.
iv
PERNYATAAN KEASLIAN
Saya yang bertanda-tangan di bawah ini

menyatakan bahwa skripsi ini merupakan karya saya sendiri
(ASLI), dan isi dalam skripsi ini tidak terdapat karya yang
pernah diajukan oleh orang lain untuk memperoleh gelar
akademis di suatu Perguruan Tinggi, dan sepanjang
pengetahuan saya juga tidak terdapat karya atau pendapat
yang pernah ditulis dan/atau diterbitkan oleh orang lain,
kecuali yang secara tertulis diacu dalam naskah ini dan
disebutkan dalam daftar pustaka. Pernyataan ini saya buat
dengan sesungguhnya, apabila di kemudian hari terdapat
penyimpangan dan ketidakbenaran dalam pernyataan ini,
maka saya bersedia menerima SANKSI AKADEMIK dengan
pencabutan gelar yang sudah diperoleh, serta sanksi lainnya
sesuai dengan norma yang berlaku di Perguruan Tinggi.
Dinyatakan di Jombang
Tanggal 24 Januari 2020
{Ttd & materai 6000}
Wahyu Try Maulana

4116098
v
HALAMAN PERSETUJUAN DAN PENGESAHAN
vi
KATA PENGANTAR
Dengan mengucap puji dan syukur kehadirat Allah

SWT, karena atas ridho dan hidayah-Nya, sehingga penulis
dapat menyelesaikan Skripsi ini. Maksud dan tujuan dari
penulisan Skripsi ini adalah untuk memenuhi persyaratan
kelulusan Program Studi Strata I pada Jurusan Sistem
Informasi di Universitas Pesantren Tinggi Darul ‘Ulum
Jombang.
Penulis merasa bahwa dalam menyusun laporan ini
masih menemui beberapa kesulitan dan hambatan, disamping
itu juga menyadari bahwa penulisan laporan ini masih jauh
dari sempurna dan masih banyak kekurangan-kekurangan
lainnya, maka dari itu penulis mengharapkan saran dan kritik
yang membangun dari semua pihak.
Menyadari penyusunan laporan ini tidak lepas dari
bantuan berbagai pihak, maka pada kesempatan ini penulis
menyampaikan ucapan terima kasih yang setulus-tulusnya
kepada:
1. Ayah dan Ibu yang telah memberikan dukungan
materi dan do’a.
2. Rektor Unipdu Jombang, Bapak Prof. DR. H.
Ahmad Zahro, Lc, MA. Beserta segenap jajaran
rektorat.
3. Dekan Fakultas Saintek Unipdu Jombang
Mukhamad Masrur, S.Kom., M.Kom beserta
segenap jajaran dekanat.
4. Eddy Kurniawan, S.Kom., M.M. Selaku ketua
program studi Sistem Informasi Unipdu
Jombang.
5. Siti Mutrofin, S.Kom., M.Kom. Selaku dosen
pembimbing satu yang telah memberikan
vii
bimbingan, motivasi dan saran yang diberikan
dalam penyusunan skripsi.
6. Nufan Balafif, S.Kom., M.Kom. Selaku dosen
pembimbing dua yang telah memberikan
bimbingan, motivasi dan saran yang diberikan
dalam penyusunan skripsi.
7. Pihak SMAN 3 Jombang yang telah mendukung
dalam pengumpulan data sehingga skripsi dapat
segera saya selesaikan
8. Segenap dosen dan karyawan fakultas saintek
Unipdu Jombang.
9. Segenap mahasiswa fakultas saintek Unipdu
Jombang khususnya angkatan 2016 yang telah
memberikan dorongan untuk menyelesaikan
skripsi ini.
10. Semua pihak yang telah membantu dalam
penyelesaian skripsi ini yang tidak bisa penulis
sebutkan satu persatu.
Akhir kata, semoga Allah SWT senantiasa

melimpahkan karunia-Nya dan membalas segala amal budi
serta kebaikan pihak-pihak yang telah membantu penulis
dalam penyusunan laporan ini dan semoga tulisan ini dapat
memberikan manfaat bagi pihak-pihak yang membutuhkan.
Jombang, 04 Juli 2020
Penulis
viii
DAFTAR ISI
HALAMAN MOTTO iii

HALAMAN PERSEMBAHAN iv
PERNYATAAN KEASLIAN v
HALAMAN PERSETUJUAN DAN PENGESAHAN vi
KATA PENGANTAR vii
DAFTAR ISI ix
DAFTAR TABEL xii
PERNYATAAN KEASLIAN xiii
DAFTAR GAMBAR xiv
DAFTAR RUMUS xvi
DAFTAR LAMPIRAN xvii
ABSTRAK xviii
BAB 1 PENDAHULUAN 1
1.1 Latar Belakang 1
1.2 Rumusan Masalah 3
1.3 Batasan Masalah 4
1.4 Tujuan Penelitian 4
1.5 Manfaat Penelitian 4
1.6 Metode Penelitian 5
1.7 Sistematika Penulisan 7
BAB 2 LANDASAN TEORI 9
2.1 Penelitian Terdahulu 9
2.2 Kajian Pustaka 11
ix
2.2.1 Penentuan / Peminatan Jurusan 12
2.2.2 Sistem Informasi 12
2.2.3 Data Mining 13
2.2.4 Decision Tree 14
2.2.5 KNN (K-Nearest Neighbor) 14
2.2.6 Naive Bayes 15
2.2.7 PHP 17
2.2.8 Basis Data 18
2.2.9 Unifed Modeling Language (UML) 18
2.2.10 MySQL 20
2.2.11 ER Diagram20
2.2.12 Metode Waterfall 20
2.2.13 Pengujian Black box22
BAB 3 ANALISIS DAN PERANCANGAN SISTEM 23
3.1 Analisis Sistem yang Berjalan 23
3.2 Analisis Sistem yang Diusulkan 23
3.2.1 Kebutuhan Fungsional 24
3.2.2 Kebutuhan Non Fungsional 25
3.2.3 Desain Sistem Yang Diusulkan 25
3.3 Perhitungan Naive Bayes 37
3.3.1 Contoh Perhitungan Naive Bayes 37
3.3.2 Alur proses algoritma Stratified Sampling 39
3.3.3 Alur proses algoritma Naive Bayes 40
BAB 4 TESTING DAN IMPLEMENTASI SISTEM54
4.1 Lingkungan Pengembangan 54
4.1.1 Perangkat Keras 54
x
4.1.2 Perangkat Lunak 54
4.2 Lingkungan Implementasi 55
4.2.1 Perangkat Keras 55
4.2.2 Perangkat Lunak 56
4.3 Testing/Pengujian Kode Program dan Implementasi
Sistem 56
4.3.1 Pengujian dan Validasi Algoritma 56
4.3.2 Implementasi Sistem Home User 58
4.3.3 Pengujian Use Case Sistem Home User 58
4.3.4 Implementasi Sistem Home Admin 59
4.3.5 Pengujian Use Case Impor Data Latih60
4.3.6 Implementasi Sistem Data Latih 62
4.3.7 Implementasi Use Case Perhitungan Data Latih
62
4.3.8 Pengujian Use Case Data Uji64
4.3.9 Akurasi Data Uji 65
4.3.10 Implementasi Sistem daftar pengguna 66
4.3.11 Pengujian Use Case Form Rekomendasi Jurusan
66
4.4 Implementasi Algoritma Naive Bayes 67
4.5 Uji Coba dan Validasi Algoritma67
4.6 Implementasi Basis Data 68
BAB 5 PENUTUP 71
5.1 Kesimpulan 71
5.2 Saran 72
DAFTAR PUSTAKA 73
Lampiran 75
xi
xii
DAFTAR TABEL
Tabel 2. 1 Matrix Penelitian Terdahulu.............................10

Tabel 3. 1 Kebutuhan Fungsional 1..................................24
Tabel 3. 2 Data Latih.........................................................41
Tabel 3. 3 Mean................................................................45
Tabel 3. 4 Standart Deviasi...............................................48
Tabel 3. 5 Probablitas.......................................................49
Tabel 3. 6 Data Uji............................................................49
Tabel 3. 7 Hasil Perhitungan Klasifikasi Data Uji..............52
Tabel 3. 8 Prediksi Kelas....................................................53
Tabel 4. 1. Spesifikasi Perangkat Keras...........................54
Tabel 4. 2 Spesifikasi Perangkat Lunak............................55
Tabel 4. 3 Spesifikasi perangkat keras.............................55
Tabel 4. 4 Spesifikasi minimum perangkat lunak..............56
Tabel 4. 5 Hasil Uji Coba Cross Validation.......................57
Tabel 4. 6 Pengujian Login...............................................59
Tabel 4. 7 Pengujian Impor Data Latih..............................60
Tabel 4. 8 Pengujian Data Latih........................................63
Tabel 4. 9 Pengujian Data Uji...........................................64
Tabel 4. 10 Pengujian Data Uji.........................................65
Tabel 4. 11 Form Rekomendasi Sekolah..........................67
xiii
PERNYATAAN KEASLIAN
Saya yang bertanda-tangan di bawah ini

menyatakan bahwa skripsi ini merupakan karya saya sendiri
(ASLI), dan isi dalam skripsi ini tidak terdapat karya yang
pernah diajukan oleh orang lain untuk memperoleh gelar
akademis di suatu Perguruan Tinggi, dan sepanjang
pengetahuan saya juga tidak terdapat karya atau pendapat
yang pernah ditulis dan/atau diterbitkan oleh orang lain,
kecuali yang secara tertulis diacu dalam naskah ini dan
disebutkan dalam daftar pustaka. Pernyataan ini saya buat
dengan sesungguhnya, apabila di kemudian hari terdapat
penyimpangan dan ketidakbenaran dalam pernyataan ini,
maka saya bersedia menerima SANKSI AKADEMIK dengan
pencabutan gelar yang sudah diperoleh, serta sanksi lainnya
sesuai dengan norma yang berlaku di Perguruan Tinggi.
Dinyatakan di Jombang
Tanggal … ………. ….
{Ttd & materai 6000}
Bayu Aji Prasetyo

4116075
xv
DAFTAR GAMBAR
Gambar 2. 1 Tahapan Metode Waterfall........................21

Gambar 3. 1 Sistem Yang Diusulkan.............................23
Gambar 3. 2 Sistem Yang Diusulkan.............................24
Gambar 3. 3 UseCase Diagram.....................................26
Gambar 3. 4 Activity Diagram Input Data.......................27
Gambar 3. 5 Activity Diagram Edit Data.........................27
Gambar 3. 6 Activity Diagram Hapus.............................28
Gambar 3. 7 Activity Diagram Data Latih.......................28
Gambar 3. 8 Activity Diagram Hitung Data Latih............29
Gambar 3. 9 Avtivity Diagram Hitung Data Uji...............29
Gambar 3. 10 Sequence Diagram Inpit Data.................30
Gambar 3. 11 Sequence Diagram Edit Data..................30
Gambar 3. 12 Sequence Diagram Hapus......................31
Gambar 3. 13 Sequence Diagram Data Latih................31
Gambar 3. 14 Sequence Diagram Hitung Data Latih.....32
Gambar 3. 15 Sequence Diagram Hitung Data Uji.........32
Gambar 3. 16 Class Diagram.........................................33
Gambar 3. 17 Conceptual Data Model...........................34
Gambar 3. 18 physhical Data Model..............................34
Gambar 3. 19 User Interface Input Data........................35
Gambar 3. 20 User Interface Input Data........................35
Gambar 3. 21 User Interface Data Latih........................36
Gambar 3. 22 User Interfice Data Uji.............................36
Gambar 3. 23 User Interface Hasil Perhitungan.............37
Gambar 4. 1 Pengujian dan validasi algoritma...............57
Gambar 4. 2 Hasil uji cross validation............................57
Gambar 4. 3 Halaman Home User.................................58
Gambar 4. 4 Halaman Login..........................................58
Gambar 4. 5 Halaman Home Admin..............................59
Gambar 4. 6 Halaman Import Data Latih.......................60
Gambar 4. 7 Halaman Data Latih...................................62
Gambar 4. 8 Sistem Perhitungan Data Latih..................62
xvi
Gambar 4. 9 Data Uji.....................................................64
Gambar 4. 10 Akurasi Data Uji.......................................65
Gambar 4. 11 Halaman Daftar Pengguna......................66
Gambar 4. 12 Form Rekomendasi Sekolah...................66
Gambar 4. 13 data_hitung..............................................68
Gambar 4. 14 data_latih.................................................69
Gambar 4. 15 data_uji....................................................69
Gambar 4. 16 tabel hasil_hitung....................................70
Gambar 4. 17 hitung_uji.................................................70
Gambar 4. 18 user.........................................................70
xvii
DAFTAR RUMUS
Rumus 2. 1.............................................................16
Rumus 2. 2.............................................................16
Rumus 2. 3.............................................................16
Rumus 2. 4.............................................................16
Rumus 2. 5.............................................................17
Rumus 3. 1.............................................................38
Rumus 3. 2.............................................................38
Rumus 3. 3.............................................................38
Rumus 3. 4.............................................................38
Rumus 3. 5.............................................................38
xviii
DAFTAR LAMPIRAN
Lampiran 1. Form Progres Skripsi Pembimbing I..................75

Lampiran 2. Form Progres Skripsi Pembimbing II.................76
Lampiran 3. Form A. Hasil Desk Evaluasi..............................77
Lampiran 4. Form B. Pengajuan Seminar Terbuka................78
Lampiran 5. Berita Acara Sidang Terbuka.............................79
Lampiran 6. Daftar Hadir Peserta Seminar Terbuka..............80
Lampiran 7. Form C. Pengajuan Ujian Tertutup....................81
Lampiran 8. Form Revisi Ujian Tertutup Ketua Penguji.........82
Lampiran 9. Form revisi ujian tertutup anggota penguji I.......83
Lampiran 10. Form revisi ujian tertutup anggota penguji II....84
xix
ABSTRAK
Penelitian ini bertujuan untuk menyajikan mode

klasifikasi dengan algoritma Naive Bayes dalam
mengimplementasikan penentuan jurusan di SMAN 3
Jombang untuk siswa baru. Pengumpulan data dilakukan
dengan cara wawancara kepada Wakil Kepala (WAKA)
Kurikulum SMAN 3 Jombang. Data input dalam penelitian ini
antara lain : nilai Ujian Nasional (UN) Matematika dan IPA di
tingkat SMP sederajat, nilai Tes Potensi Akademik (TPA)
matematika, fisika, biologi, pilihan siswa. Proses penentuan
jurusan di SMAN 3 Jombang saat ini masih dilakukan secara
manual dengan melakukan perhitungan di Excel. Proses
penentuan jurusan ini bertujuan untuk membantu kepada
pihak panitia penjurusan siswa mempermudah dalam proses
pememilihan jurusan siswa di SMAN 3 Jombang. Beberapa
algoritma klasifikasi telah digunakan dalam penelitian
sebelumnya untuk menentukan pemilihan jurusan di
antaranya adalah algoritma Decision Tree, dan C4.5.
Penelitian ini menggunakan algoritma Naive Bayes
untuk kasus pemilihan jurusan di tingkat SMA. Dengan kasus
Balanced Class dimana dalam kasus ini ada 2 missing value.
Pengujian data yang pertama adalah memuat datalatih dan
datauji dengan perbandingan 90% sampai 10%. Kemudian
melalui tahap Stratified sampling dengan aplikasi Rapidminner
Studio guna mendistribusikan datalatih dan datauji. Dari
percobaan itu menghasilkan nilai akurasi sebesar 97,06%
dengan 311 datalatih dan 34 data uji.
Kata Kunci: Algoritma Naive Bayes, Balanced class,

Klasifikasi, Rapidminner.
xx
BAB 1
PENDAHULUAN
1.1 Latar Belakang
Dalam kurikulum tahun ajaran 2013 penjurusan

untuk Sekolah Menengah Atas (SMA) sekarang dilaksanakan
di semester 1 kelas X. Ada beberapa faktor utama dalam
menentukan jurusan seperti hasil nilai Ujian Nasional (UN)
pada tingkat Sekolah Menengah Pertama (SMP) atau
sederajat, hasil nilai Tes Potensi Akademik (TPA), dan juga
angket permintaan penjurusan yang siswa inginkan.
Proses penjurusan di SMAN 3 Jombang masih
dilakukan secara konvensional dengan metode pemberian
nilai menggunakan perhitungan di Microsoft Excel. SMAN 3
Jombang memberikan kesempatan kepada peserta didik
untuk memilih 2 (dua) jurusan yakni IPA dan IPS. Dalam
proses penentuan jurusan di SMAN 3 Jombang dibentuk
sebuah panitia yang cukup banyak dan juga masing-masing
guru mempunyai kesibukan yang lain selain menjadi panitia
penjurusan kelas, dan juga waktu yang digunakan terlalu
lama. Dan ada 2 proses pengambilan nilai di SMAN 3
Jombang yaitu untuk siswa yang masuk IPS akan tetapi ingin
masuk IPA, dengan adanya seperti itu mengakibatkan siswa
tersebut ketinggalan mata pelajaran.
Tujuan dari penjurusan itu sendiri adalah untuk
memberikan kesempatan pada peserta didik untuk
mengembangkan kompetensi sikap, kompetensi pengetahuan
peserta didik sesuai dengan minat, bakat / kemampuan
akademik dalam sekelompok mata pelajaran keilmuan (Nur,
2014), dan tidak jarang juga siswa-siswi yang asal-asalan
dalam memilih jurusan yang mereka ambil yang mana itu akan
berdampak pada jenjang akademik berikutnya dan akan
mempengaruhi bidang ilmu atau studi bagi siswa-siswi yang
akan melanjutkan ke jenjang perguruan tinggi nantinya
1
2
sehingga penjurusan yang tidak tepat bisa sangat merugikan

siswa dan masa depannya.
Mengingat pentingnya proses penjurusan bagi
siswa/siswi SMA, maka dibutuhkan sebuah metode yang
dapat membantu meminimalisir dampak dari kekeliruan saat
penjurusan tersebut, yaitu dengan teknik pengelompokan data
dari hasil data mining. Data mining memiliki beraneka ragam
metode, salah satu metode yang akan penulis gunakan dalam
penelitian ini adalah algoritma Naive Bayes. Naive Bayes
merupakan salah satu metode machine learning yang
menggunakan perhitungan probabilitas. Penggunaan
algoritma ini dinilai sesuai karena naive bayesian classifier
merupakan salah satu algoritma klasifikasi yang sederhana
namun memiliki kemampuan dan akurasi tinggi (Bisri, 2015).
Dengan adanya permasalahan hal tersebut maka
penulis membuat sebuah sistem penjurusan sekolah berbasis
web. Dalam penelitian ini penulis menguji dan
mengimplementasi algoritma naïve bayes pada kasus data
balance class untuk penentuan jurusan di SMA Negeri 3
Jombang dengan jumlah 345 data. Sistem penjurusan ini
diharapkan dapat memberikan solusi dalam membantu proses
pengambilan keputusan. Tujuan dibuat sistem ini agar dengan
nilai yang sedang-sedang saja calon peserta didik baru tidak
merasa kebingungan ingin memilih jurusan dan juga
mempunyai gambaran untuk menentukan kelas terutama IPA
dan IPS.
Beberapa penelitian telah dilakukan terkait penelitian
yang berkaitan dengan penentua jurusan di tingkat SMA.
Penelitian pertama berjudul Penerapan Algoritma C4.5 untuk
klasifikasi Pola Penjurusan di Sekolah Menengah Kejuruan
(SMK) Kota Tasikmalaya oleh (Sambani, 2017) penelitian ini
menghasilkan tingkat akurasi sebesar 97,22%. Variabel input
yang digunakan dalam penelitian ini adalah minat, bakat
akademik, nilai Bahasa Inggris, Bahasa Indonesia,
Matematika, IPA. Penelitian kedua yang berjudul
Implementasi Data Mining Dengan Algoritma C4.5 Untuk
3
Penjurusan Siswa SMA Negeri 1 Pontianak oleh (Novianti,

2016) penelitian ini menghasilkan tingkat akurasi sebesar
89,74% dari 39 data uji. Penelitian ketiga oleh (Bisri, 2015)
Implementasi Algoritma Naive Bayes untuk Memprediksi
Penjurusan Siswa di SMA kesatrian 1 Semarang. Penelitian
ini menggunakan data kurikulum 2013 denga 3 jurusan (IPA,
IPS, Ilmu Bahasa), atribut yang digunakan adalah nama, nilai
bahasa indonesia, nilai bahasa inggris, nilai matematika, nilai
IPA, minat, jurusan. Dari hasil percobaan prediksi penjurusan
siswa menggunakan metode Naive Bayes, diperoleh akurasi
sebesar 83,87%. Penelitian keempat yang berjudul
Implementasi Algoritma C4.5 Pada Kasus Imbalanced Class
Distribution Untuk Penentuan Jurusan Di Sekolah Menengah
Atas oleh (Machfud, 2019), penelitian ini menggunakan
algoritma C4.5 untuk kasus pemilihan jurusan di tingkat SMA.
Dengan kasus Imbalanced Class Distribution dimana dalam
kasus ini tidak ada missing value dan menghasilkan nilai
akurasi sebesar 79,8%, recall 90,6% dan presisi 100%
dengan data uji sebesar 144 data siswa.
Dengan pertimbangan diatas, Algoritma klasifikasi

Naive Bayes yang digunakan dalam membangun sebuah
sistem penentuan jurusan sekolah, sehingga hasilnya nanti
dapat merekomendasi pilihan jurusan bagi siswa.
1.2 Rumusan Masalah
Rumusan masalah merupakan penyebutan kembali

poin-poin masalah yang akan dipecahkan dalam penelitian ini
sesuai dengan apa yang telah dijabarkan dalam latar
belakang. Bentuk dari rumusan masalah dapat berupa
beberapa pertanyaan yang diharapkan dapat dijawab pada
akhir dari penelitian di bagian kesimpulan.
1) Bagaimana solusi penentuan jurusan yang objektif,
sistematis dan fleksibel ?
4
2) Bagaimana menerapkan algoritma Naive Bayes ke dalam

sistem penentuan jurusan di SMAN 3 Jombang ?
3) Bagaimana Kinerja Naive Bayes dalam memprediksi
siswa SMA Negeri di Jombang untuk penentuan
jurusan ?
1.3 Batasan Masalah
Agar tidak menyimpang dari tujuan yang hendak

dicapai, maka penulis membatasi permasalahan sebagai
berikut :
1) Sumber data yang digunakan dalam penelitian ini adalah
data siswa kelas X (10) di SMAN 3 Jombang.
2) Data yang digunakan adalah nilai UN SMP atau
sederajat, nilai hasil Tes Potensi Akademik (TPA), dan
juga minat dari siswa.
3) Metode yang digunakan hanya algoritma naive bayes.
4) Sistem yang dibuat hanya pada kasus penentuan jurusan
siswa SMA.
5) Sistem informasi yang akan dibangun berbasis web
dengan bahasa pemrograman PHP.
6) Database yang digunakan adalah Database MySql.
1.4 Tujuan Penelitian
Adapun yang menjadi tujuan peneliti dalam

penyusunan skripsi ini adlah
1. Memberikan solusi yang objektif, cepat dan tepat sasaran
guna memprediksi atau menyeleksi jurusan siswa pada
SMAN 3 Jombang.
2. Menerapkan metode klasifikasi dengan algoritma naive
bayes ke dalam sistem pententu jurusan siswa pada
SMAN 3 Jombang.
5
1.5 Manfaat Penelitian
Adapun manfaat yang dapat diperoleh dari penelitian

ini adalah sebagai berikut :
1) Penulis
Penulis dapat memperoleh pengetahuan dan
pengalaman yang akan meningkatkan kreatifitas untuk
berinovasi dan menjadi solusi bagi apa yang dibutuhkan
baik perusahaan/lembaga atau masyarakat luas.
2) Unipdu
Penelitian ini akan memperkaya pustaka penelitian
universitas yang dapat digunakan sebagai bahan rujukan
untuk penelitian sejenis di masa mendatang.
3) SMAN 3 Jombang
Memberikan kemudahan bagi pihak sekolah dalam
memproses data untuk pemilihan jurusan
4) Siswa SMAN 3 Jombang
Siswa dapat masuk ke jurusan yang sesuai dengan bakat
dan kemampuan akademik siswa tersebut
1.6 Metode Penelitian
Penelitian ini dilakukan melalui beberapa tahapan.
Adapun metode yang digunakan dalam tiap-tiap tahapan
antara lain:
1) Metode Pengumpulan Data
Pengumpulan data dilakukan melalui wawancara, dan
observasi lapangan.
2) Metode Rekayasa Perangkat Lunak
Perangkat lunak dalam penelitian ini dibangun dengan
menggunakan metode rekayasa Waterfall. Dengan
mengambil proses perencanaan, analisis data, metode
perancangan, dan implementasi.
a. Perencanaan
Perencanaan sistem ini sangat diperlukan, karena
piranti lunak biasanya merupakan bagian dari sistem
6
yang lebih besar. Perencanaan digunakan untuk

mengetahui kebutuhan sistem yang akan dibuat.
Perencanaan dibuat melalui proses wawancara
kepada pihak terkait untuk mendapatkan data yang
sesuai dalam menyusun kebutuhan sistem.
b. Analisis Data
Pada langkah ini, penulis akan melakukan analisis
terhadap kebutuhan sistem. Pengumpulan data
penelitian dengan melakukan observasi ke SMAN 3
Jombang serta melakukan wawancara kepada pihak
terkait. Observasi dilakukan untuk mendapatkan
data yang dibutuhkan, melakukan wawancara pada
pihak-pihak terkait mengenai permasalahan yang
sedang dibahas pada skripsi ini untuk memperoleh
gambaran dan penjelasan secara mendasar, penulis
melakukan wawancara kepada kepala SMAN 3
Jombang untuk mencari referensi di buku-buku yang
berhubungan dengan materi-materi yang menjadi
pokok pembahasan tugas akhir.
c. Metode Perancangan
Perancangan dilakukan dengan menggunakan
notasi UML dan pemodelan berorientasi obyek
sehingga diagram yang digunakan adalah Use Case,
Activity, Sequence dan Class Diagram.
d. Metode Pembangunan
Pada tahap ini, penulis akan menggunakan bahasa
pemrograman yang telah ditentukan dalam proses
implementasi yakni bahasa pemrograman PHP dan
menggunakan database MySql, dan uji coba
dilakukan dengan metode pengujian Black Box.
e. Metode Uji Coba
Uji Coba dilakukan dengan menggunakan metode
Black Box.
7
1.7 Sistematika Penulisan
Sistem penulisan dalam tugas akhir ini diususun

dalam bentuk karya ilmiah dengan struktur penulisan sebagai
berikut:
BAB 1 PENDAHULUAN
Bab ini berisi uraian tentang latar belakang masalah
yang mendasari pentingnya diadakan penelitian, identifikasi,
pembatasan dan perumusan masalah penelitian, maksud dan
tujuan penelitian, kegunaan penelitian yang diharapkan, dan
sistematika penulisan.
BAB 2 LANDASAN TEORI
Bab ini berisi tinjauan teori yang mendiskripsikan
pengertian data mining, Konsep Decission Tree, algoritma
klasifikasi data mining, dan metode evaluasi.
BAB 3 ANALISIS DAN PERANCANGAN SISTEM
Bab ini berisi tentang analisis kebutuhan dari sistem
yang akan dibangun, perbandingan sistem yang sudah ada
dengan sistem yang diusulkan, dan perancangan sistem yang
diusulkan.
BAB 4 TESTING DAN IMPLEMENTASI SISTEM
Bab ini berisi tentang penjelasan prosedur testing
dan proses pengujian sistem yang telah dibuat.
BAB 5 PENUTUP
Bab ini berisi pokok-pokok kesimpulan dan saran-
saran yang perlu disampaikan kepada pihak-pihak yang
berkepentingan dengan hasil penelitian.
DAFTAR PUSTAKA
Daftar pustaka berisi daftar referensi yang digunakan
dalam penelitian.
BAB 2
LANDASAN TEORI
Bab ini memaparkan tentang penelitian-penelitian

terdahulu yang berhubungan dengan topik skripsi. Selain itu
untuk menjelaskan teori-teori atau kajian pustaka yang di
gunakan untuk membangun implementasi algoritma klasifikasi
data mining dalam beberapa bidang. pembuatan sistem
informasi pemilihan/penentuan jurusan di SMAN.
2.1 Penelitian Terdahulu
Penelitian terdahulu ini menjelaskan tentang

penelitian yang telah dilakukan sebelumnya dan memiliki tema
penelitian serupa dengan penelitian yang dilakukan penulis
sekarang. Penelitian yang diangkat yaitu Penerapan Algoritma
K-Nearest Neighbor dalam beberapa bidang. Hal ini dapat
digunakan sebagai acuhan dan bahan pertimbangan.
Penelitian pertama berjudul Penerapan Algoritma

C4.5 untuk klasifikasi Pola Penjurusan di Sekolah Menengah
Kejuruan (SMK) Kota Tasikmalaya oleh (Sambani, 2017)
penelitian ini menghasilkan tingkat akurasi sebesar 97,22%.
Variabel input yang digunakan dalam penelitian ini adalah
minat, bakat akademik, nilai Bahasa Inggris, Bahasa
Indonesia, Matematika, IPA. Penelitian kedua yang berjudul
Implementasi Data Mining Dengan Algoritma C4.5 Untuk
Penjurusan Siswa SMA Negeri 1 Pontianak oleh (Novianti,
2016) penelitian ini menghasilkan tingkat akurasi sebesar
89,74% dari 39 data uji. Penelitian ketiga oleh (Bisri, 2015)
Implementasi Algoritma Naive Bayes untuk Memprediksi
Penjurusan Siswa di SMA kesatrian 1 Semarang. Penelitian
ini menggunakan data kurikulum 2013 denga 3 jurusan (IPA,
IPS, Ilmu Bahasa), atribut yang digunakan adalah nama, nilai
bahasa indonesia, nilai bahasa inggris, nilai matematika, nilai
9
IPA, minat, jurusan. Dari hasil percobaan prediksi penjurusan
siswa menggunakan metode Naive Bayes, diperoleh akurasi
sebesar 83,87%.
Tabel 2. 1 Matrix Penelitian Terdahulu
Judul dan
Hasil Perbedaan Persamaan
Penulis
Penerapan Menghasilk  Mengguna  Penentu
Algoritma an akurasi kan jurusan
C4.5 untuk sebesar Algoritma Siswa
klasifikasi 97,22% C4.5.
 Kasus
Pola
Penentuan
Penjurusan di jurusan
Sekolah siswa
Menengah Sekolah
Kejuruan menengah
(SMK) Kota kejuruan
Tasikmalaya  Atribut
Oleh : yang
digunakan
(Sambani, :Nilai
2017) bahasa
Inggris,
bahasa
Indonesia,
Matematik
a, IPA, tes
Kesehatan,
Tes
Olahraga
10
Lanjutan Tabel 2.1.....................
Judul dan
Hasil Perbedaan Persamaan
Penulis
Inplementasi Menghasilk  Menggunak  Kasus
Data Mining an akurasi an penentuan
Dengan sebesar Algoritma jurusan
Algoritma 89.74% dari C4.5. siswa
 Sekolah
C4.5 untuk 39 data uji
Menengah
Penjurusan Atas
Siswa SMA  Penelitian ini
Negeri 1 menggunaka
Pontianak n 2 jurusan
Oleh : (IPA, IPS)
(Novianti,
2016)
Implementasi Menghasilk  Penelitian  Menggunaka
Algoritma an akurasi ini n Algoritma
Naive Bayes sebesar menggunak Naive Bayes
untuk 83.87% an 2  Kasus
jurasan, penentuan
Memprediksi
sedangkan jurusan
Penjurusan penelitian siswa
Siswa di SMA penulis Sekolah
kesatrian 1 menggunak Menengah
Semarang an 3
Oleh : jurusan
(Bisri, 2015)
2.2 Kajian Pustaka
Dalam pembangunan sistem informasi dan

inplementasi algoritma klasifikasi data mining pada penentuan
jurusan siswa terdapat beberapa proses tahapan. Berikut
adalah proses tahapan pembangunan sistem dam
11
12
implementasi algoritma klasifikasi data mining beserta kajian

pustaka menurut para ahli :
2.2.1 Penentuan / Peminatan Jurusan
Undang – undang peraturan Menteri Pendidikan dan

kebudayaan republik Indonesia nomor 64 tahun 2004,
peminatan adalah progam kulikuler yang mengakomodasi
pilihan minat, bakat atau kemampuan peserta didik dengan
orientasi pemutusan, perluasan atau pendalaman mata
pelajaran. Tujuan penjurusan pada tingkat SMA adalah untuk
memberi kesempatan kepada peserta didik dalam
mengembangkan kopetensi sikap, kopetensi pengetahuan
dan kopetensi ketrampilan peserta didik sesuai dengan
kemampuan, minat dan bakat peserta didik.Pemilihan
kelompok peminatan dilakukan sejak peserta didik mendaftar
ke SMA sesuai dengan minat, bakat dan kemampuan
akademik peserta didik. Pemilihan kelompok peminatan
berdasarkan pada :
a) Nilai rapor SMP/MTS atau sederajat;
b) Nilai ujian Nasional SMP/MTS atau sederajat;
c) Rekomendasi guru BK di SMP/MTS atau sederajat.
2.2.2 Sistem Informasi
Sistem informasi merupakan kumpulan data yang

diolah menjadi lebih beguna dengan ketentuan-
ketentuan aturan yang sistematis dan terstruktur untuk
membentuk satu kesatuan yang melaksanakan suatu
fungsi untuk mencapai tujuan (Anggraeni, 2017).
Dalam sebuah sistem informasi mempunyai subuah

komponen – komponen yang mempunyai fungsi sendiri –
sendiri agar dapat mencapai suatu tujuan penggunanya.
Berikut adalah komponen sistem informasi :
1) Input (masukan)
13
2) Output (keluaran)
3) Software (perangkat lunak)
4) Hardware (perangkat keras)
5) Database (basis data)
6) Kontror dan Prosedur
7) Jaringan Komputer
Penggunaan sistem informasi saat ini semakin

meningkat, dikarenakan sistem informasi memiliki manfaat
yang juga menjadi alasan perlunya dibangun sebuah sistem
informasi :
1) Data yang terpusat
2) Kemudahan dalam mengakses informasi
3) Efisien waktu
4) Penyebaran informasi menjadi lebih luas
5) Biaya murah dalam mengakses dan menyediakan
informasi
6) Penyimpanan data dapat berkembang sesuai dengan
kebutuhan
2.2.3 Data Mining
Data mining merupakan proses ataupun kegiatan

untuk mengumpulkan data yang berukuran besar
kemudian mengekstraksi data tersebut menjadi
informasi-informasi yang nantinya dapat digunakan.
(Saleh, 2015). Data mining dapat dibagi menjadi
beberapa tahap proses, yaitu :
3. Seleksi data merupakan data yang ada dalam
database sering kali tidak semuanya dipakai, oleh
karena itu hanya data yang sesuai untuk
dianalisis yang akan diambil dari database.
4. Proses Mining merupakan suatu proses utama
saat metode diterapkan untuk menemukan
pengetahuan berharga dan tersembunyi dari
14
data. Beberapa metode yang dapat digunakan

berdasarkan pengelompokan Data Mining.
5. Transformasi sata yaitu data diubah atau
digabung ke dalam format yang sesuai untuk
diproses dalam Data Mining.
6. Proses mencari suatu pola atau informasi dari
suatu data dengan menggunakan Teknik dalam
proses penentuannya.
7. Evaluasi pola untuk mengidentifikasi pola-pola
menarik ke dalam knowledge based yang
ditemukan.
2.2.4 Decision Tree
Decision tree dengan algoritma C.45 merupakan

salah satu metode klasifikasi yang menggunakan repre-
sentasi struktur pohon (tree) dimana setiap node
merepresentasikan atribut, cabangnya merepresentasikan
nilai dari atribut, dan daun merepresentasikan kelas. Node
yang paling atas dari decision tree disebut sebagai root. Pada
decision tree terdapat 3 jenis node, yaitu:
1. Root Node merupakan node paling atas, pada node ini
tidak ada input dan bisa tidak mempunyai output atau
mempunyai output lebih dari satu.
2. Internal Node merupakan node percabangan, pada node
ini hanya terdapat satu input dan mempunyai output
minimal dua.
3. Leaf node atau terminal node, merupakan node akhir,
pada ini hanya terdapat satu input dan tidak mempunyai
output (Sembiring, Sibuea, & Sapta, 2018)
2.2.5 KNN (K-Nearest Neighbor)
Menurut (Prasetyo, 2014) algoritma Nearest

Neighbor (kadang disebut K-Nearst Neighbor atau K-NN)
merupakan algoritma yang melakukan klasifikasi
15
berdasarkan kedekatan lokasi (jarak) suatu data dengan

data lain.
Algoritma k-nearest neighbor (k-NN atau KNN)
dalah sebuah metode untuk melakukan klasifikasi
terhadap objek berdasarkan daata pembelajaran yang
jaraknya paling dekat dengan objek tersebut. Data
pembelajaran diproyeksikan ke ruang berdimensi banyak,
dimana masing-masing dimensi merepresentasikan fitur
dari data. Ruang ini dibagi menjadi bagian-bagian
berdasarkan klasifikasi data pembelajaran. Sebuah titik
pada ruang ini ditandai kelas c jika kelas c merupakan
klasifikasi yang paling banyak ditemui pada k buah
tetangga terdekat titik tersebut. Dekat atau jauhnya
tetangga biasanya dihitung berdasarkan jarak Euclidean.
Pada fase pembelajaran, algoritma ini hanya melakukan
penyimpanan vektor-vektor fitur dan klasifikasi dari data
pembelajaran. Pada face klasifikasi, fitur-fitur yang sama
dihitung untuk data test (yang klasifikasinya tidak
diketahui). Jarak dari vektor yang baru ini terhadap
seluruh vektor data pembelajaran dihitung, dan sejumlah
k buah yang paling dekat diambil. (Merta, Sunarya, &
Arthana, 2015)
2.2.6 Naive Bayes
Menurut (Saleh, 2015) Naive Bayes merupakan

sebuah pendekatan statistik yang fundamental dalam
pengenalan pola. Naive Bayes dapat mengklasifikasikan
probabilistik yang menghitung sekumpulan probabilitas
dengan menjumlahkan frekuensi dan kombinasi nilai dari
dataset yang diberikan. algoritma teorema bayes ini
mengansumsikan semua atribut independen atau tidak saling
ketergantungan yang diberikan oleh nilai pada variabel kelas.
Naive Bayes didasarkan pada asumsi penyederhanaan bahwa
nilai atribut secara kondisional saling bebas jika diberikan nilai
output. dengan kata lain, diberikan nilai output, probabilitas
16
mengamati secara bersama adalah produk dari probabilitas

individu.
Untuk proses perhitungan Naive Bayes adalah
4. Baca datatrining
5. jika datanya numerik maka cari nilai mean dan standar
deviasi dari masing-masing parameter yang merupakan data
numerik.adapun persamaan yang digunakan untuk
menghitung nilai rata-rata hitung (mean) dapat dilihat pada
Rumus 2. 1
Rumus 2. 2
di mana:
µ: rata-rata hitung (mean)
xi : nilai sampel ke-i
n : jumlah sampel
6. untuk menghitung nilai simpangan baku (standar deviasi)

dapat diihat pada
Rumus 2. 3
σ : standart deviasi
xi : nilai x ke i
µ : rata-rata hitung
17
n : jumlah sampel
7. Persamaan dari teorema Bayes dilihat pada
Rumus 2. 4
Keterangan :
X : Data dengan class yang belum diketahui
H : Hipotesis data merupakan suatu class spesifik
P(H|X) : Probabilitas hipotesis H berdasar kondisi (posteriori
probability)
P(H) : Probabilitas hipotesis (prior probability)
P(X|H) : Probabilitas X berdasarkan kondisi pada hipotesis
P(X) : Probabilitas X
8. mendapatkan nilai tabel pada mean, standart deviasi dan
probabilitas.
Peluang dapat dilihat pada
Rumus 2. 5
P : peluang
Xi : Atribut ke i
xi : nilai atribut ke i
Y : kelas yang dicari
yi : sub kelas Y yang dicari
σ : deviasi standart, menyatakan varian dari seluruh
atribut
µ : mean, menyatakan rata-rata dari semua atribut
9. Mencari kelas dengan mengalikan proses klasifikasi
dengan probabilitas.
10. mencari nilai yang paling besar.
11. Selesai
18
2.2.7 PHP
PHP singkatan dari Hypertext Preprocessor

adalah salah satu bahasa pemrograman berbasis web
yang terkenal dan banyak diterapkan programmer pada
masa sekarang dimana sistem yang diterapkan adalah
pada sisi. Penggunaan PHP memungkinkan web dapat
dibuat dinamis sehingga maintenance situs web tersebut
menjadi lebih muda dan efisien. PHP merupakan
software Open-Source yang disebarkan dan dilisensikan
secara gratis serta dapat di download secara bebas dari
situs resmi http://www.php.net (Haryana, 2015)
2.2.8 Basis Data
Sebuah database/basis data adalah sebuah struktur

yang umumnya dikategorikan dalam 2 hal, yaitu sebuah
database flat dan sebuah database relasional. Database
relasional lebih banyak dipakai karena lebih masuk akal
dibandingkan database flat. MySQL merupakan sebuah
database relasional. Pada database yang memiliki struktur
relasional, terdapat tabel-tabel yang menyimpan data. Setiap
tabel terdiri dari kolom dan baris. Sebuah kolom
mendefinisikan jenis informasi apa yang akan disimpan
(misalnya nama, umur, berat, tinggi). Jika kolom
mendefinisikan jenis informasi apa yang akan disimpan, maka
sebuah baris adalah data aktual yang disimpan. Setiap baris
dari tabel adalah masukan dari tabel tersebut dan berisi nilai-
nilai untuk setiap kolom tabel tersebut (Imbar & Andreas,
2015)
2.2.9 Unifed Modeling Language (UML)
a) Pengertian UML
Unifed Modeling Language (UML) adalah sebuah
“bahasa” yang telah menjadi standart dalam industri untuk
visualisasi, merancang pada suatu sistem yang akan dibuat
dan mendokumentasi sistem piranti lunak. UML menawarkan
19
sebuah standart untuk merancang model sebuah sistem

(Yasin, 2012).
UML mendefinisikan diagram-diagram sebagai berikut:
1) Use case diagram
2) Class diagram
3) Activity diagram
4) Sequence diagram
b) Use case Diagram

Use Case Diagram menggambarkan teknik untuk
merekam fungsionalitas yang diharapkan dari sebuah sistem.
use case mempresentasikan sebuah interaksi antara
pengguna sistem dengan sistem itu sendiri. dengan memberi
sebuah narasi tentang bagaimana sistem tersebut digunakan
(Yasin, 2012).
c) Class Diagram
Class Diagram adalah sebuah model yang
menggambarkan struktur atau gambar dan deskripsi class
serta hubungannya antara class. untuk class diagram ini
menggambarkan atribut suatu sistem, sekaligus menawarkan
layanan untuk memanipulasi keadaan tersebut. Class diagram
menggambarkan struktur dan deskripsi class, package dan
objek beserta hubungan satu sama lain (Yasin, 2012).
d) Activity Diagram
Activity Diagram merupakan diagram yang
menggambarkan dari bermacam macam aliran kerja atau
aktivitas. Pada activity ini adalah menggambarkan suatu
akivitas pada sistem bukan apa yang dilakukan oleh aktor.
Activity diagram merupakan state diagram khusus, dimana
sebagian besar state adalah action dan sebagian besar
transisi di-trigger oleh selesainya state sebelumnya. (Yasin,
2012).
e) Sequence Diagram
Sequence diagram menggambarkan interaksi antar
objek didalam dan di sekitar sistem (termasuk pengguna,
display, dan sebagainya) berupa message yang diGambarkan
20
terhadap waktu. Sequence diagram terdiri atas dimensi

vertikal (waktu) dan dimensi horizontal (objek-objek yang
terkait). Sequence diagram biasa digunakan untuk
menggambarkan skenario atau rangkaian langkah-langkah
yang dilakukan sebagai respons dari sebuah event untuk
menghasilkan output tertentu (Yasin, 2012).
2.2.10 MySQL
MySQL (My Structure Query language) adalah

implementasi dari sistem manajemen basis data relasional
(RDBMS) yang didistribusikan secara garis dibawah lisensi
GPL (General Public License). Setiap pengguna dapat secara
bebas menggunakan MySQL, namun dengan batasan
perangkat lunak tersebut tidak boleh dijadikan produk turunan
yang bersifat komersil. MySQL sebenarnya merupakan
turunan salah satu konsep utama dalam basis data yang telah
ada sebelumnya yaitu SQL. SQL sebuah konsep
pengoperasian basis data, terutama untuk pemilihan atau
seleksi dan pemasukan data, yang memungkinkan
pengoperasian data biasa dikerjakan dengan mudah dan
efisien secara otomatif (Lestari, Irawan, & Redityamurti,
2015).
2.2.11 ER Diagram
Dalam perancangan basis data, dapat dibuat sebuah

modeluntuk diterapkan ke dalam sebuah basis data, model
inidikenal dengan nama model data. Mode data
ialahkumpulan alat untuk mendeskripsikan data, hubungan
antardata, dan semantik data. Model data juga dapat
direpresentasikan dalam Entity Relationship Diagram atau
yang lebih sering kita kenal dengan ERD. ERD adalah model
tingkat tinggi yang berisi objek dasar yang diberinama Entitas
dan hubungan antar entitas yang diberi nama relasi (Lieberty
& Imbar, 2015)
21
2.2.12 Metode Waterfall
Metode Waterfall merupakan model pengembangan

sistem informasi yang sistematik dan sekuensial. Tahapan
dari model ini meliputi, sistem/teknik informasi dan
pemodelan. Perangkat lunak merupakan bagian dari sistem
yang lebih besar (atau bisnis). Pandangan sistem ini penting
ketika perangkat lunak harus berinteraksi dengan unsur-unsur
lain seperti perangkat keras, orang, dan database (Simarmata
J. , 2010)
Tahap-tahap dari metode waterfall dilihat pada
Gambar 2.1
Gambar 2. 1 Tahapan Metode Waterfall
Pada Gambar 2.1 dijelaskan ada 5 tahapan dari metode

waterfall yaitu :
12. Analisis kebutuhan perangkat lunak, adalah persyaratan
proses pengumpulan diintensifkan dan difokuskan secara
khusus pada software, rancangan.
13. Desain sistem adalah langkah yang berfokus pada empat
atribut yang berbeda dari sebuah program, yaitu struktur
data, arsitektur perangkat lunak, representasi interface,
dan prosedural (algoritmik) rinci.
22
14. Penulisan kode program dan pada tahap ini desain harus
diterjemahkan ke dalam bentuk mesin yang dapat dibaca.
Dalam tahap ini dilakukan pembuatan kode.
15. Pengujian program adalah setelah kode telah dihasilkan,
pengujian program dimulai. Pengujian yang dilakukan
secara internal (benar tidaknya pernyataan yang dibuat
dalam coding) dan eksternal melakukan tes untuk
menemukan kesalahan dan memastikan bahwa input
sesuai dengan apa yang dibutuhkan.
16. Penerapan program dan pemeliharaan merupakan
tahapan yang paling panjang. sistem dipasang dan
digunakan secara nyata. Maintenance melibatkan
pembetulan kesalahan yang tidak ditemukan pada
tahapan-tahapan sebelumnya, meningkatkan
implementasi dari unit sistem, dan meningkatkan layanan
sistem sebagai kebutuhan.
2.2.13 Pengujian Black box
Black box merupakanpengujian program berdasarkan

fungsi dari program. Tujuan dari metode black box ini adalah
untuk menemukan kesalahan fungsi pada program. Pengujian
dengan metode black box dilakukan dengan cara memberikan
sejumlah input pada program aplikasi yang kemudian diproses
sesuai dengan kebutuhan fungsional untuk melihat apakah
program aplikasi menghasilkan output yang diinginkan dan
sesuai dengan fungsi dari program tersebut.
Apabila dari input yang diberikan menghasilkan output yang
sesuai dengan kebutuhan fungsional, maka program aplikasi
yang bersangkutan telah benar, tetapi jika output yang
dihasilkan tidak sesuai dengan kebutuhan fungsionalnya,
maka masih terdapat kesalahan pada program aplikasi.
Berdasarkan hasil pengujian sistem yang telah dilakukan
secara keseluruhan dapat ditarik kesimpulan bahwa proses
pada sistem ini secara fungsional sudah dapat digunakan dan
menghasilkan output yang diharapkan (Herdiyanti & Widianti,
2013)
23
BAB 3
ANALISIS DAN PERANCANGAN SISTEM
Bab ini berisi tentang analisis kebutuhan dari sistem

yang akan dibangun, perbandingan sistem yang sudah ada
dengan sistem yang diusulkan, dan perancangan sistem yang
diusulkan.
3.1 Analisis Sistem yang Berjalan
Analisis yang berjalan pada SMA dalam proses

penentuan jurusan siswa yaitu dengan memberi angket
kepada siswa yang akan di isi oleh siswa itu sendiri. Isi dari
angket tersebut adalah atribut – atribut yang dibutuhkan dalam
melakukan proses perhitungan untuk penentuan jurusan di
SMAN 3 Jombang. Atribut tersebut terdiri dari nilai UN di
tingkat SMP sederajat, minat siswa, dan hasil Tes Potensi
Akademik (TPA). Untuk proses bisa di lihat pada gambar 3.1
3.1
Gambar 3. 1 Sistem Yang Diusulkan
3.2 Analisis Sistem yang Diusulkan
Menyambung uraian pada bagian sebelumnya, pada

bagian ini dikemukakan sistem baru yang diusulkan. Pada
gambar 3.2 akan dilihat dari sistem yang diusulkan.
24
25
Gambar 3. 2 Sistem Yang Diusulkan
3.2.1 Kebutuhan Fungsional
Setelah usulan sistem baru dijelaskan dengan baik

maka akan dapat diidentifikasi daftar kebutuhan fungsional
dari sistem yang diusulkan. Kebutuhan fungsional adalah
kebutuhan yang berisi proses apa saja yang dapat dilakukan
oleh aplikasi tersebut.Pada kebutuhan fungsional ini akan
dijelaskan pada Tabel 3.1
Tabel 3. 1 Kebutuhan Fungsional 1
User Hak Akses

Admin 17. Create Read Update
Delete (CRUD) data
siswa
18. Import data latih
19. Menghitung entropy
20. Menghitung gain
21. Melakukan
klasifikasi
22. Melihat hasil
klasifikasi
23. Import data uji
24. Lihat akurasi
26
3.2.2 Kebutuhan Non Fungsional
Selain kebutuhan fungsional tentu sebuah sistem

juga memiliki kebutuhan non fungsional seperti kecepatan,
keamanan, reliabilitas dan sebagainya.
1.) Aktor
Aktor adalah pengguna sistem yang berfungsi sebagai
pengoperasi sistem itu sendiri.
2.) Perangkat Keras
Perangkat keras yang dibutuhkan dalam penggunaan
sistem ini adalah laptop/komputer dengan spesifikasi sebagai
berikut :
 RAM 2 GB
 HDD 500 GB
 Processor AMD A86410 APU with AMD R5 Graphics
2.00Ghz
3.) Perangkat lunak
Kebutuhan perangkat lunak dalam penggunaan sistem ini
antara lain :
 XAMPP
 Sublime Text
 MySQL
 Google Chrome
 Windows 7 (minimal)
4.) Keamanan
Untuk keamanan sendiri dalam sistem ini digunakan
username dan password yang dimasukkan pada halaman
login untuk menjaga keamanan data sistem.
3.2.3 Desain Sistem Yang Diusulkan
Template ini dibuat dengan asumsi pemodelan

berorientas obyek maka dari itu komponen yang ada adalah
Use Case, Activity, Sequence dan Class Diagram.
27
A. Pemodelan Use Case

PadaUse Case Diagram sistem ini terdapat 1 aktor
yaitu Admin, dalam sistem ini Admin adalah orang yang
bertanggung jawab mengatur dan mengelolah sistem.Admin
dapat melakukan Input data siswa, Input data latih, melakukan
proses Mining, dan melihat hasil proses Mining. Berikut adalah
use case diagram dalam aplikasi yang bisa dilihat pada
Gambar 3.3
Gambar 3. 3 UseCase Diagram
B. Activity/Robustness Diagram
Diagram kedua adalah Activity atau Robustness
Diagram. Pada bagian ini juga perlu dipastikan bahwa untuk
setiap use case perlu dibuat satu activity diagram.
1)
2) Activity Diagram Input Data
Menjelaskan tentang proses Input Data, dimana
Admin akan memasukkan data siswa yang nantinya akan
dilanjutkan ke proses data uji. Pada proses Activity diagram
dapat dilihat pada gambar 3.4
28
Gambar 3. 4 Activity Diagram Input Data
3) Activity Diagram Edit Data

Menjelaskan tentang proses mengedit data, dimana
Admin dapat mengedit data siswa yang salah atau
memerlukan suatu perubahan data. Pada proses Activity
Diagram dapat dilihat pada gambar 3.5
Gambar 3. 5 Activity Diagram Edit Data
4) Activity Diagram Hapus Data

Menjelaskan tentang menghapus data, dimana Admin
dapat menghapus data siswa jika data tersebut tidak
29
dibutuhkan. Pada proses Activity DiagramHapus dapat dilihat

pada gambar 3.6
Gambar 3. 6 Activity Diagram Hapus
5) Activity Diagram Data Latih

Pada bagian ini menjelasakan tentang proses impor
data latih. Pada proses Activity Diagram Data Latih dapat
dilihat pada gambar 3.7
Gambar 3. 7 Activity Diagram Data Latih

30
6) Activity Diagram Hitung Data Latih

Pada bagian ini menjelasakan tentang proses
perhitungan data latih. proses activity diagram dapat dilihat
pada Gambar 3.8
Gambar 3. 8 Activity Diagram Hitung Data Latih
7) Activity Diagram Hitung Data Uji

Pada bagian ini menjelasakan tentang proses
perhitungan data latih. proses activity diagram dapat dilihat
pada Gambar 3.9
Gambar 3. 9 Avtivity Diagram Hitung Data Uji

31
C. Sequence Diagram
Sequence diagram menunjukkan interaksi dengan
menampilkan setiap partisipan sistem melalui garis vertikal dan
pengurutan pesan dari atas ke bawah. Berikut peneliti
memberikan beberapa Sequence Diagram.
1) Sequence Diagram Input Data
Sequence DiagramInput data akan menjelaskan
bagaimana sistem ketika admin melakukan tambah data
siswa. Pada Gambar 3.10 dijelaskan Sequence Diagram Input
Gambar 3. 10 Sequence Diagram Inpit Data
2) Sequence Diagram Edit

Sequence DiagramEdit data akan menjelaskan
bagaimana sistem ketika admin melakukan proses edit data
siswa. Pada Gambar 3.11 dijelaskan Sequence Diagram Edit
Gambar 3. 11 Sequence Diagram Edit Data

32
3) Sequence Diagram Hapus

Sequence Diagram Hapus akan menjelaskan
bagaimana sitem ketika admin melakukan proses hapus data.
Pada Gambar 3.12 dijelaskan Sequence Diagram hapus data
Gambar 3. 12 Sequence Diagram Hapus
4) Sequence Diagram Data Latih

Sequence Diagram Data Latih akan menjelaskan
bagaimana sistem ketika admin memproses dari data latih
sehingga admin dapat melihat sebuah pohon keputusan dari
data latih tersebut. Gambar 3.13 menjelaskan bagaimana alur
data dari sistem ketika admin memproses sebuah data latih
Gambar 3. 13 Sequence Diagram Data Latih

33
5) Sequence Diagram Hitung Data Latih

squence diagram hitung data latih oleh admin.
langkah awal adalah admin memilih menu data latih terlebih
dahulu , setelah itu pilih tombol hitung Naive Bayes pada data
latih dan sistem akan menampilkan perhitungan.Gambar 3.14
menjelaskan bagaimana sistem ketika admin memproses
hitung data latih.
Gambar 3. 14 Sequence Diagram Hitung Data Latih
6) Sequence Diagram Hitung Data Uji

Pada squence diagram hitung data uji oleh admin.
langkah awal adalah admin memilih menu data uji terlebih
dahulu , setelah itu pilih tombol uji akurasi dan sistem akan
menampilkan perhitungan.Sequence diagram hitung data uji
dapat dilihat pada gambar 3.15
Gambar 3. 15 Sequence Diagram Hitung Data Uji

34
D. Class Diagram
Class Diagram merupakan bagian dari Entity
Relationship Diagram (ER-D) yang digunakan untuk pemodelan
basis data. Perbedaannya ER-D fokus pada data, sedangkan
class diagram fokus bukan hanya pada data tetapi juga
pemodelan perilaku sistem. Class diagram juga memiliki simbol-
simbol yang digunakan, misalnya (-) adalah sifat private ini
biasanya berisi atribute dari database, (+) adalah sifat public ini
biasanya adalah operasiyang digunakan dalam controller dari
framework yang basisnya mvc, dan dalam sifat public mempunyai
operation_construct dimana berisi data boolean ataupun data
yang dipatenkan. Perancangan Class Diagram dari implementasi
Algoritma Naive Bayes dapat dilihat pada Gambar 3.14
Gambar 3. 16 Class Diagram
E. Desain Basis Data

Desain basis data merupakan hal yang terpenting dari
sebuah sistem baik itu yang sederhana hingga yang kompleks.
Dalam implementasi algoritma Naive Bayes ini juga
menggunakan data base untuk menyimpan datanya. Pada
Gambar 3.15 dijelaskan rancangan desain CDM (conceptual data
model) nya. pada CDM ini di jelakan bagaimana konseptual
ataupun perancangan pada database yang akan digunakan.
35
Gambar 3. 17 Conceptual Data Model
Gambar 3. 18 physhical Data Model
F. Perancangan User Interface

User Interface merupakan aspek sistem komputer atau
program yang dapat dilihat oleh user. User Interface digunakan
untuk mengendalikan operasi dan memasukkan data. Berikut ini
adalah perancangan User Interface pada implementasi Algoritma
Naive Bayes
36
1) User Interface Login
Gambar 3. 19 User Interface Input Data
2) User Interface Input Data

User interface input data, halaman ini menampilkan input
data siswa yang akan di proses untuk menjadi data uji. User
Interface Input Data dapat dilihat pada Gambar 3.20
Gambar 3. 20 User Interface Input Data
3) User Interface Data Latih

Haaman ini menampilkan table data latih, yang nanti
akan diproses mining sehingga akan menentukan Node akar /
pohon keputusan. User Interface Data Latih dapat dilihat pada
Gambar 3.21
37
Gambar 3. 21 User Interface Data Latih
4) User Interface Data Uji

Pada halaman ini menampilkan table perbandingan
antara hasil asli dengan hasil keputusan dari Algoritma Naive
Bayes. User Interface Data Uji dapat dilihat pada Gambar 3.22
Gambar 3. 22 User Interfice Data Uji

38
5) User Interface Hasil Perhitungan
Gambar 3. 23 User Interface Hasil Perhitungan
Gambar 3.23 diatas adalah halaman user interface

pada hasil perhitugan Naive Bayes yang berada pada hak
akses admin. Halaman ini adalah menampilkan perhitungan
dari data latih yang menghasilkan mean dan standart deviasi.
3.3 Perhitungan Naive Bayes
Untuk proses perhitungan algoritma Naive Bayes

terdapat langkah–langkah untuk menentukan mean dan
standar devasi.
3.3.1 Contoh Perhitungan Naive Bayes
Untuk proses perhitungan Naive Bayes adalah

1. Baca data trining jika datanya numerik maka cari nilai
mean dan standar deviasi dari masing-masing parameter yang
merupakan data numerik.
2. Adapun persamaan yang digunakan untuk menghitun rata-
rata hitung (mean) dapat dilihat pada rumus 3.1 :
39
Rumus 3. 1
Rumus 3. 2
di mana:
µ : rata-rata hitung (mean)
xi : nilai sampel ke-i
n : jumlah sampel
3. untuk menghitung nilai simpangan baku (standar deviasi)
dapat diihat pada rumus 3.3:
Rumus 3. 3
σ : standart deviasi
xi : nilai x ke i
µ : rata-rata hitung
n : jumlah sampel
4. Class probabilitas dari teorema Bayes dilihat pada 3.4 :
Rumus 3. 4
1. Mendapatkan nilai tabel pada mean, standart deviasi dan

probabilitas.
Peluang dapat dilihat pada rumus 3.5
Rumus 3. 5
40
P : peluang
Xi : Atribut ke i
xi : nilai atribut ke i
Y : kelas yang dicari
yi : sub kelas Y yang dicari
σ : deviasi standart, menyatakan varian dari seluruh
atribut
µ : mean, menyatakan rata-rata dari semua atribut
6. Mencari kelas dengan mengalikan proses klasifikasi dengan

probabilitas
7. mencari nilai yang paling besar
8. selesai.
3.3.2 Alur proses algoritma Stratified Sampling
Mulai
Pengambilan sample
secara ramdon
Pengurutan nilai terkecil ke

terbesar dari IPA dan IPS
41
Selesai
3.3.3 Alur proses algoritma Naive Bayes
Mulai
Data latih
Data uji
Mencari mean tiap

parameter
Mencari standart deviasi
Mencari probabilitas
Proses klasifikasi Data Uji
Mencari nilai kelas dengan

mengalikan proses
klasifikasi dengan
probabilitas
Mencari nilai yang paling

besar
Selesai
Tabel 3. 2 Data Latih
MAT FIS MI
MAT MAT FIS BIO KEL
IPA TPA TPA NA
UN TPA 1 TPA 1 TPA AS
2 2 T
60,00 72,50 30,00 30,00 40,00 60,00 40,00 IPA IPA
82,50 82,50 50,00 80,00 100,00 IPA IPA
97,50 87,50 90,00 50,00 70,00 IPA IPA
97,50 92,50 100,00 80,00 80,00 IPA IPA
67,50 67,50 70,00 30,00 30,00 30,00 20,00 IPA IPA
70,00 52,50 20,00 20,00 60,00 50,00 40,00 IPA IPA
97,50 92,50 80,00 80,00 80,00 IPA IPA
97,50 95,00 70,00 90,00 80,00 IPA IPA
77,50 85,00 70,00 90,00 60,00 IPA IPA
90,00 80,00 80,00 80,00 70,00 IPA IPA
97,50 67,50 100,00 70,00 60,00 IPA IPA
92,50 57,50 30,00 30,00 70,00 IPS IPS
87,50 90,00 70,00 70,00 60,00 IPS IPS
97,50 90,00 70,00 70,00 60,00 IPS IPS
47,50 45,00 30,00 30,00 40,00 20,00 50,00 IPA IPS
60,00 52,50 20,00 40,00 40,00 40,00 20,00 IPA IPS
62,50 65,00 20,00 10,00 20,00 30,00 40,00 IPA IPS
a. Mengitung nilai mean pada atribut Nilai Matematika UN

Kelas IPA
42
43
b. Mengitung nilai mean pada atribut Nilai IPA UN kelas IPA
c. Mengitung nilai mean pada atribut Nilai Matematika TPA

kelas IPA
d. Mengitung nilai mean pada atribut Nilai Fisika TPA kelas IPA
e. Mengitung nilai mean pada atribut Nilai Biologi TPA kelas

IPA
44
f. Mengitung nilai mean pada atribut Nilai Matematika TPA 2

kelas IPA
g. Mengitung nilai mean pada atribut Nilai Fisika TPA 2 kelas

IPA
h. Mengitung nilai mean pada atribut Nilai Matematika UN

kelas IPS
i. Mengitung nilai mean pada atribut Nilai IPA UN kelas IPS

45
j. Mengitung nilai mean pada atribut Nilai Matematika TPA

kelas IPS
k. Mengitung nilai mean pada atribut Nilai Fisika TPA kelas IPS
l. Mengitung nilai mean pada atribut Nilai Biologi TPA kelas

IPS
46
m. Mengitung nilai mean pada atribut Nilai Matematika TPA 2

kelas IPS
n. Mengitung nilai mean pada atribut Nilai Fisika TPA 2 kelas

IPS
Tabel 3. 3 Mean
MAT IPA MAT FISIKA MAT FIS BIO

Kelas
UN UN TPA TPA TPA2 TPA2 TPA
IPA 85,00 79,55 69,09 63,64 46,67 33,33 66,36
IPS 74,58 66,67 40,00 41,67 30,00 36,67 48,33
Menghitung standart deviasi

a. Standart deviasi Nilai Matematika UN Kelas IPA
47
b. Standart deviasi Nilai IPA UN Kelas IPA
c. Standart deviasi Nilai Matematika TPA Kelas IPA

48
d. Standart deviasi Nilai Fisika TPA Kelas IPA
e. Standart deviasi Nilai Biologi TPA Kelas IPA

49
Tabel 3. 4 Standart Deviasi
MAT IPA MAT FISIKA MAT FIS BIO

Kelas
UN UN TPA TPA TPA2 TPA2 TPA
IPA 14,23 13,22 26,25 26,18 15,28 11,55 19,63
IPS 20,52 19,21 23,66 24,01 10,00 15,28 18,35
Menghitung probabilitas
a. Probabilitas kelas IPA

50
b. Probabilitas kelas IPS
Tabel 3. 5 Probablitas
kelas nilai
Kelas IPA 0,65
Kelas IPS 0,35
c. Proses klasifikasi Data Uji
Tabel 3. 6 Data Uji
Mat IPA Mat Fis Bio Mat Fis Prediksi

Kelas
UN UN TPA1 TPA 1 TPA1 TPA2 TPA2
90,00 90,00 60,00 70,00 50,00 IPA ?
a. Proses klasifikasi Nilai Matematika UN kelas IPA

51
b. Proses klasifikasi Nilai IPA UN kelas IPA

52
c. Proses klasifikasi Nilai Matematika TPA Kelas IPA
d. Proses klasifikasi Nilai Fisika TPA Kelas IPA

53
e. Proses klasifikasi Nilai Biologi TPA
Tabel 3. 7 Hasil Perhitungan Klasifikasi Data Uji
MAT FIS BIO

Kelas MAT UN IPA UN
TPA TPA TPA
IPA 0,09945 0,08028 0,07335 0,07572 0,06363
IPS 0,00012 0,00023 0,01976 0,01816 0,00294
54
Hasil yang ditunjukkan pada tabel klasifikasi data uji,

dimana semua atribut sudah dihitung pada tabel diatas, maka
selanjutnya akan mencari nilai kelas yaitu dengan cara
mengalikan semua atribut Nilai UN, MAT, IPA, B.ING, B.IND dan
Probabilitas.
a. Proses Perhitungan mencari nilai kelas
Tabel 3. 8 Prediksi Kelas
MAT MAT
Kelas IPA UN FIS TPA BIO TPA KELAS
UN TPA
IPA 0,09945 0,08028 0,07335 0,07572 0,06363 1,82573E-08
IPS 0,00012 0,00023 0,01976 0,01816 0,00294 1,01797E-14
Pada tabel 3.10 diatas bahwa, pada atribut kelas nilai

tertinggi adalah 1,00778E-08 , maka dengan nilai Mat UN 90,00,
Nilai IPA UN 90,00, Nilai Mat TPA 60,00, Nilai Fis YPA 70,00,
Nilai Biologi TPA 50,00. Maka hasil prediksi ini adalah Kelas IPA
BAB 4
TESTING DAN IMPLEMENTASI SISTEM
4.1 Lingkungan Pengembangan
Dari hasil perancangan yang telah dilakukan

sebelumnya, dapat diketahui bahwa hasil penerapan algoritma
Naive Bayes pada kasus pendaftaran peserta didik baru (PPDB)
SMA negeri tersebut adalah berupa aplikasi web. Oleh karena
itu, agar sistem dapat berjalan dengan baik maka perlu
diperhatikan kebutuhan implementasi sistem yang berupa
hardware dan software sebagai berikut:.
4.1.1 Perangkat Keras
Spesifikasi perangkat keras yang digunakan untuk

membangun aplikasi data mining menggunakan algoritma Naive
Bayes ini seperti yang ditunjukkan pada Tabel 4.1 Spesifikasi
Perangkat Keras.
Tabel 4. 1. Spesifikasi Perangkat Keras
Nama Spesifikasi
Prosesesor Amd E-300 APU with AMD Radeon(tm) HD
Grapich 1.30Ghz
LCD 14 Inch
Hardisk 300 GB
RAM 2 GB
4.1.2 Perangkat Lunak
Perangkat lunak yang digunakan untuk membangun

aplikasi data mining menggunakan algoritma Naive Bayes ini
adalah dapat dilihat pada Tabel 4.2
55
56
Tabel 4. 2 Spesifikasi Perangkat Lunak
Kriteria Nama Perangkat

Sistem Operasi Microsoft Windows 7
Database MySQL
Bahasa
PHP, HTML dan CSS
Pemrograman
Web Browser Google Chrome, Mozilla Firefox
Web Server Xampp control panel v5.3.0 2..1.0
Tools
Sublime text 2, Star UML, Rapid Minner
pendukung
4.2 Lingkungan Implementasi
Lingkungan implementasi adalah spesifikasi perangkat

dimana luaran perangkat lunak dari penelitian diharapkan akan
beroperasi. Komponen yang dijelaskan sama dengan lingkungan
pengembangan.
4.2.1 Perangkat Keras
Spesifikasi perangkat keras minimum yang harus

dipenuhi agar sistem dapat berjalan lebih baik, dapat dilihat pada
Tabel 4.3 spesifikasi perangkat keras minimum
Tabel 4. 3 Spesifikasi perangkat keras
Nama Spesifikasi
Prosesesor Amd E-300 APU with AMD Radeon(tm) HD
Grapich 1.30Ghz
LCD 14 Inch
Hardisk 300 GB
RAM 2 GB
57
4.2.2 Perangkat Lunak
Spesifikasi perangkat lunak minimum yang harus

dipenuhi agar sistem dapat berjalan lebih baik, dapat dilihat pada
Tabel 4.4 Spesifikasi Perangkat Lunak
Tabel 4. 4 Spesifikasi minimum perangkat lunak
Kriteria Nama Perangkat

Sistem Operasi Microsoft Windows 7
Web Browser Google Chrome, Mozilla Firefox
4.3 Testing/Pengujian Kode Program dan Implementasi

Sistem
Implementasi bertujuan untuk mengetahui alur dari

penerapan algoritma Naive Bayes untuk klasifikasi pada kasus
penentu jurusan SMA Negeri agar mudah dipahami oleh
pengguna dan dapat menghasilkan informasi yang memenuhi
tujuan tersebut. Pengujian digunakan untuk memastikan bahwa
tiap use case dapat berjalan dengan sesuai rancangan. berikut ini
adalah tampilan halaman awal. Dapat dilihat pada Gambar 4.1
adalah tampilan halaman awal dari halaman admin.
4.3.1 Pengujian dan Validasi Algoritma
Penerapan algoritma Naive Bayes ini pada proses prediksi jurusan

pada SMA negeri tidak lepas dari pengujian dan validasi
algoritma. Pengujian dan validasi algoritma berguna untuk
memastikan bahwa algoritma ini tepat atau tidak tepat
digunakan dalam proses prediksi. Pengujian dan validasi
algoritma ini menggunakan 1 skenario percobaan yaitu:
Menghitung data latih menggunakan algoritma Naive Bayes. hasil
yang diambil dari 1 pengujian tersebut adalah nilai dari evaluation
measure yang diukur menggunakan confusion matrix.
58
Gambar 4. 1 Pengujian dan validasi algoritma
Gambar 4. 2 Hasil uji cross validation

Scenario uji coba cross validation dijelaskan lebih detail pada
poin-poin sebagai berikut. Skenario uji coba yang pertama adalah
memuat data latih dan data uji perbandingan 90% sampai 10%.
Kemudian melalui tahap Stratified sampling dengan aplikasi
RapidMiner Studio guna mendistribusikan data latih dan data
uji. Hasil uji coba cross validation akan dijelaskan pada Tabel 4.5
Tabel 4. 5 Hasil Uji Coba Cross Validation
Data latih Data uji Accuracy
90% 10% 97.06
80% 20% 98.55
70% 30% 98.08
60% 40% 97.10
50% 50% 98.26
40% 60% 97.58
30% 70% 97.10

59
20% 80% 98.19
10% 90% 98.71

1.1.1 Implementasi Sistem Home User
Gambar 4. 3 Halaman Home User
Pada Gambar diatas 4.3 adalah Halaman sistem

rekomendasi untuk user dalam memprediksi sekolah. sistem ini
bisa langsung diakses tanpa harus login terlebih dahulu khusus
untuk user. pada fitur login adalah fitur untuk admin dapat dilihat
pada Gambar 4.4
4.3.2 Pengujian Use Case Sistem Home User
Gambar 4. 4 Halaman Login

60
Pada gambar diatas 4.4 adalah halaman login yang

terdapat pada sistem. Sebelum masuk ke dalam sistem, admin
harus login terlebih dahulu dengan memasukkan username dan
password. Berikut Pengujian halaman login pada tabel 4.6.
Tabel 4. 6 Pengujian Login
Pengujian Login
Penguji : Bayu Aji Prasetyo
Tanggal : 18 Mei 2020
Tujuan : untuk menguji fungsi login
Pengujian login
Skenario Data masukan Yang Pengamatan Ket
diharapkan
Skenario 1 User:admin User Login ok
Username Pass:admin ditemukan berhasil
dan
password
benar
Skenario 2 User:admin User tidak Login gagal ok
Pass:admin ditemukan
4.3.3 Implementasi Sistem Home Admin
Gambar 4. 5 Halaman Home Admin

61
Pada Gambar 4.5 diatas adalah menu admin dimana

menu itu terdiri dari beranda, data latih, data uji, hasil
perhitungan, data sekolah , data pengguna dan juga keluar. untuk
mengoperasikan pertama kali dalam sistem ini adalah admin
harus memasukkan data latih terlebih dahulu.
4.3.4 Pengujian Use Case Impor Data Latih
Pada pengujian use case mengolah data latih atau

dataset mahasiswa adalah fungsi import file dari Ms. Excel. Untuk
tampilan halaman import bisa dilihat pada Gambar 4.6.
Gambar 4. 6 Halaman Import Data Latih
Selanjutnya pada gambar 4.4 adalah pengujian import

file data latih dalam bentuk Ms. Excel yang bertujuan untuk
mengetahui kesalahan pada fungsinya. Pada Tabel 4.7
menjelaskan secara ringkas tentang pengujiannya.
Tabel 4. 7 Pengujian Impor Data Latih
Pengujian Impor Data Latih

Tujuan : untuk menguji fungsi impor data latih
Pengujian Import Data Latih
62
Skenario Data Yang Pengamatan Ket

masukan diharapkan
Skenario 1 Upload file Berhasil Berhasil impor ok
Ms. Excel Tersimpan data
dengan
Format
(.xls)
Skenario 2 Upload file Data Data ok
Ms.Excel tersimpan tersimpan
dengan
Format
(.xls)
dengan
data yang
berbeda
Skenario 3 Upload file Data tidak Tidak bisa ok
Ms. Excel tersimpan membaca file
dengan Ms. Excel
Format yang
(.xlsx) berektensi
(.xlsx) dan
menampilkan
notifikasi
“filename is
not readable”
63
4.3.5 Implementasi Sistem Data Latih
Gambar 4. 7 Halaman Data Latih

Pada Gambar 4.7 diatas adalah tampilan menu data latih.
Awal dari perhitungan adalah admin harus melakukan uplod data
pada menu data latih ini. Setelah itu tekan tombol hitung Naive
Bayes maka akan muncul perhitungan yaitu mean dan standart
deviasi pada setiap atribut. Perhitungannya bisa kita lihat pada
Gambar 4.8.
4.3.6 Implementasi Use Case Perhitungan Data Latih
Gambar 4. 8 Sistem Perhitungan Data Latih

64
Pada Gambar 4.8 diatas adalah tampilan dari hasil

perhitungan mean dan standar deviasi. Jika sudah melakukan
perhitungan maka langkah selanjutnya adalah melakukan uplod
data pada menu data uji. Untuk pengujian perhitungan data latih
bisa dilihat pada tabel 4.8
Tabel 4. 8 Pengujian Data Latih
Pengujian Perhitungan Naive Bayes

Tujuan : untuk menguji fungsi perhitungan Naive Bayes
Pengujian Perhitungan Naive Bayes
masukan diharapkan
Skenario 1 Data latih Menampilk Menampilkan ok
sudah di an hasil
upload : perhitungan perhitungan
pilih hitung Naive Bayes Naive Bayes
Naive termasuk termasuk
Bayes mean dan mean dan
standart standart
deviasi deviasi pada
setiap atritbut
kelas.
Skenario 2 Data Latih Muncul Bisa muncul ok
belum notifikasi pada tabel
disiapkan kesalahan tapi tidak ada
data “empty”
65
4.3.7 Pengujian Use Case Data Uji
Gambar 4. 9 Data Uji
Pada Gambar 4.9 diatas adalah tampilan data uji ,

admin melakukan uplod data pada sistem ini, setelah itu tekan
tombol Uji akurasi , maka sistem kan menghitung, tujuan
perhitungan adalah sistem bisa menguji keakuratan dan
ketepatan pada perekomendasian sekolah. Pada perhitungan
data uji bisa dilihat pada menu halaman akurasi. Untuk pengujian
perhitungan data uji akurasi dapat dilihat pada tabel 4.9.
Tabel 4. 9 Pengujian Data Uji
Pengujian Hitung Akurasi

masukan diharapkan
Skenario Pilih Menampilk Menampilk an ok
1 button an Hasil ketepatan
“Hitung Evaluasi prediksi,
Akurasi” confusion matrix,
tabel evaluasi
Tabel 4. 10 Pengujian Data Uji

66

masukan diharapkan
Skenario 2 Data uji Bisa Menampilk an ok
kosong diunggah ketepatan
dan prediksi,
menampilkan confusion
data kosong matrix, tabel
“empty” evaluasi dan
hasilnya 0
4.3.8 Akurasi Data Uji
Gambar 4. 10 Akurasi Data Uji
Pada Gambar 4.10 adalah halaman nilai evaluasi yaitu

hasil pengujian data uji pada halaman ini bisa menampilkan
perhitungan diantaranya accuracy, precisien, recall, f-maeasure,
eror rate, auc dan spesificity.
67
4.3.9 Implementasi Sistem daftar pengguna
Gambar 4. 11 Halaman Daftar Pengguna
Pada Gambar 4.11 diatas adalah halaman daftar

pengguna, yang terdiri dari data semua akun, tambah data
pengguna, update akun.
4.3.10 Pengujian Use Case Form Rekomendasi Jurusan
Form rekomendasi sekolah adalah dimana pihak user
atau siswa akan mengisi form yang sudah disediakan oleh sistem
, yang nantinya output dari form ini adalah rekomendasi jurusan.
Gambar 4. 12 Form Rekomendasi Sekolah

Gambar 4.12 diatas adalah menu form rekomendasi
sekolah yang terdapat pada user, guna untuk mengetahui
kesalahan dan fungsi pada fitur tersebut yang akan dijelaskan
pada Tabel 4.11.
68
Tabel 4. 11 Form Rekomendasi Sekolah
Pengujian form rekomendasi sekolah

Tujuan : untuk menguji fungsi form rekomendasi jurusan
Pengujian form rekomendasi sekolah
masukan diharapkan
Skenario 1 Memasukk Bisa Berhasil ok
an data dieksekusi tersimpan dan
form pada simpan menampilkan
lengkap rekomendasi
sekolah
Skenario 2 Tidak Mampu Tidak berhasil ok
memasukk tersimpan menyimpan
an data dan terdapat
pada 1 tulisan “please
form fiil out this
field”
4.4 Implementasi Algoritma Naive Bayes

Implementasi algoritma Naive Bayes bertujuan untuk
mengetahui nilai perbandingan dari beberapa kasus uji coba
seperti perbedaan distribusi data latih dan data uji.
4.5 Uji Coba dan Validasi Algoritma
Penerapan algoritma Naive Bayes ini pada proses

penentuan jurusan pada SMAN tidak lepas dari pengujian dan
validasi algoritma. Pengujian dan validasi algoritma berguna
untuk memastikan bahwa algoritma ini tepat atau tidak tepat
digunakan dalam proses prediksi.
69
Pengujian dan validasi algoritma ini menggunakan 1

skenario percobaan yaitu: Menghitung data latih menggunakan
algoritma Naive Bayes. hasil yang diambil dari 1 pengujian
tersebut adalah nilai dari evaluation measure yang diukur
menggunakan confusion matrix.
4.6 Implementasi Basis Data

Langkah pertama yang dilakukan pada tahapan
implementasi database yaitu membuat Database MySQL di
PhpMyadmin yang terdapat dalam aplikasi xampp yang sudah
terinstall sebelumnya. Database yang akan digunakan sebagai
media penyimpanan dalam sistem ini dinamakan dengan bayes.
Database pada aplikasi data mining prediksi sekolah
SMA negeri berdasarkan pemeringkatan Ujian Nasional dengan
menggunakan algoritma Naive Bayes pada kasus pendaftaran
peserta didik baru (PPDB) SMA Negeri ini bernama bayes dan
mempunyai 6 tabel yang terdiri dari data_hitung, data_latih,
data_uji, hasil_hitung, hitung_uji dan user.
25. Tabel data_hitung

Tabel data_hitung berisikan data-data atribut yang memiliki
nilai probabilitas yang diperoleh dari perhitungan nilai kelas.
Tampilan struktur tabel data_hitung dapat dilihat pada Gambar
4.13.
Gambar 4. 13 data_hitung
26. Tabel data_latih

Tabel data latih berisikan data-data siswa yang siap
dilakukan proses perhitungan niave bayes dimana tabel nya juga
terdiri dari 10 kolom atau atribut. Id sebagai primary key yang
berfungsi untuk mencegah terjadinya duplikasi data.Tampilan
struktur tabel bisa dilihat pada Gambar 4.14.
70
Gambar 4. 14 data_latih
27. Tabel data_uji

Tabel data_latih berisikan data-data siswa yang siap
dilakukan proses perhitungan pengujian Naive Bayes dimana
tabel nya juga terdiri dari 11 kolom atau atribut. Id sebagai
primary key yang berfungsi untuk mencegah terjadinya duplikasi
data.Tampilan struktur tabel bisa dilihat pada Gambar 4.15.
Gambar 4. 15 data_uji
28. Tabel hasil_hitung

Tabel data_hitung berisikan hasil hitung dari perhitungan
mean dan standart deviasi.tabel ini berisi 6 kolom atau atribut.
Id_hitung sebagai primary key yang berfungsi untuk mencegah
terjadinya duplikasi data.Tampilan struktur tabel bisa dilihat pada
Gambar 4.16.
71
Gambar 4. 16 tabel hasil_hitung
29. Tabel hitung_uji

Tabel hitung_uji berisikan proses terakhir untuk menentukan
kelas atau prediksi. tabel ini berisi 4 kolom atau atribut. Id
sebagai primary key yang berfungsi untuk mencegah terjadinya
duplikasi data.Tampilan struktur tabel bisa dilihat pada Gambar
4.17
Gambar 4. 17 hitung_uji
30. Tabel user

Tabel user berisikan data login untuk admin. tabel ini berisi 6
kolom atau atribut.Tampilan struktur tabel bisa dilihat pada
Gambar 4.18.
Gambar 4. 18 user
BAB 5
PENUTUP
Bab ini berisi pokok-pokok kesimpulan dan saran-

saran yang perlu disampaikan kepada pihak-pihak yang
berkepentingan dengan hasil penelitian.
5.1 Kesimpulan
Berdasarkan hasil peneitian yaitu dengan melakukan

pendekatan terhadap sebuah dataset yang mempunyai 2
missing value dan kasus balanced Class, ketika melakukan
implementasi dan pengujian terhadap sistem ini maka dapat di
simpulkan :
1) Data yang di peroleh sebanyak 345 data siswa tahun
angkatan 2019/2020 yang terdiri dari 210 siswa kelas
IPA, 135 siswa kelas IPS. kemudian didistribusikan
menjadi data latih dan data uji menggunakan teknik
Stratified sampling pada aplikasi RapidMiner.
2) Pada perhitungan manual algoritma naive bayes mampu
menghasilkan prediksi dengan menghitung manual
diantarnya mean, standart deviasi, probablitas kelas dari
setiap kelas dan menggunakan proses klasifikasi pada
data uji. Data atribut yang dihitung antara lain Nilai Ujian
Nasional (NUN), Nilai UN matematika, Nilai UN ipa, Nilai
Tes Potensi Akademik (TPA) Matematika, Nilai TPA IPA,
Nilai TPA Biologi.
3) algoritma Naive Bayes berhasil diterapkan pada sistem
rekomendasi Jurusan Kelas, sistem ini dapat
menghasilkan mean, standart deviasi serta probablitas
kelas pada setiap kelas. keakuratan pada algoritma naive
bayes sistem menggunaka confusien matrik.
4) Menghasilkan nilai akurasi sebesar 94,12% dari 311
datalatih dan 34 datauji.
73
5.2 Saran
Perancangan dan implementasi aplikasi data mining

guna untuk menentukan jurusan di SMA dengan algoritma
Naive Bayes pada kasus balanced Class yang telah diuji,
tentu tidak lepas dari kekurangan ataupun kelemahan. Oleh
karena itu, untuk pengembangan selanjutnya, penulis
menyarankan beberapa hal sebagai berikut.
1) Menambahkan fitur untuk melakukan proses startiffied
sampling dalam membagi antara data uji dengan data
latih.
2) Menggunakan semua sekolah SMA negeri yang ada di
Jombang.
74
DAFTAR PUSTAKA
Anggraeni, E. Y. (2017). Pengantar Sistem Informasi.

Bisri, M. H. (2015). Implementasi Algoritma Naive Bayes
Untuk Memprediksi Penjurusan Siswa di SMA
Kesatrian 1 Semarang. Semarang: Dinus.
Haryana, K. S. (2015). Pengembangan Perangkat Lunak
Dengan Menggunakan PHP. Jurnal Computech &
Bisnis, 2(1), 14-21.
Lestari, F. D., Irawan, B., & Redityamurti, Y. (2015). Analisis
Dan Perancangan Sistem Informasi Untuk Software
House Berbasis Aplikasi Web. e-Proceeding of
Engineering, 2(2), 3442-3448.
Lieberty, A., & Imbar, R. V. (2015). Sistem Informasi
Meramalkan Penjualan Barang Dengan Metode
Double Exponential Smoothing (Studi Kasus : PD,
Padalarang Jaya). Jurnal Teknik Informatika dan
Sistem Informasi, 1(1), 27-32.
Machfud, M. M. (2019). IMPLEMENTASI ALGORITMA C4.5
PADA KASUS IMBALANCED CLASS DISTRIBUTION
UNTUK PENENTUAN JURUSAN DI SEKOLAH
MENENGAH ATAS. Jombang.
Merta, P. W., Sunarya, M. G., & Arthana, K. R. (2015).
Handgesture To Text Dengan Metode Artifical
Intelligence KNN (K-Nearest Neighbour). Kumpulan
Arikel Mahasiswa Pendidikan Teknik Informatika
(KARMAPATI), 4(1), 18-27.
Muflikhah, L. (2018). Data Mining.
Novianti, B. (2016). Implementasi Data Mining Dengan
Algoritma C4.5 Untuk Penjurusan Siswa SMA Negeri
1 Pontianak. Jurnal Coding, 4(3), 75-84.
Nur, M. (2014). "Peminatan Pada Pendidikan Menengah,".
Jakarta : Menteri Pendidikan dan Kebudayaan
Republik Indonesia.
Prasetyo, E. (2014). Data Mining - Mengolah Data Menjadi
Informasi Menggunakan Matlab. Yogyakarta: Andi.
75
Saleh, A. (2015). Implementasi Metode Klasifikasi Naive
Bayes Dalam Memprediksi Besarnya Penggunaan
Listrik Rumah Tangga. Citec Journal, 2(3), 207-217.
Sambani, E. B. (2017). Penerapan Algoritma C4.5 Untuk
Klasifikasi Pola Penjurusan di Sekolah Menengah
Kejuruan (SMK) Kota Tasikmalaya. CSRID, 9(3), 149-
157.
Sembiring, M. A., Sibuea, F. L., & Sapta, A. (2018). Analisis
Kinerja Algoritma C.45 Dalam Memprediksi Hasil
Belajar. Journal of Science and Sosial Research, 1(1),
73-79.
Simarmata, J. (2010). Rekayasa Perangkat Lunak.
Yogyakarta: Andi.
Yasin, V. (2012). Rekayasa Perangkat Lunak Berorientasi
Objek Pemodelan Arsitektur dan Perancangan
(Modeling, Architecture and Design). Jakarta: Mitra
Wacana Media.
76
77
LAMPIRAN
Lampiran 1. Form Progres Skripsi Pembimbing I

78
Lampiran 2. Form Progres Skripsi Pembimbing II

79
Lampiran 3. Form A. Hasil Desk Evaluasi

80
Lampiran 4. Form B. Pengajuan Seminar Terbuka

81
Lampiran 5. Berita Acara Sidang Terbuka

82
Lampiran 6. Daftar Hadir Peserta Seminar Terbuka

83
Lampiran 7. Form C. Pengajuan Ujian Tertutup

84
Lampiran 8. Form Revisi Ujian Tertutup Ketua Penguji

85
Lampiran 9. Form revisi ujian tertutup anggota penguji I

86
Lampiran 10. Form revisi ujian tertutup anggota penguji II

Bayu Aji Prasetyo Skripsi

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Bayu Aji Prasetyo Skripsi

Diunggah oleh

Hak Cipta:

Format Tersedia

SKRIPSI

PENERAPAN STRATIFIED SAMPLING PADA KASUS

BAYU AJI PRASETYO

PROGRAM STUDI SISTEM INFORMASI

Diajukan sebagai salah satu syarat untuk menyelesaikan

BAYU AJI PRASETYO

PROGRAM STUDI SISTEM INFORMASI

“Rahasia keberhasilan adalah kerja keras dan belajar dari

“Kecil Terbina, Muda Berkarya, Hidup Sejahtera, Tua

Puji Syukur Kehadirat Allah SWT dan Sholawat Kepada

Saya yang bertanda-tangan di bawah ini

{Ttd & materai 6000}

Wahyu Try Maulana

Dengan mengucap puji dan syukur kehadirat Allah

Akhir kata, semoga Allah SWT senantiasa

Jombang, 04 Juli 2020

HALAMAN MOTTO iii

Tabel 2. 1 Matrix Penelitian Terdahulu.............................10

Saya yang bertanda-tangan di bawah ini

{Ttd & materai 6000}

Bayu Aji Prasetyo

Gambar 2. 1 Tahapan Metode Waterfall........................21

Lampiran 1. Form Progres Skripsi Pembimbing I..................75

Penelitian ini bertujuan untuk menyajikan mode

Kata Kunci: Algoritma Naive Bayes, Balanced class,

1.1 Latar Belakang

Dalam kurikulum tahun ajaran 2013 penjurusan

sehingga penjurusan yang tidak tepat bisa sangat merugikan

Penjurusan Siswa SMA Negeri 1 Pontianak oleh (Novianti,

Dengan pertimbangan diatas, Algoritma klasifikasi

1.2 Rumusan Masalah

Rumusan masalah merupakan penyebutan kembali

2) Bagaimana menerapkan algoritma Naive Bayes ke dalam

1.3 Batasan Masalah

Agar tidak menyimpang dari tujuan yang hendak

1.4 Tujuan Penelitian

Adapun yang menjadi tujuan peneliti dalam

1.5 Manfaat Penelitian

Adapun manfaat yang dapat diperoleh dari penelitian

yang lebih besar. Perencanaan digunakan untuk

1.7 Sistematika Penulisan

Sistem penulisan dalam tugas akhir ini diususun

Bab ini memaparkan tentang penelitian-penelitian

2.1 Penelitian Terdahulu

Penelitian terdahulu ini menjelaskan tentang

Penelitian pertama berjudul Penerapan Algoritma

Tabel 2. 1 Matrix Penelitian Terdahulu

2.2 Kajian Pustaka

Dalam pembangunan sistem informasi dan

implementasi algoritma klasifikasi data mining beserta kajian

2.2.1 Penentuan / Peminatan Jurusan

Undang – undang peraturan Menteri Pendidikan dan

2.2.2 Sistem Informasi

Sistem informasi merupakan kumpulan data yang

Dalam sebuah sistem informasi mempunyai subuah

Penggunaan sistem informasi saat ini semakin

2.2.3 Data Mining

Data mining merupakan proses ataupun kegiatan

data. Beberapa metode yang dapat digunakan

2.2.4 Decision Tree

Decision tree dengan algoritma C.45 merupakan

2.2.5 KNN (K-Nearest Neighbor)

Menurut (Prasetyo, 2014) algoritma Nearest