Oleh:
SKRIPSI
Oleh:
ii
HALAMAN MOTTO
iii
HALAMAN PERSEMBAHAN
iv
PERNYATAAN KEASLIAN
Dinyatakan di Jombang
Tanggal 24 Januari 2020
v
HALAMAN PERSETUJUAN DAN PENGESAHAN
vi
KATA PENGANTAR
vii
bimbingan, motivasi dan saran yang diberikan
dalam penyusunan skripsi.
6. Nufan Balafif, S.Kom., M.Kom. Selaku dosen
pembimbing dua yang telah memberikan
bimbingan, motivasi dan saran yang diberikan
dalam penyusunan skripsi.
7. Pihak SMAN 3 Jombang yang telah mendukung
dalam pengumpulan data sehingga skripsi dapat
segera saya selesaikan
8. Segenap dosen dan karyawan fakultas saintek
Unipdu Jombang.
9. Segenap mahasiswa fakultas saintek Unipdu
Jombang khususnya angkatan 2016 yang telah
memberikan dorongan untuk menyelesaikan
skripsi ini.
10. Semua pihak yang telah membantu dalam
penyelesaian skripsi ini yang tidak bisa penulis
sebutkan satu persatu.
Penulis
viii
DAFTAR ISI
ix
2.2.1 Penentuan / Peminatan Jurusan 12
2.2.2 Sistem Informasi 12
2.2.3 Data Mining 13
2.2.4 Decision Tree 14
2.2.5 KNN (K-Nearest Neighbor) 14
2.2.6 Naive Bayes 15
2.2.7 PHP 17
2.2.8 Basis Data 18
2.2.9 Unifed Modeling Language (UML) 18
2.2.10 MySQL 20
2.2.11 ER Diagram20
2.2.12 Metode Waterfall 20
2.2.13 Pengujian Black box22
BAB 3 ANALISIS DAN PERANCANGAN SISTEM 23
3.1 Analisis Sistem yang Berjalan 23
3.2 Analisis Sistem yang Diusulkan 23
3.2.1 Kebutuhan Fungsional 24
3.2.2 Kebutuhan Non Fungsional 25
3.2.3 Desain Sistem Yang Diusulkan 25
3.3 Perhitungan Naive Bayes 37
3.3.1 Contoh Perhitungan Naive Bayes 37
3.3.2 Alur proses algoritma Stratified Sampling 39
3.3.3 Alur proses algoritma Naive Bayes 40
BAB 4 TESTING DAN IMPLEMENTASI SISTEM54
4.1 Lingkungan Pengembangan 54
4.1.1 Perangkat Keras 54
x
4.1.2 Perangkat Lunak 54
4.2 Lingkungan Implementasi 55
4.2.1 Perangkat Keras 55
4.2.2 Perangkat Lunak 56
4.3 Testing/Pengujian Kode Program dan Implementasi
Sistem 56
4.3.1 Pengujian dan Validasi Algoritma 56
4.3.2 Implementasi Sistem Home User 58
4.3.3 Pengujian Use Case Sistem Home User 58
4.3.4 Implementasi Sistem Home Admin 59
4.3.5 Pengujian Use Case Impor Data Latih60
4.3.6 Implementasi Sistem Data Latih 62
4.3.7 Implementasi Use Case Perhitungan Data Latih
62
4.3.8 Pengujian Use Case Data Uji64
4.3.9 Akurasi Data Uji 65
4.3.10 Implementasi Sistem daftar pengguna 66
4.3.11 Pengujian Use Case Form Rekomendasi Jurusan
66
4.4 Implementasi Algoritma Naive Bayes 67
4.5 Uji Coba dan Validasi Algoritma67
4.6 Implementasi Basis Data 68
BAB 5 PENUTUP 71
5.1 Kesimpulan 71
5.2 Saran 72
DAFTAR PUSTAKA 73
Lampiran 75
xi
xii
DAFTAR TABEL
xiii
PERNYATAAN KEASLIAN
Dinyatakan di Jombang
Tanggal … ………. ….
xv
DAFTAR GAMBAR
xvi
Gambar 4. 9 Data Uji.....................................................64
Gambar 4. 10 Akurasi Data Uji.......................................65
Gambar 4. 11 Halaman Daftar Pengguna......................66
Gambar 4. 12 Form Rekomendasi Sekolah...................66
Gambar 4. 13 data_hitung..............................................68
Gambar 4. 14 data_latih.................................................69
Gambar 4. 15 data_uji....................................................69
Gambar 4. 16 tabel hasil_hitung....................................70
Gambar 4. 17 hitung_uji.................................................70
Gambar 4. 18 user.........................................................70
xvii
DAFTAR RUMUS
Rumus 2. 1.............................................................16
Rumus 2. 2.............................................................16
Rumus 2. 3.............................................................16
Rumus 2. 4.............................................................16
Rumus 2. 5.............................................................17
Rumus 3. 1.............................................................38
Rumus 3. 2.............................................................38
Rumus 3. 3.............................................................38
Rumus 3. 4.............................................................38
Rumus 3. 5.............................................................38
xviii
DAFTAR LAMPIRAN
xix
ABSTRAK
xx
BAB 1
PENDAHULUAN
1
2
1) Penulis
Penulis dapat memperoleh pengetahuan dan
pengalaman yang akan meningkatkan kreatifitas untuk
berinovasi dan menjadi solusi bagi apa yang dibutuhkan
baik perusahaan/lembaga atau masyarakat luas.
2) Unipdu
Penelitian ini akan memperkaya pustaka penelitian
universitas yang dapat digunakan sebagai bahan rujukan
untuk penelitian sejenis di masa mendatang.
3) SMAN 3 Jombang
Memberikan kemudahan bagi pihak sekolah dalam
memproses data untuk pemilihan jurusan
4) Siswa SMAN 3 Jombang
Siswa dapat masuk ke jurusan yang sesuai dengan bakat
dan kemampuan akademik siswa tersebut
1.6 Metode Penelitian
Penelitian ini dilakukan melalui beberapa tahapan.
Adapun metode yang digunakan dalam tiap-tiap tahapan
antara lain:
1) Metode Pengumpulan Data
Pengumpulan data dilakukan melalui wawancara, dan
observasi lapangan.
2) Metode Rekayasa Perangkat Lunak
Perangkat lunak dalam penelitian ini dibangun dengan
menggunakan metode rekayasa Waterfall. Dengan
mengambil proses perencanaan, analisis data, metode
perancangan, dan implementasi.
a. Perencanaan
Perencanaan sistem ini sangat diperlukan, karena
piranti lunak biasanya merupakan bagian dari sistem
6
b. Analisis Data
Pada langkah ini, penulis akan melakukan analisis
terhadap kebutuhan sistem. Pengumpulan data
penelitian dengan melakukan observasi ke SMAN 3
Jombang serta melakukan wawancara kepada pihak
terkait. Observasi dilakukan untuk mendapatkan
data yang dibutuhkan, melakukan wawancara pada
pihak-pihak terkait mengenai permasalahan yang
sedang dibahas pada skripsi ini untuk memperoleh
gambaran dan penjelasan secara mendasar, penulis
melakukan wawancara kepada kepala SMAN 3
Jombang untuk mencari referensi di buku-buku yang
berhubungan dengan materi-materi yang menjadi
pokok pembahasan tugas akhir.
c. Metode Perancangan
Perancangan dilakukan dengan menggunakan
notasi UML dan pemodelan berorientasi obyek
sehingga diagram yang digunakan adalah Use Case,
Activity, Sequence dan Class Diagram.
d. Metode Pembangunan
Pada tahap ini, penulis akan menggunakan bahasa
pemrograman yang telah ditentukan dalam proses
implementasi yakni bahasa pemrograman PHP dan
menggunakan database MySql, dan uji coba
dilakukan dengan metode pengujian Black Box.
e. Metode Uji Coba
Uji Coba dilakukan dengan menggunakan metode
Black Box.
7
BAB 1 PENDAHULUAN
Bab ini berisi uraian tentang latar belakang masalah
yang mendasari pentingnya diadakan penelitian, identifikasi,
pembatasan dan perumusan masalah penelitian, maksud dan
tujuan penelitian, kegunaan penelitian yang diharapkan, dan
sistematika penulisan.
BAB 2 LANDASAN TEORI
Bab ini berisi tinjauan teori yang mendiskripsikan
pengertian data mining, Konsep Decission Tree, algoritma
klasifikasi data mining, dan metode evaluasi.
BAB 3 ANALISIS DAN PERANCANGAN SISTEM
Bab ini berisi tentang analisis kebutuhan dari sistem
yang akan dibangun, perbandingan sistem yang sudah ada
dengan sistem yang diusulkan, dan perancangan sistem yang
diusulkan.
BAB 4 TESTING DAN IMPLEMENTASI SISTEM
Bab ini berisi tentang penjelasan prosedur testing
dan proses pengujian sistem yang telah dibuat.
BAB 5 PENUTUP
Bab ini berisi pokok-pokok kesimpulan dan saran-
saran yang perlu disampaikan kepada pihak-pihak yang
berkepentingan dengan hasil penelitian.
DAFTAR PUSTAKA
Daftar pustaka berisi daftar referensi yang digunakan
dalam penelitian.
BAB 2
LANDASAN TEORI
9
IPA, minat, jurusan. Dari hasil percobaan prediksi penjurusan
siswa menggunakan metode Naive Bayes, diperoleh akurasi
sebesar 83,87%.
Judul dan
Hasil Perbedaan Persamaan
Penulis
Penerapan Menghasilk Mengguna Penentu
Algoritma an akurasi kan jurusan
C4.5 untuk sebesar Algoritma Siswa
klasifikasi 97,22% C4.5.
Kasus
Pola
Penentuan
Penjurusan di jurusan
Sekolah siswa
Menengah Sekolah
Kejuruan menengah
(SMK) Kota kejuruan
Tasikmalaya Atribut
Oleh : yang
digunakan
(Sambani, :Nilai
2017) bahasa
Inggris,
bahasa
Indonesia,
Matematik
a, IPA, tes
Kesehatan,
Tes
Olahraga
10
Lanjutan Tabel 2.1.....................
Judul dan
Hasil Perbedaan Persamaan
Penulis
Inplementasi Menghasilk Menggunak Kasus
Data Mining an akurasi an penentuan
Dengan sebesar Algoritma jurusan
Algoritma 89.74% dari C4.5. siswa
Sekolah
C4.5 untuk 39 data uji
Menengah
Penjurusan Atas
Siswa SMA Penelitian ini
Negeri 1 menggunaka
Pontianak n 2 jurusan
Oleh : (IPA, IPS)
(Novianti,
2016)
Implementasi Menghasilk Penelitian Menggunaka
Algoritma an akurasi ini n Algoritma
Naive Bayes sebesar menggunak Naive Bayes
untuk 83.87% an 2 Kasus
jurasan, penentuan
Memprediksi
sedangkan jurusan
Penjurusan penelitian siswa
Siswa di SMA penulis Sekolah
kesatrian 1 menggunak Menengah
Semarang an 3
Oleh : jurusan
(Bisri, 2015)
11
12
2) Output (keluaran)
3) Software (perangkat lunak)
4) Hardware (perangkat keras)
5) Database (basis data)
6) Kontror dan Prosedur
7) Jaringan Komputer
Rumus 2. 1
Rumus 2. 2
di mana:
µ: rata-rata hitung (mean)
xi : nilai sampel ke-i
n : jumlah sampel
Rumus 2. 3
σ : standart deviasi
xi : nilai x ke i
µ : rata-rata hitung
17
n : jumlah sampel
7. Persamaan dari teorema Bayes dilihat pada
Rumus 2. 4
Keterangan :
X : Data dengan class yang belum diketahui
H : Hipotesis data merupakan suatu class spesifik
P(H|X) : Probabilitas hipotesis H berdasar kondisi (posteriori
probability)
P(H) : Probabilitas hipotesis (prior probability)
P(X|H) : Probabilitas X berdasarkan kondisi pada hipotesis
P(X) : Probabilitas X
8. mendapatkan nilai tabel pada mean, standart deviasi dan
probabilitas.
Peluang dapat dilihat pada
Rumus 2. 5
P : peluang
Xi : Atribut ke i
xi : nilai atribut ke i
Y : kelas yang dicari
yi : sub kelas Y yang dicari
σ : deviasi standart, menyatakan varian dari seluruh
atribut
µ : mean, menyatakan rata-rata dari semua atribut
9. Mencari kelas dengan mengalikan proses klasifikasi
dengan probabilitas.
10. mencari nilai yang paling besar.
11. Selesai
18
2.2.7 PHP
a) Pengertian UML
Unifed Modeling Language (UML) adalah sebuah
“bahasa” yang telah menjadi standart dalam industri untuk
visualisasi, merancang pada suatu sistem yang akan dibuat
dan mendokumentasi sistem piranti lunak. UML menawarkan
19
2.2.10 MySQL
14. Penulisan kode program dan pada tahap ini desain harus
diterjemahkan ke dalam bentuk mesin yang dapat dibaca.
Dalam tahap ini dilakukan pembuatan kode.
15. Pengujian program adalah setelah kode telah dihasilkan,
pengujian program dimulai. Pengujian yang dilakukan
secara internal (benar tidaknya pernyataan yang dibuat
dalam coding) dan eksternal melakukan tes untuk
menemukan kesalahan dan memastikan bahwa input
sesuai dengan apa yang dibutuhkan.
16. Penerapan program dan pemeliharaan merupakan
tahapan yang paling panjang. sistem dipasang dan
digunakan secara nyata. Maintenance melibatkan
pembetulan kesalahan yang tidak ditemukan pada
tahapan-tahapan sebelumnya, meningkatkan
implementasi dari unit sistem, dan meningkatkan layanan
sistem sebagai kebutuhan.
2.2.13 Pengujian Black box
24
25
B. Activity/Robustness Diagram
Diagram kedua adalah Activity atau Robustness
Diagram. Pada bagian ini juga perlu dipastikan bahwa untuk
setiap use case perlu dibuat satu activity diagram.
1)
2) Activity Diagram Input Data
Menjelaskan tentang proses Input Data, dimana
Admin akan memasukkan data siswa yang nantinya akan
dilanjutkan ke proses data uji. Pada proses Activity diagram
dapat dilihat pada gambar 3.4
28
C. Sequence Diagram
Sequence diagram menunjukkan interaksi dengan
menampilkan setiap partisipan sistem melalui garis vertikal dan
pengurutan pesan dari atas ke bawah. Berikut peneliti
memberikan beberapa Sequence Diagram.
1) Sequence Diagram Input Data
Sequence DiagramInput data akan menjelaskan
bagaimana sistem ketika admin melakukan tambah data
siswa. Pada Gambar 3.10 dijelaskan Sequence Diagram Input
D. Class Diagram
Class Diagram merupakan bagian dari Entity
Relationship Diagram (ER-D) yang digunakan untuk pemodelan
basis data. Perbedaannya ER-D fokus pada data, sedangkan
class diagram fokus bukan hanya pada data tetapi juga
pemodelan perilaku sistem. Class diagram juga memiliki simbol-
simbol yang digunakan, misalnya (-) adalah sifat private ini
biasanya berisi atribute dari database, (+) adalah sifat public ini
biasanya adalah operasiyang digunakan dalam controller dari
framework yang basisnya mvc, dan dalam sifat public mempunyai
operation_construct dimana berisi data boolean ataupun data
yang dipatenkan. Perancangan Class Diagram dari implementasi
Algoritma Naive Bayes dapat dilihat pada Gambar 3.14
Rumus 3. 1
Rumus 3. 2
di mana:
µ : rata-rata hitung (mean)
xi : nilai sampel ke-i
n : jumlah sampel
3. untuk menghitung nilai simpangan baku (standar deviasi)
dapat diihat pada rumus 3.3:
Rumus 3. 3
σ : standart deviasi
xi : nilai x ke i
µ : rata-rata hitung
n : jumlah sampel
4. Class probabilitas dari teorema Bayes dilihat pada 3.4 :
Rumus 3. 4
P : peluang
Xi : Atribut ke i
xi : nilai atribut ke i
Y : kelas yang dicari
yi : sub kelas Y yang dicari
σ : deviasi standart, menyatakan varian dari seluruh
atribut
µ : mean, menyatakan rata-rata dari semua atribut
Mulai
Pengambilan sample
secara ramdon
Selesai
Mulai
Data latih
Data uji
Mencari probabilitas
Selesai
Tabel 3. 2 Data Latih
MAT FIS MI
MAT MAT FIS BIO KEL
IPA TPA TPA NA
UN TPA 1 TPA 1 TPA AS
2 2 T
60,00 72,50 30,00 30,00 40,00 60,00 40,00 IPA IPA
82,50 82,50 50,00 80,00 100,00 IPA IPA
97,50 87,50 90,00 50,00 70,00 IPA IPA
97,50 92,50 100,00 80,00 80,00 IPA IPA
67,50 67,50 70,00 30,00 30,00 30,00 20,00 IPA IPA
70,00 52,50 20,00 20,00 60,00 50,00 40,00 IPA IPA
97,50 92,50 80,00 80,00 80,00 IPA IPA
97,50 95,00 70,00 90,00 80,00 IPA IPA
77,50 85,00 70,00 90,00 60,00 IPA IPA
90,00 80,00 80,00 80,00 70,00 IPA IPA
97,50 67,50 100,00 70,00 60,00 IPA IPA
92,50 57,50 30,00 30,00 70,00 IPS IPS
87,50 90,00 70,00 70,00 60,00 IPS IPS
97,50 90,00 70,00 70,00 60,00 IPS IPS
47,50 45,00 30,00 30,00 40,00 20,00 50,00 IPA IPS
60,00 52,50 20,00 40,00 40,00 40,00 20,00 IPA IPS
62,50 65,00 20,00 10,00 20,00 30,00 40,00 IPA IPS
42
43
d. Mengitung nilai mean pada atribut Nilai Fisika TPA kelas IPA
k. Mengitung nilai mean pada atribut Nilai Fisika TPA kelas IPS
Tabel 3. 3 Mean
Menghitung probabilitas
Tabel 3. 5 Probablitas
kelas nilai
Kelas IPA 0,65
Kelas IPS 0,35
MAT MAT
Kelas IPA UN FIS TPA BIO TPA KELAS
UN TPA
IPA 0,09945 0,08028 0,07335 0,07572 0,06363 1,82573E-08
IPS 0,00012 0,00023 0,01976 0,01816 0,00294 1,01797E-14
Nama Spesifikasi
Prosesesor Amd E-300 APU with AMD Radeon(tm) HD
Grapich 1.30Ghz
LCD 14 Inch
Hardisk 300 GB
RAM 2 GB
55
56
Nama Spesifikasi
Prosesesor Amd E-300 APU with AMD Radeon(tm) HD
Grapich 1.30Ghz
LCD 14 Inch
Hardisk 300 GB
RAM 2 GB
57
Pengujian Login
Penguji : Bayu Aji Prasetyo
Tanggal : 18 Mei 2020
Tujuan : untuk menguji fungsi login
Pengujian login
Skenario Data masukan Yang Pengamatan Ket
diharapkan
Skenario 1 User:admin User Login ok
Username Pass:admin ditemukan berhasil
dan
password
benar
Skenario 2 User:admin User tidak Login gagal ok
Pass:admin ditemukan
Gambar 4. 13 data_hitung
Gambar 4. 14 data_latih
Gambar 4. 15 data_uji
Gambar 4. 17 hitung_uji
Gambar 4. 18 user
BAB 5
PENUTUP
5.1 Kesimpulan
73
5.2 Saran
74
DAFTAR PUSTAKA
75
Saleh, A. (2015). Implementasi Metode Klasifikasi Naive
Bayes Dalam Memprediksi Besarnya Penggunaan
Listrik Rumah Tangga. Citec Journal, 2(3), 207-217.
Sambani, E. B. (2017). Penerapan Algoritma C4.5 Untuk
Klasifikasi Pola Penjurusan di Sekolah Menengah
Kejuruan (SMK) Kota Tasikmalaya. CSRID, 9(3), 149-
157.
Sembiring, M. A., Sibuea, F. L., & Sapta, A. (2018). Analisis
Kinerja Algoritma C.45 Dalam Memprediksi Hasil
Belajar. Journal of Science and Sosial Research, 1(1),
73-79.
Simarmata, J. (2010). Rekayasa Perangkat Lunak.
Yogyakarta: Andi.
Yasin, V. (2012). Rekayasa Perangkat Lunak Berorientasi
Objek Pemodelan Arsitektur dan Perancangan
(Modeling, Architecture and Design). Jakarta: Mitra
Wacana Media.
76
77
LAMPIRAN