Combinepdf+ (3) Compressed+

PENERAPAN DATA MINING UNTUK PREDIKSI
KELULUSAN SISWA MENGGUNAKAN ALGORITMA

NAÏVE BAYES PADA SMA NEGERI 2 SUKATANI
SKRIPSI
Di susun untuk memenuhi sebagian persyaratan mencapai
derajat sarjana S1 pada jurusan teknik informatika
Oleh :
NURDIANA SAFITRI
311410728
TEKNIK INFORMATIKA
SEKOLAH TINGGI TEKNOLOGI PELITA BANGSA
BEKASI
2018
PERSETUJUAN
SKRIPSI
JUDUL SKRIPSI PENERAPAN DATA MINING UNTUK PREDIKSI
KELULUSAN SISWA MENGGUNAKAN ALGORITMA NAÏVE
BAYES PADA SMS NEGERI 2 SUKATANI
Yang disusun oleh
NURDIANA SAFITRI
telah disetujui oleh Dosen Pembimbing Skripsi

pada tanggal 28 Oktober 2018
Dosen Pembimbing 1 Dosen Pembimbing 2
ANDRI FIRMANSYAH, S.Kom, M.Kom ADI RUSDI., S.T., M.T.

NIDN: 0401127203 NIDN: 0415096901
Mengetahui
Kaprodi Teknik Informatika
Aswan S. Sunge, S.E., M.Kom

NIDN : 0426018003
i
PENGESAHAN
SKRIPSI
JUDUL SKRIPSI PENERAPAN DATA MINING UNTUK PREDIKSI

KELULUSAN SISWA MENGGUNAKAN ALGORITMA NAÏVE
BAYES PADA SMS NEGERI 2 SUKATANI
Yang disusun oleh
NURDIANA SAFITRI
telah dipertahankan di depan Dewan Penguji

pada tanggal ……………..
Susunan Dewan Penguji
Nama Penguji Tanda Tangan
Nama dan gelar penguji 1 __________________
Nama dan gelar penguji 2 __________________
Mengetahui
Kaprodi Teknik Informatika
Aswan S. Sunge, S.E., M.Kom

NIDN : 0426018003
ii
PERNYATAAN KEASLIAN PENELITIAN
Saya yang bertandatangan dibawah ini menyatakan bahwa, skripsi ini merupakan
karya saya sendiri (ASLI), dan isi dalam skripsi ini tidak terdapat karya yang
pernah diajukan oleh orang lain untuk memperoleh gelar akademis di suatu
institusi pendidikan tinggi manapun, dan sepanjang pengetahuan saya juga tidak
terdapat karya atau pendapat yang pernah ditulis dan/atau diterbitkan oleh orang
lain, kecuali yang secara tertulis diacu dalam naskah ini dan disebutkan dalam
daftar pustaka.
Segala sesuatu yang terkait dengan naskah dan karya yang telah dibuat adalah
menjadi tanggungjawab saya pribadi.
Bekasi, ………………
Materai 6.000
NURDIANA SAFITRI
NIM: 311410728
iii
KATA PENGANTAR
Puji syukur penulis panjatkan ke hadiran Allah SWT. yang telah melimpahkan
segala rahmat dan hidayah-Nya, sehingga tersusunlah Skripsi yang berjudul
“PENERAPAN DATA MINING UNTUK PREDIKSI KELULUSAN SISWA
MENGGUNAKAN ALGORITMA NAÏVE BAYES PADA SMA NEGERI 2
SUKATANI
”.
Skripsi tersusun dalam rangka melengkapi salah satu persyaratan dalam

rangka menempuh ujian akhir untuk memperoleh gelar Sarjana Komputer
(S.Kom.) pada Program Studi Teknik Informatika di Sekolah Tinggi Teknologi
Pelita Bangsa.
Penulis sungguh sangat menyadari, bahwa penulisan Skripsi ini tidak akan
terwujud tanpa adanya dukungan dan bantuan dari berbagai pihak. Sudah
selayaknya, dalam kesempatan ini penulis menghaturkan penghargaan dan ucapan
terima kasih yang sebesar-besarnya kepada:
1. Bapak Dr. Ir. Suprianto, M.P selaku Ketua STT Pelita Bangsa
2. Bapak Aswan S. Sunge, S.E., M.Kom selaku Ketua Program Studi Teknik
Informatika STT Pelita Bangsa.
3. Bapak Andri Firmansyah, S.Kom., M.Kom selaku Pembimbing Utama yang
telah banyak memberikan arahan dan bimbingan kepada penulis dalam penyusunan
Skripsi ini.
4. Seluruh Dosen STT Pelita Bangsa yang telah membekali penulis dengan
wawasan dan ilmu di bidang teknik informatika.
5. Seluruh staf STT Pelita Bangsa yang telah memberikan pelayanan terbaiknya
kepada penulis selama perjalanan studi jenjang Strata 1.
6. Rekan-rekan mahasiswa STT Pelita Bangsa, khususnya angkatan 2014, yang
telah banyak memberikan inspirasi dan semangat kepada penulis untuk dapat
menyelesaikan studi jenjang Strata 1.
7. Ibu dan Ayah tercinta yang senantiasa mendo’akan dan memberikan
semangat dalam perjalanan studi Strata 1 maupun dalam kehidupan penulis.
iv
Akhir kata, penulis mohon maaf atas kekeliruan dan kesalahan yang terdapat
dalam Skripsi ini dan berharap semoga Skripsi ini dapat memberikan manfaat bagi
khasanah pengetahuan Teknologi Informasi di lingkungan STT Pelita Bangsa
khususnya dan Indonesia pada umumnya.
Bekasi, April 2018
Penulis
DAFTAR ISI
HALAMAN JUDUL ....................................................................................................................... i
LEMBAR PERSETUJUAN .......................................................................................................... ii
LEMBAR PENGESAHAN ........................................................................................................... iii
SURAT PERNYATAAN KEASLIAN SKRIPSI ........................................................................ iv
SURAT PERNYATAAN PUBLIKASI KARYA ILMIAH ......................................................... v
MOTTO DAN PERSEMBAHAN ................................................................................................ vi
KATA PENGANTAR ................................................................................................................... vii
ABSTRAK ..................................................................................................................................... ix
DAFTAR ISI ............................................................................................................................. ..... xi
DAFTAR TABEL ........................................................................................................................ xv
BAB 1 PENDAHULUAN ............................................................................................................... 1
1.1 Latar Belakang Penelitian ……….………………………………………..……...……..1
1.2 Identifikasi masalah ...…………...…………………………………………..…………..3
1.3 Rumusan Masalah………...……………………………………………………………..3
1.4 Batasan Masalah…...…………………………………………………………………....4
1.5 Manfaat dan Tujuan Penelitian………………………………………………………….4
1.5.1 Manfaat Penelitian………………………………………………………….....4
1.5.2 Tujuan Penelitian……………………………………………………………...5
1.6 Metodologi Penelitian………………………………………………………………….5

1.6.1 Metode Liniatur……………………………………………………………….6
1.6.2 Metode Pengumpulan Data………………………………………………….6
1.7 Sistematika Penulisan………………………………………………………………….6
BAB II TINJAUAN PUSTAKA………..………………………………………………………8
2.1 Tinjauan Studi………………………………………………………………………….8
2.2 Tinjauan Pustaka……………………………………………………………………...12
2.2.1 Penjurusan Siswa………………………………………………………………12
2.2.2 Data Mining……………………………………………………………………13
2.2.2.1 Tahap – Tahap Data Mining …………………………………………...14
2.2.3 CRISP-DM…………………………………………………………………….18
2.2.4 Klasifikasi……………………………………………………………………...21
2.2.5 Algoritma Naïve Bayes………………………………………………………...21
2.2.6 Rapid Miner……………………………………………………………………24
2.2.7 Microsoft Excel………………………………………………………………..24
2.3 Kerangka Pemikiran………………………………………………………………….26
BAB III METODOLOGI PENELITIA……………………………………………………...27
3.1 Tempat dan Waktu Penelirian………………………………………………………...27
3.1.1 Sejarah Sekolah………………………………………………………………..27
3.1.2 Visi dan Misi Sekolah…………………………………………………………28
3.2 Alat Penelitian………………………………………………………………………..29

3.2.1 Perangkat Keras……………………………………………………………….29
3.2.2 Perangkat Lunak………………………………………………………………..29
3.3 Alur Penelitian………………………………………………………………………....30
3.4 Metodologi Data Mining………………………………………………………………32
3.4.1 Permasalahan Bisnis…………………………………………………………….32
3.4.2 Tujuan Data Mining…………………………………………………………….32
3.5 Pemahaman Data………………………………………………………………………33
3.6 Pembersih Data………………………………………………………………………...34
3.7 Transformasi Data……………………………………………………………………..34
3.8 Implementasi…………………………………………………………………………..35
3.9 Analisis Data…………………………………………………………………………..35
BAB IV HASIL DAN PEMBAHASAN……….………………………………………………36
4.1 Pengujian Hasil dan Validasi…………………………………………………………..36
4.1.1 Data Keseluruhan……………………………………………………………….36
4.2 Seleksi Data……………………………………………………………………………37
4.3 Pembersih Data………………………………………………………………………...37
4.4 Transformasi Data……………………………………………………………………..38
4.5 Implementasi ………………………………………………………………………….40
4.6 Pengujian Rapid Miner ………………………………………………………………..42

4.7 Algoritma Naïve Bayes………………………………………………………………..53
BAB V PENUTUP…………………………….………………………………………………..57
5.1 Kesimpulan ……………………………………………………………………………57
5.2 Saran…………………………………………………………………………………...57
DAFTAR PUSTAKA………………………………………………………………………...xviii
LAMPIRAN………………………………...………………………………………………...xviii
DAFTAR TABEL
Tabel 2.1. Ringkasan Penelitian .................................................................................................................... 11

Tabel 3.1, Jumlah Siswa Perombelnya………………………………………………………….33
Tabel 3.2, Data Siswa Penjurusan………………………………………………………………34
Tabel 4.1, Data Keseluruhan……………………………………………………………………36
Tabel 4.2, Transformasi Data……………………………………………………………...……38
Tabel 4.3, Inisialisasi IPK……………………………………………………………………….39
Tabel 4.4, Inisialisasi Mapel…………………………………………………………………….39
Tabel 4.5, Data yang Sudah diinisialisasi……………………………………………………….40
Tabel 4.6, Data Training………………………………………………………………………...41
Tabel 4.7, Data Testing..………………………………………………………………………...41
Tabel 4.8, Data Rombel Siswa……………………………………………………………….....54
Tabel 4.9, Data Training………………………………………………………………………...54
Tabel 4.10, Data Training……………………………………………………………………….55
DAFTAR GAMBAR
Gambar 2.1. Tahapan Data Mining……………………………………………………………..15

Gambar 2.2. Siklus Hidup CRIPS-DM…………………………………………………………19
Gambar 2.3. Blok Diagram Model Klasifikasi…………………………………………………21
Gambar 2.4. Kerangka Pemikiran………………………………………………………………26
Gambar 3.1. Struktur Organisasi SMA Negeri 2 Sukatani……………………………………..28
Gambar 3.2. Alur Penelitian……………………………………………………………………30
Gambar 4.1. UI Rapid Miner…………………………………………………………………...42
Gambar 4.2 Memasukan Data Training ke Sofware rapidminer……………………………….43
Gambar 4.3 Import data Ke Rapid Miner………………………………………………………44
Gambar 4.4 Import Data Mining Steep 3……………………………………………………….45
Gambar 4.7 File Read CVS …………………………………………………………………….48
Gambar 4.8 Menghubungkan Operator Performance…………………………………………..49
Gambar 4.9 Menjalankan Rapid Miner…………………………………………………………49
Gambar 4.10 Hasil Perhitungan………………………………………………………………...50
Gambar 4.11 Accuracy…………………………………………………………………………51
Gambar 4.12 Accuracy…………………………………………………………………………51
Gambar 4.13 Grafik Scener…………………………………………………………………….52
Gambar 4.14 Cross Validation……………………………………………………………….....53
Gambar 4.15 Menjalankan Rapid Miner………………………………………………………..54
Gambar 4.16 Hasil Shuffled Sampling………………………………………………………….54
Gambar 4.17 Xvalidation Numerical…………………………………………………………...55
BAB 1
PENDAHULUAN
1.1 Latar Belakang Penelitian
Pendidikan merupakan faktor utama dalam pembentukkan pribadi
manusia. Pendidikan sangat berperan dalam membentuk baik atau buruknya
pribadi manusia. Dengan hal tersebut, pemerintah sangat serius menangani
bidang pendidikan, sebab dengan sistem pendidikan yang baik diharapkan
muncul generasi penerus bangsa yang berkualitas dan mampu menyesuaikan
diri untuk hidup bermasyarakat, berbangsa dan bernegara.
Perkembangan zaman pada saat ini terus berkembang pesat, oleh karena
itu pesatnya informasi tentang teknologi seperti contohnya komputer yang
semakin berkembang baik fisik ataupun spesifikasi dari komputer itu sendiri.
Maka dari itu komputer sudah menjadi penunjang bagi setiap perusahaan untuk
membantu para pegawai dalam mengerjakan tugasnya dengan begitu adanya
efisiensi dari segi waktu.
Berdasarkan berlimpah nya data siswa – siswi dan data nilai akademik,
informasi tersembunyi dapat diketahui dengan cara pengelolahan terhadap data
tersebut sehingga berguna bagi pihak sekolah. Pengelolahan data siswa – siswi
perlu dilakukan untuk mengetahui informasi penting berupa pengetahuan baru,
misalnya informasi mengenai pengklasifikasian data siswa – siswi berdasarkan
profil dan data akademik.
1
2
Pengetahuan baru tersebut dapat membantu pihak sekolah untuk melakukan
klasifikasi mengenai prediksi kelulusan siswa – siswi pada tahun berikutnya.
SMA Negeri 2 Sukatani pada tahun 2018 sudah memiliki siswa – siswi
sebanyak 1600 siswa dengan jumlah lulusan 360 pertahunnya. Jumlah tersebut
sudah tidak kecil lagi bagi sekolah yang sudah berusia 7 tahun ini, sekolah ini
tentu memiliki segudang data mengenai siswanya meliputi: data induk siswa
dan data kelulusan siswa. Bertumpuknya data-data ini tentu belum digunakan
secara optimal padahal tumpukan-tumpukan data tersebut dapat dijadikan suatu
informasi yang sangat berharga. Terkadang keperluan akan informasi yang
tinggi tetapi tidak diimbangi dengan penyajiannya. Pemanfaatan informasi
dapat membantu dalam pengambilan keputusan dengan menganalisa
informasi-informasi yang ada. Dengan adanya gudang data yang semakin
banyak maka akan dapat banyak juga menggali potensi-potensi informasi.
Untuk membantu dalam menemukan informasi-informasi berharga itu
diperlukan teknik data mining.
Data mining adalah teknik untuk menemukan dan mendeskripsikan pola-
pola yang ada dalam data sebagai sebuah alat untuk membantu menjelaskan
data tersebut dan membuat prakiraan dari data itu (Witten & Eibe Frank,
2005).
Teknik data mining dengan metode Naive Bayes ini dapat membantu
menemukan informasi tentang kelulusan siswa sehingga dapat membantu
pihak sekolah dalam mencari solusi dan kebijakan untuk meningkatkan
prestasi siswa supaya dapat menyelesaikan studinya dengan tepat waktu.

3
1.2 Identfikasi Masalah
Identifikasi masalah secara umum adalah segala sesuatu yang menjadi
obyek permasalahan yang akan diteliti dengan mempersiapkan alat dan metode
pengumpulan data dan pengolahan data.
Sedangkan rumusan masalah secara umum adalah segala sesuatu
permasalahan yang dihadapi oleh instansi, badan usaha, atau perusahaan
tersebut dan dengan permasalahan tersebut harus bisa ditindak lanjuti demi
tercapainya suatu tujuan instansi, badan usaha, atau perusahaan.
Dari latar belakang masalah yang ada diatas, terdapat beberapa kendala
yang terjadi dalam prediksi kelulusan yang sedang berjalan. adapaun
identifikasi masalahnya adalah sebagai berikut :
8. Belum diterapkannya cara untuk prediksi kelulusan siswa.
9. Siswa yang malas belajar akan menghasilkan nilai yang rendah.
1.3 Rumusan Masalah
Permasalahan yang dibahas dalam penelitian ini adalah
1. Bagaimana mengetahui atau memprediksi kelulusan SMA
Negeri 2 Sukatani menggunakan metode Naive Bayes.
2. Apakan dengan menggunakan metode ini adalah cara yang
efektif?
4
1.4 Batasan Masalah
Pada penelitian ini memiliki batasan-batasan agar tidak menyimpang
dari tujuan pembahasan semula, diantaranya sebagai berikut :
1. Hanya menyajikan informasi tentang ketepatan waktu kelulusan
siswa dalam menempuh studi di SMA Negeri 2 sukatni.
2. Dalam memprediksi atau menemukan pola penulis menggunakan
metode Naive Bayes.
3. Dalam penelitian juga hanya menggunakan beberapa atribut meliputi :
a) Gender : Pria dan Wanita.
b) Jurusan asal sekolah : MIPA dan IPS.
c) Menggunakan nilai Ujian Nasional.
1.5 Manfaat dan Tujuan Penelitian
Maksud dari penelitian ini adalah :
1.5.1 Manfaat Penelitian
Adapun beberapa manfaat yang diharapkan pada penelitian ini adalah:
1. Bagi Penulis
Penulis dapat menerapkan ilmu-ilmu yang diperoleh selama kuliah
salah satunya teknik data mining dalam penelitian ini, serta sebagai
syarat dalam memenuhi tugas akhir jenjang Strata SI.

5
2. Bagi Pembaca
Dapat dijadikan bahan referensi, menambah pengetahuan dan
wawasan pembaca tentang informasi-informasi dalam pembuatan
karya ilmiah.
3. Bagi Kampus Pelita Bangsa.
Dari penelitian ini diharapkan dapat menyajikan informasi tentang
Kelulusan siswa dan mengetahui faktor lain yang dapat
mempengaruhi kelulusan siswa. Sehingga program studi dapat
untuk mengambil kebijakan-kebijakan untuk meningkatkan prestasi
siswa supaya dapat menyelesaikan studinya dengan tepat waktu.
Jika program stadi memiliki lulusan-lulusan terbaik dan dapat lulus
dengan tepat waktu, maka secara otomatis akan dapat membantu
dalam meningkatkan nilai akreditasi sekolah tersebut. Selain itu
Sekolah juga dapat mempromosikan di daerah-daerah yang
mayoritas siswa yang berprestasi.
1.5.2 Tujuan Penelitian
Berdasarkan uraian masalah diatas maka tujuan penelitian ini
adalah tujuan dari penelitian ini adalah malihat jumlah peluang
siswa yang lulus dari sman 2 Suktani.
1.6 Metodologi Penelitian
Dalam melakukan penelitian ini, penulis menggunakan
bebrapa metode.
6
Metode yang digunakan terdiri dari :
1.6.1 Metode Literatur
Dalam penelitian ini penulis penggunakan metode dengan cara
mencari dan mengumpulkan data melalui sumber bacaan atau
literatur seperti jurnal, ebook, serta buku yang berhubungan
dengan Laporan Akhir yang dibuat.
1.6.2 Metode Pengumpulan Data (Survey)
Metode pengumpulan data dilakukan dengan cara melakukan
observasi lapangan. Mengumpulkan data yang ada dilapangan
dengan cara meminta data nilai rapor dan nilai hasil ujian pada
sekolah yang menggunakan penerapan data mining
menggunakan algoritma naïve bayes untuk mendapatkan hal-
hal yang dibutuhkan selama proses pendataan tersebut.
1.7 Sistematika Penulisan
Sistematika penulisan yang diterapkan untuk menyajikan
gambaran singkat mengenai permaslahan yang akan dibahas dalam
penulisan ini, sehingga akan memperoleh gambaran yang jelas tentang
isi dari penulisan,diantaranya :

7
BAB I PENDAHULUAN
Pada bab ini mendeskripsikan mengenai latar belakang
permasalahan, rumusan masalah, batasan masalah, tujuan
penelitian, manfaat penelitian, dan sistematika penulisan.
BAB II TINJAUAN PUSTAKA
Pada bab ini berisi mengenai telaah penelitian dan landasan
teori. Telaah penelitian merupakan menganalisa hasil-hasil
penelitian terdahulu yang dapat digunakan untuk sumber
refrensi. Sedangkan landasan teori merupakan definisi atau
penjabaran suatu teori yang dapat mendukung penelitian ini.
BAB III METODOLOGI PENELITIAN
Pada bab ini menjelaskan tentang analisis metode yang akan
digunakan untuk menyelesaikan rumusan masalah dalam
penelitian ini.
BAB IV HASIL DAN PEMBAHASAN
Pada bab ini berisi hasil dan analisa pengujian program untuk
diuji dan realisasikan.
BAB V PENUTUP
Bab ini berisi tentang kesimpulan dari penelitian tersebut dan
saran-saran yang ditujukan kepada semua pihak yang
bersangkutan.
BAB II
TINJAUAN PUSTAKA
2.1 Tinjauan Studi

Sebelum melakukan penelitian penulis terlebih dahulu melakukan
tinjauan pustaka dari penelitian lain dan penelitian tentang prediksi
penjurusan sekolah menengah atas ini bukanlah penelitian yang pertama
kalinya. Sebelumnya sudah ada penelitian yang membahas mengenai
klasifikasi penjurusan sekolah menengah atas menggunakan metode
algoritma Naive Bayes. Berikut adalah beberapa penelitian yang terkait
dengan masalah tersebut.
Penelitian yang pertama adalah penelitian yang dilakukan oleh
Claudia Clarentina Ciptohartono yang berjudul “Algoritma Klasifikasi
Naive Bayes untuk Menilai Kelayakan Kredit” [7]. Metode yang digunakan
pada penelitian ini adalah Algoritma Naive Bayes. Data yang digunakan
adalah data dari nasabah perusahaan BCA Finance Jakarta tahun 2013. Tool
yang digunakan untuk implementasi sistem adalah matlab. Penelitian ini
menghasilkan bukti bahwa algoritma Naive Bayes bisa diterapkan dalam
pemberian kelayakan kredit pada BCA Finance Jakarta. Tahap pengolahan
data awal dapat menghasilkan akurasi yang tinggi dan menghasilkan akurasi
akhir yang Excellent. Dalam penelitian kelayakan kredit ini pada data awal
dengan melakukan pre-processing mendapatkan akurasi sebesar 85.57%,
tetapi jika data awal dilakukan pengolahan dan dengan melakukan pre-
processing dapat menghasilkan akurasi sebesar 92.53%. Jadi Algoritma
Naive Bayes akan lebih unggul dalam pemberian penilian kelayakan kredit
jika dilakukan proses pengolahan data awal, meskipun algoritma Naive
Bayes adalah algoritma yang sanggup menangani data yang hilang.
Penelitian yang kedua adalah penelitian yang dilakukan oleh Arief
Jananto. Penelitian yang berjudul “Algoritma Naive Bayes untuk Mencari
Perkiraan Waktu Studi Mahasiswa” [8]. Metode yang digunakan pada
8
9
penelitian ini adalah Algoritma Klasifikasi Naive Bayes. Data yang

diperoleh adalah data yang berkaitan dengan keterangan diri dari mahasiswa
UNISBANK dan data nilai semua mata kuliah mahasiswa lulusan tahun
2004-2007. Kesimpulan dari penelitian tersebut adalah sebagai berikut :
a. Ketepatan masa studi mahasiswa diprediksi berdasarkan latar
belakang sekolah sebelumnya dan data akademik, serta pribadi saat
berada diperguruan tinggi.
3. Dalam memprediksi ketepatan studi mahasiswa menggunakan data
training dan testing dengan memanfaatkan fungsi prediksi dari
teknik data mining yaitu menggunakan algoritma klasifikasi Naive
Bayes.
4. Fungsi klasifikasi yang digunakan dalam prediksi ketepatan masa
studi mahasiswa ini mempunyai tingkat kesalahan sebesar 20%
sampai 34%, kesalahan tersebut dapat dipengaruhi oleh jumlah data
training dan testing serta tingkat konsistensi data yang digunakan.
Penelitian yang ketiga adalah peneltian yang dilakukan oleh Yuda
Septian Nugroho. Penelitian yang berjudul “Data Mining Menggunakan
Algoritma Naive Bayes untuk Klasifikasi Kelulusan Mahasiswa Universitas
Dian Nuswantoro” [9]. Teknik yang digunkan merupakan teknik klasifikasi
dan menggunakan algoritma Naive Bayes, tujuan dari penelitian tersebut
adalah mengklasifikasi kelulusan mahasiswa Udinus Fakultas Ilmu
Komputer angkatan tahun 2009. Hasil dari penelitian ini dengan
menggunakan metode klasifikasi Naive Bayes dan dataset berupa data
mahasiswa Universitas Dian Nuswantoro Fakultas Ilmu Kompur angkatan
tahun 2009, mendapatkan hasil akurasi kelulusan sebesar 82.08%. Data
yang kurang kompleksitas menyebabkan model dapat memprediksi cukup
akurat.
Penelitian yang ketiga adalah penelitian yang dilakukan Faid Ari
Prastya yang berjudul “Penerapan Algoritma C4.5 Untuk Prediksi Jurusan
Siswa SMAN 3 Rembang”[10]. Algoritma yang digunakan pada penelitian
ini adalah Algoritma C4.5. Data yang digunakan adalah data siswa SMAN 3
10
Rembang tahun ajaran 2014/2015. Berdasarkan hasil pengujian

menggunakan algoritma C4.5 didapat akurasi ketepatan hasil prediksi
sebesar 74,65%. Dengan jumlah true positif (tp) sebanyak 107 record, false
positif (fp) sebanyak 34 record. Jumlah true negative (tn) sebanyak 108
record dan jumlah false negative (fn) sebanyak 39 record. Jadi klasifikasi
data siswa baru Sekolah Menengah Atas Negeri 3 Rembang Tahun Ajaran
2014 / 2015 dengan algoritma C4.5 bisa menjadi pendukung keputusan yang
digunakan oleh pihak Sekolah Menengah Atas Negeri 3 Rembang dalam
proses penetuan jurusan siswa.
Penelitian yang terakhir adalah penelitian yang dilakukan Dina

Maurina yang berjudul “Penerapan data mining untuk rekomendasi
beasiswa pada sma muhammadiyah menggunakan algoritma C4.5”[11].
Pada penelitian ini, penerapan algoritma klasifikasi C4.5 telah
diimplementasikan menggunakan bahasa pemrograman PHP. Dibawah ini
merupakan hasil implementasinya. Dari hasil yang di dapatkan, untuk data
training dan data testing 80%:20% yaitu data training sebanyak 88 dan data
testing sebanyak 22, mendapatkan akurasi yang cukup baik yaitu 77%,
precision 83%, recall 55%, dan FMeasure 66%. Penerapan metode pohon
keputusan terhadap data siswa SMA Muhammadiyah Gubug memiliki
tingkat akurasi yang cukup baik dalam menyelesaikan klasifikasi
rekomendasi beasiswa, dengan demikian metode pohon keputusan
merupakan metode yang cukup sesuai untuk penyelesaian studi kasus dalam
pemilihan siswa yang mendapatkan rekomendasi beasiswa. Tingkat akurasi
yang dihasilkan oleh metode tersebut adalah 77%.
11
Tabel 2.1 : Ringkasan Penelitian
Peneliti Judul Metode Tahun

Claudia Clarentia Algoritma Klasifikasi Algoritma Naïve 2014
Ciptohartono Naive Bayes Untuk Bayes Classifier
Menilai Kelayakan
Kredit
Arief Jananto Algoritma Naive Algoritma Naive 2013
Bayes untuk Mencari Bayes
Perkiraan Waktu Studi
Mahasiswa
Yuda Septian Data Mining Algoritma Naive 2014
Nugroho Menggunakan Bayes
Algoritma Naive bayes
Untuk Klasifikasi
Kelulusan Mahasiswa
Universitas Dian
Nuswantoro
Faid Ari Prastya Penerapan Algoritma Algoritna C4.5 2015
C4.5 Untuk Prediksi
Jurusan Siswa SMAN
3 Rembang
Penerapan data mining
Dina Maurina untuk Algoritma Naive
rekomendasi beasiswa
pada Bayes
beasiswa pada
menggunakan
algoritma C4.5
Tabel 2.1 : Ringkasan Penelitian

12
Berikut adalah perbedaan penelitian yang penulis teliti

dengan penelitian sebelumnya adalah :
3. Data yang digunakan oleh penulis dalam penelitian ini adalah data
siswa SMA Negeri 2 Sukatani Tahun Ajaran 2017/2018 yang
menggunakan kurikulum 2013.
4. Data yang dianalisa dan diproses oleh penulis akan dijadikan untuk
klasifikasi kelulusan siswa di SMAN 2 Sukatani dengan parameter
yang digunakan berupa data nilai Ujian Nasional dan Nilai Ujian
Sekolah.
5. Metode yang digunakan penulis dalam penelitian ini adalah
algoritma klasifikasi Naive Bayes, yang digunakan untuk
mengklasifikasi kelulusan di SMA Negeri 2 Sukatni . Untuk melihat
tingkat keakurasian data yang diteliti penulis menggunakan tools
Rapidminer untuk mengolah data dalam klasifikasi kelulusan siswa
SMA Negeri 2 Sukatani.
2.2 Tinjauan Pustaka
2.2.1 Penjurusan Siswa

Peminatan siswa adalah proses dalam pengambilan keputusan
dan pilihan oleh siswa dalam bidang keahlian yang didasarkan atas
pemahaman potensi diri dan peluang yang ada. Dalam konteks ini,
bimbingan dan konseling membantu siswa untuk memahami diri,
menerima diri, mengarahkan diri, mengambil keputusan diri,
merealisasikan keputusannya secara bertanggung jawab.
Implementasi kurikulum 2013 akan dapat menimbulkan masalah
bagi siswa SMA/MA dan SMK yang tidak mampu dalam
menetapkan pilihan peminatan, baik pemintaan kelompok mata
pelajaran, peminatan lintas mata pelajaran maupun pendalaman mata
13
pelajaran secara tepat, sehingga akan menimbulkan kesulitan dan

kecenderungan gagal dalam belajar [11].
Penetapan pilihan peminatan kelompok mata pelajaran,
pemintaan lintas mata pelajaran, dan pemintan pedalaman materi
mata pelajaran harus sesuai dengan kecerdasan, bakat, minat dan
kecenderungan pilihan masing-masing siswa agar proses belajar
berjalan dengan baik dan berhasil dalam belajar. Oleh karena itu
peminatan sangat diperlukan bagi siswa agar dapat menetapkan
pilihan peminatan sesuai kemampuan potensi yang dimilikinya dan
kemungkinan berhasil dalam belajar.
2.2.2 Data Mining

Data mining merupakan proses penggunaan teknik statistik,
matematika, artificial intelligence (kecerdasan buatan) dan machine
learning yang digunakan untuk mengekstrak serta mengidentifikasi
informasi yang bermanfaat dan pengetahuan yang terkait dari
berbagai database besar [12].
Berikut merupakan karakteristik dari data mining :
4. Data mining berhubungan dengan penemuan sesuatu
yang tersembunyi dan pola data tertentu yang belum
diketahui sebelumnya.
5. Data mining dapat menggunakan data yang sangat besar.
Data yang sangat besar biasanya digunakan untuk
membuat hasil data mining yang lebih terpercaya.
6. Data mining berguna untuk membuat suatu
keputusan yang kritis, terutam dalam hal strategi.
Data mining mempunyai beberapa teknik berdasarkan tugas

yang dilakukan dan setiap teknik mempunyai algoritma masing-
14
masing. Berikut adalah teknik dalam data mining yang terbagi menjadi
enam kategori [9] :
2. Deskripsi
Para peneliti biasanya mencoba menemukan cara untuk
mendeskripsikan pola dan trend yang tersembunyi dalam data.
3. Estimasi
Teknik estimasi ini mirip dengan teknik kasifikasi, kecuali variabel
tujuan lebih kearah numerik dari pada kategori.
4. Prediksi
Prediksi memiliki kemiripan dengan estimasi dan klasifikasi. Namun
prediksi hasilnya menunjukan sesuatu yang belum pernah terjadi atau
mungkin terjadi dimasa depan.
5. Klasifikasi
Dalam klasifikasi variabel, tujuan bersifat kategorik. Contoh, kita akan
mengklasifikasi penghasilan dalam tiga kelas, yaitu penghasilan tinggi,
penghasilan sedang dan penghasilan rendah.
6. Klastering
Klastering lebih ke arah pengelompokan record, pengamatan dan kasus
dalam kelas yang memiliki kemiripan.
7. Asosiasi
Asosiasi mengidentifikasi hubungan antara berbagai peristiwa yang
terjadi pada satu waktu.
2.2.2.1 Tahap-tahap Data Mining

Data mining dapat dibagi menjadi beberapa tahap, Tahap
data mining dilakukan sebagai suatu rangkaian proses. Tahap-
tahap tersebut bersifat interaktif dimana pemakai terlibat langsung
atau dengan perantaraan knowledge base [13]. Berikut adalah
tahap-tahap dalam data mining :
15
Gambar 2.1 : Tahapan Data Mining
Keterangan:
4. Pembersihan Data
Pembersihan data dilakukan untuk menghilangkan noise dan data yang
tidak konsisten atau tidak relevan. Sering kali data yang diperoleh dari
database suatu perusahaan maupun diperoleh melalui hasil eksperimen,
memiliki isian-isian data yang tidak lengkap seperti data yang hilang,
tidak valid dan atau hanya salah ketik. Selain itu terdapat atribut-atribut
data yang tidak relevan dengan
16
hipotesa data mining yang dimiliki. Data-data yang tidak

relevan lebih baik dibuang dan tidak digunakan dalam
proses. Pembersihan data akan mempengaruhi
performasi dari teknik data mining. Karena data yang
diproses akan berkurang jumlah dan kompleksitasnya.
2. Integrasi Data
Integrasi data merupakan penggabungan data dari
berbagai database ke dalam satu database yang baru.
Data yang digunakan dalam data mining tidak hanya
didapatkan dari satu database namun juga didapatkan
dari beberapa database atau file teks. Integrasi data dapat
dilakukan pada atribut-atribut yang mengidentifikasikan
entitas-entitas yang unik seperti atribut nama, jenis
produk, nomer pelanggan dan lainya. Dalam melakukan
integrasi data harus dilakukan dengan cermat agar hasil
tidak menyimpang dan menyesatkan pengambilan aksi
nantinya. Sebagai contoh bila integrasi data berdasarkan
jenis produk namun menggabungkan produk dari
kategori yang berbeda, maka akan didapatkan korelasi
antar produk yang sebenarnya tidak ada. Dalam
melakukan integrasi data diperlukan transformasi dan
pemberisihan data dikarenakan sering kali data dari dua
database berbeda cara penulisannya dan bahkan data
yang ada disatu database tidak ada di database lainya.
3. Seleksi Data
Tidak semua data yang ada dalam database dipakai, oleh
sebab itu hanya data yang sesuai akan diambil untuk
dianalisa. Sebagai contoh sebuah kasus yang meneliti
faktor kecenderungan orang membeli dalam kasus
market basket analisis, tidak perlu mengambil nama
pelanggan, tetapi cukup dengan id pelanggan.
17
4. Transformasi Data
Beberapa teknik data mining memerlukan format data yang khusus
sebelum dapat diaplikasikan. Sebelum diproses dalam data mining
data akan diubah dan di digabungkan ke dalam format yang
sesuai. Beberapa metode data mining memerlukan format data
khusus agar dapat diaplikasikan. Sebagai contoh beberapa metode
standar seperti analisis asosiasi dan clustering hanya bisa
menerima input data kategorikal. Karenanya data berupa angka
numerik yang berlanjut perlu dibagi-bagi menjadi beberapa
interval. Dalam proses ini sering disebut transformasi data.
Transformasi dan pemilihan data ini menentukan kualitas dari
hasil data mining nantinya, karena ada beberapa karakteristik
teknik data mining tertentu yang tergantung pada tahap ini.
5. Proses Mining
Tahap ini merupakan proses utama saat metode
diterapkan untuk menemukan informasi atau
pengetahuan yang berharga dan tersembunyi dari data.
6. Evaluasi Pola
Untuk mengidentifikasi pola-pola menarik kedalam
knowledge based yang ditemukan. Dalam tahap ini hasil
dari teknik data mining berupa pola-pola yang khas
ataupun model prediksi akan dievaluasi untuk menilai
apakah hipotensa yang ada memang tercapai. Namun bila
hasil yang didapatkan tidak sesuai hipotesa maka akan
dilakukan beberapa alternatif, seperti menjadikan umpan
balik untuk memperbaiki proses data mining, mencoba
metode data mining lain dan menerima hasil ini sebagai
hasil yang diluar dugaan yang mungkin bermanfaat.
18
7. Presentasi Pengetahuan
Tahap yang terakhir dari proses data mining adalah
bagaimana memformulasikan keputusan atau aksi dari
hasil analisis yang didapat. Visualisasi dan penyajian
pengetahuan mengenai metode yang digunakan untuk
memperoleh pengetahuan yang diperoleh pengguna. Ada
kalanya hal ini harus melibatkan orang-orang yang tidak
memahami tentang data mining. Karenanya presentasi
hasil data mining dalam bentuk pengetahuan yang
mampu dipahami semua orang dalam satu tahapan yang
diperlukan dalam proses data mining. Dalam presentasi
ini,visualisasi juga dapat membantu mengkomunikasikan
hasil dari data mining
2.2.3 CRISP-DM (Cross Industry Standart Process for Data Mining)

CRISP-DM (Cross Industry Standard Process for Data
Mining) adalah suatu konsorsium perusahaan yang didirikan oleh
Komisi Eropa pada tahun 1996 dan sudah ditetapkan sebagai proses
standar dalam data mining yang bisa diaplikasikan diberbagai sektor
industri. Berikut merupakan gambar dari proses siklus hidup
pengembangan dari CRISP-DM [12] :
19
Gambar 2.2 : Siklus Hidup CRISP-DM
Berikut merupakan tahap dari siklus pengembangan data mining

CRISP-DM :
1. Business Understanding
Tahap pertama adalah memahami tujuan dan kebutuhan dari
sudut pandang bisnis. Kemudian pengetahuan ini diterjemahkan
kedalam pendefinisian masalah dalam data mining. Selanjutnya
akan ditentukan rencana dan strategi untuk mencapai tujuan
tersebut.
2. Data Understanding
Pada tahap ini dimulai dengan pengumpulan data kemudian
dilanjutkan dengan proses untuk mendapatkan pemahaman yang
mendalam tentang data, mengidentifikasi masalah kualitas data,
dan untuk mendeteksi bagian menarik dari data yang dapat
digunakan untuk hipotesa untuk informasi yang tersembunyi.
20
3. Data Preparation
Tahap ini meliputi semua kegiatan untuk membangun dataset
akhir (data yang akan diperoleh pada modeling) dari data
mentah. Data preparation ini dapat diulang beberapa kali.
Dalam tahap ini juga mencakup pemilihan tabel, record, dan
atribut-atribut data, termasuk juga proses pembersihan dan
transformasi data untuk kemudian dijadikan masukan dalam
tahap modeling.
4. Modeling
Pada tahap ini dilakukan pemilihan dan penerapan berbagai
teknik pemodelan dan beberapa parameternya akan disesuaikan
untuk mendapatkan nilai yang optimal. Secara khusus, ada
beberapa teknik berbeda yang dapat diterapkan untuk masalah
data mining yang sama. Dipihak lain ada teknik pemodelan yang
membutuhkan format data khusus. Sehingga memungkinkan
pada tahap ini dapat kembali ke tahap sebelumnya.
5. Evaluation
Pada tahap evaluation ini model sudah terbentuk dan diharapkan
memiliki kualitas baik jika dilihat dari sudut pandang analisa
data. Dalam tahap ini sebelum model digunakan apakah model
dapat mencapai tujuan yang ditetapkan pada fase awal yaitu
Business Understanding akan dilakukan evaluasi terhadap
keefektifan dan kualitas model. Kunci pada tahap ini adalah
menentukan apakah ada masalah bisnis yang belum
dipertimbangkan.
6. Deployment
Pada tahap ini pengetahuan dan informasi yang telah diperoleh
akan diatur dan dipresentasikan dalam bentuk khusus, sehingga
dapat digunakan oleh pengguna. Tahap deployment dapat berupa
pembuatan laporan sederhana atau mengimplementasikan proses
21
data mining yang berulang dalam perusahaan. Dalam banyak

kasus, tahap deployment melibatkan konsumen, disamping
analisis data, karena sangat penting bagi konsumen untuk
memahami tindakan apa yang harus dilakukan untuk
menggunakan model yang telah dibuat.
2.2.4 Klasifikasi
Klasifikasi merupakan salah satu tugas yang penting dalam
data mining. mengorganisasikan serta mengelompokan data ke dalam
kelas-kelas yang berbeda merupakan tujuan utama dari klasifikasi.
Definisi pengklasifikasian adalah sebuah fungsi yang bersifat
prediksi dan menggolongkan data item tertentu ke dalam sebuah
kelas. Sebuah pengklasifikasian dibuat dari sekumpulan data latih
dengan kelas yang telah ditentukan dan dikenal ciri-cirinya
sebelumnya. Performa pengklasifikasian biasanya diukur dengan
ketepatan [14].
Gambar 2.3 : Blok Diagram Model Klasifikasi
2.2.5 Algoritma Naive Bayes

Algoritma Naive Bayes adalah salah satu algoritma yang
terdapat pada teknik data mining klasifikasi. Naive bayes merupakan
pengklasifikasian dengan metode probabilitas dan statistik yang
dikemukakan oleh ilmuan Inggris yaitu Thomas bayes, Naive Bayes
memprediksi peluang dimasa depan berdasarkan pengalaman dimasa
sebelumnya, sehingga dikenal dengan Teorema Bayes.
22
tersebut dikombinasikan dengan Naive dimana diasumsikan kondisi

antar atribut saling bebas. Klasifikasi Naive Bayes diasumsikan
bahwa ada atau tidak ciri tertentu dari sebuah kelas tidak ada
hubungannya dengan ciri dari kelas lainnya [15]. Persamaan dari
teorema Bayes adalah :
P(H|X)= P(H|X).P(H)
P (X)
Keterangan :
X : Data dengan class yang belum diketahui

H : Hipotesis data X merupakan suatu class spesifik
P(H|X) : Probabilitas hipotesis H berdasar kondisi X (posteriori
probability)
P(H) : Probabilitas hipotesis H (prior probability)
P(X|H) : Probabilitas X berdasarkan kondisi pada hipotesis H
P(X) : Probabilitas X
Adapun alur dari metode Naive Bayes adalah sebagai berikut :

1. Baca data training
2. Hitung Jumlah dan probabilitas, namun apabila data
numerik maka:
a. Cari nilai mean dan standar deviasi dari masing – masing
parameter yang merupakan data numerik.
b. Cari nilai probabilistik dengan cara menghitung jumlah data
yang sesuai dari kategori yang sama dibagi dengan jumlah data
pada kategori tersebut.
3. Mendapatkan nilai dalam tabel mean, standar deviasi
dan probabilitas.
23
Sedangkan untuk menghitung data yang bersifat kontinyu,

maka menggunakan rumus Densitas Gauss :
RapidMiner adalah salah satu software untuk pengolahan data mining.
Pekerjaan yang dilakukan oleh RapidMiner text mining adalah berkisar dengan
analisis teks, mengekstrak pola-pola dari data set yang besar dan
mengkombinasikannya dengan metode statistika, kecerdasan buatan, dan database.
Tujuan dari analisis teks ini adalah untuk mendapatkan informasi bermutu tertinggi
dari teks yang diolah.

24
2.2.6 Rapid Miner
Rapid miner menyediakan prosedur data mining dan machine
learning, di dalamnya termasuk: ETL (extraction, transformation,
loading), data preprocessing, visualisasi, modelling dan evaluasi. Proses
data mining tersusun atas operator-operator yang nestable,
dideskripsikan dengan XML, dan dibuat dengan GUI. Penyajiannya
dituliskan dalam bahasa pemrograman Java.(dkk Aprillia,
C.Dennis.2013).
2.2.7 Microsoft Excel
Pengertian Microsoft Excel adalah sebuah program atau
aplikasi yang merupakan bagian dari paket installasi Microsoft Office,
berfungsi untuk mengolah angka menggunakan spreadsheet yang terdiri
dari baris dan kolom untuk mengeksekusi perintah. Microsoft Excel
telah menjadi software pengolah data / angka terbaik di dunia, selain itu
Microsoft Excel telah didistribusikan secara multi-platform. Microsoft
Excel tidak hanya tersedia dalam platform Windows, Microsoft Excel
juga tersedia di MacOS, Android dan Apple.

25
Fungsi Microsoft Excel :
a. Membuat, mengedit,
mengurutkan, menganalisis,
meringkas, dan memformat data serta grafiknya.
b. Membuat catatan keuangan dan anggaran keuangan.
c. Menghitung dan mengelola investasi, pinjaman, penjualan,
inventaris, dll.
d. Melakukan analisa dan riset harga.
e. Melakukan perhitungan statistika.
f. Membantu berbagai sektor bisinis untuk mempermudah
melakukan laporan keuangan.
g. Membuat daftar nilai sekolah maupun universitas.
h. Konversi mata uang.
2.2.8 Pengujian Cross Validation

Validation merupakan proses untuk mengevaluasi
keakurasian prediksi dari model data mining. Validasi digunakan
untuk mendapatkan prediksi menggunakan model yang sudah ada
dan kemudian membandingkan hasil tersebut dengan hasil yang
sudah diketahui, ini mewakili langkah paling penting dalam proses
membangun sebuah model [16].
Cross Validation merupakan teknik validasi dengan
membagi data secara acak ke dalam k bagian dan masing-masing
bagian akan dilakukan proses klasifikasi. Dalam Cross Validation,
jumlah tetap lipatan atau partisi dari data ditentukan sendiri. Cara
standar untuk memprediksi error rate dari teknik pembelajaran dari
sebuah sampel data tetap adalah dengan menggunakan tenfold cross
validation.
26
2.3 Kerangka Pemikiran

Penulis perlu membuat gambaran singkat sebagai alur
penyusunan laporan ini dengan kerangka pemikiran sebagai berikut:
Masalah Studi Pustaka

Penerapan Kurikulum 2013 untuk Buku dan Jurnal tentang data
penjurusan siswa SMA mining dan penjurusan siswa
Tindakan
Membuat sistem pendukung keputusan yang

dapat digunakan oleh pihak sekolah untuk
membantu proses penjurusan siswa
Metode
Algoritma Naive Bayes
Penerapan
Data Siswa SMA Negeri 2 Sukatani
Tool
RapidMiner Studio
Hasil
Klasifikasi Kelulusan siswa
Gambar 2.4 : Kerangka Pemikiran.

BAB III
METODOLOGl PENELITIAN
3.1 Tempat dan waktu Penelitian
Penelitian ini dilaksanakan di SMA Negeri 2 Sukatani Rencana
penelitian ini tentang penerapan data mining untuk mempredikdi nilai
kelulusan siswa menggunakan metode naive bayes pada sma negeri 2
sukatani yang akan dilaksanakan kurang lebih 3 bulan, yaitu di mulai bulan
mei – juli 2018. Penelitian ini dilaksanakan di SMA Negeri 2 Sukatani.
3.1.1 Sejarah sekolah
SMAN 2 SUKATANI Secara Sah berdiri pada tanggal 21 Januari
2007 , terdiri dari 3 gedung Belajar , 1 ruang kantor , 1 ruang guru. Dan
tahun berikut nya bertambah gedung untuk pembelajaran yang dibawah
pimpinan bpk Ilham,Mpd, dan sekarang dipimpin oleh Drs.H.ATO
SUNARYO, M.Pd , SebagaI Wakasek Kurikulim Retno Harjanti,S.Pd dan
Bapak Ridwan, S.Pd sebagai kasubag tata usaha.
Perjalanan SMAN 2 SUKATANI Semakin Mantap . guru-guru
semakin banyak dan staf berdatangan, dan fasilitas semakin bertambah.
27
28
3.1.2 Visi dan Misi Sekolah
1. VISI
“Unggul dalam pengembangan diri , berkarakter, berakhlak
mulia,berbudi pekerti luhur, bernuansa iman dan takwa terhadap tuhan yang
esa”
2. MISI
10. Menciptakan suasana lingkungan yang kondusif sehingga terwujud suatau
lingkungan yang harmonis , siswa dan guru.
11. menumbuhkembangkan semangat yang kuat serta berkarakter, berakhlak
mulia dan bernalar sehat untuk mencerdaskan peserta didik, guru dan
karyawan sehingga berkamauan kuat untuk terus maju.
12. meningkatkan komitmen seluruh pendidik dan tenaga kependidikan
terhadap tugas pokok dan fungsinya.
13. mengembangkan teknologi informasi dan komunikasi dalam pembelajaran
dan sistem administrasi sekolah (SAS).
Gambar 3.1 Struktur Organisasi SMA Negeri 2 Sukatani
Sumber : admin SMA Neger 2 Sukatani

29
3.2 Alat Penelitian
Alat yang digunakan untuk melakukan penelitian ini berupa perangkat keras
dan lunak.
3.2.1 Perangkat Keras
3. Computer Name : DIAN PC
4. Operating System : Windows 7 Ultimate 32-Bit (6.1, Build 7601)
5. Memory : 2048 MB Random Acces Memory (RAM)
6. System Model : 1215P
3.2.2 Perangkat Lunak
4. Operating system windows 10
5. RapidMiner
30
3.3 Alur Penelitian
Dalam melakukan penelitian ini, peneulis menerapkan alur penelitian yang
dapat dilihat pada tabel Berrikut :
Tujuan Penelitian
Studi Literatur Identifikasi Masalah
Kumpulan Data
Data Training
Data Mining
Hasil Prediksi
Evaluasi
Selesai
Gambar 3.2 Alur Penelitian
Sumber : admin SMA Negeri 2 Sukatani

31
Tahapan pertama yang dilakukan dalam melksanakan penelitian ini adalah
melakukan studi literatur dengan cara mempelajari teori dan pengetahuan dasar
mengenai semua yang berkaitan dengan penelitian ini agar dapat memahami dasar –
dasar dan konsep – konsep yang mendukung penelitian.
Tahap kedua yaitu identifikasi masalah pada tahap ini proses yang dilakukan
adalah menggali permasalahan yang ditemukan pada objek yang diteliti serta
mengidentifikasi kebutuhan yang di butuhkan oleh pengguna guna mencari alternatif
solusi yang terkait dengan permasalahan tersebut.
Tahap ketiga yaitu pengumpulan data, setelah tahap identifikasi masalah
dilakukan dan semua kebutuhan sudah didapatkan maka tahap selanjutnya yang harus
dilakukan adalah pengumpulan data. Data yang dibutuhkan dalah data diri siswa dan
data nilai siawa. Sumber data di dapatkan dari SMA Negeri 2 Sukatani.
Tahap keempat yaitu membuat data training / latih dari data – data yang sudah
di kumpulkan, karena tidak semua data dibutuhkan untuk pengujian model.
Tahap kelima yaitu membuat data mining yang digunakan untuk memilih
teknink dan algoritma yang sesuai untuk untuk menemukan pola yang berharga dan
tersembunyi dari data siswa dengan algoritma naive bayes.
Tahap keenam adalah hasil prediksi dari penerapan data mining dengan
algoritma naive bayes.
Tahap ketujuh yaitu evaluasi, pada tahap ini dilakukannya evaluasi untuk mengetahui
apakan teknik dan algoritma yang digunakan sudah sesuai untuk digunakan dalam
penelitian sehingga bisa menemukan pola hubungan antar nilai siswa dengan data
dari latar bela ang siswa yang bermanfaat untuk menentukan kelulusan.
32
3.4 Metodologi Data Mining
Data mining metodelogi yang sudah banyak digunakan dalam
pembangunan data mining yakni CRISP-DM (Cross Industry Standard
Prosess Model For Data Mining), terdiri dari enam fase yaitu pemahaman
bisninis (Bussines Understanding), pemahaman data (data Understanding),
persiapan data (data Preparation), pemodelan (modelling), evaluasi
(Evaluation), penyebaran (deployment) (Elkan,C.2014, Predictive Analytics
and data mining, p. 17).
3.4.1 Permasalahan bisnis
Prestasi merupakan salah satu elemen terpenting dalam proses kegiatan
pembelajaran disuatu lembaga pendidikan. Sekolah menggunakan nilai hasil
ujian untuk menentukan kelulusan. Nalai tersebut juga berpengaruh dari
prikalu siswa disekolah. Maka SMA Negeri 2 Sukatani perlu memperhatikan
nilai siswanya dan melakukan predisi secara dini untuk mendapatakan
informasi yang akurat dalam memprediksi benyaknya tingkat kelulusan maka
dapat memenuhi sasaran mutu yang telah ditetapkan.
3.4.2 Tujuan data mining
Memprediksi kelulusan siswa dengan menggunakan metode klasifikasi
dengan algoritma naive bayes untuk memenuhi siswa yang lulus dan tidak
lulus . dengan begitu SMA Negeri 2 Sukatani dapat mendorong siswa agar
dapat lulus tepat waktu sehingga mempermudah siswa agar dapat menempuh
pendidikan lebih lanjut.
33
3.5 Pemahaman Data (Data Understanding)
Data yang digunakan dalam penelitian ini didapat dari dua sumber,
yaitu data biodata siswa dan data akademik siswa . Kedua data tersebut
adalah daftar data siswa SMA Negeri 2 Sukatani tahun2018 yang masih
aktif. Ini adalah tabel jumlah siswa yang sudah dibagi menjadi beberapa
rombel, seperti pada tabel 3.1 dan 3.2 adalah data tabel siswa perjurusan .
Tabel 3.1 Jumlah siswa perrombel nya.
ROMBEL L P JML
: XII-IPA-1 12 33 45
: XII-IPA-2 12 33 45
: XII-IPA-3 13 33 46
: XII-IPA-4 10 34 44
JUMLAH IPA 47 133 180
: XII-IPS-1 19 24 43
: XII-IPS-2 20 21 41
: XII-IPS-3 19 23 42
: XII-IPS-4 32 22 54
JUMLAH IPS 90 90 180
JUMLAH KLS-XII 137 223 360

34
Tabel 3.2 Data siswa perjurusan
MAPEL IPA / IPS
KIMIA 21
FISIKA 3
BIOLOGI 156
EKONOMI 11
SOSIO 106
GEOGRAFI 63
3.6 Pembersihan Data
Setelah tahap pengumpulan data dan filter data maka tahap selanjutnya
yauitu cleaning data agar tidak ada duplikasi data, memeriksa data yang
inkosisten dan memperbaiki kesalahan pada saat seperti kesalahan cetak,
sehingga data tersebut dapat diolah dan dilakukan proses data mining. Setelah
semua data yang dibutuhkan telah memaliu tahap cleaning data maka data
akan disimpan dalam dataset baru yang menggunakan Microsoft Office Excel.
Data yang diambil dari jurusan IPA dan IPS ini ada data yang unknown yaitu
data dari atribut alamat dan data asala sekolah sebanyak 360 data.
3.7 Transformasi Data

35
Data diubah atau digabung ke dalam format yang sesuai untuk diproses daiam data
mining karena beberapa metode data mining membutuhkan forrnat data yang khusus
sebelum bisa diaplikasikan. Dalam penelitian ini data akan diubah ke dalam format csv
melalui excel. Transformasi data dapat memudahkan proses mining di softxxare
Rapidminer.
3.8 Implementasi
Merupakan suatu proses utama saat metode ini dilakukan untuk menemukan
pengetahuan berharga atausebuah infonnasi dari data. Teknik yang digunakan pada
proses mining ini adalah prediksi dengan menggunakan algoritma Na'íve fíayes dan
software yang digunakan dalam proses mining ini yaitu RapidMiner
3.9 Analisis Data
Data yang didapatkan dari proses tahapan-tahapan data mining kemudian
diolah kembali menggunakan Rapidminer untuk mendapatkan hasil analisis yang
lebih akurat. Attribut yang diuji adalah nilai IPK siswa kelas XII angkatan 2018
yang belum dinyatakan lulus, jenis kelamin, jurusan IPK dan mapel sebagai data
traning. Kemudian attribut yang digunakan untuk data testing adalah nilai IPK
siswa XII angkatan 2018 yang belum lulus.
BAB IV
HASIL DAN PEMBAHASAN
4.1. Pengujian Hasil dan Validasi
4.1.1 Data Keseluruhan
Data keseluruhan merupakan kumpulan data antribut beserta
kelasnya, yang akan dibagi menjadi data training dan data testing.
Data training digunakan untuk proses learning dalam pembuatan
naïve bayes, sedangkan data testing digunakan dalam proses
pengujian. Data berasal dari admin tata usaha SMAN 2 Sukatani
yang berbentuk excel. Seperti table 4.1.
Tabel 4.1 Data Keseluruhan

NO_UJIA TEMPAT_ TGL_ MA JUMLAH
NO PRGM BIN ING PLH Maple
N LAHIR LAHIR T NILAI
ILMU
12-022- 8 Juli 48.0 125.0
PENGETAHUAN
1 025-8 Bekasi 2000 ALAM 22.0 22.5 32.5 Biologi
ILMU
12-022- 15 April PENGETAHUAN 48.0 128.5
2 026-7 BEKASI 2000 ALAM 28.0 25.0 27.5 Biologi
ILMU
12-022- 19 April
PENGETAHUAN 48.0 138.5
3 027-6 Bekasi 2000 ALAM 28.0 22.5 40.0 Biologi
ILMU
12-022- 19 Juni PENGETAHUAN 54.0 167.5
4 028-5 JAKARTA 2000 ALAM 36.0 32.5 45.0 Biologi
ILMU
12-022- 21 April 62.0 142.5
PENGETAHUAN
…. 029-4 BEKASI 2000 ALAM 38.0 15.0 27.5 Biologi
ILMU
12-022- 20 Juli PENGETAHUAN 44.0 128.0
360 030-3 BEKASI 1999 ALAM 24.0 20.0 40.0 Biologi
36
37
Data yang digunakan dalam penelitian ini data siswa kela XII
SMA Negeri 2 Sukatani tahun 2018 yang belum lulus sebagai data
training sedangkan sebanyak 360 dan testing sebanyak 100 data
dengan 4 antribut.
4.2 Seleksi Data
Seleksi data adalah proses menganalisis data yang relevan
dari database karena sering ditemukan tidak semua data dibutuhkan
dalam proses data mining. Data tersebut dipilih dan diseleksi dari
database untuk di analisis. Dari semua data yang digunakan hanya
tempat lahir, nama, nilai , mapel. Karena informasi yang dikandung
didalamnya sudah mewakili informasi yang dibutuhkan untuk
dijadikan indicator penelitian.
4.3 Pembersih Data
Setelah tahap pengumpulan data dan filter data maka tahap
selanjutnya yaitu cleaning data agar tidak ada duplikasi data,
memeriksa data yang inkosisten dan memperbaiki kesalahan pada
saat seperti kesalahan cetak, sehingga data tersebut dapat diolah
dan dilakukan proses data mining. Setelah semua data yang
dibutuhkan telah melalui tahap cleaning data maka data akan
disimpan dalam dataset baru yang menggunakan Microsoft Office
Excel. Data yang diambil dari jurusan IPA dan IPS ini ada data yang
unknown yaitu data dari atribut Nilai dan data Mapel Ujian
sebanyak 360 data.

38
4.4 Transformasi Data
Data transformation adalah tahap mengubah data menjadi
bentuk yang sesuai untuk proses dalam data mining. Beberapa
metode data mining membutuhkan format data yang khusus
sebelum bisa diaplikasikan. Dan data ini juga digunakan untuk
mengelolah pada software rapiud miner. Tabel 4.2 adalah table yang
belum diubah oleh penulis atau belum dilakukan transformasi data.
Table 4.2 Transformasi Data
NO BIN ING MA PLH JUMLAH Maple

PRGM
T NILAI
ILMU
PENGETAHUAN 6. 125.0
14. ALAM 22.0 22.5 32.5 Biologi
ILMU
7. ALAM 28.0 25.0 27.5 Biologi
ILMU
6. ALAM 28.0 22.5 40.0 Biologi
ILMU
2. ALAM 36.0 32.5 45.0 Biologi
ILMU
4. ALAM
38.0 15.0 27.5 Biologi
ILMU
5. ALAM
24.0 20.0 40.0 Biologi
Selanjutnya penulis melakukan transformasi dan inisialilsasi
data agar penelitian ini berjalan dengan baik. Data yang akan
diinisialilsasi merupakan data dari attribut IPK dan Mata Pelajaran
seperti table 4.3 dan 4.4.

39
Tabel 4.3 Inisialisasi IPK
Nilai IPK Inisialilsasi
IPK ASLI >85 A
75<=IPK ASLI<=85 B
IPK ASLI <75 C
Tabel 4.4 Inisialisasi IPK
Mata Pelajaran Inisialisasi
Biologi A
Fisika B
Sosiologi C
Ekonomi D
Kimia E
Geografi G
40
Selanjutnya data yang sudah dianalisis ditransformasikan kedalan
excel kembali seperti Tabel pada table 4.5.
Tabel 4.5 data yang sudah di insialisasi
NO NAMA JUMLAH Mapel

PRGM
NILAI
1 ACHMAD SUBHAN AYYUSPI ILMU PENGETAHUAN ALAM

125.0 A
2 AHMAD JAELANI 128.5 A

ILMU PENGETAHUAN ALAM
…. ALWIYAH WIDIASTUTI ILMU PENGETAHUAN ALAM

138.5 A
100 AMALIA NUR FATTONAH ILMU PENGETAHUAN ALAM

167.5 A
4.5 Implementasi
Pada tahap ini dilakukan pemodelan data , metode yang
dipakai pada penelitian ini adalah probabilitas (prediksi) dengan
menggunakan algoritma Naïve bayes. Data yang telah dikumpul .
diseleksi dan ditransformasi akan dikelola menggunakan metode
probabilitas. Metode ini dapat digunakan dalam memprediksi
peluang dimasa depan berdasarkan pengalamanan dimasa
sebelumnya sebagai perbandingan.

41
Data yang akan diujikan dibagi menjadi 2 bagian yaitu
training dan testing kemudian dianalisa menggunakan software
rapidminer . data training siswa kelas XII memiliki 360 record data
dan data testing memiliki 100 record data. Menggunakan cross
validation . Tabel 4.5 adalah data training dan table 4.6 adalah data
testing yang akan di akses melalui software rapidminer.
Tabel 4.6 Data training
NO NAMA BIN ING MAT PLH JUMLAH Mapel

PRGM
NILAI
ILMU
PENGETAHUA
N 48.0 125.0 A
1 ACHMAD SUBHAN ALAM 22.0 22.5 32.5
ILMU
PENGETAHUA
N 48.0 128.5 A
2 AHMAD JAELANI ALAM 28.0 25.0 27.5
ILMU
ALWIYAH PENGETAHUA
N 48.0 138.5 A
…. WIDIASTUTI ALAM 28.0 22.5 40.0
ILMU
AMALIA NUR PENGETAHUA
N 54.0 167.5 A
360 FATTONAH ALAM 36.0 32.5 45.0
Tabel 4.7 Data testing
JUMLAH
NO NAMA PRGM BIN ING MAT PLH Mapel
NILAI
ILMU
ACHMAD SUBHAN
PENGETAHUAN 48.0 125.0 A
1 AYYUSPI ALAM 22.0 22.5 32.5
ILMU
2 AHMAD JAELANI ALAM 28.0 25.0 27.5
ILMU
ALWIYAH
3 WIDIASTUTI ALAM 28.0 22.5 40.0
ILMU
AMALIA NUR
… FATTONAH ALAM 36.0 32.5 45.0
ILMU
100 AMALIAH ALAM 38.0 15.0 27.5
42
4.6 Pengujian Rapidminer
Atribut yang digunakan sebagai label adalah lulus, penulis
akan menganalisis factor yang mempengaruhi siswa lulus tepat
waktu dan memprediksi siswa yang dapat lulus tepat waktu
menggunakan data dari siswa SMA Negeri 2 Sukatani. Data
terlebih dahulu kita transformasi ke dalam format .cvs agar bias
diakses menggunakan software rapidminer.
Gambar 4.1 UI rapid miner

43
Setelah data dibuat kedalam bentuk format .cvs selanjutnya
lakukan importing data seperti pada gambar 4.2
Gambar 4.2 Memasukan data training dan testing ke software

rapidminer.
44
Setelah data yang akan digunakan dipilih langkah selanjutnya
yaitu klik next akan muncul data import step 2 seperti gambar 4.3.
Gambar 4.3 Import data ke software rapidminer step 2
Setelah data yang akan digunakan dipilih langkah selanjutnya yaitu
klik next akan muncul data import step 3 seperti gambar 4.4.
45
Gambar 4.4 Import data mining step 3
yaitu klik next akan muncul data import step 4 seperti gambar 4.5
46
yaitu klik next akan muncul data import step 5 seperti gambar 4.6.
47
Setelah data yang akan digunakan dipilih langkah selanjutnya yaitu
klik Finish. Maka selanjutnya drag and drop naïve bayes dan kemudian
hubungkan ke rad cvs data ke naïve bayes seperti pada gambar 4.7 .
48
Gambar 4.7 File read CVS dengan operator naïve bayes
Langkah selanjutnya adalah menghubungkan output lab dari
apply model menuju output operator performance . setelah semua nya
terhubung, selanjutnya adalah hubungkan port per dan exa yang ada di
operator performance menuju port res yang berada disebelah kanan
view proses seperti gambar 4.8

49
Gambar 4.8 Menghubungkan operator performance
Gambar 4.9 Menjalankan Rapidminer
Setelah beberapa detik maka rapidminer akan menampilkan hasil
prediksi pada view result. Hasil nya bias terlihat pada gambar 4.10.
50
Gambar 4.10 Hasil Perhitungan
Dari hasil perhitungan menggunakan rapidminer dengan metode
prediksi menampilkan dari data testing yang telah diuji dengan data training
berupa kolom prediction (Mapel). Kolom kolom ini memberikan informasi
tentang data siswa yang diambil dari data testing yang dapat diprediksi lulus
. selanjutnya untuk mengetahui tingkat accuracy algoritma naïve bayes, klik
tab performancevector yang terletak disebelah kanan , sehingga
menampilkan table view seperti gambar 4.11.

51
Gambar 4.11 Accuracy
Gambar 4.12 Gambar Accuracy

52
Dapat dilihat pada gambar 4.11 tingkat accuracy dari
performancevector yaitu 90 %
Gambar 4.13 Grafik Scener
Berdarsarkan gambar 4.13 diatas bahwa jurusan ipa yang
memiliki IPK 3 probabilitasnya lebih besar dibandingkan ips.

53
Gambar 4.14 Cross Validation
Selanjutnya adalah mengatur cross validation dengan cara
double klikk operator cross validation, kemudian drag and drop operator
naïve bayes dan hubungkan port tra and mod . selanjutnya klik tombol
proses untuk menjalankan cross validation pada gambar 4.15

54
Gambar 4.15 Menjalankan Rapidminer.
Gambar 4.16 Hasil shuffled sampling

55
Gambar 4.17 Xvalidation Numerical
4.7 Algoritma Naïve Bayes
Dalam penelitian algoritma yang digunakan adalah naïve
bayes dan untuk memudahkan menjelaskan tentang algoritma naïve
bayes dalam penelitan ini maka penulis membuat table data yang
digunakan dalam penelitian seperti table 4.7 sebagai data training
dan 4.8 sebagai data testing .
Jumal Kelas XI yang tergabung dari IPA dan IPS dibagi
beberapa rombel, seperti table 4.7 dibawah.

56
Tabel 4.8 Data rombel siswa IPA dan IPS
ROMBEL L P JML
: XII-IPA-1 12 33 45
: XII-IPA-2 12 33 45
: XII-IPA-3 13 33 46
: XII-IPA-4 10 34 44
JUMLAH IPA 47 133 180
: XII-IPS-1 19 24 43
: XII-IPS-2 20 21 41
: XII-IPS-3 19 23 42
: XII-IPS-4 19 22 41
JUMLAH IPS 77 90 167
JUMLAH KLS-XII 124 223 347
Table 4.9 Data training
JUMLAH
NAMA PRGM NILAI Mapel
ACHMAD SUBHAN
AYYUSPI ILMU PENGETAHUAN ALAM 125 A
AHMAD JAELANI ILMU PENGETAHUAN ALAM 128.5 A
ALWIYAH WIDIASTUTI ILMU PENGETAHUAN ALAM 138.5 A
ROHANA ILMU PENGETAHUAN SOSIAL 120.5 C
ROYADI ILMU PENGETAHUAN SOSIAL 153 C
SALMAH ARDILA ILMU PENGETAHUAN SOSIAL 132 G
SEPTI SUSANTI ILMU PENGETAHUAN SOSIAL 152 G

57
Tabel 4.10 Data Testing
MUHAMAD RICKO
ARDIANSYAH ILMU PENGETAHUAN SOSIAL 155.5 G
MUHAMMAD NUR SIDIK ILMU PENGETAHUAN SOSIAL 145.5 C
NANA YULIYANA ILMU PENGETAHUAN SOSIAL 133 D
NUR HALIMAH ILMU PENGETAHUAN SOSIAL 132.5 D
NURUL ALINA HASAN ILMU PENGETAHUAN SOSIAL 129 C
RATNA JUITA ILMU PENGETAHUAN SOSIAL 180 C
Tabel 4.8 diatas memiliki 360 record sebagai data training dan
table 4.9 memiliki 100 record sebagai data testing yang digunakan dalam
penelitian ini. Dalam kasus yang ada pada table 4.7 akan dibuat prediksi
untuk menentukan siswa lulus atau tidak menggunakan probabilitas.
Untuk menghitung nilai probabilitas atau prediksi siswa dengan
menggunakan cara sebagai berikut :
Pertama Menghitung jumlah dari IPA dan IPS dari label data
training . dari tabel training didapatkan hasil sebagai berikut :
 IPA = 180
 IPS = 167
58
Setelah mengetahui jumlah siswa yang mengikuti ujian tepat
waktu langkah adalah menghitung probabilitas masing masing attribute
dari data testing seperti berikut ini :
 Gender laki – laki , jurusan = IPA , IPK = 85, Mapel = E,
 P(Jurusan = IPA / jumlah siswa data training ) = 180 / 360 =
0,5
 P(Gender = laki – laki / IPA ) = 47 / 180 = 0,261111111
• P(Gender = Laki – laki / Mapel E ) = 47 / 21 = 2,2380952381
 P( Mapel = E = Jurusan / IPA ) = 20 / 180 = 0,111111111
Selanjut nya menghitung yang jumlah perempuan nya adalah
sebagai berikut :
 Gender Permpuan , jurusan = IPA , IPK = 85, Mapel = A,
 P(Jurusan = IPA / jumlah siswa data training ) = 180 / 360 =
0,5
 P(Gender = Permpuan / IPA ) = 133 / 180 = 0,73888888
 P(Gender = Perempuan / Mapel E ) = 133 / 21 = 6,333333
• P( Mapel = A = Jurusan / IPA ) = 156 / 180 = 0,86666666667

59
Untuk menghitung nilai IPK yang memiliki tipe data yang
kontinyu menggunakan rumus distribusi Gaussion seperti dibawah ini :

( )
√
4. = 3,1416
E = 2,72
i. = rata – rata
Σ = simpangan baku
Selanjutnya gantikan nilai x pada rumus diatas menjadi
angka dari data attribute IPK yang dicari seperti dibawah ini ;
( )
√
0.60697135032 X 0,84920528533 = 0.51544327873

60
Selanjutnya menghitung probabilotias IPS dengan
menggunakan data testing yang sama seperti perhitungan IPA diatas :
• Gender = laki – laki , Jurusan = IPS , IPK = 85, Mapel = G,
• P (IPS = Laki- laki / jumlah siswa data training ) = 77 / 176 = 0,4375
• P( Mapel = G = Jumlah siswa data training ) = 63 / 460
= 0,13695652217
0.46470390492 X 0.37874081899 = 0.17600233754
Langkah selanjutnya menghitung semua nilai dari masing masing
attribute IPA dan IPS , Kemudian melakukan normalisasi untuk masing –
masing kelas seperti berikut ini :
IPA = 180
IPS = 167
( )
√
Proses perhitungan confidence
Probabilitas IPA = 0,00478789055 = 0,867
0,00478789055 + 0,00073104692
Probabilitas IPS = 0,00073104692 = 0,132
0,00478789055 + 0,00073104692
61
Dari perhitungan diatas diketahui bahwa siswa siswa dengan katagori
laki – laki , jurusan IPA , IPK 3, Mapel E diprediksi lulus karena hasil
perhitungan kelas IPA lebih besar Dari kelas IPS dengan hasil probabilitas
sebesar 0,867 .
BAB V
KESIMPULAN DAN DARAN
5.1 Kesimpulan
Setelah melakukan pengujian dan analisis penulis mendapatkan sebagai
berikut :
15. Algoritma Naïve Bayes dapat digunakan untuk memprediksi kelulusan siswa.
16. Dengan Menggunakan metode Algortima Naïve Bayes mampu menjadi lebih
efektif dalam menentukan kelulusan.
17. Algoritma Naïve Bayes dalam memprediksi kelulusanmemiliki akurasi 86
18. Informasi yang didapat dalam penelitian ini adalah bahwa siswa yang IPK nya
85 lebih besar kemungkinan nya untuk lulus .
19. siswa yang jurusan IPA lebih besar nilai nya dibandingkan IPS .
5.2 Saran
Saran yang diberikan penulis adalah :
8. Diharapkan data – data sekolah susah menggunakan data base sehingga
mempermudah penelitian selanjutnya.
9. Jika ada yang peneliti yang ingin melanjutkan penelitian ini sebaiknya
menggunakan algoritma yang berbeda sebagai perbandingan tingkat akurasi.

LAMPIRAN :
Data testing
JUMLAH
NAMA PRGM Mapel
NILAI
ACHMAD SUBHAN AYYUSPI ILMU PENGETAHUAN ALAM 125 A
AHMAD JAELANI ILMU PENGETAHUAN ALAM 128.5 A
ALWIYAH WIDIASTUTI ILMU PENGETAHUAN ALAM 138.5 A
AMALIA NUR FATTONAH ILMU PENGETAHUAN ALAM 167.5 A
AMALIAH ILMU PENGETAHUAN ALAM 142.5 A
ARI ARDIANSYAH ILMU PENGETAHUAN ALAM 128 A
BASTIAN ARDIANSYAH ILMU PENGETAHUAN ALAM 137.5 A
DELY AGUSTIN ILMU PENGETAHUAN ALAM 116 A
DEVI FANDINI ILMU PENGETAHUAN ALAM 119.5 A
DWI PRIHATINI ILMU PENGETAHUAN ALAM 147 A
ELPA ELPIANA ILMU PENGETAHUAN ALAM 124.5 A
ERMI FATURRAHMI ILMU PENGETAHUAN ALAM 168 B
FIKRI HAEKAL HARDIANSYAH ILMU PENGETAHUAN ALAM 140 A
FILHZAH HASYYATI RUYANI ILMU PENGETAHUAN ALAM 150.5 A
IDA ROYANI ILMU PENGETAHUAN ALAM 125 A
IIS SOLIHATUL FADILAH ILMU PENGETAHUAN ALAM 152 A
IMAM SYAEFULLAH ILMU PENGETAHUAN ALAM 139 A
INTAN KARTINI ILMU PENGETAHUAN ALAM 167 A
JUBAEDAH ILMU PENGETAHUAN ALAM 141.5 A
KHAAFIDH KAMILAH ILMU PENGETAHUAN ALAM 144 A
LAELA SUGIARTI ILMU PENGETAHUAN ALAM 163.5 A
LISANTI JANNAT ILMU PENGETAHUAN ALAM 156 A
LITA LASMALA ILMU PENGETAHUAN ALAM 127.5 A
LUSIANA ILMU PENGETAHUAN ALAM 149 A
MILAH PRIHATINI ILMU PENGETAHUAN ALAM 150 A
MITA ILMU PENGETAHUAN ALAM 169 A
MUHAMAD DION GILANG
ILMU PENGETAHUAN ALAM 135.5 A
SAPUTRA
MUHAMAD ROUF ILMU PENGETAHUAN ALAM 129.5 A
MUHAMMAD ARIFIN ILMU PENGETAHUAN ALAM 108 A
MUNIH ILMU PENGETAHUAN ALAM 135.5 A
NABILA RATNA SARI ILMU PENGETAHUAN ALAM 141.5 A
NATASYA OKTAVIANTI ILMU PENGETAHUAN ALAM 145.5 A
NIA RAHMAYANTI ILMU PENGETAHUAN ALAM 163 A
NURANISAH ILMU PENGETAHUAN ALAM 152 A
PUTRI DIANA ILMU PENGETAHUAN ALAM 128.5 A
RAKA SIWI ILMU PENGETAHUAN ALAM 162.5 A
RIKA KOMALASARI ILMU PENGETAHUAN ALAM 114.5 A
ROBIATUL ADAWIYAH ILMU PENGETAHUAN ALAM 159 A
SAHRUL ALAM ILMU PENGETAHUAN ALAM 134 A
SINTA DEWI ILMU PENGETAHUAN ALAM 115 A
SITI RUKIYAH ILMU PENGETAHUAN ALAM 163 A
TIKA APRIANTIKA ILMU PENGETAHUAN ALAM 163.5 A
UTARI SAPITRI ILMU PENGETAHUAN ALAM 137.5 A
WIDIA APRIANI ILMU PENGETAHUAN ALAM 140.5 A
YASIR MOHAMAD ILMU PENGETAHUAN ALAM 174.5 A
NASRUL ARI FAJRI ILMU PENGETAHUAN SOSIAL 123 C
NIA ARSITA ILMU PENGETAHUAN SOSIAL 104.5 C
NOVIYANTI ILMU PENGETAHUAN SOSIAL 100 C
NURHASNI FAUZIAH ILMU PENGETAHUAN SOSIAL 133.5 G
RIA NOVITASARI ILMU PENGETAHUAN SOSIAL 131 G
ROSMALIA FAUZIA ILMU PENGETAHUAN SOSIAL 136.5 C
SANDI SUARDI ROYANA ILMU PENGETAHUAN SOSIAL 165.5 C
SELIYANA APRIDA ILMU PENGETAHUAN SOSIAL 118.5 C
SITI HABIBAH ILMU PENGETAHUAN SOSIAL 127.5 C
SITI NURHALIMAH ILMU PENGETAHUAN SOSIAL 110.5 C
SOPIAH ILMU PENGETAHUAN SOSIAL 131.5 G
SULEKAH ILMU PENGETAHUAN SOSIAL 136 G
SUTAN FACHRIE IRAWAN ILMU PENGETAHUAN SOSIAL 141 C
YAYAH ZAKIYAH ILMU PENGETAHUAN SOSIAL 117 G
YULITA SARI ILMU PENGETAHUAN SOSIAL 138 G
YUSUF ILMU PENGETAHUAN SOSIAL 129 C
INDRA HANDIKA ILMU PENGETAHUAN SOSIAL 205 C
ABDUL RIZKI ILMU PENGETAHUAN SOSIAL 165 C
ALFINA DAMAYANTI ILMU PENGETAHUAN SOSIAL 117 C
ALI MUSTOPA ILMU PENGETAHUAN SOSIAL 157.5 G
ANIPAH ILMU PENGETAHUAN SOSIAL 119.5 C
ANISAH ILMU PENGETAHUAN SOSIAL 124.5 G
ALWAN FAUZI ILMU PENGETAHUAN SOSIAL 179 C
AVITA PRADINI ILMU PENGETAHUAN SOSIAL 112 G
DALIYA ILMU PENGETAHUAN SOSIAL 148.5 C
DANDI SUPRIYADI ILMU PENGETAHUAN SOSIAL 143.5 G
DONNY PRATAMA ILMU PENGETAHUAN SOSIAL 142.5 G
FAISAL EFENDI ILMU PENGETAHUAN SOSIAL 142 G
FARIHIN PADILAH ILMU PENGETAHUAN SOSIAL 141 C
IKA ISNIYATIN SAYIDA ILMU PENGETAHUAN SOSIAL 144.5 G
ISMAIL ILMU PENGETAHUAN SOSIAL 150.5 C
KAKA SURYADIKA ILMU PENGETAHUAN SOSIAL 150.5 C
KARMILAH ILMU PENGETAHUAN SOSIAL 149.5 C
LULUK TOBING ILMU PENGETAHUAN SOSIAL 138.5 C
MAEMUNAH WATI ILMU PENGETAHUAN SOSIAL 126 C
MAHDAN SYAIFUSSALAM ILMU PENGETAHUAN SOSIAL 131 C
MILA AGUSTIN ILMU PENGETAHUAN SOSIAL 123.5 C
MUHAMAD GUNTUR SAKETI ILMU PENGETAHUAN SOSIAL 145.5 C
MUHAMAD RICKO ARDIANSYAH ILMU PENGETAHUAN SOSIAL 155.5 G
MUHAMMAD NUR SIDIK ILMU PENGETAHUAN SOSIAL 145.5 C
NANA YULIYANA ILMU PENGETAHUAN SOSIAL 133 D
NUR HALIMAH ILMU PENGETAHUAN SOSIAL 132.5 D
NURUL ALINA HASAN ILMU PENGETAHUAN SOSIAL 129 C
RATNA JUITA ILMU PENGETAHUAN SOSIAL 180 C
ROHANA ILMU PENGETAHUAN SOSIAL 120.5 C
ROYADI ILMU PENGETAHUAN SOSIAL 153 C
SALMAH ARDILA ILMU PENGETAHUAN SOSIAL 132 G
SEPTI SUSANTI ILMU PENGETAHUAN SOSIAL 152 G
SITI KHOIRIYAH ILMU PENGETAHUAN SOSIAL 118.5 C
SITI NURJANAH ILMU PENGETAHUAN SOSIAL 131.5 G
SOPANDI ILMU PENGETAHUAN SOSIAL 153.5 G
SRI ASTUTI ILMU PENGETAHUAN SOSIAL 127.5 C
SUTEDI SUNJAYA ILMU PENGETAHUAN SOSIAL 158 G
TIARA AMALIA ILMU PENGETAHUAN SOSIAL 166.5 G
Data training
JUMLAH
NAMA PRGM Mapel
NILAI
ACHMAD SUBHAN AYYUSPI A 125 A
AHMAD JAELANI A 128.5 A
ALWIYAH WIDIASTUTI A 138.5 A
AMALIA NUR FATTONAH A 167.5 A
AMALIAH A 142.5 A
ARI ARDIANSYAH A 128 A
BASTIAN ARDIANSYAH A 137.5 A
DELY AGUSTIN A 116 A
DEVI FANDINI A 119.5 A
DWI PRIHATINI A 147 A
ELPA ELPIANA A 124.5 A
ERMI FATURRAHMI A 168 B
FIKRI HAEKAL HARDIANSYAH A 140 A
FILHZAH HASYYATI RUYANI A 150.5 A
IDA ROYANI A 125 A
IIS SOLIHATUL FADILAH A 152 A
IMAM SYAEFULLAH A 139 A
INTAN KARTINI A 167 A
JUBAEDAH A 141.5 A
KHAAFIDH KAMILAH A 144 A
LAELA SUGIARTI A 163.5 A
LISANTI JANNAT A 156 A
LITA LASMALA A 127.5 A
LUSIANA A 149 A
MILAH PRIHATINI A 150 A
MITA A 169 A
MUHAMAD DION GILANG
A 135.5 A
SAPUTRA
MUHAMAD ROUF A 129.5 A
MUHAMMAD ARIFIN A 108 A
MUNIH A 135.5 A
NABILA RATNA SARI A 141.5 A
NATASYA OKTAVIANTI A 145.5 A
NIA RAHMAYANTI A 163 A
NURANISAH A 152 A
PUTRI DIANA A 128.5 A
RAKA SIWI A 162.5 A
RIKA KOMALASARI A 114.5 A
ROBIATUL ADAWIYAH A 159 A
SAHRUL ALAM A 134 A
SINTA DEWI A 115 A
SITI RUKIYAH A 163 A
TIKA APRIANTIKA A 163.5 A
UTARI SAPITRI A 137.5 A
WIDIA APRIANI A 140.5 A
YASIR MOHAMAD A 174.5 A
AAM AMYATI DEWI A 115 A
AHMAD FAUZI A 119 A
ALDI HARYANTO A 188 B
ALDIYANSYAH A 133 A
ANIS AFRILYANTI A 143.5 A
ASTRI PRATIWI A 135 A
DAHLIA A 159 A
DEWI LESTARI A 139 A
ELISTIA WATI A 125 A
ERIKA AMELIA A 142 A
EVI YANI A 165 B
FARHAN FAUZAN A 126.5 A
GANGGA PUTRA SATRIA A 127.5 A
HAMIDAH A 167.5 A
IIN SARTIKA A 205.5 E
IKHFA AMELIA A 147 A
IQBAL ZAENAL MUTAQIEN A 197 A
KARTINI A 129.5 A
KHOLIDA ZIAH A 188.5 A
LATIFAH A 140.5 A
LILI ISKANDAR A 186 A
MARDIANSYAH A 103 A
MARIATUL KIBTIYAH A 147.5 A
MASIH MAHCICA A 147 A
MEGAWATI A 133 A
MIFTAHUL FAUZI A 139.5 A
MUHAMAD FAHRI A 199 A
MUTOHAROH A 168 A
NENENG SURYANI OKTAVIANI A 159.5 A
NENI SURYANI A 142 A
NUR ASIKIN A 161 A
NURHAPIPAH A 140 A
PEBI RISYANI A 159.5 E
PETI PEBIOLA A 118.5 E
PUTRI WULANDARI A 159.5 A
RENITASARI A 126.5 A
ROHIMAH A 138 A
ROSALINDA A 131 A
SISKA DESIYANTI A 118 A
SONIA NURKHOLIFAH A 126 A
TRI HARTANTI A 112 A
TUBAGUS HAYKAL NENDYAS
A 142.5 A
WAFI
WAFFIYYATUL MARDIYYAH A 152 A
WAHYUNI A 115 A
YUROH A 122 A
AFIFAH A 167 A
AKBAR SALEH ALFIAN A 145.5 E
ALFAN YUDISTIRO A 107.5 E
ANDI YANTO A 179.5 E
ARISKA DEWI PORTUNA A 142 A
AYU SUGIYARTI A 153 E
CICI YISTIANI A 123.5 E
DITA NELISTINA A 160.5 E
ELPURANINA SEPTIANY A 172 E
FAISAL RAMADHAN A 152 E
FARIDA FARHA A 140 A
FEBRIYANTI A 127 A
HADI KUSUMA A 157 B
IIS PRASISKA A 125.5 A
IMAS SUNENGSIH A 111.5 A
INAH SYINTIA A 131 A
ISMAIL YUSUF A 121 A
KOMARIAH A 131 A
LIA KAMELIA A 150 B
LILIS KARLINA A 120 A
MALA JAMILAH A 157.5 A
MENANTI DEBORA A 130.5 A
MIFTAHUL JANNAH A 131.5 E
MILA OCTAPIANA A 129 E
MISBAHUDIN A 172.5 E
MUHAMAD RAMLI A 195 A
MUHAMAD WILDAN RAMADHAN A 146.5 A
NADILA RAHMA GUSTI RAHAYU A 179 E
NURAENI A 134 E
NURHAPIPAH A 159.5 A
PUJI RAHAYU A 120 A
PUTRI PADILAH A 135.5 A
RATNA SARI A 118 A
REINOLDI DATA A 177.5 A
ROSITA SOLEHA A 137.5 A
SAFITRI A 169 A
SAIDAH TUN TOYYIBAH A 133 A
SITI FATHIYATUL BARKAH A 153.5 A
SITI KHOERUNNISA A 148.5 A
SRI HARTATI A 156 A
TEDI MAHPUDIN A 155.5 A
TRISNAWATI A 151 A
WAHYU INDRA KUSUMA A 142.5 A
WIDIA NINGRUM A 194.5 A
WINTIKA SARI A 122.5 A
MOCHAMAD IRSAL NURILFA
A 165.5 A
JAMIL
AHMAD FAUZI A 141 A
ALIA SAFITRI A 228.5 E
ALMA YULFANI A 108 A
ARIF SUNANDAR A 177.5 A
ASWARI FAIRUZI A 136.5 A
ATIKAH ADAWIYAH A 181 A
AYU AMELIA A 133 A
BAGUS A 135.5 A
DEWI SANTI A 112 A
EGA FADILLAH A 140.5 A
ELSA MARHAMAH A 137 A
FAHRUZI PRATAMA A 209.5 A
FEBI PUSPITA SARI A 145 A
HASMANAH A 147.5 A
INDAH A 132 A
IRNA RAHMADIAH A 189 A
JIMI RICARDO P MANURUNG A 170 A
KUSNIYAH SUSILAWATI A 126.5 A
LIDIAWATI A 117 A
LISA TIANINGRUM A 110 A
MAKMUR ASHARI A 184.5 A
MILENIA A 146.5 A
MUHAMMAD MIFTAHUL MAARIF A 175 E
MUHAMMAD REZA HADI
A 136 A
SAPUTRA
MUJDALIFAH A 177 A
NADIA ROKHALI A 160.5 A
NADILA SARI A 128.5 A
NAILA ANGELANI A 227 A
NENG SANTI OKTAVIANI A 125.5 A
PUTRI ALVIRA A 155 A
RAHMA ALFIRA A 143 A
RENNA DAMAYANTI A 141 A
ROSMIATI A 120.5 A
SAFITRI AMELIA A 127.5 A
SANINGKEM A 170.5 A
SARAH YANISA HUTAPEA A 119.5 A
SITI NURHAPIPAH A 108 A
SITI ROBIATUL ADAWIYAH A 118.5 A
SRI UNTARI SETIANINGSIH A 238 E
TETEN NURDIANSYAH A 256.5 A
UMI SARI A 171 A
WIDYADARA YULIATAMA A 205 A
WILDA FITRIYATUR
A 134 A
ROMADHONA
YAYAH A 139.5 A
ADITIA SULISTIO B 174.5 C
AIDA NURAFRIANI B 173.5 D
ALISAH SUSILAWATI B 133 C
ANISA B 151 C
ARI SOPYAN B 159 C
BARAMULIH MAHENDRA B 154.5 D
BERLIANA RAHAYU B 142 C
DANDY B 118.5 C
DESTY ALFIANI SARI B 149.5 C
DINAR MINDY MEINISSA B 190.5 C
EGIE ALPIYANI B 145 C
EKI SYAHRUDIN B 133 C
FERI IRAWAN B 118 C
HARI ANGGARA B 141.5 C
INTAN JUITA B 130.5 C
JAMALULLAEL B 140.5 C
KARJA SUREJA B 101.5 C
KHUSNUL KHOTIMAH B 130.5 C
M. IFAN RAMADAN B 119 C
MAHDI SAFRI WIJAYA B 126.5 C
MAR'ATUN SOLIHAH B 138 C
MELATI DEWANTI B 167.5 G
MILA ANGGRAINI PS B 145.5 C
MUHAMAD ILHAM B 156.5 C
MUHAMAD RIZKO MUBAROQ B 156 C
MUHAMMAD ERLANGGA B 158 C
NON PRISKA AMELIA SAPITRI B 178 C
NURAENI B 134.5 C
RANTIH B 123.5 G
RIKI FIRMANSYAH B 124.5 G
RIZKY ANANDA PERTIWI B 201 G
SAEPUL HIDAYAT B 105 C
SARMILA B 129 C
SITI AISAH B 149.5 C
SITI KOMARIAH B 168 C
SITI NURROKMAH B 179.5 C
SRI NINGRUM B 151.5 C
SUHERDI B 101.5 G
SUNINGSIH B 126 C
TOPIK AKBAR B 148 C
TRI MAYA B 123.5 C
YUDISTIRA B 179.5 C
YULIA B 159 D
ABDUROHMAN B 124 C
AGNES PRATIWI B 136.5 G
ALFIN FIRDAUS B 192 C
AMIROH PRABAWATI B 158 G
ARI WIDIAWAN SUMARDI B 148 G
BUSTOMI ARIFIN PANIGORO B 163 G
CICIH KOMALASARI B 122.5 C
DENIS KRISTIAWAN B 153 G
DEYA SAFITRI B 129 G
DIWANAH B 160 C
EKA NOVIANTI B 124 C
ERI ERIYANTO B 141.5 G
FRANSON ERNANDO SITORUS B 179.5 C
HENDRIK RIPALDI B 117 C
HOIRUL ANWAR SALEH B 167.5 G
IRMA YULIYANTI B 124 G
LELI HERLINA LUBIS B 159.5 G
KARYADI B 141.5 G
M. RIKO PRATAMA B 107.5 C
MARLIAH B 138.5 C
METTA MAYMUNAH B 109 C
MIMIN MINTARSIH B 166 G
MUHADI B 165.5 G
MUHAMAD JULVI AINU RIJA B 141.5 G
MUHAMAD SUNARDI B 129.5 G
NOVI YANTI RUKMANA B 117 G
NURAENI B 113 G
PUTRI ANDRIYANI B 148.5 C
RESNAWATI B 128 C
REZA GUSTI PAMBEAN B 110.5 C
SAEPUDIN B 130.5 C
SARTIKAH B 126.5 C
SITI FATIMAH B 155 G
SITI ROMLAH B 120.5 C
SRI HARTINI B 151.5 C
SUPRIYATI B 135 G
UMAR NADI B 160.5 D
URNI MELANIA B 146 C
YOVAN RIZKI YUSUF B 156 D
ZAENAL ABIDIN B 104.5 G
FADIEL EKA ARYA KUSUMA B 142.5 C
ABDUL ROJAK B 125 C
AJENG SARTIKA AGUSTIN B 102 C
ALDIANSYAH B 184.5 C
AMANDA AUDITA PRATAMA B 157 G
AZIS MAHPUD B 134 C
DEDE AZHARI B 143 C
DEWI NURYAMAH B 164.5 G
DHEA SYAFITRI B 143 C
DIDI SETIA BUDI B 110.5 C
EGA JUANSARI B 177.5 D
FIKRI MUNAZAT B 142 C
GALIH RIDNO AJIE B 120 C
HENI MULYANI B 151.5 C
JUNAEDI B 118 C
KAMELIA PUTRI B 110 G
KEVIN FEBIANSON B 133.5 C
LISA IMANIYAH B 151 C
M. RIDWAN B 203 C
MARSIH NOVIANTI B 125.5 C
MEGA PITALOKA B 124 C
MELINAH B 96.5 D
MUHAMAD AFRIZAL B 133 C
MUHAMAD MALIK B 110 C
MUHAMAD RUPLI B 123.5 C
NASRUL ARI FAJRI B 123 C
NIA ARSITA B 104.5 C
NOVIYANTI B 100 C
NURHASNI FAUZIAH B 133.5 G
RIA NOVITASARI B 131 G
ROSMALIA FAUZIA B 136.5 C
SANDI SUARDI ROYANA B 165.5 C
SELIYANA APRIDA B 118.5 C
SITI HABIBAH B 127.5 C
SITI NURHALIMAH B 110.5 C
SOPIAH B 131.5 G
SULEKAH B 136 G
SUTAN FACHRIE IRAWAN B 141 C
YAYAH ZAKIYAH B 117 G
YULITA SARI B 138 G
YUSUF B 129 C
INDRA HANDIKA B 205 C
ABDUL RIZKI B 165 C
ALFINA DAMAYANTI B 117 C
ALI MUSTOPA B 157.5 G
ANIPAH B 119.5 C
ANISAH B 124.5 G
ALWAN FAUZI B 179 C
AVITA PRADINI B 112 G
DALIYA B 148.5 C
DANDI SUPRIYADI B 143.5 G
DONNY PRATAMA B 142.5 G
FAISAL EFENDI B 142 G
FARIHIN PADILAH B 141 C
IKA ISNIYATIN SAYIDA B 144.5 G
ISMAIL B 150.5 C
KAKA SURYADIKA B 150.5 C
KARMILAH B 149.5 C
LULUK TOBING B 138.5 C
MAEMUNAH WATI B 126 C
MAHDAN SYAIFUSSALAM B 131 C
MILA AGUSTIN B 123.5 C
MUHAMAD GUNTUR SAKETI B 145.5 C
MUHAMAD RICKO ARDIANSYAH B 155.5 G
MUHAMMAD NUR SIDIK B 145.5 C
NANA YULIYANA B 133 D
NUR HALIMAH B 132.5 D
NURUL ALINA HASAN B 129 C
RATNA JUITA B 180 C
ROHANA B 120.5 C
ROYADI B 153 C
SALMAH ARDILA B 132 G
SEPTI SUSANTI B 152 G
SITI KHOIRIYAH B 118.5 C
SITI NURJANAH B 131.5 G
SOPANDI B 153.5 G
SRI ASTUTI B 127.5 C
SUTEDI SUNJAYA B 158 G
TIARA AMALIA B 166.5 G
WINDY FRASTIKA B 175.5 C
YUSUP FAISAL GINA B 136 C
ZAHRATUL JANNAH ZULFA B 254.5 C
RIZKI MAULANA ISHAK B 225.5 G
DONNY PRATAMA B 225.5 G
FAISAL EFENDI B 225.5 G
FARIHIN PADILAH B 225.5 G
IKA ISNIYATIN SAYIDA B 225.5 G
ISMAIL B 225.5 G
KAKA SURYADIKA B 225.5 G
KARMILAH B 225.5 G
LULUK TOBING B 225.5 G
MAEMUNAH WATI B 225.5 G
MAHDAN SYAIFUSSALAM B 225.5 G
SUTEDI SUNJAYA B 225.5 G
TIARA AMALIA B 225.5 G
SUTEDI SUNJAYA B 225.5 G

Combinepdf+ (3) Compressed+

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Combinepdf+ (3) Compressed+

Diunggah oleh

Hak Cipta:

Format Tersedia

PENERAPAN DATA MINING UNTUK PREDIKSI

KELULUSAN SISWA MENGGUNAKAN ALGORITMA

SEKOLAH TINGGI TEKNOLOGI PELITA BANGSA

Yang disusun oleh

telah disetujui oleh Dosen Pembimbing Skripsi

Dosen Pembimbing 1 Dosen Pembimbing 2

ANDRI FIRMANSYAH, S.Kom, M.Kom ADI RUSDI., S.T., M.T.

Aswan S. Sunge, S.E., M.Kom

JUDUL SKRIPSI PENERAPAN DATA MINING UNTUK PREDIKSI

Yang disusun oleh

telah dipertahankan di depan Dewan Penguji

Susunan Dewan Penguji

Nama Penguji Tanda Tangan

Nama dan gelar penguji 1 __________________

Nama dan gelar penguji 2 __________________

Aswan S. Sunge, S.E., M.Kom

Skripsi tersusun dalam rangka melengkapi salah satu persyaratan dalam

Bekasi, April 2018

HALAMAN JUDUL ....................................................................................................................... i

LEMBAR PERSETUJUAN .......................................................................................................... ii

LEMBAR PENGESAHAN ........................................................................................................... iii

SURAT PERNYATAAN KEASLIAN SKRIPSI ........................................................................ iv

SURAT PERNYATAAN PUBLIKASI KARYA ILMIAH ......................................................... v

MOTTO DAN PERSEMBAHAN ................................................................................................ vi

KATA PENGANTAR ................................................................................................................... vii

DAFTAR ISI ............................................................................................................................. ..... xi

DAFTAR TABEL ........................................................................................................................ xv

BAB 1 PENDAHULUAN ............................................................................................................... 1

1.1 Latar Belakang Penelitian ……….………………………………………..……...……..1

1.2 Identifikasi masalah ...…………...…………………………………………..…………..3

1.3 Rumusan Masalah………...……………………………………………………………..3

1.4 Batasan Masalah…...…………………………………………………………………....4

1.5 Manfaat dan Tujuan Penelitian………………………………………………………….4

1.5.1 Manfaat Penelitian………………………………………………………….....4

1.5.2 Tujuan Penelitian……………………………………………………………...5

1.6 Metodologi Penelitian………………………………………………………………….5

1.6.2 Metode Pengumpulan Data………………………………………………….6

1.7 Sistematika Penulisan………………………………………………………………….6

BAB II TINJAUAN PUSTAKA………..………………………………………………………8

2.1 Tinjauan Studi………………………………………………………………………….8

2.2 Tinjauan Pustaka……………………………………………………………………...12

2.2.1 Penjurusan Siswa………………………………………………………………12

2.2.2 Data Mining……………………………………………………………………13

2.2.2.1 Tahap – Tahap Data Mining …………………………………………...14

2.2.5 Algoritma Naïve Bayes………………………………………………………...21

2.2.6 Rapid Miner……………………………………………………………………24

2.2.7 Microsoft Excel………………………………………………………………..24

2.3 Kerangka Pemikiran………………………………………………………………….26

BAB III METODOLOGI PENELITIA……………………………………………………...27

3.1 Tempat dan Waktu Penelirian………………………………………………………...27

3.1.1 Sejarah Sekolah………………………………………………………………..27

3.1.2 Visi dan Misi Sekolah…………………………………………………………28

3.2 Alat Penelitian………………………………………………………………………..29

3.2.2 Perangkat Lunak………………………………………………………………..29

3.3 Alur Penelitian………………………………………………………………………....30

3.4 Metodologi Data Mining………………………………………………………………32

3.4.1 Permasalahan Bisnis…………………………………………………………….32

3.4.2 Tujuan Data Mining…………………………………………………………….32

3.5 Pemahaman Data………………………………………………………………………33

3.6 Pembersih Data………………………………………………………………………...34

3.7 Transformasi Data……………………………………………………………………..34

3.9 Analisis Data…………………………………………………………………………..35

BAB IV HASIL DAN PEMBAHASAN……….………………………………………………36