Anda di halaman 1dari 90

PENERAPAN DATA MINING UNTUK PREDIKSI

KELULUSAN SISWA MENGGUNAKAN ALGORITMA


NAÏVE BAYES PADA SMA NEGERI 2 SUKATANI

SKRIPSI
Di susun untuk memenuhi sebagian persyaratan mencapai
derajat sarjana S1 pada jurusan teknik informatika

Oleh :

NURDIANA SAFITRI

311410728

TEKNIK INFORMATIKA

SEKOLAH TINGGI TEKNOLOGI PELITA BANGSA

BEKASI

2018

PERSETUJUAN

SKRIPSI
JUDUL SKRIPSI PENERAPAN DATA MINING UNTUK PREDIKSI
KELULUSAN SISWA MENGGUNAKAN ALGORITMA NAÏVE
BAYES PADA SMS NEGERI 2 SUKATANI

Yang disusun oleh

NURDIANA SAFITRI

telah disetujui oleh Dosen Pembimbing Skripsi


pada tanggal 28 Oktober 2018

Dosen Pembimbing 1 Dosen Pembimbing 2

ANDRI FIRMANSYAH, S.Kom, M.Kom ADI RUSDI., S.T., M.T.


NIDN: 0401127203 NIDN: 0415096901

Mengetahui
Kaprodi Teknik Informatika

Aswan S. Sunge, S.E., M.Kom


NIDN : 0426018003

i
PENGESAHAN

SKRIPSI

JUDUL SKRIPSI PENERAPAN DATA MINING UNTUK PREDIKSI


KELULUSAN SISWA MENGGUNAKAN ALGORITMA NAÏVE
BAYES PADA SMS NEGERI 2 SUKATANI

Yang disusun oleh

NURDIANA SAFITRI

telah dipertahankan di depan Dewan Penguji


pada tanggal ……………..

Susunan Dewan Penguji

Nama Penguji Tanda Tangan

Nama dan gelar penguji 1 __________________

Nama dan gelar penguji 2 __________________

Mengetahui
Kaprodi Teknik Informatika

Aswan S. Sunge, S.E., M.Kom


NIDN : 0426018003

ii
PERNYATAAN KEASLIAN PENELITIAN

Saya yang bertandatangan dibawah ini menyatakan bahwa, skripsi ini merupakan
karya saya sendiri (ASLI), dan isi dalam skripsi ini tidak terdapat karya yang
pernah diajukan oleh orang lain untuk memperoleh gelar akademis di suatu
institusi pendidikan tinggi manapun, dan sepanjang pengetahuan saya juga tidak
terdapat karya atau pendapat yang pernah ditulis dan/atau diterbitkan oleh orang
lain, kecuali yang secara tertulis diacu dalam naskah ini dan disebutkan dalam
daftar pustaka.

Segala sesuatu yang terkait dengan naskah dan karya yang telah dibuat adalah
menjadi tanggungjawab saya pribadi.

Bekasi, ………………

Materai 6.000

NURDIANA SAFITRI

NIM: 311410728

iii
KATA PENGANTAR

Puji syukur penulis panjatkan ke hadiran Allah SWT. yang telah melimpahkan
segala rahmat dan hidayah-Nya, sehingga tersusunlah Skripsi yang berjudul
“PENERAPAN DATA MINING UNTUK PREDIKSI KELULUSAN SISWA
MENGGUNAKAN ALGORITMA NAÏVE BAYES PADA SMA NEGERI 2
SUKATANI

”.

Skripsi tersusun dalam rangka melengkapi salah satu persyaratan dalam


rangka menempuh ujian akhir untuk memperoleh gelar Sarjana Komputer
(S.Kom.) pada Program Studi Teknik Informatika di Sekolah Tinggi Teknologi
Pelita Bangsa.

Penulis sungguh sangat menyadari, bahwa penulisan Skripsi ini tidak akan
terwujud tanpa adanya dukungan dan bantuan dari berbagai pihak. Sudah
selayaknya, dalam kesempatan ini penulis menghaturkan penghargaan dan ucapan
terima kasih yang sebesar-besarnya kepada:
1. Bapak Dr. Ir. Suprianto, M.P selaku Ketua STT Pelita Bangsa
2. Bapak Aswan S. Sunge, S.E., M.Kom selaku Ketua Program Studi Teknik
Informatika STT Pelita Bangsa.
3. Bapak Andri Firmansyah, S.Kom., M.Kom selaku Pembimbing Utama yang
telah banyak memberikan arahan dan bimbingan kepada penulis dalam penyusunan
Skripsi ini.
4. Seluruh Dosen STT Pelita Bangsa yang telah membekali penulis dengan
wawasan dan ilmu di bidang teknik informatika.
5. Seluruh staf STT Pelita Bangsa yang telah memberikan pelayanan terbaiknya
kepada penulis selama perjalanan studi jenjang Strata 1.
6. Rekan-rekan mahasiswa STT Pelita Bangsa, khususnya angkatan 2014, yang
telah banyak memberikan inspirasi dan semangat kepada penulis untuk dapat
menyelesaikan studi jenjang Strata 1.
7. Ibu dan Ayah tercinta yang senantiasa mendo’akan dan memberikan
semangat dalam perjalanan studi Strata 1 maupun dalam kehidupan penulis.

iv
Akhir kata, penulis mohon maaf atas kekeliruan dan kesalahan yang terdapat
dalam Skripsi ini dan berharap semoga Skripsi ini dapat memberikan manfaat bagi
khasanah pengetahuan Teknologi Informasi di lingkungan STT Pelita Bangsa
khususnya dan Indonesia pada umumnya.

Bekasi, April 2018

Penulis
DAFTAR ISI

HALAMAN JUDUL ....................................................................................................................... i

LEMBAR PERSETUJUAN .......................................................................................................... ii

LEMBAR PENGESAHAN ........................................................................................................... iii

SURAT PERNYATAAN KEASLIAN SKRIPSI ........................................................................ iv

SURAT PERNYATAAN PUBLIKASI KARYA ILMIAH ......................................................... v

MOTTO DAN PERSEMBAHAN ................................................................................................ vi

KATA PENGANTAR ................................................................................................................... vii

ABSTRAK ..................................................................................................................................... ix

DAFTAR ISI ............................................................................................................................. ..... xi

DAFTAR TABEL ........................................................................................................................ xv

BAB 1 PENDAHULUAN ............................................................................................................... 1

1.1 Latar Belakang Penelitian ……….………………………………………..……...……..1

1.2 Identifikasi masalah ...…………...…………………………………………..…………..3

1.3 Rumusan Masalah………...……………………………………………………………..3

1.4 Batasan Masalah…...…………………………………………………………………....4

1.5 Manfaat dan Tujuan Penelitian………………………………………………………….4

1.5.1 Manfaat Penelitian………………………………………………………….....4

1.5.2 Tujuan Penelitian……………………………………………………………...5

1.6 Metodologi Penelitian………………………………………………………………….5


1.6.1 Metode Liniatur……………………………………………………………….6

1.6.2 Metode Pengumpulan Data………………………………………………….6

1.7 Sistematika Penulisan………………………………………………………………….6

BAB II TINJAUAN PUSTAKA………..………………………………………………………8

2.1 Tinjauan Studi………………………………………………………………………….8

2.2 Tinjauan Pustaka……………………………………………………………………...12

2.2.1 Penjurusan Siswa………………………………………………………………12

2.2.2 Data Mining……………………………………………………………………13

2.2.2.1 Tahap – Tahap Data Mining …………………………………………...14

2.2.3 CRISP-DM…………………………………………………………………….18

2.2.4 Klasifikasi……………………………………………………………………...21

2.2.5 Algoritma Naïve Bayes………………………………………………………...21

2.2.6 Rapid Miner……………………………………………………………………24

2.2.7 Microsoft Excel………………………………………………………………..24

2.3 Kerangka Pemikiran………………………………………………………………….26

BAB III METODOLOGI PENELITIA……………………………………………………...27

3.1 Tempat dan Waktu Penelirian………………………………………………………...27

3.1.1 Sejarah Sekolah………………………………………………………………..27

3.1.2 Visi dan Misi Sekolah…………………………………………………………28

3.2 Alat Penelitian………………………………………………………………………..29


3.2.1 Perangkat Keras……………………………………………………………….29

3.2.2 Perangkat Lunak………………………………………………………………..29

3.3 Alur Penelitian………………………………………………………………………....30

3.4 Metodologi Data Mining………………………………………………………………32

3.4.1 Permasalahan Bisnis…………………………………………………………….32

3.4.2 Tujuan Data Mining…………………………………………………………….32

3.5 Pemahaman Data………………………………………………………………………33

3.6 Pembersih Data………………………………………………………………………...34

3.7 Transformasi Data……………………………………………………………………..34

3.8 Implementasi…………………………………………………………………………..35

3.9 Analisis Data…………………………………………………………………………..35

BAB IV HASIL DAN PEMBAHASAN……….………………………………………………36

4.1 Pengujian Hasil dan Validasi…………………………………………………………..36

4.1.1 Data Keseluruhan……………………………………………………………….36

4.2 Seleksi Data……………………………………………………………………………37

4.3 Pembersih Data………………………………………………………………………...37

4.4 Transformasi Data……………………………………………………………………..38

4.5 Implementasi ………………………………………………………………………….40

4.6 Pengujian Rapid Miner ………………………………………………………………..42


4.7 Algoritma Naïve Bayes………………………………………………………………..53

BAB V PENUTUP…………………………….………………………………………………..57

5.1 Kesimpulan ……………………………………………………………………………57

5.2 Saran…………………………………………………………………………………...57

DAFTAR PUSTAKA………………………………………………………………………...xviii

LAMPIRAN………………………………...………………………………………………...xviii
DAFTAR TABEL

Tabel 2.1. Ringkasan Penelitian .................................................................................................................... 11


Tabel 3.1, Jumlah Siswa Perombelnya………………………………………………………….33
Tabel 3.2, Data Siswa Penjurusan………………………………………………………………34
Tabel 4.1, Data Keseluruhan……………………………………………………………………36
Tabel 4.2, Transformasi Data……………………………………………………………...……38
Tabel 4.3, Inisialisasi IPK……………………………………………………………………….39
Tabel 4.4, Inisialisasi Mapel…………………………………………………………………….39
Tabel 4.5, Data yang Sudah diinisialisasi……………………………………………………….40
Tabel 4.6, Data Training………………………………………………………………………...41
Tabel 4.7, Data Testing..………………………………………………………………………...41
Tabel 4.8, Data Rombel Siswa……………………………………………………………….....54
Tabel 4.9, Data Training………………………………………………………………………...54
Tabel 4.10, Data Training……………………………………………………………………….55
DAFTAR GAMBAR

Gambar 2.1. Tahapan Data Mining……………………………………………………………..15


Gambar 2.2. Siklus Hidup CRIPS-DM…………………………………………………………19
Gambar 2.3. Blok Diagram Model Klasifikasi…………………………………………………21
Gambar 2.4. Kerangka Pemikiran………………………………………………………………26
Gambar 3.1. Struktur Organisasi SMA Negeri 2 Sukatani……………………………………..28
Gambar 3.2. Alur Penelitian……………………………………………………………………30
Gambar 4.1. UI Rapid Miner…………………………………………………………………...42
Gambar 4.2 Memasukan Data Training ke Sofware rapidminer……………………………….43
Gambar 4.3 Import data Ke Rapid Miner………………………………………………………44
Gambar 4.4 Import Data Mining Steep 3……………………………………………………….45
Gambar 4.5 Import Data Mining Steep 4……………………………………………………….46
Gambar 4.6 Import Data Mining Steep 5……………………………………………………….47
Gambar 4.7 File Read CVS …………………………………………………………………….48
Gambar 4.8 Menghubungkan Operator Performance…………………………………………..49
Gambar 4.9 Menjalankan Rapid Miner…………………………………………………………49
Gambar 4.10 Hasil Perhitungan………………………………………………………………...50
Gambar 4.11 Accuracy…………………………………………………………………………51
Gambar 4.12 Accuracy…………………………………………………………………………51
Gambar 4.13 Grafik Scener…………………………………………………………………….52
Gambar 4.14 Cross Validation……………………………………………………………….....53
Gambar 4.15 Menjalankan Rapid Miner………………………………………………………..54
Gambar 4.16 Hasil Shuffled Sampling………………………………………………………….54
Gambar 4.17 Xvalidation Numerical…………………………………………………………...55
BAB 1
PENDAHULUAN

1.1 Latar Belakang Penelitian

Pendidikan merupakan faktor utama dalam pembentukkan pribadi

manusia. Pendidikan sangat berperan dalam membentuk baik atau buruknya

pribadi manusia. Dengan hal tersebut, pemerintah sangat serius menangani

bidang pendidikan, sebab dengan sistem pendidikan yang baik diharapkan

muncul generasi penerus bangsa yang berkualitas dan mampu menyesuaikan

diri untuk hidup bermasyarakat, berbangsa dan bernegara.

Perkembangan zaman pada saat ini terus berkembang pesat, oleh karena

itu pesatnya informasi tentang teknologi seperti contohnya komputer yang

semakin berkembang baik fisik ataupun spesifikasi dari komputer itu sendiri.

Maka dari itu komputer sudah menjadi penunjang bagi setiap perusahaan untuk

membantu para pegawai dalam mengerjakan tugasnya dengan begitu adanya

efisiensi dari segi waktu.

Berdasarkan berlimpah nya data siswa – siswi dan data nilai akademik,

informasi tersembunyi dapat diketahui dengan cara pengelolahan terhadap data

tersebut sehingga berguna bagi pihak sekolah. Pengelolahan data siswa – siswi

perlu dilakukan untuk mengetahui informasi penting berupa pengetahuan baru,

misalnya informasi mengenai pengklasifikasian data siswa – siswi berdasarkan

profil dan data akademik.

1
2

Pengetahuan baru tersebut dapat membantu pihak sekolah untuk melakukan

klasifikasi mengenai prediksi kelulusan siswa – siswi pada tahun berikutnya.

SMA Negeri 2 Sukatani pada tahun 2018 sudah memiliki siswa – siswi

sebanyak 1600 siswa dengan jumlah lulusan 360 pertahunnya. Jumlah tersebut

sudah tidak kecil lagi bagi sekolah yang sudah berusia 7 tahun ini, sekolah ini

tentu memiliki segudang data mengenai siswanya meliputi: data induk siswa

dan data kelulusan siswa. Bertumpuknya data-data ini tentu belum digunakan

secara optimal padahal tumpukan-tumpukan data tersebut dapat dijadikan suatu

informasi yang sangat berharga. Terkadang keperluan akan informasi yang

tinggi tetapi tidak diimbangi dengan penyajiannya. Pemanfaatan informasi

dapat membantu dalam pengambilan keputusan dengan menganalisa

informasi-informasi yang ada. Dengan adanya gudang data yang semakin

banyak maka akan dapat banyak juga menggali potensi-potensi informasi.

Untuk membantu dalam menemukan informasi-informasi berharga itu

diperlukan teknik data mining.

Data mining adalah teknik untuk menemukan dan mendeskripsikan pola-

pola yang ada dalam data sebagai sebuah alat untuk membantu menjelaskan

data tersebut dan membuat prakiraan dari data itu (Witten & Eibe Frank,

2005).

Teknik data mining dengan metode Naive Bayes ini dapat membantu

menemukan informasi tentang kelulusan siswa sehingga dapat membantu

pihak sekolah dalam mencari solusi dan kebijakan untuk meningkatkan

prestasi siswa supaya dapat menyelesaikan studinya dengan tepat waktu.


3

1.2 Identfikasi Masalah

Identifikasi masalah secara umum adalah segala sesuatu yang menjadi

obyek permasalahan yang akan diteliti dengan mempersiapkan alat dan metode

pengumpulan data dan pengolahan data.

Sedangkan rumusan masalah secara umum adalah segala sesuatu

permasalahan yang dihadapi oleh instansi, badan usaha, atau perusahaan

tersebut dan dengan permasalahan tersebut harus bisa ditindak lanjuti demi

tercapainya suatu tujuan instansi, badan usaha, atau perusahaan.

Dari latar belakang masalah yang ada diatas, terdapat beberapa kendala

yang terjadi dalam prediksi kelulusan yang sedang berjalan. adapaun

identifikasi masalahnya adalah sebagai berikut :

8. Belum diterapkannya cara untuk prediksi kelulusan siswa.

9. Siswa yang malas belajar akan menghasilkan nilai yang rendah.

1.3 Rumusan Masalah

Permasalahan yang dibahas dalam penelitian ini adalah

1. Bagaimana mengetahui atau memprediksi kelulusan SMA

Negeri 2 Sukatani menggunakan metode Naive Bayes.

2. Apakan dengan menggunakan metode ini adalah cara yang

efektif?
4

1.4 Batasan Masalah

Pada penelitian ini memiliki batasan-batasan agar tidak menyimpang

dari tujuan pembahasan semula, diantaranya sebagai berikut :

1. Hanya menyajikan informasi tentang ketepatan waktu kelulusan

siswa dalam menempuh studi di SMA Negeri 2 sukatni.

2. Dalam memprediksi atau menemukan pola penulis menggunakan

metode Naive Bayes.

3. Dalam penelitian juga hanya menggunakan beberapa atribut meliputi :

a) Gender : Pria dan Wanita.

b) Jurusan asal sekolah : MIPA dan IPS.

c) Menggunakan nilai Ujian Nasional.

1.5 Manfaat dan Tujuan Penelitian

Maksud dari penelitian ini adalah :

1.5.1 Manfaat Penelitian

Adapun beberapa manfaat yang diharapkan pada penelitian ini adalah:

1. Bagi Penulis

Penulis dapat menerapkan ilmu-ilmu yang diperoleh selama kuliah

salah satunya teknik data mining dalam penelitian ini, serta sebagai

syarat dalam memenuhi tugas akhir jenjang Strata SI.


5

2. Bagi Pembaca

Dapat dijadikan bahan referensi, menambah pengetahuan dan

wawasan pembaca tentang informasi-informasi dalam pembuatan

karya ilmiah.

3. Bagi Kampus Pelita Bangsa.

Dari penelitian ini diharapkan dapat menyajikan informasi tentang

Kelulusan siswa dan mengetahui faktor lain yang dapat

mempengaruhi kelulusan siswa. Sehingga program studi dapat

untuk mengambil kebijakan-kebijakan untuk meningkatkan prestasi

siswa supaya dapat menyelesaikan studinya dengan tepat waktu.

Jika program stadi memiliki lulusan-lulusan terbaik dan dapat lulus

dengan tepat waktu, maka secara otomatis akan dapat membantu

dalam meningkatkan nilai akreditasi sekolah tersebut. Selain itu

Sekolah juga dapat mempromosikan di daerah-daerah yang

mayoritas siswa yang berprestasi.

1.5.2 Tujuan Penelitian

Berdasarkan uraian masalah diatas maka tujuan penelitian ini

adalah tujuan dari penelitian ini adalah malihat jumlah peluang

siswa yang lulus dari sman 2 Suktani.

1.6 Metodologi Penelitian

Dalam melakukan penelitian ini, penulis menggunakan

bebrapa metode.
6

Metode yang digunakan terdiri dari :

1.6.1 Metode Literatur

Dalam penelitian ini penulis penggunakan metode dengan cara

mencari dan mengumpulkan data melalui sumber bacaan atau

literatur seperti jurnal, ebook, serta buku yang berhubungan

dengan Laporan Akhir yang dibuat.

1.6.2 Metode Pengumpulan Data (Survey)

Metode pengumpulan data dilakukan dengan cara melakukan

observasi lapangan. Mengumpulkan data yang ada dilapangan

dengan cara meminta data nilai rapor dan nilai hasil ujian pada

sekolah yang menggunakan penerapan data mining

menggunakan algoritma naïve bayes untuk mendapatkan hal-

hal yang dibutuhkan selama proses pendataan tersebut.

1.7 Sistematika Penulisan

Sistematika penulisan yang diterapkan untuk menyajikan

gambaran singkat mengenai permaslahan yang akan dibahas dalam

penulisan ini, sehingga akan memperoleh gambaran yang jelas tentang

isi dari penulisan,diantaranya :


7

BAB I PENDAHULUAN

Pada bab ini mendeskripsikan mengenai latar belakang

permasalahan, rumusan masalah, batasan masalah, tujuan

penelitian, manfaat penelitian, dan sistematika penulisan.

BAB II TINJAUAN PUSTAKA

Pada bab ini berisi mengenai telaah penelitian dan landasan

teori. Telaah penelitian merupakan menganalisa hasil-hasil

penelitian terdahulu yang dapat digunakan untuk sumber

refrensi. Sedangkan landasan teori merupakan definisi atau

penjabaran suatu teori yang dapat mendukung penelitian ini.

BAB III METODOLOGI PENELITIAN

Pada bab ini menjelaskan tentang analisis metode yang akan

digunakan untuk menyelesaikan rumusan masalah dalam

penelitian ini.

BAB IV HASIL DAN PEMBAHASAN

Pada bab ini berisi hasil dan analisa pengujian program untuk

diuji dan realisasikan.

BAB V PENUTUP

Bab ini berisi tentang kesimpulan dari penelitian tersebut dan

saran-saran yang ditujukan kepada semua pihak yang

bersangkutan.
BAB II

TINJAUAN PUSTAKA

2.1 Tinjauan Studi


Sebelum melakukan penelitian penulis terlebih dahulu melakukan
tinjauan pustaka dari penelitian lain dan penelitian tentang prediksi
penjurusan sekolah menengah atas ini bukanlah penelitian yang pertama
kalinya. Sebelumnya sudah ada penelitian yang membahas mengenai
klasifikasi penjurusan sekolah menengah atas menggunakan metode
algoritma Naive Bayes. Berikut adalah beberapa penelitian yang terkait
dengan masalah tersebut.
Penelitian yang pertama adalah penelitian yang dilakukan oleh
Claudia Clarentina Ciptohartono yang berjudul “Algoritma Klasifikasi
Naive Bayes untuk Menilai Kelayakan Kredit” [7]. Metode yang digunakan
pada penelitian ini adalah Algoritma Naive Bayes. Data yang digunakan
adalah data dari nasabah perusahaan BCA Finance Jakarta tahun 2013. Tool
yang digunakan untuk implementasi sistem adalah matlab. Penelitian ini
menghasilkan bukti bahwa algoritma Naive Bayes bisa diterapkan dalam
pemberian kelayakan kredit pada BCA Finance Jakarta. Tahap pengolahan
data awal dapat menghasilkan akurasi yang tinggi dan menghasilkan akurasi
akhir yang Excellent. Dalam penelitian kelayakan kredit ini pada data awal
dengan melakukan pre-processing mendapatkan akurasi sebesar 85.57%,
tetapi jika data awal dilakukan pengolahan dan dengan melakukan pre-
processing dapat menghasilkan akurasi sebesar 92.53%. Jadi Algoritma
Naive Bayes akan lebih unggul dalam pemberian penilian kelayakan kredit
jika dilakukan proses pengolahan data awal, meskipun algoritma Naive
Bayes adalah algoritma yang sanggup menangani data yang hilang.
Penelitian yang kedua adalah penelitian yang dilakukan oleh Arief
Jananto. Penelitian yang berjudul “Algoritma Naive Bayes untuk Mencari
Perkiraan Waktu Studi Mahasiswa” [8]. Metode yang digunakan pada

8
9

penelitian ini adalah Algoritma Klasifikasi Naive Bayes. Data yang


diperoleh adalah data yang berkaitan dengan keterangan diri dari mahasiswa
UNISBANK dan data nilai semua mata kuliah mahasiswa lulusan tahun
2004-2007. Kesimpulan dari penelitian tersebut adalah sebagai berikut :
a. Ketepatan masa studi mahasiswa diprediksi berdasarkan latar
belakang sekolah sebelumnya dan data akademik, serta pribadi saat
berada diperguruan tinggi.
3. Dalam memprediksi ketepatan studi mahasiswa menggunakan data
training dan testing dengan memanfaatkan fungsi prediksi dari
teknik data mining yaitu menggunakan algoritma klasifikasi Naive
Bayes.
4. Fungsi klasifikasi yang digunakan dalam prediksi ketepatan masa
studi mahasiswa ini mempunyai tingkat kesalahan sebesar 20%
sampai 34%, kesalahan tersebut dapat dipengaruhi oleh jumlah data
training dan testing serta tingkat konsistensi data yang digunakan.
Penelitian yang ketiga adalah peneltian yang dilakukan oleh Yuda
Septian Nugroho. Penelitian yang berjudul “Data Mining Menggunakan
Algoritma Naive Bayes untuk Klasifikasi Kelulusan Mahasiswa Universitas
Dian Nuswantoro” [9]. Teknik yang digunkan merupakan teknik klasifikasi
dan menggunakan algoritma Naive Bayes, tujuan dari penelitian tersebut
adalah mengklasifikasi kelulusan mahasiswa Udinus Fakultas Ilmu
Komputer angkatan tahun 2009. Hasil dari penelitian ini dengan
menggunakan metode klasifikasi Naive Bayes dan dataset berupa data
mahasiswa Universitas Dian Nuswantoro Fakultas Ilmu Kompur angkatan
tahun 2009, mendapatkan hasil akurasi kelulusan sebesar 82.08%. Data
yang kurang kompleksitas menyebabkan model dapat memprediksi cukup
akurat.
Penelitian yang ketiga adalah penelitian yang dilakukan Faid Ari
Prastya yang berjudul “Penerapan Algoritma C4.5 Untuk Prediksi Jurusan
Siswa SMAN 3 Rembang”[10]. Algoritma yang digunakan pada penelitian
ini adalah Algoritma C4.5. Data yang digunakan adalah data siswa SMAN 3
10

Rembang tahun ajaran 2014/2015. Berdasarkan hasil pengujian


menggunakan algoritma C4.5 didapat akurasi ketepatan hasil prediksi
sebesar 74,65%. Dengan jumlah true positif (tp) sebanyak 107 record, false
positif (fp) sebanyak 34 record. Jumlah true negative (tn) sebanyak 108
record dan jumlah false negative (fn) sebanyak 39 record. Jadi klasifikasi
data siswa baru Sekolah Menengah Atas Negeri 3 Rembang Tahun Ajaran
2014 / 2015 dengan algoritma C4.5 bisa menjadi pendukung keputusan yang
digunakan oleh pihak Sekolah Menengah Atas Negeri 3 Rembang dalam
proses penetuan jurusan siswa.

Penelitian yang terakhir adalah penelitian yang dilakukan Dina


Maurina yang berjudul “Penerapan data mining untuk rekomendasi
beasiswa pada sma muhammadiyah menggunakan algoritma C4.5”[11].
Pada penelitian ini, penerapan algoritma klasifikasi C4.5 telah
diimplementasikan menggunakan bahasa pemrograman PHP. Dibawah ini
merupakan hasil implementasinya. Dari hasil yang di dapatkan, untuk data
training dan data testing 80%:20% yaitu data training sebanyak 88 dan data
testing sebanyak 22, mendapatkan akurasi yang cukup baik yaitu 77%,
precision 83%, recall 55%, dan FMeasure 66%. Penerapan metode pohon
keputusan terhadap data siswa SMA Muhammadiyah Gubug memiliki
tingkat akurasi yang cukup baik dalam menyelesaikan klasifikasi
rekomendasi beasiswa, dengan demikian metode pohon keputusan
merupakan metode yang cukup sesuai untuk penyelesaian studi kasus dalam
pemilihan siswa yang mendapatkan rekomendasi beasiswa. Tingkat akurasi
yang dihasilkan oleh metode tersebut adalah 77%.
11

Tabel 2.1 : Ringkasan Penelitian

Peneliti Judul Metode Tahun


Claudia Clarentia Algoritma Klasifikasi Algoritma Naïve 2014
Ciptohartono Naive Bayes Untuk Bayes Classifier
Menilai Kelayakan
Kredit
Arief Jananto Algoritma Naive Algoritma Naive 2013
Bayes untuk Mencari Bayes
Perkiraan Waktu Studi
Mahasiswa
Yuda Septian Data Mining Algoritma Naive 2014
Nugroho Menggunakan Bayes
Algoritma Naive bayes
Untuk Klasifikasi
Kelulusan Mahasiswa
Universitas Dian
Nuswantoro
Faid Ari Prastya Penerapan Algoritma Algoritna C4.5 2015
C4.5 Untuk Prediksi
Jurusan Siswa SMAN
3 Rembang
Penerapan data mining
Dina Maurina untuk Algoritma Naive
rekomendasi beasiswa
pada Bayes
beasiswa pada
menggunakan
algoritma C4.5

Tabel 2.1 : Ringkasan Penelitian


12

Berikut adalah perbedaan penelitian yang penulis teliti


dengan penelitian sebelumnya adalah :
3. Data yang digunakan oleh penulis dalam penelitian ini adalah data
siswa SMA Negeri 2 Sukatani Tahun Ajaran 2017/2018 yang
menggunakan kurikulum 2013.
4. Data yang dianalisa dan diproses oleh penulis akan dijadikan untuk
klasifikasi kelulusan siswa di SMAN 2 Sukatani dengan parameter
yang digunakan berupa data nilai Ujian Nasional dan Nilai Ujian
Sekolah.
5. Metode yang digunakan penulis dalam penelitian ini adalah
algoritma klasifikasi Naive Bayes, yang digunakan untuk
mengklasifikasi kelulusan di SMA Negeri 2 Sukatni . Untuk melihat
tingkat keakurasian data yang diteliti penulis menggunakan tools
Rapidminer untuk mengolah data dalam klasifikasi kelulusan siswa
SMA Negeri 2 Sukatani.

2.2 Tinjauan Pustaka

2.2.1 Penjurusan Siswa


Peminatan siswa adalah proses dalam pengambilan keputusan
dan pilihan oleh siswa dalam bidang keahlian yang didasarkan atas
pemahaman potensi diri dan peluang yang ada. Dalam konteks ini,
bimbingan dan konseling membantu siswa untuk memahami diri,
menerima diri, mengarahkan diri, mengambil keputusan diri,
merealisasikan keputusannya secara bertanggung jawab.
Implementasi kurikulum 2013 akan dapat menimbulkan masalah
bagi siswa SMA/MA dan SMK yang tidak mampu dalam
menetapkan pilihan peminatan, baik pemintaan kelompok mata
pelajaran, peminatan lintas mata pelajaran maupun pendalaman mata
13

pelajaran secara tepat, sehingga akan menimbulkan kesulitan dan


kecenderungan gagal dalam belajar [11].
Penetapan pilihan peminatan kelompok mata pelajaran,
pemintaan lintas mata pelajaran, dan pemintan pedalaman materi
mata pelajaran harus sesuai dengan kecerdasan, bakat, minat dan
kecenderungan pilihan masing-masing siswa agar proses belajar
berjalan dengan baik dan berhasil dalam belajar. Oleh karena itu
peminatan sangat diperlukan bagi siswa agar dapat menetapkan
pilihan peminatan sesuai kemampuan potensi yang dimilikinya dan
kemungkinan berhasil dalam belajar.

2.2.2 Data Mining


Data mining merupakan proses penggunaan teknik statistik,
matematika, artificial intelligence (kecerdasan buatan) dan machine
learning yang digunakan untuk mengekstrak serta mengidentifikasi
informasi yang bermanfaat dan pengetahuan yang terkait dari
berbagai database besar [12].
Berikut merupakan karakteristik dari data mining :
4. Data mining berhubungan dengan penemuan sesuatu
yang tersembunyi dan pola data tertentu yang belum
diketahui sebelumnya.
5. Data mining dapat menggunakan data yang sangat besar.
Data yang sangat besar biasanya digunakan untuk
membuat hasil data mining yang lebih terpercaya.
6. Data mining berguna untuk membuat suatu
keputusan yang kritis, terutam dalam hal strategi.

Data mining mempunyai beberapa teknik berdasarkan tugas


yang dilakukan dan setiap teknik mempunyai algoritma masing-
14

masing. Berikut adalah teknik dalam data mining yang terbagi menjadi
enam kategori [9] :
2. Deskripsi
Para peneliti biasanya mencoba menemukan cara untuk
mendeskripsikan pola dan trend yang tersembunyi dalam data.
3. Estimasi
Teknik estimasi ini mirip dengan teknik kasifikasi, kecuali variabel
tujuan lebih kearah numerik dari pada kategori.
4. Prediksi
Prediksi memiliki kemiripan dengan estimasi dan klasifikasi. Namun
prediksi hasilnya menunjukan sesuatu yang belum pernah terjadi atau
mungkin terjadi dimasa depan.
5. Klasifikasi
Dalam klasifikasi variabel, tujuan bersifat kategorik. Contoh, kita akan
mengklasifikasi penghasilan dalam tiga kelas, yaitu penghasilan tinggi,
penghasilan sedang dan penghasilan rendah.
6. Klastering
Klastering lebih ke arah pengelompokan record, pengamatan dan kasus
dalam kelas yang memiliki kemiripan.
7. Asosiasi
Asosiasi mengidentifikasi hubungan antara berbagai peristiwa yang
terjadi pada satu waktu.

2.2.2.1 Tahap-tahap Data Mining


Data mining dapat dibagi menjadi beberapa tahap, Tahap
data mining dilakukan sebagai suatu rangkaian proses. Tahap-
tahap tersebut bersifat interaktif dimana pemakai terlibat langsung
atau dengan perantaraan knowledge base [13]. Berikut adalah
tahap-tahap dalam data mining :
15

Gambar 2.1 : Tahapan Data Mining

Keterangan:
4. Pembersihan Data
Pembersihan data dilakukan untuk menghilangkan noise dan data yang
tidak konsisten atau tidak relevan. Sering kali data yang diperoleh dari
database suatu perusahaan maupun diperoleh melalui hasil eksperimen,
memiliki isian-isian data yang tidak lengkap seperti data yang hilang,
tidak valid dan atau hanya salah ketik. Selain itu terdapat atribut-atribut
data yang tidak relevan dengan
16

hipotesa data mining yang dimiliki. Data-data yang tidak


relevan lebih baik dibuang dan tidak digunakan dalam
proses. Pembersihan data akan mempengaruhi
performasi dari teknik data mining. Karena data yang
diproses akan berkurang jumlah dan kompleksitasnya.
2. Integrasi Data
Integrasi data merupakan penggabungan data dari
berbagai database ke dalam satu database yang baru.
Data yang digunakan dalam data mining tidak hanya
didapatkan dari satu database namun juga didapatkan
dari beberapa database atau file teks. Integrasi data dapat
dilakukan pada atribut-atribut yang mengidentifikasikan
entitas-entitas yang unik seperti atribut nama, jenis
produk, nomer pelanggan dan lainya. Dalam melakukan
integrasi data harus dilakukan dengan cermat agar hasil
tidak menyimpang dan menyesatkan pengambilan aksi
nantinya. Sebagai contoh bila integrasi data berdasarkan
jenis produk namun menggabungkan produk dari
kategori yang berbeda, maka akan didapatkan korelasi
antar produk yang sebenarnya tidak ada. Dalam
melakukan integrasi data diperlukan transformasi dan
pemberisihan data dikarenakan sering kali data dari dua
database berbeda cara penulisannya dan bahkan data
yang ada disatu database tidak ada di database lainya.
3. Seleksi Data
Tidak semua data yang ada dalam database dipakai, oleh
sebab itu hanya data yang sesuai akan diambil untuk
dianalisa. Sebagai contoh sebuah kasus yang meneliti
faktor kecenderungan orang membeli dalam kasus
market basket analisis, tidak perlu mengambil nama
pelanggan, tetapi cukup dengan id pelanggan.
17

4. Transformasi Data
Beberapa teknik data mining memerlukan format data yang khusus
sebelum dapat diaplikasikan. Sebelum diproses dalam data mining
data akan diubah dan di digabungkan ke dalam format yang
sesuai. Beberapa metode data mining memerlukan format data
khusus agar dapat diaplikasikan. Sebagai contoh beberapa metode
standar seperti analisis asosiasi dan clustering hanya bisa
menerima input data kategorikal. Karenanya data berupa angka
numerik yang berlanjut perlu dibagi-bagi menjadi beberapa
interval. Dalam proses ini sering disebut transformasi data.
Transformasi dan pemilihan data ini menentukan kualitas dari
hasil data mining nantinya, karena ada beberapa karakteristik
teknik data mining tertentu yang tergantung pada tahap ini.
5. Proses Mining
Tahap ini merupakan proses utama saat metode
diterapkan untuk menemukan informasi atau
pengetahuan yang berharga dan tersembunyi dari data.
6. Evaluasi Pola
Untuk mengidentifikasi pola-pola menarik kedalam
knowledge based yang ditemukan. Dalam tahap ini hasil
dari teknik data mining berupa pola-pola yang khas
ataupun model prediksi akan dievaluasi untuk menilai
apakah hipotensa yang ada memang tercapai. Namun bila
hasil yang didapatkan tidak sesuai hipotesa maka akan
dilakukan beberapa alternatif, seperti menjadikan umpan
balik untuk memperbaiki proses data mining, mencoba
metode data mining lain dan menerima hasil ini sebagai
hasil yang diluar dugaan yang mungkin bermanfaat.
18

7. Presentasi Pengetahuan
Tahap yang terakhir dari proses data mining adalah
bagaimana memformulasikan keputusan atau aksi dari
hasil analisis yang didapat. Visualisasi dan penyajian
pengetahuan mengenai metode yang digunakan untuk
memperoleh pengetahuan yang diperoleh pengguna. Ada
kalanya hal ini harus melibatkan orang-orang yang tidak
memahami tentang data mining. Karenanya presentasi
hasil data mining dalam bentuk pengetahuan yang
mampu dipahami semua orang dalam satu tahapan yang
diperlukan dalam proses data mining. Dalam presentasi
ini,visualisasi juga dapat membantu mengkomunikasikan
hasil dari data mining

2.2.3 CRISP-DM (Cross Industry Standart Process for Data Mining)


CRISP-DM (Cross Industry Standard Process for Data
Mining) adalah suatu konsorsium perusahaan yang didirikan oleh
Komisi Eropa pada tahun 1996 dan sudah ditetapkan sebagai proses
standar dalam data mining yang bisa diaplikasikan diberbagai sektor
industri. Berikut merupakan gambar dari proses siklus hidup
pengembangan dari CRISP-DM [12] :
19

Gambar 2.2 : Siklus Hidup CRISP-DM

Berikut merupakan tahap dari siklus pengembangan data mining


CRISP-DM :
1. Business Understanding
Tahap pertama adalah memahami tujuan dan kebutuhan dari
sudut pandang bisnis. Kemudian pengetahuan ini diterjemahkan
kedalam pendefinisian masalah dalam data mining. Selanjutnya
akan ditentukan rencana dan strategi untuk mencapai tujuan
tersebut.
2. Data Understanding
Pada tahap ini dimulai dengan pengumpulan data kemudian
dilanjutkan dengan proses untuk mendapatkan pemahaman yang
mendalam tentang data, mengidentifikasi masalah kualitas data,
dan untuk mendeteksi bagian menarik dari data yang dapat
digunakan untuk hipotesa untuk informasi yang tersembunyi.
20

3. Data Preparation
Tahap ini meliputi semua kegiatan untuk membangun dataset
akhir (data yang akan diperoleh pada modeling) dari data
mentah. Data preparation ini dapat diulang beberapa kali.
Dalam tahap ini juga mencakup pemilihan tabel, record, dan
atribut-atribut data, termasuk juga proses pembersihan dan
transformasi data untuk kemudian dijadikan masukan dalam
tahap modeling.
4. Modeling
Pada tahap ini dilakukan pemilihan dan penerapan berbagai
teknik pemodelan dan beberapa parameternya akan disesuaikan
untuk mendapatkan nilai yang optimal. Secara khusus, ada
beberapa teknik berbeda yang dapat diterapkan untuk masalah
data mining yang sama. Dipihak lain ada teknik pemodelan yang
membutuhkan format data khusus. Sehingga memungkinkan
pada tahap ini dapat kembali ke tahap sebelumnya.

5. Evaluation
Pada tahap evaluation ini model sudah terbentuk dan diharapkan
memiliki kualitas baik jika dilihat dari sudut pandang analisa
data. Dalam tahap ini sebelum model digunakan apakah model
dapat mencapai tujuan yang ditetapkan pada fase awal yaitu
Business Understanding akan dilakukan evaluasi terhadap
keefektifan dan kualitas model. Kunci pada tahap ini adalah
menentukan apakah ada masalah bisnis yang belum
dipertimbangkan.
6. Deployment
Pada tahap ini pengetahuan dan informasi yang telah diperoleh
akan diatur dan dipresentasikan dalam bentuk khusus, sehingga
dapat digunakan oleh pengguna. Tahap deployment dapat berupa
pembuatan laporan sederhana atau mengimplementasikan proses
21

data mining yang berulang dalam perusahaan. Dalam banyak


kasus, tahap deployment melibatkan konsumen, disamping
analisis data, karena sangat penting bagi konsumen untuk
memahami tindakan apa yang harus dilakukan untuk
menggunakan model yang telah dibuat.

2.2.4 Klasifikasi
Klasifikasi merupakan salah satu tugas yang penting dalam
data mining. mengorganisasikan serta mengelompokan data ke dalam
kelas-kelas yang berbeda merupakan tujuan utama dari klasifikasi.
Definisi pengklasifikasian adalah sebuah fungsi yang bersifat
prediksi dan menggolongkan data item tertentu ke dalam sebuah
kelas. Sebuah pengklasifikasian dibuat dari sekumpulan data latih
dengan kelas yang telah ditentukan dan dikenal ciri-cirinya
sebelumnya. Performa pengklasifikasian biasanya diukur dengan
ketepatan [14].

Gambar 2.3 : Blok Diagram Model Klasifikasi

2.2.5 Algoritma Naive Bayes


Algoritma Naive Bayes adalah salah satu algoritma yang
terdapat pada teknik data mining klasifikasi. Naive bayes merupakan
pengklasifikasian dengan metode probabilitas dan statistik yang
dikemukakan oleh ilmuan Inggris yaitu Thomas bayes, Naive Bayes
memprediksi peluang dimasa depan berdasarkan pengalaman dimasa
sebelumnya, sehingga dikenal dengan Teorema Bayes.
22

tersebut dikombinasikan dengan Naive dimana diasumsikan kondisi


antar atribut saling bebas. Klasifikasi Naive Bayes diasumsikan
bahwa ada atau tidak ciri tertentu dari sebuah kelas tidak ada
hubungannya dengan ciri dari kelas lainnya [15]. Persamaan dari
teorema Bayes adalah :
P(H|X)= P(H|X).P(H)
P (X)

Keterangan :

X : Data dengan class yang belum diketahui


H : Hipotesis data X merupakan suatu class spesifik
P(H|X) : Probabilitas hipotesis H berdasar kondisi X (posteriori
probability)
P(H) : Probabilitas hipotesis H (prior probability)
P(X|H) : Probabilitas X berdasarkan kondisi pada hipotesis H
P(X) : Probabilitas X

Adapun alur dari metode Naive Bayes adalah sebagai berikut :


1. Baca data training
2. Hitung Jumlah dan probabilitas, namun apabila data
numerik maka:
a. Cari nilai mean dan standar deviasi dari masing – masing
parameter yang merupakan data numerik.
b. Cari nilai probabilistik dengan cara menghitung jumlah data
yang sesuai dari kategori yang sama dibagi dengan jumlah data
pada kategori tersebut.
3. Mendapatkan nilai dalam tabel mean, standar deviasi
dan probabilitas.
23

Sedangkan untuk menghitung data yang bersifat kontinyu,


maka menggunakan rumus Densitas Gauss :

RapidMiner adalah salah satu software untuk pengolahan data mining.

Pekerjaan yang dilakukan oleh RapidMiner text mining adalah berkisar dengan

analisis teks, mengekstrak pola-pola dari data set yang besar dan

mengkombinasikannya dengan metode statistika, kecerdasan buatan, dan database.

Tujuan dari analisis teks ini adalah untuk mendapatkan informasi bermutu tertinggi

dari teks yang diolah.


24

2.2.6 Rapid Miner

Rapid miner menyediakan prosedur data mining dan machine

learning, di dalamnya termasuk: ETL (extraction, transformation,

loading), data preprocessing, visualisasi, modelling dan evaluasi. Proses

data mining tersusun atas operator-operator yang nestable,

dideskripsikan dengan XML, dan dibuat dengan GUI. Penyajiannya

dituliskan dalam bahasa pemrograman Java.(dkk Aprillia,

C.Dennis.2013).

2.2.7 Microsoft Excel

Pengertian Microsoft Excel adalah sebuah program atau

aplikasi yang merupakan bagian dari paket installasi Microsoft Office,

berfungsi untuk mengolah angka menggunakan spreadsheet yang terdiri

dari baris dan kolom untuk mengeksekusi perintah. Microsoft Excel

telah menjadi software pengolah data / angka terbaik di dunia, selain itu

Microsoft Excel telah didistribusikan secara multi-platform. Microsoft

Excel tidak hanya tersedia dalam platform Windows, Microsoft Excel

juga tersedia di MacOS, Android dan Apple.


25

Fungsi Microsoft Excel :

a. Membuat, mengedit,
mengurutkan, menganalisis,

meringkas, dan memformat data serta grafiknya.

b. Membuat catatan keuangan dan anggaran keuangan.

c. Menghitung dan mengelola investasi, pinjaman, penjualan,

inventaris, dll.

d. Melakukan analisa dan riset harga.

e. Melakukan perhitungan statistika.

f. Membantu berbagai sektor bisinis untuk mempermudah

melakukan laporan keuangan.

g. Membuat daftar nilai sekolah maupun universitas.

h. Konversi mata uang.

2.2.8 Pengujian Cross Validation


Validation merupakan proses untuk mengevaluasi
keakurasian prediksi dari model data mining. Validasi digunakan
untuk mendapatkan prediksi menggunakan model yang sudah ada
dan kemudian membandingkan hasil tersebut dengan hasil yang
sudah diketahui, ini mewakili langkah paling penting dalam proses
membangun sebuah model [16].
Cross Validation merupakan teknik validasi dengan
membagi data secara acak ke dalam k bagian dan masing-masing
bagian akan dilakukan proses klasifikasi. Dalam Cross Validation,
jumlah tetap lipatan atau partisi dari data ditentukan sendiri. Cara
standar untuk memprediksi error rate dari teknik pembelajaran dari
sebuah sampel data tetap adalah dengan menggunakan tenfold cross
validation.
26

2.3 Kerangka Pemikiran


Penulis perlu membuat gambaran singkat sebagai alur
penyusunan laporan ini dengan kerangka pemikiran sebagai berikut:

Masalah Studi Pustaka


Penerapan Kurikulum 2013 untuk Buku dan Jurnal tentang data
penjurusan siswa SMA mining dan penjurusan siswa

Tindakan

Membuat sistem pendukung keputusan yang


dapat digunakan oleh pihak sekolah untuk
membantu proses penjurusan siswa

Metode
Algoritma Naive Bayes

Penerapan
Data Siswa SMA Negeri 2 Sukatani

Tool

RapidMiner Studio

Hasil
Klasifikasi Kelulusan siswa

Gambar 2.4 : Kerangka Pemikiran.


BAB III

METODOLOGl PENELITIAN

3.1 Tempat dan waktu Penelitian

Penelitian ini dilaksanakan di SMA Negeri 2 Sukatani Rencana

penelitian ini tentang penerapan data mining untuk mempredikdi nilai

kelulusan siswa menggunakan metode naive bayes pada sma negeri 2

sukatani yang akan dilaksanakan kurang lebih 3 bulan, yaitu di mulai bulan

mei – juli 2018. Penelitian ini dilaksanakan di SMA Negeri 2 Sukatani.

3.1.1 Sejarah sekolah

SMAN 2 SUKATANI Secara Sah berdiri pada tanggal 21 Januari

2007 , terdiri dari 3 gedung Belajar , 1 ruang kantor , 1 ruang guru. Dan

tahun berikut nya bertambah gedung untuk pembelajaran yang dibawah

pimpinan bpk Ilham,Mpd, dan sekarang dipimpin oleh Drs.H.ATO

SUNARYO, M.Pd , SebagaI Wakasek Kurikulim Retno Harjanti,S.Pd dan

Bapak Ridwan, S.Pd sebagai kasubag tata usaha.

Perjalanan SMAN 2 SUKATANI Semakin Mantap . guru-guru

semakin banyak dan staf berdatangan, dan fasilitas semakin bertambah.

27
28

3.1.2 Visi dan Misi Sekolah

1. VISI
“Unggul dalam pengembangan diri , berkarakter, berakhlak
mulia,berbudi pekerti luhur, bernuansa iman dan takwa terhadap tuhan yang
esa”
2. MISI
10. Menciptakan suasana lingkungan yang kondusif sehingga terwujud suatau
lingkungan yang harmonis , siswa dan guru.
11. menumbuhkembangkan semangat yang kuat serta berkarakter, berakhlak
mulia dan bernalar sehat untuk mencerdaskan peserta didik, guru dan
karyawan sehingga berkamauan kuat untuk terus maju.
12. meningkatkan komitmen seluruh pendidik dan tenaga kependidikan
terhadap tugas pokok dan fungsinya.
13. mengembangkan teknologi informasi dan komunikasi dalam pembelajaran
dan sistem administrasi sekolah (SAS).

Gambar 3.1 Struktur Organisasi SMA Negeri 2 Sukatani

Sumber : admin SMA Neger 2 Sukatani


29

3.2 Alat Penelitian

Alat yang digunakan untuk melakukan penelitian ini berupa perangkat keras

dan lunak.

3.2.1 Perangkat Keras

3. Computer Name : DIAN PC

4. Operating System : Windows 7 Ultimate 32-Bit (6.1, Build 7601)

5. Memory : 2048 MB Random Acces Memory (RAM)

6. System Model : 1215P

3.2.2 Perangkat Lunak

4. Operating system windows 10

5. RapidMiner
30

3.3 Alur Penelitian

Dalam melakukan penelitian ini, peneulis menerapkan alur penelitian yang

dapat dilihat pada tabel Berrikut :

Tujuan Penelitian

Studi Literatur Identifikasi Masalah

Kumpulan Data

Data Training

Data Mining

Hasil Prediksi

Evaluasi

Selesai

Gambar 3.2 Alur Penelitian

Sumber : admin SMA Negeri 2 Sukatani


31

Tahapan pertama yang dilakukan dalam melksanakan penelitian ini adalah

melakukan studi literatur dengan cara mempelajari teori dan pengetahuan dasar

mengenai semua yang berkaitan dengan penelitian ini agar dapat memahami dasar –

dasar dan konsep – konsep yang mendukung penelitian.

Tahap kedua yaitu identifikasi masalah pada tahap ini proses yang dilakukan

adalah menggali permasalahan yang ditemukan pada objek yang diteliti serta

mengidentifikasi kebutuhan yang di butuhkan oleh pengguna guna mencari alternatif

solusi yang terkait dengan permasalahan tersebut.

Tahap ketiga yaitu pengumpulan data, setelah tahap identifikasi masalah

dilakukan dan semua kebutuhan sudah didapatkan maka tahap selanjutnya yang harus

dilakukan adalah pengumpulan data. Data yang dibutuhkan dalah data diri siswa dan

data nilai siawa. Sumber data di dapatkan dari SMA Negeri 2 Sukatani.

Tahap keempat yaitu membuat data training / latih dari data – data yang sudah

di kumpulkan, karena tidak semua data dibutuhkan untuk pengujian model.

Tahap kelima yaitu membuat data mining yang digunakan untuk memilih

teknink dan algoritma yang sesuai untuk untuk menemukan pola yang berharga dan

tersembunyi dari data siswa dengan algoritma naive bayes.

Tahap keenam adalah hasil prediksi dari penerapan data mining dengan

algoritma naive bayes.

Tahap ketujuh yaitu evaluasi, pada tahap ini dilakukannya evaluasi untuk mengetahui

apakan teknik dan algoritma yang digunakan sudah sesuai untuk digunakan dalam

penelitian sehingga bisa menemukan pola hubungan antar nilai siswa dengan data

dari latar bela ang siswa yang bermanfaat untuk menentukan kelulusan.
32

3.4 Metodologi Data Mining

Data mining metodelogi yang sudah banyak digunakan dalam

pembangunan data mining yakni CRISP-DM (Cross Industry Standard

Prosess Model For Data Mining), terdiri dari enam fase yaitu pemahaman

bisninis (Bussines Understanding), pemahaman data (data Understanding),

persiapan data (data Preparation), pemodelan (modelling), evaluasi

(Evaluation), penyebaran (deployment) (Elkan,C.2014, Predictive Analytics

and data mining, p. 17).

3.4.1 Permasalahan bisnis

Prestasi merupakan salah satu elemen terpenting dalam proses kegiatan

pembelajaran disuatu lembaga pendidikan. Sekolah menggunakan nilai hasil

ujian untuk menentukan kelulusan. Nalai tersebut juga berpengaruh dari

prikalu siswa disekolah. Maka SMA Negeri 2 Sukatani perlu memperhatikan

nilai siswanya dan melakukan predisi secara dini untuk mendapatakan

informasi yang akurat dalam memprediksi benyaknya tingkat kelulusan maka

dapat memenuhi sasaran mutu yang telah ditetapkan.

3.4.2 Tujuan data mining

Memprediksi kelulusan siswa dengan menggunakan metode klasifikasi

dengan algoritma naive bayes untuk memenuhi siswa yang lulus dan tidak

lulus . dengan begitu SMA Negeri 2 Sukatani dapat mendorong siswa agar

dapat lulus tepat waktu sehingga mempermudah siswa agar dapat menempuh

pendidikan lebih lanjut.

33
3.5 Pemahaman Data (Data Understanding)

Data yang digunakan dalam penelitian ini didapat dari dua sumber,

yaitu data biodata siswa dan data akademik siswa . Kedua data tersebut

adalah daftar data siswa SMA Negeri 2 Sukatani tahun2018 yang masih

aktif. Ini adalah tabel jumlah siswa yang sudah dibagi menjadi beberapa

rombel, seperti pada tabel 3.1 dan 3.2 adalah data tabel siswa perjurusan .

Tabel 3.1 Jumlah siswa perrombel nya.

ROMBEL L P JML

: XII-IPA-1 12 33 45

: XII-IPA-2 12 33 45

: XII-IPA-3 13 33 46

: XII-IPA-4 10 34 44

JUMLAH IPA 47 133 180

: XII-IPS-1 19 24 43

: XII-IPS-2 20 21 41

: XII-IPS-3 19 23 42

: XII-IPS-4 32 22 54

JUMLAH IPS 90 90 180

JUMLAH KLS-XII 137 223 360


34

Tabel 3.2 Data siswa perjurusan

MAPEL IPA / IPS

KIMIA 21

FISIKA 3

BIOLOGI 156

EKONOMI 11

SOSIO 106

GEOGRAFI 63

3.6 Pembersihan Data

Setelah tahap pengumpulan data dan filter data maka tahap selanjutnya

yauitu cleaning data agar tidak ada duplikasi data, memeriksa data yang

inkosisten dan memperbaiki kesalahan pada saat seperti kesalahan cetak,

sehingga data tersebut dapat diolah dan dilakukan proses data mining. Setelah

semua data yang dibutuhkan telah memaliu tahap cleaning data maka data

akan disimpan dalam dataset baru yang menggunakan Microsoft Office Excel.

Data yang diambil dari jurusan IPA dan IPS ini ada data yang unknown yaitu

data dari atribut alamat dan data asala sekolah sebanyak 360 data.

3.7 Transformasi Data


35

Data diubah atau digabung ke dalam format yang sesuai untuk diproses daiam data

mining karena beberapa metode data mining membutuhkan forrnat data yang khusus

sebelum bisa diaplikasikan. Dalam penelitian ini data akan diubah ke dalam format csv

melalui excel. Transformasi data dapat memudahkan proses mining di softxxare

Rapidminer.

3.8 Implementasi

Merupakan suatu proses utama saat metode ini dilakukan untuk menemukan

pengetahuan berharga atausebuah infonnasi dari data. Teknik yang digunakan pada

proses mining ini adalah prediksi dengan menggunakan algoritma Na'íve fíayes dan

software yang digunakan dalam proses mining ini yaitu RapidMiner

3.9 Analisis Data

Data yang didapatkan dari proses tahapan-tahapan data mining kemudian

diolah kembali menggunakan Rapidminer untuk mendapatkan hasil analisis yang

lebih akurat. Attribut yang diuji adalah nilai IPK siswa kelas XII angkatan 2018

yang belum dinyatakan lulus, jenis kelamin, jurusan IPK dan mapel sebagai data

traning. Kemudian attribut yang digunakan untuk data testing adalah nilai IPK

siswa XII angkatan 2018 yang belum lulus.

BAB IV
HASIL DAN PEMBAHASAN
4.1. Pengujian Hasil dan Validasi

4.1.1 Data Keseluruhan

Data keseluruhan merupakan kumpulan data antribut beserta

kelasnya, yang akan dibagi menjadi data training dan data testing.

Data training digunakan untuk proses learning dalam pembuatan

naïve bayes, sedangkan data testing digunakan dalam proses

pengujian. Data berasal dari admin tata usaha SMAN 2 Sukatani

yang berbentuk excel. Seperti table 4.1.

Tabel 4.1 Data Keseluruhan


NO_UJIA TEMPAT_ TGL_ MA JUMLAH
NO PRGM BIN ING PLH Maple
N LAHIR LAHIR T NILAI
ILMU
12-022- 8 Juli 48.0 125.0
PENGETAHUAN
1 025-8 Bekasi 2000 ALAM 22.0 22.5 32.5 Biologi
ILMU
12-022- 15 April PENGETAHUAN 48.0 128.5
2 026-7 BEKASI 2000 ALAM 28.0 25.0 27.5 Biologi
ILMU
12-022- 19 April
PENGETAHUAN 48.0 138.5
3 027-6 Bekasi 2000 ALAM 28.0 22.5 40.0 Biologi
ILMU
12-022- 19 Juni PENGETAHUAN 54.0 167.5
4 028-5 JAKARTA 2000 ALAM 36.0 32.5 45.0 Biologi
ILMU
12-022- 21 April 62.0 142.5
PENGETAHUAN
…. 029-4 BEKASI 2000 ALAM 38.0 15.0 27.5 Biologi
ILMU
12-022- 20 Juli PENGETAHUAN 44.0 128.0
360 030-3 BEKASI 1999 ALAM 24.0 20.0 40.0 Biologi

36
37

Data yang digunakan dalam penelitian ini data siswa kela XII

SMA Negeri 2 Sukatani tahun 2018 yang belum lulus sebagai data

training sedangkan sebanyak 360 dan testing sebanyak 100 data

dengan 4 antribut.

4.2 Seleksi Data

Seleksi data adalah proses menganalisis data yang relevan

dari database karena sering ditemukan tidak semua data dibutuhkan

dalam proses data mining. Data tersebut dipilih dan diseleksi dari

database untuk di analisis. Dari semua data yang digunakan hanya

tempat lahir, nama, nilai , mapel. Karena informasi yang dikandung

didalamnya sudah mewakili informasi yang dibutuhkan untuk

dijadikan indicator penelitian.

4.3 Pembersih Data

Setelah tahap pengumpulan data dan filter data maka tahap

selanjutnya yaitu cleaning data agar tidak ada duplikasi data,

memeriksa data yang inkosisten dan memperbaiki kesalahan pada

saat seperti kesalahan cetak, sehingga data tersebut dapat diolah

dan dilakukan proses data mining. Setelah semua data yang

dibutuhkan telah melalui tahap cleaning data maka data akan

disimpan dalam dataset baru yang menggunakan Microsoft Office

Excel. Data yang diambil dari jurusan IPA dan IPS ini ada data yang

unknown yaitu data dari atribut Nilai dan data Mapel Ujian

sebanyak 360 data.


38

4.4 Transformasi Data

Data transformation adalah tahap mengubah data menjadi

bentuk yang sesuai untuk proses dalam data mining. Beberapa

metode data mining membutuhkan format data yang khusus

sebelum bisa diaplikasikan. Dan data ini juga digunakan untuk

mengelolah pada software rapiud miner. Tabel 4.2 adalah table yang

belum diubah oleh penulis atau belum dilakukan transformasi data.

Table 4.2 Transformasi Data

NO BIN ING MA PLH JUMLAH Maple


PRGM
T NILAI
ILMU
PENGETAHUAN 6. 125.0
14. ALAM 22.0 22.5 32.5 Biologi
ILMU
PENGETAHUAN 7. 128.5
7. ALAM 28.0 25.0 27.5 Biologi
ILMU
PENGETAHUAN 8. 138.5
6. ALAM 28.0 22.5 40.0 Biologi
ILMU
PENGETAHUAN 5. 167.5
2. ALAM 36.0 32.5 45.0 Biologi
ILMU
PENGETAHUAN 4. 142.5
4. ALAM
38.0 15.0 27.5 Biologi
ILMU
PENGETAHUAN 7. 128.0
5. ALAM
24.0 20.0 40.0 Biologi

Selanjutnya penulis melakukan transformasi dan inisialilsasi

data agar penelitian ini berjalan dengan baik. Data yang akan

diinisialilsasi merupakan data dari attribut IPK dan Mata Pelajaran

seperti table 4.3 dan 4.4.


39

Tabel 4.3 Inisialisasi IPK

Nilai IPK Inisialilsasi

IPK ASLI >85 A

75<=IPK ASLI<=85 B

IPK ASLI <75 C

Tabel 4.4 Inisialisasi IPK

Mata Pelajaran Inisialisasi

Biologi A

Fisika B

Sosiologi C

Ekonomi D

Kimia E

Geografi G
40

Selanjutnya data yang sudah dianalisis ditransformasikan kedalan

excel kembali seperti Tabel pada table 4.5.

Tabel 4.5 data yang sudah di insialisasi

NO NAMA JUMLAH Mapel


PRGM
NILAI

1 ACHMAD SUBHAN AYYUSPI ILMU PENGETAHUAN ALAM


125.0 A

2 AHMAD JAELANI 128.5 A


ILMU PENGETAHUAN ALAM

…. ALWIYAH WIDIASTUTI ILMU PENGETAHUAN ALAM


138.5 A

100 AMALIA NUR FATTONAH ILMU PENGETAHUAN ALAM


167.5 A

4.5 Implementasi

Pada tahap ini dilakukan pemodelan data , metode yang

dipakai pada penelitian ini adalah probabilitas (prediksi) dengan

menggunakan algoritma Naïve bayes. Data yang telah dikumpul .

diseleksi dan ditransformasi akan dikelola menggunakan metode

probabilitas. Metode ini dapat digunakan dalam memprediksi

peluang dimasa depan berdasarkan pengalamanan dimasa

sebelumnya sebagai perbandingan.


41

Data yang akan diujikan dibagi menjadi 2 bagian yaitu

training dan testing kemudian dianalisa menggunakan software

rapidminer . data training siswa kelas XII memiliki 360 record data

dan data testing memiliki 100 record data. Menggunakan cross

validation . Tabel 4.5 adalah data training dan table 4.6 adalah data

testing yang akan di akses melalui software rapidminer.

Tabel 4.6 Data training

NO NAMA BIN ING MAT PLH JUMLAH Mapel


PRGM
NILAI
ILMU
PENGETAHUA
N 48.0 125.0 A
1 ACHMAD SUBHAN ALAM 22.0 22.5 32.5
ILMU
PENGETAHUA
N 48.0 128.5 A
2 AHMAD JAELANI ALAM 28.0 25.0 27.5
ILMU
ALWIYAH PENGETAHUA
N 48.0 138.5 A
…. WIDIASTUTI ALAM 28.0 22.5 40.0
ILMU
AMALIA NUR PENGETAHUA
N 54.0 167.5 A
360 FATTONAH ALAM 36.0 32.5 45.0

Tabel 4.7 Data testing

JUMLAH
NO NAMA PRGM BIN ING MAT PLH Mapel
NILAI
ILMU
ACHMAD SUBHAN
PENGETAHUAN 48.0 125.0 A
1 AYYUSPI ALAM 22.0 22.5 32.5
ILMU
PENGETAHUAN 48.0 128.5 A
2 AHMAD JAELANI ALAM 28.0 25.0 27.5
ILMU
ALWIYAH
PENGETAHUAN 48.0 138.5 A
3 WIDIASTUTI ALAM 28.0 22.5 40.0
ILMU
AMALIA NUR
PENGETAHUAN 54.0 167.5 A
… FATTONAH ALAM 36.0 32.5 45.0
ILMU
PENGETAHUAN 62.0 142.5 A
100 AMALIAH ALAM 38.0 15.0 27.5
42

4.6 Pengujian Rapidminer

Atribut yang digunakan sebagai label adalah lulus, penulis

akan menganalisis factor yang mempengaruhi siswa lulus tepat

waktu dan memprediksi siswa yang dapat lulus tepat waktu

menggunakan data dari siswa SMA Negeri 2 Sukatani. Data

terlebih dahulu kita transformasi ke dalam format .cvs agar bias

diakses menggunakan software rapidminer.

Gambar 4.1 UI rapid miner


43

Setelah data dibuat kedalam bentuk format .cvs selanjutnya

lakukan importing data seperti pada gambar 4.2

Gambar 4.2 Memasukan data training dan testing ke software


rapidminer.
44

Setelah data yang akan digunakan dipilih langkah selanjutnya

yaitu klik next akan muncul data import step 2 seperti gambar 4.3.

Gambar 4.3 Import data ke software rapidminer step 2

Setelah data yang akan digunakan dipilih langkah selanjutnya yaitu

klik next akan muncul data import step 3 seperti gambar 4.4.
45

Gambar 4.4 Import data mining step 3

Setelah data yang akan digunakan dipilih langkah selanjutnya

yaitu klik next akan muncul data import step 4 seperti gambar 4.5
46

Gambar 4.5 Import data mining step 4

Setelah data yang akan digunakan dipilih langkah selanjutnya

yaitu klik next akan muncul data import step 5 seperti gambar 4.6.
47

Gambar 4.6 Import data mining step 5

Setelah data yang akan digunakan dipilih langkah selanjutnya yaitu

klik Finish. Maka selanjutnya drag and drop naïve bayes dan kemudian

hubungkan ke rad cvs data ke naïve bayes seperti pada gambar 4.7 .
48

Gambar 4.7 File read CVS dengan operator naïve bayes

Langkah selanjutnya adalah menghubungkan output lab dari

apply model menuju output operator performance . setelah semua nya

terhubung, selanjutnya adalah hubungkan port per dan exa yang ada di

operator performance menuju port res yang berada disebelah kanan

view proses seperti gambar 4.8


49

Gambar 4.8 Menghubungkan operator performance

Gambar 4.9 Menjalankan Rapidminer

Setelah beberapa detik maka rapidminer akan menampilkan hasil

prediksi pada view result. Hasil nya bias terlihat pada gambar 4.10.
50

Gambar 4.10 Hasil Perhitungan

Dari hasil perhitungan menggunakan rapidminer dengan metode

prediksi menampilkan dari data testing yang telah diuji dengan data training

berupa kolom prediction (Mapel). Kolom kolom ini memberikan informasi

tentang data siswa yang diambil dari data testing yang dapat diprediksi lulus

. selanjutnya untuk mengetahui tingkat accuracy algoritma naïve bayes, klik

tab performancevector yang terletak disebelah kanan , sehingga

menampilkan table view seperti gambar 4.11.


51

Gambar 4.11 Accuracy

Gambar 4.12 Gambar Accuracy


52

Dapat dilihat pada gambar 4.11 tingkat accuracy dari

performancevector yaitu 90 %

Gambar 4.13 Grafik Scener

Berdarsarkan gambar 4.13 diatas bahwa jurusan ipa yang

memiliki IPK 3 probabilitasnya lebih besar dibandingkan ips.


53

Gambar 4.14 Cross Validation

Selanjutnya adalah mengatur cross validation dengan cara

double klikk operator cross validation, kemudian drag and drop operator

naïve bayes dan hubungkan port tra and mod . selanjutnya klik tombol

proses untuk menjalankan cross validation pada gambar 4.15


54

Gambar 4.15 Menjalankan Rapidminer.

Gambar 4.16 Hasil shuffled sampling


55

Gambar 4.17 Xvalidation Numerical

4.7 Algoritma Naïve Bayes

Dalam penelitian algoritma yang digunakan adalah naïve

bayes dan untuk memudahkan menjelaskan tentang algoritma naïve

bayes dalam penelitan ini maka penulis membuat table data yang

digunakan dalam penelitian seperti table 4.7 sebagai data training

dan 4.8 sebagai data testing .

Jumal Kelas XI yang tergabung dari IPA dan IPS dibagi

beberapa rombel, seperti table 4.7 dibawah.


56

Tabel 4.8 Data rombel siswa IPA dan IPS

ROMBEL L P JML

: XII-IPA-1 12 33 45
: XII-IPA-2 12 33 45
: XII-IPA-3 13 33 46
: XII-IPA-4 10 34 44
JUMLAH IPA 47 133 180
: XII-IPS-1 19 24 43
: XII-IPS-2 20 21 41
: XII-IPS-3 19 23 42
: XII-IPS-4 19 22 41
JUMLAH IPS 77 90 167

JUMLAH KLS-XII 124 223 347

Table 4.9 Data training

JUMLAH
NAMA PRGM NILAI Mapel
ACHMAD SUBHAN
AYYUSPI ILMU PENGETAHUAN ALAM 125 A

AHMAD JAELANI ILMU PENGETAHUAN ALAM 128.5 A

ALWIYAH WIDIASTUTI ILMU PENGETAHUAN ALAM 138.5 A

ROHANA ILMU PENGETAHUAN SOSIAL 120.5 C

ROYADI ILMU PENGETAHUAN SOSIAL 153 C

SALMAH ARDILA ILMU PENGETAHUAN SOSIAL 132 G

SEPTI SUSANTI ILMU PENGETAHUAN SOSIAL 152 G


57

Tabel 4.10 Data Testing

MUHAMAD RICKO
ARDIANSYAH ILMU PENGETAHUAN SOSIAL 155.5 G

MUHAMMAD NUR SIDIK ILMU PENGETAHUAN SOSIAL 145.5 C

NANA YULIYANA ILMU PENGETAHUAN SOSIAL 133 D

NUR HALIMAH ILMU PENGETAHUAN SOSIAL 132.5 D

NURUL ALINA HASAN ILMU PENGETAHUAN SOSIAL 129 C

RATNA JUITA ILMU PENGETAHUAN SOSIAL 180 C

Tabel 4.8 diatas memiliki 360 record sebagai data training dan

table 4.9 memiliki 100 record sebagai data testing yang digunakan dalam

penelitian ini. Dalam kasus yang ada pada table 4.7 akan dibuat prediksi

untuk menentukan siswa lulus atau tidak menggunakan probabilitas.

Untuk menghitung nilai probabilitas atau prediksi siswa dengan

menggunakan cara sebagai berikut :

Pertama Menghitung jumlah dari IPA dan IPS dari label data

training . dari tabel training didapatkan hasil sebagai berikut :

 IPA = 180
 IPS = 167

58

Setelah mengetahui jumlah siswa yang mengikuti ujian tepat

waktu langkah adalah menghitung probabilitas masing masing attribute

dari data testing seperti berikut ini :

 Gender laki – laki , jurusan = IPA , IPK = 85, Mapel = E,

 P(Jurusan = IPA / jumlah siswa data training ) = 180 / 360 =

0,5

 P(Gender = laki – laki / IPA ) = 47 / 180 = 0,261111111

• P(Gender = Laki – laki / Mapel E ) = 47 / 21 = 2,2380952381

 P( Mapel = E = Jurusan / IPA ) = 20 / 180 = 0,111111111

Selanjut nya menghitung yang jumlah perempuan nya adalah

sebagai berikut :

 Gender Permpuan , jurusan = IPA , IPK = 85, Mapel = A,

 P(Jurusan = IPA / jumlah siswa data training ) = 180 / 360 =

0,5

 P(Gender = Permpuan / IPA ) = 133 / 180 = 0,73888888

 P(Gender = Perempuan / Mapel E ) = 133 / 21 = 6,333333

• P( Mapel = A = Jurusan / IPA ) = 156 / 180 = 0,86666666667


59

Untuk menghitung nilai IPK yang memiliki tipe data yang

kontinyu menggunakan rumus distribusi Gaussion seperti dibawah ini :


( )

4. = 3,1416

E = 2,72

i. = rata – rata

Σ = simpangan baku

Selanjutnya gantikan nilai x pada rumus diatas menjadi

angka dari data attribute IPK yang dicari seperti dibawah ini ;

( )

0.60697135032 X 0,84920528533 = 0.51544327873


60

Selanjutnya menghitung probabilotias IPS dengan

menggunakan data testing yang sama seperti perhitungan IPA diatas :

• Gender = laki – laki , Jurusan = IPS , IPK = 85, Mapel = G,

• P (IPS = Laki- laki / jumlah siswa data training ) = 77 / 176 = 0,4375

• P( Mapel = G = Jumlah siswa data training ) = 63 / 460

= 0,13695652217

0.46470390492 X 0.37874081899 = 0.17600233754

Langkah selanjutnya menghitung semua nilai dari masing masing

attribute IPA dan IPS , Kemudian melakukan normalisasi untuk masing –

masing kelas seperti berikut ini :

IPA = 180

IPS = 167
( )

Proses perhitungan confidence

Probabilitas IPA = 0,00478789055 = 0,867

0,00478789055 + 0,00073104692

Probabilitas IPS = 0,00073104692 = 0,132

0,00478789055 + 0,00073104692
61

Dari perhitungan diatas diketahui bahwa siswa siswa dengan katagori

laki – laki , jurusan IPA , IPK 3, Mapel E diprediksi lulus karena hasil

perhitungan kelas IPA lebih besar Dari kelas IPS dengan hasil probabilitas

sebesar 0,867 .
BAB V

KESIMPULAN DAN DARAN

5.1 Kesimpulan

Setelah melakukan pengujian dan analisis penulis mendapatkan sebagai

berikut :

15. Algoritma Naïve Bayes dapat digunakan untuk memprediksi kelulusan siswa.

16. Dengan Menggunakan metode Algortima Naïve Bayes mampu menjadi lebih

efektif dalam menentukan kelulusan.

17. Algoritma Naïve Bayes dalam memprediksi kelulusanmemiliki akurasi 86

18. Informasi yang didapat dalam penelitian ini adalah bahwa siswa yang IPK nya

85 lebih besar kemungkinan nya untuk lulus .

19. siswa yang jurusan IPA lebih besar nilai nya dibandingkan IPS .

5.2 Saran

Saran yang diberikan penulis adalah :

8. Diharapkan data – data sekolah susah menggunakan data base sehingga

mempermudah penelitian selanjutnya.

9. Jika ada yang peneliti yang ingin melanjutkan penelitian ini sebaiknya

menggunakan algoritma yang berbeda sebagai perbandingan tingkat akurasi.


LAMPIRAN :

Data testing

JUMLAH
NAMA PRGM Mapel
NILAI
ACHMAD SUBHAN AYYUSPI ILMU PENGETAHUAN ALAM 125 A
AHMAD JAELANI ILMU PENGETAHUAN ALAM 128.5 A
ALWIYAH WIDIASTUTI ILMU PENGETAHUAN ALAM 138.5 A
AMALIA NUR FATTONAH ILMU PENGETAHUAN ALAM 167.5 A
AMALIAH ILMU PENGETAHUAN ALAM 142.5 A
ARI ARDIANSYAH ILMU PENGETAHUAN ALAM 128 A
BASTIAN ARDIANSYAH ILMU PENGETAHUAN ALAM 137.5 A
DELY AGUSTIN ILMU PENGETAHUAN ALAM 116 A
DEVI FANDINI ILMU PENGETAHUAN ALAM 119.5 A
DWI PRIHATINI ILMU PENGETAHUAN ALAM 147 A
ELPA ELPIANA ILMU PENGETAHUAN ALAM 124.5 A
ERMI FATURRAHMI ILMU PENGETAHUAN ALAM 168 B
FIKRI HAEKAL HARDIANSYAH ILMU PENGETAHUAN ALAM 140 A
FILHZAH HASYYATI RUYANI ILMU PENGETAHUAN ALAM 150.5 A
IDA ROYANI ILMU PENGETAHUAN ALAM 125 A
IIS SOLIHATUL FADILAH ILMU PENGETAHUAN ALAM 152 A
IMAM SYAEFULLAH ILMU PENGETAHUAN ALAM 139 A
INTAN KARTINI ILMU PENGETAHUAN ALAM 167 A
JUBAEDAH ILMU PENGETAHUAN ALAM 141.5 A
KHAAFIDH KAMILAH ILMU PENGETAHUAN ALAM 144 A
LAELA SUGIARTI ILMU PENGETAHUAN ALAM 163.5 A
LISANTI JANNAT ILMU PENGETAHUAN ALAM 156 A
LITA LASMALA ILMU PENGETAHUAN ALAM 127.5 A
LUSIANA ILMU PENGETAHUAN ALAM 149 A
MILAH PRIHATINI ILMU PENGETAHUAN ALAM 150 A
MITA ILMU PENGETAHUAN ALAM 169 A
MUHAMAD DION GILANG
ILMU PENGETAHUAN ALAM 135.5 A
SAPUTRA
MUHAMAD ROUF ILMU PENGETAHUAN ALAM 129.5 A
MUHAMMAD ARIFIN ILMU PENGETAHUAN ALAM 108 A
MUNIH ILMU PENGETAHUAN ALAM 135.5 A
NABILA RATNA SARI ILMU PENGETAHUAN ALAM 141.5 A
NATASYA OKTAVIANTI ILMU PENGETAHUAN ALAM 145.5 A
NIA RAHMAYANTI ILMU PENGETAHUAN ALAM 163 A
NURANISAH ILMU PENGETAHUAN ALAM 152 A
PUTRI DIANA ILMU PENGETAHUAN ALAM 128.5 A
RAKA SIWI ILMU PENGETAHUAN ALAM 162.5 A
RIKA KOMALASARI ILMU PENGETAHUAN ALAM 114.5 A
ROBIATUL ADAWIYAH ILMU PENGETAHUAN ALAM 159 A
SAHRUL ALAM ILMU PENGETAHUAN ALAM 134 A
SINTA DEWI ILMU PENGETAHUAN ALAM 115 A
SITI RUKIYAH ILMU PENGETAHUAN ALAM 163 A
TIKA APRIANTIKA ILMU PENGETAHUAN ALAM 163.5 A
UTARI SAPITRI ILMU PENGETAHUAN ALAM 137.5 A
WIDIA APRIANI ILMU PENGETAHUAN ALAM 140.5 A
YASIR MOHAMAD ILMU PENGETAHUAN ALAM 174.5 A
NASRUL ARI FAJRI ILMU PENGETAHUAN SOSIAL 123 C
NIA ARSITA ILMU PENGETAHUAN SOSIAL 104.5 C
NOVIYANTI ILMU PENGETAHUAN SOSIAL 100 C
NURHASNI FAUZIAH ILMU PENGETAHUAN SOSIAL 133.5 G
RIA NOVITASARI ILMU PENGETAHUAN SOSIAL 131 G
ROSMALIA FAUZIA ILMU PENGETAHUAN SOSIAL 136.5 C
SANDI SUARDI ROYANA ILMU PENGETAHUAN SOSIAL 165.5 C
SELIYANA APRIDA ILMU PENGETAHUAN SOSIAL 118.5 C
SITI HABIBAH ILMU PENGETAHUAN SOSIAL 127.5 C
SITI NURHALIMAH ILMU PENGETAHUAN SOSIAL 110.5 C
SOPIAH ILMU PENGETAHUAN SOSIAL 131.5 G
SULEKAH ILMU PENGETAHUAN SOSIAL 136 G
SUTAN FACHRIE IRAWAN ILMU PENGETAHUAN SOSIAL 141 C
YAYAH ZAKIYAH ILMU PENGETAHUAN SOSIAL 117 G
YULITA SARI ILMU PENGETAHUAN SOSIAL 138 G
YUSUF ILMU PENGETAHUAN SOSIAL 129 C
INDRA HANDIKA ILMU PENGETAHUAN SOSIAL 205 C
ABDUL RIZKI ILMU PENGETAHUAN SOSIAL 165 C
ALFINA DAMAYANTI ILMU PENGETAHUAN SOSIAL 117 C
ALI MUSTOPA ILMU PENGETAHUAN SOSIAL 157.5 G
ANIPAH ILMU PENGETAHUAN SOSIAL 119.5 C
ANISAH ILMU PENGETAHUAN SOSIAL 124.5 G
ALWAN FAUZI ILMU PENGETAHUAN SOSIAL 179 C
AVITA PRADINI ILMU PENGETAHUAN SOSIAL 112 G
DALIYA ILMU PENGETAHUAN SOSIAL 148.5 C
DANDI SUPRIYADI ILMU PENGETAHUAN SOSIAL 143.5 G
DONNY PRATAMA ILMU PENGETAHUAN SOSIAL 142.5 G
FAISAL EFENDI ILMU PENGETAHUAN SOSIAL 142 G
FARIHIN PADILAH ILMU PENGETAHUAN SOSIAL 141 C
IKA ISNIYATIN SAYIDA ILMU PENGETAHUAN SOSIAL 144.5 G
ISMAIL ILMU PENGETAHUAN SOSIAL 150.5 C
KAKA SURYADIKA ILMU PENGETAHUAN SOSIAL 150.5 C
KARMILAH ILMU PENGETAHUAN SOSIAL 149.5 C
LULUK TOBING ILMU PENGETAHUAN SOSIAL 138.5 C
MAEMUNAH WATI ILMU PENGETAHUAN SOSIAL 126 C
MAHDAN SYAIFUSSALAM ILMU PENGETAHUAN SOSIAL 131 C
MILA AGUSTIN ILMU PENGETAHUAN SOSIAL 123.5 C
MUHAMAD GUNTUR SAKETI ILMU PENGETAHUAN SOSIAL 145.5 C
MUHAMAD RICKO ARDIANSYAH ILMU PENGETAHUAN SOSIAL 155.5 G
MUHAMMAD NUR SIDIK ILMU PENGETAHUAN SOSIAL 145.5 C
NANA YULIYANA ILMU PENGETAHUAN SOSIAL 133 D
NUR HALIMAH ILMU PENGETAHUAN SOSIAL 132.5 D
NURUL ALINA HASAN ILMU PENGETAHUAN SOSIAL 129 C
RATNA JUITA ILMU PENGETAHUAN SOSIAL 180 C
ROHANA ILMU PENGETAHUAN SOSIAL 120.5 C
ROYADI ILMU PENGETAHUAN SOSIAL 153 C
SALMAH ARDILA ILMU PENGETAHUAN SOSIAL 132 G
SEPTI SUSANTI ILMU PENGETAHUAN SOSIAL 152 G
SITI KHOIRIYAH ILMU PENGETAHUAN SOSIAL 118.5 C
SITI NURJANAH ILMU PENGETAHUAN SOSIAL 131.5 G
SOPANDI ILMU PENGETAHUAN SOSIAL 153.5 G
SRI ASTUTI ILMU PENGETAHUAN SOSIAL 127.5 C
SUTEDI SUNJAYA ILMU PENGETAHUAN SOSIAL 158 G
TIARA AMALIA ILMU PENGETAHUAN SOSIAL 166.5 G
Data training

JUMLAH
NAMA PRGM Mapel
NILAI
ACHMAD SUBHAN AYYUSPI A 125 A
AHMAD JAELANI A 128.5 A
ALWIYAH WIDIASTUTI A 138.5 A
AMALIA NUR FATTONAH A 167.5 A
AMALIAH A 142.5 A
ARI ARDIANSYAH A 128 A
BASTIAN ARDIANSYAH A 137.5 A
DELY AGUSTIN A 116 A
DEVI FANDINI A 119.5 A
DWI PRIHATINI A 147 A
ELPA ELPIANA A 124.5 A
ERMI FATURRAHMI A 168 B
FIKRI HAEKAL HARDIANSYAH A 140 A
FILHZAH HASYYATI RUYANI A 150.5 A
IDA ROYANI A 125 A
IIS SOLIHATUL FADILAH A 152 A
IMAM SYAEFULLAH A 139 A
INTAN KARTINI A 167 A
JUBAEDAH A 141.5 A
KHAAFIDH KAMILAH A 144 A
LAELA SUGIARTI A 163.5 A
LISANTI JANNAT A 156 A
LITA LASMALA A 127.5 A
LUSIANA A 149 A
MILAH PRIHATINI A 150 A
MITA A 169 A
MUHAMAD DION GILANG
A 135.5 A
SAPUTRA
MUHAMAD ROUF A 129.5 A
MUHAMMAD ARIFIN A 108 A
MUNIH A 135.5 A
NABILA RATNA SARI A 141.5 A
NATASYA OKTAVIANTI A 145.5 A
NIA RAHMAYANTI A 163 A
NURANISAH A 152 A
PUTRI DIANA A 128.5 A
RAKA SIWI A 162.5 A
RIKA KOMALASARI A 114.5 A
ROBIATUL ADAWIYAH A 159 A
SAHRUL ALAM A 134 A
SINTA DEWI A 115 A
SITI RUKIYAH A 163 A
TIKA APRIANTIKA A 163.5 A
UTARI SAPITRI A 137.5 A
WIDIA APRIANI A 140.5 A
YASIR MOHAMAD A 174.5 A
AAM AMYATI DEWI A 115 A
AHMAD FAUZI A 119 A
ALDI HARYANTO A 188 B
ALDIYANSYAH A 133 A
ANIS AFRILYANTI A 143.5 A
ASTRI PRATIWI A 135 A
DAHLIA A 159 A
DEWI LESTARI A 139 A
ELISTIA WATI A 125 A
ERIKA AMELIA A 142 A
EVI YANI A 165 B
FARHAN FAUZAN A 126.5 A
GANGGA PUTRA SATRIA A 127.5 A
HAMIDAH A 167.5 A
IIN SARTIKA A 205.5 E
IKHFA AMELIA A 147 A
IQBAL ZAENAL MUTAQIEN A 197 A
KARTINI A 129.5 A
KHOLIDA ZIAH A 188.5 A
LATIFAH A 140.5 A
LILI ISKANDAR A 186 A
MARDIANSYAH A 103 A
MARIATUL KIBTIYAH A 147.5 A
MASIH MAHCICA A 147 A
MEGAWATI A 133 A
MIFTAHUL FAUZI A 139.5 A
MUHAMAD FAHRI A 199 A
MUTOHAROH A 168 A
NENENG SURYANI OKTAVIANI A 159.5 A
NENI SURYANI A 142 A
NUR ASIKIN A 161 A
NURHAPIPAH A 140 A
PEBI RISYANI A 159.5 E
PETI PEBIOLA A 118.5 E
PUTRI WULANDARI A 159.5 A
RENITASARI A 126.5 A
ROHIMAH A 138 A
ROSALINDA A 131 A
SISKA DESIYANTI A 118 A
SONIA NURKHOLIFAH A 126 A
TRI HARTANTI A 112 A
TUBAGUS HAYKAL NENDYAS
A 142.5 A
WAFI
WAFFIYYATUL MARDIYYAH A 152 A
WAHYUNI A 115 A
YUROH A 122 A
AFIFAH A 167 A
AKBAR SALEH ALFIAN A 145.5 E
ALFAN YUDISTIRO A 107.5 E
ANDI YANTO A 179.5 E
ARISKA DEWI PORTUNA A 142 A
AYU SUGIYARTI A 153 E
CICI YISTIANI A 123.5 E
DITA NELISTINA A 160.5 E
ELPURANINA SEPTIANY A 172 E
FAISAL RAMADHAN A 152 E
FARIDA FARHA A 140 A
FEBRIYANTI A 127 A
HADI KUSUMA A 157 B
IIS PRASISKA A 125.5 A
IMAS SUNENGSIH A 111.5 A
INAH SYINTIA A 131 A
ISMAIL YUSUF A 121 A
KOMARIAH A 131 A
LIA KAMELIA A 150 B
LILIS KARLINA A 120 A
MALA JAMILAH A 157.5 A
MENANTI DEBORA A 130.5 A
MIFTAHUL JANNAH A 131.5 E
MILA OCTAPIANA A 129 E
MISBAHUDIN A 172.5 E
MUHAMAD RAMLI A 195 A
MUHAMAD WILDAN RAMADHAN A 146.5 A
NADILA RAHMA GUSTI RAHAYU A 179 E
NURAENI A 134 E
NURHAPIPAH A 159.5 A
PUJI RAHAYU A 120 A
PUTRI PADILAH A 135.5 A
RATNA SARI A 118 A
REINOLDI DATA A 177.5 A
ROSITA SOLEHA A 137.5 A
SAFITRI A 169 A
SAIDAH TUN TOYYIBAH A 133 A
SITI FATHIYATUL BARKAH A 153.5 A
SITI KHOERUNNISA A 148.5 A
SRI HARTATI A 156 A
TEDI MAHPUDIN A 155.5 A
TRISNAWATI A 151 A
WAHYU INDRA KUSUMA A 142.5 A
WIDIA NINGRUM A 194.5 A
WINTIKA SARI A 122.5 A
MOCHAMAD IRSAL NURILFA
A 165.5 A
JAMIL
AHMAD FAUZI A 141 A
ALIA SAFITRI A 228.5 E
ALMA YULFANI A 108 A
ARIF SUNANDAR A 177.5 A
ASWARI FAIRUZI A 136.5 A
ATIKAH ADAWIYAH A 181 A
AYU AMELIA A 133 A
BAGUS A 135.5 A
DEWI SANTI A 112 A
EGA FADILLAH A 140.5 A
ELSA MARHAMAH A 137 A
FAHRUZI PRATAMA A 209.5 A
FEBI PUSPITA SARI A 145 A
HASMANAH A 147.5 A
INDAH A 132 A
IRNA RAHMADIAH A 189 A
JIMI RICARDO P MANURUNG A 170 A
KUSNIYAH SUSILAWATI A 126.5 A
LIDIAWATI A 117 A
LISA TIANINGRUM A 110 A
MAKMUR ASHARI A 184.5 A
MILENIA A 146.5 A
MUHAMMAD MIFTAHUL MAARIF A 175 E
MUHAMMAD REZA HADI
A 136 A
SAPUTRA
MUJDALIFAH A 177 A
NADIA ROKHALI A 160.5 A
NADILA SARI A 128.5 A
NAILA ANGELANI A 227 A
NENG SANTI OKTAVIANI A 125.5 A
PUTRI ALVIRA A 155 A
RAHMA ALFIRA A 143 A
RENNA DAMAYANTI A 141 A
ROSMIATI A 120.5 A
SAFITRI AMELIA A 127.5 A
SANINGKEM A 170.5 A
SARAH YANISA HUTAPEA A 119.5 A
SITI NURHAPIPAH A 108 A
SITI ROBIATUL ADAWIYAH A 118.5 A
SRI UNTARI SETIANINGSIH A 238 E
TETEN NURDIANSYAH A 256.5 A
UMI SARI A 171 A
WIDYADARA YULIATAMA A 205 A
WILDA FITRIYATUR
A 134 A
ROMADHONA
YAYAH A 139.5 A
ADITIA SULISTIO B 174.5 C
AIDA NURAFRIANI B 173.5 D
ALISAH SUSILAWATI B 133 C
ANISA B 151 C
ARI SOPYAN B 159 C
BARAMULIH MAHENDRA B 154.5 D
BERLIANA RAHAYU B 142 C
DANDY B 118.5 C
DESTY ALFIANI SARI B 149.5 C
DINAR MINDY MEINISSA B 190.5 C
EGIE ALPIYANI B 145 C
EKI SYAHRUDIN B 133 C
FERI IRAWAN B 118 C
HARI ANGGARA B 141.5 C
INTAN JUITA B 130.5 C
JAMALULLAEL B 140.5 C
KARJA SUREJA B 101.5 C
KHUSNUL KHOTIMAH B 130.5 C
M. IFAN RAMADAN B 119 C
MAHDI SAFRI WIJAYA B 126.5 C
MAR'ATUN SOLIHAH B 138 C
MELATI DEWANTI B 167.5 G
MILA ANGGRAINI PS B 145.5 C
MUHAMAD ILHAM B 156.5 C
MUHAMAD RIZKO MUBAROQ B 156 C
MUHAMMAD ERLANGGA B 158 C
NON PRISKA AMELIA SAPITRI B 178 C
NURAENI B 134.5 C
RANTIH B 123.5 G
RIKI FIRMANSYAH B 124.5 G
RIZKY ANANDA PERTIWI B 201 G
SAEPUL HIDAYAT B 105 C
SARMILA B 129 C
SITI AISAH B 149.5 C
SITI KOMARIAH B 168 C
SITI NURROKMAH B 179.5 C
SRI NINGRUM B 151.5 C
SUHERDI B 101.5 G
SUNINGSIH B 126 C
TOPIK AKBAR B 148 C
TRI MAYA B 123.5 C
YUDISTIRA B 179.5 C
YULIA B 159 D
ABDUROHMAN B 124 C
AGNES PRATIWI B 136.5 G
ALFIN FIRDAUS B 192 C
AMIROH PRABAWATI B 158 G
ARI WIDIAWAN SUMARDI B 148 G
BUSTOMI ARIFIN PANIGORO B 163 G
CICIH KOMALASARI B 122.5 C
DENIS KRISTIAWAN B 153 G
DEYA SAFITRI B 129 G
DIWANAH B 160 C
EKA NOVIANTI B 124 C
ERI ERIYANTO B 141.5 G
FRANSON ERNANDO SITORUS B 179.5 C
HENDRIK RIPALDI B 117 C
HOIRUL ANWAR SALEH B 167.5 G
IRMA YULIYANTI B 124 G
LELI HERLINA LUBIS B 159.5 G
KARYADI B 141.5 G
M. RIKO PRATAMA B 107.5 C
MARLIAH B 138.5 C
METTA MAYMUNAH B 109 C
MIMIN MINTARSIH B 166 G
MUHADI B 165.5 G
MUHAMAD JULVI AINU RIJA B 141.5 G
MUHAMAD SUNARDI B 129.5 G
NOVI YANTI RUKMANA B 117 G
NURAENI B 113 G
PUTRI ANDRIYANI B 148.5 C
RESNAWATI B 128 C
REZA GUSTI PAMBEAN B 110.5 C
SAEPUDIN B 130.5 C
SARTIKAH B 126.5 C
SITI FATIMAH B 155 G
SITI ROMLAH B 120.5 C
SRI HARTINI B 151.5 C
SUPRIYATI B 135 G
UMAR NADI B 160.5 D
URNI MELANIA B 146 C
YOVAN RIZKI YUSUF B 156 D
ZAENAL ABIDIN B 104.5 G
FADIEL EKA ARYA KUSUMA B 142.5 C
ABDUL ROJAK B 125 C
AJENG SARTIKA AGUSTIN B 102 C
ALDIANSYAH B 184.5 C
AMANDA AUDITA PRATAMA B 157 G
AZIS MAHPUD B 134 C
DEDE AZHARI B 143 C
DEWI NURYAMAH B 164.5 G
DHEA SYAFITRI B 143 C
DIDI SETIA BUDI B 110.5 C
EGA JUANSARI B 177.5 D
FIKRI MUNAZAT B 142 C
GALIH RIDNO AJIE B 120 C
HENI MULYANI B 151.5 C
JUNAEDI B 118 C
KAMELIA PUTRI B 110 G
KEVIN FEBIANSON B 133.5 C
LISA IMANIYAH B 151 C
M. RIDWAN B 203 C
MARSIH NOVIANTI B 125.5 C
MEGA PITALOKA B 124 C
MELINAH B 96.5 D
MUHAMAD AFRIZAL B 133 C
MUHAMAD MALIK B 110 C
MUHAMAD RUPLI B 123.5 C
NASRUL ARI FAJRI B 123 C
NIA ARSITA B 104.5 C
NOVIYANTI B 100 C
NURHASNI FAUZIAH B 133.5 G
RIA NOVITASARI B 131 G
ROSMALIA FAUZIA B 136.5 C
SANDI SUARDI ROYANA B 165.5 C
SELIYANA APRIDA B 118.5 C
SITI HABIBAH B 127.5 C
SITI NURHALIMAH B 110.5 C
SOPIAH B 131.5 G
SULEKAH B 136 G
SUTAN FACHRIE IRAWAN B 141 C
YAYAH ZAKIYAH B 117 G
YULITA SARI B 138 G
YUSUF B 129 C
INDRA HANDIKA B 205 C
ABDUL RIZKI B 165 C
ALFINA DAMAYANTI B 117 C
ALI MUSTOPA B 157.5 G
ANIPAH B 119.5 C
ANISAH B 124.5 G
ALWAN FAUZI B 179 C
AVITA PRADINI B 112 G
DALIYA B 148.5 C
DANDI SUPRIYADI B 143.5 G
DONNY PRATAMA B 142.5 G
FAISAL EFENDI B 142 G
FARIHIN PADILAH B 141 C
IKA ISNIYATIN SAYIDA B 144.5 G
ISMAIL B 150.5 C
KAKA SURYADIKA B 150.5 C
KARMILAH B 149.5 C
LULUK TOBING B 138.5 C
MAEMUNAH WATI B 126 C
MAHDAN SYAIFUSSALAM B 131 C
MILA AGUSTIN B 123.5 C
MUHAMAD GUNTUR SAKETI B 145.5 C
MUHAMAD RICKO ARDIANSYAH B 155.5 G
MUHAMMAD NUR SIDIK B 145.5 C
NANA YULIYANA B 133 D
NUR HALIMAH B 132.5 D
NURUL ALINA HASAN B 129 C
RATNA JUITA B 180 C
ROHANA B 120.5 C
ROYADI B 153 C
SALMAH ARDILA B 132 G
SEPTI SUSANTI B 152 G
SITI KHOIRIYAH B 118.5 C
SITI NURJANAH B 131.5 G
SOPANDI B 153.5 G
SRI ASTUTI B 127.5 C
SUTEDI SUNJAYA B 158 G
TIARA AMALIA B 166.5 G
WINDY FRASTIKA B 175.5 C
YUSUP FAISAL GINA B 136 C
ZAHRATUL JANNAH ZULFA B 254.5 C
RIZKI MAULANA ISHAK B 225.5 G
DONNY PRATAMA B 225.5 G
FAISAL EFENDI B 225.5 G
FARIHIN PADILAH B 225.5 G
IKA ISNIYATIN SAYIDA B 225.5 G
ISMAIL B 225.5 G
KAKA SURYADIKA B 225.5 G
KARMILAH B 225.5 G
LULUK TOBING B 225.5 G
MAEMUNAH WATI B 225.5 G
MAHDAN SYAIFUSSALAM B 225.5 G
SUTEDI SUNJAYA B 225.5 G
TIARA AMALIA B 225.5 G
SUTEDI SUNJAYA B 225.5 G

Anda mungkin juga menyukai