Anda di halaman 1dari 8

JUSIKOM PRIMA (Junal Sistem Informasi Ilmu Komputer Prima)

Vol. 2 No. 1, Juli 2018 e-ISSN : 2580-2879

PENERAPAN NAÏVE BAYES DALAMS PREDIKSI KETERCAPAIAN


NILAI KRITERIA KETUNTASAN MINIMAL SISWA
Dwi Hartanti 1, Kusrini 2, Emha Luthfi Taufiq 3

Universitas AMIKOM Yogyakarta


Jalan Ring Road Utara, Condongcatur, Depok, Condongcatur, Daerah Istimewa Yogyakarta
Email: dwihartanti048@gmail.com1, kusrini@amikom.ac.id2,emhataufiqluthfi@amikom.ac.id3

ABSTRAK Kriteria Ketuntasan Minimal (KKM)


Data mining adalah proses menemukan bagaimana ditetapkan pada setiap awal tahun pelajaran. Guru
hubungan dalam data yang tidak diketahui oleh menetapkan Kriteria Ketuntasan Minimal (KKM)
pengguna menyajika dengan cara yang dapat mata pelajaran dengan mempertimbangkan tiga
dipahami sehingga hubungan menjadi dasar dalam aspek kriteria, yaitu kompleksitas, daya dukung dan
pengambilan keputusan. Setiap sekolah memiliki kemampuan (intake) peserta didik. Dari ketiga
sebuah masalah dalam nilai KKM siswa. KKM aspek tersebut diberi skor antara 0-100, kemudian
merupakan Kriteria Ketuntasan Minimal nilai siswa. dihitung nilai rata-rata untuk setiap indikator,
KKM akan menjadi patokan nilai minimal suatu niai rata-rata setiap kompetensi dasar, rata-rata setiap
matapelajaran. Banyak siswa yang nilai tidak standar kompetensi. Untuk menetapkan nilai
tercapai nilai KKM akan menjadi sebuah pekerjaan Kriteria Ketuntasan Minimal (KKM) mata
sekolah dalam hal ini. Dalam hal ini sekolah pelajaran diperoleh dari rata-rata semua standar
membutuhkan sebuah penerapan datamining yang kompetensi.
dapat melakukan prediksi ketercapain nilai KKM Pendidikan sangat berpengaruh positif terhadap
siswa. Agar sekolah mendapatkan informasi siswa ketercapaian nilai siswa karena dengan tingginya
yang diperkirakan tidak tercapai nilai mata pendidikan orang tua maka akan memberikan
pelajaran. Sehingga sekolah dapat melakukan perhatian yang khusus kepada pendidikan anak dan
sebuah tindakan untuk masalah ini. Tujuan dari nilai anak.
penelitian ini adalah melakukan prediksi Bimbingan belajar salah satu sarana yang
ketercapaian nilai KKM siswa dengan menggunakan banyak diikuti siswa yang ingin mendapatkan
algoritma Naïve Bayes. Dalam melakukan pelajaran diluar sekolah. Dengan siswa yang
pengukuran tingkat akurasi ketepatan hasil naïve mengikuti bimbingan belajar akan membuat nilai
bayes dalam melakukan prediksi ketercapain nilai siswa kan lebih meningkat dengan mengikuti
KKM dalam mengikuti matapelajaran. Atribut yang bimbingan belajar.
digunakan adalah nilai raa-rata UTS gasal, Kehadiran atau presensi siswa dalam mengikuti
pendidikan orang tua, bimbingan belajar dan pembelajaran menjadi salah satu faktor ketercapaian
presensi kehadiran. Hasil pengujian dengan 600 nilai siswa. Siswa yang rajin mengikuti
record dengan porsi 75% data latih dan 25% data uji. pembelajaran tingkat pemahaman akan suatu materi
Sistem menghasilkan akurasi sebesar 78%. kna lebih baik daripada siswa yang jarang mengikuti
pembelajaran.
Kata kunci:Prediski, Naïve Bayes, Data Mining, Nilai merupakan indeks atau petunjuk bahwa
Confusion Matriks siswa tercapai atau tidak tercapainya anak dalam
mengikuti mata pelajaran di sekolah. Nilai akan
1. PENDAHULUAN diolah dengan beberapa matapelajaran dan akan
Dalam dunia pendidikan sekarang ini nilai didapatkan rata-rata nilai siswa.
menjadi salah satu penentun ketercapain nilai KKM Tujuan penelitian ini adalah : 1) Untuk
siswa. Adanya nilai Kriteria Ketuntasan Minimal mengetahui akurasi yang diperoleh dari penerapan
(KKM) setiap mata pelajaran merupakan salah metode naïve bayes pada prediksi ketercapain nilai
satu muatan penting Kurikulum Tingkat Satuan KKM siswa. 2) Untuk membangun sistem yang
Pendidikan. Kriteria Ketuntasan Minimal menjadi membantu dalam prediksi ketercapain nilai KKM
acuan bersama antara pendidik, peserta didik, dan siswa. Dengan sistem ini akan membantu sekolah
orang tua peserta didik. Sehingga pihak-pihak dalam mengetahui siswa mana saja yang tidak
yang berkepentingan terhadap penilaian di sekolah tercapai dan tercapai. Sekolah akan melakukan
berhak untuk mengetahuinya. Setiap satuan tindakan atas informasi yang didapatkan salah
pendidikan perlu melakukan sosialisasi agar satunya melakukan pembelajaran tambahan.
informasi dapat diakses dengan mudah oleh peserta Berdasarkan pengamatan penelitian terdahulu
didik dan atau orang tuanya. sebagai bahan rujukan yaitu penelitian yang
dilakukan oleh Tutus Pranigki pada jurnal tersebut

15
JUSIKOM PRIMA (Junal Sistem Informasi Ilmu Komputer Prima)
Vol. 2 No. 1, Juli 2018 e-ISSN : 2580-2879

Sistem Prediksi Penyakit Kanker


ServiksMenggunakan CART, Naive Bayes, dan K-
NN.Penelitian dilakukan dengan berbagai metode
algoritma. Penelitian ini menghasilkan naïve ayes
memiliki nilai akurasi yang tertinggi.
Masalah yang muncul yang berhubungan dengan
ini adalah banyaknya siswa yang tidak tuntas pada
mata pelajaran tertentu. Maka sekolah harus harus
melakukan sebuah tindakan ntuk mengatasi banyak
siiswa yang tidak tuntas seperti memberikan
pelajaran tambahan, menata penempatan tempat
duduk siswa. Berdasarkan penjabaran diatas maka di
perlukan sebuah sistem prediksi dengan data mining
yang dapat melakukan prediksi ketercapaian KKM
siswa. Dengan informasi yang dihasilkan dapat
membantu sekolah dalam memprediksi siswa yang
tidak tuntas.
Sedangkan Penelitian yang dilakukan penulis
adalah mengetahui akursi sistem prediksi
ketercapain nilai KKM siswa menggunakan metode
Naïve Bayes. Suatu sistem harus memiliki akurasi
Gambar 1. Tahapan Data mining
tinggi dalam melakukan prediksi.
2.2.2 Prediksi
Prediksi adalah suatu proses memperkirakan
2. ISI PENELITIAN secara sistematis tentang sesuatu yang paling
2.2 Definisi mungkin terjadi di masa depan berdasarkan
2.2.1 Data Mining informasi masa lalu dan sekarang yang dimiliki,
Data mining adalah suatu istilah yang digunakan agar kesalahannya (selisih antara sesuatu yang
untuk menguraikan penemuan pengetahuan di dalam terjadi dengan hasil perkiraan) dapat diperkecil.
database.. Data mining juga merupakan proses Prediksi tidak harus memberikan jawaban secara
dengan menggunakan teknik statistik, matematika, pasti kejadian yang akan terjadi, melainkan
kecerdasan buatan, dan machine learning untuk berusaha untuk mencari jawaban sedekat mungkin
mengekstrasi dan mengidentifikasi informasi yang yang akan terjadi. Data mining adalah suatu istilah
bermanfaat dan pengetahuan yang terkait dari yang digunakan untuk menguraikan penemuan
berbagai database besar. Data mining merupakan pengetahuan di dalam database. Data mining juga
bagian yang terintegrasi dengan proses Knowledge merupakan proses dengan menggunakan teknik
Discovery in Databases (KDD). KDD adalah statistik, matematika, kecerdasan buatan, dan
menggali dan menganalisis informasi dan machine learning untuk mengekstrasi dan
pengetahuan yang tersembunyi dari sejumlah besar mengidentifikasi informasi yang bermanfaat dan
himpunan data.[7].Tahapan prosesKnowledge pengetahuan yang terkait dari berbagai database
Discovery in Databases ditunjukan pada gambar 1. besar.
Prediksi adalah suatu proses memperkirakan
secara sistematis tentang sesuatu yang paling
mungkin terjadi di masa depan berdasarkan
informasi masa lalu dan sekarang yang dimiliki,
agar kesalahannya (selisih antara sesuatu yang
terjadi dengan hasil perkiraan) dapat diperkecil.

2.2.3 Naïve Bayes


Algoritma Naïve Bayes Classifier (NBC)
merupakan algoritma yang memanfaatkan teori
probabilitas, yaitu memprediksi probabilitas di masa
depan berdasarkan pengalaman di masa sebelumnya.
Klasifikasi–klasifikasi Bayes adalah klasifikasi
statistik yang dapat dapat digunakan untuk
memprediksi probabilitas keanggotaan suatu class.
Untuk klasifikasi Bayes sederhana yang lebih
dikenal sebagai naïve Bayesian Classifier dapat
diasumsikan bahwa efek dari suatu nilai atribut
sebuah kelas yang diberikan adalah bebas dari
atribut-atribut lain.

16
JUSIKOM PRIMA (Junal Sistem Informasi Ilmu Komputer Prima)
Vol. 2 No. 1, Juli 2018 e-ISSN : 2580-2879

Mulai

Teorema Bayes memiliki bentuk umum sebagai


berikut
Identifikasi Masalah :
P(X|H)P(H)
P(H|X)= …………………......(1)
P(X) Pengamatan

Melihat hasil pengujian akurasii dari


Pengumpulan Data sistem yang telah dibangun
Dalam hal ini:

Pengamatan
Pattern Evaluations

Tinjauan Pustaka
X : data dengan class yang belum
(Landasan teori, keasliasn penelitian)
diketahui

Perencanaan
H : hipotesis data X merupakan suatu Pemilihan Data untuk prediksi
Evaluasi pengujian aplikasi

class spesifik Cleaning Data

P(H|X) : probabilitas hipotesis H berdasarkan


kondisi X (postetiori probability) Penggabungan Data Untuk Prediksi
Data Integration Akurasi terbaik
Jika YA

P(H) : Probabilitas hipotesis H


(priorprobability) Melakukan Seleksi Atribut, Data Latih,
P(X|H) : probabilitas X berdasarkan kondisi Data Uji
Data Selections

Refleksi
pada hipotesis H
P(X) probabilitas dari X Melakukan Diskritisasi Data
Data Transformations

Hasil dari rumus diatas untuk mencari probabilitas


Kesimpulan dan saran
Tindakan

yang paling tinggi dengan membandingkan seluruh

Data Mining
Php, Mysql
Analisis menggunakan NBC Jika TIDAK Knowledge Presentations

data yang ada yaitu P(H|X). 1. Training data dengan NBC


2. Tampilkan hasil atau akurasi
Teorema Bayesian dengan asumsi bahwa setiap sistem

variabel bersifat bebas (independence). Sehingga selesai

dengan asumsi seperti itu menyimpukan bahwa Menghitung akurasi sistem


setiap atribut tidak saling terkait (conditionally
independence) maka

P(X|Ci)= Gambar 2. Alur Penelitian


∑𝑛𝑘=1 𝑃(𝑋𝑘|𝐶𝑖)……….......................(2)
2.2.2 Use case diagram
Setelah diperoleh hasil dari seluruh data pada setiap Use case diagram adalah suatu bentuk diagram
class, maka hasil akhirnya dapat menggunakan yang akan menggambarkan fungsionalitas yang
rumus: diharapkan dari sebuah sistem dilihat dari sudut
pandang user. Diagram use case menggambarkan
P(X|Ci)=arg maxP(Xi|Ci)*P(Ci)…..........................(3) aktivitas-aktivitas yang dapat dilakukan oleh user.
Untuk gambar Use case terlihat pada gambar 3.
2.2 Alur Penelitian
2.2.1 Metode Penelitian
Metode yang digunakan pada penelitian ini
adalah menggunakan metode Naïve Bayes karena
metode ini sesuai digunakan untuk prediksi
ketercapaian nilai KKM siswa. Tahapan penelitian
mengikuti alur proses yang telah dibuat agar
mempermudah dalam melakukan penelitian. Alur
penelitian terlihat pada gambar 2.

17
JUSIKOM PRIMA (Junal Sistem Informasi Ilmu Komputer Prima)
Vol. 2 No. 1, Juli 2018 e-ISSN : 2580-2879

pemberitahuan bahwa
Gambar 3. Use Case Diagram pemrosesan telah selesai

Dari use case yang terlihat pada gambar 3 maka 3. Deskripsi use case prediksi data baru
dapat di deskripsikan sebagai berikut Tabel 3. Deskripsi use case diagram prediksi data
1. Deskripsi use case input data set
baru
Tabel 1. Deskripsi Use Case Diagram Input Data
Set
Nama Use Case Prediksi Data Baru
Nama Use Case Input data set Aktor
Aktor Admin Deskripsi Melakukan prediksi data
baru
Deskripsi Melakukan input data set
Kondisi Awal Melakukan data baru belum
Kondisi Awal Sistem menampilkan menu
diprediksi
utama petugas
Aktor Sistem
Aktor Sistem
1. Aktor memilih 2. Sistem menampilkan
1. Aktor memilih 2. Sistem akan
menu prediksi form prediksi baru
menu import data menampilkan form
set import data set 3. Aktor mengisi 4. Jika klik tombol Input
form prediksi data maka sistem akan
3. Aktor memilih 4. Sistem akan
baru merespon dengan
tombol cari data mengarahkan ke
menampilkan keputusan
direktori yang akan
hasil prediksi
dituju.
5. Aktor memilih 6. Sistem akan
2.3 Pengolahan Data
data file csv yang mengarahkan file csv
2.3.1 Pengambilan Data
telah ditentukan. ke partisi didalam Pengambilan data dalam penelitian ini penulis
sistem mendapatkan data langsung ke obyek penelitian.
7. Aktor memilih 8. Sistem akan Pengambilan data langsung ke objek akan
tombol impot memasukan data dari mendapatkan data yang valid.Data yang diperoleh
data csv kedalam database adalah data siswa, data orang tua dan data
mysql pendungkung lainnya. Data yang digunakan adalah
data pada tahun ajaran 2015/2016 dan data tahun
2. Deskripsi use case proses NBC ajaran 2016/2017. Data yang di peroleh berjumlah
Tabel 2.Deskripsi use case diagram proses NBC 560 record. Atribut digunakan untuk masukan dalam
melakukan prediksi.Adapun atribut yang digunnakan
Nama Use Case Proses NBC dapat dilihat pada tabel 5.

Aktor Admin Tabel 5. Atribut data siswa


Deskripsi Melakukan prediksi Atribut Keterangan
ketercapaian nilai KKM Nama Nama lengkap siswa yang
siswa dengan komposisi data bersangkutan
training dan data testing Kelas tingkatan kelas siswa yang
yang telah diinputkan oleh bersangkutan
aktor Nilai UTS Nilai UTS semester ganjil siswa
Kondisi Awal Melakukan training dan yang bersangkutan
testing data set siswa Bimbingan Keikutsertaan siswa bimbingan
Belajar belajar
Aktor Sistem Pendidikan Pendidikan orang tua dari siswa
1. Aktor memilih 2. Sistem melakukan proses Orang Tua tersebut
menu analisa analisa data training dan Keterangan Keterangan tuntas atau tidak tuntas
naïve bayes data testing siswa dalam mengikuti mata
menggunakan metode pelajaran.
Naïve Bayes
3. Apabila sistem selesai 2.3.2 Pembersihan Data
melakukan pemrosesan. Pembersihan data merupakan salah satu tahap
Sistem akan yang dilakukan dalam penelitian ini. Proses
menampilkan pembersihan data dari missing valuedan redudansi

18
JUSIKOM PRIMA (Junal Sistem Informasi Ilmu Komputer Prima)
Vol. 2 No. 1, Juli 2018 e-ISSN : 2580-2879

data. Data disebut missing value jika pada record Rata Pend.
Nama Bimbel Absen
tertentu pada salah satu atribut tidak mempunyai UTS Ortu
nilai. Record yang missing valueakan dihapus dan Tidak
Aan Adi S1 50
tidak digunakan. Pada dataset yang sama jika record Ikut
berisi nilai yang sama maka record tersebut juga Ahmad 7.1 S1 Ikut 50
akan dihapus dan tidak digunakan. Tidak
Andrianto 6.9 S1 50
Ikut
Tabel 6. Data siswa Tidak
Ardianto Fajar 7 S1 50
Ikut
Rata Pend. Tidak
Nama Bimbel Absen Bayu Aji Saputro 6.5 SMA 50
UTS Ortu Ikut
Adimas 6.5 SMA 50 Tidak
Tidak Bayu Prastiyo 6.9 S1 50
Aan Adi S1 50 Ikut
Ikut Tidak
Tidak Budiyanto 6.3 SD 50
Agus 6.2 50 Ikut
Ikut Danny Aji 7.7 SMA Ikut 50
Ahmad 7.1 S1 Ikut 50 Dimas Tidak
Tidak 7.1 S1 50
Andrianto 6.9 S1 50 Anjasmara Ikut
Ikut Tidak
AnggikSetyawan 7.5 SMA 50 Dyangga Farista 6.3 SMA 50
Ikut
Tidak Tidak
Ardianto Fajar 7 S1 50 Eko Pujiyanto 7.1 SMP 50
Ikut Ikut
Tidak Galang Tidak
Bayu Aji Saputro 6.5 SMA 50 7.9 SMA 50
Ikut Prihhatoro Ikut
Tidak Ibnu Kurniawan
Bayu Prastiyo 6.9 S1 50 5.5 SMP Ikut 50
Ikut Aji
Tidak Muhamad
Budiyanto 6.3 SD 50 5.9 SMP Ikut 50
Ikut Ridwan
Tidak Tidak
Candra Ari 5.9 50 Muhammad Suro 6.6 SD 50
Ikut Ikut
Danny Aji 7.7 SMA Ikut 50
Dimas Tidak 2.2.3 Integrasi Data
7.1 S1 50
Anjasmara Ikut Integrasi Data adalah tahap yang dilakukan
Tidak dalam penelitian ini peneliti menggabungkan semua
Dyangga Farista 6.3 SMA 50
Ikut data yang dikumpulkan dan yang akan digunakan.
Tidak Peneliti melakukan penggabungan dari beberapa
Eko Pujiyanto 7.1 SMP 50
Ikut data yaitu dtaa siswa dan data pendidikan orang tua
Ferri Pradia 6.8 S1 50 yang berkaitan dengan aspek-aspek penilian untuk
Galang Tidak ketercapaian nilai KKM siswa. Sehingga dengan
7.9 SMA 50
Prihhatoro Ikut melakukan penggabungan data ini diperoleh data set
Ibnu Kurniawan yang sesuai dengan perancangan sistem yang
5.5 SMP Ikut 50
Aji dibangun.
Muhamad
5.9 SMP Ikut 50
Ridwan 2.2.5 Seleksi Data Atribut
Tidak Dalam data mining dibutuhkan data latih dan
Muhammad Suro 6.6 SD 50 data uji. Maka dalam tahap ini penulis melakukan
Ikut
seleksi data atribut untuk melakukan prediski
Data pada tabel 3 ini data dimana yang sudah ketercapaian nilai KKM siswa. Dalam seleksi data
melalui tahap pembersihan data atau claening data. penulis menyeleksi data menjadi data latih dan data
Penulis mengambil data yang memiliki value atau uji yang akan digunakan. Data latih merupakan
nilai yang lengkap. Untuk data yang memiliki suatu data yang akan digunakan untuk melakukan
missing value tidak digunakan dan dihapus. Hasil penelusuran pola dalam data mining atau sebagai
dari pembersihan data ini akan berguna dalam daya ang digunakan data sumber. Data uji
prediksi ketercapain nilai KKM siswa. merupakan data yang akan diujikan atau data yang
akan dicoba pada sistem. Data yang sudah selesai
Hasil pembersihan data atau cleaning data dapat melalui tahap seleksi data digunakan kemudian
dilihat pada tabel 7. akan di bagi menjadi data latih dan data uji dengan
proporsi pembagian sebesar 75% dari data
Tabel 7. Hasil Pembersihan data

19
JUSIKOM PRIMA (Junal Sistem Informasi Ilmu Komputer Prima)
Vol. 2 No. 1, Juli 2018 e-ISSN : 2580-2879

keseluruhan sebagai daa latih dan 25% dari data melakukan perhitungan dengan 3 keluaran, yaitu:
keseluruhan sebagai data uji. recall, precision dan acuraccy
1. Recall adalah proporsi kasus positif yang
2.2.6 Pembahasan diidentifikasi dengan benar. Rumus dari recall =
Dalam tahap ini peneliti melakukan pengujian TP/(TP+FN)
dengan menggunakan data 2 tahun pelajaran dari 2. Precision adalah proporsi kasus dengan hasil
tahun 2015/2016 sampai 2016/2017 dengan positif yang benar. Rumus dar Precision =
menggunakan rincian data sebagai berikut: TP/(TP+FP)
3. Accuracy adalah perbandingan kasus yang
Data keseluruhan dalam 2 tahun ajaran 2015/2016 diidentifikasi benar dengan jumlah semua kasus
sampai 2016/2017 sebanyak 645recorddata siswa. Rumus dari accuracy=
Dengan atrbut yang telah ditentukan. Oleh peneliti (TP+TN)/(TP+TN+FP+FN).
dalam melakukan prediski keercpaian nilai KKM Pada tahap inimelakukan pengujian terhadap
siswa. sistem yang dibangun. Pada tahap ini akan menguji
sistem menggunakan metode pengujian Confusion
Dari data yang ada beberapa data yang tidak Matrix. Pengujian dilakukan agar sistem tersebut
memiliki data yang lengkap atau missing value layak untuk digunakan dalam memprediksi
sebanyak 15 record data siswa ketercapain nilai KKM siswa. Adapun rincian
pengujian adalah terlihat pada tabel 5.
Setelah data yang didapatkan yang digunakan maka
tahap selanjutnya melakukan integrasi data atau Rumus perhitungan Confusion Matrix terlihat pada
penggabungan data yang akan digunakan atau daya tabel 5.
yang sudah melalui pembersihan data. Data yang
akan digunakan sebanyak 630 record.

Tahapan selanjutnya penulis melakukan pembagian


data atribut yaitu data latih dan data uji. Data lath
75% dan data uji 25%. Untuk pembagian data latih
dan data uji terlihat pada tabel 8.

Tabel 8. Pembagian Data Latih & Data Uji


Tabel 5. Rumus Confusion Matrix
Jenis Data Prosentase Jumlah Data Sebenarnya
Confusion Matrix
Data Latih 75% 473 TRUE FALSE
Data Uji 25% 157 TP FP
(True (False
2.2.6 Prediksi Dengan Naïve Bayes TRUE Positiv Positiv
Pada tahapan ini akan mengolah data latih dan Corect Unexpecte
data uji menggunakan metode naive bayes. Setelah Data Result) d Result)
pembagian data latih dan data uji dengan hasil 473 Prediksi TN (True
recordsebagai data latih dan 157 recordsebagai data FALSE FN (False
Negative
uji yang akan menentukan nilai tercapai dan tidak Negativ
Corect
tercapai nilai KKM siswa menggunakan metode Missing
Absence Of
naive bayes. Dari hasil prediksi yang sesuai dengan Result)
Result)
data asli sebanyak 145 record. Sehingga data yang
tidak sesuai dengan data asli sebanyak 12 record. Rumus untuk perhitungan confusion matrix jika di
Langkah selanjutnya menguji kinerja sistem.Tujuan tuliskan seperti dibawah ini:
dari menguji kinerja sistem adalah untuk mengetahui
kinerja sistem dalam melakukan prediksiketercapain Nilai Precision = TP / (TP+FP)
nilai KKM siswa. Nilai Recall = TP/ (TP+FN)
NilaiAcuracy = TP + TN / (TP+TN+FP+FN)
2.2.7 Pengujian Dengan Confusion Matrix
Confusion matrixadalah suatu metode yang Mendefinisikan sebagai berikut
biasanya digunakan untuk melakukan perhitungan
akurasi pada konsep data mining. Rumus ini

20
JUSIKOM PRIMA (Junal Sistem Informasi Ilmu Komputer Prima)
Vol. 2 No. 1, Juli 2018 e-ISSN : 2580-2879

Precision = Merupakan tingkat ketepatan


Hasil dari pengujian dengan confusion matrix antara informasi yang diminta
terlihat pada tabel 6. oleh pengguna dengan jawaban
yang diberikan oleh sistem
Tabel 6. Data Hasil Prediksi Recall = Merupakan tingkat keberhasilan
sistem dalam menemukan
kembali sebuah informasi.
Dari data yang terlihat pada tabel 6 didapatkan hasil Acuracy = Sebagai tingkat kedekatan antara
perhitungan confusion matrix sebagai berikut nilai prediksi dengan nilai aktual
b. Menghitung P(X|Ci) untuk setiap kelas i
Nilai Precision =145/(145+12) = 0,92
Nilai Recall = 145/(145+157) = 0,48 P(Rata-rata nilai UTS= ”7.5”
NilaiAcuracy =(145+473)/(145+473+157+12) 133
|keterangan=Tercapai”) = = 0.98
=0,78 135

P(Rata-rata nilai UTS=“75” |


Apabila hasil dari perhitungan confusion matrix di 2
keterangan=“Tidak Tercapai”) = = 0.02
konversikan ke nilai yang lebih mudah yaitu nilai 135
persen maka akan didaptkan hasil sebagai berikut
Nilai Precision = 0,90 x 100 = 90% P(Pendidikan Orang Tua = “SMA” |
343
Nilai Recall = 0,47 x 100 = 47% keterangan=”Tercapai”) = = 0,95
360
NilaiAcuracy = 0,715 x 100 = 71%
P(Pendidikan Orang Tua = “SMA” | keterangan
Setelah dilakukan perhitungan metode naïve bayes 17
= “Tidak Tercapai”) = = 0,04
dengan data sebanyak 600 record dengan 360
mengguunakan data latih sebanyak 473 data dan
data uji 157 data maka didapatkan bahwa nilai P(Keikutsertaan Bimbel= “Tidak Ikut |
463
precision sebesar 92%, nilai recall sebesar 48% dan Keterangan=”Tercapai”) = =0.97
473
nilai accuracy sebesar 78%. P(Tidak Melaksanakan Piket =“Tidak Ikut
13
|keterangan=“Tidak Tercapai”) = = 0.02
2.2.7 Studi Kasus Perhitungan Naïve Bayes 473

Pada tahap ini akan memberikan contoh


P( Kehadiran = “49” | keterangan = Tercapai”)
perhitungan dalam menggunakan metode naïve 46
bayes. Tujuan dalam tahap ini adalah agar pembaca = = 0.92
50
mengetahui bagaimana perhitungan naïve bayes
secara jelas dan mudah untuk dipahami. P( Kehadiran = “49”| keterangan= “Tidak
Dalam tahap perhitungan ini akan menentukan 4
Disiplin”) = = 0.08
50
nilai tercapai dan tidak tercapai nilai KKM siswa
menggunakan metode naïve bayes. Dengan atribut
yang telah di tentukan yaitu nilai rata-rata UTS Data Sebenarnya
Confusion Matrix
gasal, pendidikan orang tua, keikutsertaan siswa TRUE FALSE
dalam Bimbel dan kehadiran siswa.
Data TRUE 145 12
Berikut adalah data baru yang akan digunakan Prediksi FALSE 157 473
sebagai contoh perhitungan. Berikut adalah data
baru adalah b. Menghitung P(X|Ci) untuk setiap kelas
P(X|: level = ’Tercapai’) = 0.98 x 0.95 x 0.97 x
a Rata-rata nilau UTS Gasal = 7.5 0.92 = 0.8308244
b Pendidikan Orang Tua = SMA
c Keikutsertaan Bimbel = Tidak Ikut P(X| level= ’Tidak Tercapai’ ) = 0.02 x 0.04 x
d Kehadiran = 49 0.07 x 0.08= 0.000672

Maka untuk menetukan hasil akhir dari data baru c. Menghitung P(X|Ci)*P(Ci ) :
yang diatas maka perhitungan dilakukan secara jelas P(X|keterangan =”Tercapai”) *
dan mudah dipahami sebagai berikut: P(level=“Tercapai”) = 0.87 x 0.8308244=
a. Menghitung P(Ci) 0.722817228
460
P(Keterangan=’Tercapai’) = = 0,87 P(X|keterangan =“Tidak Tercapai”) *
473
P(level=“Tidak Tercapai”)= 0.02 x0.0.000672=
13
P(Keterangan=’Tidak Tercapai’) = = 0,02 0.0001344
473

21
JUSIKOM PRIMA (Junal Sistem Informasi Ilmu Komputer Prima)
Vol. 2 No. 1, Juli 2018 e-ISSN : 2580-2879

Bayes Classifier . SemanTIK, Vol.3, No.2,


Hasil dari perhitungan dengan data rata-rata nilai Jul-Des 2017, pp. 13-22 ISSN : 2502-8928
UTS, pendidikan Orang Tua, Keikutsertaan Bimbel
dan Kehadirandengan menggunkan algoritma Naïve [5]. Husni Naparin.2016. Prediksi Peminatan Siswa
Bayes diatas didapatkan hasil keterangan = Sma Menggunakan Metode Naive Bayes.
“Tercapai” SYSTEMIC Vol. 02, No. 01 ISSN 2460-
8092.
3. PENUTUP
3.1 Kesimpulan [6]. Jayanto, Arief. 2013. Algoritma Naive Bayes
Dari penelitian yang telah dilakukan maka dapat untuk Mencari Perkiraan Waktu Studi
diambil kesimpulan bahwa dengan menggunakan Mahasiswa. Jurnal Teknologi Informasi
naïve bayes dapat melakukan prediksi terhadap DINAMIK Volume 18, No.1, Januari
ketercapaian nilai KKM siswa. Dengan 2013 : 09-16 ISSN : 0854-9524.
menggunakan naïve bayes dengan data sebanyak
473 data record untuk data latih dan 157record [7]. Mandasari, Vina, dkk. 2011. Analisis Kepuasan
untuk data uji. Dari pengujian didaptkan nilai Konsumen Terhadap Restoran Cepat Saji
accuracy sebesar 78%, precion sebesar 92% dan Melalui Pendekatan Data Mining. Jurnal
recall sebesar 48%. Generic Vol.6 No.1 (Januari 2011)
3.2 Saran
Agar penelitian berikutnya yang akan melakukan [8]. Ridwan, Mujib, dkk. 2013. Penerapan Data
penelitian yang sama, agar mendapatkan hasil yang MiningUntuk Evaluasi Kinerja Akademik
lebih baik sebgai berikut Mahasiswa Menggunakan Algoritma
1. Pada penelitian ini dalam hal pengukuran Naive Bayes Classifier. Jurnal EECCIS
kinerja sistem menggunakan metode Confusion Vol.7, No. 1, Juni 2013
Matrix. Sebagai perbandingan dalam hal
pengujian kinerja sistem prediksi dapat [9]. Untari, Dwi, “Data Mining untuk Analisa
menggunakan metode lain sepeti K-Fold Cross Prediksi Mahasiswa Non-Aktif
Validation. menggunkaan Metode Decision Tree
2. Untuk mengatahui tingkat kinerja sistem yang C45”, Universitas Dian Nuswantoro:
berbeda, proses pelatihan dan pengujian data Semarang, 2014.
untuk klasifikasi kedisiplinan siswa
menggunakan metode selain menggunakan [10]. G. Subbalakshmi, K. Ramesh and M. C.
algoritma Naïve Bayes Classifictaion. Rao, "Decision Support in Heart Disease
Prediction System Using Naive Bayes,"
Indian Journal of Computer Science and
Engineering, vol. 2, no. No. 2, ISSN: 0976-
5166, pp. 170-176, April-June 2011.

DAFTAR PUSTAKA [11]. M. Sarosa, H. Suryono and M. Ridwan,


"Penerapan Data Mining Untuk Evaluasi
[1]. Mardapi, Dj. dan Ghofur, A, (2013). Pedoman Kinerja Akademik Mahasiswa
Umum Pengembangan Penilaian; Kurikulum Menggunakan Algoritma Naive Bayes
Berbasis Kompetensi SMA. Jakarta: Classifier," Jurnal EECCIS, vol. 7, no. No.
Direktorat Pendidikan Menengah Umum 1, pp. 59-64, 2013.

[2]. Peraturan Menteri Pendidikan Nasional Nomor [12]. R. R. Patil, "Heart Disease Prediction System
14 tahun 2008 tentang Organisasi dan Tata using Naive Bayes and Jelinek-Mercer
Kerja Direktorat Jenderal Manajemen Smoothing," International Journal of
Pendidikan Dasar dan Menengah Advanced Research in Computer and
Departemen Pendidikan Nasional. Jakarta: Communication Engineering, vol. 3, no. 5,
Direktorat Jenderal Manajemen Pendidikan ISSN (Online): 2278-1021, ISSN (Print):
Dasar dan Menengah. 2319-5940, pp. 6787-6789, 2014.

[3]. Praningki Tutus, Sistem Prediksi Penyakit


Kanker Serviks Menggunakan CART, Naive
Bayes, dan k-NN. Cite c Journal, Vol. 4, No.
2, Februari 2017 – April 2017

[4]. Deny Wiria Nugraha dkk. 2017. Prediksi


Penyakit Stroke Menggunakan Metode Naive

22

Anda mungkin juga menyukai