Program Studi Pendidikan Teknologi Informasi, Fakultas Ilmu Komputer, Universitas Brawijaya
Email: 1rickygunawaan@student.ub.ac.id, 2satriohadi@ub.ac.id, 3satrio@ub.ac.id
Abstrak
Penelitian ini berdasarkan hasil observasi dan wawancara dengan guru, keterbatasan guru dalam melihat
dan menganalisis faktor yang dapat mempengaruhi hasil belajar peserta didik dan tingkat keberhasilan
peserta didik. Maka berdasarkan kondisi tersebut penelitian ini bertujuan untuk menerapkan algoritme
Naïve Bayes untuk melakukan klasifikasi hasil belajar siswa di Jurusan Teknik Komputer Dan Jaringan
(TKJ) Di SMK Negeri 3 Malang dan Untuk mengetahui tingkat akurasi dari algoritme Naïve Bayes
dalam proses klasifikasi hasil belajar siswa di Jurusan Teknik Komputer Dan Jaringan (TKJ) Di SMK
Negeri 3 Malang. Penelitian yang dikembangkan klasifikasi hasil belajar siswa di Jurusan Teknik
Komputer Dan Jaringan (TKJ) Di SMK Negeri 3 Malang yang dikelaskan menjadi 3 kategori yaitu
Sangat Baik , Baik, dan Cukup. Data siswa yang digunakan dalam penelitian ini diambil dari data siswa
SMK Negeri 3 Malang. Data yang didapatkan berjumlah 63 data siswa Atribut dipakai pada penelitian
ini berjumlah 10 dan 1 atribut untuk keluaran dari klasifikasi.Hasil pengujian akurasi dari pengujian data
training menggunakan klasifikasi Naïve Bayes dengan perbedaan pada data training menunjukan hasil
akurasi yang tetap yakni 70%. Pada pengujian dengan perbedaan pada data testing menunjukan akurasi
dengan angka 80% dan 70 % dengan rata-rata akurasi 75%. Pada sistem yang juga diterapkan klasifikasi
Naïve Bayes mendapat akurasi 90% dikarenakan menggunakan seluruh dataset untuk data training.
Kata kunci: data mining, naïve bayes, klasifikasi, prediksi, sekolah menengah kejuruan, Teknik komputer dan
jaringan, akurasi
Abstract
This research is based on the results of observations and interviews with teachers, the limitations of the
teacher in recognizing and analyzing factors that can influence student achievement and student
achievement. Based on these conditions, this study aims to use the Naïve Bayes algorithm to classify the
performance of students from the Department of Computer and Network Engineering at Vocational
High School 3 Malang, and to assess the accuracy of Naïve Bayes algorithm at the Classification of
student performance in the Department of Computer and Network Engineering at SMK Negeri 3
Malang. Research developed based on preliminary research is the classification of performance of
students from the Department of Computer and Network Engineering at the vocational school 3 Malang,
which is divided into three categories, Very Good, Good and Enough. The student data used in this study
are from SMK Negeri 3 Malang students. The data obtained was 63 student attributes used in this study
and 10 and 1 attribute for output from the classification. The results of the accuracy test of the training
data test using the Naïve Bayes classification with differences in the training data showed the results of
a fixed accuracy of 70%. For tests with differences in test data, an accuracy of 80% and 70% is displayed
with an average accuracy of 75%. On a system that is also applied, the naive bayes classification gets
90% accuracy because all records are used for the training data.
Keywords: data mining, naïve bayes, classification, prediction, vocational school, computer and network
engineering, accuracy
Pendidikan orang tua juga mempengaruhi independent atau tidak saling bergantung satu
bagaimana pola pikir peserta didik tersebut. sama lain. Algoritme ini didefinisikan juga
Pedidikan orang tua menentukan sebagai metode probabilitas dan statistic dalam
bagaimana peserta didik tersebut di didik pengklasifikasian yaitu dapat memprediksi
dan di besarkan. peluang yang akan didapat pada masa depan
d. Faktor ekonomi berdasarkan data yang ada di masa sebelumnya
Faktor ekonomi juga mempengaruhi (Saleh,2015)
bagaimana peserta didik itu dapat Persamaan dari teorema Bayes bisa dilihat pada
berkembang. Peserta didik dengan ekonomi Persamaan 2.1 :
menengah kebawah pasti akan kesulitan 𝑝(𝐵 |𝐴) × 𝑝(𝐴)
untuk membeli buku yang lebih bagus di 𝑃(𝐴|𝐵) = (2.1)
𝑝(𝐴)
bandingkan dengan peserta didik yang Alur metode Naive Bayes dapat digambarkan
memiliki ekonomi yang tinggi. pada Gambar 1 berikut :
e. Nilai
Nilai sangat berpengaruh di hasil belajar
akhir peserta didik. semua nilai yang
peserta didik capai akan menentukan
berhasil atau tidaknya peserta didik dalam
memahami pelajaran.
2.5. Data Mining
Pengertian data mining berdasarkan
buku “Decision Support Systems and Intelligent
Systems” data mining adalah sebuah sebutan
yang dipakai untuk menganalisis suatu
penemuan informasi atau pengetahuan di dalam
suatu basis data.
2.6. Klasifikasi
Klasifikasi ialah pemetaan data ke dalam
kelompok kelas. Jadi dari data yang tersedia di
kelompokan menjadi kelas-kelas yang sesuai.
Pada prosesnya pengklasifikasian memiliki
dua proses yang harus dikerjakan, yaitu
(Nugroho & Subanar, 2013):
1. Proses Training
Menggunakan dataset yang sudah diketahui
atribut-atribut yang ada untuk membangun
suatu model klasifikasi berdasarkan pada
dataset yang ada.
2. Proses Testing Gambar 1 Alur Metode Naive Bayes
pengujian pada model yang sudah Adapun penjelasan dari Gambar 1 alur
diproduksi untuk menganalisa tingkat metode Naive Bayes adalah sebagai berikut
akurasi model. Data testing dibuat (Saleh, 2015):
diklasifikasikan datanya. 1. Membaca data training yang ada.
Jadi, Klasifikasi merupakan 2. Menghitung nilai mean bisa dilihat pada
penempatan objek-objek yang belum di Persamaan 2.4 :
kategorikan sebelumnya untuk di kategorikan. 𝑥1 + 𝑥2 + ⋯ 𝑥𝑛
Sehingga data tersebut dapat terkategori dan 𝜇= (2.2)
𝑛
bisa dipakai berdasarkan klasifikasinya. Keterangan :
2.7. Algoritme Naïve bayes µ : mean
Naïve bayes adalah suatu algoritme 𝑥𝑛 : sampel ke -n
klasifikasian sederhana yang memperhitungkan n : sample
sekelompok keungkinan dengan cara Untuk menghitung standar deviasi
menambahkan frekuensi data dan kombinasi dapat amati pada Persamaan 2.3:
nilai pada dataset. Algoritme ini ∑𝑛
𝑥 (𝑥𝑖 −𝜇)
2
mengansumsikan semua dari atribut adalah 𝜎= √ 𝑖
𝑛−1
(2.3)
Keterangan:
σ : standar deviasi
xi : nilai x ke- I
µ : rerata
n : jumlah sampel
Mencari nilai probabilitas dengan
menghitung jumlah data yang termasuk
kategori yang diinginkan kemudian dibagi
dengan jumlah data yang ada dalam
kategori tersebut dengan menggunakan Gambar 2 WEKA Interface
Persamaan Densitas Gauss pada Persamaan
2.4.
2
(𝑥𝑖−𝜇𝑖𝑗 )
1 −
𝑃 = (𝑋𝑖 = 𝑥𝑖 |𝑌𝑗 = 𝑦𝑗 ) = 𝑒 2𝜎 2
√2𝜋𝜎
Keterangan:
P : Probabilitas
Xi : Atribut i
xi : Nilai atribut i
Yj : Kelas yang sedang dicari
yj : bagian kelas Y yang sedang dicari 3. METODOLOGI PENELITIAN
µ : Mean
Mulai
σ : Deviasi standar, menyatakan varian
dari seluruh atribut
Identifikasi Masalah
3. Menhasilkan nilai perhitungan sebelumnya
4. Menghasilkan jawaban yang menjawab
Studi literatur
permasalahan.
2.8. Evaluasi Naïve bayes Pengumpulan data
Aspek yang menjadi tolak ukur dari
suatu algoritme klasifikasi adalah akurasi. Suatu
sistem ketika melakukan klasifikasi dapat Perancangan
mengklasifikasi semua data dengan benar,
tetapi kinerja suatu sistem tidak mungkin 100% Evaluasi dan Hasil Analisis
akurat. Pada algoritme Naïve bayes. Untuk
menghitung akurasi pada algoritme Naïve bayes
bisa menggunakan Persamaan 2.5 (Eko Penarikan Kesimpulan
Prasetyo, 2012).
𝑗𝑢𝑚𝑙𝑎ℎ 𝑑𝑎𝑡𝑎 𝑦𝑎𝑛𝑔 𝑑𝑖𝑝𝑟𝑒𝑑𝑖𝑘𝑠𝑖 𝑏𝑒𝑛𝑎𝑟
𝑎𝑘𝑢𝑟𝑎𝑠𝑖 = × 100% (2.5) Selesai
𝑗𝑢𝑚𝑙𝑎ℎ 𝑑𝑎𝑡𝑎
0
Sangat Baik Baik Cukup
6.2. Pengujian Perubahan Data Testing 1. Implementasi algoritme Naïve Bayes untuk
klasifikasi hasil belajar peserta didik diawali
dengan analisis data lalu dilakukan
penelitian, mendapatkan dataset yang
dibutuhkan selanjutnya dilaksanakan prodksi
sebuah sistem dengan mengmplementasikan
algoritma Naïve Bayes dalam sistem tersebut.
Setelah itu melaksanakan pengujian pada
beberpa data testing untuk memperoleh niali
akurasi hasil klasifikasi yang dilaksanakan
Gambar 6 Hasil Data Testing
oleh aplikasi bantuan weka dan sistem.
2. Berdasarkan pengujian data training
Grafik Hasil Pengujian data menggunakan klasifikasi Naïve Bayes
dengan perbedaan pada data training
testing 1 menunjukkan hasil akurasi yang tetap yakni
10 70%. Pada pengujian dengan perbedaan pada
data testing menunjukan akurasi dengan
5 angka 80% dan 75%. Pada sistem yang juga
diterapkan klasifikasi Naïve Bayes mendapat
0 akurasi 90% di karenakan menggunakan
Sangat Baik Baik Cukup seluruh dataset untuk data training. Hasil
pengujian dan analisis terlihat bahwa dataset
Grafik Hasil Pengujian data testing 1 yang banyak dan sebaran data yang luas dapat
mempengaruhi akurasi pada klasifikasi Naïve
Gambar 7 Hasil Pengujian 10 data testing
Bayes. Klasifikasi Naïve Bayes dengan
Hasil pengujian data perbedaan pada
tingkat akurasi yang tidak terlalu buruk
data Testing 10 dan 20 data dengan data training
tersebut dapat dijadikan rekomendasi dalam
yang tetap yakni 40 dataset dari data Sekolah
memprediksi hasil belajar peserta didik.
Menengah Kejuruan Negeri 3 Jurusan TKJ
8. Daftar Pustaka
memiliki tingkat akurasi yang yakni 80% dan
Dimyati and Mudjiono, 2006. Belajar dan
75%. Membuktikan bahwa tingkat akurasi untuk
pembelajaran. Jakarta: Rineka Cipta.
data ini tergolong tinggi dan klasifikasi naïve
Hasbullah, 2005. Dasar-dasar Ilmu Pendidikan.
bayes dapat diterapkan untuk data tersebut.
Jakarta: RajaGrafindo Persada.
Ihsan, F., 2010. Dasar-dasar Kependidikan.
6.3. Pengujian Pada sistem
Jakarta: Rineka Cipta.
Grafik Hasil Pengujian sistem Suryosubroto, B., 1990. Sistem pengajaran
dengan modul / B . Suryosubroto Pengantar
8 administrasi dan supervisi pendidikan di
6 sekolah : Tinjauan secara micro tentang
4 administrasi pendidikan / disusun oleh B .
Suryosubroto Proses belajar mengajar di
2
sekolah : wawasan baru , bebera. pp.1–2.
0 Susanto Ahmad, 2013. Teori Belajar dan
Sangat Baik Baik Cukup Pembelajaran di Sekolah Dasar. Pendidikan.
Grafik Hasil Pengujian sistem
Jakarta: Kencana prenada media group.
Syah, M., 2008. Psikologi Pendidikan dengan
Gambar 8 Hasil Pengujian Sistem Pendekatan Baru. Bandung: Bandung Remaja
Rosdakarya.
Pengujian dengan sistem pada 10 data
testing yang sudah diambil menghasilkan nilai
akurasi 90%. Pengujian algoritme naïve bayes
yang sudah di tanamkan pada sistem.
7. Kesimpulan
Berdasar perolehan tahap sebelumnya dapat
ditarik sebuah kesimpulan: