NB1 en Id
NB1 en Id
com
menggunakan Algoritma Naïve Bayes dengan Siti Ernawati, Risa Wati, Nuzuliarini Nuris
dkk.
implementasi data mining (Studi Kasus: Jurusan - Analisis komparatif dari nave bayes dan knn pada
prediksi harga forex pergerakan mata uang gbp/
Teknik Industri USU) usd pada saat itu bingkai setiap hari
Konten ini diunduh dari alamat IP 103.73.72.78 pada 09/11/2022 pukul 03:22
TALENTA CEST III 2020 Penerbitan IOP
Konferensi IOP Seri: Ilmu dan Teknik Material 1122 (2001) 012069 doi:10.1088/1757-899X/1122/1/012069
*
Email: meilita_tryana@yahoo.co.id
Abstrak. Salah satu indikator kinerja perguruan tinggi adalah presentasi kelulusan mahasiswa
tepat waktu dengan persentase kelulusan lebih dari atau sama dengan 50%. Banyaknya data
di Sistem Informasi Akademik (SIA) Perguruan Tinggi tidak digunakan dalam mengukur kinerja
suatu Perguruan Tinggi, khususnya Program Studi. Departemen Teknik Industri merangkum
data mahasiswa dalam SIA sebagai database dan mengolahnya sesuai dengan yang
dibutuhkan. Selama ini, data yang melimpah di SIA belum dimanfaatkan untuk menilai kinerja
siswa. Pada saat Prodi melakukan evaluasi akademik mahasiswa, Prodi melakukan evaluasi
berdasarkan variabel jumlah sks, IPK, dan kendala. Pada Program Studi diperlukan klasifikasi
yang tepat untuk memudahkan dalam mengevaluasi kinerja mahasiswa. Metode yang
digunakan adalah algoritma Naïve Bayes dalam mengklasifikasikan prestasi akademik
mahasiswa Jurusan Teknik Industri USU. Atribut yang digunakan antara lain NIM, Nama, Jenis
Kelamin, Daerah Asal, Asal Sekolah, Masuk, dan IPK.Dari hasil pengujian 173 data sampel
dengan menggunakan algoritma Naïve Bayes, pola yang terbentuk memiliki akurasi
kecocokan sebesar 70,83% yang artinya berguna dalam memprediksi kelulusan siswa.
1. Perkenalan
Kemajuan teknologi informasi telah merambah di segala bidang kehidupan. Banyak data yang dihasilkan oleh teknologi
informasi, mulai dari industri, ekonomi, ilmu pengetahuan dan teknologi, dan berbagai bidang kehidupan lainnya. Data
tersebut melimpah namun masih tersembunyi sehingga tidak dimanfaatkan dengan baik [1].
Pada industri 4.0, teknologi memberikan dampak positif bagi organisasi seperti meningkatkan
produktivitas dan meningkatkan komunikasi dan koordinasi secara vertikal (dalam organisasi) maupun
horizontal (antara organisasi, pemasok, dan pelanggan). Oleh karena itu, untuk mendapatkan hal tersebut
diperlukan adopsi teknologi industri 4.0. Mirip dengan adopsi teknologi lainnya, adopsi industri 4.0
membutuhkan strategi untuk adopsi. Perumusan strategi ini, diperlukan evaluasi terhadap kondisi
eksisting organisasi [2].
Pengolahan big data juga masih tersembunyi, dilakukan melalui proses data mining, atau biasa disebut data
mining. Sebagai bagian dari Knowledge Discovery in Database, data mining adalah aktivitas penggalian informasi
atau pengetahuan bernilai tinggi dari database besar. Konsep kerja menentukan pola yang ditemukan dalam
kumpulan data agar lebih berguna dalam kehidupan nyata [3].
Perkembangan ruang lingkup bisnis menunjukkan peningkatan yang signifikan dalam pertumbuhan
komunikasi. Hal tersebut mempermudah akses data bagi organisasi atau perusahaan, sehingga memberikan efek
perubahan pengelolaan database ke tingkat lanjutan yang didukung oleh fasilitas data warehousing dan
database berbasis web sebagai strategi organisasi untuk meningkatkan kinerja dan keuntungan organisasi.
Konten dari karya ini dapat digunakan di bawah ketentuanLisensi Creative Commons Attribution 3.0. Distribusi lebih lanjut dari karya
ini harus mempertahankan atribusi kepada penulis dan judul karya, kutipan jurnal dan DOI.
Diterbitkan di bawah lisensi oleh IOP Publishing Ltd 1
TALENTA CEST III 2020 Penerbitan IOP
Konferensi IOP Seri: Ilmu dan Teknik Material 1122 (2001) 012069 doi:10.1088/1757-899X/1122/1/012069
Departemen Teknik Industri merangkum data mahasiswa dalam SIA sebagai database dan
mengolahnya sesuai dengan yang dibutuhkan. Selama ini, data yang melimpah di SIA belum digunakan
untuk menilai kinerja siswa. Pada saat Prodi melakukan evaluasi akademik mahasiswa, Prodi melakukan
evaluasi berdasarkan variabel jumlah sks, IPK, dan kendala. Sedangkan variabel data AIS lainnya belum
digunakan untuk menilai kinerja siswa, seperti jenis kelamin, asal sekolah, Asal daerah, jalur masuk, bahkan
pengelompokan kelas berdasarkan jalur masuk. Pada Program Studi diperlukan klasifikasi yang tepat untuk
memudahkan dalam mengevaluasi kinerja mahasiswa. Metode yang digunakan adalah algoritma Naïve
Bayes yang mengelompokkan prestasi akademik mahasiswa Jurusan Teknik Industri USU.
Beberapa studi pendahuluan yang telah dilakukan terkait dengan topik penelitian, antara lain penelitian
yang memanfaatkan evaluasi prestasi akademik mahasiswa dengan menerapkan metode pengklasifikasi
Naive Bayes dengan menggunakan indikator indeks prestasi sebagai penentu layak tidaknya kelulusan
mahasiswa pada Universitas Brawijaya [5]. Penelitian dengan penerapan data mining untuk pemetaan
kebutuhan mahasiswa bimbingan dan konseling menggunakan algoritma nave Bayes di Universitas Negeri
Universitas Negeri Padang [6]. Penelitian ini diharapkan dapat membantu kinerja departemen
meningkatkan jumlah kelulusan mahasiswa tepat waktu dengan mempertimbangkan analisis dan evaluasi
penelitian.
2. Metodologi Penelitian
2
TALENTA CEST III 2020 Penerbitan IOP
Konferensi IOP Seri: Ilmu dan Teknik Material 1122 (2001) 012069 doi:10.1088/1757-899X/1122/1/012069
5. Asal sekolah sebagai variabel bebas untuk MAN, SMAN, SMAS, SMTA Lainnya
6. Jalur masuk sebagai variabel bebas kategoris SNMPTN, SPMB, dan SPMPRM.
7. IPK (Grade Point Average) sebagai variabel independen numerik.
Hasil studi dinyatakan dengan indeks tertentu yang terakumulasi dari kredit dan materi yang diambil. CPI
menunjukkan hasil investigasi berdasarkan ujian yang dilakukan saat mengambil mata kuliah yang dihitung
dengan rumus sebagai berikut:
Ramalan
hasil
Ketepatan
pertunjukan
nilai
Aplikasi dari
algoritme
Naif Bayes
Aturan Pengujian
proses
Pertunjukan
perhitungan
klasifikasi
hasil tion
3
TALENTA CEST III 2020 Penerbitan IOP
Konferensi IOP Seri: Ilmu dan Teknik Material 1122 (2001) 012069 doi:10.1088/1757-899X/1122/1/012069
DI LUAR
3 130403004 Ummu Habibah F PRIA SNMPTN 3.32877 TERLAMBAT
MEDAN
Wildani DI LUAR
4 130403005 F PRIA SNMPTN 3.40753 TERLAMBAT
Kurniasari MEDAN
DI LUAR
5 130403006 Siti Khairunnisa F SMA SNMPTN 3.60274 TERLAMBAT
MEDAN
DI LUAR
6 130403007 Agni Fitaloka F SMA SNMPTN 3.46000 TEPAT WAKTU
MEDAN
7 130403008 Wawan Andrian M MEDAN SMA SNMPTN 3.23630 TEPAT WAKTU
DI LUAR
9 130403011 Akbar Al Ayubi M SMA SNMPTN 3.24000 TEPAT WAKTU
MEDAN
10 130403013 Intan Hartanti F MEDAN SMA SNMPTN 3.53425 TERLAMBAT
Muhammad DI LUAR
11 130403014 M PRIA SNMPTN 3.29110 TERLAMBAT
Burha MEDAN
DI LUAR
12 130403015 Abdi Santoso M PRIA SNMPTN 3.17466 TERLAMBAT
MEDAN
125data pelatihantelah diterapkan dipembersihan dataproses. Kemudian dari tabel diatas dapat dihitung
menggunakan rumus Klasifikasi Naïve Bayes, adapun cara kerjanya sebagai berikut :
Untuk masalah klasifikasi, yang dihitung adalah P(H|X), yaitu probabilitas bahwa hipotesis benar
(valid) untuk data sampel X yang diamati.
(1)
Di mana:
X: contoh data dengan kelas baru (label).
H : hipotesis bahwa X adalah kelas data (label) C. P(H) adalah probabilitas hipotesis H .
P(X): probabilitas data sampel yang diamati.
P(X|H) : probabilitas sampel data X, jika hipotesis yang diasumsikan benar (valid).
Rangkuman hasil perhitungan dapat dilihat pada tabel berikut.
4
TALENTA CEST III 2020 Penerbitan IOP
Konferensi IOP Seri: Ilmu dan Teknik Material 1122 (2001) 012069 doi:10.1088/1757-899X/1122/1/012069
W 0,500 0,471
M 0,500 0,529
Total 1.000 1.000
BANTALAN) TEPAT WAKTU TERLAMBAT
(2)
Informasi:
f: Peluang
Xi: Menghubungkannya dengan i
5
TALENTA CEST III 2020 Penerbitan IOP
Konferensi IOP Seri: Ilmu dan Teknik Material 1122 (2001) 012069 doi:10.1088/1757-899X/1122/1/012069
Rerata dan simpangan baku kemudian digunakan untuk menghitung nilai probabilitas IPK dalam mempengaruhi
kelulusan mahasiswa. Perhitungan IPK P yang diterapkan pada data pengujian ditunjukkan pada tabel 3 di bawah ini.
Ada total 48data pengujiandalam penelitian ini danpembersihan datatelah diterapkan pertama kali
untuk menghilangkan kebisingan. Rekapitulasi perhitungan probabilitas IHK dapat dilihat pada tabel
di bawah ini.
Tabel 3.Rekapitulasi Hasil Perhitungan P (IPK) kelulusan tepat dan terlambat
Nilai probabilitas dari setiap atribut kemudian dikalikan sesuai dengan data yang akan diprediksi. Data yang akan
diprediksi selanjutnya disebut data testing. Proses pengujian nantinya akan melibatkan data pengujian untuk
memprediksi apakah kelulusan itu benar atau terlambat. Tabel hasil prediksi untuk data pengujian disajikan pada
tabel 4 di bawah ini.
Abdul Rahim
3 160403005 TERLAMBAT
Nasution
Muhammad
4 160403006 TERLAMBAT
Imam Prakasa
5 160403008 Bayu Suwandira TERLAMBAT
Tamadhar Ali
6 160403010 TERLAMBAT
Khansa
6
TALENTA CEST III 2020 Penerbitan IOP
Konferensi IOP Seri: Ilmu dan Teknik Material 1122 (2001) 012069 doi:10.1088/1757-899X/1122/1/012069
Mutiara Sani
11 160403019 TEPAT WAKTU
Lubis
Anggi Ridho
12 160403020 TEPAT WAKTU
Habibi
13 160403022 Ayu Lestari TEPAT WAKTU
Talitha Almira
15 160403031 TEPAT WAKTU
Muharrami
16 160403032 Reza Agustian TEPAT WAKTU
Wira Sopyana
17 160403036 TEPAT WAKTU
Sarah
Jhan Pranata
18 160403037 TEPAT WAKTU
brahmana
Lufia Ulva
19 160403038 TEPAT WAKTU
hutapea
20 160403039 Agung Triono TEPAT WAKTU
Hasil prediksi kelulusan kemudian diuji menggunakan software rapid miner 7.3 yang dapat dilihat
pada gambar di bawah ini.
Hasil akurasi model naïve Bayes menunjukkan tingkat akurasi sebesar 70,83%, artinya
model klasifikasi passing dilihat dari tingkat presisi yang mencapai 70,83% yang dianggap
signifikan (sedang), namun hal ini perlu dilakukan ditinjau dari perspektif kompleksitas dan
jumlah dataset.
4. Kesimpulan
Berdasarkan penelitian yang telah dilakukan,
sebuah. Data latih yang digunakan dalam penelitian ini sebanyak 125 record dari siswa tahun 2013 sampai dengan 2015. Sedangkan data testing
yang digunakan sebanyak 48 record yang berasal dari data siswa tahun 2016.
b. Atribut yang digunakan meliputi nomor induk siswa, nama siswa, jenis kelamin, daerah asal,
sekolah asal, jalur masuk, dan IPK.
c. Dari hasil pengujian 173 data sampel dengan menggunakan algoritma Naïve Bayes, pola yang terbentuk
memiliki akurasi kecocokan sebesar 70,83% yang artinya cara tersebut berguna dalam memprediksi siswa.
7
TALENTA CEST III 2020 Penerbitan IOP
Konferensi IOP Seri: Ilmu dan Teknik Material 1122 (2001) 012069 doi:10.1088/1757-899X/1122/1/012069
kelulusan sehingga model untuk memprediksi kelulusan siswa berhasil dibuat menggunakan algoritma
Naïve Bayes.
Referensi
[1] Faisal M 2008Sistem Informasi Manajemen Jaringan Malang: Pers UIN-Malang
[2] Sitepu MH dkk. 2020Pendekatan Sosial-Teknis untuk Menilai Kesiapan Organisasi untuk
Industri 4.0J. Fisik.: Konf. Ser.1542012031
[3] Kapiudin M 2007Data Mining untuk Klasifikasi Pelanggan dengan Ant Colony Optimization, Vol8 No 1
[4] Peraturan Badan Akreditasi Nasional Perguruan Tinggi Nomor 3 Tahun 2019 tentang
Instrumen Akreditasi Perguruan Tinggi
[5] Ridwan M 2013Penerapan Data Mining Untuk Mengevaluasi Prestasi Akademik Siswa Menggunakan
Algoritma Naive Bayes Classifier
[6] Kurnia Saputra H 2018Analisis Data Mining Untuk Pemetaan Siswa Yang Membutuhkan Bimbingan Dan
Konseling Menggunakan Algoritma Naïve Bayes Classifier
[7] Sinulingga S 2015Pengantar Teknik Industri Edisi 2 Medan : USU Press
[8] Ningrum 2017Pengaruh Penggunaan Metode Problem Solving Based Terhadap Hasil Belajar
Ekonomi Siswa Kelas X Ekonomi Kelas X Semester Genap Metro Man 1 Akademik
Tahun
[9] Ashari Muin A 2016Metode Naive Bayes untuk Prediksi Kelulusan (Studi Kasus: Data Mahasiswa Baru
Perguruan Tinggi)
[10] Pudjiantoro dkk 2011Aplikasi Data Mining Untuk Menganalisis Kemungkinan Pengunduran Diri Calon
Mahasiswa Baru. http://yudiagusta.files.wordpress.com/2008/09/051-060-knsi2011-009-
implement- data- mining- for- analysis- kemungkinan pengunduran diri-prospective-new-
student.pdf (diunduh pada 21 Maret, 2020)