Angga Pebdika, Ruli Herdiana, Dodi Solihudin: (Jurnal Mahasiswa Teknik Informatika)

JATI (Jurnal Mahasiswa Teknik Informatika) Vol. 7 No.
1, Februari 2023
KLASIFIKASI MENGGUNAKAN METODE NAIVE BAYES UNTUK

MENENTUKAN CALON PENERIMA PIP
Angga Pebdika, Ruli Herdiana, Dodi Solihudin

Program Studi Komputerisasi Akuntansi STMIK IKMI Cirebon
Program Studi Teknik Informatika STMIK IKMI Cirebon
Jl. Perjuangan No. 10B Majasem Kec. Kesambi Kota Cirebon Tlp. 0231-490480-490481
anggarahman1502@gmail.com
ABSTRAK
Dalam dunia global saat ini, pendidikan sangat penting untuk lebih meningkatkan sumber daya manusia.
Pendidikan akan membantu peserta didik mengenai pengembangkan sikap, keterampilan, serta kecerdasan
intelektualnya untuk memberikan manusia yang terampil, cerdas, dan berakhlak mulia. Namun pendidikan
seringkali tidak berjalan dengan baik, Ada beberapa faktor yang berkontribusi terhadap hal ini, Contoh yang
paling menonjol adalah faktor ekonomi yang menyebabkan banyak anak putus sekolah. Oleh karena itu
pemerintah membuat program agar masyarakat miskin dapat melanjutkan pendidikannya melalui program ini.
Dalam penyusunan ini dicoba dengan memakai prosedur Naive Bayes. Metode ini merupakan metode
mengklasifikasikan data satu atau lebih kategori yang telah diidentifikasi. Operasi Naive Bayes menggunakan
perhitungan probabilitas dan statistik yang ditemukan oleh ilmuwan Inggris Thomas Bayes, yaitu memprediksi
probabilitas masa depan berdasarkan pengalaman masa lalu. Tujuan dari penelitian ini adalah untuk
menghindari kesalahan dalam menentukan penerimaan bantuan. Perlu diterapkan data mining dengan algoritma
Naive Bayes yang bisa mengklasifikasi tingkat kelayakan siswa penerima PIP, sehingga didapat hasil
penerimaan program Indonesia Pintar yang lebih akurat. Penelitian ini memberikan informasi baru tentang hasil
dari proses analisis yang dilakukan, selain itu dengan menggunakan metode Naive Bayes, proses analisis
tersebut dapat membuat model kelayakan untuk menerima program Indonesia Pintar berdasarkan karakteristik
yang telah ditentukan sebelumnya. Hasil dari proses penelitian ini diharapkan dapat menciptakan sistem data
mining yang dapat memberikan hasil seleksi yang sangat akurat dalam memilih penerimaan PIP.
Kata kunci : Data Mining,Naïve Bayes, Pendidikan,Program Indonesia Pintar
1. PENDAHULUAN Naive Bayes Untuk Penentuan Penerima Bantuan

Dalam kehidupan pendidikan memiliki peranan Program Indonesia Pintar (PIP) (Studi Kasus : Sd
yang sangat penting, Pendidikan juga dapat Negeri 9 Air Kumbang)”. Berdasarkan uraian di atas,
memajukan dan mengembangkan kepribadian Implementasi data mining dengan prosedur Naive
seseorang secara mental dan fisik. Itulah sebabnya Bayes guna memprediksi kelayakan penerima PIP
pendidikan berakibat positif untuk kita, serta bersumber pada penambahan atribut dataset “Jumlah
pembelajaran pula bisa menyingkirkan buta huruf tanggungan” sangat berguna untuk memastikan
serta mengarahkan kepiawaian, keterampilan mental, kelayakan penerima PIP. Bersumber pada informasi
serta lain sebagainya. Namun pendidikan seringkali yang diperoleh, penentuan penerima PIP memakai
tidak berjalan dengan baik sebab beberapa faktor prosedur algoritma Naive Bayes memberikan
problematis menjadi penyebab putus sekolah, informasi prognostik yang lebih akurat tentang siswa
seringkali alasan finansial menjadi alasan utama yang berhak menerima dukungan PIP ketimbang
putus sekolah. dengan penentuan yang dicoba oleh sekolah. Dengan
Dalam menyikapi permasalahan perekonomian demikian, metode Naive Bayes berhasil melakukan
yang membuat banyak anak putus sekolah, prediksi dengan presisi 90,00%, presisi 98,57%,
pemerintah meluncurkan program Indonesia Pintar. recall 87,67%, dan AUC 0,868 menggunakan 101
Pada tahun 2015 Kebijakan Program Indonesia Pintar data [2].
(PIP) didirikan lewat Permendikbud No. 12 Tahun Data Mining adalah cara untuk menemukan
2015 tanggal 12 Mei 2015. Program Indonesia Pintar informasi yang berharga, laten, tersembunyi dari
ialah program pemerintah yang ditawarkan dalam sejumlah besar data (database) dan dengan demikian
wujud pembiayaan pendidikan. langsung kepada para menemukan pola yang menarik, yang sebelumnya
siswa. Program ini diperuntukkan bagi individu dari tidak diketahui. Data mining adalah sekumpulan
keluarga kurang sanggup secara ekonomi yang proses untuk memastikan korelasi pola dengan tujuan
ditandai menggunakan Kartu Indonesia Pintar (KIP) memfilter data yang besar dan mendapatkan fitur
[1]. terbaru yang berguna untuk memahami suatu model
Menurut penelitian terdahulu Kajian oleh Okta atau varian dari suatu database.
Rin dan Suzi Oktavia Kunang (2021) berjudul Metode Naïve Bayes merupakan metode yang
“Implementasi Data Mining Menggunakan Metode hanya memerlukan jumlah data latih (training data)
452
JATI (Jurnal Mahasiswa Teknik Informatika) Vol. 7 No. 1, Februari 2023
yang kecil untuk memilih parameter yang dibutuhkan dapat terbagi dari beberapa kelompok seperti
selama proses klasifikasian. Dengan menggunakan Deskripsi, Evaluasi, Prediksi, Klasifikasi,
beberapa atribut Dengan atribut saling berhubungan Pengelompokan dan Pemetaan berdasarkan tugas
untuk penentuan kelayakan [3]. yang akan dilakukan [6].
Data mining adalah suatu proses dimana
2. TINJAUAN PUSTAKA. sejumlah besar data digali dan dianalisis untuk
2.1. Program Indonesia Pintar mendapatkan suatu yang valid, baru dan bermanfaat,
Program Indonesia Pintar (PIP) adalah Sebuah alhasil bisa menemukan pola atau formula dalam data
program pemerintah yang diprakarsai oleh tersebut. Penambangan data secara umum dapat
Kementerian Pendidikan dan Kebudayaan yang diklasifikasikan menjadi dua kategori utama,
dibentuk dengan tujuan mengatasi permasalahan penambangan deskriptif dan penambangan prediktif.
pengajaran sekolah yang ada, dimana masih banyak Deskriptif Mining adalah proses menemukan
masalah siswa putus sekolah karena kesulitan informasi penting dari database. Sedangkan prediktif
keuangan. Siswa dari keluarga miskin membutuhkan adalah Proses penentuan polaritas data dengan
program Indonesia Pintar karena siswa dari keluarga menentapkan beberapa variabel untuk
miskin sangat rawan berhenti sekolah di usia dini. memperkirakan variabel lain di masa mendatang.
Hal seperti ini diakibatkan karena keadaan ekonomi Data Mining ialah bagian integral dari
keluarga peserta didik yang kurang mendukung, pengetahuan pada basis data atau sering disebut
sehingga kebanyakan peserta didik menetapkan untuk dengan Knowledge Discovery in Databases (KDD),
berhenti sekolah serta memilih untuk membantu yang berarti progres umum transformasi data mentah
prekonomian keluarga dengan bekerja. Atas dasar menjadi model yang berguna, yaitu informasi yang
masalah ini, pemerintah mengambil tindakan dalam dibutuhkan pengguna sebagai informasi. [7].
upaya pemecahan masalah supaya peserta didik yang Dibawah ini ialah proses terjadinya dalam sebuah
berasal dari keluarga kurang mampu bisa KDD :
menuntaskan pendidikannya serta dapat meneruskan 1. Data selection
persekolahan ke jenjang yang lebih teratas [4] Data selection berasal dari sekumpulan data
Kebijakan program Indonesia Pintar melalui oprasional yang harus dilakukan sebelum tahap
Kartu Indonesia Pintar (KIP) ditetapkan pemerintah ekstraksi data pada KDD. Hasil Pemilihan data
di bawah Kementerian Pendidikan dan Kebudayaan yang akan digunakan dalam tahap data mining
(Kemendikbud) lewat Tim Percepatan ditampilkan dalam satu halaman berdasarkan data
Penanggulangan Kemiskinan Nasional (TNP2K). operasional.
Program ini bertujuan agar memberikan pendidikan 2. Preprocessing
yang layak bagi siswa miskin, mencegah anak putus Sebelum tahap selanjutnya dilakukan, Diperlukan
sekolah dan penuhi kebutuhan dalam pembelajaran. metode pembersihan untuk data yang menjadi
Siswa ditujukan menggunakan bantuan ini untuk fokus KDD. Dalam tahapan ini mencangkup
memenuhi kebutuhan sekolah seperti: Biaya SPP, penghapusan duplikat data, pengecekan data yang
perlengkapan sekolah dan uang saku. Dengan adanya tidak konsisten serta koreksi kesalahan dalam data
Kartu Indonesia Pintar, diharapkan siswa tidak putus seperti kekeliruan dalam cetak.
sekolah lagi karena kekurangan dana. Bantuan Kartu 3. Transformation
Indonesia Pintar (KIP) ditujukan pada peserta didik Coding merupakan transformasi data yang dipilih
yang kekurangan dari tingkat SD sampai dengan agar cocok untuk langkah penambangan data.
SMA. Salah satu gejala yang muncul ialah Coding KDD adalah langkah kreatif yang sangat
pemerataan pendidikan serta akurasi keselarasan bergantung oleh jenis data atau model yang
berbasis Program Indonesia Pintar (PIP) melalui diambil dari setdata.
Kartu Indonesia Pintar (KIP) tidak tepat sasaran. Hal 4. Data mining
ini dibuktikan dengan masih adanya siswa dari Dalam langkah ini ialah digunakannya teknik atau
keluarga mampu dengan terdaftar sebagai penerima metode dengan tujuan menemukan pola atau hasil
dana Kartu Indonesia Pintar (KIP), dan terdapat yang menarik. Teknik, metode, atau algoritma
peserta didik yang tergolong kekurangan dan bukan penambangan data yang bervariasi, menentukan
pemeroleh bantuan Indonesia Pintar yang metode atau algoritma yang tepat sangat
terdaftar [5]. bergantung dalam tujuan serta keseluruhan
tahapan dalam KDD.
2.2. Data Mining 5. Interpretation/Evaluation
Data mining merupakan salah satu teknik Model data yang diperoleh dari langkah data
penggolongan data dengan tujuan mencari kolerasi mining dapat memberikan hasil yang dapat mudah
antar data yang tidak diketahui oleh pengguna dan dimengerti daripada yang berkepentingan. Tujuan
menyajikannya dalam hasil yang mudah dipahami dari bagian ini adalah untuk menentukan apakah
dan kolerasi data tercatat dapat digunakan sebagai kebijakan atau informasi yang diperoleh
dasar pengambilan keputusan. Penambangan data bertentangan dengan informasi.
453
Knowledge Discovery in Databases (KDD) Pendekatan Naïve Bayes digunakan untuk

ialah aktivitas yang mencakup serta memakai data analisis data. Ini adalah pengklasifikasi probabilitas
historis dengan tujuan mendapatkan keteraturan, pola dasar yang menggunakan Teorema Bayes dengan
serta korelasi pada perpaduan data yang besar [8]. asumsi independensi yang tinggi. Pendekatan Nave
Dalam jurnalnya disampaikan ciri-ciri data mining Bayes memiliki keuntungan karena hanya
sebagai berikut : menggunakan sedikit data training untuk
a. Data Mining mengacu pada inovasi tersembunyi mendapatkan estimasi parameter yang diperlukan
serta model data spesifik yg sebelumnya tidak dalam proses klasifikasi. Oleh karena itu, terlepas
diketahui. dari variabel independen yang dipertimbangkan,
b. Pada umumnya data mining menggunakan big hanya varian dari variabel kelas yang diperlukan
data. untuk menentukan kategorisasinya, bukan seluruh
c. Secara umum, big data digunakan dengan tujuan variabel kelas. [9]
membentuk hasil yang kredibel.
d. Data mining bermanfaat bagi pengambilan 2.4. Klasifikasi
ketentuan krusial terutama pada strategi Klasifikasi adalah salah satu langkah terpenting
pada data mining. Klasifikasi ialah proses
2.3. Naïve Bayes mengkategorikan atau memberi label data atau objek
Naive Bayes classifier (NBC) ialah salah satu baru berdasarkan kualitas tertentu. Teknik klasifikasi
metode klasifikasi yang sering digunakan. Naive melibatkan pemeriksaan variabel yang dihasilkan dari
Bayes Classifier (NBC) adalah salah satu metode data yang ada. Tujuan dari klasifikasi adalah untuk
klasifikasi dan statistik pengklasifikasi yang dapat mengantisipasi kelas yang dihasilkan dari item yang
memprediksi peluang untuk menjadi anggota kelas. tidak diketahui. Ada tiga tahap klasifikasi yaitu
NBC berdasarkan pada teori Bayesian konstruksi model, aplikasi model serta evaluasi.
memperkirakan bahwasanya nilai atribut tidak Pembuatan model melibatkan pembuatan contoh
bergantung dengan nilai yang lainnya. Keunggulan memakai data pelatihan yang telah memiliki atribut
NBC ialah sederhana namun mempunyai akurasi serta kelas. informasi ini lalu digunakan untuk
yang tinggi. Proses klasifikasi data terdiri dari dua memilih kelas data atau objek baru. Data tersebut
langkah. Langkah pertama ialah pelatihan dengan kemudian dievaluasi untuk melihat keakuratan yang
contoh (model training). Langkah kedua ialah didapatkan dari pengembangan dan penerapan model
mengklasifikasikan data yang kategorinya tidak pada data baru [10].
diketahui [7]. Salah satu metode classifier yang dapat
Naive Bayes adalah teknik peramalan digunakan adalah metode Naive Bayes yang sering
probabilistik sederhana sesuai dengan pelaksanaan disebut dengan Naive Bayes Classifier (NBC). Naive
teorema Bayes (hukum bayes) menggunakan Bayes Classifier (NBC) adalah salah satu metode
perkiraan independensi yang kuat. Kelebihan dari klasifikasi dan statistik pengklasifikasi yang dapat
pada metode ini ialah hanya memerlukan sedikit data memprediksi peluang untuk menjadi anggota kelas.
latih dengan tujuan memastikan parameter yang Menurut NBC, nilai atribut grup tidak bergantung
diharapkan pada langkah klasifikasi [2]. pada nilai karakteristik lainnya. Keunggulan NBC
Kelebihan metode ini ialah : ialah dasar namun akurat. Prosedur kategorisasi data
1. Membenahi kuantitatif serta diskrit dibagi menjadi dua tahap. Langkah pertama adalah
2. Tangguh untuk titik kebisingan terisolasi, seperti berlatih dengan contoh (Training Example). Tahap
yang dirata-rata saat mengevaluasi probabilitas kedua adalah proses pengkategorian data yang belum
bersyarat data. diketahui kelasnya [7].
3. Hanya dengan jumlah kecil data training untuk
memperkirakan parameter (rata – rata serta 3. METODE PENELITIAN
variansi yang berasal dari variabel) untuk Data penelitian dipisahkan menjadi dua kategori
klasifikasi. ialah data primer serta data sekunder. Data primer
4. Skala nilai yang hilang disebabkan oleh adalah informasi yang dikumpulkan langsung di
pengabaian kejadian selama estimasi lapangan, sedangkan data sekunder dikumpulkan
kemungkinan peluang. secara tidak langsung.
5. Cepat serta menghemat waktu
6. Kuat terhadap karakteristik yang tidak relevan. 3.1. Teknik Pengumpulan Data
1. Obervasi
Kekurangan Metode Naïve Bayes : Metode observasi dilakukan dengan pengambilan
1. Memperkirakan bahwa karakteristiknya bebas. data calon penerima program indonesia pintar di
2. Ini tidak berlaku, Jika probabilitas bersyarat SMP 1 Negeri Kramatmulya.
adalah 0, probabilitas prediksi juga akan menjadi 2. Metode wawancara
0. Hal ini dilakukan melalui wawancara dengan
wakil kepala sekolah dan pengurus sekolah untuk
454
mendapatkan informasi tentang data calon menjelaskan proses dimana tolos Rapidminer
penerima manfaat program Indonesia Pintar. memilih atribut mana yang akan digunakan dalam
tahapan data mining. Pada tahap ini adalah
3.2. Tahap Perancangan menyeleksi atribut mana saja yang dibutuhkan
Dalam penelitian ini menggunakan tahap menggunakan oprator select attributes yang dapat
perancangan KDD : memfilter atribut yang diperlukan. Dengan
parameter subset, opsi ini memilih beberapa
atribut yang akan digunakan. Jika metadata
diketahui, semua atribut dicantumkan dan atribut
yang diperlukan dapat dipilih dengan mudah.
Berikut dibawah ini adalah hasil seleksi atribut.
Gambar 1. Tahapan KDD
1. Data selection
Data selection berasal dari sekumpulan data
oprasional yang harus dilakukan sebelum tahap
ekstraksi data pada KDD. Hasil Pemilihan data
yang akan digunakan dalam tahap data mining
ditampilkan dalam satu halaman berdasarkan data Gambar 2. Hasil Seleksi Atribut
operasional.
2. Preprocessing 2. Preprocessing
Sebelum tahap selanjutnya dilakukan, Diperlukan Dalam tahap ini mencakup hapus duplikat data,
metode pembersihan untuk data yang menjadi periksa data yang tidak konsisten dan perbaiki
fokus KDD. Dalam tahapan ini mencangkup kesalahan dalam data. Pada langkah ini penulis
penghapusan duplikat data, pengecekan data yang menggunakan filter sampel rapidminer untuk
tidak konsisten serta koreksi kesalahan dalam data menghilangkan missing value, data missing value
seperti kekeliruan dalam cetak. tersebut mengandung dua atribut yaitu pekerjaan
3. Transformation dan pendapatan. Berikut adalah proses
Coding merupakan transformasi data yang dipilih penghapusan pada rapidminer menggunakan
agar cocok untuk langkah penambangan data. oprator filter examples.
Coding KDD adalah langkah kreatif yang sangat
bergantung oleh jenis data atau model yang
diambil dari setdata.
4. Data mining
Dalam langkah ini ialah digunakannya teknik atau
metode dengan tujuan menemukan pola atau hasil
yang menarik. Teknik, metode, atau algoritma
penambangan data yang bervariasi, menentukan
metode atau algoritma yang tepat sangat
bergantung dalam tujuan serta keseluruhan
tahapan dalam KDD. Gambar 3. Penggunaan Oprator Filter Example
5. Interpretation/Evaluation
Model data yang diperoleh dari langkah data 3. Tranforsformasi
mining dapat memberikan hasil yang dapat mudah Pada tahapan ini, mengubah data menjadi model
dimengerti daripada yang berkepentingan. Tujuan analisis data dan memodelkan data agar sesuai
dari bagian ini adalah untuk menentukan apakah dengan analisis data mining yang
kebijakan atau informasi yang diperoleh diharapkan, tujuan transformasi adalah mengubah
bertentangan dengan informasi data yang dipilih ke dalam bentuk prosedur
penambangan. Mengubah kode NISN menjadi ID
4. HASIL DAN PEMBAHASAN dan kode PIP menjadi Label. Atribut dalam peran
1. Data Selection label berperan sebagai label dan atribut berlabel
Data selection mencakup semua atribut dari sebagai operator pembelajaran, label sering
kumpulan data asli, dipilih untuk mendapatkan disebut sebagai variabel atau kelas. Berikut data
atribut yang diperlukan untuk proses yang diolah untuk data mining.
penambangan data selanjutnya . Berikut ini
455
dan data uji. pada subproses training

menggunakan operator naive bayes sebagai
penerapan model algoritme. sementara
operator Apply model terapkan menggunakan
subproses Pengujian untuk menguji data yang
dihasilkan dari operator Naive Bayes, operator
Kinerja dipergunakan untuk mengevaluasi kinerja
Gambar 4. Penggunaan Operator Set Role model, secara otomatis menyampaikan daftar nilai
kriteria kinerja yang disediakan untuk tugas
Set-Role merupakan operator yang tertentu.
mengklasifikasikan atribut menjadi atribut
spesifik atau atribut standar . Operator Set Role 5. Interpretation/Evaluation
memisahkan baris yang mengambil atribut Pada fase ini dilakukan proses evaluasi hasil data
koordinat serta prediksi posisi yang diberikan ke mining untuk memudahkan pendataan , salah
kelas label. Dibawah ini merupakan hasil satunya adalah penggunaan Confusion Matrix.
transformation data dengan mengganti NISN Confusion matrix ialah alat untuk menganalisis
sebagai ID serta Layak PIP sebagai label. seberapa baik sebuah klasifikasi. True positive
serta true negative menyampaikan hasil ketika
klasifikasi benar, sedangkan false positive serta
false negative menyampaikan hasil ketika
klasifikasi salah.
Gambar 7. Hasil Klasifikasi Naïve Bayes
Gambar 5. Hasil Transformasi Data Dari hasil klasifikasi algoritma naive bayes
didapatkan hasil akurasi mencapai 88,89%. Lebih
4. Data Mining spesifiknya, bilangan true positive (TP) 126, true
Pada tahapan data mining ini ialah menggunakan negative (TN) 10, false positive (FP) 14, dan false
algoritma naïve bayes yang berfungsi negative (FN) 3. True Yadan true Tidak adalah
memecahkan masalah klasifikasi. aplikasi yang kelas asli atau nilai real. prediksi YA dan prediksi
digunakan pada proses ini ialah rapidminer versi tidak adalah kelas atau nilai prediktif. Class
9.8. Dengan menggunakan operator Retrieve, Precision ialah class yang mengukur tingkat
Split Data, Naive Bayes, Apply Model dan presisi antara informasi yang diminta oleh
Perpormance. Pada gambar dibawah ini ialah pengguna dengan hasil prediksi yang diberikan
proses Data mining dengan memakai algoritma oleh sistem. Class reccal ialah kelas yang
naïve bayes untuk mengklasifikasikan tingkat mengevaluasi hasil yang diberikan oleh sistem
kelayakan peserta didik calon penerima Program saat memprediksi informasi.
Indonesia Pintar.
Algoritma Naïve bayes, bisa dihitung dengan
menggunakan rumus sebagai berikut :
1. Accuracy
𝑇𝑃 + 𝑇𝑁
𝐴𝑐𝑐𝑢𝑟𝑎𝑐𝑦 = 𝑥 100%
𝑇𝑃 + 𝑇𝑁 + 𝐹𝑃 + 𝐹𝑁
126 + 10
𝐴𝑐𝑐𝑢𝑟𝑎𝑐𝑦 = 𝑥 100%
126 + 10 + 14 + 3
Gambar 6. Proses Algoritma Naïve Bayes 𝐴𝑐𝑐𝑢𝑟𝑎𝑐𝑦 = 0.8888 = 88.89%

Dari perhitungan tersebut, nilai akurasi hasil
Berdasarkan gambar di atas, Operator Split Data pengujian klasifikasi menggunakan algoritma
digunakan untuk membagi data menjadi data latih Naive Bayes adalah sebesar 88.89%.
456
2. Precision ConfusionMatrix:
𝑇𝑃 True Ya Tidak
𝑃𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛 = 𝑥 100%
𝑇𝑃 + 𝐹𝑃 Ya 126 14
Tidak 3 10
126 recall: 41.67% (positive class: Tidak)
𝑃𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛 = 𝑥 100%
126 + 14
ConfusionMatrix:
𝑝𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛 = 0.9 = 90.00% True Ya Tidak
Dari perhitungan tersebut, nilai precision hasil Ya 126 14
pengujian klasifikasi Algoritma Naive Bayes Tidak 3 10
memiliki tingkat keberhasilan 90,00%.
AUC (optimistic): 0.889 (positive class: Tidak)
3. Recal AUC: 0.807 (positive class: Tidak)
AUC (pessimistic): 0.851 (positive class: Tidak)
𝑇𝑃
𝑅𝑒𝑐𝑎𝑙𝑙 = 𝑥 100%
𝑇𝑃 + 𝐹𝑃 5. KESIMPULAN DAN SARAN
Kesimpulan berikut dapat dibentuk berdasarkan
126
𝑅𝑒𝑐𝑎𝑙𝑙 = 𝑥 100% penjelasan yang diberikan : Data mining dengan
126 + 3 metode naive bayes dapat memprediksi tingkat
kelayakan pengguna bantuan PIP berdasarkan data set
Recall = 0.9767 = 97.67% yang sudah dikumpulkan dengan menggunakan
Dari perhitungan tersebut, nilai recali hasil bantuan tolls rapidminer serta menggunakan beberapa
pengujian klasifikasi Algoritma Naive Bayes operator diantaranya Oprator Retrieve, Split Data,
memiliki tingkat keberhasilan 97.00% Naïve Bayes, Apply Model, dan Performance.
Berdasarkan hasil penelitian serta pengujian dengan
4. AUC teknik data mining memakai algoritma klasifikasi
Dari analisis data diatas menggunakan software naive bayes KDD maka nilai akurasi keseluruhan
Rapid Miner dengan pengukuran Naive Bayes, 88.89% dan Class recall YA 97.67%, Class recall
hasil AUC-0.807 masuk dalam kategori baik tidak 41.67%, Class precision YA 90.00% dan Class
(klasifikasi baik). Tingkat akurasi AUC dibagi precision tidak 76.92%.
menjadi lima bagian, yaitu :
- 0.90 – 1.00 = Excellent Classification DAFTAR PUSTAKA
- 0.80 – 0.90 = Good Classification [1] Herlinawati, E. Heriyati, Sudiyono, and A. B.
- 0.70 – 0.80 = Fair Classification Susanto, Kajian Program Indonesia Pintar
- 0.60 – 0.70 = Poor Classification (PIP): Strategi Penjangkauan Anak Tidak
- 0.50 – 0.60 = Failure Sekolah (ATS) Untuk Mengikuti Pendidikan
Melalui Program Indonesia Pintar (PIP). 2018.
[2] O. Rini and S. O. Kunang, “Implementasi Data
Mining Menggunakan Metode Naive Bayes
Untuk Penentuan Penerima Bantuan Program
Indonesia Pintar ( Pip ) ( Studi Kasus : Sd
Negeri 9 Air Kumbang ),” Bina Darma Conf.
Comput. Sci., vol. 3, no. 4, pp. 714–722, 2021,
[Online]. Available:
https://conference.binadarma.ac.id/index.php/B
DCCS/article/view/2450
[3] A. Saleh, “Implementasi Naive Bayes,” J.
Informatics, Inf. Syst. Softw. Eng. Appl., vol. 2,
no. 3, pp. 207–2017, 2015, doi:
10.24076/citec.2015v2i3.49.
Gambar 8. Hasil AUC
[4] Yudi Agusman, “Public Inspiration : Jurnal
Administrasi Publik Implementasi Program
5. Perpormance Vector
Indonesia Pintar di Sekolah Dasar Negeri 1
PerformanceVector accuracy 88.89%
Kolakaasi Kabupaten Kolaka,” vol. 4, no. 2, pp.
Confusion Matrix:
105–113, 2019, doi: 10.22225/pi.4.2.2019.105-
True Ya Tidak
113.
Ya 126 14 [5] N. E. Rohaeni and O. Saryono, “Implementasi
Tidak 3 10 Kebijakan Program Indonesia Pintar ( PIP )
Precision: 76.92% (positive class: Tidak) Melalui Kartu Indonesia Pintar ( KIP ) dalam
457
Upaya Pemerataan Pendidikan,” J. Educ. icle/view/342

Manag. Adm. Rev., vol. 2, no. 1, pp. 193–204, [8] R. Saputra and A. J. P. Sibarani, “Implementasi
2018, doi: 10.4321/ijemar.v2i1.1824. Data Mining Menggunakan Algoritma Apriori
[6] A. Syafii, G. Dwilestari, and A. Ajiz, Untuk Meningkatkan Pola Penjualan Obat,” vol.
“KOMPARASI ALGORITMA NAÏVE BAYES 7, no. 2, 2020, doi: 10.35957/jatisi.v7i2.195.
DAN ALGORITMA C4.5 DALAM [9] E. W. Ningsih and Hardiyan, “Penerapan
KLASIFIKASI PELANGGAN PRODUK Algoritma Naïve Bayes Dalam Penentuan
INDIHOME,” JURSIMA J. Sist. Inf. dan Kelayakan Penerima Kartu Jakarta Pintar Plus,”
Manaj., vol. 10, no. 2, pp. 60–70, 2022, doi: J. Tek. Komput. AMIK BSI, vol. 6, no. 1, pp. 15–
10.47024/js.v10i2.414. 20, 2020, doi: 10.31294/jtk.v6i1.6680.
[7] S. Adi, “Implementasi Algoritma Naïve Bayes [10] D. A. Nasution, H. H. Khotimah, and N.
Classifier Untuk Klasifikasi Penerima Beasiswa Chamidah, “Perbandingan Normalisasi Data
PPA Di Universitas Amikom Yogyakarta,” J. untuk Klasifikasi Wine Menggunakan
Mantik Penusa, vol. 22, no. 1, pp. 11–16, 2018, Algoritma K-NN,” Comput. Eng. Sci. Syst. J.,
[Online]. Available: https://e- vol. 4, no. 1, pp. 78–82, 2019, doi:
jurnal.pelitanusantara.ac.id/index.php/mantik/art 10.24114/cess.v4i1.11458.
458

Angga Pebdika, Ruli Herdiana, Dodi Solihudin: (Jurnal Mahasiswa Teknik Informatika)

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Angga Pebdika, Ruli Herdiana, Dodi Solihudin: (Jurnal Mahasiswa Teknik Informatika)

Diunggah oleh

Hak Cipta:

Format Tersedia

JATI (Jurnal Mahasiswa Teknik Informatika) Vol. 7 No.

KLASIFIKASI MENGGUNAKAN METODE NAIVE BAYES UNTUK

Angga Pebdika, Ruli Herdiana, Dodi Solihudin

Kata kunci : Data Mining,Naïve Bayes, Pendidikan,Program Indonesia Pintar

1. PENDAHULUAN Naive Bayes Untuk Penentuan Penerima Bantuan

Knowledge Discovery in Databases (KDD) Pendekatan Naïve Bayes digunakan untuk

Gambar 1. Tahapan KDD

dan data uji. pada subproses training

Gambar 7. Hasil Klasifikasi Naïve Bayes

Gambar 6. Proses Algoritma Naïve Bayes 𝐴𝑐𝑐𝑢𝑟𝑎𝑐𝑦 = 0.8888 = 88.89%

Upaya Pemerataan Pendidikan,” J. Educ. icle/view/342

Anda mungkin juga menyukai