1, Februari 2023
ABSTRAK
Dalam dunia global saat ini, pendidikan sangat penting untuk lebih meningkatkan sumber daya manusia.
Pendidikan akan membantu peserta didik mengenai pengembangkan sikap, keterampilan, serta kecerdasan
intelektualnya untuk memberikan manusia yang terampil, cerdas, dan berakhlak mulia. Namun pendidikan
seringkali tidak berjalan dengan baik, Ada beberapa faktor yang berkontribusi terhadap hal ini, Contoh yang
paling menonjol adalah faktor ekonomi yang menyebabkan banyak anak putus sekolah. Oleh karena itu
pemerintah membuat program agar masyarakat miskin dapat melanjutkan pendidikannya melalui program ini.
Dalam penyusunan ini dicoba dengan memakai prosedur Naive Bayes. Metode ini merupakan metode
mengklasifikasikan data satu atau lebih kategori yang telah diidentifikasi. Operasi Naive Bayes menggunakan
perhitungan probabilitas dan statistik yang ditemukan oleh ilmuwan Inggris Thomas Bayes, yaitu memprediksi
probabilitas masa depan berdasarkan pengalaman masa lalu. Tujuan dari penelitian ini adalah untuk
menghindari kesalahan dalam menentukan penerimaan bantuan. Perlu diterapkan data mining dengan algoritma
Naive Bayes yang bisa mengklasifikasi tingkat kelayakan siswa penerima PIP, sehingga didapat hasil
penerimaan program Indonesia Pintar yang lebih akurat. Penelitian ini memberikan informasi baru tentang hasil
dari proses analisis yang dilakukan, selain itu dengan menggunakan metode Naive Bayes, proses analisis
tersebut dapat membuat model kelayakan untuk menerima program Indonesia Pintar berdasarkan karakteristik
yang telah ditentukan sebelumnya. Hasil dari proses penelitian ini diharapkan dapat menciptakan sistem data
mining yang dapat memberikan hasil seleksi yang sangat akurat dalam memilih penerimaan PIP.
452
JATI (Jurnal Mahasiswa Teknik Informatika) Vol. 7 No. 1, Februari 2023
yang kecil untuk memilih parameter yang dibutuhkan dapat terbagi dari beberapa kelompok seperti
selama proses klasifikasian. Dengan menggunakan Deskripsi, Evaluasi, Prediksi, Klasifikasi,
beberapa atribut Dengan atribut saling berhubungan Pengelompokan dan Pemetaan berdasarkan tugas
untuk penentuan kelayakan [3]. yang akan dilakukan [6].
Data mining adalah suatu proses dimana
2. TINJAUAN PUSTAKA. sejumlah besar data digali dan dianalisis untuk
2.1. Program Indonesia Pintar mendapatkan suatu yang valid, baru dan bermanfaat,
Program Indonesia Pintar (PIP) adalah Sebuah alhasil bisa menemukan pola atau formula dalam data
program pemerintah yang diprakarsai oleh tersebut. Penambangan data secara umum dapat
Kementerian Pendidikan dan Kebudayaan yang diklasifikasikan menjadi dua kategori utama,
dibentuk dengan tujuan mengatasi permasalahan penambangan deskriptif dan penambangan prediktif.
pengajaran sekolah yang ada, dimana masih banyak Deskriptif Mining adalah proses menemukan
masalah siswa putus sekolah karena kesulitan informasi penting dari database. Sedangkan prediktif
keuangan. Siswa dari keluarga miskin membutuhkan adalah Proses penentuan polaritas data dengan
program Indonesia Pintar karena siswa dari keluarga menentapkan beberapa variabel untuk
miskin sangat rawan berhenti sekolah di usia dini. memperkirakan variabel lain di masa mendatang.
Hal seperti ini diakibatkan karena keadaan ekonomi Data Mining ialah bagian integral dari
keluarga peserta didik yang kurang mendukung, pengetahuan pada basis data atau sering disebut
sehingga kebanyakan peserta didik menetapkan untuk dengan Knowledge Discovery in Databases (KDD),
berhenti sekolah serta memilih untuk membantu yang berarti progres umum transformasi data mentah
prekonomian keluarga dengan bekerja. Atas dasar menjadi model yang berguna, yaitu informasi yang
masalah ini, pemerintah mengambil tindakan dalam dibutuhkan pengguna sebagai informasi. [7].
upaya pemecahan masalah supaya peserta didik yang Dibawah ini ialah proses terjadinya dalam sebuah
berasal dari keluarga kurang mampu bisa KDD :
menuntaskan pendidikannya serta dapat meneruskan 1. Data selection
persekolahan ke jenjang yang lebih teratas [4] Data selection berasal dari sekumpulan data
Kebijakan program Indonesia Pintar melalui oprasional yang harus dilakukan sebelum tahap
Kartu Indonesia Pintar (KIP) ditetapkan pemerintah ekstraksi data pada KDD. Hasil Pemilihan data
di bawah Kementerian Pendidikan dan Kebudayaan yang akan digunakan dalam tahap data mining
(Kemendikbud) lewat Tim Percepatan ditampilkan dalam satu halaman berdasarkan data
Penanggulangan Kemiskinan Nasional (TNP2K). operasional.
Program ini bertujuan agar memberikan pendidikan 2. Preprocessing
yang layak bagi siswa miskin, mencegah anak putus Sebelum tahap selanjutnya dilakukan, Diperlukan
sekolah dan penuhi kebutuhan dalam pembelajaran. metode pembersihan untuk data yang menjadi
Siswa ditujukan menggunakan bantuan ini untuk fokus KDD. Dalam tahapan ini mencangkup
memenuhi kebutuhan sekolah seperti: Biaya SPP, penghapusan duplikat data, pengecekan data yang
perlengkapan sekolah dan uang saku. Dengan adanya tidak konsisten serta koreksi kesalahan dalam data
Kartu Indonesia Pintar, diharapkan siswa tidak putus seperti kekeliruan dalam cetak.
sekolah lagi karena kekurangan dana. Bantuan Kartu 3. Transformation
Indonesia Pintar (KIP) ditujukan pada peserta didik Coding merupakan transformasi data yang dipilih
yang kekurangan dari tingkat SD sampai dengan agar cocok untuk langkah penambangan data.
SMA. Salah satu gejala yang muncul ialah Coding KDD adalah langkah kreatif yang sangat
pemerataan pendidikan serta akurasi keselarasan bergantung oleh jenis data atau model yang
berbasis Program Indonesia Pintar (PIP) melalui diambil dari setdata.
Kartu Indonesia Pintar (KIP) tidak tepat sasaran. Hal 4. Data mining
ini dibuktikan dengan masih adanya siswa dari Dalam langkah ini ialah digunakannya teknik atau
keluarga mampu dengan terdaftar sebagai penerima metode dengan tujuan menemukan pola atau hasil
dana Kartu Indonesia Pintar (KIP), dan terdapat yang menarik. Teknik, metode, atau algoritma
peserta didik yang tergolong kekurangan dan bukan penambangan data yang bervariasi, menentukan
pemeroleh bantuan Indonesia Pintar yang metode atau algoritma yang tepat sangat
terdaftar [5]. bergantung dalam tujuan serta keseluruhan
tahapan dalam KDD.
2.2. Data Mining 5. Interpretation/Evaluation
Data mining merupakan salah satu teknik Model data yang diperoleh dari langkah data
penggolongan data dengan tujuan mencari kolerasi mining dapat memberikan hasil yang dapat mudah
antar data yang tidak diketahui oleh pengguna dan dimengerti daripada yang berkepentingan. Tujuan
menyajikannya dalam hasil yang mudah dipahami dari bagian ini adalah untuk menentukan apakah
dan kolerasi data tercatat dapat digunakan sebagai kebijakan atau informasi yang diperoleh
dasar pengambilan keputusan. Penambangan data bertentangan dengan informasi.
453
JATI (Jurnal Mahasiswa Teknik Informatika) Vol. 7 No. 1, Februari 2023
454
JATI (Jurnal Mahasiswa Teknik Informatika) Vol. 7 No. 1, Februari 2023
mendapatkan informasi tentang data calon menjelaskan proses dimana tolos Rapidminer
penerima manfaat program Indonesia Pintar. memilih atribut mana yang akan digunakan dalam
tahapan data mining. Pada tahap ini adalah
3.2. Tahap Perancangan menyeleksi atribut mana saja yang dibutuhkan
Dalam penelitian ini menggunakan tahap menggunakan oprator select attributes yang dapat
perancangan KDD : memfilter atribut yang diperlukan. Dengan
parameter subset, opsi ini memilih beberapa
atribut yang akan digunakan. Jika metadata
diketahui, semua atribut dicantumkan dan atribut
yang diperlukan dapat dipilih dengan mudah.
Berikut dibawah ini adalah hasil seleksi atribut.
1. Data selection
Data selection berasal dari sekumpulan data
oprasional yang harus dilakukan sebelum tahap
ekstraksi data pada KDD. Hasil Pemilihan data
yang akan digunakan dalam tahap data mining
ditampilkan dalam satu halaman berdasarkan data Gambar 2. Hasil Seleksi Atribut
operasional.
2. Preprocessing 2. Preprocessing
Sebelum tahap selanjutnya dilakukan, Diperlukan Dalam tahap ini mencakup hapus duplikat data,
metode pembersihan untuk data yang menjadi periksa data yang tidak konsisten dan perbaiki
fokus KDD. Dalam tahapan ini mencangkup kesalahan dalam data. Pada langkah ini penulis
penghapusan duplikat data, pengecekan data yang menggunakan filter sampel rapidminer untuk
tidak konsisten serta koreksi kesalahan dalam data menghilangkan missing value, data missing value
seperti kekeliruan dalam cetak. tersebut mengandung dua atribut yaitu pekerjaan
3. Transformation dan pendapatan. Berikut adalah proses
Coding merupakan transformasi data yang dipilih penghapusan pada rapidminer menggunakan
agar cocok untuk langkah penambangan data. oprator filter examples.
Coding KDD adalah langkah kreatif yang sangat
bergantung oleh jenis data atau model yang
diambil dari setdata.
4. Data mining
Dalam langkah ini ialah digunakannya teknik atau
metode dengan tujuan menemukan pola atau hasil
yang menarik. Teknik, metode, atau algoritma
penambangan data yang bervariasi, menentukan
metode atau algoritma yang tepat sangat
bergantung dalam tujuan serta keseluruhan
tahapan dalam KDD. Gambar 3. Penggunaan Oprator Filter Example
5. Interpretation/Evaluation
Model data yang diperoleh dari langkah data 3. Tranforsformasi
mining dapat memberikan hasil yang dapat mudah Pada tahapan ini, mengubah data menjadi model
dimengerti daripada yang berkepentingan. Tujuan analisis data dan memodelkan data agar sesuai
dari bagian ini adalah untuk menentukan apakah dengan analisis data mining yang
kebijakan atau informasi yang diperoleh diharapkan, tujuan transformasi adalah mengubah
bertentangan dengan informasi data yang dipilih ke dalam bentuk prosedur
penambangan. Mengubah kode NISN menjadi ID
4. HASIL DAN PEMBAHASAN dan kode PIP menjadi Label. Atribut dalam peran
1. Data Selection label berperan sebagai label dan atribut berlabel
Data selection mencakup semua atribut dari sebagai operator pembelajaran, label sering
kumpulan data asli, dipilih untuk mendapatkan disebut sebagai variabel atau kelas. Berikut data
atribut yang diperlukan untuk proses yang diolah untuk data mining.
penambangan data selanjutnya . Berikut ini
455
JATI (Jurnal Mahasiswa Teknik Informatika) Vol. 7 No. 1, Februari 2023
Gambar 5. Hasil Transformasi Data Dari hasil klasifikasi algoritma naive bayes
didapatkan hasil akurasi mencapai 88,89%. Lebih
4. Data Mining spesifiknya, bilangan true positive (TP) 126, true
Pada tahapan data mining ini ialah menggunakan negative (TN) 10, false positive (FP) 14, dan false
algoritma naïve bayes yang berfungsi negative (FN) 3. True Yadan true Tidak adalah
memecahkan masalah klasifikasi. aplikasi yang kelas asli atau nilai real. prediksi YA dan prediksi
digunakan pada proses ini ialah rapidminer versi tidak adalah kelas atau nilai prediktif. Class
9.8. Dengan menggunakan operator Retrieve, Precision ialah class yang mengukur tingkat
Split Data, Naive Bayes, Apply Model dan presisi antara informasi yang diminta oleh
Perpormance. Pada gambar dibawah ini ialah pengguna dengan hasil prediksi yang diberikan
proses Data mining dengan memakai algoritma oleh sistem. Class reccal ialah kelas yang
naïve bayes untuk mengklasifikasikan tingkat mengevaluasi hasil yang diberikan oleh sistem
kelayakan peserta didik calon penerima Program saat memprediksi informasi.
Indonesia Pintar.
Algoritma Naïve bayes, bisa dihitung dengan
menggunakan rumus sebagai berikut :
1. Accuracy
𝑇𝑃 + 𝑇𝑁
𝐴𝑐𝑐𝑢𝑟𝑎𝑐𝑦 = 𝑥 100%
𝑇𝑃 + 𝑇𝑁 + 𝐹𝑃 + 𝐹𝑁
126 + 10
𝐴𝑐𝑐𝑢𝑟𝑎𝑐𝑦 = 𝑥 100%
126 + 10 + 14 + 3
456
JATI (Jurnal Mahasiswa Teknik Informatika) Vol. 7 No. 1, Februari 2023
2. Precision ConfusionMatrix:
𝑇𝑃 True Ya Tidak
𝑃𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛 = 𝑥 100%
𝑇𝑃 + 𝐹𝑃 Ya 126 14
Tidak 3 10
126 recall: 41.67% (positive class: Tidak)
𝑃𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛 = 𝑥 100%
126 + 14
ConfusionMatrix:
𝑝𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛 = 0.9 = 90.00% True Ya Tidak
Dari perhitungan tersebut, nilai precision hasil Ya 126 14
pengujian klasifikasi Algoritma Naive Bayes Tidak 3 10
memiliki tingkat keberhasilan 90,00%.
AUC (optimistic): 0.889 (positive class: Tidak)
3. Recal AUC: 0.807 (positive class: Tidak)
AUC (pessimistic): 0.851 (positive class: Tidak)
𝑇𝑃
𝑅𝑒𝑐𝑎𝑙𝑙 = 𝑥 100%
𝑇𝑃 + 𝐹𝑃 5. KESIMPULAN DAN SARAN
Kesimpulan berikut dapat dibentuk berdasarkan
126
𝑅𝑒𝑐𝑎𝑙𝑙 = 𝑥 100% penjelasan yang diberikan : Data mining dengan
126 + 3 metode naive bayes dapat memprediksi tingkat
kelayakan pengguna bantuan PIP berdasarkan data set
Recall = 0.9767 = 97.67% yang sudah dikumpulkan dengan menggunakan
Dari perhitungan tersebut, nilai recali hasil bantuan tolls rapidminer serta menggunakan beberapa
pengujian klasifikasi Algoritma Naive Bayes operator diantaranya Oprator Retrieve, Split Data,
memiliki tingkat keberhasilan 97.00% Naïve Bayes, Apply Model, dan Performance.
Berdasarkan hasil penelitian serta pengujian dengan
4. AUC teknik data mining memakai algoritma klasifikasi
Dari analisis data diatas menggunakan software naive bayes KDD maka nilai akurasi keseluruhan
Rapid Miner dengan pengukuran Naive Bayes, 88.89% dan Class recall YA 97.67%, Class recall
hasil AUC-0.807 masuk dalam kategori baik tidak 41.67%, Class precision YA 90.00% dan Class
(klasifikasi baik). Tingkat akurasi AUC dibagi precision tidak 76.92%.
menjadi lima bagian, yaitu :
- 0.90 – 1.00 = Excellent Classification DAFTAR PUSTAKA
- 0.80 – 0.90 = Good Classification [1] Herlinawati, E. Heriyati, Sudiyono, and A. B.
- 0.70 – 0.80 = Fair Classification Susanto, Kajian Program Indonesia Pintar
- 0.60 – 0.70 = Poor Classification (PIP): Strategi Penjangkauan Anak Tidak
- 0.50 – 0.60 = Failure Sekolah (ATS) Untuk Mengikuti Pendidikan
Melalui Program Indonesia Pintar (PIP). 2018.
[2] O. Rini and S. O. Kunang, “Implementasi Data
Mining Menggunakan Metode Naive Bayes
Untuk Penentuan Penerima Bantuan Program
Indonesia Pintar ( Pip ) ( Studi Kasus : Sd
Negeri 9 Air Kumbang ),” Bina Darma Conf.
Comput. Sci., vol. 3, no. 4, pp. 714–722, 2021,
[Online]. Available:
https://conference.binadarma.ac.id/index.php/B
DCCS/article/view/2450
[3] A. Saleh, “Implementasi Naive Bayes,” J.
Informatics, Inf. Syst. Softw. Eng. Appl., vol. 2,
no. 3, pp. 207–2017, 2015, doi:
10.24076/citec.2015v2i3.49.
Gambar 8. Hasil AUC
[4] Yudi Agusman, “Public Inspiration : Jurnal
Administrasi Publik Implementasi Program
5. Perpormance Vector
Indonesia Pintar di Sekolah Dasar Negeri 1
PerformanceVector accuracy 88.89%
Kolakaasi Kabupaten Kolaka,” vol. 4, no. 2, pp.
Confusion Matrix:
105–113, 2019, doi: 10.22225/pi.4.2.2019.105-
True Ya Tidak
113.
Ya 126 14 [5] N. E. Rohaeni and O. Saryono, “Implementasi
Tidak 3 10 Kebijakan Program Indonesia Pintar ( PIP )
Precision: 76.92% (positive class: Tidak) Melalui Kartu Indonesia Pintar ( KIP ) dalam
457
JATI (Jurnal Mahasiswa Teknik Informatika) Vol. 7 No. 1, Februari 2023
458