SAGE Open
January-March 2023: 1–15
KLASTERISASI PENDIDIKAN MASYARAKAT UNTUK © The Author(s) 2023
DOI: 10.1177/21582440231160439
MENGETAHUI PROVINSI DENGAN PENDIDIKAN journals.sagepub.com/home/sgo
Indri Wahyuningsih
Abstrak
Pendidikan adalah kebutuhan mendasar bagi tiap manusia yang berperan penting pada masa depan bangsa, karena
bangsa yang dikatakan maju dapat dilihat dari sistem pembelajarannya yang baik. Pendidikan yang berhasil diukur
dari ratanya jumlah lulusan berbagai jenjang pendidikan pada berbagai wilayah. Namun tidak semua Negara baik
dalam kualitas pendidikannya. Salah satunya yaitu Provinsi yang ada di indonesia. Diketahui bahwa pada tahun-
tahun sebelumnya Negara ini kurang dalam peningkatan pendidikannya, sehingga menyebabkan beberapa wilayah
yang masyarakatnya tidak sekolah atau putus sekolah. Permasalahannya banyak disebabkan karena faktor ekonomi,
rasa malas, kurangnya motivasi tentang pentingnya pendidikan, dan lain sebagainya.Pandemi covid-19 sebelumnya
juga menjadi alasan peningkatan jumlah anak putus sekolah yang dikarenakan perekonomian keluarga menurun.
Banyaknya Provinsi yang ada di Indonesia diperlukan pengelompokan jumlah provinsi yang ada. Pengelompokkan
bertujuan memudahkan pemerintah dalam memberikan perhatian khusus terhadap provinsi yang pendidikannya
dinilai kurang dan tujuan lainnya untuk mengetahui provinsi mana saja yang tingkat pendidikannya rendah. Dalam
pengelompokan, sistem yang diterapkan adalah data mining menggunakan metode Clustering algoritma K-Means
yang diperoses menggunakan software rapidminer. Adapun pengelompokkan yang terbentuk pada data tingkat
pendidikan sebanyak 38 record adalah 3 klaster yang dinyatakan provinsi dengan pendidikannya terendah terdapat
pada Cluster_2 dengan jumlah 26 Provinsi yaitu NTB, Papua Selatan, Papua Barat, Papua Barat Daya, Kalimantan
Utara dll.
Tinjauan Pustaka
2.1 Data Mining
Data mining adalah suatu alat bantu sebagai proses
penggalian data pada basis data yang berukuran besar
dalam spesifikasi tingkat kerumitannya. Pengertian
data mining juga suatu proses dengan Teknik statik,
(kecerdasan buatan) / AI, mathematics, dan juga
Machine learning untuk memproses maupun
identifikasi informasi data yang digunakan untuk
pengetahuan dari big data (Putra et al., 2022) .
2.2 Clustering
Clustering merupakan proses yang digunakan untuk
mengelompokkan data ke beberapa kelompok atau
klaster sehingga data yang ada dalam satu kelompok
memiliki kemiripan maksimal dan data antar klaster
memiliki kemiripan yang minimum. Analisis
clustering juga merupakan cara untuk
mengidentifikasi kelompok objek yang saling mirip
yang akan membantu dalam menemukan pola
penyebaran atau pola hubungan terhadap sekumpulan
data yang terbilang besar (Wanto dkk., 2021)