Anda di halaman 1dari 11

JURNAL MEDIA INFORMATIKA BUDIDARMA

Volume 5, Nomor 4, Oktober 2021, Page 1548-1558


ISSN 2614-5278 (media cetak), ISSN 2548-8368 (media online)
Available Online at https://ejurnal.stmik-budidarma.ac.id/index.php/mib
DOI 10.30865/mib.v5i4.3279

Kluster Rata-Rata Lama Sekolah (RLS) Menurut Jenis Kelamin di


Provinsi Jawa Tengah dengan K-Means
Ajeng Tiara Wulandari*, Jati Sumarah
Program Studi Teknik Elektronika, Politeknik Dharma Patria, Kebumen, Jawa Tengah, Indonesia
Email: 1ajengtiarawulandari@gmail.com, 2jatisumarah@gmail.com,
Email Penulis Korespondensi: ajengtiarawulandari@gmail.com
Abstrak−Rata-rata lama (RLS) sekolah menggambarkan tingkat pencapaian setiap penduduk pada suatu daerah dalam
kegiatan bersekolah. Semakin tinggi angka lamanya bersekolah, maka semakin tinggi pula jenjang pendidikan yang telah
dicapai penduduk, sehingga indikator ini sangat penting karena dapat menunjukkan kualitas sumber daya manusia di suatu
daerah. Apalagi telah banyak penelitian-penelitian yang mengemukakan bahwa Rata-rata Lama Sekolah memiliki pengaruh
yang signifikan terhadap pertumbuhan Ekonomi. Hal ini berarti, jika Rata-rata Lama Sekolah mengalami peningkatan, maka
Jumlah penggangguran dan Penduduk Miskin pada suatu daerah akan menurun dan pastinya akan memberikan pengaruh
yang positif dan signifikan terhadap pertumbuhan ekonomi. Tujuan dari penelitian untuk untuk melakukan analisis berupa
pemetaan berupa klaster terhadap Rata-Rata Lama Sekolah di Kabupaten dan Kota di Jawa Tengah menggunakan artificial
intelligence (AI). Hal ini perlu dilakukan dalam rangka memperoleh gambaran secara makro tingkat perkembangan Rata-
Rata Lama Sekolah selama beberapa tahun terakhir melalui pemetaan wilayah. Dataset yang digunakan berasal dari website
Badan Pusat Statistik (BPS) Provinsi Jawa Tengah dengan subjek Rata-rata Lama Sekolah (RLS) berdasarkan jenis kelamin
dari tahun 2017-2019. Metode solusi yang digunakan adalah metode k-means yang merupakan bagian dari data mining
klastering. Jumlas klaster yang digunakan pada penelitian yakni klaster tinggi dan rendah. Proses analisis dibantu
mengunakan software RapidMiner. Sebelum proses k-means dilakukan, preprocessing dilakukan dengan mengambil nilai
rata-rata dari jumlah RLS berdasarkan jenis kelamin dari tahun 2017-2019. Hasil nilai rata-rata yang diperoleh akan diproses
menggunakan k-means. Hasil penelitian menyebutkan bahwa dari 35 provinsi diperoleh 8 provinsi (23 persen) berada di
klaster tinggi (cluster_1) dan 27 provinsi (77 persen) di klaster rendah (cluster_0). Hasil yang diperoleh menyebutkan diatas
70% wilayah di jawa Tengah masih memiliki RLS rendah.
Kata Kunci: Pengelompokkan; Kluster; Lama Sekolah; Jenis Kelamin; Jawa Tengah; K-Means.
Abstract−The average length of school (RLS) describes the level of achievement in school activities of each citizen in a
given area. The higher the number of years of schooling, the higher the population's level of education, hence this indicator is
critical since it can reveal the quality of a region's human resources. Furthermore, numerous studies have found that the
average length of schooling has a major impact on economic growth. This indicates that when the average length of
schooling rises, the number of unemployed and poor people in a given area declines, resulting in a positive and considerable
impact on economic growth. The goal of the study was to use artificial intelligence to undertake an analysis in the form of a
cluster mapping of the Average Length of Schooling in Regencies and Cities in Central Java (AI). This is necessary in order
to gain a macro picture of the average years of schooling's progress over the last few years through regional mapping. The
data was taken from the Central Java Statistics Agency (BPS) website, and it was based on the subject Average Length of
School (RLS) by gender from 2017 to 2019. The k-means method, which is part of clustering data mining, was employed as
the solution method. There were two types of clusters used in this study: high and low clusters. RapidMiner software is used
to aid the analyzing process. Preprocessing is done before the k-means approach by taking the average value of the number of
RLS based on gender from 2017 to 2019. K-means will be used to process the results of the average value obtained.
According to the findings, eight provinces (23 percent) were in the high cluster (cluster 1) while 27 provinces (77 percent)
were in the low cluster (cluster 0). According to the findings, RLS levels are still low in over 70% of Central Java's locations.
Keywords: Grouping; Cluster; Length of School; Gender; Central Java; K-Means.

1. PENDAHULUAN
Rata-Rata Lama Sekolah (RLS) merupakan rata-rata jumlah tahun yang telah diselesaikan oleh penduduk pada
seluruh jenjang pendidikan formal yang pernah dijalani [1]. Angka ini juga bisa menggambarkan kualitas
pendidikan penduduk dalam sebuah wilayah. Angka ini dihitung dengan menggunakan tiga variabel simultan
yaitu variabel partisipasi sekolah, tingkat/kelas yang sedang/pernah dijalani, dan ijazah terakhir yang dimiliki.
Penduduk yang dihitung dalam rata-rata lama sekolah ini adalah penduduk usia 15 tahun ke atas [2]. Semakin
tinggi angka lamanya bersekolah, maka semakin tinggi pula jenjang pendidikan yang telah dicapai penduduk,
sehingga indikator ini sangat penting karena dapat menunjukkan kualitas sumber daya manusia di suatu daerah.
Apalagi telah banyak penelitian-penelitian yang mengemukakan bahwa Rata-rata Lama Sekolah memiliki
pengaruh yang signifikan terhadap pertumbuhan Ekonomi [3]. Hal ini berarti, jika Rata-rata Lama Sekolah
mengalami peningkatan, maka Jumlah penggangguran dan Penduduk Miskin pada suatu daerah akan menurun
dan pastinya akan memberikan pengaruh yang positif dan signifikan terhadap pertumbuhan ekonomi [4]. Pada
usulan proposal penelitian ini Rata-rata Lama Sekolah yang akan dibahas terkhusus di daerah Kabupaten dan
Kota yang ada di provinsi Jawa Tengah berdasarkan jenis kelamin. Sebagaimana diketahui Jawa Tengah
merupakan provinsi terpadat ke tiga setelah Jawa Barat dan Jawa Timur. Apalagi berdasarkan data Badan Pusat
Statistik Indonesia pada Semester 1 (Maret) 2020, Jawa Tengah merupakan provinsi ke enam yang memiliki
persentase penduduk miskin perkotaan tertinggi dengan 10,09% setelah Nusa Tenggara Barat (14,90%),

Ajeng Tiara Wulandari, Copyright ©2021, MIB, Page 1548


Submitted: 01/09/2021; Accepted: 20/10/2021; Published: 26/10/2021
JURNAL MEDIA INFORMATIKA BUDIDARMA
Volume 5, Nomor 4, Oktober 2021, Page 1548-1558
ISSN 2614-5278 (media cetak), ISSN 2548-8368 (media online)
Available Online at https://ejurnal.stmik-budidarma.ac.id/index.php/mib
DOI 10.30865/mib.v5i4.3279

Bengkulu (14,77%), Sumatera Selatan (12,16%), DI Yogyakarta (11,53) dan Jambi (10,41%) [5]. Sedangkan
untuk Rata-rata Lama Sekolah di Indonesia masih berdasarkan data Badan Pusat Statistik Indonesia, di tahun
2019 Jawa Tengah berada di urutan ke lima terendah (7,53) setelah provinsi Papua (6,65), Nusa Tenggara Barat
(7,27), Kalimantan Barat (7,31) dan Papua Barat (7,44) [6]. Padahal Jawa Tengah merupakan provinsi terpadat
ke tiga dan berada di pulau Jawa yang seharusnya mampu menjadi contoh bagi provinsi-provinsi lain di
Indonesia, tapi sangat miris karena kenyataannya tingkat Rata-rata Lama Sekolah di provinsi ini sangat rendah.
Oleh karena itu, melakukan pengelompokkan nilai Rata-rata Lama Sekolah sangat penting dilakukan,
sebagai informasi dan barometer pemerintah khusus nya bagi pemerintah daerah pada masing-masing kabupaten
dan kota di Provinsi Jawa Tengah dalam menentukan kebijakan terkait di bidang pendidikan. Tujuan khusus dari
penelitian ini adalah untuk memberikan masukan dan informasi bagi pemerintah Provinsi Jawa Tengah agar
lebih memaksimalkan usaha dan kepedulian untuk meningkatkan daerah-daerah yang memiliki Rata-rata Lama
Sekolah yang rendah dan menjaga nilai Rata-rata Lama Sekolah agar tetap stabil bagi daerah-daerah yang nilai
Rata-rata Lama Sekolah nya sudah tinggi. Dataset penelitian berupa data Rata-rata Lama Sekolah menurut Jenis
Kelamin di Provinsi Jawa Tengah tahun 2017 hingga tahun 2019 yang terdiri dari 29 Kabupaten dan 6 Kota yang
diperoleh dari Badan Pusat Statistik Jawa Tengah. Metode pengelompokkan yang digunakan pada penelitian ini
adalah Algoritma data mining K-Means Clustering.
Tabel 1. Rata-rata Lama Sekolah (RLS) Menurut Jenis Kelamin (Tahun)
No Wilayah Jateng Rata-rata Lama Sekolah (RLS) menurut Jenis Kelamin (Tahun)
Laki-laki Perempuan
2019 2018 2017 2019 2018 2017
1 Kabupaten Cilacap 7.42 7.41 7.4 6.47 6.45 6.44
2 Kabupaten Banyumas 7.95 7.94 7.93 7.14 7.12 7.11
3 Kabupaten Purbalingga 7.47 7.43 7.28 6.76 6.59 6.48
4 Kabupaten Banjarnegara 6.66 6.58 6.57 6.32 6.09 6.08
5 Kabupaten Kebumen 7.97 7.94 7.9 7.09 6.87 6.82
6 Kabupaten Purworejo 8.64 8.43 8.42 7.49 7.34 7.33
7 Kabupaten Wonosobo 7.01 7 6.76 6.51 6.5 6.27
8 Kabupaten Magelang 8.3 8 7.87 7.28 7.17 6.95
9 Kabupaten Boyolali 8.46 8.45 8.44 6.94 6.85 6.72
10 Kabupaten Klaten 8.94 8.93 8.92 7.77 7.65 7.62
11 Kabupaten Sukoharjo 9.72 9.48 9.47 8.67 8.41 8.25
12 Kabupaten Wonogiri 7.61 7.52 7.39 6.71 6.49 6.13
13 Kabupaten Karanganyar 9.32 9.31 9.3 7.93 7.91 7.74
14 Kabupaten Sragen 8.12 7.89 7.84 6.61 6.6 6.3
15 Kabupaten Grobogan 7.35 7.19 7.18 6.34 6.14 6.13
16 Kabupaten Blora 7.14 6.99 6.98 6.06 5.96 5.95
17 Kabupaten Rembang 7.71 7.53 7.52 6.61 6.41 6.4
18 Kabupaten Pati 7.78 7.77 7.51 6.69 6.64 6.57
19 Kabupaten Kudus 9.2 9.19 8.93 8.1 8.09 7.7
20 Kabupaten Jepara 7.89 7.81 7.73 6.81 6.8 6.67
21 Kabupaten Demak 8.27 8.26 8.25 6.91 6.82 6.81
22 Kabupaten Semarang 8.44 8.36 8.35 7.62 7.44 7.43
23 Kabupaten Temanggung 7.52 7.2 7.12 6.8 6.72 6.71
24 Kabupaten Kendal 7.91 7.64 7.42 6.63 6.47 6.3
25 Kabupaten Batang 7.33 7.32 7.31 6.17 6.16 6.05
26 Kabupaten Pekalongan 7.21 7.07 7.06 6.56 6.31 6.15
27 Kabupaten Pemalang 6.94 6.9 6.89 5.92 5.75 5.65
28 Kabupaten Tegal 7.44 7.3 7.15 6.31 6.09 5.97
29 Kabupaten Brebes 6.76 6.75 6.74 5.38 5.37 5.36
30 Kota Magelang 11.05 10.93 10.92 9.96 9.95 9.94
31 Kota Surakarta 11.1 11.09 10.96 10.09 10.01 9.84
32 Kota Salatiga 10.99 10.91 10.68 9.94 9.93 9.57
33 Kota Semarang 11.41 11.29 11.28 10.15 10.14 10.13
34 Kota Pekalongan 8.95 8.94 8.93 8.5 8.22 8.21
35 Kota Tegal 8.7 8.69 8.68 7.82 7.71 7.45
Sumber: Badan Pusat Statistik Provinsi Jawa Tengah [7]
Banyak penelitian-penelitian terdahulu terkait yang membahas tentang pengelompokkan menggunakan
algoritma K-Means, diantaranya: Penelitian untuk pengelompokkan daerah rawan bencana berdasarkan provinsi
yang ada di indonesia. Hasil dari penelitian ini berupa pengelompokkan data daerah rawan bencana yang dibagi
menjadi 3 cluster, yakni cluster tinggi terdiri dari 4 provinsi, cluster normal terdiri dari 14 Provinsi dan cluster
rendah terdiri 16 Provinsi [8]. Berikutnya penelitian yang dilakukan untuk pengelompokkan kepadatan
penduduk, indeks pembangunan manusia, angka pengangguran terbuka dan Rata-rata Lama Sekolah berdasarkan
provinsi di indonesia. Hasil dari penelitian ini berupa cluster 1 yang terdiri dari 12 provinsi, cluster 2 terdiri dari

Ajeng Tiara Wulandari, Copyright ©2021, MIB, Page 1549


Submitted: 01/09/2021; Accepted: 20/10/2021; Published: 26/10/2021
JURNAL MEDIA INFORMATIKA BUDIDARMA
Volume 5, Nomor 4, Oktober 2021, Page 1548-1558
ISSN 2614-5278 (media cetak), ISSN 2548-8368 (media online)
Available Online at https://ejurnal.stmik-budidarma.ac.id/index.php/mib
DOI 10.30865/mib.v5i4.3279

6 provinsi dan cluster 3 terdiri dari 1 provinsi, cluster 4 terdiri dari 6 provinsi dan cluster 5 terdiri dari 9 provinsi
[9]. Selanjutnya penelitian tentang klastering laju pertumbuhan PDRB menurut lapangan usaha di Kota Surabaya
dengan Algoritma K-Means. Hasil dari penelitian ini terdapat 9 kategori/sektor dengan cluster tinggi, 5
kategori/sektor dengan cluster sedang dan 3 kategori/sektor dengan cluster rendah [10]. Berikutnya penelitian
yang dilakukan untuk mengkluster distribusi kasus rabies di kota Palembang menggunakan data mining K-
Means. Pengolahan data pada penelitian ini menggunakan software RapidMiner dengan hasil bahwa dari 16
kecamatan di Palembang, tujuh kecamatan termasuk klaster wilayah sangat rawan rabies (C0), sedangkan empat
kecamatan termasuk di cluster daerah rawan rabies (C1), dan lima kecamatan yang termasuk dalam cluster
regional tidak rawan rabies (C2) [11]. Selanjutnya penelitian dengan menggunakan algoritma K-Means untuk
mengelompokkan tingkat keterlibatan siswa program sarjana sains universitas Amerika Utara dalam lingkungan
e-learning [12]. Penelitian-penelitian terkait ini lah yang melatarbelakangi dilakukannya penelitian untuk
mengelompokkan Rata-rata Lama Sekolah di Kabupaten dan kota yang ada di Provinsi Jawa Tengah.

2. METODOLOGI PENELITIAN
2.1 Penelitian Terdahulu
Penelitian mengenai metode klustering K-Means telah beberapa kali dilakukan sebelumnya. Berikut adalah
daftar penelitian yang menjadi acuan terutama klustering K-Means dalam menyelesaikan masalah, seperti yang
disajikan pada tabel 2 berikut:
Tabel 2. Penelitian yang dijadikan rujukan
No. Peneliti Metode Deskripsi
Penelitian untuk pengelompokkan daerah rawan bencana berdasarkan
provinsi yang ada di indonesia. Hasil dari penelitian ini berupa
(Supriyadi et
1 K-Means pengelompokkan data daerah rawan bencana yang dibagi menjadi 3 kluster,
al., 2018)
yakni Kluster tinggi terdiri dari 4 provinsi, Kluster normal terdiri dari 14
Provinsi dan Kluster rendah terdiri 16 Provinsi.
Penelitian untuk pengelompokkan kepadatan penduduk, indeks
pembangunan manusia, angka pengangguran terbuka dan angka partisipasi
(Ahmar et sekolah berdasarkan provinsi di indonesia. Hasil dari penelitian ini berupa
2 K-Means
al., 2018) Kluster 1 yang terdiri dari 12 provinsi, Kluster 2 terdiri dari 6 provinsi dan
Kluster 3 terdiri dari 1 provinsi, Kluster 4 terdiri dari 6 provinsi dan Kluster
5 terdiri dari 9 provinsi
Penelitian tentang klustering laju pertumbuhan PDRB menurut lapangan
(Febriyati et usaha di Kota Surabaya dengan Algoritma K-Means. Hasil dari penelitian
3 K-Means
al., 2020) ini terdapat 9 kategori/sektor dengan Kluster tinggi, 5 kategori/sektor
dengan Kluster sedang dan 3 kategori/sektor dengan Kluster rendah.
Penelitian yang dilakukan untuk mengkluster distribusi kasus rabies di kota
Palembang menggunakan data mining K-Means. Pengolahan data pada
penelitian ini menggunakan software RapidMiner dengan hasil bahwa dari
(Rahayu et
4 K-Means 16 kecamatan di Palembang, tujuh kecamatan termasuk klaster wilayah
al., 2020)
sangat rawan rabies (C0), sedangkan empat kecamatan termasuk pada
cluster daerah rawan rabies (C1), dan lima kecamatan yang termasuk dalam
cluster regional tidak rawan rabies (C2).
Penelitian untuk mengelompokkan tingkat keterlibatan siswa program
sarjana sains universitas Amerika Utara dalam Lingkungan e-learning
menggunakan Algoritma K-Means. Makalah ini mengusulkan penggunaan
algoritma K-Means untuk mengelompokkan siswa berdasarkan 12 metrik
(Moubayed keterlibatan yang dibagi menjadi dua kategori: terkait interaksi dan terkait
5 K-Means
et al. 2020) upaya. Analisis kuantitatif dilakukan untuk mengidentifikasi siswa yang
tidak terlibat yang mungkin membutuhkan bantuan. Hasil eksperimen
menunjukkan bahwa di antara metrik terkait interaksi dan upaya yang
dipertimbangkan, jumlah login dan durasi rata-rata untuk menyerahkan
tugas adalah yang paling mewakili tingkat keterlibatan siswa.
2.2 Data Mining
Data Mining didefinisikan sebagai proses untuk mendapatkan informasi yang berguna dari gudang basis data
yang besar, yang dapat juga diartikan sebagai pengekstrakan informasi baru yang diambil dari bongkahan data
besar yang membantu dalam pengambilan keputusan (Knowledge Discovery) [13]. Data mining merupakan
proses yang menggunakan berbagai teknik dan alat analisis data untuk menemukan hubungan dan pola yang

Ajeng Tiara Wulandari, Copyright ©2021, MIB, Page 1550


Submitted: 01/09/2021; Accepted: 20/10/2021; Published: 26/10/2021
JURNAL MEDIA INFORMATIKA BUDIDARMA
Volume 5, Nomor 4, Oktober 2021, Page 1548-1558
ISSN 2614-5278 (media cetak), ISSN 2548-8368 (media online)
Available Online at https://ejurnal.stmik-budidarma.ac.id/index.php/mib
DOI 10.30865/mib.v5i4.3279

tersembunyi. Pendekatan dasar dalam data mining adalah untuk meringkas data dan untuk mengekstrak
informasi berguna yang masuk akal dan sebelumnya tidak diketahui [14]. Data Mining dapat menemukan tren
dan pola tersembunyi yang tidak muncul dalam analisis kueri sederhana sehingga dapat memiliki bagian penting
dalam hal menemukan pengetahuan dan membuat keputusan. Tugas-tugas semacam itu dapat bersifat prediksi
seperti klasifikasi dan regresi atau deskriptif seperti Clustering dan asosiasi [15]. Karena itu Data Mining
sebenarnya memiliki akar yang panjang dari bidang ilmu seperti kecerdasan buatan (artificial intelligent),
machine learning, statistik dan basis Data [16]. Data mining perlu dipelajari dan dipahami, karena manusia
menghasilkan banyak sekali data yang sangat besar baik dalam bidang bisnis, kedokteran, cuaca, olahraga,
politik dan sebagainya [17]. Sebagai suatu rangkaian proses, data mining dapat dibagi menjadi beberapa tahap
yang dapat dilihat pada gambar 1. Tahap-tahap tersebut bersifat interaktif di mana pemakai terlibat langsung atau
dengan perantaraan knowledge base.

Gambar 1. Tahapan Data Mining [18]


Ada beberapa tugas yang dapat dilakukan oleh Data Mining dalam proses pemecahan masalah dan
pencarian pengetahuan baru [19]–[21], diantaranya :Klastering (Clustering), Klasifikasi (Classification),
Asosiasi (Association), Estimasi (Estimation) dan Prediksi (Predictions).
2.2 Metode K-Means
Algoritma K-Means ditemukan oleh beberapa orang yaitu Lloyd (1957), Forgey (1965), Friedman dan Rubin
(1967), dan McQueen (1967). Ide dari pengelompokkan (Clustering) pertama kali ditemukan oleh Lloyd pada
tahun 1957, namun hal tersebut baru dipublikasi pada tahun 1982. Pada tahun 1965 Forgey juga
mempublikasikan teknik yang sama sehingga terkadang dikenal sebagai Lloyd-Forgy [22]. K-Means merupakan
salah satu algoritma Clustering yang masuk dalam kelompok Unsupervised learning yang digunakan untuk
membagi data menjadi beberapa kelompok dengan sistem partisi. Algoritma ini menerima masukan berupa data
tanpa label kelas. Hali ini berbeda dengan K-Nearest Neighbor (KNN) dan algoritma supervised learning lainnya
yang menerima masukan berupa vektor.
Pada dasarnya algoritma K-Means hanya mengambil sebagian dari banyaknya komponen yang
didapatkan untuk kemudian dijadikan pusat cluster awal, pada penentuan pusat cluster ini dipilih secara acak
dari populasi data. Kemudian algoritma K-Means akan menguji masing-masing dari setiap komponen dalam
populasi data tersebut dan menandai komponen tersebut ke dalam salah satu pusat cluster yang telah
didefinisikan sebelumnya tergantung dari jarak minimum antar komponen dengan tiap-tiap pusat cluster.
Selanjutnya posisi pusat cluster akan dihitung kembali hingga semua komponen data digolongkan ke dalam tiap-
tiap cluster dan terakhir akan terbentuk cluster baru [23].

Gambar 2. K-Means Clustering


2.3 Flowchart K-Means
Berikut ini disajikan Diagram alir dari metode Clustering K-Means.

Ajeng Tiara Wulandari, Copyright ©2021, MIB, Page 1551


Submitted: 01/09/2021; Accepted: 20/10/2021; Published: 26/10/2021
JURNAL MEDIA INFORMATIKA BUDIDARMA
Volume 5, Nomor 4, Oktober 2021, Page 1548-1558
ISSN 2614-5278 (media cetak), ISSN 2548-8368 (media online)
Available Online at https://ejurnal.stmik-budidarma.ac.id/index.php/mib
DOI 10.30865/mib.v5i4.3279

Start

Tentukan Nilai k

Centroid
(Tentukan titik tengah cluster)

Hitung jarak objek ke Centroid


(Euclidean distance)

Clustering
(Kelompokkan objek ke cluster
berdasarkan jarak terdekat)

Ya
Objek masih ada

Tidak

End

Gambar 3. Diagram alir metode K-Means


Langkah-langkah metode K-Means dapat dijelaskan sebagai berikut :
1) Tentukan jumlah cluster (k) pada data set.
2) Tentukan nilai pusat (Centroid).
Penentuan nilai Centroid pada tahap awal dilakukan secara random.
3) Pada masing-masing record, hitung jarak terdekat dengan Centroid.
Ada beberapa cara yang dapat digunakan untuk mengukur jarak data ke pusat kelompok, diantaranya
Euclidean, Manhattan/City Block, dan Minkowsky. Setiap cara memiliki kelebihan dan kekurangan masing-
masing. Pada penelitian ini, jarak Centroid yang digunakan adalah Euclidean Distance.
4) Kelompokkan objek berdasarkan jarak ke Centroid terdekat.
5) Ulangi langkah ke-3 hingga langkah ke-4, lakukan iterasi hingga Centroid bernilai optimal.
Adapun tahapan yang dilakukan untuk menyelesaikan masalah penelitian disusun dalam kerangka kerja
berikut:
Mulai

Journal, Proceedings
Pengumpulan Data Studi Pustaka and Books of Artificial
Neural Networks

Identifikasi Masalah
Penentuan Kluster

Praproses Pengujian Hasil Pengolahan


Data

Hasil Klustering

Evaluasi Akhir

Selesai

Gambar 4. Tahapan Penelitian


Keterangan:
a) Pengumpulan Data
Dataset penelitian berupa data Rata-rata Lama Sekolah (RLS) Menurut Jenis Kelamin di Provinsi Jawa
Tengah tahun 2017 hingga tahun 2019 yang terdiri dari 29 Kabupaten dan 6 Kota yang diperoleh dari Badan
Pusat Statistik Jawa Tengah.
b) Studi Pustaka
Dilakukan untuk melengkapi pengetahuan dasar dan teori-teori yang digunakan dalam penelitian (artikel
ilmiah, buku, prosiding dll).
c) Identifikasi Masalah

Ajeng Tiara Wulandari, Copyright ©2021, MIB, Page 1552


Submitted: 01/09/2021; Accepted: 20/10/2021; Published: 26/10/2021
JURNAL MEDIA INFORMATIKA BUDIDARMA
Volume 5, Nomor 4, Oktober 2021, Page 1548-1558
ISSN 2614-5278 (media cetak), ISSN 2548-8368 (media online)
Available Online at https://ejurnal.stmik-budidarma.ac.id/index.php/mib
DOI 10.30865/mib.v5i4.3279

Dilakukan setelah semua data-data terpenuhi kemudian didapatkan dataset yang sesuai untuk dilakukan
proses yang ditentukan.
d) Praproses
Tahapan yang dikerjakan dengan melakukan perubahan terhadap beberapa tipe data pada atribut dataset
dengan tujuan untuk mempermudah pemahaman terhadap isi record, juga melakukan seleksi dengan
memperhatikan konsistensi data, missing value dan redundant pada data.
e) Penentuan Kluster
Hasil dari tahap ini adalah menentukan jumlah klustering yang ditetapkan dengan menggunakan datamining
K-Means.
f) Penguji Hasil Pengolahan Data
Seteleh proses penentuan kluster selesai, maka dilakukan tahapan uji coba terhadap hasil pengolahan data
dengan menggunakan Software RapidMiner.
g) Hasil Klustering
Hasil pengelompokan yang diperoleh berdasarkan jumlah kluster yang telah ditetapkan.
h) Evaluasi Akhir
Dilakukan untuk mengetahui apakah testing hasil pengolahan data sesuai.

3. HASIL DAN PEMBAHASAN


3.1 Pengumpulan Data
Pada penelitian ini Dataset yang digunakan adalah persentase Rata-rata Lama Sekolah (RLS) menurut jenis
kelamin di Provinsi Jawa Tengah tahun 2017 hingga tahun 2019 yang terdiri dari 29 Kabupaten dan 6 Kota yang
diperoleh dari Badan Pusat Statistik Jawa Tengah - Source Url: https://jateng.bps.go.id/indicator/40/134/1/rata-
rata-lama-sekolah-rls-menurut-jenis-kelamin.html. Objek yang dianalisa adalah persentase Rata-rata Lama
Sekolah (RLS) menurut jenis kelamin. Selanjutnya dataset akan disesuaikan dengan kebutuhan agar dapat
dilakukan pemetaan berupa klaster terhadap persentase Rata-rata Lama Sekolah (RLS) menggunakan teknik
kecerdasan buatan (artificial intelligence). Salah satu teknik kecerdasan buatan yang digunakan sebagai solusi
adalah metode k-means. Sebelum dataset digunakan, terlebih dahulu dilakukan proses preprosesing data
dengan cara mengambil nilai rata persentase (%) RLS tahun 2017-2019 berdasarkan jenis kelamin. Berikut hasil
sampel dataset yang akan digunakan pada pemetaan wilayah berupa klaster menggunakan metode k-means.
Tabel 3. Dataset persentase Rata-rata Lama Sekolah (RLS) yang sudah diolah
No Wilayah Jateng Laki-Laki Perempuan
1 Kabupaten Cilacap 7.41 6.45
2 Kabupaten Banyumas 7.94 7.12
3 Kabupaten Purbalingga 7.39 6.61
4 Kabupaten Banjarnegara 6.60 6.16
5 Kabupaten Kebumen 7.94 6.93
6 Kabupaten Purworejo 8.50 7.39
7 Kabupaten Wonosobo 6.92 6.43
8 Kabupaten Magelang 8.06 7.13
9 Kabupaten Boyolali 8.45 6.84
10 Kabupaten Klaten 8.93 7.68
11 Kabupaten Sukoharjo 9.56 8.44
12 Kabupaten Wonogiri 7.51 6.44
13 Kabupaten Karanganyar 9.31 7.86
14 Kabupaten Sragen 7.95 6.50
15 Kabupaten Grobogan 7.24 6.20
16 Kabupaten Blora 7.04 5.99
17 Kabupaten Rembang 7.59 6.47
18 Kabupaten Pati 7.69 6.63
19 Kabupaten Kudus 9.11 7.96
20 Kabupaten Jepara 7.81 6.76
21 Kabupaten Demak 8.26 6.85
22 Kabupaten Semarang 8.38 7.50
23 Kabupaten Temanggung 7.28 6.74
24 Kabupaten Kendal 7.66 6.47
25 Kabupaten Batang 7.32 6.13
26 Kabupaten Pekalongan 7.11 6.34
27 Kabupaten Pemalang 6.91 5.77

Ajeng Tiara Wulandari, Copyright ©2021, MIB, Page 1553


Submitted: 01/09/2021; Accepted: 20/10/2021; Published: 26/10/2021
JURNAL MEDIA INFORMATIKA BUDIDARMA
Volume 5, Nomor 4, Oktober 2021, Page 1548-1558
ISSN 2614-5278 (media cetak), ISSN 2548-8368 (media online)
Available Online at https://ejurnal.stmik-budidarma.ac.id/index.php/mib
DOI 10.30865/mib.v5i4.3279

No Wilayah Jateng Laki-Laki Perempuan


28 Kabupaten Tegal 7.30 6.12
29 Kabupaten Brebes 6.75 5.37
30 Kota Magelang 10.97 9.95
31 Kota Surakarta 11.05 9.98
32 Kota Salatiga 10.86 9.81
33 Kota Semarang 11.33 10.14
34 Kota Pekalongan 8.94 8.31
35 Kota Tegal 8.69 7.66
Dataset pada Tabel 3 akan diproses menggunakan bantuan software RapidMiner menggunakan metode k-
means. Pada penelitian ini proses pemetaan yang dilakukan akan menghasilkan dua klaster yakni klaster tinggi
terhadap Rata-rata lama (C1) dan klaster rendah terhadap Rata-rata lama (C2). Software RapidMiner
memudahkan dalam melakukan perhitungan dataset dengan menggunakan operator-operator. Operator ini
berfungsi untuk memodifikasi data. Dataset dihubungkan dengan node-node pada operator kemudian
menghubungkannya ke node hasil untuk melihat hasilnya. Hasil yang diperlihatkan RapidMiner dapat
ditampilkan secara visual dengan grafik. Berikut adalah rancangan pemetaan Rata-Rata Lama Sekolah (RLS)
menurut jenis kelamin di provinsi Jawa Tengah dengan K-Means seperti pada Gambar 5 berikut:

Gambar 5. Rancangan RapidMiner Studio


Pada gambar 1 dijelaskan output mapping berupa klaster Rata-Rata Lama Sekolah (RLS) menurut jenis
kelamin dimana setiap operator yang digunakan diberikan nama yang berbeda untuk memudahkan proses
analisis. Untuk operator Read Excel diberi nama Dataset RLS artinya dataset excel yang digunakan sesuai
dengan tabel 1. Sedangkan operator k-means digunakan untuk melakukan pemetaan berupa klaster. Untuk
operator terakhir digunakan adalah cluster distance performance. Operator ini menganalisa dan mengevaluasi
kinerja model klaster yang terbentuk melalui kinerja parameter yang disebut dengan davies_bouldin_index
(DBI). Parameter ini secara spesifik berfungsi menghasilkan klaster dengan jarak intra-cluster rendah (kesamaan
intra-cluster tinggi) dan jarak antar-cluster tinggi (kesamaan antar-cluster rendah) akan memiliki DBI rendah.
Maka hasil klaster yang menghasilkan kumpulan klaster dengan DBI terkecil dianggap sebagai metode terbaik
berdasarkan kriteria ini. Adapun pengaturan parameter yang dilakukan adalah dengan mengubah nilai k dan
menentukan measure type pada software RapidMiner. Adapun tampilan dari pengaturan properties parameter
dapat dilihat pada Gambar 6 berikut.

Gambar 6. Menentukan cluster


Setelah dilakukan penentuan parameter (Gambar 6), pengujian terhadap dataset dapat dilakukan. Dalam
hal ini atribut yang diuji sebagai class adalah persentase RLS dimana dataset dianalisis berdasarkan jenis
kelamin dengan nilai kevalidan data 97,14% untuk persentase RLS berdasarkan jenkel=”Perempuan” dan

Ajeng Tiara Wulandari, Copyright ©2021, MIB, Page 1554


Submitted: 01/09/2021; Accepted: 20/10/2021; Published: 26/10/2021
JURNAL MEDIA INFORMATIKA BUDIDARMA
Volume 5, Nomor 4, Oktober 2021, Page 1548-1558
ISSN 2614-5278 (media cetak), ISSN 2548-8368 (media online)
Available Online at https://ejurnal.stmik-budidarma.ac.id/index.php/mib
DOI 10.30865/mib.v5i4.3279

97,14% untuk persentase RLS berdsarkan jenkel=”Laki-Laki”. Berikut statistik dataset RLS seperti pada gambar
7 sebagai berikut.

(a)

(b)
Gambar 7. Rancangan RapidMiner Studio (a-b)
Setelah statistik dataset yang digunakan valid, maka dapat diproses menggunakan metode k-means.
Berikut hasil analisa dengan RapidMiner Studio pada Rata-Rata Lama Sekolah (RLS) menurut jenis kelamin di
provinsi Jawa Tengah menggunakan metode k-means seperti yang ditunjukkan pada Gambar 8 berikut.

Gambar 8. Hasil klaster


Tabel 4. Hasil klaster Rata-rata Lama Sekolah (RLS)
Wilayah Jateng Laki-Laki Perempuan cluster
Kabupaten Cilacap 7.4 6.5 cluster_0
Kabupaten Banyumas 7.9 7.1 cluster_0
Kabupaten Purbalingga 7.4 6.6 cluster_0
Kabupaten Banjarnegara 6.6 6.2 cluster_0
Kabupaten Kebumen 7.9 6.9 cluster_0
Kabupaten Purworejo 8.5 7.4 cluster_0
Kabupaten Wonosobo 6.9 6.4 cluster_0
Kabupaten Magelang 8.1 7.1 cluster_0
Kabupaten Boyolali 8.5 6.8 cluster_0
Kabupaten Klaten 8.9 7.7 cluster_0
Kabupaten Sukoharjo 9.6 8.4 cluster_1
Kabupaten Wonogiri 7.5 6.4 cluster_0
Kabupaten Karanganyar 9.3 7.9 cluster_1
Kabupaten Sragen 8.0 6.5 cluster_0

Ajeng Tiara Wulandari, Copyright ©2021, MIB, Page 1555


Submitted: 01/09/2021; Accepted: 20/10/2021; Published: 26/10/2021
JURNAL MEDIA INFORMATIKA BUDIDARMA
Volume 5, Nomor 4, Oktober 2021, Page 1548-1558
ISSN 2614-5278 (media cetak), ISSN 2548-8368 (media online)
Available Online at https://ejurnal.stmik-budidarma.ac.id/index.php/mib
DOI 10.30865/mib.v5i4.3279

Wilayah Jateng Laki-Laki Perempuan cluster


Kabupaten Grobogan 7.2 6.2 cluster_0
Kabupaten Blora 7.0 6.0 cluster_0
Kabupaten Rembang 7.6 6.5 cluster_0
Kabupaten Pati 7.7 6.6 cluster_0
Kabupaten Kudus 9.1 8.0 cluster_1
Kabupaten Jepara 7.8 6.8 cluster_0
Kabupaten Demak 8.3 6.8 cluster_0
Kabupaten Semarang 8.4 7.5 cluster_0
Kabupaten Temanggung 7.3 6.7 cluster_0
Kabupaten Kendal 7.7 6.5 cluster_0
Kabupaten Batang 7.3 6.1 cluster_0
Kabupaten Pekalongan 7.1 6.3 cluster_0
Kabupaten Pemalang 6.9 5.8 cluster_0
Kabupaten Tegal 7.3 6.1 cluster_0
Kabupaten Brebes 6.8 5.4 cluster_0
Kota Magelang 11.0 10.0 cluster_1
Kota Surakarta 11.1 10.0 cluster_1
Kota Salatiga 10.9 9.8 cluster_1
Kota Semarang 11.3 10.1 cluster_1
Kota Pekalongan 8.9 8.3 cluster_1
Kota Tegal 8.7 7.7 cluster_0
Pada tabel 4 merupakan sheet di Result Perspective untuk menampilkan data yang telah diolah secara
keseluruhan lengkap dengan klasternya dari example set (read excel). Berikut hasil lengkap Data view yang
dijelaskan pada gambar 3 dimana jumlah klaster digunakan adalah 2 (k=2). Hasil penelitian menyebutkan bahwa
dari 35 provinsi diperoleh 8 provinsi (23 persen) berada di klaster tinggi (cluster_1) dan 27 provinsi (77 persen)
di klaster rendah (cluster_0). Klaster tinggi yakni Kabupaten Sukoharjo, Kabupaten Karanganyar, Kabupaten
Kudus, Kota Magelang, Kota Surakarta, Kota Salatiga, Kota Semarang, Kota Pekalongan. Sedangkan klaster
rendah yakni Kabupaten Cilacap, Kabupaten Banyumas, Kabupaten Purbalingga, Kabupaten Banjarnegara,
Kabupaten Kebumen, Kabupaten Purworejo, Kabupaten Wonosobo, Kabupaten Magelang, Kabupaten Boyolali,
Kabupaten Klaten, Kabupaten Wonogiri, Kabupaten Sragen, Kabupaten Grobogan, Kabupaten Blora, Kabupaten
Rembang, Kabupaten Pati, Kabupaten Jepara, Kabupaten Demak, Kabupaten Semarang, Kabupaten
Temanggung, Kabupaten Kendal, Kabupaten Batang, Kabupaten Pekalongan, Kabupaten Pemalang, Kabupaten
Tegal, Kabupaten Brebes, Kota Tegal.

Gambar 9. Nilai centroid akhir pada pemetaan Rata-Rata Lama Sekolah (RLS) menurut jenis kelamin
Pada gambar 9 dijelaskan bahwa penentuan nilai klaster tinggi dan rendah berdasarkan pada nilai centroid
dimana nilai centroid akhir adalah {10.005; 8.904} pada klaster tinggi (cluster_1) dan {7.603; 6.577} pada
klaster rendah (cluster_0). Berikut adalah Flot view merupakan sheet di Result Perspective untuk menampilkan
data yang telah diolah secara keseluruhan lengkap dengan klasternya dari example set (read excel) dalam bentuk
diagram Scatter. Tampilannya dapat dilihat pada gambar 10 berikut.

Gambar 10. Pemetaan berupa klaster berdasarkan wilayah

Ajeng Tiara Wulandari, Copyright ©2021, MIB, Page 1556


Submitted: 01/09/2021; Accepted: 20/10/2021; Published: 26/10/2021
JURNAL MEDIA INFORMATIKA BUDIDARMA
Volume 5, Nomor 4, Oktober 2021, Page 1548-1558
ISSN 2614-5278 (media cetak), ISSN 2548-8368 (media online)
Available Online at https://ejurnal.stmik-budidarma.ac.id/index.php/mib
DOI 10.30865/mib.v5i4.3279

Dari penelitian yang dilakukan, metode k-means dengan pengukuran validity cluster dengan
menggunakan Davies Bouldin Index (DBI), membuktikan bahwa k- medoids dapat menghasilkan kualitas cluster
yang lebih optimal yang ditunjukan dengan nilai DBI yang lebih kecil yakni 0.284. Artinya nilai DBI yang lebih
kecil mendekati 0 menunjukan skema cluster yang optimal. Adapun hasil DBI pada jumlah penduduk miskin
dapat dilihat pada gambar 11 berikut.

Gambar 11. Nilai DBI

4. KESIMPULAN
Berdasarkan hasil penelitian dapat disimpulkan bahwa penerapan metode k-means dapat dilakukan berupa
pemetaan terhadap wilayah RLS di provinsi Jawa Tengah. Hasil yang diperoleh menyebutkan diatas 70%
wilayah di jawa Tengah masih memiliki RLS rendah.

UCAPAN TERIMAKASIH
Terima kasih penulis sampaikan kepada Direktorat Riset dan Pengabdian Masyarakat, Deputi Bidang Penguatan
Riset dan Pengembangan, Kementerian Riset dan Teknologi/ Badan Riset dan Inovasi Nasional (Ristek/BRIN)
yang telah memberikan dana hibah penelitian dosen pemula (PDP) tahun 2020 pendanaan 2021. Selanjutnya,
terima kasih kepada ketua dan staff LPPM Politeknik Dharma Patria yang telah memfasilitasi kegiatan PDP
mulai penyusuan proposal hingga laporan penelitian.

REFERENCES
[1] Rohadin and A. Nurcahyo, “The Model Of Investment And Education On The Level Of Labor Absorption,” PalArch’s
Journal Of Archaeology Of Egypt/Egyptology, vol. 17, no. 6, pp. 102–110, 2020
[2] A. Hadi, “Pengaruh Rata-Rata Lama Sekolah Kabupaten/Kota Terhadap Persentase Penduduk Miskin Kabupaten/Kota
Di Provinsi Jawa Timur Tahun 2017,” Media Trend, vol. 14, no. 2, pp. 148–153, 2019.
[3] A. B. M. Bintang and N. Woyanti, “Pengaruh PDRB, Pendidikan, Kesehatan, Dan Pengangguran Terhadap Tingkat
Kemiskinan di Jawa Tengah (2011-2015),” Media Ekonomi dan Manajemen, vol. 33, no. 1, pp. 20–28, 2018.
[4] M. N. Faritz and A. Soejoto, “Pengaruh Pertumbuhan Ekonomi dan Rata-Rata Lama Sekolah Terhadap Kemiskinan Di
Provinsi Jawa Tengah,” Jurnal Pendidikan Ekonomi (JUPE), vol. 8, no. 1, pp. 16–21, 2020.
[5] BPS, “Persentase Penduduk Miskin Menurut Provinsi (Persen), 2019-2020,” Badan Pusat Statistik Indonesia, 2020.
[Online]. Available: https://www.bps.go.id/indicator/23/192/1/persentase-penduduk-miskin-menurut-provinsi.html.
[6] BPS, “Rata-Rata Lama Sekolah Menurut Provinsi [Metode Baru], 2010-2019,” Badan Pusat Statistik Indonesia, 2019.
[Online]. Available: https://www.bps.go.id/dynamictable/2020/02/18/1773/rata-rata-lama-sekolah-menurut-provinsi-
metode-baru-2010-2019.html.
[7] BPS, “Rata-rata Lama Sekolah (RLS) menurut Jenis Kelamin (Tahun),” Badan Pusat Statistik Provinsi Jawa Tengah,
2020. [Online]. Available: https://jateng.bps.go.id/indicator/40/134/1/rata-rata-lama-sekolah-rls-menurut-jenis-
kelamin.html.
[8] B. Supriyadi, A. P. Windarto, T. Soemartono, and Mungad, “Classification of Natural Disaster Prone Areas in
Indonesia using K-Means,” International Journal of Grid and Distributed Computing, vol. 11, no. 8, pp. 87–98, 2018.
[9] A. S. Ahmar, D. Napitupulu, R. Rahim, R. Hidayat, Y. Sonatha, and M. Azmi, “Using K-Means Clustering to Cluster
Provinces in Indonesia,” Journal of Physics: Conference Series, vol. 1028, no. 1, pp. 1–6, 2018.
[10] N. A. Febriyati, A. D. Gs, and A. Wanto, “GRDP Growth Rate Clustering in Surabaya City uses the K- Means
Algorithm,” International Journal of Information System & Technology, vol. 3, no. 2, pp. 276–283, 2020.
[11] K. Rahayu, L. Novianti, and M. Kusnandar, “Implementation Data Mining with K-Means Algorithm for Clustering
Distribution Rabies Case Area in Palembang City,” Journal of Physics: Conference Series, vol. 1500, no. 1, pp. 1–9,
2020.
[12] A. Moubayed, M. Injadat, A. Shami, and H. Lutfiyya, “Student Engagement Level in an e-Learning Environment:
Clustering Using K-means,” American Journal of Distance Education, vol. 34, no. 2, pp. 137–156, 2020.
[13] P. N. Tan, M. Steinbach, and V. Kumar, Introduction to Data Mining. London: Pearson Education, 2006.
[14] S. Sudirman, A. P. Windarto, and A. Wanto, “Data Mining Tools | RapidMiner : K-Means Method on Clustering of
Rice Crops by Province as Efforts to Stabilize Food Crops In Indonesia,” IOP Conference Series: Materials Science
and Engineering, vol. 420, no. 012089, pp. 1–8, 2018.
[15] A. M. Hemeida, S. Alkhalaf, A. Mady, E. A. Mahmoud, M. E. Hussein, and A. M. Baha Eldin, “Implementation of
nature-inspired optimization algorithms in some data mining tasks,” Ain Shams Engineering Journal, pp. 1–10, 2019.
[16] D. Aprilla, D. A. Baskoro, L. Ambarwati, and I. W. S. Wicaksana, Belajar Data Mining Dengan Rapid Minner. 2013.
[17] D. Nofriansyah and G. W. Nurcahyo, Algoritma Data Mining Dan Pengujian. Yogyakarta: Deepublish, 2015.

Ajeng Tiara Wulandari, Copyright ©2021, MIB, Page 1557


Submitted: 01/09/2021; Accepted: 20/10/2021; Published: 26/10/2021
JURNAL MEDIA INFORMATIKA BUDIDARMA
Volume 5, Nomor 4, Oktober 2021, Page 1548-1558
ISSN 2614-5278 (media cetak), ISSN 2548-8368 (media online)
Available Online at https://ejurnal.stmik-budidarma.ac.id/index.php/mib
DOI 10.30865/mib.v5i4.3279

[18] U. Fayyad, G. Piatetsky-Shapiro, and P. Smyth, “From Data Mining to Knowledge Discovery in Databases,” AI
Magazine, vol. 17, no. 3, pp. 37–54, 1996.
[19] D. T. Larose, Discovering Knowledge in Data: An Introduction to Data Mining: Second Edition. New Jersey: John
Wiley & Sons, 2005.
[20] J. Han and M. Kamber, Data Mining : Concepts and Techniques Second Edition. San Francisco: Elsevier, 2006.
[21] I. H. Witten, E. Frank, and M. A. Hall, Data Mining : Practical Machine Learning Tools and Techniques Third Edition.
Burlington: Elsevier, 2011.
[22] R. Primartha, Belajar Machine Learning Teori dan Praktik. Bandung: Informatika Bandung, 2018.
[23] E. G. Sihombing, “Klasifikasi Data Mining Pada Rumah Tangga Menurut Provinsi Dan Status Kepemilikan Rumah
Kontrak / Sewa Menggunakan K-Means Clustering Method,” CESS (Journal of Computer Engineering System and
Science), vol. 2, no. 2, pp. 74–82, 2017.

Ajeng Tiara Wulandari, Copyright ©2021, MIB, Page 1558


Submitted: 01/09/2021; Accepted: 20/10/2021; Published: 26/10/2021

Anda mungkin juga menyukai