Dosen Pengampu
Wa Ode Zuhayeni Madjida S.S.T., M.Si.
PENDAHULUAN
Latar Belakang
Tabel 1. Presentase Penduduk Miskin dan Jumlah Penduduk Miskin di Indonesia tahun 2018-2019
Tahun 2020
Ukuran Kemiskinan
Semester 1 Semester 2
(1) (2) (3)
Presentase Penduduk Miskin (P0) (%) 26.64 26.80
Indeks Kedalaman Kemiskinan 6.16 6.90
Indeks Keparahan Kemiskinan 2.08 2.35
Sumber : Badan Pusat Statistik, diolah
Usaha pemerintah untuk terus mengurangi kemiskinan tidak terlepas dari berbagai
kebijakan baik yang terkait ekonomi makro maupun ekonomi mikro. Pada tataran ekonomi
makro, pemerintah terus mendorong pertumbuhan ekonomi, menjaga stabilisasi harga dan
membuka lapangan kerja (Sigit, 2020). Pemerintah juga terus mengembangkan infrastruktur
daerah tertinggal sehingga kegiatan ekonomi di daerah tersebut dapat lebih bergerak maju.
Terkait dengan ekonomi mikro, pemerintah memberikan bantuan langsung baik terkait
pangan, subsidi tunai maupun bantuan iuran asuransi kesehatan bagi masyarakat miskin.
Pengentasan kemiskinan merupakan tujuan pemerintah dalam rangka mewujudkan
kesejahteraan rakyat. Hal ini karena kesejahteraan rakyat merupakan cita-cita bangsa
Indonesia sebagaimana diamanatkan dalam Pembukaan UUD 1945. Selain kemiskinan, salah
satu indikator lain dari kesejahteraan adalah pendidikan. Pendidikan merupakan hak warga
negara yang diatur dalam UUD 1945. Dalam hal ini, pemerintah bertanggung jawab untuk
memastikan hak pendidikan diperoleh oleh seluruh rakyat. Banyak ukuran yang bisa
dijadikan proksi dalam tinjauan masalah pendidikan, salah satunya adalah rata-rata lama
sekolah. Data Badan Pusat Statistik menunjukkan rata-rata lama sekolah penduduk berusia
kurang dari 15 tahun di Provinsi Papua hanya 6,96 tahun, yang artinya rata rata penduduk
hanya menamatkan sekolah SD sederajat. Hal tersebut tentunya belum memenuhi program
wajib belajar 12 tahun yang dicanangkan pemerintah. Oleh karena itu, penting bagi
pemerintah, baik pusat maupun daerah, untuk segera berfokus mengatasi masalah
kesejahteraan yang terjadi di Provinsi Papua.
Berbagai kebijakan yang dilakukan pemerintah, tentu membutuhkan data yang akurat
sehingga kebijakan lebih strategis dan tepat sasaran. Data yang digunakan sebagai acuan
harus bisa menggambarkan karakteristik wilayah sesuai kondisi sebenarnya. Pada masalah
pengentasan kemiskinan, seringkali pemerintah bermasalah dengan target penerima bantuan.
Seringkali bantuan tidak tepat sasaran yang menyebabkan kerugian serta ketidakefektivan
strategi kebijakan. Hal ini dapat ditanggulangi salah satunya dengan cara mengelompokkan
wilayah secara akurat berdasarkan karakteristik kemiskinannya. Salah satu alat analisis yang
bisa digunakan adalah algoritma machine learning seperti clustering methods. Metode
clustering merupakan algoritma unsupervised machine learning yang digunakan untuk
melakukan pengelompokan objek yang didasarkan pada persamaan karakteristik yang
dimiliki (Saputra, 2020). Dengan menerapkan metode clustering, diharapkan dapat
membantu para pengambil kebijakan untuk mengetahui karakteristik dari wilayah
berdasarkan visualisasi hasil pengelompokan sehingga kebijakan yang dibuat lebih efektif
dan tepat sasaran.
Tujuan Penelitian
Berdasarkan latar belakang yang telah dipaparkan, tujuan dari penelitian ini dapat
dituliskan sebagai berikut.
1. Melakukan pengelompokkan wilayah kabupaten/kota dengan menerapkan algoritma
machine learning (k-medoids clustering dan hierarchical clustering) berdasarkan
tingkat kemiskinan dan rata-rata lama sekolah.
2. Mendapatkan algoritma machine learning terbaik yang mampu mengidentifikasi
kelompok-kelompok wilayah kabupaten/kota berdasarkan tingkat kemiskinan dan
rata-rata lama sekolah dengan tepat.
TINJAUAN PUSTAKA
Landasan Teori
Persentase Penduduk Miskin
Salah satu indikator yang digunakan untuk mengevaluasi kemiskinan di suatu wilayah
adalah persentase penduduk miskin. Indikator ini menunjukkan persentase penduduk yang
ada di bawah garis kemiskinan. Menurut BPS, garis kemiskinan adalah nilai minimal
pengeluaran yang dibutuhkan seseorang untuk dapat memenuhi kebutuhan pokok makanan
dan nonmakanan untuk hidup selama sebulan. Penduduk yang rata-rata pengeluaran per
kapita di tiap bulannya berada di bawah garis kemiskinan dikategorikan sebagai penduduk
miskin. Persentase penduduk miskin dihitung menggunakan rumus di bawah ini.
𝑞
1 𝑧 − 𝑦𝑖 𝛼
𝑃𝛼 = ∑ [ ]
𝑛 𝑧
𝑖=1
Keterangan:
𝑧: garis kemiskinan
𝑦𝑖 : rata-rata pengeluaran per kapita sebulan penduduk yang berada di bawah garis kemiskinan
𝑛: jumlah penduduk
Keterangan:
Clustering
Salah satu cara untuk mengelompokkan data adalah clustering. Berbeda dengan
klasifikasi yang mengelompokkan data di saat banyak dan jenis kelompoknya telah diketahui
sebelum analisis dilakukan, clustering mengelompokkan data tanpa ada asumsi mengenai
banyak dan jenis kelompok di awal analisis (Johnson & Wichern, 2002). Pengelompokan ini
dilakukan berdasarkan kemiripan atau ketidak miripan yang dinilai dari jarak. Pengukuran
jarak dapat dilakukan dengan berbagai metode seperti euclidian, manhattan, dan lain-lainnya.
Hierarchical Clustering
Nonhierarchical Clustering
Jenis lain dari analisis clustering adalah nonhierarchical clustering. Metode clustering
ini mengelompokkan data ke dalam kelompok sebanyak K yang ditentukan di awal atau
dengan prosedur tertentu. Pengelompokan yang optimal adalah di saat jarak antarkelompok
yang terbentuk sangat besar atau setiap kelompok benar-benar berbeda di antara satu sama
lain. Beberapa contoh algoritma nonhierarchical clustering adalah K-means dan K-medoids.
Penelitian Terdahulu
Gifthera Dwilestari, Mulyawan, Martanto, dan Irfan Ali melakukan analisis clustering
pada persentase penduduk miskin provinsi-provinsi Indonesia pada tahun 2007-2019
menggunakan metode K-medoids. Banyaknya klaster atau K dicoba sebanyak 2 hingga 20,
setiap besar K yang dipilih didasarkan pada nilai Davies Bouldin Index. K sebesar tiga
digunakan sehingga provinsi-provinsi di Indonesia dikelompokkan ke dalam tiga klaster.
Klaster 1 memiliki kemiskinan tingkat rendah ada sebanyak 19 provinsi, klaster 2 memiliki
kemiskinan tingkat sedang terdiri dari 12 provinsi, dan klaster 3 memiliki kemiskinan tingkat
tinggi terdiri dari 3 provinsi.
METODOLOGI
Sumber Data
Data yang digunakan dalam penelitian ini merupakan data sekunder yang diperoleh
dari Badan Pusat Statistik tahun 2020 yaitu data informasi kemiskinan yaitu Persentase
Penduduk Miskin (P0) dan Rata-rata Lama Sekolah (RLS) dari 29 Kabupaten/Kota yang
berada di Provinsi Papua. Dalam penelitian ini akan dilakukan pengelompokan
kabupaten/kota di Indonesia berdasarkan persentase penduduk miskin dan rata-rata lama
sekolah dengan menerapkan 2 metode clustering menggunakan algoritma machine learning
metode k-medoids clustering dan algomerative hierarchical clustering.
Adapun langkah-langkah proses data mining yang dilakukan dalam penelitian ini adalah
sebagai berikut:
a. Langkah 1: Data Prepocessing
Pada peroses ini dilakukan pengecekan apakah terdapat missing value kemudian
pengecekan terhadap outlier menggunakan boxplot.
b. Langkah 2: Clustering
K-medoids (K-Med) Clustering
K-medoids merupakan suatu metode algoritma Clustering yang cukup efisien
digunakan untuk data set berukuran kecil. Metode K-medoids diawali dengan mencari
titik yang paling representatif (medoids) dalam data set dengan menghitung jarak dalam
kelompok dari semua kemungkinan kombinasi dari medoids sehingga dihasilkan jarak
antar titik dalam suatu Cluster kecil sedangkan untuk jarak antar Cluster besar. K-
medoids atau Partitioning Around Medoids (PAM) merupakan algoritma Clustering
yang mirip dengan K-Means. Dimana algoritma metode ini memiliki kelebihan dapat
mengatasi kelemahan dari K-means yang sensitive terhadap noise dan outlier. Kelebihan
lainnya yaitu hasil proses Clustering tidak bergantung pada urutan masuk dari dataset.
Metode K-medoids akan meminimalkan jumlah perbedaan antar titik data dalam Cluster
dan menetapkan satu titik data di setiap Cluster sebagai pusat medoids.
Adapun langkah-langkah yang digunakan dalam melakukan pengelompokan
menggunakan K-medoids sebagai berikut:
1. Menginisialisasi nilai k untuk menentukan banyaknya pusat Cluster. Penelitian
ini penulis menggunakan pengecekan nilai k optimum dengan melihat grafik
metode sillhoutte
2. Mengalokasikan setiap objek data ke dalam Cluster terdekat menggunakan
persamaan jarak Euclidian Distance dengan persamaan :
𝑛
𝑑(𝑥, 𝑦) = √∑ (𝑥𝑖 − 𝑦𝑖 )2
𝑖=1
3. Memilih secara acak objek yang berada pada masing-masing Cluster sebagai
kandidat medoid baru
4. Menghitung jarak setiap objek yang berada pada masing-masing Cluster dengan
kandidat medoid baru.
5. Menghitung total simpangan (S) dengan menghitung nilai total distance baru total
distance lama. Jika S < 0, maka tukar objek dengan data Cluster untuk
membentuk sekumpulan k objek baru sebagai medoid.
6. Mengulangi langkah 2 sampai 5 hingga tidak terjadi perubahan medoid, sehingga
didapatkan Cluster beserta anggota Cluster masing-masing.
Algglomerative Hierarchical Clustering
Analisis Clustering memiliki beberapa jenis berdasarkan tahapannya, satu di
antaranya adalah hierarchical Clustering, yaitu teknik Clustering yang dilakukan dengan
penggabungan berturut-turut atau pembagian yang berturut-turut. Hierarchical Clustering
yang melakukan penggabungan berturut-turut diawali dengan data-data tunggal
dinamakan dengan agglomerative hierarchical clustering. Untuk sebaliknya,
hierarchical clustering yang melakukan pembagian berturut-turut diawali dengan satu
kelompok besar data-data disebut dengan divisive hierarchical clustering. Agglomerative
hierarchical clustering diawali dengan banyak cluster sebanyak data dan diakhiri dengan
satu cluster yang memuat semua data, sedangkan divisive hierarchical clustering berlaku
sebaliknya.
Agglomerative memiliki beberapa metode yang sering dipakai diantaranya single
linkage, average linkage, colmpleate linkage. Pada proses tahapan agglomerative dibagi
menjadi beberapa tahapan, yaitu:
1. Hitung matriks jarak
Terdapat banyak jenis jarak, tapi jarak yang umum digunakan adalah
Euclidean.
𝑝
2
𝑑𝑖𝑗 = √∑(𝑥𝑖𝑘 − 𝑥𝑗𝑘 )
𝑘=1
Keterangan:
Jika jarak objek 1 dengan 2 memiliki nilai jarak minimal dibandingkan jarak antar
objek lainnya dalam matriks jarak Euclidean, maka gabungan dua cluster pada
tahap pertama adalah d12.
Preprocessing Data
Data yang digunakan dalam penelitian ini merupakan data kuantitatif terkait tingkat
kemiskinan serta rata-rata lama sekolah di kabupaten/kota di Provinsi Papua. Jumlah
kabupaten/kota yang ada adalah 29. Sebelum data dianalisis lebih lanjut, data terlebih dahulu
melalui tahap preprocessing. Pertama, variabel yang tidak diperlukan dalam analisis akan
dihilangkan. Dalam hal ini, variabel yang berisi nama kabupaten/kota yang bertipe fektor,
terlebih dahulu dihilangkan dari proses analisis. Selanjutnya, karena dua variabel yang
digunakan untuk clustering memiliki standard pengukuran yang berbeda maka sebelum
analisis lebih lanjut data perlu distandardisasi terlebih dahulu. Kemudian, data diperiksa
untuk melihat ada atau tidaknya missing value maupun outlier. Berdasarkan pengamatan
langsung, tidak terdapat missing value pada data yang akan dianalisis. Kemudian
pemeriksaan outlier menggunakan box plot juga menunjukkan data sudah terbebas dari
outlier. Gambar 2 menunjukkan box plot dari kedua variabel yang dianalisis. Pada dasanya,
meskipun terdapat outlier, metode clusterring yang akan digunakan pada penelitian ini sudah
dapat menangani adanya outlier.
Gambar 2. Box plot Variabel Tingkat Kemiskinan dan Rata-rata Lama Sekolah
K-medoids Clustering
Berdasarkan gambar 3, nilai klaster optimal yang diperoleh adalah 3. Sehingga dalam
analisis ini besar nilai k yang akan dibentuk adalah 2 dan 3 klaster yang diharapkan mampu
menghasilkan klaster sesuai karakteristik yang diberikan. Selanjutnya dilakukan proses
klastering menggunakan bantuan software Rstudio untuk masing-masing nilai k sehingga
diperoleh hasil klasterisasi seperti pada tabel 2 untuk k=2 dan tabel 3 untuk k=3.
Tabel 2. Hasil Klastering menggunakan metode K-medoids Clustering dengan nilai k=2
Nomor di
Kabupaten/Kota di Rata-rata Rata-rata
Klaster RLS P0 Plot
Papua RLS P0
Klaster
(1) (2) (3) (4) (5) (6) (7)
1 Asmat 6,31 25,49 12 8,63 25,18
1 Biak Numfor 9,46 24,57 6
1 Boven Digoel 10,17 19,41 10
1 Jayapura 5,51 12,44 3
1 Jayawijaya 8,72 37,22 2
1 Keerom 8,82 16,32 17
1 Kepulauan Yapen 10 26,3 5
1 Mamberamo Raya 8,81 28,38 20
1 Mappi 8,78 25,04 11
1 Merauke 6,69 10,03 1
1 Nabire 10,04 24,15 4
1 Paniai 10,33 36,71 7
1 Supiori 9,2 36,91 19
1 Waropen 8,01 29,54 18
2 Deiyai 2,84 41,76 28 3,51 31,05
2 Dogiyai 2,15 28,62 26
2 Intan Jaya 4,93 40,71 27
2 Kota Jayapura 3,01 11,16 29
2 Lanny Jaya 1,13 38,13 22
2 Mamberamo Tengah 3,2 36,41 23
2 Mimika 3,62 14,26 9
2 Nduga 5,66 36,72 21
2 Pegunungan Bintang 4,26 30,15 14
2 Puncak 2,79 36,96 25
2 Puncak Jaya 4,57 34,74 8
2 Sarmi 3,64 13,87 16
2 Tolikara 2,81 32,04 15
2 Yahukimo 4,94 37,34 13
2 Yalimo 3,15 32,82 24
Berdasarkan tabel 2, dapat diketahui bahwa klaster 1 merupakan klaster dengan rata-
rata lama sekolah rendah dengan presentase penduduk miskin rendah. Sedangkan klaster 2
berisi kabupaten/kota dengan rata-rata lama sekolah lebih tinggi dari klaster 1 dan presentase
penduduk miskin yang juga lebih tinggi. Terlihat bahwa klaster 1 terdiri dari 14
kabupaten/kota, sedangkan klaster 2 terdiri dari 15 kabupaten/kota. Selanjutnya, akan
ditampilkan visualisasi hasil aglomerative k-medoids clustering untuk k=2 seperti pada
gambar 4 berikut. Berdasarkan gambar 4, terlihat bahwa setiap klaster memiliki jarak yang
cukup jauh di antara satu sama lain. Hal ini mengindikasikan bahwa setiap klaster dapat
dibedakan secara jelas.
Gambar 4. Plot K-medoids Clustering dengan k=2
Tabel 3. Hasil Klastering menggunakan metode K-medoids Clustering dengan nilai k=3
Nomor di
Kabupaten/Kota di Rata-rata Rata-rata
Klaster RLS P0 Plot
Papua RLS P0
Klaster
(1) (2) (3) (4) (5) (6) (7)
1 Jayapura 5,51 12,44 3 4,49 12,35
1 Kota Jayapura 3,01 11,16 29
1 Merauke 6,69 10,03 1
1 Mimika 3,62 14,26 9
1 Sarmi 3,64 13,87 16
2 Asmat 6,31 25,49 12 9,05 27,50
2 Biak Numfor 9,46 24,57 6
2 Boven Digoel 10,17 19,41 10
2 Jayawijaya 8,72 37,22 2
2 Keerom 8,82 16,32 17
2 Kepulauan Yapen 10 26,3 5
2 Mamberamo Raya 8,81 28,38 20
2 Mappi 8,78 25,04 11
2 Nabire 10,04 24,15 4
2 Paniai 10,33 36,71 7
2 Supiori 9,2 36,91 19
2 Waropen 8,01 29,54 18
3 Deiyai 2,84 41,76 28 3,54 35,53
3 Dogiyai 2,15 28,62 26
3 Intan Jaya 4,93 40,71 27
3 Lanny Jaya 1,13 38,13 22
3 Mamberamo Tengah 3,2 36,41 23
3 Nduga 5,66 36,72 21
3 Pegunungan Bintang 4,26 30,15 14
3 Puncak 2,79 36,96 25
3 Puncak Jaya 4,57 34,74 8
3 Tolikara 2,81 32,04 15
3 Yahukimo 4,94 37,34 13
3 Yalimo 3,15 32,82 24
Berdasarkan tabel 3, dapat diketahui bahwa klaster 1 merupakan klaster dengan rata-
rata lama sekolah medium dengan presentase penduduk miskin rendah dibanding klaster
lainnya. Sedangkan klaster 2 berisi kabupaten/kota dengan rata-rata lama sekolah paling
tinggi dan presentase penduduk miskin yang medium dibanding klaster lainnya. Kemudian
klaster 3 merupakan klaster dengan rata-rata lama sekolah terendah dengan presentase
penduduk miskin tertinggi dibanding klaster lainnya. Terlihat bahwa klaster 1 terdiri dari 5
kabupaten/kota, klaster 2 terdiri dari 12 kabupaten/kota dan klaster 3 terdiri dari 12
kabupaten/kota. Selanjutnya, akan ditampilkan visualisasi hasil aglomerative k-medoids
clustering untuk k=3 seperti pada gambar 5 berikut. Berdasarkan gambar 4terlihat bahwa
setiap klaster memiliki jarak yang cukup jauh di antara satu sama lain. Hal ini
mengindikasikan bahwa setiap klaster dapat dibedakan secara jelas.
Gambar 5. Plot Agglomerative K-medoids Clustering dengan k=3
Jumlah klaster yang optimal ditentukan dengan metode within sum of square (wss).
Banyak klaster yang dipilih didasarkan pada nilai total within sum of square terkecil yang
apabila jumlah klaster diperbanyak maka total within sum of square-nya tidak berubah lagi
secara signifikan. Evaluasi ini dilakukan berdasarkan Gambar 6 di bawah ini. Terlihat bahwa
setelah banyak klaster lebih dari 6, total within sum of square tidak menurun lagi secara
signifikan sehingga banyak klaster yang akan dibentuk adalah 6.
Untuk mengetahui metode mana yang dapat memberikasn hasil klastering yang lebih
baik, maka digunakan ukuran indeks Dunn. Metode klastering yang dinilai lebih baik, akan
memiliki nilai indeks Dunn yang lebih besar. Hasil perhitungan indeks Dunn dari kedua
metode yang digunakan pada penelitian ini sebagai berikut.
KESIMPULAN
Dari hasil penelitian ini, diharapkan dapat menjadi referensi bagi para pengambil
kebijakan dalam pelaksanaan program serta kebijakan kemiskinan yang efektif dan tepat
sasaran di kabupaten/kota Provinsi Papua. Untuk penelitian selanjutnya, diharapkan dapat
mengembangkan penelitian ini dengan menambah variabel-variabel dari dimensi kemiskinan
lainnya seperti persentase pengeluaran per kapita untuk makanan, angka partisipasi sekolah
penduduk miskin, dan penduduk miskin usia 15 tahun ke atas tidak bekerja, serta dapat
menerapkan pengelompokan dengan metode clustering yang lain.
DAFTAR PUSTAKA