Volume 10, Nomor 2, Oktober 2021, hlm. 101 - 109 ISSN: 2252-9039 (print)
Terakreditasi Peringkat 3, SK No. 28/E/KPT/2019 ISSN: 2655-3198 (online)
DOI: 10.34010/komputika.v10i2.4317
ABSTRAK – Kemiskinan merupakan salah satu indikator penting dalam melihat keberhasilan pembangunan
ekonomi suatu negara. Tingkat kemiskinan di Indonesia sebesar 9,22 persen dengan jumlah penduduk miskin
sebanyak 24,79 juta jiwa. Data kemiskinan di setiap daerah akan berbeda dipengaruhi oleh berbagai indikator. Oleh
karena itu penting untuk mengelompokkan daerah-daerah di Indonesia berdasarkan karakteristik kemiskinan
sehingga pemerintah dapat dengan tepat mengambil kebijakan terkait penanggulangan kemiskinan. Penelitian ini
menggunakan dua metode clustering, yaitu partitioning dan hierarki untuk mengelompokkan provinsi-provinsi di
Indonesia berdasarkan karakteristik kemiskinan. Metode partitioning yang dipilih adalah K-Means. Data yang
digunakan adalah 8 variabel kemiskinan pada 34 provinsi di Indonesia tahun 2019. Penentuan jumlah cluster
menggunakan validasi internal dan validasi stabilitias menunjukkan bahwa metode hierarki dengan jumlah cluster
2 menghasilkan cluster yang paling optimal. Perbandingan metode hierarki dinilai berdasarkan agglomerative
coefficient, dimana metode Ward mampu memberikan hasil pengelompokan terbaik.
Kata Kunci – Kemiskinan, Analisis Klaster, Partitioning, Hierarki.
Tersedia di https://ojs.unikom.ac.id/index.php/komputika
N Afira & A W Wijayanto
Komputika: Jurnal Sistem Komputer, Vol. 10, No. 2, Oktober 2021
102
N Afira & A W Wijayanto
Komputika: Jurnal Sistem Komputer, Vol. 10, No. 2, Oktober 2021
103
N Afira & A W Wijayanto
Komputika: Jurnal Sistem Komputer, Vol. 10, No. 2, Oktober 2021
𝑑(𝑢𝑣)𝑤 =
∑𝑖 ∑𝑘 𝑑𝑖𝑘
(5) 2.5 Validasi Cluster
𝑁(𝑢𝑣) 𝑁𝑤
Indeks validitas dihitung berdasarkan dua hal,
dik adalah jarak antara objek ke-i dalam cluster yaitu [18]:
(UV) dan objek ke-k dalam cluster ke W, dan N(uv) 1. Compactness: kesamaan objek pada klaster yang
dan Nw adalah jumlah objek dalam cluster (UV) dan sama.
W. 2. Separation: perbedaan objek pada klaster yang
4. Ward’s Method berbeda.
Metode agglomerative yang sering digunakan pada Validasi cluster yang digunakan untuk
data kontinu adalah metode Ward. Pendekatan ini menentukan jumlah cluster optimal terdiri dari 3
menggabungkan cluster jika total ketidaksamaan macam yaitu validasi internal, validasi stabilitas,
kuadrat dengan pusat cluster minimum disemua dan validasi biologis [19]. Validasi cluster yang
kemungkinan pilihan penggabungan [3]. Ilustrasi digunakan pada penelitian ini adalah validasi
ward’s method dapat dilihat pada gambar 5. internal dan validasi stabilitas sebagai metode untuk
memvalidasi hasil cluster.
104
N Afira & A W Wijayanto
Komputika: Jurnal Sistem Komputer, Vol. 10, No. 2, Oktober 2021
105
N Afira & A W Wijayanto
Komputika: Jurnal Sistem Komputer, Vol. 10, No. 2, Oktober 2021
Berdasarkan tabel 6 terlihat bahwa metode Bouldin sebesar 0.2802. Selain itu untuk metode
hierarki dengan jumlah cluster 2 yang paling yang sama dengan jumlah cluster 3 nilai Indeks
optimal. Nilai Connecitivity sebesar 2.929, nilai Dunn yang paling mendekati 1. Perbedaan nilai
Sillhoutte sebesar 0.569 dan nilai Indeks Davies Indeks Dunn untuk metode hierarki antara cluster 2
dan 3 hanya sebesar 0.003.
106
N Afira & A W Wijayanto
Komputika: Jurnal Sistem Komputer, Vol. 10, No. 2, Oktober 2021
AD 2.0127 kmeans 6
Setelah itu dilakukan uji validitas stabilitas Kalimantan Timur, Kalimantan Tengah,
menggunakan nilai APN, AD, ADM dan FOM. Nilai Kalimantan Utara, Sulawesi Utara, Sulawesi
indeks validitas stabilitas dapat dilihat pada tabel 7. Tengah, Sulawesi Selatan, Sulawesi Tenggara,
Berdasarkan tabel 8 nilai APN dan ADM Gorontalo, Sulawesi Barat, Maluku, Maluku
menunjukkan metode hierarki dengan jumlah cluster Utara, Papua Barat, Papua.
2 adalah metode terbaik. Sedangkan hanya nilai AD Kelompok 2 : DKI Jakarta.
dan FOM yang menunjukkan metode K-Means
dengan jumlah cluster 6 merupakan metode yang 3.4.2 Ward’s Method
terbaik. Berikut hasil pengelompokkan provinsi-provinsi
di Indonesia menggunakan metode Ward.
3.4 Analisis Cluster Kelompok 1 : Aceh, Jambi, Sumatera Selatan,
Hasil dari uji validitas internal dan stabilitis Bengkulu, Lampung, Kep.Bangka Belitung, Jawa
menunjukkan bahwa metode terbaik yang Tengah, DI Yogyakarta, Jawa Timur, Bali, Nusa
digunakan adalah hierarki dengan jumlah cluster 2. Tenggara Barat, Nusa Tenggara Timur,
Hal ini dikarenakan nilai indeks Connectivity dan Kalimantan Barat, Kalimantan Selatan,
Davies Bouldin yang lebih kecil. Selain itu nilai Kalimantan Tengah, Kalimantan Utara, Sulawesi
indeks Sillhoutte dan Dunn juga mendekati 1. Nilai Tengah, Sulawesi Selatan, Sulawesi Tenggara,
APN dan ADM juga lebih kecil ketimbang metode Gorontalo, Sulawesi Barat, Maluku, Maluku
dengan jumlah cluster lainnya. Sehingga peneliti Utara, Papua Barat, Papua.
menggunakan metode hierarki dengan jumlah Kelompok 2 : Sumatera Utara, Sumatera Barat,
cluster 2 pada data kemiskinan tahun 2019. Riau, Kepulauan Riau, DKI Jakarta, Jawa Barat,
Banten, Kalimantan Timur, Sulawesi Utara.
3.4.1 Single Linkage, Complete Linkage, Average
Linkage
Berikut hasil pengelompokkan provinsi-provinsi Tabel 9. Agglomerative Coefficient Metode Hierarki
di Indonesia menggunakan metode single linkage, Metode Agglomerative
complete linkage dan average linkage. Coefficient
Kelompok 1 : Aceh, Sumatera Utara, Sumatera Single 0.7759
Barat, Riau, Kepulauan Riau, Jambi, Sumatera Complete 0.8721618
Selatan, Bengkulu, Lampung, Kep.Bangka Average 0.8303338
Belitung, Jawa Barat, Jawa Tengah, DI Ward 0.8969488
Yogyakarta, Jawa Timur, Banten, Bali, Nusa
Tenggara Barat, Nusa Tenggara Timur, Berdasarkan tabel 9 didapatkan bahwa metode
Kalimantan Barat, Kalimantan Selatan, hierarki yang menghasilkan cluster terbaik yaitu
107
N Afira & A W Wijayanto
Komputika: Jurnal Sistem Komputer, Vol. 10, No. 2, Oktober 2021
metode Ward karena nilai agglomerative coefficient Dendogram yang dihasilkan dari metode Ward
lebih besar ketimbang metode hierarki lainnya. seperti pada gambar 7.
3.5 Karakteristik Tiap Cluster 2. Kelompok 2 terdiri dari 9 provinsi yang memiliki
Cluster yang terbentuk oleh metode Ward, perlu rata-rata lebih tinggi pada variabel PDRB, rata-
diketahui karakteristik dari setiap cluster rata lama sekolah, pengeluaran perkapita,
berdasarkan variabel-variabel kemiskinan. tingkat pengangguran terbuka, angka harapan
hidup, dan angka melek huruf.
Tabel 10. Deskripsi Statistik tiap Cluster
Variabel Cluster 1 Cluster 2
Persentase 4. KESIMPULAN
0.2590 -0.7194
Kemiskinan Berdasarkan hasil validasi internal dan validasi
PDRB -0.2466 0.6849 stabilitas didapat metode terbaik yaitu hierarki
Lama Sekolah -0.3355 0.9321 dengan jumlah cluster 2. Hasil akhir diperoleh untuk
Pengeluaran -0.26158 0.72660 cluster 1 berjumlah 25 provinsi sedangkan cluster 2
TPT -0.4174 1.1594 berjumlah 9 provinsi. Karakteristik cluster 1 yaitu
Angka Harapan tingkat kemiskinan yang lebih tinggi.
-0.18495 0.51374
Hidup Dengan mengetahui karakteristik kemiskinan tiap
Angka Melek provinsi, pemerintah dapat dengan tepat dalam
-0.2259 0.6276
Huruf membuat kebijakan untuk mengatasi masalah
Persentase Rumah kemiskinan. Untuk penelitian berikutnya akan lebih
Tangga dengan baik jika menambahkan metode clustering lainnya.
Status 0.37061 -1.0295
Kepemilikan DAFTAR PUSTAKA
Sendiri
[1] Badan Pusat Statistik, “Berita Resmi Statistik”
Berita Resmi Statistik No.08/01/Th. XXII, Januari
1. Kelompok 1 terdiri dari 25 provinsi yang
2020.
memiliki rata-rata lebih tinggi pada variabel
[2] R. Xu and D. Wunsch, “Clustering”, John Wiley
persentase kemiskinan, dan persentase rumah
& Sons , vol. 10., 2008.
tangga dengan status kepemilikan sendiri.
108
N Afira & A W Wijayanto
Komputika: Jurnal Sistem Komputer, Vol. 10, No. 2, Oktober 2021
[3] S. Landau and I. C. Ster, “Cluster analysis: EDUCATORS AND PROFESSIONAL: Journal of
overview”. Elsevier Ltd., vol. 11, pp. 1-12, 2010. Informatics, vol 4, no. 2, pp. 193-202, 2020
[4] Z. Abidin, “Pengelompokan Kabupaten/Kota [15] D. Zhang, K. Lee, K., & I. Lee, “Hierarchical
Di Jawa Timur Berdasarkan Indikator trajectory clustering for spatio-temporal
Kemiskinan Dengan Menggunakan Analisis periodic pattern mining”. Expert Systems with
Cluster Hierarki”, Doctoral dissertation, Applications, no. 92, pp. 1-11, 2018
Surabaya : Institut Teknologi Sepuluh [16] T. M. Kodinariya and P. R. Makwana, “Review
Nopember, 2018. on determining number of Cluster in K-Means
[5] L. Ramadhani, I. Purnamasari, and F. D. T. Clustering”, International Journal of Advanced
Amijaya, “Penerapan Metode Complete Research in Computer Science and Management
Linkage dan Metode Hierarchical Clustering Studie, vol. 1, no. 6, pp. 90-95, 2013.
Multiscale Bootstrap”, J. Eksponensial, vol. 9, no. [17] A. K. Jain, M. N. Nurty, and P. J. Flynn, 1999,
1, pp. 1–10, 2018. Data Clustering: A Review, ACM Comput.
[6] N. I. Febianto and N. Palasara, “Analisa Surv., vol. 31, no. 3, pp. 264-323.
Clustering KMeans Pada Data Informasi [18] Y. Liu, Z. Li, H. Xiong, X. Gao and J. Wu,
Kemiskinan Di Jawa Barat Tahun 2018”, J. “Understanding of Internal Clustering
Sisfokom (Sistem Inf. dan Komputer), vol. 8, no. 2, Validation Measures”, in 2010 IEEE
pp. 130-140, 2019. International Conference on Data Mining, pp.
[7] W. Alwi and M. Hasrul, “Analisis Klaster 911-916, 2010.
Untuk Pengelompokkan Kabupaten/Kota Di [19] M.A. Nahdliyah, T. Widiharih, & A.
Provinsi Sulawesi Selatan Berdasarkan Prahutama, “Metode K-Medoids Clustering
Indikator Kesejahteraan Rakyat”, J. MSA dengan Validasi Silhouette Index dan C-Index
(Matematika dan Stat. serta Apl.), vol. 6, no. 1, p. (Studi Kasus Jumlah Kriminalitas
35, 2018. Kabupaten/Kota di Jawa Tengah Tahun
[8] R. A. Johnson and D. W. Wichern, Applied 2018)”. Jurnal Gaussian, vol. 8, no. 2, pp. 161-170,
multivariate statistical analysis, USA: Pearson 2019.
Education, Inc , 2007. [20] N. N. Halim and E. Widodo, “Clustering
[9] D. Bartholomew, M. Knott, & I. Moustaki, Dampak Gempa Bumi di Indonesia
“Latent variable models and factor analysis: A Menggunakan Kohonen Self Organizing
unified approach (Vol. 904)”, John Wiley & Maps”, in Prosiding SI MaNIs (Seminar Nasional
Sons, 2011 Integrasi Matematika dan Nilai-Nilai Islami), vol.
[10] S. Machfudhoh and N. Wahyuningsih, 1, no. 1, pp. 188-194, 2017.
“Analisis Cluster Kabupaten/Kota Berdasarkan [21] J. Baarsh and M. E. Celebi, “Investigation of
Pertumbuhan Ekonomi Jawa Timur,” Jurnal Internal Validity Measures for K-Means
Sains dan Pomits, vol. 2, no. 1, pp. 1-7, 2013. Clustering”, in Proceedings of the international
[11] K. Yeturu, “Machine learning algorithms, multiconference of engineers and computer
applications, and practices in data science,” in scientists, vol. 1, pp. 14-16, 2012.
Handbook of Statistics, vol. 43, Elsevier, 2020, pp. [22] B. J. D. Sitompul, O. S. Sitompul, and P.
81–206, 2020. Sihombing, “Enhancement Clustering
[12] C. Suhaeni, A. Kurnia, and R. Ristiyanti, Evaluation Result of Davies-Bouldin Index with
“Perbandingan Hasil Pengelompokan Determining Initial Centroid of K-Means
menggunakan Analisis Cluster Berhirarki, K- Algorithm,” in Journal of Physics: Conference
Means Cluster, dan Cluster Ensemble (Studi Series, vol. 1235, no. 1, 2019.
Kasus Data Indikator Pelayanan Kesehatan Ibu
Hamil)”, J. Media Infotama, vol. 14, no. 1, 2018.
[13] Castillo, “Hierarchical Clustering C “, [Online].
https://www.slideshare.net/ChaToX/hierarch
ical-clustering-56364612 [Diakses 22 Desember
2015]
[14] R. Pramudita, “Pengujian Black Box pada
Aplikasi Ecampus Menggunakan Metode
Equivalence Partitioning”, INFORMATICS FOR
109