Anda di halaman 1dari 6

p-ISSN 2085-7829

Jurnal EKSPONENSIAL Volume 13, Nomor 2, Nopember 2022 e-ISSN 2798-3455

Pengelompokan Kabupaten/Kota Di Pulau Kalimantan Dengan


Fuzzy C-Means Berdasarkan Indikator Kemiskinan

Clustering Regency/City In Borneo With Fuzzy C-Means Based On


Poverty Indicators

Retno Ayu Ningtyas1, Yuki Novia Nasution2, dan Syaripuddin3


1,2,3
Laboratorium Matematika Komputasi, Program Studi Matematika, FMIPA, Universitas Mulawarman
Email: retnoayas@gmail.com

ABSTRACT
Cluster analysis is a branch of statistical science that is used to grouping data that have similar
characteristics between each other. The grouping method used in this research is Fuzzy C-Means. Fuzzy C-
Means method is one of the grouping methods developed from the C-Means method by applying the
properties of fuzzy sets. With the existence of each data is determined by the degree of membership. This
method is applied to data from 56 districts/cities on Borneo based on poverty indicators with variables
namely the percentage of average length of schooling, life expectancy, percentage of the poor, percentage
of open unemployment rate, percentage of households with proper sanitation, and percentage of households
with proper drinking water. This study aims to obtain the results of grouping districts/cities on Borneo
based on poverty indicators and to obtain optimal cluster results based on three validity indices, namely
Connectivity, Dunn, and Silhoutte values. Based on the results of the study, it was found that there were 2
optimal clusters, namely the first cluster consisted of 36 regencies/cities while the second cluster consisted
of 20 regencies/cities.

Keywords: Cluster analysis, Fuzzy C-Means, Poverty Indicators, Validity Index

Pendahuluan pengelompokan fuzzy sehingga data dapat


Analisis cluster merupakan sebuah cabang menjadi anggota dari semua cluster dengan
ilmu statistik analisis multivariat yang digunakan derajat atau tingkat keanggotaan yang berbeda
khusus untuk pengelompokkan objek yang antara 0 hingga 1. Kedekatan objek data ke pusat
memiliki kesamaan karakter. Objek yang sama cluster menentukan tingkat keanggotaan objek
akan dikelompokkan menjadi sebuah kelas yang data ke sebuah cluster (Kusumadewi, 2007).
memiliki beberapa anggota (Prasetyo, 2012). Metode Fuzzy C-Means juga dapat menempatkan
Terdapat beberapa metode dalam analisis cluster, pusat cluster yang lebih tepat dibandingkan
diantaranya adalah non-fuzzy clustering dan fuzzy dengan metode clustering lainnya. Selain
clustering. Perbedaan antara fuzzy clustering memiliki kelebihan fuzzy c-means juga memiliki
dengan non-fuzzy clustering terletak pada derajat keterbatasan diantaranya mudah terjebak dalam
keanggotaannya. Pada fuzzy clustering harus optimum lokal dan sensitif terhadap pusat cluster
ditentukan terlebih dahulu derajat keanggotaannya awal. Untuk mengatasi keterbatasan tersebut,
sedangkan pada non-fuzzy clustering tidak perlu maka pada penelitian ini digunakan tiga indeks
ditentukan derajat keanggotaannya melainkan validitas yaitu Indeks Dunn, Indeks Silhoutte, dan
langsung dilakukan proses clustering Indeks Connectivity.
(Kusumadewi, 2002). Validitas cluster merupakan suatu tahap
Fuzzy clustering merupakan salah satu teknik kegiatan yang digunakan untuk memberikan
untuk menentukan cluster optimal dalam suatu penilaian hasil dari analisis suatu cluster dengan
ruang vektor yang didasarkan pada jarak antar berdasarkan jumlah atau kuantitatif dan sesuai
vektor. Fuzzy clustering sangat berguna bagi dengan keadaan sebenarnya (Kapita & Abdullah,
pemodelan fuzzy terutama dalam mengidentifikasi 2020). Selain itu, validitas cluster juga salah satu
aturan-aturan fuzzy (Kusumadewi, 2006). Ada metode yang digunakan untuk melakukan
beberapa algoritma clustering data, diantaranya evaluasi hasil dari sebuah algoritma clustering
adalah K-Means dan Fuzzy C-Means. Fuzzy C- yang telah dilakukan dengan tujuan untuk
Means adalah suatu teknik clustering data dimana memperoleh jumlah cluster terbaik (Khairati,
keberadaan tiap-tiap titik data dalam suatu cluster Adlina, Hertono & Handari, 2019).
ditentukan oleh derajat keanggotaan. Teknik ini Pada penelitian yang telah dilakukan, dapat
pertama kali diperkenalkan oleh Jim Bezdek pada dilihat bahwa penerapan Fuzzy C-Means dapat
tahun 1981 (Kusumadewi dan Purnomo, 2010). diterapkan pada Indikator Kemiskinan.
Kelebihan dari Fuzzy C-Means adalah dapat Kemiskinan merupakan salah satu masalah
melakukan clustering lebih dari satu variabel kesejahteraan yang harus dituntaskan atau
sekaligus. Fuzzy C-Means menggunakan model mengalami penurunan tingkat kemiskinan,

Jurusan Matematika FMIPA Universitas Mulawarman 141


p-ISSN 2085-7829
Jurnal EKSPONENSIAL Volume 13, Nomor 2, Nopember 2022 e-ISSN 2798-3455

sehingga upaya yang harus dilakukan secara variabel w yang umumnya digunakan adalah 2
komprehensif dalam mencakup berbagai aspek (Bezdek dan Dunn, 1975).
kehidupan masyarakat dan dilaksanakan secara
terpadu. Badan Pusat Statistik mencatat penduduk Algoritma Fuzzy C-Means
Indonesia yang masih hidup dibawah garis Tahapan dari metode FCM untuk
kemiskinan hingga September 2020 sebesar 27,55 pengelompokkan data secara umum dirumuskan
juta orang atau 10,15 persen dari total penduduk sebagai berikut:
Indonesia. Pulau Kalimantan memiliki jumlah 1. Menentukan initial value yaitu jumlah
penduduk miskin terendah yaitu sebanyak 969,64 kelompok (c), variabel w, maksimum iterasi,
ribu orang. error terkecil yang diharapkan, fungsi
obyektif awal (P0=0)
Teori/Metodologi 2. Membangkitkan bilangan random
Analisis cluster melakukan pengelompokan (𝜇 ) × ; 𝑐 × 𝑛 menunjukkan ukuran matriks
data ke dalam sejumlah kelompok (cluster) sebagai elemen-elemen matriks partisi awal U.
berdasarkan kesamaan karakteristik masing- Matriks partisi (U) pada kelompok fuzzy
masing data pada kelompok-kelompok yang ada. memenuhi kondisi pada persamaan:
𝜇 ∈ [0,1],𝑖 = 1,2, … , 𝑛; 𝑘 = 1,2, … , 𝑐 (1)
Fuzzy C-Means
Metode Fuzzy C-Means menurut Klawonn μik adalah derajat keanggotaan yang merujuk
(2007) merupakan salah satu metode pada seberapa besar kemungkinan suatu data
pengelompokkan yang dikembangkan dari metode bisa menjadi anggota ke dalam suatu
C-Means dengan menerapkan sifat fuzzy kelompok. Misalkan 𝑄 adalah jumlah derajat
keanggotaannya sehingga data dapat menjadi keanggotaan 𝜇 pada setiap kolom matriks U,
anggota dari semua kelas atau kelompok yaitu:
terbentuk dengan derajat atau tingkat keanggotaan
yang berbeda antara 0 hingga tingkat keberadaan 𝑄 = 𝜇 (2)
data dalam suatu kelompok ditentukan oleh
derajat keanggotaannya. Teknik ini pertama kali
diperkenalkan oleh Jim Bezdek pada tahun 1981 Nilai elemen matriks yang ternomalisasi
(Kusrini dan Luthfi, 2009). dihitung dengan persamaan:
Konsep dasar FCM pertama kali adalah
menentukan pusat kelompok, yang akan menandai 𝜇 (3)
lokasi rata-rata untuk tiap-tiap kelompok. Pada
kondisi awal, pusat kelompok ini masih belum Bentuk matriks partisi awal yang telah
akurat. Tiap-tiap titik data memiliki derajat dinormalisasi sebagai berikut :
keanggotan untuk tiap-tiap kelompok. Dengan
cara memperbaiki pada kelompok dan derajat  11norm 21  1nnorm 
 
norm
keanggotaan tiap-tiap titik data secara berulang,
maka akan dapat dilihat bahwa pusat kelompok  21 22   2 nnorm  (4)
U   norm
0 norm

akan bergerak menuju lokasi yang tepat.     


Perulangan ini didasarkan pada minimisasi fungsi  
objektif yang menggambarkan jarak dari titik data  c1norm c 2 norm
 cnnorm 
yang diberikan ke pusat kelompok yang terbobot Nilai elemen-elemen pada setiap kolom
oleh derajat keanggotaan titik data tersebut 0
(Kusumadewi, 2006). Dalam metode FCM matriks partisi awal U harus mendekati
dipergunakan variabel derajat keanggotaan atau atau sama dengan satu.
membership function (μik) yang merujuk seberapa 3. Menghitung centroid vkj dengan k=1,2,…,c;
besar kemungkinan suatu data bisa menjadi dan j=1,2,…,m; menggunakan persamaan
anggota ke dalam suatu kelompok. Membership berikut :
function untuk suatu data ke suatu kelompok ∑ (𝜇 ) 𝑥 (5)
𝑣 =
tertentu mempunyai jangkauan nilai 0 ≤ μik ≤ 1. ∑ (𝜇 )
Metode FCM memperkenalkan suatu variabel w Persamaan untuk proses iterasi pusat
yang merupakan weighting exponent dari kelompok :
membership function, variabel ini dapat ∑ (𝜇 ) 𝑥 (6)
mengubah besar pengaruh dari membership 𝑣 =
∑ (𝜇 )
function dalam proses pengelompokkan
menggunakan metode FCM, variabel w Hasil perhitungan vij ditulis dalam bentuk
mempunyai nilai lebih besar dari 1 (w>1). Nilai matriks berukuran 𝑐 × 𝑛 sebagai berikut :

142 Jurusan Matematika FMIPA Universitas Mulawarman


p-ISSN 2085-7829
Jurnal EKSPONENSIAL Volume 13, Nomor 2, Nopember 2022 e-ISSN 2798-3455

 v11 v21  v1m  Halkidi, Batistakis & Vazirgiannis (2001),


v terdapat tiga jenis kriteria indeks validitas, yaitu:
v  v2 m  (7) 1) Kriteria Eksternal: Mengevaluasi hasil
v t   21 22 algoritma clustering berdasarkan struktur yang
    
  sudah ditentukan.
 vc1 vc 2  vcm  2) Kriteria Internal: Mengevaluasi hasil
algoritma clustering secara kuantitatif yang
4. Memperbaiki derajat keanggotaan setiap data
mencakup vektor dari himpunan data tersebut.
dalam setiap kelompok dengan menghitung
perubahan matriks partisi : 3) Kriteria Relatif: Mengevaluasi hasil algoritma
clustering dengan membandingkan algoritma
[∑ ( ) ]
𝜇 = tersebut dengan skema clustering lainnya.
∑ [∑ ( (8)
) ] Validasi hasil clustering dapat menggunakan
Dengan 𝜇 merupakan derajat keanggotaan beberapa indeks diantaranya yaitu indeks Dunn,
Silhoutte, dan Connectivity. Pada indeks
pada data kelompok ke-k untuk objek ke-i
Connectivity membentuk jumlah cluster terbaik
dalam proses iterasi ke-t. Derajat keanggotaan
apabila nilai yang dihasilkan semakin kecil
yang lebih diperbaiki ini merupakan elemen
t
dibandingkan dengan nilai dari cluster yang lain
matriks U berukuran 𝑐 × 𝑛. Bentuk (Halim & Widodo, 2017). Sedangkan untuk
matriksnya adalah sebagai berikut: indeks Dunn menghasilkan cluster terbaik jika
 v11 v21  v1m  nilai Dunn yang diperoleh semakin besar.
v Kemudian untuk indeks Silhoutte menghasilkan
v  v2 m  (9) cluster terbaik jika nilai yang diperoleh semakin
v t   21 22 dekat dengan angka 1 (Khairati, Adlina, Hertono
    
  & Handari, 2019).
 vc1 vc 2  vcm 
Dalam menghitung 𝜇 pada iterasi ke-t Kemiskinan
Secara umum, kemiskinan diartikan sebagai
(elemen matriks Ut), maka nilai vij yang
kondisi ketidak mampuan pendapatan dalam
digunakan adalah vij pada iterasi ke-t pula
mencukupi kebutuhan pokok sehingga kurang
(pada elemen matriks vt).
mampu untuk menjamin kelangsungan hidup.
Menghitung nilai fungsi objektif yang
Definisi kemiskinan dalam arti luas adalah
digunakan sebagai syarat perulangan untuk
keterbatasan yang dimiliki oleh seseorang,
mendapatkan pusat kelompok yang tepat.
keluarga, komunitas, bahkan negara yang
Sehingga diperoleh kecenderungan data untuk
menyatakan ketidaknyamanan dalam kehidupan,
masuk ke kelompok mana pada langkah akhir.
terancamnya penegakan hak dan keadilan,
Persamaan untuk nilai awal fungsi objektif
terancamnya posisi tawar (bargaining) dalam
untuk t = 1:
pergaulan dunia, hilangnya generasi serta
(10)
𝑃 = ([ (𝑥 − 𝑣 ) ](𝜇 ) suramnya masa depan bangsa (Haryadi, 2005).
Secara sederhana, miskin berarti tidak mampu
Persamaan untuk proses iterasi fungsi objektif memenuhi kebutuhan pokok anggota keluarga
Untuk t = 1,2,… : baik berupa pangan maupun non pangan
(11) (Tjondronegoro, 1996 dalam Girsang, 2011).
𝑃 = ([ (𝑥 − 𝑣 ) ](𝜇 ) Badan Pusat Statistik menentukan garis
kemiskinan berdasarkan pengeluaran rumah
Untuk menghitung nilai fungsi objektif pada tangga yang nilainya sekitar Rp 211.726 (Maret
iterasi ke-t (Pt), pusat kelompok vij yang 2010) atau Rp 233.740 per kapita per bulan
digunakan adalah vkj iterasi ke-t (elemen (Maret 2011) (Girsang, 2011). Berbeda dengan
matriks vt) dan derajat keanggotaan 𝜇 BPS, Bank Dunia memberikan definisi
iterasi ke-(t-1) yaitu elemen matriks Ut-1. kemiskinan yang lebih komprehensif, meliputi
5. Mengecek kondisi penghentian iterasi Jika |Pt - kebutuhan dasar, deprivasi kesejahteraan dan
Pt-1 |< 𝜀 atau t > maksimum iterasi maka ketidakcukupan kapasitas untuk hidup lebih baik
iterasi diberhentikan, jika tidak, maka iterasi (Girsang, 2011).
dinaikkan t=t+1 dengan mengulangi langkah
ke-4 untuk memulai iterasi baru.
Hasil Penelitian dan Pembahasan
Indeks Validitas 1. Data Penelitian
Indeks validitas merupakan suatu ukuran yang Data yang digunakan dalam penelitian ini
digunakan untuk menentukan jumlah kelompok adalah data sekunder. Pada Teknik pengambilan
yang optimal (Wang & Zhang, 2007). Menurut data ini dilakukan dengan mencatat data sampel di

Jurusan Matematika FMIPA Universitas Mulawarman 143


p-ISSN 2085-7829
Jurnal EKSPONENSIAL Volume 13, Nomor 2, Nopember 2022 e-ISSN 2798-3455

website Badan Pusat Statistik tentang indikator


kemiskinan 56 kabupaten/kota di Pulau
Kalimantan. Adapun variabel yang digunakan
dalam penelitian ini yaitu enam variabel: rata-rata
lama sekolah (X1), angka harapan hidup (X2),
tingkat pengangguran terbuka (X3), persentase
penduduk miskin (X4), persentase rumah tangga
dengan akses sanitasi layak (X5) dan persentase
rumah tangga dengan akses air minum layak (X6).
2. Fuzzy C-Means
Adapun tahapan-tahapan clustering metode
Fuzzy C-Means dalam clustering data
kabupaten/kota di Pulau Kalimantan berdasarkan
indikator kemiskinan sebagai berikut:
1. Menghitung indeks validitas
Hasil uji validasi dilakukan dengan
menggunakan package clValid pada software R.
Kemudian didapatkan nilai indeks Dunn, indeks
Silhoutte dan indeks Connectivity dari clustering Gambar 1. Hasil Cluster Kabupaten/Kota yang
menggunakan Fuzzy C-Means untuk data terbentuk
kabupaten/kota di Pulau Kalimantan berdasarkan
indikator kemiskinan pada masing-masing cluster Berdasarkan hasil analisis diatas dapat diketahui
yang terbentuk sesuai dengan Tabel 1 dan Tabel bahwa anggota cluster dengan c  2 pada
2. metode Fuzzy C-Means adalah sebagai berikut:
1. Cluster 1 beranggotakan kabupaten/kota di
Tabel 1. Hasil Uji Validasi Internal
Pulau Kalimantan yaitu Sambas, Bengkayang,
Connectivity Dunn Silhouette
2 cluster 27,2587 0,1377 0,2365
Landak, Sanggau, Ketapang, Sintang, Kapuas
3 cluster 35,7607 0,1668 0,2014 Hulu, Sekadau, Melawi, Kayong Utara, Kubu
4 cluster 42,6833 0,1978 0,2091 Raya, Tanah Laut, Kota Baru, Banjar, Barito
5 cluster 52,7480 0,2055 0,2061 Kuala, Tapin, Hulu Sungai Selatan, Hulu
Sungai Tengah, Hulu Sungai Utara, Tanah
Tabel 2. Jumlah Cluster Optimal Bumbu, Balangan, Malinau, Nunukan,
Indeks Nilai Cluster Kotawaringin Barat, Kotawaringin Timur,
Validitas Optimal Kapuas, Barito Selatan, Barito Utara,
Connectivity 27,2587 2 Lamandau, Seruyan, Katingan, Pulang Pisau,
Dunn 0,2055 5 Gunung Mas, Barito Timur, Murung Raya,
Silhouette 0,2365 2 Paser, dan Mahakam Ulu.
2. Cluster 2 beranggotakan kabupaten/kota di
Tabel 2 menunjukkan nilai indeks validasi
Pulau Kalimantan yaitu Mempawah, Kota
internal terbaik serta jumlah cluster optimal yang
Pontianak, Kota Singkawang, Tabalong, Kota
digunakan untuk metode Fuzzy C-Means
Banjarmasin, Kota Banjar Baru, Bulungan,
Clustering yaitu dengan menggunakan
Tana Tidung, Kota Tarakan, Kotawaringin
pengelompokkan 2 cluster yang mempunyai
Barat, Sukamara, Kota Palangkaraya, Kutai
indeks connectivity lebih kecil yaitu sebesar
Barat, Kutai Kartanegara, Kutai Timur, Berau,
27,2587 dan indeks silhouette yaitu 0,2365 lebih
Penajam Paser Utara, Kota Balikpapan, Kota
besar dibandingkan jumlah cluster lainnya namun
Samarinda, dan Kota Bontang.
nilai indeks dunn lebih kecil dibandingkan jumlah
cluster lainnya.
Kesimpulan
2. Pengelompokan dengan Fuzzy C-Means
Berdasarkan hasil analisis data dan
Tahap selanjutnya dilakukan proses
pembahasan diperoleh kesimpulan sebagai
pengelompokkan menggunakan metode Fuzzy C-
berikut:
Means pada aplikasi R dengan menggunakan
1. Berdasarkan hasil indeks validitas connectivity
banyak cluster c  2 . Diperoleh hasil cluster sebesar 27,2587 dan nilai silhoutte sebesar
yang terdiri dari 56 Kabupaten/Kota di Pulau 0,2365 pada metode Fuzzy C-Means bahwa
Kalimantan yang ditunjukkan pada Gambar 1 jumlah cluster yang optimal untuk
sebagai berikut: mengelompokkan Kabupaten/Kota di Pulau
Kalimantan berdasarkan indikator kemiskinan
adalah sebanyak 2 cluster.

144 Jurusan Matematika FMIPA Universitas Mulawarman


p-ISSN 2085-7829
Jurnal EKSPONENSIAL Volume 13, Nomor 2, Nopember 2022 e-ISSN 2798-3455

2. Anggota pada cluster 1 berjumlah 36


Kabupaten/Kota. Sedangkan anggota pada
cluster 2 berjumlah 20 Kabupaten/Kota.
Saran
Saran yang dapat diberikan untuk penelitian
selanjutnya yaitu melakukan perbandingan antara
metode Fuzzy clustering yang lainnya seperti
Fuzzy subtractive clustering. Serta disarankan
menggunakan indeks validitas yang lain seperti
partition coefficient dan exponential.

Daftar Pustaka
Bezdek, J.C dan Dunn, J. (1975). Optimal Fuzzy
Partitions: A Heuristic for Estimating the
Parameters in a Mixture of Normal
Distributions. IEEE Transactions on
Computers, 835-838.
Girsang, Wardis. (2011). Kemiskinan
Multidimensional Di Pulau-Pulau Kecil.
Ambon: BPFP-UNPATTI.
Halkidi, Maria., Batistakis, Yannis, Batistakis.,
dan Michalis, Vazirgiannis. (2001). On
Clustering Validation Techniques.
Journal of Intelligent Information
Systems 17, 107-145.
Haryadi, Agus. (2005). Kemiskinan, Mentalitas
Budaya. Yogyakarta: Pustaka Rahima.
Kapita, S.N., & Abdullah, S. Do. (2020).
Pengelompokan Data Mutu Sekolah
Menggunakan Metode Self-Organizing
Map (SOM) dan K-Means. Jurnal Teknik
ITS, A368-A373.
Khairati, A.F., Adlina, A., Hertono, G., &
Handari, B. (2019). Kajian Indeks
Validitas pada Algoritma K-Means
Enhanced dan K-Means MMCA. In:
Prosiding Seminar Nasional Matematika
Klawonn, F, dkk. (2007). Evolving Fuzzy Rule-
Based Classifiers. IEEE Press 220-225
Kusrini dan Luthfi, E. T. (2009). Algoritma Data
Mining. Yogyakarta: Andi Offset
Kusumadewi, Sri. (2002). Analisis dan Desain
Sistem Fuzzy Menggunakan Tool Box.
Yogyakarta: Graha Ilmu.
Kusumadewi, S, dkk. (2006). Fuzzy Multi-
Attribute Decision Making (Fuzzy
MADM). Yogyakarta: Graha Ilmu.
Kusumadewi, Sri. (2007). Klasifikasi Kandungan
Nutrisi Bahan Pangan Menggunakan
Fuzzy C-Means. Seminar Nasional
Aplikasi Teknologi Informasi (SNATI),
53-58.
Kusumadewi, S, dan Purnomo, H. (2010).
Aplikasi Logika Fuzzy Untuk Pendukung
Keputusan. Yogyakarta: Graha Ilmu.
Wang, Wei., dan Zhang, Qi. (2007). A Fast
Algorithm for Approximate Quantiles in
High-Speed Data Streams. IEEE.

Jurusan Matematika FMIPA Universitas Mulawarman 145


p-ISSN 2085-7829
Jurnal EKSPONENSIAL Volume 13, Nomor 2, Nopember 2022 e-ISSN 2798-3455

146 Jurusan Matematika FMIPA Universitas Mulawarman

Anda mungkin juga menyukai