Anda di halaman 1dari 8

Tema: (Inovasi, Teknologi dan Pendidikan Guna Mewujudkan

Indonesia Sejahtera di Era Industrialisasi 4.0), 21 Desember 2018


ISBN: 978-602-5793-40-0

Artikel Ilmiah Hasil Riset


K-MEANS CLUSTERING DENGAN METODE ELBOW UNTUK
PENGELOMPOKAN KABUPATEN DAN KOTA DI JAWA TIMUR
BERDASARKAN INDIKATOR KEMISKINAN
Anita Fitria Febrianti1, Antonito Hornay Cabral2,Gangga Anuraga3
Program Studi Statistika, Universitas PGRI Adi Buana Surabaya1,2,3
anitafitriafeb98@gmail.com

ABSTRAK
Provinsi Jawa Timur merupakan salah satu provinsi dengan kabupaten dan kota terbanyak di
Indonesia yang terdiri dari 29 kabupaten dan 9 kota. Besarnya wilayah di Jawa Timur
menyebabkan pemerintah daerah sulitmenangani kasus kemiskinan. Oleh karena itu perlu adanya
pengelompokan kabupaten dan kota supaya mudah dalam menangani permasalah dan
mengetahui kabupaten atau kota yang membutuhkan bantuan Pemerintah. Tujuan dari penelitian
ini adalah untuk mengelompokan kabupaten dan kota di Jawa Timur berdasarkan indikator
kemiskinan. Pada penelitian ini menggunakan Metode K-Means Cluster, merupakan salah satu
metode yang bisa digunakan untuk mengelompokan kabupaten dan kota di Jawa Timur. Algoritma
pada metode K-Means Cluster menetapkan suatu obyek ke dalam cluster yang
mempunyai centroid (mean) terdekat. Hasil penelitian menunjukkan bahwa dengan
mengelompokan kabupaten dan kota kedalam 4 cluster maka dapat diperoleh cluster pertama
terdiri dari 10 kabupaten, cluster kedua terdiri dari 5 kabupaten, cluster 3 terdiri dari 19 kabupaten
dan cluster 4 terdiri dari 4 kabupaten. Hasil karakteristik cluster pertama memiliki presentase
penduduk 15 tahun keatas pendidikan SLTA yang tinggi, cluster kedua memiliki rumah tangga
menerima raskin yang cukup tinggi, cluster ketiga memiliki angka partisipasi sekolah rendah dan
karakteristik pada cluster keempat memiliki penduduk 15 tahun keatas yang bekerja di sektor
pertanian yang sangat tinggi.
Kata kunci: kemiskinan, K-Means Cluster, Elbow Method

ABSTRACT
East Java Province is one of the provinces with the most regencies and cities in Indonesia,
consisting of 29 regencies and 9 cities. The size of the area in eastern Java has made it difficult for
regional governments to handle poverty cases. therefore it is necessary to group districts and cities
that need government assistance. The purpose of this study is to classify districts and cities in East
Java. Based on poverty indicators. In this study using the K-Means Cluster method, is one method
that can be used to group districts and cities in East Java. Algorithms in the K-Means Cluster
method assign an object to a cluster that has the closest centroid (mean). The results showed that
by grouping districts and cities into 4 duster, the first cluster consisted of 10 districts, the second
cluster consisted of 5 districts, cluster 3 consisted of 19 districts and cluster 4 consisted of 4
districts. The results of the first cluster characteristics have a percentage of the population of 15
years and above for high school education which is high, the second cluster has households that
receive quite high Raskin. The third cluster has low school achievement rates and the
characteristics of the fourth cluster have a population of 15 years and over who work in a very high
agricultural sector.
Keywords : Poverty, K-Means Cluster, Elbow Method

Subtema: Industrialisasi Ekonomi 863


Tema: (Inovasi, Teknologi dan Pendidikan Guna Mewujudkan
Indonesia Sejahtera di Era Industrialisasi 4.0), 21 Desember 2018
ISBN: 978-602-5793-40-0

PENDAHULUAN Gabungan Keduanya dalam Cluster


Analisis kelompok ataucluster Data. Hasil yang diperoleh gabungan
analysisadalah analisis statistika yang metode single lingkage dan K-means
bertujuan untuk mengelompokkan obyek- memberikan hasil cluster lebih baik
obyek berdasarkan kesamaan karakte- dengan parameter uji cluster variance
ristik. Obyek tersebut akan diklasifikasi- dan metode silhouette[4].
kan ke dalam satu atau beberapa kelom- Kemiskinan adalah keadaan
pok (cluster) sehingga obyek-obyek yang dimana terjadi ketidakmampuan untuk
berada dalam satu kelompok akan mem- memenuhi sandang, pangan, papan,
punyai kemiripan satu dengan yang lain. serta pendidikan dan kesehatan.
Dengan demikian terdapat homogenitas Kemiskinan dapat disebabkan oleh
(kesamaan) yang tinggi antar anggota kelangkaan kebutuhan dasar ataupun
dalam satu kelompok (within-cluster) dan sulitnya akses terhadap pendidikan dan
heterogenitas (perbedaan) yang tinggi pekerjaan. Angka kemiskinan Kabupaten
antar kelompok yang satu dengan /Kota di Jawa Timur memiliki posisi
kelompok lainnya (between-cluster)[1]. cukup tinggi. Angka kemiskinan ini terjadi
Beberapa penelitian terkait diduga karena para petani sudah tidak
analisis kelompok diantaranya pernah memiliki lahan sendiri. Sebagain besar di
dilakukan oleh Anuraga (2015), dalam Jawa Timur adalah buruhtani.Berdasar-
penelitiannya yang berjudul Hierarchical kan data dari Badan Pusat Statistik
Clustering Multiscale Bootstrap untuk kemiskinan di Provinsi Jawa Timur sejak
pengelompokan kemiskinan di Jawa September 2014 hingga Maret 2015
Timur menyimpulkan bahwa terdapat tercatat garis kemiskinan naik sebesar
lima kelompok (cluster) yang terbentuk 6,49%, sedangkan di wilayah perkotaan
dengan kemiripan satu dengan yang lain hanya 3,93%[5]. Tingkat kemiskinan ini
dan signifikan dengan nilai AU juga dipengaruhi karena tingkat pendi-
(Approximately Unbi-ased) p_value  dikan, lapangan kerja yang kurang me-
0,95[2].Febriyana, (2011) melakukan madai, pengeluaran perkapita untuk
analisis klaster k-means dan k-median makanan, dan juga penerima raskin di
pada data indikator kemiskinan (studi Kabupaten/Kota.
kasus data indikatorKemiskinan Tingkat kemiskinan di Jawa
Kabupaten di Indonesia tahun 2009). Timur dari tahun ke tahun mengalami
Hasil yang diperoleh adalah metode kenaikan. Untuk itu dalam menangani
pengklasteran K-Means lebih baik angka kemiskinan, pemerintah berperan
daripada K-Median untuk kasus tersebut, untuk mengelompokkan daerah yang
karena ketepatan klasifikasi K-Means membutuhkan pendidikan yang layak,
sebesar 98,51%, sedangkan K-Median lapangan pekerjaan sesuai dengan
sebesar 97,57%[3]. Alfina, dkk. (2012) potensi yang dimiliki khususnya pada
meneliti tentang perbandingan metode wilayah yang memiliki angka kemiskinan
Hierarchical Clustering, K-Means dan yang tinggi. Hasil pengelompokkan ter-

Subtema: Industrialisasi Ekonomi 864


Tema: (Inovasi, Teknologi dan Pendidikan Guna Mewujudkan
Indonesia Sejahtera di Era Industrialisasi 4.0), 21 Desember 2018
ISBN: 978-602-5793-40-0

sebut dapat digunakan oleh pemerintah presentase rumah tangga


2 Rasio
dalam merumuskan kebijakan terkait per- miskin menerima raskin(X2)
sebaran kemiskinan Presentase pengeluaran per
3 Rasio
Dalam penelitian ini digunakan kapita untuk makanan (X3)
data indikator kemiskinan menurut Presentase perempuan usia
4 15-49 tahun menggunakan Rasio
kabupaten dan kota di Jawa Timur tahun
KB (X4)
2016. Indikator kemiskinan diantaranya
Presentase penduduk 15
adalah rumah tangga miskin yang 5 tahun keatas bekerja di Rasio
menggunakan air layak dan jamban sektor pertanian (X5)
sendiri, rumah tangga menerima raskin, Presentase pendududuk
pengeluaran untuk makanan, angka miskin 15 tahun keatas
6 Rasio
melek huruf, presentase penduduk dengan pendidikan SLTA
miskin yang bekerja di sektor informal, (X6)
dan sebagainya. Tujuan dari penelitian Presentase angka melek
7 huruf penduduk 15-55 tahun Rasio
ini adalah mengelompokkan kabupaten
(X7)
dan kota di Jawa Timur bersadarkan
Presentase angka
indikator dengan menggunakan analisis partisipasi sekolah
K-Means Cluster. Pengelompokkan yang 8 Rasio
penduduk usia 13-15 tahun
dilakukan ini diharapkan dapat memberi- (X8)
kan informasi yang bermanfaatserta
masukan bagi pemerintah untuk mena- Analisis Pengelompokan
ngani daerah yang mempunyai kemis- Analisis kelompok atau cluster
kinan yang tinggi dan dapat melakukan analysis merupakan salah satu teknik
pemetaan sesuai dengan kelompoknya. multivariat yang masuk dalam klasifikasi
metode interdependen, yaitu metode ya-
METODE
ng mempelajari struktur hubungan antara
Data yang digunakan dalam pe-
variabel, antara kasus/responden dan
nelitian merupakan data sekunder yang
antara obyek. Analisis cluster atau
diambil dari Badan Pusat Statistik (BPS).
kelompok bertujuan untuk mengelompok-
Data yang digunakan berupa data indi-
kan obyek atau kasus ke dalam kelom-
kator kemiskinan seluruh kabupaten dan
pok yang mempunyai sifat yang relatif
kota di Jawa Timur tahun 2016, yang ter-
homogen. Obyek-obyek yang mempu-
diri dari 29 kabupaten dan 9 kota.
nyai kemiripan dikelompokkan dalam
Variabel-variabel tersebut dapat dilihat
cluster yang sama, sedangkan obyek-
pada tabel berikut:
Tabel 3.1 Variabel Penelitian
obyek lain yang tidak mirip dikelompok-
kan dalam cluster yang lain[1].
No. Keterangan Skala
Menurut Santoso (2004) analisis
Presentase rumah tangga
miskin menggunakan air kelompok merupakan pengelompokkan
1 Rasio data yang dilakukan dengan dua macam
layak dan jamban sendiri
(X1) metode yaitu metode hierarki dan meto-

Subtema: Industrialisasi Ekonomi 865


Tema: (Inovasi, Teknologi dan Pendidikan Guna Mewujudkan
Indonesia Sejahtera di Era Industrialisasi 4.0), 21 Desember 2018
ISBN: 978-602-5793-40-0

de non hierarki. Metode hirarki merupa- Menghitung ulang centroid yang


kan pengelompokkan yang dilakukan se- digunakan cluster untuk mendapatkan
cara hirarki atau berjenjang dari n, (n-1) obyek yang baru dan untuk cluster
sampai 1 kelompok. Metode non hirarki yang kehilangan obyek.
dilakukan dengan menentukan terlebih 3. Mengulangi langkah ke-2 sampai
dahulu jumlah cluster yang diinginkan. tidak ada lagi obyek yang
Salah satu prosedur non hirarki yang dipindahkan.
terkenal adalah metode K-Means[6]. Metode Elbow
Ukuran kemiripan yang biasa di- Metode dan analisis ini
gunakan dalam analisis cluster adalah digunakan untuk pemilihan jumlah cluster
jarak Euclidean dan jarak Mahalanobis. atau kelompok yang optimal. Berikut
Jarak Euclidean digunakan jika variabel disajikan algoritma elbow dalam
amatan saling bebas atau berkorelasi menentukan jumlah kelompok yang
satu sama lain (tidak terjadi multikolinie- terbentuk [7].
ritas). Jika terjadi multikolinearitas maka Yaitu berdasarkan pada sum of
dapat diatasi denngan mentransformasi square error(SSE).
data menggunakan Principal Component k
SSE    X i  Ck
2
(2)
Analysis (PCA)[1]. k 1 xi Sk

Johnson dan Wichern (1982) menya- dimana K adalah banyaknya kelompok


takan bahwa Jarak Euclidean antara yang digunakan pada algoritma K-MeansXi
x  [ x1 , x2 ,..., x p ]T , y  [ y1 , y2 ,..., y p ]T adalah jumlah data dan Ck adalah
banyaknya clusteri pada cluster ke k.
adalah sebagai berikut[1]:
d (x,y )  ( x1  y1 ) 2  ...  ( x p  y p ) 2 (1) Langka-langkah analisis data
K-Means Cluster Langkah-langkah penelitian dalam
Johnson dan Wichern (1982) penelitian ini adalah sebagai berikut:
1. Analisis deskriptif untuk mengetahui
menyarankan bahwa algoritma pada
gambaran indikator kemiskinan
metode K-Means Cluster menetapkan
Jawa Timur
suatu obyek ke dalam cluster yang
2. Menentukan jumlah cluster yang
mempunyai centroid (mean) terdekat[1].
akan dibentuk. Dalam penelitian
Proses ini dibagi dalam tiga tahap:
ini jumlah cluster yang dibentuk
1. Mempartisiobyek-obyekkedalam k
adalah sebanyak 4 cluster
clusterawal.
3. Lakukan analisis cluster dengan
2. Menentukan obyek yang mempunyai
metode K-Means Cluster sesuai
jarak terdekat dengan centroid
dengan langkah 1.
(mean). (Ukuran jarak yang biasa
4. Membagi anggota-anggota ke
digunakan adalah jarak Euclidean,
dalam setiap cluster
yang digunakan baik untuk
5. Deskripsikan karakteristik cluster
pengamatan yang distandarkan
yang didapatkan pada langkah 2
maupun yang tidak distandarkan).

Subtema: Industrialisasi Ekonomi 866


Tema: (Inovasi, Teknologi dan Pendidikan Guna Mewujudkan
Indonesia Sejahtera di Era Industrialisasi 4.0), 21 Desember 2018
ISBN: 978-602-5793-40-0

6. Melakukan kesimpulan terhadap


analisis yang dilakukan Berdasarkan tabel 2 diatas
terlihat bahwa secara rata-rata sebagian
HASIL besar rumah tangga menerima raskin
Deskripsi indikator kemiskinan Jawa masih terkolong tinggi yaitu sebesar
Timur 1718.53 dengan standar deviasi sebesar
Tabel 2 Analisis deskriptif 419.24. selain itu angka melek huruf di
dilakukan untuk mengetahui gambaran Jawa Timur tergolong cukup tinggi yaitu
secara umum karakteristik untuk masing- sebesar 95.04%.
masing variabel yangmembentuk Analisis K-Means cluster indikator
indikator kemiskinan pada setiap kemiskinan
kabupaten/kota di Provinsi Jawa Timur. Sebelum melakukan analisis
Tabel 2. Statistk deskriptif variabel penelitian analisis K-Means Cluster, perlu
Rata- Standar ditentukan terlebih dahulu jumlah cluster.
Var Min Maks
rata deviasi Dalam penelitian ini jumlah cluster yang
X1 32.1 76.10 16.17 98.93
ditentukan sebanyak 4 cluster. Dengan
X2 20.09 76.48 19.28 99.07
menggunakan algoritma k-means Cluster
X3 54.78 62.31 3.57 69.5
X4 32.44 91.61 12.92 98 dengan kasus indikator kemiskinan
X5 0 29.74 19.06 64.69 sebayak 4 cluster merupakan cluster
X6 4.22 14.93 8.37 35.23 optimal. Untuk lebih jelas dapat dilihat
X7 82.18 95.04 4.54 100 pada plot berikut:
X8 73.7 94.25 6.75 100

Gambar 1. Jumlah cluster optimal

Subtema: Industrialisasi Ekonomi 867


Tema: (Inovasi, Teknologi dan Pendidikan Guna Mewujudkan
Indonesia Sejahtera di Era Industrialisasi 4.0), 21 Desember 2018
ISBN: 978-602-5793-40-0

Berdasarkan gambar 1 dapat dilihat cluster dapat dilihat pada gambar 2


bahwa jumlah cluster yang optimal dibawah ini.
sebanyak 4 cluster. Untuk anggota

Gambar 2. Jumlah anggota cluster

Berdasarkan gambar 2 dapat tik setiap cluster berdasarkan indikator


dilihat bahwa cluster 1 terdapat 10 kemiskinan. Adapun hasil rata-rata setiap
kabupaten/kota, cluster 2 terdapat 5 cluster yang disajikan dalam tabel 4
kabupaten dan kota, cluster 3 terdapat dibawah ini:
19 kabupaten/kota dan cluster 4 terdiri Tabel 4. rata-rata presentase indikator
dari 4 kabupaten. Berikut adalah hasil kemiskinan di setiap cluster
keanggotan kabupaten/kota pada setiap Cluster
Var
cluster yang disajikan dalam tabel 3: 1 2 3 4
Tabel 3. Anggota-anggota Cluster X1 0.532 -1.723 0.115 0.275
Cluster Anggota cluster X2 -1.060 0.713 0.467 -0.460
1 Sidoarjo, kota Kediri, kota Blitar, X3 -1.242 0.717 0.143 1.529
kotaMalang, kota Probolinggo, X4 0.463 -0.144 0.272 -2.272
kota Pasuruan, kota Mojokerto,
X5 -1.259 0.277 0.276 1.492
kota Madiun, kota Surabaya dan
kota Batu. X6 1.327 -0.706 -0.341 -0.824
2 Jember, Banyuwangi, X7 0.726 -0.940 0.253 -1.841
Bondowoso, Situbondo dan X8 0.324 -1.589 0.303 -0.264
Tuban. Berdasarkan tabel 4 diatas dapat
3 Pacitan, Ponorogo, Treng-galek,
Tulungagung, Blita, Kediri, dilihat bahwa karakteristik pada cluster 1
Malang, Lumajang, Probolinggo, mempunyai presentase penduduk 15
Pasuruan, Mojo-kerto, Jombang, tahun keatas dengan pendidikan SLTA
Nganjuk, Madiun, Magetan, dan angka melek huruf penduduk 15-55
Ngawi, Bojonegoro, Lamongan,
Gresik tahun yang tinggi.Senada dengan
4 Bangkalan, Sampang, Pame- penelitian yang dilakukan oleh Febri
kasan, sumenep Angelina M.(2015) menyatakan bahwa
Masing-masing cluster yang ciri-ciri kawasan miskin dipengaruhi
terbentuk memiliki karakteristik yang dengan tingkat pendidikan dan angka
berbeda-beda. Berikut adalah karakteris-

Subtema: Industrialisasi Ekonomi 868


Tema: (Inovasi, Teknologi dan Pendidikan Guna Mewujudkan
Indonesia Sejahtera di Era Industrialisasi 4.0), 21 Desember 2018
ISBN: 978-602-5793-40-0

melek huruf. Ketika tingkat pendidikan UCAPAN TERIMA KASIH


dan angka melek huruf tinggi maka akan Ucapan terimakasih kami
menurunkan tingkat kemiskinan di suatu haturkan kepada program studi statistika
kabupaten/kota [8]. Karakteristik pada UNIPA Surabaya atas terlaksananya
cluster 2 memiliki pesentase rumah penelitian kolaboratif dosen dan
tangga menerima raskin dan pengeluar- mahasiswa.
an perkapita untuk makanan cukup tinggi
dengan rata-rata sebesar 0.713 dan DAFTAR RUJUKAN
0.717 dari sini dapat ditentukan di kluster [1] D. W. W. Richard A. Johnson,
2 didominasi oleh kabupaten /kota pesisir Applied Multifariate Statistical
di Jawa Timur. Pada karakterik cluster 3 Analysis. 1982.
mempunyai rumah tangga menerima [2] G. Anuraga, “Hierarchical Clustering
raskin dan angka partisipasi sekolah Multiscale Boostrap untuk
penduduk usia 13-15 tahun yang rendah. Pengelompokkan Kemiskinan di
Jawa Timur,” Statistika, vol. 1, pp.
Kemudian cluster 4 mempunyai
27–33, 2015.
presentase pengeluaran perkapita untuk
makanan dan presentase penduduk [3] Febriyana, Analisis Klaster K-Means
dan K-Median Pada Data Indikator
miskin 15 tahun keatas yang bekerja di
Kemiskinan. 2011.
sektor pertanian yang sangat tinggi.
[4] T. Alfina, B. Santosa, and R.
SIMPULAN Barakbah, “Analisa Perbandingan
Berdasarkan hasil pembahasan Metode Hierarchical Clustering , K-
means dan Gabungan Keduanya
dapat disimpulkan bahwa kondisi
dalam Cluster Data ( Studi kasus :
indikator kemiskinan pada setiap Problem Kerja Praktek Jurusan
kabupaten dan kota di Jawa Timur masih Teknik Industri ITS ),” J. Tek. ITS,
tidak seimbang, sehingga ada beberapa vol. 1, no. Data Mining, pp. 1–5,
kabupaten dan kota di provinsi Jawa 2012.
Timur masih memiliki beberapa indikator [5] BPS, “Data dan Informasi
kemiskinan yang tinggi. Pengelompokan Kemiskinan Kabupaten Kota Tahun
kabupaten dan kota di Jawa Timur 2015,” p. vi + 279, 2016.
berdasarkan indikator kemiskinan [6] Santoso Singgih. 2004 Statistik
dengan 4 cluster dengan metode K- Multivariat dengan SPSS. (116)
Means Cluster diperoleh cluster 1 [7] M. A. Syakur, B. K. Khotimah, E. M.
terdapat 10 kabupaten dan kota, cluster S. Rochman, and B. D. Satoto,
2 diperoleh 20 kabupaten dan kota, “Integration K-Means Clustering
cluster 3 diperoleh 4 kabupaten dan kota Method and Elbow Method for
sedangkan cluster 4 diperoleh 4 Identification of the Best Customer
Profile Cluster,” IOP Conf. Ser.
kabupaten. Hasil kesimpulan ini dapat
Mater. Sci. Eng., vol. 336, no. 1,
diharapkan sebagai bahan pertimbangan 2018.
dalam menangani daerah yang status
kemiskinan masih tinggi.

Subtema: Industrialisasi Ekonomi 869


Tema: (Inovasi, Teknologi dan Pendidikan Guna Mewujudkan
Indonesia Sejahtera di Era Industrialisasi 4.0), 21 Desember 2018
ISBN: 978-602-5793-40-0

[8] F. A. Manurung and D. B. Santoso, Timur,” J. Ilm. Mhs.FEB Univ.


“Pemetaan Kemiskinan Brawijaya, vol. 4,no. 1, pp. 1-
Kabupaten/Kota di Provinsi Jawa 10,2015.

Subtema: Industrialisasi Ekonomi 870

Anda mungkin juga menyukai