Anda di halaman 1dari 9

1

PENGGUNAAN ANALISIS CLUSTER K-MEANS DAN ANALISIS


DISKRIMINAN DALAM PENGELOMPOKAN DESA MISKIN
DI KABUPATEN PANGKEP

𝐅𝐞𝐛𝐢 𝐅𝐚𝐣𝐫𝐢𝐚𝐧𝐭𝐢𝟏) , 𝐌𝐮𝐡𝐚𝐦𝐦𝐚𝐝 𝐍𝐚𝐝𝐣𝐢𝐛 𝐁𝐮𝐬𝐭𝐚𝐧𝟐) dan 𝐌𝐮𝐡𝐚𝐦𝐦𝐚𝐝 𝐀𝐫𝐢𝐟 𝐓𝐢𝐫𝐨 𝟑)


1
Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Negeri Makassar
email: febifajrianti25@gmail.com1
mnbustan@gmail.com2
arif_tiro@yahoo.com3

ABSTRAK
Jenis penelitian ini adalah penelitian eksplorasi yang bertujuan untuk
mengelompokkan objek dengan menggunakan metode pengelompokan Analisis
Cluster K-Means sebagai pengelompokan awal terhadap objek penelitian desa
berdasarkan variabel pencirinya. Variabel yang digunakan sebagai indikator
pengelompokan desa miskin adalah tingkat pendidikan (𝑋1 ), kepadatan penduduk
(𝑋2 ), angka kelahiran kasar (𝑋3 ), angka kematian kasar (𝑋4 ), rata-rata banyaknya
anggota keluarga (𝑋5 ). Data diperoleh dari unit perpustakaan BPS dan kantor
Catatan Sipil Kabupaten Pangkep dengan objek penelitian keseluruhan desa di
Kabupaten Pangkep. Tahapan analisis data yang dilakukan yaitu melakukan
pengelompokan awal dengan menggunakan Analisis Cluster K-Means, dari beberapa
cluster yang dibentuk selanjutnya akan dilakukan analisis Diskriminan untuk melihat
akurasi pengelompokan. Berdasarkan analisis Diskriman diperoleh 98,06% ( 3
cluster), 94,17% (4 cluster), 91,26% (5 cluster), 94,17% (6 cluster), 86,41% (7
cluster), dan 88,35% (8 cluster). Dari uraian di atas diperoleh bahwa dengan
membentuk pengelompokan dengan 3 cluster, maka hasil akurasi pengelompokan
yang diperoleh lebih baik dari cluster lain yang dibentuk.
Kata Kunci : Analisis Cluster K-Means, Analisis Diskriminan, Kemiskinan

ABSTRACT
This type of research is a study that wants to group the object by using grouping
method k-means cluster as a preliminary grouping of research objects villages based
on variables of the lighter. Variables used as indicator of grouping are education level
(𝑋1 ), population density (𝑋2 ), crude birthrate (𝑋3 ), crude mortality rate (𝑋4 ), average
number of family members (𝑋5 ). Data from library unit of BPS and Civil Registry
Office of Pangkep Regency of South Sulawasi with research result of villages in
Pangkep Regency. The stages of data analysis were performed by preliminary
clustering by using Cluster K-Means analysis, from some clusters that will be
conducted discriminant analysis to see the accuracy of the grouping. Based on the
analysis of discriminant obtained 98,06% (3 clusters), 94,17% (4 clusters), 91,26% (5
clusters), 94,17% (6 clusters), 86,41% (7 clusters), and 88,35% (8 clusters). From the
above description is formed by forming clustering with 3 clusters, then the result of a
better grouping deed of other clusters fotmed.
Keywords : Cluster K-Means Analysis, Discriminant Analysis, Proverty
2

1. PENDAHULUAN penduduk miskin, juga sekaligus


harus bisa mengurangi tingkat
Analisis Multivariat merupakan
kedalaman dan keparahan dari
salah satu metode statistika yang
kemiskinan. Pada penulisan Tugas
tepat untuk meringkas data dengan
Akhir ini, dilakukan suatu penelitian
dengan peubah banyak dengan
mengenai pengelompokan seluruh
berbagai tujuan penelitian yang
desa di Kabupaten Pangkep
beragam (Sitepu, dkk., 2011). Salah
berdasarkan kriteria-kriteria
satu metode analisis multivariat yang
kemiskinan, dengan menggunakan
telah banyak digunakan dan mudah
metode Analisis Cluster K-Means
untuk diinterpretasikan secara
yang slanjutnya akan dilihat tingkat
statistik adalah analisis cluster.
keakuratan pengelompokkan tersebut
Menurut Webb (2002), Analisis
dengan menggunakan metode
Cluster digunakan untuk eksplorasi
analisis diskriminan.
data dan untuk menyediakan data
untuk digunakan dalam 2. KAJIAN LITERATUR
pengclusteran. Analisis Cluster
a. Analisis Multivariat
adalah pengelompokan individu
Analisis Multivariat merupakan
dalam suatu populasi untuk
analisis dimana masalah yang diteliti
menemukan struktur dalam data.
bersifat multidimensional dan
Terkhusus di Sulawesi Selatan, menggunakan tiga atau lebih variabel
salah satu daerah yang menjadi (Kuncoro, 2003:211). Analisis
sorotan focus penanggulangan multivariate dibagi menjadi dua
kemiskinan yaitu di Kabupaten kategori utama yaitu: Pertama
Pangkep, karena memiliki tingkat metode ketergantungan, Ciri dari
persentase kemiskinan yang cukup analisis ini adalah adanya satu atau
tinggi dibandingkan dengan beberapa variabel yang berfungsi
kabupaten lainnya. Kebijakan sebagai dependen dan beberapa
kemiskinan oleh pemerintah variabel lain variabel bebas.
Kabupaten Pangkep, selain harus Beberapa metode beserta tujuannya
mampu memperkecil jumlah yang termasuk ke dalam golongan
3

metode ini adalah: Analisis regresi atau lebih kelompok. Metode ini
Berganda, Analisis Diskriminan mempartisi data ke dalam kelompok
Berganda, Analisis Multivariat sehingga data berkarakteristik sama
Varians, Analisis Korelasi di masukkan ke dalam satu
Kanonikal. Dan ke dua metode kelompok yang sama dan data yang
saling ketergantungan, Ciri dari berkarakteristik berbeda
analisis ini adalah bahwa variabel dikelompokkan ke dalam kelompok
saling berhubungan satu dengan yang lain. Prasetyo (2011). Menurut
yang lainnya sehingga tidak ada (Santosa dalam Ong, 2013:14),
variabel dependen. Beberapa metode langkah-langkah melakukan
beserta tujuannya yang termasuk ke clustering dengan metode K-Means
dalam golongan metode ini adalah: adalah sebagai berikut:
Analisis Faktor, Analisis kelompok, 1. Pilih jumlah cluster k.
Skala Multidimensional. 2. Inisialisasi k pusat cluster ini
b. Analisis Cluster bisa dilakukan dengan berbagai
Analisis cluster merupakan teknik cara. Namun yang paling sering
multivariate yang mempunyai tujuan dilakukan adalah dengan cara
utama untuk mengelompokkan objek- random. Pusat-pusat cluster
objek berdasarkan karakteristik yang diberiduberi nilai awal dengan
dimilikinya. Proses cluster atau angka-angka random,
pengelompokan data bias dilakukan 3. Alokasikan semua data ke
dengan dua metode yaitu metode centroid terdekat dengan metric
hierarki dan metode non hierarki jarak yang sudah deitetapkan.
c. Analisis Cluster K-Means Untuk menghiutng jarak semua
Metode K-Means pertama kali data ke setiap tiitk pusat cluster
diperkenalkan oleh MecQueen JB dapat menggunakan beberapa
pada tahun 1976. K-Means teori jarak seperti Euclidean,
merupakan salah satu metode Squared Euclidean
pengelompikan data nonhierarki Distance,Chebychev dan
(sekatan) yang beruaha mempartisi Manhattan/City block.
data yang ada kedalam bentuk dua
4

4. Hitung kembali centroid C dilibatkan lebih dari dua, pada


berdasarkan data yang mengikuti umumnya diperlukan lebih dari satu
cluster masing-masing fungsi diskriminan untuk
5. Tugaskan lagi setiap objek pegelompokan objek-objek tersebut.
memakai pusat cluster yang Arif, Sukarna, Aswi (2010).
baru. Jika pusat cluster tidak Menurut Simamora dalam Irwan
berubah lagi maka proses (2010), analisis Diskriminan terdiri
clustering selesai. Atau, kembali dari lima tahap, yaitu: (1)
ke langkah nomor 3 sampai merumuskan masalah, (2)
pusat cluster tidak berubah lagi mengestimasi koefisien fungsi
d. Analisis Diskriminan Diskriminan, (3) memastikan
Analisis Diskriminan merupakan signifikansi determinan, (4)
metode statistika untuk menginterpretasi hasil, dan (5)
mengelompokkan sejumlah objek ke menguji signifikansi analisis
dalam sejumlah kelompok Diskriminan.
berdasarkan beberapa peubah yang e. Kemiskinan dan Desa Miskin
membentuk fungsi diskriminan, Miskin adalah suatu keadaan
sedemikian sehingga setiap objek seseorang yang mengalami
menjadi anggota dari salah satu kekurangan atau tidak mampu
kelompok. Tujuan analisis memenuhi tingkat hidup yang paling
diskriminan pada dasarnya untuk rendah serta tidak mampu mencapai
mengetahu peubah yang dapat tingkat minimal dati tujuan-tujuan
membedakan anggota populasi. yang telah ditetapkan.
Analisis ini dilakukan dengan Pengertian Desa Miskin adalah
membentuk kombinasi linear dari daerah Kabupaten yang masyarakat
sejumlah peubah, sehingga nilai serta wilayahnya relatif kurang
diskriminan dari setiap objek yang berkembang dibandingkan daerah
terlhat merupakan petunjuk pada lain dalam skala nasional. Suatu
objek tersebut untuk menjadi daerah dikategorikan sebagai daerah
anggota pada satu kelompok tertentu. tertinggal, karena beberapa faktor
Apabila banyaknya kelompok yang penyebab, antara lain.
5

3. METODE PENELITIAN 2. Melakukan pengujian asumsi

Data yang digunakan dalam terhadap variabel sesuai

penelitian adalah data sekunder berdasarkan teori dari metode

berupa dokumentasi tertulis dan yang digunakan.

identifikasi variabel yang digunakan 3. Melakukan analisis statistika


tentang wilayah/desa yang diperoleh deskriptif untuk mengetahui
dari unit Perpustakaan BPS dan karakteristik kondisi
Catatan Sipil Kabupaten Pangkep desa/kelurahan miskin.
Sulawsi Selatan pada tahun 2017.
4. Melakukan pengclusteran
Dat yang digunakan dalam penelitian
desa/kelurahan miskin dengan
ini berupa dokumentasi tertulis dan
menggunakan Analisis Cluster
identifikasi peubah yang digunakan
K-Means.
tentang desa/kelurahan di kabupaten
5. Menghitung
Pangkep Sulawesi Selatan Tahun
ketepatan/keakuratan cluster
2017 yaitu : X1 (tingkat pendidikan
dengan menggunakan Analisis
), X2 (kepadatan penduduk per km2
Diskriminan
), X3 (angka kelahiran kasar), X4
(angka kematian kasar), X5 (rata-rata 6. Membuat kesimpulan dan saran
banyaknya anggota keluarga.
Langkah-langkah yang dilakukan 4. HASIL DAN PEMBAHASAN

pada penelitian ini adalah sebagai a. Analisis Deskriptif


Tabel 4.1. Statistik Deskriptif 103
berikut:
Desa di Kabupatan Pangkep
1. Melakukan pengumpulan data

Minimum Maksimum Rerata Simpangan


Baku
SD (Banyaknya siswa) 109 1589 516,14 258,12
SMP (Banyaknya Siswa) 14 1395 387,84 263,60
SMA (Banyaknya Siswa) 14 3794 538,25 570,08
Kepadatan Penduduk (/km2) 0,70 5576 491,73 691,45
Kelahiran (/tahun) 00 12 6,59 2,72
Kematian (tahun) 00 20 2,35 3,62
Anggota Rumah tangga 177 2568 720,90 359,70
6

b. Pembentukan Cluster yang selanjutnya cluster yang


Dalam penelitian ini memiliki akurasi terbaik akan
dilakukan peng-cluster-an dengan digunakan sebagai pengekompokan
menggunakan metode analisis cluster awal desa miskin di Kabupaten
K-means, dimana metode pada Pangkep. Penentuan akurasi cluster
penelitian ini tidak ditentukan jumlah ini dengan menggunakan metode
cluster yang akan dibentuk untuk analisis diskiriman. Adapun rumus
menentukan pengelompokan awal untuk menentukan Akurasi Analisis
desa berada dalam kategori miskin. Diskriminan menurut Dillon (1984) :
c. Akurasi Cluster Terbentuk [ 𝑁−(𝑛𝑘)]2
Press’s Q = 𝑁(𝑘−1)
Hasil pengelompokan dari
Analisis Cluster K-Means Ket : N = ukuran sampel
memberikan hasil kelompok ysng n = jumlah kasus yang
terbentuk dari penelitian desa miskin diklasifikasikan secara tepat
dengan beberapa variabel. Akan tetapi
k = jumlah grup atau kelompok
pengelompokan analisis cluster k-
means tidak memberikan hasil akurasi Tabel 4.15. Akurasi masing-masing
kelompok. Berdasarkan hasil Cluster berasarkan nilai Q
pengelompokan awal dari Analisis
Cluster Akurasi %
Cluster K-Means maka digunakan
3 Cluster 98,06
analisis diskriminan untuk
4 Cluster 94,17
memperjelas batas-batas
5 Cluster 91,26
pengelompokan.
6 Cluster 94,17
7 Cluster 86,41
8 Cluster 88,35

d. Penentuan Cluster Terbaik Berdasarkan hasil akurasi pada


table 4.15 di atas dapat dijelaskan
Pada bagian ini akan ditentukan
bahwa pada 3 cluster terbentuk
cluster yang memiliki akurasi
memiliki akurasi 98,06% ketepatan
ketepatan pengelompokan terbaik,
7

pengelompokan. Pada 4 cluster dan pengelompokan yang diperoleh


6 cluster yang terbentuk memiliki adalah 88,35%. jadi, jumlah cluster
akurasi 94,17% ketepatan yang memiliki akurasi terbaik adalah
pengelompokan. Adapun akurasi 3 cluster yang terbentuk dengan
ketepatan pengelompokan dari 5 akurasi pengelompokan 98,06%.
cluster yang terbentuk adalah
Berikut adalah wilayah-wilayah
91,26%. Untuk 7 cluster yang
yang termasuk dalam anggota 3
terbentuk akurasi yang diperoleh
cluster yang terbentuk:
adalah 86,41% dan pada 8 cluster
yang terbentuk akurasi Tabel 4.16. Anggota dari
Cluster Terbaik

No. Jumlah Anggota (Desa/Kelurahan)


Anggota
1 34 Pabbundukang, Anrong Appaka, Sibatua, Bonto Perak,
Balleangin, Tonasa, Kel. Kassi, Kel. Bori Appaka, Kel.
Sapanang, Bowong Cindea, Tabo-tabo, Mangilu, Bulu
Cindea, Biring Ere, Labbakkang, Mangallekana, Pundata
Baji, Borimasunggu, Taraweang, Bara Batu, Bonto-Bonto,
Talaka, Ma'rang, Attang Salo, Padang Lampe, Bonto Matene,
Segeri, Minasa Te'ne, Kalabbirang, Biraeng, Bonto Kio,
Bontoa, Bonto Langkasa, Kabba
2 59 Sapuka, Sabaru, Balobaloang, Sabalana, Tampaang,
Sailus, Kapoposang Bali, Poleonro, Kalu-Kalukuang,
Pammas, Sabaru, Kanyurang, Doang-duangang Lompo,
Marasende, Dewakang, Mattiro Sompe, Mattiro Bintang,
Mattiro deceng, Mattiro langi, Mattiro Ujung, Mattiro
Dolangeng, Mattiro Bone, Mattiro Adae, Tekolabbua,
Balocci Baru, Pattallassang, Manakku, Gentung,
Kanaungan, Bonto Manai, Kassiloe, Tamangapa,
Pitusunggu, Pitue, Punranga, Alesipitto, Bone, Bawasolo,
Baring, Parenreng, Panaikang, Benteng, Manggalung,
Tamarupa, mandalle, Boddie, Coppo Tompong,
Bantimurung, Tondongkura, Lanne, Bulu Tellue, Malaka,
Bonto Birao, Mattiro Kanja, Mattiro Baji, Mattiro Bulu,
Mattiro Labangeng, Mattiro Uleng Mattiro Walie
3 10 Satanger, Mattiro Matae, Jagong, Mappasaile, Paddoang-
doangan, Tumampua, Tompo Bulu, Samalewa, Batara,
Mattiro Bombang
8

5. KESIMPULAN Budhiantoro, S.,Viktoria, F., Wiko,


Berdasarkan uraian pada bab S., Ah, M. Dan Dwi R.,P.,A.
(2013). Multidimensional
sebelumnya berdasarkan metode Fuzzy Proverty Index (MPI):
yang digunakan yakni cluster k- Konsep dan Pengukurannya
di Indonesia. PRAKARSA
means, maka dibentuk beberapa Economics Policy Working
cluster yang akan digunakan dalam Paper.
BPS. (2016). Statistik Kemiskinan di
Indonesia. Jakarta. Badan
membentuk kelompok awal yang Pusat Statistik
mendiskripsikan miskin di Dian, Podje, L., & Saleh. (2015).
kabupaten pangkep yakni 3 cluster, 4 Analisis Diskriminan Pada
Klasifikasi Nasabah
cluster, 5 cluster, 6 cluster, 7 cluster Menunggak Dan Tidak
dan 8 cluster. Dari beberapa cluster Menunggak Dengan Cross
Validation. Jurnal Statistika,
yang dibentuk selanjutnya akan
1-10.
dilakukan analisis diskriminan untuk
Ediyanto, Mara, M. N., & Hadewi,
melihat akurasi pengelompokan. N.S.(201). Pengklasifikasian
Berdasarkan analisis diskriman Karakteristik dengan Metode
K-Means Cluster
diperoleh 98,06% ( 3 cluster), Analysis. Buletin Ilmiah
94,17% (4 cluster), 91,26% (5 Mat.Stat. dan Terapannya,
133-136.
cluster), 94,17% (6 cluster), 86,41%
Febriyana. (2011). Analisis
(7 cluster), dan 88,35% (8 cluster). Diskriminan K-Means dan K-
Dari uraian di atas diperoleh bahwa Median pada Data Indikator
Kemiskinan (Studi Kasus
dengan membentuk pengelompokan data Indikator kemiskinan
dengan 3 cluster yang terbentuk, Kabupaten di Indonesia
Tahun 2009). Jakarta.
maka hasil akurasi pengelompokan Skripsi. Universitas Islam
yang diperlolah lebih baik dari Negeri Syarif Hidayatullah.
cluster lain yang dibentuk. Hastuti, N. F. (2013). Pemanfaatan
Metode K-Means Clustering
dalam Penentuan
REFERENSI Penerimaan Beasiswa.
Agusta, Y. (2007). K-Means – Surakarta. Skripsi. FMIPA
Penerapan, Permasalahan Universitas Sebelas Maret.
dan Metode Terkait. Jurnal
Sistem dan Informatika,47-60 Irwan. (2010). Penggunaan Analisis
Diskriminan dan Self-
9

Organizing Maps (SOM) Clustering untuk Menentukan


dalam Pengelompokan Objek Stategi Merketing President
(Studi Pengelompokan Desa University. Jurnal Ilmiah
Miskin di Kabupaten Wajo). Teknik Industri, 10-20.
Makassar. Skripsi. FMIPA
Universtas Negeri Makassar. Prasetyo, E. (n.d.). Data Mining
(Konsep dan Aplikasi
Kristanto, N. H., L.A, A. C., & S, H. Menggunakan MATLAB.
B. (2016). Implementasi K- Andi Yogyakarta.
Means Clustering untuk
Pengelompokan Analisis Sitepu, R., Irmeilyana, & Gultom, B.
Rasio Profitabilitas dalam (2011). Analisis Cluster
working Capitaal. Juisi , 9- terhadap Tingkat
15. Pencemaran Industri di
Sumatra Selatan. Jurnal
Kuncoro, M. 2003. Metode Riset Penelitian Sains , 3.
Untuk Bisnis dan Ekonomi.
Jakarta : Erlangga Tiro, M. A., Sukarna, & Aswi.
(2010). Statistika Deskriptif
Laeli, S. (2014). Analisis Cluster Peubah Banyak. Makassar:
dengn Average Linkage Method Andira Publisher, Makassar
Linkage dan Ward's Method untuk
Data Responden Nasabah Asuransi Weeb, A.R., (2002). Statistical
Jiwa Unit Link. Statistika Pattern Recognition Second
Edition, John Wiley and
Laraswati, T. F.(2014).Perbandingan Sons Ltd England.
Kinerja Metode Complete
Linkage, Metode Average Yulianto, S., & Hidayatullah, K. H.
Linkage , dan Metode K- (2014). Analisis Klaster
Means dalam Menentukan Untuk Pengelompokan
Hasil Analisis Cluster. Kabupaten/Kota di Provinsi
Statistika. Jawa Tengah Berdasarkan
Indikator Kesejahteraan
Ong, J. O. (2013). Implementasi Rakyat.JurnalStatistika,56-63
Algoritma K-Means

Anda mungkin juga menyukai