JURUSAN SIPIL
FAKULTAS TEKNIK
UNIVERSITAS TANJUNGPURA
BAB I
PENDAHULUAN
Analisis cluster merupakan teknik multivariat yang mempunyai tujuan utama untuk
mengelompokkan objek berdasarkan karakteristik yang dimilikinya. Analisis cluster
mengklasifikasi objek sehingga setiap objek yang paling dekat kesamaannya dengan objek lain
berada dalam cluster yang sama. Cluster-cluster yang terbentuk memiliki homogenitas internal
yang tinggi dan heterogenitas eksternal yang tinggi. Berbeda dengan teknik multivariat lainnya,
analisis ini tidak mengestimasi set vaiabel secara empiris sebaliknya menggunakan setvariabel
yang ditentukan oleh peneliti itu sendiri. Fokus dari analisis cluster adlah membandingkan objek
berdasarkan set variabel, hal inilah yang menyebabkan para ahli mendefinisikan set variabel
sebagai tahap kritis dalam analisis cluster. Set variabel cluster adalah suatu set variabel yang
merpresentasikan karakteristik yang dipakai objek-objek. Bedanya dengan analisis faktor adalah
bahwa analisis cluster terfokus pada pengelompokan objek sedangkan analisis faktor terfokus
pada kelompok variabel.
Solusi analisis cluster bersifat tidak unik, anggota cluster untuk tiap penyelesaian/solusi
tergantung pada beberapa elemen prosedur dan beberapa solusi yang berbeda dapat diperoleh
dengan mengubah satu elemen atau lebih. Solusi cluster secara keseluruhan bergantung pada
variabel-variaabel yang digunakan sebagai dasar untuk menilai kesamaan. Penambahan atau
pengurangan variabel-variabel yang relevan dapat mempengaruhi substansi hasi analisisi cluster.
Rumusan Masalah memiliki peran penting di dalam sebuah penelitian karya ilmiah,
dalam penelitian ini akan membahas “Metode Analisis Cluster, Pertumbuhan Ekonomi
Kabupaten/Kota di Provinsi Kalimantan Barat”. Adapun permasalahan yang akan dikemukakan
dalam penulisan ini adalah melihat pengaruh pertumbuhan ekonomi terhadap potensi antar
Kabupaten/Kota yang ada di Provinsi Kalimantan Barat.
BAB II
PEMBAHASAN
Metode Hirarki, Metode ini memulai peneglompokan dengan dua atau lebih obyek yang
mempunyai kesamaan paling dekat. Kemudian diteruskan pada obyek yang lain dan
seterusnya hingga cluster akan memebentuk semacam pohon, dimana terdapat tingkatan
(hirarki) yang jelas antar obyek, dari yang paling mirip hingga yang paling tidak mirip.
Alat yang membantu untuk memperjelas proses hirarki ini disebut dendogram.
Metode Non-Hirarki, Metode ini dimulai dengan menentukan terlebih dahulu jumlah
cluster yang di inginkan. Setelah jumlah cluster ditentukan, maka proses cluster
dilakukan dengan tanpa mengikuti proses hirarki. Metode ini biasa disebut K-Means
Cluster.
Tahap 1 :
Mengukur kesamaan antar objek (similarity). Sesuai prinsip analisis cluster yang
mengelompokkan objek yang mempunyai kemiripan, proses pertama adalah mengukur
seberapa jauh ada kesamaan antar objek. Metode yang digunakan:
Tahap 2 :
Non-Hirarchial Methode
Berbeda dengan metode hirarki, metode ini justru dimulai dengan terlebih dahulu jumlah
cluster yang diinginkan (dua cluster, tiga cluster atau yang lain). Setelah jumlah cluster
diketahui, baru proses cluster dilakukan tanpa mengikuti proses hirarki. Metode ini biasa
disebut dengan K-Means Cluster.
Kebalikan dari metode hirarki, metode non-hirarki menempatkan objek-objek ke dalam
cluster sekaligus sehingga terbentuk sejumlah cluster tertentu. Langkah pertama adalah
memilih sebuah cluster sebagai inisial cluster pusat, dan semua objek dalam jarak tertentu
ditempatkan pada cluster yang terbentuk. Kemudian memilih cluster selanjutnya dan
penempatan dilanjutkan sampai semua objek ditempatkan. Objek-objek bisa ditempatkan
lagi jika jaraknya lebih dekat pada cluster lain daripada cluster asalnya.
Tahap 3 :
Melakukan validasi dan profiling cluster. Cluster yang terbentuk kemudian diuji apakah
hasil tersebut valid. Kemudian dilakukan proses profiling untuk menjelaskan karakteristik setiap
cluster berdasarkan profil tertentu (seperti usia konsumen pembeli rumah, tingkat
penghasilannya dan sebagainya). Analisis cluster agak bersifat subjektif dalam penentuan
penyelesaian cluster yang optimal, sehingga peneliti seharusnya memberikan perhatian yang
besar mengenai validasi dan jaminan tingkat signifikansi pada penyelesaian akhir dari cluster.
Validasi termasuk usaha yang dilakukan oleh peneliti untuk menjamin bahwa hasil
cluster adalah representatif terhadap populasi secara umum, dan dengan demikian dapat
digeneralisasi untuk objek yang lain dan stabil untuk waktu tertentu. Pendekatan
langsung dalam hal ini adalah dengan analisis sample secara terpisah kemudian
membandingkan antara hasil cluster dengan perkiraan masing-masing cluster. Pendekatan
ini sering tidak praktis, karena adanya keterbatasan waktu dan biaya atau objek untuk
perkalian analisis cluster. Dalam hal ini pendekatan yang biasa digunakan adalah dengan
membagi sample menjadi dua kelompok. Masing-masing dianalisis cluster secara
terpisah, kemudian hasilnya dibandingkan.
Tahap Profiling meliputi penggambaran karakteristik masing- masing cluster untuk
menjelaskan bagaimana mereka bisa berbeda secara relevan pada tiap dimensi. Tipe ini
meliputi penggunaan analisis diskriminan. Prosedur dimulai setelah cluster ditentukan.
Melihat kesamaan karakteristik potensi yang dimiliki antar wilayah satu dengan yang
lainnya dengan mudah dan berpola
Hasil dari analisis cluster dipengaruhi oleh obyek yang diclusterkan, peubah yang diamati,
ukuran kemiripan (jarak) antar Kabupaten/Kota.
BAB III
HASIL ANALISIS
Untuk itu dapat dilihat pada tampilan data dalam SPSS dibawah ini :
Sumber : BPS Provinsi Kalimantan Barat, 2014
Untuk menyelesaikan contoh kasus diatas dengan aplikasi program SPSS ,perlu dilakukan
beberapa proses.
Descriptive Statistics
Data diatas digunakan sebagai dasar perhitungan z-score yang diperoleh. Kemudian akan muncul
tabel dari tampilan data view seperti berikut :
Selanjutnya akan dilakukan metode non-hirarki dengan k-means cluster.
Cluster
1 2 3
Tabel diatas merupakan tampilan pertama proses clustering data sebelum dilakukan iterasi.
Untuk mendeteksi berapa kali proses iterasi yang dilakukan dalam proses clustering dari 14
obyek yang diteliti, dapat dilihat pada tampilan output berikut ini :
Iteration Historya
1 2 3
Dari tabel dapat terlihat akan dilakukan melalui 3 tahapan iterasi untuk mendapatkan cluster
yang tepat. Dari tabel dapat terlihat bahwa jarak minimum antar pusat cluster yang terjadi dari
hasil iterasi adalah 4,342. Adapun hasil akhir dari proses clustering yaitu :
Cluster
1 2 3
Output final cluster centers tersebut masih terkait dengan proses strandardiasi data sebelumnya,
yang mengacu pada z-score dengan ketentuan :
Nilai negative (-) berarti data dibawah rata-rata total.
Nilai positif (+) berarti data berada di atas rata-rata total.
Dari tabel output final cluster centers, dengan ketentuan yang telah ditentukan maka :
Cluster 1
Pada cluster 1 berisikan kota-kota yang memiliki jumlah pertumbuhan ekonomi dan jumlah dana
hibah yang lebih dari rata-rata populasi kota yang diteliti. Hal ini terbukti dari nilai positif (+)
yang terdapat pada tabel output dalam keseluruhan variabel. Dengan demikian, dapat diprediksi
bahwa cluster 1 merupakan pengelompokan dari Kabupaten/Kota dengan pertumbuhan sedang.
Cluster 2
Pada cluster 2 berisikan kota-kota yang memiliki jumlah PDRB, jumlah pertumbuhan ekonomi,
jumlah dana hibah, jumlah konsumsi pemerintah, dan jumlah penduduk yang kurang dari rata-
rata populasi kota yang diteliti. Hal ini terbukti dari nilai positif (-) yang terdapat pada tabel
output dalam keseluruhan variabel. Dengan demikian, dapat diprediksi bahwa cluster 2
merupakan pengelompokan dari Kabupaten/Kota dengan pertumbuhan rendah.
Cluster 3
Pada cluster 3 berisikan kota-kota yang memiliki jumlah PDRB, jumlah pertumbuhan ekonomi,
jumlah konsumsi pemerintah, dan jumlah penduduk yang lebih dari rata-rata populasi kota yang
diteliti. Hal ini terbukti dari nilai positif (+) yang terdapat pada tabel output dalam keseluruhan
variabel. Dengan demikian, dapat diprediksi bahwa cluster 3 merupakan pengelompokan dari
Kabupaten/Kota dengan pertumbuhan tinggi.
Selanjutnya, melihat perbedaan variabel pada cluster yang terbentuk. Ini dapat terlihat dari nilai
F dan nilai probabilitas (sig) masing-masing variabel, seperti dibawah ini :
ANOVA
Cluster Error
The F tests should be used only for descriptive purposes because the clusters have been chosen to maximize the differences among cases in
different clusters. The observed significance levels are not corrected for this and thus cannot be interpreted as tests of the hypothesis that the
cluster means are equal.
Dimana dalam tabel diatas, MS Between ditunjukkan oleh mean square kolom cluster ,
sedangkan MS Within ditunjukkan oleh means square kolom error.
Semakin besar nilai F dan (sig < 0,05), maka semakin besar perbedaan variabel pada cluster yang
terbentuk
Dengan demikian hasil cluster yang di dapat dalam penelitian ini bahwa instrument jumlah
pendapatan kota yang paling menunjukkan perbedaaan diantara kota-kota pada ketiga cluster
yang terbentuk, yang ditunjukkan nilai F = 19,441 dan sig = 0,000 dan seterusnya.Selanjutnya
untuk mengetahui jumlah anggota masing-masing cluster yang terbentuk dapat terlihat pada tabel
output berikut ini :
Cluster 1 9.000
2 1.000
3 4.000
Valid 14.000
Missing .000
Dari tabel dapat terlihat bahwa cluster 1 beranggotakan 9 kota, cluster 2 berisi 1 kota, dan cluster
3 terdapat 4 kota yang mengelompok. Dan untuk mengetahui kota-kota mana saja yang termasuk
dalam kategori tiap cluster dapat kembali dilihat tampilan data view pada kolom terakhir berikut
ini :
Dari tabel qcl_1 merupakan nomor keberadaan cluster dan tabel qcl_2 merupakan jarak antara
obyek dengan pusat cluster, dapat terlihat pemaparan dibawah ini :
Cluster 1 :
Cluster 2 berisikan :
1) Kabupaten Pontianak - 0
Cluster 3 :
BAB IV
PENUTUP
4.1 Kesimpulan
Jadi, dapat disimpulkan bahwa dari 3 pengelompokan (cluster) terdapat beberapa kota
yang memiliki kesamaan karakteristik terhadap potensi pertumbuhan ekonomi Kabupaten/Kota
yaitu pada cluster 3 (Pertumbuhan Tinggi) yang berisikan 4 kota beserta jarak antara obyek satu
dengan yang lainnya, sebagai berikut berisikan Kab. Sanggau – 1.06525, Kab. Kapuas Hulu –
1.43681, Kota Singkawang – 2.46413, Kota Pontianak – 1.77222 , cluster 1 (Pertumbuhan
Sedang) yang berisikan 9 kota beserta jarak antara obyek satu dengan yang lainnya, sebagai
berikut berisikan Kab. Sambas – 2.22907, Kab. Bengkayang – 1.40761, Kab. Landak – 1.25380,
Kab. Ketapang – 1.87681, Kab. Sintang – 1.61990, Kab.Sekadau – 1.58393, Kab. Melawi –
1.45735, Kab. Kayong Utara – 2.60799, Kab. Kubu Raya – 2.46413, dan cluster 2 (Pertumbuhan
Rendah) yang berisikan 1 kota beserta jarak antara obyek satu dengan yang lainnya yaitu
Kabupaten Pontianak – 0.
4.2 Rekomendasi
Berhubungan dengan Perencanaan Wilayah dan Kota, Metode Analisis Cluster dapat
digunakan dalam mengelompokkan kesamaan karakteristik potensi pertumbuhan tinggi,
pertumbuhan sedang, dan pertumbuhan rendah yang dimiliki antar Kabupaten/Kota di Provinsi
Kalimantan Barat.
DAFTAR PUSTAKA
__-https://naufalmti.files.wordpress.com/2010/07/modul-cluster.pdf Statistikian.2014.Analisis
Cluster. Diunduh tanggal 28 Mei 2015