Tujuan dari Analisis Cluster adalah mengelompokkan obyek berdasarkan kesamaan karakteristik
di antara obyek-obyek tersebut. Dengan demikian, ciri-ciri suatu cluster yang baik yaitu memiliki:
• Homogenitas internal (within cluster) yaitu kesamaan antar anggota dalam satu cluster
• Heterogenitas eksternal (between cluster) yaitu perbedaan antara cluster yang satu dengan
cluster yang lain.
Pada analisis cluster, data mentah diubah ke dalam matriks similarity, selanjutnya dirumuskan
formasi kelompok dengan prinsip variasi dalam kelompok lebih kecil daripada variasi antar
kelompok.
Data Mentah
Matriks Similarity Formasi Kelompok
Obyek vs. Variabel
• Metode Non-Hirarki
Rl(i),l = −
n (l ) +1 n l ( I ) −1
IV. Pengolahan Data dan Analisis
Pada bagian ini akan dibahas contoh kasus, tujuan dari pengolahan, dan tahapan analisis.
Contoh kasus:
Provinsi Jawa Barat yang merupakan provinsi dengan jumlah penduduk terbesar di Indonesia.
Setiap daerah memiliki kewajiban untuk menyediakan pelayanan pendidikan dan kesehatan.
Pembangunan bidang kesehatan dan pendidikan bertujuan agar semua lapisan masyarakat dapat
meperoleh pelayanan kesehatan dan pendidikan secara mudah dan merata. Selain fasilitas
kesehatan skala kecamatan dan kota/kabupaten, diperlukan juga pengembangan sarana dan
prasarana maupun program di sektor kesehatan dan pendidikan yang melayani beberapa
kota/kabupaten. Oleh karena itu, Pemprov Jawa Barat ingin merancang kebijakan terkait
pelayanan kesehatan dan pendidikan. Untuk efektivitas dan efisiensi kebijakan tersebut tidak
dimungkinkan membuat kebijakan khusus untuk setiap kota/kabupaten sehingga perlu adanya
pengelompokkan kota/kabupaten menjadi 5 kelompok berdasarkan karakteristik yang dimilikinya
menggunakan data yang tertera pada Tabel 1.
1) Merumuskan Masalah
Masalah yang akan diteliti adalah sebagai berikut.
• Berapa kluster yang terbentuk?
• Bagaimana karakteristik setiap kluster berdasarkan variabel penentunya?
• Bagaimana interpretasi pembentukan kluster tersebut dalam konteks
perencanaan wilayah dan kota?
2) Memasukkan Data pada Stata
Klik “Data Editor” pada toolbar. Input data yang dimasukkan adalah data terkait
derajat Provinsi Jawa Barat seperti yang tercantum pada Gambar 1.
Gambar 1. Tampilan Data Editor
Dalam analisis cluster terdapat dua metode yang dapat digunakan yaitu metode hirarkis
dan non-hirarkis. Pada studi kasus kali ini yang digunakan adalah metode hirarki dengan
metode single linkage, average linkage, dan complete linkage serta metode non-hirarkis
dengan metode K-means dimana belum ada jumlah kelompok yang ditetapkan sehingga
jumlah kelompok baru akan didapatkan setelah analisis dengan STATA dilakukan.
a. Single Linkage
• Untuk menganalisis cluster menggunakan metode single linkage, gunakan
command: cluster singlelinkage $sarana, name(singleclus). Dengan
command tersebut, akan terbentuk cluster bernama ‘singleclus’ dan tiga
variabel baru di tabel data yaitu singleclus_id, singleclus_ord,
singleclus_hgt.
• Untuk melihat komponen dari tiap cluster dapat digunakan command:
cluster generate clus=groups(5), name(singleclus) yang nantinya
membentuk variabel baru bernama ‘clus’ yang berisikan pembagian
obyek-obyek ke dalam 5 komponen cluster.
• Masukkan command: tabstat $sarana, by(clus) stat(min mean max) untuk
melihat karakteristik dari tiap cluster yang terbentuk.
800 600
L2 dissimilarity measure
200 4000
1 4 5 2 3 9 16 6 12 15 17 21 13 7 8 10 11 23 14 19 24 26 18 22 20 25 27
Nilai ini menunjukan rasio variansi between cluster (antara kelompok yang
satu dengan yg lainnya) dan within cluster (di dalam kelompoknya sendiri).
Semakin besar nilai Cali ́nski–Harabasz pseudo-F maka semakin tinggi
perbedaan antar kelompok dan semakin tinggi kemiripan objek di dalam
satu kelompoknya. Pada praktikum ini, cluster yang paling jelas terbentuk
saat berjumlah 15. Namun, jumlah kelompok yang terlalu banyak menjadi
tidak efektif. Sehingga yang diambil adalah 5 kelompok sesuai kebutuhan.
Maka, bandingkan nilai pesudo-F dengan 5 kelompok menggunakan teknik
single linkage, average linkage, dan complete linkage.
• Untuk analisis stopping rules dengan Duda–Hart Je(2)/Je(1) dapat
menggunakan command: cluster stop singleclus, rule(duda)
Dengan stopping rules ini, semakin besar nilai Je(2)/Je(1) dan semakin kecil
nilai pseudo T-squared maka semakin jelas perbedaan antar cluster-nya.
b. Average Linkage
• Untuk menganalisis cluster menggunakan metode average linkage,
gunakan command: cluster averagelinkage $sarana, name(averageclus).
Dengan command tersebut, akan terbentuk tiga variabel baru di tabel data
yaitu averageclus_id, averageclus_ord, averageclus_hgt.
• Untuk melihat komponen dari tiap cluster dapat digunakan command:
cluster generate clus2=groups(5), name(averageclus) yang nantinya
membentuk variabel baru bernama ‘clus2’ yang berisikan pembagian
obyek-obyek ke dalam 5 komponen cluster.
• Masukkan command: tabstat $sarana, by(clus2) stat(min mean max) untuk
melihat karakteristik dari tiap cluster yang terbentuk.
Gambar di atas menunjukkan karakteristik berupa nilai minimum, nilai
maksimum dan rata-rata tiap variabel pada tiap cluster yang terbentuk.
• Untuk melihat dendogram1 yang terbentuk dari cluster tersebut,
gunakan command: cluster dendrogram averageclus.
1 4 5 2 3 6 12 15 17 9 16 7 11 8 10 23 13 21 14 19 24 26 18 20 25 22 27
1
Menggambarkan proses pembentukan cluster yang dinyatakan dalam bentuk diagram pohon. Data yang mirip akan terletak pada
hirarki yang berdekatan.
Nilai ini menunjukan rasio variansi between cluster (antara kelompok yang
satu dengan yg lainnya) dan within cluster (di dalam kelompoknya sendiri).
Semakin besar nilai Cali ́nski–Harabasz pseudo-F maka semakin tinggi
perbedaan antar kelompok dan semakin tinggi kemiripan objek di dalam
satu kelompoknya. Pada praktikum ini, cluster yang paling jelas terbentuk
saat berjumlah 10. Namun, jumlah kelompok yang terlalu banyak menjadi
tidak efektif. Sehingga yang diambil adalah 5 kelompok sesuai kebutuhan.
Maka, bandingkan nilai pesudo-F dengan 5 kelompok menggunakan teknik
single linkage, average linkage, dan complete linkage.
• Untuk analisis stopping rules dengan Duda–Hart Je(2)/Je(1) dapat
menggunakan command: cluster stop averageclus, rule(duda)
Dengan stopping rules ini, semakin besar nilai Je(2)/Je(1) dan semakin kecil
nilai pseudo T-squared maka semakin jelas perbedaan antar cluster-nya.
c. Complete Linkage
• Untuk menganalisis cluster menggunakan metode single linkage, gunakan
command: cluster completelinkage $sarana, name(compclus). Dengan
command tersebut, akan terbentuk tiga variabel baru di tabel data yaitu
compclus_id, compclus_ord, compclus_hgt.
• Untuk melihat komponen dari tiap cluster dapat digunakan command:
cluster generate clus3=groups(5), name(compclus) yang nantinya
membentuk variabel baru bernama ‘clus3’ yang berisikan pembagian
obyek-obyek ke dalam 5 komponen cluster.
• Masukkan command: tabstat $sarana, by(clus3) stat(min mean max) untuk
melihat karakteristik dari tiap cluster yang terbentuk.
Gambar di atas menunjukkan karakteristik berupa nilai minimum, nilai
maksimum dan rata-rata tiap variabel pada tiap cluster yang terbentuk.
1 4 5 2 3 6 9 16 12 15 17 7 11 8 10 23 13 21 14 19 24 26 18 20 25 22 27
Nilai ini menunjukan rasio variansi between cluster (antara kelompok yang
satu dengan yg lainnya) dan within cluster (di dalam kelompoknya sendiri).
Semakin besar nilai Cali ́nski–Harabasz pseudo-F maka semakin tinggi
perbedaan antar kelompok dan semakin tinggi kemiripan objek di dalam
satu kelompoknya. Pada praktikum ini, cluster yang paling jelas terbentuk
saat berjumlah 9. Namun, jumlah kelompok yang terlalu banyak menjadi
tidak efektif. Sehingga yang diambil adalah 5 kelompok sesuai kebutuhan.
Maka, bandingkan nilai pesudo-F dengan 5 kelompok menggunakan teknik
single linkage, average linkage, dan complete linkage.
d. K-Means
1. Untuk menganalisis cluster menggunakan metode pengelompokan K-Means,
gunakan command: cluster kmeans $sarana, k(5) name(kcluster). Dari
command tersebut akan muncul variabel baru yaitu ‘kcluster’ sesuai dengan
jumlah cluster yang telah ditentukan yaitu 5 pada praktikum ini.
2. Masukkan command: tabstat $sarana, by(kcluster) stat(min mean max) untuk
melihat karakteristik dari tiap cluster yang terbentuk.
Gambar di atas menunjukkan karakteristik berupa nilai minimum, nilai
maksimum dan rata-rata tiap variabel pada tiap cluster yang terbentuk.
Berikut adalah hasil dari analisis cluster yang telah dilakukan dengan data yang
ada.
Cluster
Kabupaten/Kota Average Complete
Single Linkage K-Means
Linkage Linkage
Bogor 1 1 1 1
Sukabumi 3 3 2 1
Cianjur 4 3 2 5
Bandung 2 2 1 1
Garut 2 2 1 1
Tasikmalaya 4 4 3 5
Ciamis 4 4 4 4
Kuningan 4 4 4 4
Cirebon 4 4 3 5
Majalengka 4 4 4 4
Sumedang 4 4 4 4
Indramayu 4 4 3 5
Subang 4 4 4 4
Purwakarta 5 5 5 3
Karawang 4 4 3 5
Bekasi 4 4 3 5
Bandung Barat 4 4 3 5
Pangandaran 5 5 5 2
Kota Bogor 5 5 5 3
Kota Sukabumi 5 5 5 2
Kota Bandung 4 4 4 4
Kota Cirebon 5 5 5 2
Kota Bekasi 4 4 4 4
Kota Depok 5 5 5 3
Kota Cimahi 5 5 5 2
Kota
Tasikmalaya 5 5 5 3
Kota Banjar 5 5 5 2
Berdasarkan nilai pseudo F, metode yang paling tepat dipilih pada praktikum ini
adalah metode hirarki dengan pendekatan complete linkage. Metode K-means
tidak dipertimbangkan karena metode ini lebih tepat untuk digunakan pada obyek
pengelompokkan yang besar.
Cluster Kabupaten/Kota
MIN 82 22 14 1 10 199 0
MAX 1788 639 348 44 101 4804 240
INTERVAL 568,7 205,7 111,3 14,3 30,3 1535 80
Q1 650,7 227,7 125,3 15,3 40,3 1734 80
Q2 1219 433,3 236,7 29,7 70,7 3269 160
Pada tabel di atas, sel yang berwarna hijau menunjukan bahwa nilai obyek berada
di kuartil atas dan nilai obyek dengan sel berwarna merah berada pada kuartil
bawah. Setelah diketahui karakteristik per obyek, dapat juga dilihat karakteristik
tiap cluster dengan aplikasi STATA maupun manual dengan Excel seperti berikut.
Cluster SD SMP SMA Rumah Sakit Puskesmas Posyandu Klinik
1 1600,7 426,67 212,3 12,7 76 4321,6 126,7
2 1229,5 289,5 155,5 5 51,5 3173,5 30
3 902,7 202,7 116,8 14,5 44,3 2352,8 94,7
4 661,14 149 86,14 13,4 40,2 1637,6 51,1
5 205,7 83,2 51,1 9,8 19 634,6 48,2
Pada tabel karakteristik cluster di atas, sel dengan warna hijau menunjukkan bahwa
nilai rata-rata cluster pada variabel tersebut tertinggi dibanding cluster lainnya,
berwarna kuning menunjukkan bahwa rata-rata cluster pada variabel tersebut
tertinggi kedua dibanding cluster lain, dan sel dengan warna merah menunjukkan
bahwa nilai rata-rata cluster pada variabel tersebut terendah dibanding cluster
lainnya. Berikut karakteristik setiap kelompok/cluster :
• Cluster 1 memiliki sarana pendidikan yaitu SD, SMP, SMA paling banyak
dibandingkan kluster lainnya. Begitu pula dengan keberadaan sarana
kesehatan seperti puskesmas, posyandu dan klinik. Sementara rumah sakit
di cluster tersebut berada di tingkat sedang.
• Cluster 2 memiliki sarana pendidikan yaitu SD, SMP, SMA di tingkat
sedang. Begitu pula dengan sarana kesehatan berupa puskesmas dan
posyandu. Akan tetapi sarana kesehatan berupa rumah sakit dan klinik lebih
rendah dibandingkan cluster lainnya.
• Cluster 3 memiliki sarana pendidikan yaitu SD, SMP, SMA di tingkat
sedang. Untuk sarana kesehatan berupa rumah sakit, cluster 3 memiliki
jumlah paling tinggi dibanding cluster lainnya. Sedangkan untuk
puskesmas, posyandu dan klinik berada di tingkat sedang,
• Cluster 4 memiliki sarana pendidikan dan kesehatan pada tingkat sedang.
• Cluster 5 memiliki sarana pendidikan yaitu SD, SMP dan SMA paling
rendah dibandingkan cluster lainnya. Sedangkan untuk sarana
kesehatannya, rumah sakit dan klinik di cluster 5 berada ditingkat sedang
sedangkan untuk puskesmas dan posyandu berada di tingkat terendah.
(3) Selanjutnya dapat dilihat sarana yang sudah baik dan sarana yang perlu
ditingkatkan lagi.
Cluster Sarana yang Sudah Sarana yang Perlu
Memadai Ditingkatkan
Dari hasil analisis dapat diketahui sarana pendidikan dan kesehatan yang perlu di
tingkatkan pada setiap clusternya.
▪ Cluster 1 sudah memiliki sarana pendidikan dan kesehatan yaitu SD, SMP,
SMA, Puskesmas, Posyandu, Klinik yang memadai dibanding cluster
lainnya. Akan tetapi untuk sarana rumah sakit, cluster 1 berada di tingkat
sedang sehingga dapat ditingkatkan agar lebih baik lagi dalam pelayanan
kesehatannya.
▪ Untuk cluster 2 seluruh sarana pendidikan dan kesehatan perlu ditingkatkan.
Rumah sakit dan klinik perlu mendapatkan perhatian khusus dalam
peningkatan sarana dibanding sarana lainnya karena kedua sarana tersebut
menempati tingkat terendah.
▪ Cluster 3 sudah memiliki sarana rumah sakit yang memadai, sedangkan
untuk sarana pendidikan dan kesehtan lainnya dapat ditingkatkan kembali
karena masih berada di tingkat sedang.
▪ Untuk cluster 4, seluruh sarana pendidikan dan kesehatan perlu ditingkatkan
kembali.
▪ Secara umum cluster 5 memiliki sarana pendidikan dan kesehatan yang
paling rendah dibanding cluster lainnya. Seluruh sarana pendidikan dan
kesehatan di cluster 5 perlu ditingkatkan, terutama untuk sarana pendidikan
yaitu SD, SMP, SMA dan sarana kesehatan yaitu posyandu dan puskesmas
karena sarana tersebut berada pada tingkat terendah.
B.ANALISIS SKALOGRAM
I. Tujuan
• Praktikan mampu memahami proses analisis skalogram
• Praktikan mampu melakukan analisis skalogram menggunakan aplikasi Excel
• Praktikan mampu melakukan interpretasi terhadap hasil analisis skalogram di bidang
Perencanaan Wilayah dan Kota
Alat analisis skalogram membahas mengenai fasilitas perkotaan yang dimiliki suatu daerah
sebagai indikator difungsikannya daerah tersebut sebagai salah satu pusat pertumbuhan. Tujuan
digunakannya analisis ini adalah untuk mengidentifikasi kota-kota yang dapat dikelompokkan
menjadi pusat-pusat pertumbuhan berdasarkan pada fasilitas kota yang tersedia.
Hirarki kota akan berfungsi sebagai pusat-pusat pelayanan baik skala regional maupun lokal.
Tahapan penyusunan analisis skalogram adalah sebagai berikut:
Berdasarkan studi kasus tersebut, maka penyelesaian yang dapat dilakukan terdiri dari
beberapa tahapan yang diantaranya adalah: (1) merumuskan pertanyaan penelitian; (2)
memasukkan data pada Excel; (3) mengolah data menggunakan Excel; (4) menganalisis
hasil pengolahan data dan melakukan interpretasi.
Rentang :
Jml_Puskesmas Batas Bawah Batas Atas
Tinggi 29,66666667 44
Sedang 15,33333333 29,66666667
Rendah 1 15,33333333
b. Ubah input data awal menjadi matriks objek versus data rentang nilai setiap variabel
c. Ubah kolom variabel menjadi kolom berdasarkan tiap rentang (Tinggi, Sedang,
Rendah) dan beri nilai dengan tanda * di tiap nilai kolom yang sesuai
T S R
KabKota 1 2 3 4 1 2 3 4 1 2 3 4
Bogor * * * *
Sukabumi * * * *
Cianjur * * * *
Bandung * * * *
Garut * * * *
Tasikmalaya * * * *
Ciamis * * * *
Kuningan * * * *
Cirebon * * * *
Majalengka * * * *
Sumedang * * * *
Indramayu * * * *
Subang * * * *
Purwakarta * * * *
Karawang * * * *
Bekasi * * * *
Bandung Barat * * * *
Pangandaran * * * *
Kota Bogor * * * *
Kota Sukabumi * * * *
Kota Bandung * * * *
Kota Cirebon * * * *
Kota Bekasi * * * *
Kota Depok * * * *
Kota Cimahi * * * *
Kota Tasikmalaya * * * *
Kota Banjar * * * *
*angka 1, 2, 3, 4 menunjukkan variabel 1, 2, 3, 4 secara berurutan
d. Lakukan iterasi dengan mengubah urutan objek dan variabel sampai menghasilkan
urutan orde yang paling baik yang ditandai dengan menghasilkan nilai R (nilai error)
paling kecil
T S R
KabKota 1 2 3 4 1 2 3 4 1 2 3 4
Bogor * * * *
Bekasi * * * *
Kota Bandung * * * *
Sukabumi * * * *
Bandung * * * *
Garut * * * *
Karawang * * * *
Kota Bekasi * * * *
Cianjur * * * *
Cirebon * * * *
Indramayu * * * *
Subang * * * *
Kota Bogor * * * *
Kota Depok * * * *
Tasikmalaya * * * *
Bandung Barat * * * *
Ciamis * * * *
Kuningan * * * *
Majalengka * * * *
Sumedang * * * *
Purwakarta * * * *
Pangandaran * * * *
Kota Sukabumi * * * *
Kota Cirebon * * * *
Kota Cimahi * * * *
Kota
Tasikmalaya * * * *
Kota Banjar * * * *
𝑛𝑜𝑘𝑡𝑎ℎ 𝑑𝑖 𝑙𝑢𝑎𝑟 35
R = 𝑥100% = 𝑥100% = 32,4%
𝑘𝑒𝑠𝑒𝑙𝑢𝑟𝑢ℎ𝑎𝑛 𝑛𝑜𝑘𝑡𝑎ℎ 108
• Iterasi 2 (Memindahkan variabel yang memiliki nilai tinggi paling banyak ke
kanan)
T S R
KabKota 3 1 2 4 3 1 2 4 3 1 2 4
Bogor * * * *
Bekasi * * * *
Kota Bandung * * * *
Karawang * * * *
Cianjur * * * *
Cirebon * * * *
Indramayu * * * *
Sukabumi * * * *
Bandung * * * *
Garut * * * *
Subang * * * *
Kota Bogor * * * *
Kota Depok * * * *
Kota Bekasi * * * *
Tasikmalaya * * * *
Bandung Barat * * * *
Ciamis * * * *
Kuningan * * * *
Majalengka * * * *
Sumedang * * * *
Purwakarta * * * *
Pangandaran * * * *
Kota Sukabumi * * * *
Kota Cirebon * * * *
Kota Cimahi * * * *
Kota
Tasikmalaya * * * *
Kota Banjar * * * *
𝑛𝑜𝑘𝑡𝑎ℎ 𝑑𝑖 𝑙𝑢𝑎𝑟 22
R = 𝑥100% = 𝑥100% = 20,4%
𝑘𝑒𝑠𝑒𝑙𝑢𝑟𝑢ℎ𝑎𝑛 𝑛𝑜𝑘𝑡𝑎ℎ 108
• Iterasi 3
T S R
KabKota 3 1 2 4 3 1 2 4 3 1 2 4
Bogor * * * *
Bekasi * * * *
Kota Bandung * * * *
Karawang * * * *
Cianjur * * * *
Cirebon * * * *
Indramayu * * * *
Sukabumi * * * *
Bandung * * * *
Garut * * * *
Subang * * * *
Kota Bogor * * * *
Kota Depok * * * *
Kota Bekasi * * * *
Tasikmalaya * * * *
Bandung Barat * * * *
Ciamis * * * *
Kuningan * * * *
Majalengka * * * *
Sumedang * * * *
Purwakarta * * * *
Pangandaran * * * *
Kota Sukabumi * * * *
Kota Cirebon * * * *
Kota Cimahi * * * *
Kota
Tasikmalaya * * * *
Kota Banjar * * * *
𝑛𝑜𝑘𝑡𝑎ℎ 𝑑𝑖 𝑙𝑢𝑎𝑟 20
R= 𝑥100% = 𝑥100% = 18,5%
𝑘𝑒𝑠𝑒𝑙𝑢𝑟𝑢ℎ𝑎𝑛 𝑛𝑜𝑘𝑡𝑎ℎ 108
e. Beri skor dan urutan pada tiap orde dengan Tinggi bernilai 3; Sedang bernilai 2; dan
Rendah bernilai 13.
T S R
Skor Urutan
KabKota 3 1 2 4 3 1 2 4 3 1 2 4
12 I
Bogor * * * *
11 II
Bekasi * * * *
11 II
Kota Bandung * * * *
9 IV
Karawang * * * *
8 V
Cianjur * * * *
8 V
Cirebon * * * *
8 V
Indramayu * * * *
6 VII
Sukabumi * * * *
6 VII
Bandung * * * *
6 VII
Garut * * * *
5 VIII
Subang * * * *
5 VIII
Kota Bogor * * * *
5 VIII
Kota Depok * * * *
4 IX
Kota Bekasi * * * *
4 IX
Tasikmalaya * * * *
4 IX
Bandung Barat * * * *
4 IX
Ciamis * * * *
4 IX
Kuningan * * * *
4 IX
Majalengka * * * *
4 IX
Sumedang * * * *
4 IX
Purwakarta * * * *
4 IX
Pangandaran * * * *
4 IX
Kota Sukabumi * * * *
4 IX
Kota Cirebon * * * *
4 IX
Kota Cimahi * * * *
Kota
4 IX
Tasikmalaya * * * *
Kota Banjar * * * * 4 IX
Pada analisis ini dapat diketahui kabupaten/kota yang unggul dari segi fasilitas kesehatan
di Provinsi Jawa Barat. Analisis skalogram ini menghasilkan error (R) yang relatif kecil
yakni 18,5%. Tidak ada batasan nilai error untuk keberartian pada analisis skalogram.
Namun, nilai error tersebut menjelaskan bahwa hasil analisis pada contoh kasus ini tidak
dapat menjelaskan keseluruhan kondisi fasilitas kesehatan Jawa Barat sebesar 18,5%.