Modul Praktikum 2 - Analisis Cluster Dan Skalogram 2020 (R)

MODUL II
ANALISIS KLUSTER DAN SKALOGRAM
A.A NALISIS KLUSTER

I. Tujuan
• Praktikan mampu memahami dan melakukan proses analisis cluster
• Praktikan mampu melakukan interpretasi terhadap hasil analisis cluster dalam konteks
perencanaan wilayah dan kota.
II. Alat dan Data

Alat:
1. Komputer dan Perangkatnya
2. Aplikasi Stata
Data: data statistik dari BPS
III. Teori Dasar

Analisis Cluster adalah teknik statistik yang berguna untuk mengelompokkan objek ke dalam
beberapa kelompok tertentu dimana setiap objek yang terbentuk memiliki sifat dan karakteristik
yang berdekatan.
Tujuan dari Analisis Cluster adalah mengelompokkan obyek berdasarkan kesamaan karakteristik
di antara obyek-obyek tersebut. Dengan demikian, ciri-ciri suatu cluster yang baik yaitu memiliki:
• Homogenitas internal (within cluster) yaitu kesamaan antar anggota dalam satu cluster
• Heterogenitas eksternal (between cluster) yaitu perbedaan antara cluster yang satu dengan
cluster yang lain.
Pada analisis cluster, data mentah diubah ke dalam matriks similarity, selanjutnya dirumuskan
formasi kelompok dengan prinsip variasi dalam kelompok lebih kecil daripada variasi antar
kelompok.
Data Mentah
Matriks Similarity Formasi Kelompok
Obyek vs. Variabel
Adapun metode pengelompokan dalam analisis cluster meliputi:

• Metode Hirarki
Pengelompokan dimulai dengan dua atau lebih obyek yang mempunyai kesamaan paling
dekat. Metode hirarki ini terdiri dari dua cara, yaitu:
a) Penggabungan (Agglomerative)
Cara ini digunakan jika masing-masing objek dianggap satu kelompok kemudian antar
objek yang jaraknya berdekatan bergabung menjadi satu kelompok. Pada metode ini,
dapat digunakan tiga pendekatan yaitu single linkage, average linkage, dan complete
linkage.
b) Pemecahan (Divisive)
Cara ini digunakan jika pada awalnya semua objek berada dalam satu kelompok.
Setelah itu, objek dengan sifat paling beda dipisahkan dan membentuk satu
kelompok yang lain. Proses tersebut berlanjut sampai semua objek tersebut masing-
masing membentuk satu kelompok. Metode ini juga disebut sebagai metode splinter
average distance karena pemisahan tersebut didasarkan pada rata-rata jarak dengan
kelompok lain dan dengan kelompok sendiri
• Metode Non-Hirarki
Metode Non-Hirarki dilakukan dengan pendekatan K-Means. K-mean cluster sangat

efektif dan efisien jika digunakan untuk mengelompokkan objek yang berjumlah besar.
Metode ini didasarkan optimasi kriteria formal dan telah didefinisikan dengan jumlah
obyek yang besar. Pada metode K-Means sudah diasumsikan terlebih dahulu jumlah
kelompok yang akan terbentuk. Penentuan kelompok pada metode ini tidak final, jika tidak
tepat (tingkat errornya tinggi) maka hasil pengelompokkan dapat diubah dengan
memindahkan objek ke cluster lainnya. Adapun tahapan dalam metode K-Means sebagai
berikut:
1. Tentukan Kelompok awal berdasarkan perkiraan.
2. Membuat Tabel Karakteristik setiap kelompok, berdasarkan rata-rata setiap
variabel pada setiap kelompok.
3. Hitung Jarak antara individu dengan kelompok dimana individu tersebut
berada
 p 2 1
2
D (i,l ) =  X (i, j ) − X (l, j ) 

 j =1 
4. Hitung kesalahan pengelompokkan.

2
n
E  P ( n, K )  =  D i,l ( i ) 
i=1
5. Menguji penurunanan nilai kesalahan dengan adanya pemindahan individu

ke kelompok lain
n l ( i )  D  I ,l ( i ) 
2
n ( l ) D ( i,l )
2
Rl(i),l = −
n (l ) +1 n l ( I )  −1
IV. Pengolahan Data dan Analisis
Pada bagian ini akan dibahas contoh kasus, tujuan dari pengolahan, dan tahapan analisis.
Contoh kasus:
Provinsi Jawa Barat yang merupakan provinsi dengan jumlah penduduk terbesar di Indonesia.
Setiap daerah memiliki kewajiban untuk menyediakan pelayanan pendidikan dan kesehatan.
Pembangunan bidang kesehatan dan pendidikan bertujuan agar semua lapisan masyarakat dapat
meperoleh pelayanan kesehatan dan pendidikan secara mudah dan merata. Selain fasilitas
kesehatan skala kecamatan dan kota/kabupaten, diperlukan juga pengembangan sarana dan
prasarana maupun program di sektor kesehatan dan pendidikan yang melayani beberapa
kota/kabupaten. Oleh karena itu, Pemprov Jawa Barat ingin merancang kebijakan terkait
pelayanan kesehatan dan pendidikan. Untuk efektivitas dan efisiensi kebijakan tersebut tidak
dimungkinkan membuat kebijakan khusus untuk setiap kota/kabupaten sehingga perlu adanya
pengelompokkan kota/kabupaten menjadi 5 kelompok berdasarkan karakteristik yang dimilikinya
menggunakan data yang tertera pada Tabel 1.
Tabel 1. Data Sarana Kesehatan dan Pendidikan

Jumlah
Kabupaten/Kota Rumah
SMP SD SMA Puskesmas Posyandu Klinik
Sakit
Bogor 639 1788 348 25 101 4804 153
Sukabumi 311 1205 147 7 58 3451 54
Cianjur 268 1254 164 3 45 2896 6
Bandung 302 1431 130 7 62 4198 131
Garut 339 1583 159 6 65 3963 96
Tasikmalaya 240 1090 116 1 40 2278 29
Ciamis 106 751 57 4 37 1586 45
Kuningan 94 650 41 7 37 1417 13
Cirebon 183 923 103 10 57 2591 28
Majalengka 103 668 52 3 32 1461 24
Sumedang 101 612 76 2 32 1644 78
Indramayu 193 892 116 6 49 2311 20
Subang 151 872 102 7 40 1836 80
Purwakarta 165 429 55 11 20 1010 77
Karawang 145 890 97 20 50 2271 187
Bekasi 304 917 178 44 39 2457 240
Bandung Barat 151 704 91 6 31 2209 64
Pangandaran 47 295 24 1 15 520 11
Kota Bogor 120 223 98 17 24 965 94
Kota Sukabumi 41 104 32 6 15 447 22
Kota Bandung 234 634 132 33 73 1973 118
Kota Cirebon 43 134 29 11 22 330 31
Kota Bekasi 254 441 143 38 31 1546 0
Kota Depok 206 275 134 20 32 1003 113
Kota Cimahi 36 101 24 7 13 398 33
Kota
69 208 50 13 20 840 35
Tasikmalaya
Kota Banjar 22 82 14 3 10 199 18
Sumber: Provinsi Jawa Timur dalam Angka, 2017
Berdasarkan studi kasus tersebut, maka penyelesaian yang dapat dilakukan terdiri dari
beberapa tahapan yang diantaranya adalah: (1) merumuskan masalah; (2) memasukkan
data pada Stata; (3) menganalisis data menggunakan Stata; dan (4) interpretasi terhadap
hasil analisis data
1) Merumuskan Masalah
Masalah yang akan diteliti adalah sebagai berikut.
• Berapa kluster yang terbentuk?
• Bagaimana karakteristik setiap kluster berdasarkan variabel penentunya?
• Bagaimana interpretasi pembentukan kluster tersebut dalam konteks
perencanaan wilayah dan kota?
2) Memasukkan Data pada Stata
Klik “Data Editor” pada toolbar. Input data yang dimasukkan adalah data terkait
derajat Provinsi Jawa Barat seperti yang tercantum pada Gambar 1.
Gambar 1. Tampilan Data Editor
Sumber: Hasil Analisis, 2019
3) Menganalisis Data Menggunakan Stata
Dalam analisis cluster terdapat dua metode yang dapat digunakan yaitu metode hirarkis
dan non-hirarkis. Pada studi kasus kali ini yang digunakan adalah metode hirarki dengan
metode single linkage, average linkage, dan complete linkage serta metode non-hirarkis
dengan metode K-means dimana belum ada jumlah kelompok yang ditetapkan sehingga
jumlah kelompok baru akan didapatkan setelah analisis dengan STATA dilakukan.
Untuk mempermudah analisis selanjutnya, akan dilakukan pengelompokkan variabel

menjadi suatu kelompok dengan menggunakan command: global sarana JmlSMP-
JmlKlinik. Pada praktikum ini, variabel-variabel akan dikelompokkan ke dalam kelompok
yang diberi nama ‘sarana’.
a. Single Linkage
• Untuk menganalisis cluster menggunakan metode single linkage, gunakan
command: cluster singlelinkage $sarana, name(singleclus). Dengan
command tersebut, akan terbentuk cluster bernama ‘singleclus’ dan tiga
variabel baru di tabel data yaitu singleclus_id, singleclus_ord,
singleclus_hgt.
• Untuk melihat komponen dari tiap cluster dapat digunakan command:
cluster generate clus=groups(5), name(singleclus) yang nantinya
membentuk variabel baru bernama ‘clus’ yang berisikan pembagian
obyek-obyek ke dalam 5 komponen cluster.
• Masukkan command: tabstat $sarana, by(clus) stat(min mean max) untuk
melihat karakteristik dari tiap cluster yang terbentuk.
Gambar di atas menunjukkan karakteristik berupa nilai minimum, nilai

maksimum dan rata-rata tiap variabel pada tiap cluster yang terbentuk.
• Untuk melihat dendogram yang terbentuk dari cluster tersebut, gunakan

command: cluster dendrogram singleclus.
Dendrogram for singleclus cluster analysis
800 600
L2 dissimilarity measure
200 4000
1 4 5 2 3 9 16 6 12 15 17 21 13 7 8 10 11 23 14 19 24 26 18 22 20 25 27
Gambar di atas menunjukan dendogram yang terbentuk dari analisis

cluster yang nantinya dapat menunjukkan komponen dari tiap
cluster yang terbentuk sesuai dengan jumlah cluster yang
ditentukan.
• Untuk analisis stopping rules dengan Cali ́nski–Harabasz pseudo-F

dapat menggunakan command: cluster stop singleclus, rule(calinski)
atau cluster stop karena stopping rules Cali ́nski–Harabasz pseudo-F
merupakan default dari STATA.
Nilai ini menunjukan rasio variansi between cluster (antara kelompok yang
satu dengan yg lainnya) dan within cluster (di dalam kelompoknya sendiri).
Semakin besar nilai Cali ́nski–Harabasz pseudo-F maka semakin tinggi
perbedaan antar kelompok dan semakin tinggi kemiripan objek di dalam
satu kelompoknya. Pada praktikum ini, cluster yang paling jelas terbentuk
saat berjumlah 15. Namun, jumlah kelompok yang terlalu banyak menjadi
tidak efektif. Sehingga yang diambil adalah 5 kelompok sesuai kebutuhan.
Maka, bandingkan nilai pesudo-F dengan 5 kelompok menggunakan teknik
single linkage, average linkage, dan complete linkage.
• Untuk analisis stopping rules dengan Duda–Hart Je(2)/Je(1) dapat
menggunakan command: cluster stop singleclus, rule(duda)
Dengan stopping rules ini, semakin besar nilai Je(2)/Je(1) dan semakin kecil
nilai pseudo T-squared maka semakin jelas perbedaan antar cluster-nya.
b. Average Linkage
• Untuk menganalisis cluster menggunakan metode average linkage,
gunakan command: cluster averagelinkage $sarana, name(averageclus).
Dengan command tersebut, akan terbentuk tiga variabel baru di tabel data
yaitu averageclus_id, averageclus_ord, averageclus_hgt.
cluster generate clus2=groups(5), name(averageclus) yang nantinya
membentuk variabel baru bernama ‘clus2’ yang berisikan pembagian
• Masukkan command: tabstat $sarana, by(clus2) stat(min mean max) untuk
• Untuk melihat dendogram1 yang terbentuk dari cluster tersebut,
gunakan command: cluster dendrogram averageclus.
Dendrogram for averageclus cluster analysis

2500 2000
1000 1500
500
0
1 4 5 2 3 6 12 15 17 9 16 7 11 8 10 23 13 21 14 19 24 26 18 20 25 22 27

cluster yang nantinya dapat menunjukkan komponen dari tiap cluster
yang terbentuk sesuai dengan jumlah cluster yang ditentukan.
dapat menggunakan command: cluster stop averageclus, rule(calinski)
1
Menggambarkan proses pembentukan cluster yang dinyatakan dalam bentuk diagram pohon. Data yang mirip akan terletak pada
hirarki yang berdekatan.
menggunakan command: cluster stop averageclus, rule(duda)
c. Complete Linkage
• Untuk menganalisis cluster menggunakan metode single linkage, gunakan
command: cluster completelinkage $sarana, name(compclus). Dengan
command tersebut, akan terbentuk tiga variabel baru di tabel data yaitu
compclus_id, compclus_ord, compclus_hgt.
cluster generate clus3=groups(5), name(compclus) yang nantinya
membentuk variabel baru bernama ‘clus3’ yang berisikan pembagian
• Masukkan command: tabstat $sarana, by(clus3) stat(min mean max) untuk
• Untuk melihat dendogram yang terbentuk dari cluster tersebut, gunakan

command: cluster dendrogram compclus.
Dendrogram for compclus cluster analysis

5000 4000
2000 3000
01000
1 4 5 2 3 6 9 16 12 15 17 7 11 8 10 23 13 21 14 19 24 26 18 20 25 22 27

cluster yang nantinya dapat menunjukkan komponen dari tiap cluster
yang terbentuk sesuai dengan jumlah cluster yang ditentukan.
dapat menggunakan command: cluster stop compclus, rule(calinski)

menggunakan command: cluster stop compclus, rule(duda)
d. K-Means
1. Untuk menganalisis cluster menggunakan metode pengelompokan K-Means,
gunakan command: cluster kmeans $sarana, k(5) name(kcluster). Dari
command tersebut akan muncul variabel baru yaitu ‘kcluster’ sesuai dengan
jumlah cluster yang telah ditentukan yaitu 5 pada praktikum ini.
2. Masukkan command: tabstat $sarana, by(kcluster) stat(min mean max) untuk
Berikut adalah hasil dari analisis cluster yang telah dilakukan dengan data yang
ada.
Cluster
Kabupaten/Kota Average Complete
Single Linkage K-Means
Linkage Linkage
Bogor 1 1 1 1
Sukabumi 3 3 2 1
Cianjur 4 3 2 5
Bandung 2 2 1 1
Garut 2 2 1 1
Tasikmalaya 4 4 3 5
Ciamis 4 4 4 4
Kuningan 4 4 4 4
Cirebon 4 4 3 5
Majalengka 4 4 4 4
Sumedang 4 4 4 4
Indramayu 4 4 3 5
Subang 4 4 4 4
Purwakarta 5 5 5 3
Karawang 4 4 3 5
Bekasi 4 4 3 5
Bandung Barat 4 4 3 5
Pangandaran 5 5 5 2
Kota Bogor 5 5 5 3
Kota Sukabumi 5 5 5 2
Kota Bandung 4 4 4 4
Kota Cirebon 5 5 5 2
Kota Bekasi 4 4 4 4
Kota Depok 5 5 5 3
Kota Cimahi 5 5 5 2
Kota
Tasikmalaya 5 5 5 3
Kota Banjar 5 5 5 2
Untuk menentukan hasil metode yang digunakan, dapat digunakan perbandingan

nilai calinski karena nilai ini membandingkan jarak between dan within tiap obyek
analisis cluster. Dengan perbandingan nilai calinski, metode yang dipilih adalah
metode dengan nilai calinski paling besar.
Pada praktikum ini, nilai calinski tiap metode analisis cluster dengan jumlah 5
cluster adalah sebagai berikut.
Metode Calinski
Single Linkage 48,96
Average Linkage 61,89
Complete Linkage 101,41
Berdasarkan nilai pseudo F, metode yang paling tepat dipilih pada praktikum ini
adalah metode hirarki dengan pendekatan complete linkage. Metode K-means
tidak dipertimbangkan karena metode ini lebih tepat untuk digunakan pada obyek
pengelompokkan yang besar.
4) Kesimpulan dan Interpretasi

(1) Setelah dilakukan analisis cluster dan perbandingan nilai calinski, metode
analisis yang paling tepat digunakan adalah metode hirarki dengan complete
linkage dengan hasil sebagai berikut.
Cluster Kabupaten/Kota
Cluster 1 Bogor, Bandung, Garut
Cluster 2 Sukabumi, Cianjur
Cluster 3 Tasikmalaya, Cirebon
Cluster 4 Ciamis, Kuningan, Majalengka, Sumedang, Subang, Kota

Bandung, Kota Bekasi
Cluster 5 Purwakarta, Pangandaran, Kota Bogor, Kota Sukabumi,

Kota Cirebon, Kota Depok, Kota Cimahi, Kota
Tasikmalaya, Kota Banjar, Bekasi, Karawang, Indramayu,
Bandung Barat
(2) Cluster-cluster tersebut terbentuk berdasarkan kesamaan keberadaan

infrastruktur di kota dan kabupaten tersebut dengan karakteristik per obyek
seperti berikut.
Cluster Kab/Kota SD SMP SMA Rumah Sakit Puskesmas Posyandu Klinik
Bogor 1788 639 348 25 101 4804 153
Cluster Bandung 1431 302 130 7 62 4198 131
1 Garut 1583 339 159 6 65 3963 96
Cluster Sukabumi 1205 311 147 7 58 3451 54
2 Cianjur 1254 268 164 3 45 2896 6
Cluster Tasikmalaya 1090 240 116 1 40 2278 29
3 Cirebon 923 183 103 10 57 2591 28
Kota Bandung 634 234 132 33 73 1973 118
Ciamis 751 106 57 4 37 1586 45
Kuningan 650 94 41 7 37 1417 13
Subang 872 151 102 7 40 1836 80
Majalengka 668 103 52 3 32 1461 24
Cluster Sumedang 612 101 76 2 32 1644 78
4 Kota Bekasi 441 254 143 38 31 1546 0
Indramayu 892 193 116 6 49 2311 20
Purwakarta 429 165 55 11 20 1010 77
Karawang 890 145 97 20 50 2271 187
Bekasi 917 304 178 44 39 2457 240
Bandung Barat 704 151 91 6 31 2209 64
Pangandaran 295 47 24 1 15 520 11
Kota Bogor 223 120 98 17 24 965 94
Kota Sukabumi 104 41 32 6 15 447 22
Kota Cirebon 134 43 29 11 22 330 31
Kota Depok 275 206 134 20 32 1003 113
Kota Cimahi 101 36 24 7 13 398 33
Kota
Cluster Tasikmalaya 208 69 50 13 20 840 35
5 Kota Banjar 82 22 14 3 10 199 18
MIN 82 22 14 1 10 199 0
MAX 1788 639 348 44 101 4804 240
INTERVAL 568,7 205,7 111,3 14,3 30,3 1535 80
Q1 650,7 227,7 125,3 15,3 40,3 1734 80
Q2 1219 433,3 236,7 29,7 70,7 3269 160
Pada tabel di atas, sel yang berwarna hijau menunjukan bahwa nilai obyek berada
di kuartil atas dan nilai obyek dengan sel berwarna merah berada pada kuartil
bawah. Setelah diketahui karakteristik per obyek, dapat juga dilihat karakteristik
tiap cluster dengan aplikasi STATA maupun manual dengan Excel seperti berikut.
Cluster SD SMP SMA Rumah Sakit Puskesmas Posyandu Klinik
1 1600,7 426,67 212,3 12,7 76 4321,6 126,7
2 1229,5 289,5 155,5 5 51,5 3173,5 30
3 902,7 202,7 116,8 14,5 44,3 2352,8 94,7
4 661,14 149 86,14 13,4 40,2 1637,6 51,1
5 205,7 83,2 51,1 9,8 19 634,6 48,2
Pada tabel karakteristik cluster di atas, sel dengan warna hijau menunjukkan bahwa
nilai rata-rata cluster pada variabel tersebut tertinggi dibanding cluster lainnya,
berwarna kuning menunjukkan bahwa rata-rata cluster pada variabel tersebut
tertinggi kedua dibanding cluster lain, dan sel dengan warna merah menunjukkan
bahwa nilai rata-rata cluster pada variabel tersebut terendah dibanding cluster
lainnya. Berikut karakteristik setiap kelompok/cluster :
• Cluster 1 memiliki sarana pendidikan yaitu SD, SMP, SMA paling banyak
dibandingkan kluster lainnya. Begitu pula dengan keberadaan sarana
kesehatan seperti puskesmas, posyandu dan klinik. Sementara rumah sakit
di cluster tersebut berada di tingkat sedang.
• Cluster 2 memiliki sarana pendidikan yaitu SD, SMP, SMA di tingkat
sedang. Begitu pula dengan sarana kesehatan berupa puskesmas dan
posyandu. Akan tetapi sarana kesehatan berupa rumah sakit dan klinik lebih
rendah dibandingkan cluster lainnya.
• Cluster 3 memiliki sarana pendidikan yaitu SD, SMP, SMA di tingkat
sedang. Untuk sarana kesehatan berupa rumah sakit, cluster 3 memiliki
jumlah paling tinggi dibanding cluster lainnya. Sedangkan untuk
puskesmas, posyandu dan klinik berada di tingkat sedang,
• Cluster 4 memiliki sarana pendidikan dan kesehatan pada tingkat sedang.
• Cluster 5 memiliki sarana pendidikan yaitu SD, SMP dan SMA paling
rendah dibandingkan cluster lainnya. Sedangkan untuk sarana
kesehatannya, rumah sakit dan klinik di cluster 5 berada ditingkat sedang
sedangkan untuk puskesmas dan posyandu berada di tingkat terendah.
(3) Selanjutnya dapat dilihat sarana yang sudah baik dan sarana yang perlu
ditingkatkan lagi.
Cluster Sarana yang Sudah Sarana yang Perlu
Memadai Ditingkatkan
1 SD, SMP, SMA, Rumah Sakit

Puskesmas, Posyandu,
Klinik
2 - SD, SMP, SMA,
Rumah Sakit, Klinik
3 Rumah Sakit SD, SMP, SMA,

Klinik
4 - SD, SMP, SMA,

Rumah Sakit, Klinik
5 - SD, SMP, SMA,

Rumah Sakit, Klinik
Dari hasil analisis dapat diketahui sarana pendidikan dan kesehatan yang perlu di
tingkatkan pada setiap clusternya.
▪ Cluster 1 sudah memiliki sarana pendidikan dan kesehatan yaitu SD, SMP,
SMA, Puskesmas, Posyandu, Klinik yang memadai dibanding cluster
lainnya. Akan tetapi untuk sarana rumah sakit, cluster 1 berada di tingkat
sedang sehingga dapat ditingkatkan agar lebih baik lagi dalam pelayanan
kesehatannya.
▪ Untuk cluster 2 seluruh sarana pendidikan dan kesehatan perlu ditingkatkan.
Rumah sakit dan klinik perlu mendapatkan perhatian khusus dalam
peningkatan sarana dibanding sarana lainnya karena kedua sarana tersebut
menempati tingkat terendah.
▪ Cluster 3 sudah memiliki sarana rumah sakit yang memadai, sedangkan
untuk sarana pendidikan dan kesehtan lainnya dapat ditingkatkan kembali
karena masih berada di tingkat sedang.
▪ Untuk cluster 4, seluruh sarana pendidikan dan kesehatan perlu ditingkatkan
kembali.
▪ Secara umum cluster 5 memiliki sarana pendidikan dan kesehatan yang
paling rendah dibanding cluster lainnya. Seluruh sarana pendidikan dan
kesehatan di cluster 5 perlu ditingkatkan, terutama untuk sarana pendidikan
yaitu SD, SMP, SMA dan sarana kesehatan yaitu posyandu dan puskesmas
karena sarana tersebut berada pada tingkat terendah.
B.ANALISIS SKALOGRAM
I. Tujuan
• Praktikan mampu memahami proses analisis skalogram
• Praktikan mampu melakukan analisis skalogram menggunakan aplikasi Excel
• Praktikan mampu melakukan interpretasi terhadap hasil analisis skalogram di bidang
Perencanaan Wilayah dan Kota
II. Alat dan Data

Alat:
1. Komputer dan Perangkatnya
2. Aplikasi Excel
Data: data statistik dari BPS
III. Teori Dasar

Dalam konteks perencanaan wilayah dan kota, analisis skalogram merupakan salah satu alat
untuk mengidentifikasi pusat pertumbuhan wilayah berdasarkan fasilitas yang dimilikinya,
dengan demikian dapat ditentukan hirarki pusat-pusat pertumbuhan dan aktivitas pelayanan suatu
wilayah. Semakin tinggi perkembangan suatu wilayah berarti wilayah tersebut semakin mampu
memberikan pelayanan kepada masyarakatnya. Pelayanan yang dimaksud dalam hal ini
adalah ketersediaan fasilitas- fasilitas yang ada didaerah itu seperti fasilitas yang berkaitan
dengan aktivitas ekonomi, aktivitas sosial dan pemerintahan. Dengan analisis skalogram dapat
ditentukan daerah ataupun kecamatan yang dapat dijadikan sebagai pusat pertumbuhan.
Kecamatan yang memiliki kelengkapan fasilitas tertinggi dapat ditentukan sebagai pusat
pertumbuhan. Wilayah dengan fasilitas yang lebih lengkap merupakan pusat pelayanan,
sedangkan wilayah dengan fasilitas yang kurang akan menjadi daerah belakang (hinterland).
Alat analisis skalogram membahas mengenai fasilitas perkotaan yang dimiliki suatu daerah
sebagai indikator difungsikannya daerah tersebut sebagai salah satu pusat pertumbuhan. Tujuan
digunakannya analisis ini adalah untuk mengidentifikasi kota-kota yang dapat dikelompokkan
menjadi pusat-pusat pertumbuhan berdasarkan pada fasilitas kota yang tersedia.
Hirarki kota akan berfungsi sebagai pusat-pusat pelayanan baik skala regional maupun lokal.
Tahapan penyusunan analisis skalogram adalah sebagai berikut:
1. Membuat data matriks antara objek-objek dengan peringkat faktor/variabel penilainya

2. Matriks data diubah menjadi matriks antara objek terhadap kelas nilai faktor/variabel
3. Tukarkan objek-objek dan faktor-faktor/variabel-variabel sedemikian rupa hingga
memenuhi prinsip konsistensi
4. Berikan skor untuk tiap skala dari objek dengan melihat dimana posisi kotak objek
5. Hitung koefisien reproductibility (R) untuk mengetahui derajat error
6. Lakukan iterasi hingga koefisien R paling kecil
IV. Pengolahan Data dan Analisis

Pada bagian ini akan dijelaskan contoh kasus, tujuan dari pengolahan, dan tahapan analisis.
Contoh Kasus :
Untuk meningkatkan pelayanan kesehatan warganya, Pemerintah Provinsi Jawa Barat

benrencana untuk menentukan pusat pelayanan kesehatan skala provinsi berdasarkan ketersediaan
fasilitas kesehatan eksisting di setiap kota/kabupaten. Secara administratif, Provinsi Jawa Barat
dibagi menjadi 27 kota/kabupaten. Penentuan lokasi pusat pelayanan kesehatan di Provinsi Jawa
Barat, salah satunya dapat dianalisis dengan analisis skalogram.. Berikut adalah data jumlah
fasilitas kesehatan tiap kabupaten/kota yang akan digunakan dalam analisis skalogram.
Tabel 2. Data Jumlah Fasilitas Kesehatan Provinsi Jawa Barat
Kab/Kota JmlRS JmlPuskesmas JmlPosyandu JmlKlinik

Bogor 25 101 4804 153
Sukabumi 7 58 3451 54
Cianjur 3 45 2896 6
Bandung 7 62 4198 131
Garut 6 65 3963 96
Tasikmalaya 1 40 2278 29
Ciamis 4 37 1586 45
Kuningan 7 37 1417 13
Cirebon 10 57 2591 28
Majalengka 3 32 1461 24
Sumedang 2 32 1644 78
Indramayu 6 49 2311 20
Subang 7 40 1836 80
Purwakarta 11 20 1010 77
Karawang 20 50 2271 187
Bekasi 44 39 2457 240
Pangandaran 1 15 520 11
Kota Bogor 17 24 965 94
Kota Bekasi 38 31 1546 0
Kota Depok 20 32 1003 113
Kota Cimahi 7 13 398 33
Kota Tasikmalaya 13 20 840 35
Kota Banjar 3 10 199 18
Sumber : Provinsi Jawa Barat Dalam Angka 2017
Berdasarkan studi kasus tersebut, maka penyelesaian yang dapat dilakukan terdiri dari
beberapa tahapan yang diantaranya adalah: (1) merumuskan pertanyaan penelitian; (2)
memasukkan data pada Excel; (3) mengolah data menggunakan Excel; (4) menganalisis
hasil pengolahan data dan melakukan interpretasi.
1) Merumuskan Pertanyaan Penelitian

Pertanyaan penelitian yang akan diteliti adalah sebagai berikut.
• Kabupaten/Kota apa yang cocok dijadikan pusat pelayanan kesehatan di Jawa Barat?
• Jika diperlukan sub-pusat pelayanan skala provinsi, dimanakah sebaiknya sub-pusat
tersebut berada?
• Apa saran yang Saudara usulkan untuk pengembangan pusat dan sub-pusat
pelayanan kesehatan tersebut?
2) Memasukkan Data pada Ms. Excel

Input data pada Tabel 1 dengan melakukan copy-paste tabel pada Ms. Excel. Input data
berupa matriks objek versus variabel/faktor.
3) Mengolah Data Menggunakan Ms. Excel
Melakukan analisis skalogram pada Excel pada dasarnya memiliki prinsip yang sama
dengan melakukan analisis skalogram secara manual. Tahap yang dilakukan adalah
sebagai berikut:
a. Buat rentang dengan 3 interval (Rendah, Sedang, Tinggi) untuk setiap variabel
KabKota JmlRS JmlPuskesmas JmlPosyandu JmlKlinik

Bogor 25 101 4804 153
Sukabumi 7 58 3451 54
Cianjur 3 45 2896 6
Bandung 7 62 4198 131
Garut 6 65 3963 96
Tasikmalaya 1 40 2278 29
Ciamis 4 37 1586 45
Kuningan 7 37 1417 13
Cirebon 10 57 2591 28
Majalengka 3 32 1461 24
Sumedang 2 32 1644 78
Indramayu 6 49 2311 20
Subang 7 40 1836 80
Purwakarta 11 20 1010 77
Karawang 20 50 2271 187
Bekasi 44 39 2457 240
Pangandaran 1 15 520 11
Kota Bogor 17 24 965 94
Kota Bekasi 38 31 1546 0
Kota Depok 20 32 1003 113
Kota Cimahi 7 13 398 33
Kota Tasikmalaya 13 20 840 35
Kota Banjar 3 10 199 18
Max 44 101 4804 240
Min 1 10 199 0
Interval 14,3 30,3 1535 80
Q1 15,3 40,3 1734 80
Q2 29,7 70,7 3269 160
Rentang :
Jml_Puskesmas Batas Bawah Batas Atas
Tinggi 29,66666667 44
Sedang 15,33333333 29,66666667
Rendah 1 15,33333333
Jml_Pasar Batas Bawah Batas Atas

Tinggi 70,66666667 101
Sedang 40,33333333 70,66666667
Rendah 10 40,33333333
Jml_TK Batas Bawah Batas Atas

Tinggi 3269 4804
Sedang 1734 3269
Rendah 199 1734
Jml_Sar_Olga Batas Bawah Batas Atas

Tinggi 160 240
Sedang 80 160
Rendah 0 80
b. Ubah input data awal menjadi matriks objek versus data rentang nilai setiap variabel
JmlRS JmlPuskesmas JmlPosyandu JmlKlinik

KabKota (1) (2) (3) (4)
Bogor S T T S
Sukabumi R S T R
Cianjur R S S R
Bandung R S T S
Garut R S T S
Tasikmalaya R R S R
Ciamis R R R R
Kuningan R R R R
Cirebon R S S R
Majalengka R R R R
Sumedang R R R R
Indramayu R S S R
Subang R R S S
Purwakarta R R R R
Karawang S S S T
Bekasi T R S T
Bandung Barat R R S R
Pangandaran R R R R
Kota Bogor S R R S
Kota Sukabumi R R R R
Kota Bandung T T S S
Kota Cirebon R R R R
Kota Bekasi T R R R
Kota Depok S R R S
Kota Cimahi R R R R
Kota Tasikmalaya R R R R
Kota Banjar R R R R
c. Ubah kolom variabel menjadi kolom berdasarkan tiap rentang (Tinggi, Sedang,
Rendah) dan beri nilai dengan tanda * di tiap nilai kolom yang sesuai
T S R
KabKota 1 2 3 4 1 2 3 4 1 2 3 4
Bogor * * * *
Sukabumi * * * *
Cianjur * * * *
Bandung * * * *
Garut * * * *
Tasikmalaya * * * *
Ciamis * * * *
Kuningan * * * *
Cirebon * * * *
Majalengka * * * *
Sumedang * * * *
Indramayu * * * *
Subang * * * *
Purwakarta * * * *
Karawang * * * *
Bekasi * * * *
Bandung Barat * * * *
Pangandaran * * * *
Kota Bogor * * * *
Kota Sukabumi * * * *
Kota Bandung * * * *
Kota Cirebon * * * *
Kota Bekasi * * * *
Kota Depok * * * *
Kota Cimahi * * * *
Kota Tasikmalaya * * * *
Kota Banjar * * * *
*angka 1, 2, 3, 4 menunjukkan variabel 1, 2, 3, 4 secara berurutan
d. Lakukan iterasi dengan mengubah urutan objek dan variabel sampai menghasilkan
urutan orde yang paling baik yang ditandai dengan menghasilkan nilai R (nilai error)
paling kecil
• Iterasi 1 (Mengubah urutan objek dengan memindahkan objek yang memiliki

nilai tinggi paling banyak ke atas)
T S R
KabKota 1 2 3 4 1 2 3 4 1 2 3 4
Bogor * * * *
Bekasi * * * *
Sukabumi * * * *
Bandung * * * *
Garut * * * *
Karawang * * * *
Kota Bekasi * * * *
Cianjur * * * *
Cirebon * * * *
Indramayu * * * *
Subang * * * *
Kota Bogor * * * *
Kota Depok * * * *
Tasikmalaya * * * *
Ciamis * * * *
Kuningan * * * *
Majalengka * * * *
Sumedang * * * *
Purwakarta * * * *
Pangandaran * * * *
Kota Cimahi * * * *
Kota
Tasikmalaya * * * *
Kota Banjar * * * *
𝑛𝑜𝑘𝑡𝑎ℎ 𝑑𝑖 𝑙𝑢𝑎𝑟 35
R = 𝑥100% = 𝑥100% = 32,4%
𝑘𝑒𝑠𝑒𝑙𝑢𝑟𝑢ℎ𝑎𝑛 𝑛𝑜𝑘𝑡𝑎ℎ 108
• Iterasi 2 (Memindahkan variabel yang memiliki nilai tinggi paling banyak ke
kanan)
T S R
KabKota 3 1 2 4 3 1 2 4 3 1 2 4
Bogor * * * *
Bekasi * * * *
Karawang * * * *
Cianjur * * * *
Cirebon * * * *
Indramayu * * * *
Sukabumi * * * *
Bandung * * * *
Garut * * * *
Subang * * * *
Kota Bogor * * * *
Kota Depok * * * *
Kota Bekasi * * * *
Tasikmalaya * * * *
Ciamis * * * *
Kuningan * * * *
Majalengka * * * *
Sumedang * * * *
Purwakarta * * * *
Pangandaran * * * *
Kota Cimahi * * * *
Kota
Tasikmalaya * * * *
Kota Banjar * * * *
R = 𝑥100% = 𝑥100% = 20,4%
• Iterasi 3
T S R
KabKota 3 1 2 4 3 1 2 4 3 1 2 4
Bogor * * * *
Bekasi * * * *
Karawang * * * *
Cianjur * * * *
Cirebon * * * *
Indramayu * * * *
Sukabumi * * * *
Bandung * * * *
Garut * * * *
Subang * * * *
Kota Bogor * * * *
Kota Depok * * * *
Kota Bekasi * * * *
Tasikmalaya * * * *
Ciamis * * * *
Kuningan * * * *
Majalengka * * * *
Sumedang * * * *
Purwakarta * * * *
Pangandaran * * * *
Kota Cimahi * * * *
Kota
Tasikmalaya * * * *
Kota Banjar * * * *
R= 𝑥100% = 𝑥100% = 18,5%
e. Beri skor dan urutan pada tiap orde dengan Tinggi bernilai 3; Sedang bernilai 2; dan
Rendah bernilai 13.
T S R
Skor Urutan
KabKota 3 1 2 4 3 1 2 4 3 1 2 4
12 I
Bogor * * * *
11 II
Bekasi * * * *
11 II
9 IV
Karawang * * * *
8 V
Cianjur * * * *
8 V
Cirebon * * * *
8 V
Indramayu * * * *
6 VII
Sukabumi * * * *
6 VII
Bandung * * * *
6 VII
Garut * * * *
5 VIII
Subang * * * *
5 VIII
Kota Bogor * * * *
5 VIII
Kota Depok * * * *
4 IX
Kota Bekasi * * * *
4 IX
Tasikmalaya * * * *
4 IX
4 IX
Ciamis * * * *
4 IX
Kuningan * * * *
4 IX
Majalengka * * * *
4 IX
Sumedang * * * *
4 IX
Purwakarta * * * *
4 IX
Pangandaran * * * *
4 IX
4 IX
4 IX
Kota Cimahi * * * *
Kota
4 IX
Tasikmalaya * * * *
Kota Banjar * * * * 4 IX
4) Menganalisis Hasil Pengolahan Data dan Melakukan Interpretasi
Pada analisis ini dapat diketahui kabupaten/kota yang unggul dari segi fasilitas kesehatan
di Provinsi Jawa Barat. Analisis skalogram ini menghasilkan error (R) yang relatif kecil
yakni 18,5%. Tidak ada batasan nilai error untuk keberartian pada analisis skalogram.
Namun, nilai error tersebut menjelaskan bahwa hasil analisis pada contoh kasus ini tidak
dapat menjelaskan keseluruhan kondisi fasilitas kesehatan Jawa Barat sebesar 18,5%.
1. Berdasarkan hasil analisis skalogram dengan 4 (empat) variabel jumlah fasilitas

kesehatan, dapat diketahui bahwa hirarki 1 adalah Kabupaten Bogor sehingga pusat
pelayanan kesehatan skala provinsi di Jawa Barat diprioritaskan berada di Kabupaten
Bogor.
2. Jika diperlukan sub-pusat pelayanan kesehatan skala provinsi, kota/kabupaten yang
sesuai adalah Kota Bandung dan Kabupaten Bekasi (Urutan 2).
3. Namun, baik Kabupaten Bogor sebagai pusat maupun Kota Bandung dan Kabupaten
Bekasi sebagai sub-pusat pelayanan kesehatan skala provinsi, masih memiliki
kekurangan. Untuk meningkatkan fungsi Kabupaten Bogor sebagai pusat pelayanan
kesehatan, maka upaya yang perlu dilakukan adalah peningkatan fasilitas rumah sakit
dan klinik di Kabupaten Bogor dan peningkatan puskesmas di Kabupaten Bekasi serta
peningkatan fasilitas klinik di Kota Bandung.

Modul Praktikum 2 - Analisis Cluster Dan Skalogram 2020 (R)

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Modul Praktikum 2 - Analisis Cluster Dan Skalogram 2020 (R)

Diunggah oleh

Hak Cipta:

Format Tersedia

MODUL II

ANALISIS KLUSTER DAN SKALOGRAM

A.A NALISIS KLUSTER

II. Alat dan Data

III. Teori Dasar

Adapun metode pengelompokan dalam analisis cluster meliputi:

Metode Non-Hirarki dilakukan dengan pendekatan K-Means. K-mean cluster sangat

D (i,l ) =  X (i, j ) − X (l, j ) 

4. Hitung kesalahan pengelompokkan.

5. Menguji penurunanan nilai kesalahan dengan adanya pemindahan individu

Tabel 1. Data Sarana Kesehatan dan Pendidikan

Sumber: Hasil Analisis, 2019

3) Menganalisis Data Menggunakan Stata

Untuk mempermudah analisis selanjutnya, akan dilakukan pengelompokkan variabel

Gambar di atas menunjukkan karakteristik berupa nilai minimum, nilai

• Untuk melihat dendogram yang terbentuk dari cluster tersebut, gunakan

Gambar di atas menunjukan dendogram yang terbentuk dari analisis

• Untuk analisis stopping rules dengan Cali ́nski–Harabasz pseudo-F

Dendrogram for averageclus cluster analysis

Gambar di atas menunjukan dendogram yang terbentuk dari analisis

• Untuk melihat dendogram yang terbentuk dari cluster tersebut, gunakan

Dendrogram for compclus cluster analysis

Gambar di atas menunjukan dendogram yang terbentuk dari analisis

• Untuk analisis stopping rules dengan Duda–Hart Je(2)/Je(1) dapat

Untuk menentukan hasil metode yang digunakan, dapat digunakan perbandingan

Single Linkage 48,96

Average Linkage 61,89

Complete Linkage 101,41

4) Kesimpulan dan Interpretasi

Cluster 1 Bogor, Bandung, Garut

Cluster 2 Sukabumi, Cianjur

Cluster 3 Tasikmalaya, Cirebon

Cluster 4 Ciamis, Kuningan, Majalengka, Sumedang, Subang, Kota

Cluster 5 Purwakarta, Pangandaran, Kota Bogor, Kota Sukabumi,

(2) Cluster-cluster tersebut terbentuk berdasarkan kesamaan keberadaan

1 SD, SMP, SMA, Rumah Sakit

3 Rumah Sakit SD, SMP, SMA,

4 - SD, SMP, SMA,

5 - SD, SMP, SMA,

II. Alat dan Data

III. Teori Dasar

1. Membuat data matriks antara objek-objek dengan peringkat faktor/variabel penilainya

IV. Pengolahan Data dan Analisis

Untuk meningkatkan pelayanan kesehatan warganya, Pemerintah Provinsi Jawa Barat

Tabel 2. Data Jumlah Fasilitas Kesehatan Provinsi Jawa Barat

Kab/Kota JmlRS JmlPuskesmas JmlPosyandu JmlKlinik

1) Merumuskan Pertanyaan Penelitian

2) Memasukkan Data pada Ms. Excel

KabKota JmlRS JmlPuskesmas JmlPosyandu JmlKlinik

Jml_Pasar Batas Bawah Batas Atas

Jml_TK Batas Bawah Batas Atas

Jml_Sar_Olga Batas Bawah Batas Atas

JmlRS JmlPuskesmas JmlPosyandu JmlKlinik

• Iterasi 1 (Mengubah urutan objek dengan memindahkan objek yang memiliki

4) Menganalisis Hasil Pengolahan Data dan Melakukan Interpretasi

1. Berdasarkan hasil analisis skalogram dengan 4 (empat) variabel jumlah fasilitas

Anda mungkin juga menyukai