Modul Analisis Cluster
Modul Analisis Cluster
PWK - UNISBA
2.1 Pendahuluan
Analisis cluster merupakan salah satu teknik statistik multivariat untuk
mengidentifikasi sekelompok obyek yang memiliki kemiripan karakteristik tertentu,
yang dapat dipisahkan dengan kelompok obyek lainnya. Jumlah kelompok yang
dapat diidentifikasi tergantung pada banyaknya variasi data obyek.
Between Cluster
Within Cluster Within Cluster
a. Interval
1) Euclidian distance
3) Cosine
∑ (XiYi)
S (X,Y) =
√ ∑ (Xi2) (Yi 2)
4) Peason Correlation
∑ Zxi Zyi
S (X,Y) =
(N-1)
5) Chebychev
6) Block
D (X,Y) = ∑ │Xi – Yi │
7) Minkowski
8) Customized
2) Phi-square
1 ∑ (Xi – E(Xi))2 ∑ (Yi – E(Yi))2
D (X,Y) = √ { + }
n E(Xi) E(Yi)
c. Biner
1) Square euclidian distance
D (X, Y) =b+c
2) Euclidian distance
D (X, Y) = √b+c
3) Size Difference
(b – c)2
D (X, Y) =
(a + b + c + d)2
4) Pattern Difference
bc
D (X, Y) =
(a + b + c + d)2
5) Variance
(b + c)
D (X, Y) =
4(a + b + c + d)
6) Shape
( b + c)
D (X, Y) =
(2a + b + c )
8) Present and absent
Untuk memilih nilai integer lain selain 0 dan 1
DESAIN PENELITIAN
TAHAP 2 Outlier
PENGUKURAN SIMILARITAS
Apakah variabel Metrik atau Non Metrik
Proximity Distance
Measure of Similarity
Pattern: Correlation
Measure of Similarity
STANDARISASI
Standarisasi Variabel
TAHAP 3 ASUMSI
Pemenuhan asumsi dasar
TAHAP 4
ALGORITMA CLUSTERING
Hirarki, non hirarki, kombinasi
JUMLAH CLUSTER
TAHAP 5
INTERPRETASI
Periksa cluster centroid
TAHAP 6 VALIDASI
1. Penentuan tujuan
☺ Tentukan tujuan analisis cluster yang akan lakukan. Secara umum tujuan
utama analisis cluster adalah mempartisi suatu set objek menjadi dua grup
atau lebih berdasarkan kesamaan objek tersebut. Dengan membentuk
grup yang homogen, dapat dilihat 3 hal:
a. Deskripsi taksonomi
b. Identifikasi relationship
☺ Dalam penentuan tujuan ini variabel yang akan dipakai telah dipilih dan
ditentukan (sesuaikan dengan tujuan analisis)
☺ Data yang digunakan untuk tiap variabel dapat berupa data interval, ratio,
nominal, atau ordinal
2. Desain penelitian
☺ Terdapat data mentah berupa matriks dengan n objek dan p veriabel
(sebaiknyajumlah objek > jumlah variable)
☺ Menstransformasikan matriks data mentah (n x p) menjadi matriks jarak
antar objek(nxn) dengan menggunakan metoda perhitungan jarak
☺ Dalam tahap ini harus dideteksi terdapat data yang outlier atau tidak. outlier /
pencilan adalah objek yang memiliki nilai ekstrim dibandingkan objek-objek lain.
outlier ini dapat mengganggu pengelompokan. Jika terdapat data outlier, maka
harus dilakukan standarisasi data.
☺ Standarisasi data dapat dilakukan dengan 2 metode:
a. Standarisasi variabel (dengan Z score)
Xi - M
Z=
σ
3. Asumsi model
1. Sampel yang diambil benar-benar dapat mewakili populasi yang ada
(representativeness of the sample)
2. Tidak terjadi multikolinearitas (artinya variabel yang satu bebas dari
variabel lainnya)
4. Pengelompokan
Pembentukan Cluster dilakukan dengan menggunakan metoda tertentu
(hierarchical)cluster atau mutually exclusive cluster
a. Metode Hirarki; memulai pengelompokan dengan dua atau lebih obyek
yang mempunyai kesamaan paling dekat. Kemudian diteruskan pada
obyek yang lain dan seterusnya hingga cluster akan membentuk semacam
‘struktur pohon’ dimana terdapat tingkatan (hirarki) yang jelas antar
obyek, dari yang paling mirip hingga yang paling tidak mirip. Alat yang
membantu untuk memperjelas proses hirarki ini disebut “dendogram”.
I. Metode Agglomerative
1. Single lingkage (nearest neigbor methods)/ Pautan Tunggal
Metode ini didasarkan pada jarak minimum. Dimulai dengan dua
objek yang dipisahkan dengan jarak paling pendek maka keduanya
akan ditempatkan pada cluster pertama. Keduanya membentuk
kelompok yang pertama. Pada langkah selanjutnya, terdapat dua
kemungkinan:
a. objek ketiga akan bergabung dengan kelompok yang ada
b. dua objek lainnya akan membentuk kelompok baru
Metode ini dikenal pula dengan nama pendekatan tetangga
terdekat
2. Complete lingkage (futhest neigbor methods)/ Pautan Lengkap
Disebut juga pendekatan tetangga terjauh. Dasarnya adalah jarak
maksimum. Dalam metode ini seluruh objek dalam suatu cluster
dikaitkan satu sama lain pada suatu jarak maksimum atau dengan
kesamaan minimum.
3. Average lingkage methods (between groups methods)/ Pautan
rata-rata
Dasarnya adalah jarak rata-rata antar observasi. pengelompokan
dimulai dari tengan atau pasangan observasi dengan jarak paling
mendekati jarak rata-rata.
4. Ward’s error sum of squares methods
Dalam metode ini jarak antara dua cluster adalah jumlah kuadrat
antara dua cluster untuk seluruh variabel. Metode ini cenderung
digunakan untuk mengkombinasi cluster-cluster dengan jumlah
kecil.
hirarki, maka tahap selanjutnya coba gunakan teknik non hirarki. Bila hasilnya
berbeda, maka kelompok yang terbentuk tersebut belum valid dan tidak
dapat diterapkan secara umum. Begitu sebaliknya.
Klik pada kolom Proximity matrix. Untuk Cluster Membership, pilih Range of
Solutions Minimum number of clusters 2 dan Maximum number of clusters 4, lalu
klik tombol Continue.
4. Kemudian klik icon Plots, akan tampak pada layar :
Klik Dendogram. Pada kolom Icicle, pilih none. Lalu klik icon Continue
5. Klik icon Methods, akan tampak pada layar :
Analisis Cluster 2 - 10
Laboratorium Perencanaan dan Perancangan Sistem Ruang
PWK - UNISBA
Pilih Ward’s Method pada Cluster Method. Teknik pengukuran similaritas Squared
Euclidean distance merupakan default pada SPSS. Karena dalam penelitian ini
menggunakan teknik pengukuran tersebut, sehingga option tersebut tidak perlu
diganti. Pada kolom Transform Values, pilih Z score pada Standardize. Lalu
lanjutkan dengan mengklik icon continue.
6. Klik icon Save, akan tampak pada layar :
Analisis Cluster 2 - 11
Laboratorium Perencanaan dan Perancangan Sistem Ruang
PWK - UNISBA
7. Terakhir, tekan tombol OK. SPSS akan menampilkan output analisis cluster.
Data yang digunakan adalah data dari dokumen BPS, diambil dari
Kabupaten Karawang dalam Angka tahun 2005. Data ini adalah data 30 kecamatan
yang ada di kabupaten Karawang. Data tersebut kami bagi ke dalam empat bagian,
yaitu empat bagian menurut jenis fasilitas yang ada. Fasilitas tersebut yaitu fasilitas
pendidikan, fasilitas kesehatan, fasilitas peribadatan, dan fasilitas perdagangan dan
jasa.
Adapun data fasilitas pendidikan antara lain jumlah TK, SD, SMP, dan
SMA. Sedangkan fasilitas kesehatan antara lain jumlah poliklinik, rumah bersalin,
puskesmas, dan apotek. Untuk fasilitas peribadatan penulis memilih jumlah masjid,
gereja katolik, gereja protestan, dan vihara. Untuk fasilitas perdagangan dan jasa
antara lain jumlah supermaket, hotel, dan jumlah bank. Penggabungan data
keseluruhan ada di halaman berikut. Jumlah variabel yang ada terlalu banyak,
sehingga penulis memutuskan untuk menggunakan Analisis Faktor untuk mereduksi
jumlah variabel, dan mengelompokkan variabel-variabel yang ada ke dalam
“faktor”.
Ada delapan poin yang harus diperhatikan dalam pembentukan faktor, yaitu
(1)KMO dan Barlett’s Test; (2)Anti Image Matrices; (3)Communalities; (4)Total
Variance Explained; (5)Scree Plot; (6)Component Matrix; (7)Rotated Component
Matrix; dan (8)Component Transformation Matrix. Namun, karena fokus utama
makalah ini ada pada Analisis Cluster, penulis tidak memasukkan semua poin di
atas.
Analisis Cluster 2 - 12
Laboratorium Perencanaan dan Perancangan Sistem Ruang
PWK - UNISBA
Tabel 2 Jumlah Fasilitas Pendidikan, Kesehatan, Peribadatan, dan Fasilitas Perdagangan dan Jasa di Kabupaten Karawang
Tahun 2005 Berdasarkan Kecamatan
Sarana Pendidikan Kesehatan Peribadatan Perdagangan dan Jasa
No. Kecamatan Rumah Gereja Gereja
TK SD SMP SMA Poliklinik Puskesmas Apotik Masjid Vihara Supermarket Hotel Bank
Bersalin Katolik Protestan
1 Pangkalan 1 32 2 1 1 32 2 1 1 32 2 1 1 32 2
2 Tegalwaru 0 32 5 1 0 32 5 1 0 32 5 1 0 32 5
3 Ciampel 0 25 4 1 0 25 4 1 0 25 4 1 0 25 4
4 Telukjambe 4 43 3 2 4 43 3 2 4 43 3 2 4 43 3
Barat
5 Telukjambe 4 44 5 0 4 44 5 0 4 44 5 0 4 44 5
Timur
6 Klari 5 55 7 2 5 55 7 2 5 55 7 2 5 55 7
7 Cikampek 9 45 9 4 9 45 9 4 9 45 9 4 9 45 9
8 Purwasari 0 36 4 4 0 36 4 4 0 36 4 4 0 36 4
9 Tirtamulya 0 43 4 1 0 43 4 1 0 43 4 1 0 43 4
10 Jatisari 1 40 4 3 1 40 4 3 1 40 4 3 1 40 4
11 Banyusari 2 26 3 0 2 26 3 0 2 26 3 0 2 26 3
12 Kotabaru 8 45 6 5 8 45 6 5 8 45 6 5 8 45 6
13 Cilamaya Kulon 0 44 3 7 0 44 3 7 0 44 3 7 0 44 3
14 Cilamaya 1 47 6 0 1 47 6 0 1 47 6 0 1 47 6
Wetan
15 Lemahabang 1 37 5 0 1 37 5 0 1 37 5 0 1 37 5
16 Talagasari 0 39 3 2 0 39 3 2 0 39 3 2 0 39 3
17 Majalaya 0 19 2 0 0 19 2 0 0 19 2 0 0 19 2
18 Karawang 5 42 7 15 5 42 7 15 5 42 7 15 5 42 7
Timur
19 Karawang Barat 8 87 14 31 8 87 14 31 8 87 14 31 8 87 14
20 Rawamerta 0 35 5 0 0 35 5 0 0 35 5 0 0 35 5
12
Laboratorium Perencanaan dan Perancangan Sistem Ruang
PWK - UNISBA
Commun alities
Initial Extraction
Jumlah TK Jumlah SD Jumlah 1.000 .716
SMP Jumlah SMA Jumlah 1.000 .614
Poliklinik 1.000 .655
Jumlah Rumah Bersalin Jumlah 1.000 .873
Puskesmas Jumlah Apotik 1.000 .667
Jumlah Masjid 1.000 .746
Jumlah Gereja Kat olik Jumlah Gereja 1.000 .473
Protest an Jumlah Vihara 1.000 .829
Jumlah Supermarket 1.000 .759
Jumlah Hotel 1.000 .858
Jumlah Bank 1.000 .846
1.000 .891
1.000 .879
1.000 .714
1.000 .822
14
Laboratorium Perencanaan dan Perancangan Sistem Ruang
PWK - UNISBA
Component
1 2 3
Jumlah Gereja Protestan .816 .298 .303
Jumlah Supermarket Jumlah .790 .113 .492
Masjid .778 .391 .025
Jumlah Vihara .757 .513 .234
Jumlah Bank .750 .007 .510
Jumlah SD Jumlah .749 .119 .196
SMA Jumlah SMP .735 .271 .509
Jumlah Puskesmas Jumlah .614 .497 .177
Gereja Kat olik Jumlah TK .610 .264 .178
Jumlah Rumah Bersalin .054 .923 .051
Jumlah Poliklinik .334 .749 .208
Jumlah Hotel .430 .714 .227
Jumlah Apotik .105 .156 .795
.285 .065 .793
.458 .349 .705
Extract ion Method: Principal Component Analy sis.
Rotation Method: Varimax with Kaiser Normalization.
a. Rotation conv erged in 7 it erations.
Component 1 2 3
1 .760 .455 .464
2 -.145 .815 -.561
3 -.633 .359 .686
15
Laboratorium Perencanaan dan Perancangan Sistem Ruang
PWK - UNISBA
Cas e
5 :Te l u k j a m b e Ti m u r
2 3 :Re n g a s d e n g k l o k
4 :Te l u k j a m b e Ba ra t
1 4 :Ci l a m a y a We ta n
1 8 :Ka ra wa n g Ti m u r
1 3 :Ci l a m a y a Ku l o n
1 9 :Ka ra wa n g Ba ra t
1 5 :L e m a h a b a n g
2 2 :Ku ta wa l u y a
2 0 :Ra wa m e rta
1 6 :Ta l a g a s a ri
3 0 :Pa k i s j a y a
2 1 :Te m p u ra n
2 4 :J a y a k e rta
1 1 :Ba n y u s a ri
9 :Ti rta m u l y a
1 7 :M a j a l a y a
1 :Pa n g k a l a n
2 8 :Ti rta j a y a
2 9 :Ba tu j a y a
1 2 :Ko ta b a ru
2 :Te g a l wa ru
7 :Ci k a m p e k
2 7 :Ci b u a y a
8 :Pu rwa s a ri
1 0 :J a ti s a ri
2 6 :Ci l e b a r
3 :Ci a m p e l
2 5 :Pe d e s
6 :Kl a ri
Number of c lus ters
1 X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
2 X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
3 X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
4 X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
5 X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
6 X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
7 X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
8 X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
9 X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
10 X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
11 X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
12 X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
13 X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
14 X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
15 X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
16 X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
17 X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
18 X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
19 X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
20 X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
21 X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
22 X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
23 X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
24 X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
25 X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
26 X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
27 X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
28 X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
29 X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
24
Laboratorium Perencanaan dan Perancangan Sistem Ruang
PWK - UNISBA
C A S E 0 5 10 15
20 25
Label Num +---------+---------+---------+-------
--+---------+
Ciampel 3 -+
Cibuaya 27 -+
Pangkalan 1 -+
Tegalwaru 2 -+
Pakisjaya 30 -+
Jatisari 10 -+
Jayakerta 24 -+
Banyusari 11 -+
Pedes 25 -+-+
Majalaya 17 -+ |
Kutawaluya 22 -+ |
Telukjambe Timur 5 -+ |
Lemahabang 15 -+ |
Cilebar 26 -+ |
Klari 6 -+ +---------------------+
Kotabaru 12 -+-+ |
Telukjambe Barat 4 -+ | |
Tirtamulya 9 -+ | |
Cilamaya Kulon 13 -+-+ |
Tempuran 21 -+ |
Tirtajaya 28 -+ +-------------+
Cilamaya Wetan 14 -+ | |
Batujaya 29 -+ | |
Purwasari 8 -+ | |
Rawamerta 20 -+---+ | +---------+
Talagasari 16 -+ +-----+ | | |
Rengasdengklok 23 -----+ +-------------+ | |
Karawang Timur 18 -----------+ 25 | |
Karawang Barat 19 ---------------------------------------+ |
Cikampek 7 -------------------------------------------------+
Gambar 4 Dendogram Hasil Analisis Cluster
Laboratorium Perencanaan dan Perancangan Sistem Ruang
PWK - UNISBA
2.8 Referensi
terlantar akibat faktor sosial, ekonomi, dan budaya. Maka dari itu perlu
adanyaperhatian ekstra dari pihak pemerintah untuk menangani permasalahan ini.
Salah satu usaha penanganan lansia oleh pemerintah adalah pembentukan
wilayah pembinaan dengan menggunakan analisis cluster mtoda hirarki. Adapun data
lansia yang terlantar di Indonesia tahun 2012 adalah sebagai berikut:
Tabel
Kriteria Keterlantaran Lansia Menurut Provinsi
Prosentase (%)
Makan Lauk
Makan Tidak
PROVINSI Tidak Pauk
makanan Memiliki mempunyai
pernah berprotein Bila sakit
pokok <21X pakaian tempat
sekolah/ tinggi <4X tidak diobati
dalam < 4 stel tetap untuk
tamat SD dalam
seminggu tidur
seminggu
Sumatera Utara 53,13 28,67 35,74 16,71 3,48 3,33
Sumatera Barat 47,48 38,23 17,48 20,60 0,90 4,05
Riau 67,72 50,59 18,43 9,95 1,58 3,34
Jambi 75,99 44,10 29,77 27,94 1,76 2,55
Sumatera Selatan 65,69 58,39 27,90 24,67 2,57 5,18
Bengkulu 71,37 32,02 35,60 40,64 2,17 4,29
Lampung 80,64 35,59 41,56 34,15 1,48 2,78
Dki Jakarta 37,80 56,38 12,28 67,24 1,45 2,78
Jawa Barat 70,84 70,48 31,37 17,17 1,82 5,32
Jawa Tengah 79,30 35,99 16,25 19,36 1,89 3,97
D.I. Yogyakarta 76,05 46,27 11,35 17,45 1,17 4,72
Jawa Timur 82,76 30,86 15,13 20,77 27 2,01 3,55
Bali 77,96 42,28 6,28 25,74 0,34 4,87
NTB 86,92 33,09 23,48 48,28 3,20 4,64
NTT 87,36 56,75 58,67 39,77 1,42 8,31
Kalimantan Barat 63,48 54,34 38,60 29,46 3,87 7,51
Kalimantan Timur 60,37 50,29 18,78 28,13 6,69 2,68
Kalimantan Selatan 76,93 38,72 16,65 29,37 2,77 7,07
Kalimantan Tengah 73,43 52,45 18,18 12,72 1,11 1,01
Sulawesi Utara 51,30 58,14 25,58 11,08 1,84 2,89
Sulawesi Tengah 66,01 54,47 16,29 32,81 2,47 8,66
Sulawesi Selatan 77,62 58,74 10,93 24,03 3,70 6,89
Sulawesi Tenggara 77,65 60,91 3,19 17,78 1,07 8,78
Irian Jaya 52,32 70,04 25,37 16,84 6,58 19,62
Laboratorium Perencanaan dan Perancangan Sistem Ruang
PWK - UNISBA
Pertanyaan:
1. Teori:
a. Jelaskan tujuan analisis cluster dalam ilmu perencanaan ?
b. Jelaskan metoda perhitungan jarak dalam analisis cluster ?
c. Sebutkan konsep dasar penggunaan analisis cluster ?
d. Jelaskan metode agglomerative dan Ward’s Error Sum of Square Methods ?
2. Berdasarkan hasil output analisis di atas, maka jelaskanlah:
a. 3 cluster yang terbentuk dan anggota masing-masing cluster
b. Variabel yang membentuk setiap cluster
c. Objek/ responden yang memiliki jarak euclidian terkecil
Agglomeration Schedule
Cluster Combined Stage Cluster First Appears
Stage Coefficients Next Stage
Cluster 1 Cluster 2 Cluster 1 Cluster 2
24 1 7 58.423 19 23 0
4. Berapa kelompok cluster yang terbentuk beserta anggotanya, dengan jarak 2,0 ?
C A S E 0 5 10 15 20 25
Label Num +---------+---------+---------+---------+---------+
A 1 ─┐
B 2 ─┼───┐
C 3 ─┘ ├───────────────────────────────────────────┐
E 5 ─┬─┐ │ │
F 6 ─┘ ├─┘ │
D 4 ───┘ │
V 22 ─┐ │
W 23 ─┼───┐ │
K 11 ─┘ ├───┐ │
I 9 ─┬─┐ │ │ │
L 12 ─┘ ├─┘ │ │
G 7 ─┬─┤ │ │
H 8 ─┘ │ ├───────────────────────────────────────┘
29
J 10 ───┘ │
P 16 ───┬───┐ │
Q 17 ───┘ │ │
N 14 ─┬─┐ ├─┘
O 15 ─┘ ├─┐ │
Y 25 ───┘ │ │
M 13 ─┬─┐ ├─┘
X 24 ─┘ ├─┤
U 21 ───┘ │
R 18 ─┬─┐ │
T 20 ─┘ ├─┘
S 19 ───┘