NIM : 107094003053
Descriptives
Descriptive Statistics
Analisis :
Tabel ini merupakan table Deskriptif Statistik, yang mendeskriptifkan data-data (minimum, maximum, mean-
rataan, standar deviasi) dalam table
Quick Cluster
Initial Cluster Centers
Cluster
1
2 3
Zscore(assets) 3,66561 -,62473 -,65942
Zscore(Hi) ,61953 4,24167 1,44979
Zscore(Low) -,01218 4,51000 1,38708
Zscore(Close) ,07490 4,60373 1,04523
Zscore(Freq) ,49193 -,47962 -,47949
Output ini adalah tampilan pertama (initial) proses clustering data sebelum dilakukan iterasi. Tapi, output ini
tidak dianalisis, karena yang akan dianalisis adalah hasil akhir cluster dari proses clustering sesudah iterasi
Iteration History(a)
a Convergence achieved due to no or small change in cluster centers. The maximum absolute coordinate change for any center is ,
000. The current iteration is 3. The minimum distance between initial centers is 4,821.
Output ini menyatakan telah terjadi 3 kali proses iterasi, hingga menghasilkan Hasil Akhir Cluster (Final
Cluster Centers)
Cluster
1 2 3
Zscore(assets) 1,61235 -,62473 -,29123
Zscore(Hi) -,05677 4,24167 -,20073
Zscore(Low) -,22461 4,51000 -,18058
Zscore(Close) -,20433 4,60373 -,18932
Zscore(Freq) 1,74156 -,47962 -,32433
X = µ + z.
Dimana :
X = Rata-rata sampel (dalam hal ini rata-rata variable pada cluster tertentu)
µ = Rata-rata populasi
z = Nilai standardisasi yang didapat pada SPSS
= Standar deviasi
Contoh Perhitungannya :
a. Rata-Rata Assets cluster 1 = 12160,84 + (1,61 x 17903,47) = 40985,43
b. Rata-Rata Assets cluster 2 = 12160,84 + (-0,625 x 17903,47) = 971,17
c. Rata-Rata Assets cluster 3 = 12160,84 + (-0,29 x 17903,47) = 6968,84
Setelah terbentuk 3 cluster, langkah selanjutnya adalah melihat apakah variable-variabel yang terbentuk
mempunyai perbedaan tiap cluster, melalui pengujian output ANOVA
ANOVA
Cluster Error
Mean Square df Mean Square df F Sig.
Zscore(assets) 6,243 2 ,523 22 11,927 ,000
Zscore(Hi) 9,405 2 ,236 22 39,872 ,000
Zscore(Low) 10,597 2 ,128 22 83,086 ,000
Zscore(Close) 11,039 2 ,087 22 126,373 ,000
Zscore(Freq) 7,233 2 ,433 22 16,690 ,000
The F tests should be used only for descriptive purposes because the clusters have been chosen to maximize the differences among
cases in different clusters. The observed significance levels are not corrected for this and thus cannot be interpreted as tests of the
hypothesis that the cluster means are equal.
Analisis :
Kolom cluster menunjukkan besaran between cluster mean, sedangkan kolom Error menunjukkan besaran
within cluster mean, sehingga kolom F :
F = Cluster
Error
Contoh :
Angka F (pada ZHi) = 9,405/0,236 = 39,85 sebanding dengan 39,872 (perbedaan angka mungkin karena
pembulatan)
Pada prinsipnya, semakin besar angka F suatu variable dan angka signifikannya di bawah 0,05, maka semakin
besar pula perbedaan variable tersebut pada ketiga cluster yang terbentuk.
Sebagai contoh :
Pada variable Close, angka F = 126,373 dengan angka sig. 0,000 yang berarti signifikansi adalah nyata, atau
dengan kata lain, factor Close sangat memmbedakan karakteristik ketiga cluster
Sekarang kita bandingkan, angka F variable ZAssets (11,927) lebih kecil dari angka F variable ZClose
(126,373), hal itu berarti perbedaan assets jauh lebih kecil dari perbedaan Close antar responden pada ketiga
cluster
Cluster 1 4,000
2 1,000
3
20,000
Valid 25,000
Missing ,000
Analisis :
Dari table di atas didapat :
1. Responden yang masuk ke cluster 1 sebanyak 4 responden
2. Responden yang masuk ke cluster 2 sebanyak 1 responden
3. Responden yang masuk ke cluster 3 sebanyak 20 responden
Tidak ada variable yang hilang (missing), karena semua responden (25 resonden) terpeta pada ketiga cluster.
Proximities
Case Processing Summary(a)
Cases
Valid Missing Total
Per Per
cen cen Per
N t N t N cent
96, 4,0 100
24 1 25
0% % ,0%
a Squared Euclidean Distance used
Cluster
Proximity Matrix
Analisis :
Tabel menyatakan matrix proximity, dengan angka yang tertera adalah jarak (distance) antara 2 buah variable
Seperti diketahui, langkah pertama cluster, adalah melakukan pengukuran tterhadap kesamaan (similarity) antar
variable, sesuai tujuan cluster untuk mengelompokkan variable yang sama (similar)
Contoh :
Jarak antara variable 1 (Sumatera Utara) dengan variable 2 (Sumatera Barat) adalah 3, 891
Jarak antara variable 1 (Sumatera Utara) dengan variable 3 (Riau) adalah 3, 485
Analisis :
Tabel di atas adalah hasil proses clustering dengan metode Between Group Linkage
Setelah jarak antar variable diukur dengan cara Euclidean, maka dilakukan pengelompokkan variable secara
hierarki, yaitu pengelompokkan dilakukan secara bertingkat, satu demi satu, atau dari terbentuknya cluster yang
banyak, hingga akhirnya terbentuk 1 cluster, dengan cara Agglomerasi
Pada Stage 1 : terbentuk 1 cluster dengan anggotanya variable 3 (Riau) dan 19 (Kalimantan Tengah), dengan
coeffisien 0,781, yang menyatakan jarak antar varibel 3 dan 19, dan ini adalah jarak yang terdekat dari sekian
banyak kombinasi jarak dari 24 variabel yang ada. Pada kolom Next stage, tertulis angka 6, yang berarti
langkah clustering selanjutnya dengan melihat stage 6
Pada Stage 6 : Variabel 3 membentuk cluster dengan variable 2 (Sumatera Barat). Dengan demikian, sekarang
cluster terdiri dari 3 variabel, 2 (Sumaera barat), 3 (Riau) dan 19 (Kalimantan Tengah), dengan jarak rata-rata :
- Jarak variable 3 dan 19 (Pada Proximity Matrix) = 0,781
- Jarak variable 2 dan 3 = 1,379
- Jadi, jarak rata-rata = (0,781+1,379)/2 = 1,08
Demikian seterusnya, hingga terbentuk 1 cluster saja (divisualisasikan dalam Dendogram)
Cluster Membership
Jawaban :
a. Jika terbentuk 2 cluster
1. Cluster 1 : 23 Provinsi di Irian Jaya
2. Cluster 2 : Irian Jaya
b. Jika terbentuk 3 cluster
1. Cluster 1 : 22 Provinsi di luar DKI Jakarta dan Irian Jaya
2. Cluster 2 : DKI Jakarta
3. Cluster 3 : Irian Jaya
Vertical Icicle
Case
U
T
B
T
G
G
B
U
T
LI
IA
I
U
A
R
H
M
A
:N
H
:N
N
N
A
Y
A
T
L
N
R
:R
T
A
S
:B
L
U
T
H
A
R
U
N
A
A
U
R
IM
R
T
E
A
U
5
G
R
R
L
K
A
A
P
A
R
IM
:S
A
A
3
1
3
J
:J
N
1
T
G
G
N
A
A
L
B
N
T
A
T
K
A
:S
U
4
E
U
B
N
N
K
0
A
IA
B
L
A
:S
W
T
2
W
T
E
E
E
2
N
:L
A
:IR
E
IJ
N
Y
2
S
:B
L
A
T
R
3
A
W
G
7
A
A
N
K
E
T
E
O
:S
6
T
:D
N
4
:J
N
A
:J
R
T
2
IY
A
A
T
1
9
E
M
8
IM
:J
N
1
T
2
IM
T
:D
N
U
0
A
U
A
IM
M
1
A
:S
L
:S
IM
L
1
A
A
1
:K
2
L
1
:K
:S
AL
7
:K
6
5
1
:K
1
9
Number of clusters
8
1
1 X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
2 X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
3 X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
4 X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
5 X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
6 X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
7 X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
8 X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
9 X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
10 X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
11 X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
12 X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
13 X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
14 X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
15 X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
16 X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
17 X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
18 X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
19 X X X X X X X X X X X X X X X X X X X X X X X X X X X X X
20 X X X X X X X X X X X X X X X X X X X X X X X X X X X X
21 X X X X X X X X X X X X X X X X X X X X X X X X X X X
22 X X X X X X X X X X X X X X X X X X X X X X X X X X
23 X X X X X X X X X X X X X X X X X X X X X X X X X
Jawaban
c. Analisis Dendogram
Proses Aggloomerasi dimulai pada skala 0, dengan ketentuan jika sebuah garis dekat dengan angka 0,
maka variable-variabel yang terwakili dengan garis tersebut semakin mungkin membentuk cluster
1. 3 dan 19; 11 dan 13; 10, 12, dan 18; 4 dan 6; membentuk clusternya masing-masing, sehingga
terbentuk 4 cluster pada proses pertama, dan yang lainnya berdiri sendiri
2. Cluster yang terbentuk :
- Cluster 3 dan 19 bergabung dengan var 2, 20 membentuk 1 cluster
- 21 dan 22
- Cluster 11 & 13 bergabung dengan cluster 10, 12, & 18
- Cluster 4 & 6 bergabung dengan var 1, 7
- 5 dan 17
3. Cluster yang terbentuk pada proses 3 :
- Cluster 3, 19, 20, 2 bergabung dengan var 9
- Cluster 21,22 bergabung dengan var 23
- Cluser 11, 13, 10, 12, 18 bergabung dengan var 14
- Cluster 4, 6, 1, 7 bergabung dengan var 16
Begitu seterusnya hingga terbentuk 1 cluster, yang merupakan gabungan dari cluster sebelumnya dan
variable 24 - Irian Jaya
Soal no. 3
Produksi Perikanan Laut Yang Dijual Di TPI (Tempat Penjualan Ikan) Menurut Provinsi, 2005-
2009 (Ton)
6 DKI Jakarta 26 553 24 881 35 348 39 820 30 362
7 Jawa Barat 23 150 48 958 54 092 54 906 34 935
8 Jawa Tengah 152 352 146 284 163 856 159 307 158 961
10 Jawa Timur 60 058 41 259 58 799 92 489 104 634
12 Bali 15 828 8 108 20 206 18 821 34 706
16 Kalimantan Sel 8 510 6 579 14 850 15 528 17 931
20 Sulawesi Selatan 26 803 23 209 29 779 33 166 35 612
Analisis :
QCL_1 menunjukkan provinsi masuk ke cluster mana
QCL_2 menunjukkan jaraknya
Jadi, dari QCL_1, yang termasuk :
Cluster 1 : 19 Provinsi selain Jawa Tengah, Jawa Barat, dan Jawa Timur
Cluster 2 : Jawa Tengah
Cluster 3 : Jawa Barat dan Jawa Timur
Descriptives
Descriptive Statistics
Analisis :
Tabel ini merupakan table Deskriptif Statistik, yang mendeskriptifkan data-data (minimum, maximum, mean-
rataan, standar deviasi) dalam table
Quick Cluster
Initial Cluster Centers
Cluster
1 2 3
Zscore(duaribu_lima) -,47781 4,06497 1,31003
Zscore(duaribu_enam) -,50363 4,07986 ,78647
Zscore(duaribu_tujuh) -,56997 3,97818 1,06051
Zscore(duaribu_delapan) -,62110 3,62830 1,84305
Zscore(duaribu_sembilan)
-,62130 3,43484 2,04476
Output ini adalah tampilan pertama (initial) proses clustering data sebelum dilakukan iterasi. Tapi, output ini
tidak dianalisis, karena yang akan dianalisis adalah hasil akhir cluster dari proses clustering sesudah iterasi
Iteration History(a)
Output ini menyatakan telah terjadi 2 kali proses iterasi, hingga menghasilkan Hasil Akhir Cluster (Final
Cluster Centers), di bawah ini :
Final Cluster Centers
Cluster
1 2 3
Zscore(duaribu_lima) -,29386 4,06497 ,75919
Zscore(duaribu_enam) -,31022 4,07986 ,90719
Zscore(duaribu_tujuh) -,31413 3,97818 ,99515
Zscore(duaribu_delapan) -,33212 3,62830 1,34098
Zscore(duaribu_sembilan)
-,30215 3,43484 1,15305
Dimana :
X = Rata-rata sampel (dalam hal ini rata-rata variable pada cluster tertentu)
µ = Rata-rata populasi
z = Nilai standardisasi yang didapat pada SPSS
= Standar deviasi
Contoh Perhitungannya :
a. Rata-Rata Assets cluster 1 = 16170,27 + (-0,29 x 33501,25) = 6454.91
b. Rata-Rata Assets cluster 2 = 16170,27 + (4,07 x 33501,25) = 152520,36
c. Rata-Rata Assets cluster 3 = 16170,27 + (0,76 x 33501,25) = 41631,22
Setelah terbentuk 3 cluster, langkah selanjutnya adalah melihat apakah variable-variabel yang terbentuk
mempunyai perbedaan tiap cluster, melalui pengujian output ANOVA
ANOVA
Cluster Error
Mean Square df Mean Square Df F Sig.
Zscore(duaribu_lima) 9,659 2 ,089 19 109,072 ,000
Zscore(duaribu_enam) 10,060 2 ,046 19 217,149 ,000
Zscore(duaribu_tujuh) 9,841 2 ,069 19 141,799 ,000
Zscore(duaribu_delapan) 9,428 2 ,113 19 83,585 ,000
Zscore(duaribu_sembilan)
8,096 2 ,253 19 31,992 ,000
The F tests should be used only for descriptive purposes because the clusters have been chosen to maximize the differences among
cases in different clusters. The observed significance levels are not corrected for this and thus cannot be interpreted as tests of the
hypothesis that the cluster means are equal.
Analisis :
Kolom cluster menunjukkan besaran between cluster mean, sedangkan kolom Error menunjukkan besaran
within cluster mean, sehingga kolom F :
F = Cluster
Error
Contoh :
Angka F (pada Zduaribu_enam) = 10,060/0,046 = 218,7 sebanding dengan 217,149 (perbedaan angka mungkin
karena pembulatan)
Pada prinsipnya, semakin besar angka F suatu variable dan angka signifikannya di bawah 0,05, maka semakin
besar pula perbedaan variable tersebut pada ketiga cluster yang terbentuk.
Sebagai contoh :
Pada variable duaribu_enam, angka F = 217,149 dengan angka sig. 0,000 yang berarti signifikansi adalah nyata,
atau dengan kata lain, factor Close sangat membedakan karakteristik ketiga cluster
Sekarang kita bandingkan, angka F variable Zduaribu_sembilan (31,992) lebih kecil dari angka F variable
Zduaribu_enam (217,149), hal itu berarti perbedaan pada tahun duaribu_sembilan jauh lebih kecil dari
perbedaan pada tahun duaribu_enam antar responden
Analisis : pada ketiga cluster
Number of Cases in each Cluster Dari table di atas didapat :
1. Responden yang masuk ke cluster 1 sebanyak 19 responden
Cluster 1 19,000
2 1,000
2. Responden yang masuk ke cluster 2 sebanyak 1 responden
3 2,000 3. Responden yang masuk ke cluster 3 sebanyak 2 responden
Tidak ada variable yang hilang (missing), karena semua responden (22
resonden) terpeta pada ketiga cluster.
Valid 22,000
Missing ,000