Anda di halaman 1dari 6

Nama : Fariza Halidatsani Azhra

NIM : 20916041

Mata Kuliah Analisis Multivariat

TUGAS 5

a. Lakukan analisis cluster menggunakan K-Mean dengan k=4. Bandingkan


rata-rata antar kelompok dari masing-masing variabel.

1. Proses normalisasi data


Sebelum dikelompokkan data perlu dinormalisasi dengan proses
normalisasi data. Output dari normalisasi data adalah Z score. Data "Z
score” inilah yang kemudian akan diolah untuk tahap pengelompokkan
(clustering) berikutnya.
Descriptive Statistics
N Minimum Maximum Mean Std. Deviation
X1 100 39.00 60.00 49.8600 4.82632
X2 100 78.00 121.00 100.7300 9.64612
X3 100 -87.00 -55.00 -71.8200 7.19761
X4 100 44.00 74.00 60.4500 5.92951
X5 100 -92.00 107.00 3.9900 40.55486
Y 100 106.00 162.00 139.2600 9.89707
Z 100 10.00 125.00 26.7900 22.48335
Valid N (listwise) 100

2. Clustering dengan K-Means (k=4)


Hasil pengolahan clustering dengan K-Means menggunakan SPSS adalah
sebagai berikut :
Final Cluster Centers
Cluster
1 2 3 4
Zscore(X1) -1.30298 .92902 -.60852 .16308
Zscore(X2) -1.30983 .93185 -.58605 .15605
Zscore(X3) 1.30480 -.93243 .59486 -.15577
Zscore(X4) -.61396 .61978 .09276 -.23958
Zscore(X5) .15524 -.13460 1.55559 -.56399
Final Cluster Centers
Cluster
1 2 3 4
Zscore(Y) -1.32055 1.04728 -.36825 -.02924
Zscore(Z) -.32318 -.13521 1.39156 -.20520
Tabel Final Cluster Centers menunjukkan hasil analisisnya untuk masing-
masing kriteria dan cluster yang dibentuk.
Ketentuan Final Cluster Centers:
1. Jika hasil perhitungan ditemukan negatif, berarti cluster yang bersangkutan ada
di bawah rata-rata total.
2. Jika hasil perhitungan ditemukan positif, berarti cluster yang bersangkutan ada
di atas rata-rata total.
Sehingga dapat disimpulkan bahwa :
a. Cluster 1 terdiri dari data yang memiliki nilai X1,X2,X4,Y,Z dibawah rata-rata
normal dan nilai X3,X5 di atas rata-rata normal.
b. Cluster 2 terdiri dari data yang memiliki nilai X3,X5,Z dibawah rata-rata normal
dan nilai X1,X2,X4,Y di atas rata-rata normal.
c. Cluster 3 terdiri dari data yang memiliki nilai X1,X2,Y dibawah rata-rata normal
dan nilai X3,X4,X5,Z di atas rata-rata normal.
d. Cluster 4 terdiri dari data yang memiliki nilai X3,X4,X5,Y,Z dibawah rata-rata
normal dan nilai X1,X2 di atas rata-rata normal.

ANOVA
Cluster Error
Mean Square df Mean Square df F Sig.
Zscore(X1) 22.996 3 .313 96 73.562 .000
Zscore(X2) 23.036 3 .311 96 73.984 .000
Zscore(X3) 23.000 3 .313 96 73.596 .000
Zscore(X4) 7.424 3 .799 96 9.288 .000
Zscore(X5) 14.453 3 .580 96 24.936 .000
Zscore(Y) 24.503 3 .266 96 92.284 .000
Zscore(Z) 9.795 3 .725 96 13.507 .000
Number of Cases in each
Cluster
Cluster 1 21.000
2 32.000
3 13.000
4 34.000
Valid 100.000
Missing .000

Tabel Number of cases in each cluster menunjukkan bahwa dengan


menggunakan metode K-Means didapatkan 4 cluster dimana diketahui
jumlah data tiap cluster yaitu, cluster 1 terdapat 21 data, cluster 2 terdapat
32 data, cluster 3 terdapat 13 data dan cluster 4 memiliki 34 data, dengan
total ada 100 data.

Dari hasil pengolahan menggunakan SPSS didapatkan data seperti pada


gambar di atas. Qcl_1 adalah hasil dari clustering k means yang menyatakan
jenis kelompok/cluster. Sedangkan untuk Qcl_2 menyatakan jarak, misal
data 1 masuk ke dalam cluster 1 dengan nilai jarak /distance sebesar
1,11607.
3. Perbandingan rata-rata antar kelompok dari masing-masing variabel

Tabel di atas menunjukkan perbandingan rata-rata antar cluster dari masing-


masing variabel.

Rata-rata
cluster 1 cluster 2 cluster 3 cluster 4
X1 49,80851 49,94792 49,78667 49,89691
X2 100,6064 100,9063 100,5867 100,8041
X3 -71,734 -71,9479 -71,6933 -71,8763
X4 60,39362 60,45833 60,28 60,45361
X5 4,691489 4,510417 7,613333 3,979381
Y 139,117 139,3958 138,9867 139,3196
Z 26,89362 26,72917 27,25333 27,07216

b. Lakukan analisis cluster menggunakan Hierarki. Berapa jumlah


kelompok yang sebaiknya dibentuk

1. Proses normalisasi data


Sebelum dikelompokkan data perlu dinormalisasi dengan proses
normalisasi data. Output dari normalisasi data adalah Z score. Data "Z
score” inilah yang kemudian akan diolah untuk tahap pengelompokkan
(clustering) berikutnya

Descriptive Statistics
N Minimum Maximum Mean Std. Deviation
X1 100 39.00 60.00 49.8600 4.82632
X2 100 78.00 121.00 100.7300 9.64612
X3 100 -87.00 -55.00 -71.8200 7.19761
X4 100 44.00 74.00 60.4500 5.92951
X5 100 -92.00 107.00 3.9900 40.55486
Y 100 106.00 162.00 139.2600 9.89707
Z 100 10.00 125.00 26.7900 22.48335
Valid N (listwise) 100
2. Clustering dengan Metode Hierarki
Hasil pengolahan clustering dengan Metode Hierarki menggunakan SPSS
adalah sebagai berikut :
Hasil dendogram menunjukkan bahwa penggabungan setiap anggota berdasarkan jarak
yang paling dekat, sehingga membentuk satu cluster yang sangat besar. Pembentukkan
jumlah cluster dapat dibentuk dengan metode cut off pada hasil dendogram. Dilakukan
cut off pada angka 6 sehingga terdapat 3 cluster dan 9 outlier.
Cluster 1 memiliki 85 data, terdiri dari data 15-90 pada dendogram (warna kuning)
Cluster 2 terdiri dari data 69,92,17 (warna biru)
Cluster 3 terdiri dari data 46,62,34 (warna hijau)
Outlier 1 yaitu data 52
Outlier 2 yaitu data 8
Outlier 3 yaitu data 81
Outlier 4 yaitu data 65
Outlier 5 yaitu data 29
Outlier 6 yaitu data 6
Outlier 7 yaitu data 9
Outlier 8 yaitu data 93
Outlier 9 yaitu data 41

Dari hasil uji cut off yang dipilih adalah cut off pada angka 6 karena menghasilkan
sedikit outlier dan dianggap yang paling baik, berikut tabel perbadingan apabila di cut
off pada angka 5,6,7.

Cut Off Cluster Outlier


5 5 11
6 3 9
7 2 10

Anda mungkin juga menyukai