Presentasi Cluster Analysis - KLMPK 4

CLUSTER ANALYSIS
OLEH : KELOMPOK 4
ARIESTA CHRISTIAN BEGAWAN AZIZ
JALIL SETIAWAN JAMAL
DEFINISI DAN CIRI CLUSTER
DEFINISI ANALISIS CLUSTER
• TEKNIK EKSPLORASI MULTIVARIAT
• VERIFIKASI KESAMAAN
• BERTUJUAN MENGELOMPOKKAN OBJEK / DATA
CIRI-CIRI CLUSTER YANG BAIK

• HOMOGENITAS INTERNAL
• HETEROGENITAS EKSTERNAL
(Favero and Balfiore, 2019)
MENGUKUR JARAK
• EUCLIDEAN SQUARE DISTANCE

• SQUARED EUCLIDEAN DISTANCE
• MANHATTAN DISTANCE
• CHEBYSHEV DISTANCE
METODE CLUSTERING
DIVISIVE
HIERARCICHAL SINGLE LINKAGE

COMPLETE LINKAGE
CLUSTERING AGGLOMERATIVE AVERAGE LINKAGE
MEDIAN / CENTROID
WARD’S
NON-HIERARCICHAL
(Legendre and Legendre, 2012)

SINGLE LINKAGE
AVARAGE LINKAGE
COMPLETE LINKAGE
TAHAPAN DALAM ANALISIS CLUSTER
• MENENTUKAN VARIABLE ANALISIS CLUSTER

• MEMILIH DESAIN ANALISIS CLUSTER
• ASUMSI ANALISIS CLUSTER
• PEMBENTUKAN CLUSTER
• INTERPRETASI CLUSTER
• VALIDASI DAN PROFILISASI CLUSTER
CONTOH
• Dari penelitian yang dilakukan terhadap 12 kota, ingin diketahui
pengelompokan kota-kota tersebut berdasarkan instrumen 5 variabel
yaitu :
1. jumlah pendapatan kota (trilyun Rp)
2. jumlah pinjaman pemerintah kota (milyar Rp)
3. jumlah dana hibah yang dimiliki kota (milyar Rp)
4. jumlah konsumsi pemerintah kota (milyar Rp)
5. Jumlah penduduk kota (juta jiwa).
• Mengingat data yang terkumpul mempunyai variabilitas satuan, maka
perlu dilakukan langkah standardisasi atau transformasi terhadap
variabel yang relevan ke bentuk zscore, sebagai berikut :
1) Setelah keseluruhan data yang dikumpulkan tersebut diatas dientry
dalam program SPSS,selanjutnya klik menu “analyze” dan pilih sub
menu “Descriptives Statistics” lalu “Descriptives
• Masukkan ke dalam kotak VARIABLESseluruh variabel
instrumen penilai, yaitu variabel jumlah pendapatan, jumlah
pinjaman, jumlah dana hibah, jumlah konsumsi,dan jumlah
penduduk. (dalam hal ini variabel kota tidak dimasukkan
karena data bertipe string).
• Kemudian aktifkan bagian “Save standardized values as
Variables”. Abaikan bagian yang lain lalu tekan OK
• untuk menampilkan output aplikasi program SPSS.
SEBAGAI DASAR
PERHITUNGAN
Z- SCORE
TAMPILA
N
“DATAVIE
W”
LANGKAH 2
UJI ASUMSI
• UJI BAHWA SAMPEL DAPAT MEWAKILI POPULASI ATAU SAMPEL REPRESENTATIVE MELALUI UJI
KAISER-MAYER-OLKIN (KMO). HASIL UJI KMO DAPAT DILIHAT PADA TABLE DI BAWAH :
Karena nilai KMO lebih

dari 0,5, maka dapat
disimpulkan bahwa
sampel representative
dan dapat mewakili
populasi
LANGKAH 2
UJI ASUMSI
• UJI BAHWA TIDAK TERDAPAT MULTIKOLINEARITAS DENGAN MENGHITUNG NILAI VARIANS
INFLATION FACTOR (VIF). HASIL UJI VIF DAPAT DILIHAT PADA TABLE DI BAWAH :
Karena nilai VIF semua

variabel < 10, maka
tidak terdapat
multikolinearitas pada
semua variable
3
• Dari tampilan data yang tertera (hasil standardisasi/transformasi),

buka menu “Analyze”, lalu pilih sub menu “Classify” dan pilih “K-
Means Cluster…”
3
• Konsep dari metode hirarkis ini dimulai dengan menggabungkan 2

obyek yang paling mirip, kemudian gabungan 2 obyek tersebut akan
bergabung lagi dengan satu atau lebih obyek yang paling mirip
lainnya.
• Proses clustering ini pada akhirnya akan ‘menggumpal’ menjadi satu
cluster besar yang mencakup semua obyek.
• Metode ini disebut juga sebagai “metode aglomerativ”yang
digambarkan dengan dendogram.
LANGKAH SPSS
1. Masih dengan data sebelumnya, yang merupakan hasil standardisasi, buka
menu “Analyze” lalu pilih sub menu “Classify” kemudian “Hierarchical Cluster…”
hingga muncul tampilan seperti berikut ini:
2. Masukkan seluruh variabel yangtelah

distandardkan (Z-score) ke dalam bagian
“Variable(s)”. Untuk bagian “Label Casesby” isi
dengan variabel kota; sedangkan untuk bagian
“Cluster” pilih Cases; pada bagian “Display”
pilih keduanya yaitu Statistics dan Plots.
Pada bagian “Cluster Method” pilih
Between groups linkage. Kemudian
buka kotak combo Square
Euclidean distance pada
“Measure”; dan pada “Transform
Values” buka kotak combo pada
pilihan Z-score. Abaikan bagian yang
lain lalu tekan tombol “Continue”
untuk kembali ke menu utama.
MENUNJUKKAN BAHWA SEMUA DATA
SEJUMLAH 12 OBYEK TELAH DIPROSES
TANPA ADA DATA YANGHILANG.
 menujukkan matrik
jarak antar variabel
 Semakin kecil jarak
euclidean, maka
semakin mirip kedua
variabel tersebut
sehingga akan
membentuk kelompok
(cluster).
 hasil proses clustering
dengan metode
Between Group
Linkage.
 Setelah jarak antar
variabel diukur dengan
jarak euclidean, maka
dilakukan
pengelompokan, yang
dilakukan secara
bertingkat.
Apabila ditentukan dibentuk 2
cluster, maka :
 Anggota cluster 1 adalah
Kota A, B, C, D, E, dan H
Kota F,G, I, J, K, danL.
Apabila ditentukan dibentuk 3
cluster, maka :
Kota A
Kota B, C, D, E, dan H.
Apabila diinginkan dibentuk 4
cluster, maka :
Kota A Anggota cluster 2
adalah Kota Bdan KotaH
 Anggota cluster 3 adalah C,
D, dan E
 Dendogram berguna untuk
menunjukkan anggota cluster yang
ada jika akan ditentukan berapa
cluster yang seharusnya dibentuk.
 Sebagai contoh yang terlihat dalam
dendogram, apabila akan dibentuk
2 cluster, maka cluster 1
beranggotakan Kota Ksampai
dengan Kota F(sesuai urutan dalam
dendogram); dan cluster2
beranggotakan Kota D sampai
dengan Kota A.
 Demikian seterusnya dapat dengan
mudah dilihat anggota tiap cluster
sesuai jumlah cluster yang
diinginkan.
PENCIRIAN KLASTER
JUMLAH
JUMLAH
JUMLAH JUMLAH DANA HIBAH JUMLAH
KOTA KONSUMSI
KLASTER PENDAPATA PINJAMAN YANG PENDUDUK
(ANGGOTA) PEMERINTAH
N KOTA PEMERINTAH DIMILIKI KOTA
KOTA
KOTA
I A 55 5,6 9 50 25
2 B dan H 58,5 7,55 6,5 74 35
3 C, D, dan E 69 5,6 6,5 67 46,5
F, G, I, J, K,
4 83,8 7,5 8,3 84,3 51,8
dan L
• ANGKA DIPEROLEH DARI RATA-RATA NILAI SETIAP VARIABLE DARI ANGGOTA DALAM KLASTER
• DARI ANGKA DIATAS, MAKA KITA DAPAT MEMBERIKAN CIRI DAN PENAMAAN CLUSTER SESUAI
DENGAN TUJUAN PENELITIAN DAN BERSIFAT SUBJEKTIF

Presentasi Cluster Analysis - KLMPK 4

Diunggah oleh

Hak Cipta:

Format Tersedia

Anda mungkin juga menyukai

Presentasi Cluster Analysis - KLMPK 4

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Presentasi Cluster Analysis - KLMPK 4

Diunggah oleh

Hak Cipta:

Format Tersedia

CLUSTER ANALYSIS

CIRI-CIRI CLUSTER YANG BAIK

• EUCLIDEAN SQUARE DISTANCE

HIERARCICHAL SINGLE LINKAGE

(Legendre and Legendre, 2012)

• MENENTUKAN VARIABLE ANALISIS CLUSTER

Karena nilai KMO lebih

Karena nilai VIF semua

• Dari tampilan data yang tertera (hasil standardisasi/transformasi),

• Konsep dari metode hirarkis ini dimulai dengan menggabungkan 2

2. Masukkan seluruh variabel yangtelah

Anda mungkin juga menyukai