Analisis Klaster
Analisis Klaster
• misalkan seorang peneliti boleh saja mempunyai banyak variabel yang akan dikaji;
• namun setelah ia mengeksplorasi data, diketahui bahwa beberapa variabel cenderung
mempunyai nilai yang berdekatan (tidak begitu bervariasi) sehingga membentuk kelompok-
kelompok,
• situasi seperti ini mirip dengan keadaan yang ditemui pada analisis faktor,
• hanya saja peneliti tidak mempunyai dugaan bahwa ada suatu konstruk yang tak terobservasi
yang direpresentasikan oleh kedekatan nilai tersebut,
• begitu pula, kedekatan nilai ini juga mempunyai keacakan dan tidak mencerminkan inter-
korelasi.
TUJUAN ANALISIS KLASTER
• analisis klaster berguna untuk mengelompokkan data observasi
ataupun variabel-variabel ke dalam suatu pengelompokan yang
sedemikian rupa sehingga setiap kelompok mempunyai homogeneitas;
• namun karena data yang digunakan dalam analisis klaster biasanya merupakan
sampel dari suatu populasi,
• agar dapat digunakan untuk generalisasi, maka outlier tetap harus dikeluarkan dari sampel yang
dianalisis agar kesimpulan tidak bias.
• dalam analisis juga perlu diperhatikan agar variabel yang saling berkorelasi
sebaiknya dikeluarkan dari model agar keberimbangan pada pembobotan dalam
perhitungan distance di antara kelompok bisa dipertahankan.
PENGUKURAN KESAMAAN
• konsep penting dalam analisis klaster adalah kesamaan —atau disebut
similarity (similaritas) atau proximity (proksimitas atau kedekatan).
• analis dapat memvisualkan kesamaan tersebut secara geometris dalam
bentuk kedekatan antar unit data, misal sbb:
secara intuitif dari refleksi
terhadap visualisasi tersebut
bisa disimpulkan bahwa ada 3
kelompok (klaster);
namun,tentunya analis perlu
dukungan argumen matematis
untuk menjelaskan mengapa
setiap unit tersebut
terkelompok menjadi 3 klaster.
JARAK SEBAGAI INDIKASI KESAMAAN
• kesamaan dalam analisis klaster ditentukan berdasarkan kedekatan
jarak di antara unit dalam data set.
• setelah itu baru kemudian menerapkan metode analisis klaster yang diperlukan.
METODE KLASTERISASI
• pada dasarnya metode klasterisasi dikelompokkan menjadi dua pendekatan:
• pendekatan hierarkikal —disebut agglomerative hierarchical methods; dan
• pendekatan nonhierarkikal
• pada awalnya karena dalam data set tersebut ada 6 unit data, maka akan
dipandang adanya 6 klaster.
• pada iterasi pertama ini, terbentuk 5 klaster, yaitu C1 (U1dan U2), U3, U4, U5
dan U6.
CONTOH NEAREST NEIGHBOR METHOD
• analis bisa mengulang kembali perhitungan untuk menentukan
pasangan unit yang akan membentuk berikutnya apabila klaster yang
ada belum bermakna.
• dari perhitungan yang tersaji di tabel, jarak terdekat berikutnya terjadi di antara U3
dan U4, sehingga keduanya bisa digabungkan menjadi klaster kedua atau C2
• pada iterasi kedua ini, terbentuk 4 klaster, yakni C1 (U1 dan U2), C2 (U3 dan U4), C5
dan C6
CONTOH NEAREST NEIGHBOR METHOD
• setelah itu baru kemudian melakukan perhitungan ESS untuk menentukan unit mana yang dapat
dikombinasikan menjadi suatu klaster.
CONTOH WARD METHOD
• pada iterasi
pertama,
berdasarkan nilai
ESS terendah, maka
bisa ditentukan
bahwa klaster
pertama atau C1
yang terbentuk
berisi U5 dan U6
CONTOH WARD METHOD
• pada iterasi kedua, ESS
terendah ditunjukkan
kombinasi klaster C1 (U5 dan
U6) dan klaster C2 (U3 dan
U4) dengan ESS masing-
masing 4 dan 14,75 (lih. tabel
sblm) atau total 18,75
• namun untuk keperluan klasterisasi pada data set yang sederhana, metode
single linkage seringkali juga sudah memadai.
• dalam metode K-means, analis perlu menentukan jumlah klaster dan titik sentral terlebih
dahulu secara manasuka, baru kemudian menentukan unit apa yang akan ditempatkan pada
klaster yang mana; sbb:
• hitung jarak antara masing-masing unit dengan centroid masing-masing klaster; dan jarak minimum
suatu unit dengan centroid klaster menunjukkan unit tersebut berada atau menjadi anggota pada
klaster tersebut,
• Masukkan unit tersebut ke dalam klaster dengan centroid terdekat, dan ulangi langkah
pembandingan,
• Apabila tidak tersedia lagi unit yang dapat dipindah menjadi anggota klaster tertentu, maka alokasi
dipandang sudah stabil dan proses iterasi selesai.
• simak juga video pembelajaran pada tautan yang dibagikan di grup kelas untuk melihat
contoh klasterisasi dengan K-means menggunakan aplikom SPSS.
TGS 04
1. simak juga tautan video
pembelajaran berikut, dan
tuliskan apa saja prosedur
yang dilakukan untuk
mengerjakan analisis klaster
menggunakan aplikom SPSS.
• https://youtu.be/hsZL-jbmWK4
• https://youtu.be/t_i2LxDAI6I