Anda di halaman 1dari 31

ANALISIS CLUSTER

Pengertian CLUSTERING
Proses pengelompokkan sejumlah obyek berdasarkan
informasi yang diperoleh dari data yang menjelaskan
hubungan antar obyek dengan prinsip untuk
memaksimalkan kesamaan antar anggota satu cluster
dan meminimumkan kesamaan antar cluster.
Manfaat
Tujuan Clustering
Clustering
Tujuan utama dari
Untuk mengidentifikasi
clustering adalah
obyek-obyek
mengelompokkan obyek-
(Recognition), untuk
obyek berdasarkan
mendukung sistem
karakteristik yang dimiliki
pendukung keputusan dan
masing-masing obyek
data mining.
(Candiasa, 2011:77).
Macam-Macam Metode CLUSTERING
1) Berbasis Metode Statistik
Terdapat dua metode clustering yang menggunakan
metode statistik sebagai basisnya, yaitu :
Metode Hirarki
Metode Non-Hirarki
Linkage
2) Berbasis Logika Fuzzy
Terdapat beberapa metode clustering berbasis fuzzy yang paling sering
digunakan: metode Fuzzy C-Means dan Fuzzy Subtractive Clustering.

3) Berbasis Neural Network

4) Metode clustering lain yang digunakan untuk optimasi centroid atau lebar
cluster, yaitu metode Genetik Algoritma (GA).
Analisis Cluster Berbasis Metode Statistik
Asumsi yang Harus Dipenuhi

Representatif
• Sampel yang diambil benar-benar bisa
mewakili populasi yang ada.
Multikolinearitas
• Kemungkinan adanya korelasi antar objek.
Proses Analisis Cluster
Memilih Ukuran Melakukan Proses
Jarak Standarisasi Data Jika
Diperlukan

Melakukan
Interpretasi Terhadap
Cluster yang Memilih Prosedur
Terbentuk Pengclusteran

Melakukan Validasi dan Profiling


Cluster
1. Memilih Ukuran Jarak

a. Jarak Euclid
• Jarak berupa akar jumlah kuadrat perbedaan nilai
untuk tiap variabel.
1. Memilih Ukuran Jarak

b. Jarak kuadrat Euclid


(Squared Euclidean Distance

• Jarak kuadrat Euclid (Squared Euclidean Distance), yaitu


jumlah kuadrat perbedaan nilai untuk tiap variabel.
1. Memilih Ukuran Jarak

c. The City Block or Manhattan


Distance

• Jarak antar dua objek merupakan jumlah nilai


perbedaan mutlak untuk tiap variabel.
1. Memilih Ukuran Jarak

d. Jarak Chebychev

• Jarak antar kedua objek dengan mengukur nilai


maksimum dari perbedaan absolut pada setiap
variabel.
2. Melakukan Proses Standarisasi Data
Jika Diperlukan

Jika data memang menpunyai satuan yang berbeda secara signifikan,


maka harus dilakukan proses standarisasi data dengan mengubah data
yang ada ke Z-Score.
3. Memilih Prosedur
Pengclusteran
4. Melakukan Interpretasi Terhadap
Cluster yang Terbentuk

Melakukan interpretasi terhadap cluster yang telah terbentuk, yang


pada intinya memberi nama spesifik untuk menggambarkan isi cluster
tersebut.
5. Melakukan Validasi dan
Profiling Cluster

Menjelaskan karakteristik setiap cluster berdasar profil tertentu. Dari data


profiling tersebut bisa dilakukan analisis lanjutan seperti analisis diskriminan.
Metode K-Means
Clustering
Pengertian K-Means Clustering
K-Means merupakan salah satu metode clustering non-
hirarki yang berusaha untuk mempartisi obyek yang ada
ke dalam bentuk satu atau lebih cluster (kelompok).
Metode ini mempartisi obyek berdasarkan
karakteristiknya, sehingga obyek yang mempunyai
karakteristik yang sama dikelompokkan ke dalam satu
cluster yang sama dan obyek yang mempunyai
karakteristik yang berbeda dikelompokkan ke dalam
cluster yang lain (Agusta, 2007).
Tujuan Pengelompokkan
Untuk meminimalkan variasi dalam satu cluster
dan memaksimalkan variasi antar cluster.
Penerapan Algoritma K-Means Clustering

VIII J di SMP Negeri 5 Singaraja


Langkah – Langkah K-Means Clustering

1
Tentukan jumlah cluster (k) yang
5 ingin dibentuk.
2
Lakukan kembali langkah 3
Tetapkan k pusat cluster awal
hingga titik pusat dari setiap
secara random.
cluster tidak berubah

4
3
Tentukan kembali titik pusat
Alokasikan semua data/obyek ke
cluster yang baru berdasarkan
dalam cluster terdekat
rata-rata
(1). Tentukan jumlah cluster (k) yang ingin
dibentuk.
Dalam makalah ini data-data yang ada akan dikelompokkan menjadi
tiga cluster.
(2). Tetapkan k pusat cluster awal secara
random
(3). Alokasikan semua data/obyek ke dalam
cluster terdekat
(4). Tentukan kembali titik pusat cluster yang
baru berdasarkan rata-rata
(5). Lakukan kembali langkah 3 hingga titik
pusat dari setiap cluster tidak berubah
ketiga pusat cluster dikelompokkan menjadi 3
dengan karakteristik sebagai berikut:

• Kelompok pertama (cluster ke-1) : berisi siswa-siswa yang


memiliki ratarata nilai tugas sekitar 75,7, rata-rata nilai kuis
sekitar 69,7, dan rata-rata nilai ulangan harian sekitar 58,3.
• Kelompok kedua (cluster ke-2) : berisi siswa-siswa yang
memiliki ratarata nilai tugas sekitar 66,6, rata-rata nilai kuis
sekitar 68,5, dan rata-rata nilai ulangan harian sekitar 82,9.
• Kelompok ketiga (cluster ke-3) : berisi siswa-siswa yang
memiliki ratarata nilai tugas sekitar 78,3, rata-rata nilai kuis
sekitar 72,9, dan rata-rata nilai ulangan harian sekitar 82,4
Dari langkah – langkah tersebut dapat
disimpulkan bahwa
• Kelompok pertama (Cluster ke-1), terdiri dari 12 orang siswa, yakni siswa
dengan nomor urut 2, 13, 14, 19, 21, 30, 31, 32, 33, 36, 38 dan 39. Pada
cluster ke-1 ini siswa tergolong memiliki kemampuan matematika rendah.
Berdasarkan hal tersebut siswa pada cluster ini diberikan remedi.
• Kelompok kedua (Cluster ke-2), terdiri dari 9 orang siswa, yakni siswa
dengan nomor urut 1, 6, 10, 15, 22, 26, 29, 34 dan 35. Pada cluster ke-2 ini
siswa tergolong memiliki kemampuan matematika sedang. Berdasarkan hal
tersebut siswa pada cluster ini diberikan remedi.
• Kelompok ketiga (Cluster ke-3), terdiri dari 19 orang siswa, yakni siswa
dengan nomor urut 3, 4, 5, 7, 8, 9, 11, 12, 16, 17, 18, 20, 23, 24, 25, 27, 28,
37 dan 40. Pada cluster ke-3 ini siswa tergolong memiliki kemampuan
matematika tinggi. Karena hal tersebut siswa pada cluster ini tidak
diberikan remedi, tetapi siswa pada cluster ini diberikan pengayaan.
SEKIAN DAN TERIMAKASIH