Cluster

ANALISIS CLUSTER
Pengertian CLUSTERING
Proses pengelompokkan sejumlah obyek berdasarkan
informasi yang diperoleh dari data yang menjelaskan
hubungan antar obyek dengan prinsip untuk
memaksimalkan kesamaan antar anggota satu cluster
dan meminimumkan kesamaan antar cluster.
Manfaat
Tujuan Clustering
Clustering
Tujuan utama dari
Untuk mengidentifikasi
clustering adalah
obyek-obyek
mengelompokkan obyek-
(Recognition), untuk
obyek berdasarkan
mendukung sistem
karakteristik yang dimiliki
pendukung keputusan dan
masing-masing obyek
data mining.
(Candiasa, 2011:77).
Macam-Macam Metode CLUSTERING
1) Berbasis Metode Statistik
Terdapat dua metode clustering yang menggunakan
metode statistik sebagai basisnya, yaitu :
Metode Hirarki
Metode Non-Hirarki
Linkage
2) Berbasis Logika Fuzzy
Terdapat beberapa metode clustering berbasis fuzzy yang paling sering
digunakan: metode Fuzzy C-Means dan Fuzzy Subtractive Clustering.
3) Berbasis Neural Network
4) Metode clustering lain yang digunakan untuk optimasi centroid atau lebar
cluster, yaitu metode Genetik Algoritma (GA).
Analisis Cluster Berbasis Metode Statistik
Asumsi yang Harus Dipenuhi
Representatif
• Sampel yang diambil benar-benar bisa
mewakili populasi yang ada.
Multikolinearitas
• Kemungkinan adanya korelasi antar objek.
Proses Analisis Cluster
Memilih Ukuran Melakukan Proses
Jarak Standarisasi Data Jika
Diperlukan
Melakukan
Interpretasi Terhadap
Cluster yang Memilih Prosedur
Terbentuk Pengclusteran
Melakukan Validasi dan Profiling

Cluster
1. Memilih Ukuran Jarak
a. Jarak Euclid
• Jarak berupa akar jumlah kuadrat perbedaan nilai
untuk tiap variabel.
b. Jarak kuadrat Euclid

(Squared Euclidean Distance
• Jarak kuadrat Euclid (Squared Euclidean Distance), yaitu

jumlah kuadrat perbedaan nilai untuk tiap variabel.
c. The City Block or Manhattan

Distance
• Jarak antar dua objek merupakan jumlah nilai

perbedaan mutlak untuk tiap variabel.
d. Jarak Chebychev
• Jarak antar kedua objek dengan mengukur nilai

maksimum dari perbedaan absolut pada setiap
variabel.
2. Melakukan Proses Standarisasi Data
Jika Diperlukan
Jika data memang menpunyai satuan yang berbeda secara signifikan,

maka harus dilakukan proses standarisasi data dengan mengubah data
yang ada ke Z-Score.
3. Memilih Prosedur
Pengclusteran
4. Melakukan Interpretasi Terhadap
Cluster yang Terbentuk
Melakukan interpretasi terhadap cluster yang telah terbentuk, yang

pada intinya memberi nama spesifik untuk menggambarkan isi cluster
tersebut.
5. Melakukan Validasi dan
Profiling Cluster
Menjelaskan karakteristik setiap cluster berdasar profil tertentu. Dari data

profiling tersebut bisa dilakukan analisis lanjutan seperti analisis diskriminan.
Metode K-Means
Clustering
Pengertian K-Means Clustering
K-Means merupakan salah satu metode clustering non-
hirarki yang berusaha untuk mempartisi obyek yang ada
ke dalam bentuk satu atau lebih cluster (kelompok).
Metode ini mempartisi obyek berdasarkan
karakteristiknya, sehingga obyek yang mempunyai
karakteristik yang sama dikelompokkan ke dalam satu
cluster yang sama dan obyek yang mempunyai
karakteristik yang berbeda dikelompokkan ke dalam
cluster yang lain (Agusta, 2007).
Tujuan Pengelompokkan
Untuk meminimalkan variasi dalam satu cluster
dan memaksimalkan variasi antar cluster.
Penerapan Algoritma K-Means Clustering
VIII J di SMP Negeri 5 Singaraja

Langkah – Langkah K-Means Clustering
1
Tentukan jumlah cluster (k) yang
5 ingin dibentuk.
2
Lakukan kembali langkah 3
Tetapkan k pusat cluster awal
hingga titik pusat dari setiap
secara random.
cluster tidak berubah
4
3
Tentukan kembali titik pusat
Alokasikan semua data/obyek ke
cluster yang baru berdasarkan
dalam cluster terdekat
rata-rata
(1). Tentukan jumlah cluster (k) yang ingin
dibentuk.
Dalam makalah ini data-data yang ada akan dikelompokkan menjadi
tiga cluster.
(2). Tetapkan k pusat cluster awal secara
random
(3). Alokasikan semua data/obyek ke dalam
cluster terdekat
(4). Tentukan kembali titik pusat cluster yang
baru berdasarkan rata-rata
(5). Lakukan kembali langkah 3 hingga titik
pusat dari setiap cluster tidak berubah
ketiga pusat cluster dikelompokkan menjadi 3
dengan karakteristik sebagai berikut:
• Kelompok pertama (cluster ke-1) : berisi siswa-siswa yang

memiliki ratarata nilai tugas sekitar 75,7, rata-rata nilai kuis
sekitar 69,7, dan rata-rata nilai ulangan harian sekitar 58,3.
• Kelompok kedua (cluster ke-2) : berisi siswa-siswa yang
sekitar 68,5, dan rata-rata nilai ulangan harian sekitar 82,9.
• Kelompok ketiga (cluster ke-3) : berisi siswa-siswa yang
sekitar 72,9, dan rata-rata nilai ulangan harian sekitar 82,4
Dari langkah – langkah tersebut dapat
disimpulkan bahwa
• Kelompok pertama (Cluster ke-1), terdiri dari 12 orang siswa, yakni siswa
dengan nomor urut 2, 13, 14, 19, 21, 30, 31, 32, 33, 36, 38 dan 39. Pada
cluster ke-1 ini siswa tergolong memiliki kemampuan matematika rendah.
Berdasarkan hal tersebut siswa pada cluster ini diberikan remedi.
• Kelompok kedua (Cluster ke-2), terdiri dari 9 orang siswa, yakni siswa
dengan nomor urut 1, 6, 10, 15, 22, 26, 29, 34 dan 35. Pada cluster ke-2 ini
siswa tergolong memiliki kemampuan matematika sedang. Berdasarkan hal
tersebut siswa pada cluster ini diberikan remedi.
• Kelompok ketiga (Cluster ke-3), terdiri dari 19 orang siswa, yakni siswa
dengan nomor urut 3, 4, 5, 7, 8, 9, 11, 12, 16, 17, 18, 20, 23, 24, 25, 27, 28,
37 dan 40. Pada cluster ke-3 ini siswa tergolong memiliki kemampuan
matematika tinggi. Karena hal tersebut siswa pada cluster ini tidak
diberikan remedi, tetapi siswa pada cluster ini diberikan pengayaan.
SEKIAN DAN TERIMAKASIH

Cluster

Diunggah oleh

Informasi Dokumen

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Cluster

Diunggah oleh

Hak Cipta:

Format Tersedia

ANALISIS CLUSTER

3) Berbasis Neural Network

Melakukan Validasi dan Profiling

b. Jarak kuadrat Euclid

• Jarak kuadrat Euclid (Squared Euclidean Distance), yaitu

c. The City Block or Manhattan

• Jarak antar dua objek merupakan jumlah nilai

• Jarak antar kedua objek dengan mengukur nilai

Jika data memang menpunyai satuan yang berbeda secara signifikan,

Melakukan interpretasi terhadap cluster yang telah terbentuk, yang

Menjelaskan karakteristik setiap cluster berdasar profil tertentu. Dari data

VIII J di SMP Negeri 5 Singaraja

• Kelompok pertama (cluster ke-1) : berisi siswa-siswa yang

Anda mungkin juga menyukai