Anda di halaman 1dari 17

CLUSTERING

Nama Kelompok : Cahya Nirwana Yoza (09011182227025)


Izzati Nabila (09011282227079)
Sherli Amelia (09011282227097)
Tria Adinda (09011382227123)
Cindera Aini Rohima (09011282227028)
M Rio Pratama (09011282227121)
Kelas : SK 3 A

Dosen Pengampu: Anggun Islami, M.Kom.

Mata Kuliah Data Mining


PENGERTIAN CLUSTERING
Clustering adalah metode analisa data, sebagai salah satu metode analisa data. Data Mining
yang bertujuan untuk mengelompokkan data dengan karakteristik yang sama ke suatu
‘wilayah’ (cluster) yang sama dan data dengan karakteristik yang berbeda ke ‘wilayah’ yang
lain.

Clustering adalah suatu metode pengelompokkan berdasarkan ukuran kedekatan (kemiripan).


Cluestering beda dengan group,kalau group berarti kelompok yang sama, kondisinya kalau
tidak ya pasti bukan kelompoknya. Tetapi cluester tidak harus sama akan tetapi
pengelompokkannya berdasarkan pada kedekatan dari suatu karakterteristik sample yang
ada.

Bentuk Pembelajaran ada 2 :


1. Terawasi (Supervised Learning)
2. Tak Terawasi (Unsuvervised Learning) -> Clustering
DEFINISI CLUSTERING

Clustering adalah sebuah teknik dalam analisis data yang digunakan untuk
mengelompokkan objek atau data ke dalam kelompok-kelompok yang serupa berdasarkan
kesamaan karakteristik tertentu. Tujuan utama dari clustering adalah untuk
mengidentifikasi struktur dalam data dengan cara mengelompokkan data-point yang mirip
sehingga data yang sejenis berada dalam kelompok yang sama, sementara data yang
berbeda berada dalam kelompok yang berbeda.

Beberapa poin penting terkait clustering adalah:


1. Tujuan Identifikasi Struktur
2. Metode Tidak Terawasi
3. Kesamaan atau Jarak
4. Aplikasi yang Beragam
KARAKTERISTIK
CLUSTERING

Partitioning Clustering
Hierarchical Clustering
\

Overlapping Clustering
Hybrid
PARTITIONING CLUSTERING

Disebut juga exclusive clustering


Setiap data harus masuk dalam cluster tertentu.
Memungkinkan bagi setiap data yang masuk ke dalam
cluster tertentu pada suatu tahapan, untuk kemudian
pindah ke cluster lain pada tahapan berikutnya.
Contoh: k-means.
HIERARCHICAL CLUSTERING

Setiap data harus masuk dalam cluster tertentu


Data yang sudah masuk kedalam cluster tertentu pada suatu tahapan ,tidak
dapat berpindah ke cluster lainnya
Contoh : Single Linkage, Centroid Linkage,Complate Linkage, Average
Centroid
Direction of Hierarchy
Divisive
- cluster devide /dibagi into k cluster
Agglomerative
- n cluster merge to k cluster (n>k)
OVERLAPING & HYBRID CLUSTERING

Overlapping Clustering:
Setiap data mungkin masuk ke dalam beberapa cluster.
Data memiliki nilai keanggotaan pada beberapa cluster.
Contoh: Fuzzy C-Means
Hybrid :
Menggabungkan karakteristik dari Partitioning,
Hierarchical, dan Overlapping.
ALGORITMA K-MEANS
CLUSTERING

1. Tentukan jumlah cluster yang ingin dibentuk.


2. Tentukan centroid awal untuk masing-masing cluster secara random.
3. Hitung jarak (euclidian distance) setiap data ke masing-masing centroid cluster.
4. Setiap data memilih centroid yang terdekat.
5. Tentukan centroid baru dari masing-masing cluster, dengan cara menghitung
nilai rata-rata dari data-data dalam cluster.
6. Jika nilai centroid baru tidak sama dengan centroid lama (pada cluster yang
sama), maka ulang ke langkah 3.
K-MEANS
CLUSTERING
K-Means clustering adalah metode untuk
mengelompokkan item ke dalam kelompok (dimana k
adalah jumlah kelompok yang diinginkan).
Kelompok/cluster dibentuk dengan meminimalkan jumlah
dari Euclidean distances) diantara data dengan titik pusat
(centroid) yang berkorespondensi.
Centroid adalah titik pusat data, dalam hal ini kita
mengasumsikan rata-rata vector sebagai centroid.
CONTOH KASUS
CONTOH KASUS
CONTOH KASUS
CONTOH KASUS
CONTOH KASUS
CONTOH KASUS
CONTOH KASUS
CONTOH KASUS

Anda mungkin juga menyukai