Anda di halaman 1dari 8

Data Mining

Clustering
Research Method

By:
Yoga Religia, S.Kom, M.Kom
CLUSTERING
Suatu cluster merupakan sekelompok entitas yang memiliki kesamaan dan memiliki perbedaan
dengan entitas dari kelompok lain (Everitt,1980).

Algoritma Clustering
• Algoritma clustering bekerja dengan
mengelompokkan obyek-obyek data
(pola, entitas, kejadian, unit, hasil
observasi) ke dalam sejumlah cluster
tertentu (Xu and Wunsch,2009).
• Algoritma clustering melakukan
pemisahan/ pemecahan/ segmentasi
data ke dalam sejumlah kelompok
(cluster) menurut karakteristik tertentu.

By : Yoga Religia 2
KELASIFIKASI vs CLUSTERING

Pada kelasifikasi : kelas dari setiap data mengikuti fitur/variable penyerta kelas,
sehingga jika ada data baru yang belum diketahui kelasnya, dengan model yang sudah
dibangun kita dapat memprediksi kelas dari data baru tersebut.

Pada clustering : data yang digunakan tidak memilki label kelas seperti pada klasifikasi
supervised, tetapi kemudian dikelompokkan menurut karakteristiknya.

Perbedaannya pada data yang digunakan.


Kelasifikasi menggunakan data supervised learning. Sedangkan
Clustering menggunakan data unsupervised learning
By : Yoga Religia 3
TUJUAN CLUSTERING

dapat dibedakan menjadi dua, yaitu pengelompokan untuk


pemahaman dan clustering untuk penggunaan
(Prasetyo,2012)

• Clustering untuk tujuan pemahaman hanya


digunakan sebagai proses awal untuk
kemudian dilanjutkan dengan pekerjaan
seperti summarization (rata-rata,standar
deviasi), pelabelan kelas untuk setiap
kelompok sehingga dapat digunakan
sebagai data training dalam klasifikasi
supervised.
• Clustering untuk tujuan penggunaan
digunakan untuk mencari prototipe kelompok
yang paling representatif terhadap data,
memberikan abstraksi dari setiap obyek data
dalam kelompok dimana sebuah data
By : Yoga Religia terletak didalamnya. 4
MANFAAT CLUSTERING

Menurut Tan, 2006 clustering adalah sebuah proses


untuk mengelompokan data ke dalam
beberapa cluster atau kelompok sehingga data dalam
satu cluster memiliki tingkat kemiripan yang
maksimum dan data antar cluster memiliki kemiripan
yang minimum.

• Clustering merupakan metode
segmentasi data yang sangat
berguna dalam prediksi dan analisa
masalah bisnis tertentu. Misalnya
Segmentasi pasar, marketing dan
pemetaan zonasi wilayah.
• Identifikasi obyek dalam bidang
berbagai bidang seperti computer
By : Yoga Religia vision dan image processing. 5
JENIS-JENIS CLUSTERING

Partitional-based : mengatur objek Hierarchical-based : metode yang


dari suatu himpunan kedalam bekerja berdasarkan pada gagasan
beberapa kelompok cluster. utama dari objek untuk dijadikan lebih
Contoh: k-means, k-medoids, Fuzzy terkait dengan objek terdekatnya.
c-means, CLARA, CLARANS dan Contoh: BIRCH, AGNES dan DIANA.
PAM.

Density-based : cluster didefinisikan Grid-based : pengelompokan data


sebagai daerah yang memiliki dilakukan dengan membagi objek ke
kepadatan tinggi dari kumpulan data. dalam sejumlah sel yang membentuk
Contoh: DBSCAN, OPTICS, CLIQUE, struktur grid dimana operasi untuk
dan DENCLUE clustering dilakukan.
Contoh: WaveCluster dan STING

By : Yoga Religia 6
METODE DAN DATA
Kualitas hasil clustering sangat bergantung pada metode yang dipakai

Kualitas Clustering
• Hasil clustering yang baik akan menghasilkan tingkat Type data yang digunakan
kesamaan yang tinggi dalam satu kelas dan tingkat
kesamaan yang rendah antar kelas. Kesamaan yang • Variabel berskala interval
dimaksud merupakan pengukuran secaranumeric
terhadap dua buah objek. Nilai kesamaan antar • Variabel biner
kedua objek akan semakin tinggi jika kedua objek • Variabel nominal, ordinal, dan rasio
yang dibandingkan memiliki kemiripan yang tinggi.
Begitu juga dengan sebaliknya.  • Variabel dengan tipe lainnya.

By : Yoga Religia 7
TERIMAKASIH
See you next time

Anda mungkin juga menyukai