Data Mining - Clustering
Data Mining - Clustering
Clustering
Research Method
By:
Yoga Religia, S.Kom, M.Kom
CLUSTERING
Suatu cluster merupakan sekelompok entitas yang memiliki kesamaan dan memiliki perbedaan
dengan entitas dari kelompok lain (Everitt,1980).
Algoritma Clustering
• Algoritma clustering bekerja dengan
mengelompokkan obyek-obyek data
(pola, entitas, kejadian, unit, hasil
observasi) ke dalam sejumlah cluster
tertentu (Xu and Wunsch,2009).
• Algoritma clustering melakukan
pemisahan/ pemecahan/ segmentasi
data ke dalam sejumlah kelompok
(cluster) menurut karakteristik tertentu.
By : Yoga Religia 2
KELASIFIKASI vs CLUSTERING
Pada kelasifikasi : kelas dari setiap data mengikuti fitur/variable penyerta kelas,
sehingga jika ada data baru yang belum diketahui kelasnya, dengan model yang sudah
dibangun kita dapat memprediksi kelas dari data baru tersebut.
Pada clustering : data yang digunakan tidak memilki label kelas seperti pada klasifikasi
supervised, tetapi kemudian dikelompokkan menurut karakteristiknya.
• Clustering merupakan metode
segmentasi data yang sangat
berguna dalam prediksi dan analisa
masalah bisnis tertentu. Misalnya
Segmentasi pasar, marketing dan
pemetaan zonasi wilayah.
• Identifikasi obyek dalam bidang
berbagai bidang seperti computer
By : Yoga Religia vision dan image processing. 5
JENIS-JENIS CLUSTERING
By : Yoga Religia 6
METODE DAN DATA
Kualitas hasil clustering sangat bergantung pada metode yang dipakai
Kualitas Clustering
• Hasil clustering yang baik akan menghasilkan tingkat Type data yang digunakan
kesamaan yang tinggi dalam satu kelas dan tingkat
kesamaan yang rendah antar kelas. Kesamaan yang • Variabel berskala interval
dimaksud merupakan pengukuran secaranumeric
terhadap dua buah objek. Nilai kesamaan antar • Variabel biner
kedua objek akan semakin tinggi jika kedua objek • Variabel nominal, ordinal, dan rasio
yang dibandingkan memiliki kemiripan yang tinggi.
Begitu juga dengan sebaliknya. • Variabel dengan tipe lainnya.
By : Yoga Religia 7
TERIMAKASIH
See you next time