Unsupervised Learning
Table of Content
What will We Learn Today?
1. Unsupervised Learning
2. Clustering
3. K-Means
4. Hierarchical Clustering
• Metode unsupervised learning yang paling umum adalah analisis cluster, yang
digunakan pada analisa data untuk mencari pola-pola tersembunyi atau
pengelompokan dalam data.
• Clustering
• Anomaly Detection
• Autoencoder
• Association
• Analisis cluster mengklasifikasikan objek sehingga setiap objek yang paling dekat
kesamaannya dengan objek lain berada dalam cluster yang sama.
1. Pendekatan Partisi
contoh : K-Means
2. Pendekatan Hirarki
5. Lakukan terhadap data yang lain sampai kita dapat cluster seperti ini.
7. Kembali ke Step 3, apabila masih ada data yang berpindah cluster atau apabila ada
perubahan nilai centroid dan sudah maximum iteration.
8. Jika sudah tidak ada perubahan maka ini adalah hasil akhir.
Karena K-Means tidak bisa melihat hasil clustering mana yang terbaik. Maka, kita harus
memperhatikan cluster-cluster ini dan total variance mereka. Kemudian
melakukannya berulang kali dengan starting point yang berbeda-beda untuk
mendapat hasil terbaik.
Contoh:
Karena K-Means tidak bisa melihat hasil clustering mana yang terbaik. Maka, kita harus
memperhatikan cluster-cluster ini dan total variance mereka. Kemudian
melakukannya berulang kali dengan starting point yang berbeda-beda untuk
mendapat hasil terbaik.
Contoh:
• Membandingkan Total Variance dari ketiga hasil cluster dan mengambil hasil
cluster dengan sum of variance terendah.
1. Agglomerative
2. Divisive
a) Agglomerative
b) Divisive
Algoritma Agglomerative
Algoritma Agglomerative
Jarak dari A ke E bisa digambarkan sebagai tabel berikut. Kemudian diulang untuk
objek lainnya.
Jika jarak objek a dengan b memiliki nilai jarak paling kecil dibandingkan jarak antar
objek lainnya dalam matriks jarak Euclidean, maka gabungan dua cluster terdekat
yaitu cluster B dengan E karena nilai jaraknya adalah 1.118 yang paling kecil
dibandingkan yang lainnya.
Algoritma Agglomerative
Perhitungan Tahap 1
Algoritma Agglomerative
Perhitungan tahap 2
Algoritma Agglomerative
Perhitungan tahap 3
Proses pembaruan matriks jarak dengan teknik complete linkage telah selesai karena
cluster yang tersisa pada matriks tahap 3 hanyalah satu. Sehingga tahap 4 memiliki satu
cluster yang beranggotakan semua cluster-cluster awal.
Algoritma Agglomerative
4. Buat dendrogram