05
Modul ke:
Program Studi
Teknik
Informatika
Unsupervised learning
• Pada pertemuan selanjutnya Anda sudah belajar tentang
teknik supervised learning, di mana teknik ini membutuhkan
“contoh” berupa labelled dataset untuk “belajar”.
• Di pertemuan ini Anda akan mempelajari tentang teknik
unsupervised learning.
• Teknik unsupervised learning ini tidak akan diberikan labelled
dataset, melainkan teknik ini hanya akan diberikan unlabelled
dataset.
• Contoh implementasi dari teknik ini adalah pendeteksi topik
yang sedang ramai dibicarakan di sosmed dan aplikasi
pengelompokkan buku berdasarkan kemiripan isinya.
Clustering Algorithm
• Untuk
menghitung “kemiripan” antara sample
dan cluster center, bisa menggunakan salah
satu formula berikut:
– Euclidean distance (silahkan lihat slide di
pertemuan sebelumnya)
– Manhattan distance:
– Minkowski Distance
k-Means dengan Python