Anda di halaman 1dari 11

Machine learning

05
Modul ke:

Materi Minggu 5: Unsupervised Learning dan k-Means


Buku Acuan: A. C. Muller dan S. Guido, Introduction to Machine Learning with Python.
California: O’ Reilly Media Inc, 2016.
Fakultas
FASILKOM I Putu Edy Suardiyana Putra, Ph.D.

Program Studi
Teknik
Informatika
Unsupervised learning
• Pada pertemuan selanjutnya Anda sudah belajar tentang
teknik supervised learning, di mana teknik ini membutuhkan
“contoh” berupa labelled dataset untuk “belajar”.
• Di pertemuan ini Anda akan mempelajari tentang teknik
unsupervised learning.
• Teknik unsupervised learning ini tidak akan diberikan labelled
dataset, melainkan teknik ini hanya akan diberikan unlabelled
dataset.
• Contoh implementasi dari teknik ini adalah pendeteksi topik
yang sedang ramai dibicarakan di sosmed dan aplikasi
pengelompokkan buku berdasarkan kemiripan isinya.
Clustering Algorithm

• Algoritma clustering masuk ke dalam kategori


unsupervised learning.
• Algoritma ini mempartisi data ke dalam
beberapa grup berdasarkan kemiripannya.
• Teknik ini banyak digunakan untuk:
– Segmentasi pasar
– Analisa sosial media
– Analisis data astronomi
Perbedaan clustering dan
klasifikasi
Clustering Classification

Data tidak berlabel Data berlabel

Unsupervised learning Supervised learning

Tujuan: membentuk grup berdasarkan Mengidentifikasi class berdasarkan


keimiripan contoh yang diberikan

Jumlah group/class belum diketahui Jumlah group/class sudah diketahui di


awal
k-Means clustering

• k-Means merupakan salah satu algoritma k-


Means yang paling sederhana dan mudah
untuk diimplementasikan.
• Algoritma ini dimulai dengan mencari cluster
center yang bisa merepresentasikan sebuah
grup/class dengan baik.
• Lalu, semua sample yang ada akan di
pasangkan dengan sebuah cluster center.
k-Means clustering
k-Means clustering

• Untuk
  menghitung “kemiripan” antara sample
dan cluster center, bisa menggunakan salah
satu formula berikut:
– Euclidean distance (silahkan lihat slide di
pertemuan sebelumnya)
– Manhattan distance:

– Minkowski Distance
k-Means dengan Python

• Library k-Means dengan Python dapat


ditemukan di tautan berikut: https://
scikit-learn.org/stable/modules/generated/skl
earn.cluster.KMeans.html
• Pada contoh implementasi kali ini akan
digunakan library Pandas untuk memudahkan
dalam mengatur data.
Contoh code dengan Python
Contoh luaran
Terima Kasih
I Putu Edy Suardiyana Putra, Ph.D.

Anda mungkin juga menyukai