K-Means Algo

Diunggah oleh

Muhammad Rifki Setiawan

0% menganggap dokumen ini bermanfaat (0 suara)

16 tayangan19 halaman

Judul Asli

k-means_algo

Hak Cipta

Format Tersedia

PDF, TXT atau baca online dari Scribd

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Laporkan Dokumen Ini

Hak Cipta:

Format Tersedia

Unduh sebagai PDF, TXT atau baca online dari Scribd

Tandai sebagai konten tidak pantas

0% menganggap dokumen ini bermanfaat (0 suara)

16 tayangan19 halaman

K-Means Algo

Diunggah oleh

Muhammad Rifki Setiawan

Hak Cipta:

Format Tersedia

Unduh sebagai PDF, TXT atau baca online dari Scribd

Tandai sebagai konten tidak pantas

Lompat ke Halaman

Anda di halaman 1dari 19

Cari di dalam dokumen

K-means Clustering

Pembelajaran Mesin
Senin, 13 September 2021

Dr. rer. nat. Akmal Junaidi, M.Sc.

& Dewi Asiah Shofana, S.Komp., M.Kom.
Jurusan Ilmu Komputer
FMIPA – Univ. Lampung
Supervised vs Unsupervised Learning
Supervised Learning

• Proses learning dengan melatih mesin

menggunakan sekumpulan data yang
telah diberi label yang benar.
• Setelah itu mesin diberikan sekumpulan
data baru untuk dianalisis berdasarkan
proses training tadi sehingga dapat
memprediksi label yang benar.
Supervised vs Unsupervised Learning
Unsupervised Learning

• Proses mesin mempelajari sekumpulan

data yang tidak berlabel dan
membiarkan mesin menjalankan
algoritma tanpa guidance/petunjuk.
• Tugas mesin adalah mengelompokkan
data berdasarkan tingkat kesamaan,
pola dan perbedaan tanpa diawali
dengan pelatihan mesin secara eksplisit.
Kategori Learning

Supervised Unsupervised
• Terdiri dari 2 kategori • Terdiri dari 2 kategori
• Classifcation • Clustering
• Regression • Association
Pendekatan Algoritma
Partition Algorithms Hierarchical
(fat) Algorithm

K-means • Bottom up –

Mixture Gaussian Agglomerative

Spectral Clustering • Top-down – Divisive
Clustering
• Ide dasar:
 Mengelompokkan data-data sejenis ke dalam
satu kelompok yang sama.
 Mengidentifkasi kelompok yang satu dengan
kelompok lainnya.
Contoh Clustering
Dua Cluster
Contoh Clustering
Tiga Cluster
Algoritma K-means
1. Pilih K cluster dan tentukan K centroid (gravity
center) dari data (K jumlah cluster/kelompok).
2. Hitung jarak tiap data ke centroid.
3. Kelompokkan data berdasarkan centroid terdekat.
4. Update centroid berdasarkan data yang baru
dikelompokkan.
5. Ulangi langkah 2 hingga tidak ada data lagi yang
berubah.
Catatan:

Centroid dapat diinterpretasikan sebagai pusat kelompok.

Nilai K adalah bilangan bulat.
Contoh Algoritma K-means
Id Buah Diameter Berat
1 7.0 165
2 7.1 170
3 6.5 180
4 6.6 195
5 6.8 200
(Data buah diukur pada hari Minggu, 25 Oktober 2020)

Kelompokkan data menjadi dua cluster!

Proses Iterasi
• K = 2 (2 cluster/kelompok)
• Pilih 2 centroid cluster (random):
 Pusat cluster 1: c1=(7.2 , 160)
 Pusat cluster 2: c2=(6.5 , 190)
Jarak (Euclidean Distance)
Id Buah Diameter Berat Jarak c1 Jarak c2
1 7.0 165 √25.04 √625.25
2 7.1 170 √100.01 √400.36
3 6.5 180 √400.49 √100
4 6.6 195 √1225.36 √25.01
5 6.8 200 √1600.16 √100.09


Selanjutnya: Pengelompokan
Pengelompokkan
Id Buah Diameter Berat Keanggotaan
1 7.0 165 c1
2 7.1 170 c1
3 6.5 180 c2
4 6.6 195 c2
5 6.8 200 c2


Selanjutnya: Update centroid
Update Centroid c1
Id Buah Diameter Berat Keanggotaan
1 7.0 165 c1
2 7.1 170 c1

7.0+7.1 165+170
�� 1= ( 2
,
2 )
=( 7.05,167 .5 )
Pengelompokkan
Id Buah Diameter Berat Keanggotaan
3 6.5 180 c2
4 6.6 195 c2
5 6.8 200 c2
6.5+ 6.6+ 6.8 180+195+ 200
�� 2= ( 3
,
3 )
�� 2=( 6.63,191.67 )

Selanjutnya: Hitung jarak ke centroid baru
Analisis Kompleksitas Waktu
• Komputasi jarak antar dua data memerlukan
waktu O(m) dimana m adalah dimensi vektor.
• Mengatur ulang data terhadap cluster
memerlukan waktu O(Knm) perhitungan jarak,
dimana n adalah banyaknya data dan K adalah
banyak cluster.
• Update cluster memerlukan waktu O(Km).
• Jika jumlah iterasi yang dilakukan sebanyak I,
maka total kompleksitas waktu adalah O(IKmn).
Analisis Kompleksitas Ruang
• Proses penyimpanan variabel diperlukan untuk
menyimpan n data. Karena data berdimensi m,
algoritma memerlukan space O(mn).
• Proses penyimpanan juga digunakan untuk variabel
centroids, sehingga dibutuhkan space O(Km) .
• Total space yang dibutuhkan algoritma ini adalah
O((n+K)m).
Tantangan
• Pemilihan centroids awal tidak selalu optimal
menuju konvergensi.
• Gunakan beberapa konfgurasi centroids untuk
mendapatkan hasil yang lebih baik.
• Jumlah cluster yang tepat dengan kondisi data
sesungguhnya merupakan bagian dari penelitian
itu sendiri.
• Pendekatan L-bow dapat diterapkan untuk
memprediksi jumlah cluster yang tepat.
Terima kasih

Anda mungkin juga menyukai

K Means
Dokumen7 halaman
K Means
Ismail
Belum ada peringkat
Metode K-Means
Dokumen5 halaman
Metode K-Means
Fajar Sinaringtyas
Belum ada peringkat
Algoritma K-Means Final (FIX)
Dokumen19 halaman
Algoritma K-Means Final (FIX)
RIZQI ADIGUNA
Belum ada peringkat
Aglo Clust 2022
Dokumen26 halaman
Aglo Clust 2022
Rifqi adliansyahalby
Belum ada peringkat
08 Clustering K Mean
Dokumen26 halaman
08 Clustering K Mean
Daniel Perdana
Belum ada peringkat
Tugas 5 Data Mining
Dokumen16 halaman
Tugas 5 Data Mining
Gufran Ghozian Rizky
Belum ada peringkat
Divi Clust 2022
Dokumen22 halaman
Divi Clust 2022
Rifqi adliansyahalby
Belum ada peringkat
K-Means Clustering (Case 2 Cluster)
Dokumen6 halaman
K-Means Clustering (Case 2 Cluster)
Jans Hendry
Belum ada peringkat
Data Mining (K-Means Dan K-Modes)
Dokumen8 halaman
Data Mining (K-Means Dan K-Modes)
Made Riken
Belum ada peringkat
Estimasi
Dokumen32 halaman
Estimasi
Muhammad Indra
Belum ada peringkat
Fuzzy Clustering
Dokumen10 halaman
Fuzzy Clustering
Faraida
Belum ada peringkat
Algorithma K Means
Dokumen10 halaman
Algorithma K Means
yunbetrysiagian
Belum ada peringkat
Data Mining Kelompok Kmeans
Dokumen15 halaman
Data Mining Kelompok Kmeans
Vici Hoo
Belum ada peringkat
ML (04) - Unsupervised - KMeans
Dokumen23 halaman
ML (04) - Unsupervised - KMeans
farindika
Belum ada peringkat
Contoh Data K-Means Cluster
Dokumen4 halaman
Contoh Data K-Means Cluster
rifana artha
Belum ada peringkat
Romi DM 07 Estimasi Mar2016
Dokumen44 halaman
Romi DM 07 Estimasi Mar2016
Imti Tsalil Amri
Belum ada peringkat
Modul 13 Clustering
Dokumen64 halaman
Modul 13 Clustering
Chamdan Mashuri
Belum ada peringkat
Pertemuan 3: Unsupervised Learning Clustering
Dokumen22 halaman
Pertemuan 3: Unsupervised Learning Clustering
Zidaz
Belum ada peringkat
Tugas Mandiri 3 - Penilaian
Dokumen7 halaman
Tugas Mandiri 3 - Penilaian
peni nur nilamsari
Belum ada peringkat
Kevin Andrian H1051211043
Dokumen15 halaman
Kevin Andrian H1051211043
RESISKOM21M.FATHURRAHMAN
Belum ada peringkat
LAPORAN HASIL PENELITIAN Hilyatu Shofi
Dokumen6 halaman
LAPORAN HASIL PENELITIAN Hilyatu Shofi
dhika ananda
Belum ada peringkat
Clustering Dan Evaluasi
Dokumen22 halaman
Clustering Dan Evaluasi
heru
Belum ada peringkat
Materi 10 - K-Means Clustering 2022
Dokumen33 halaman
Materi 10 - K-Means Clustering 2022
Marvelio Lark
Belum ada peringkat
Hitung K-Means
Dokumen18 halaman
Hitung K-Means
Khusus Download
Belum ada peringkat
UAS Statistika
Dokumen23 halaman
UAS Statistika
Dimas Bagaskara
Belum ada peringkat
Task10 - Bagus Arimanu - Ipynb - Colaboratory
Dokumen6 halaman
Task10 - Bagus Arimanu - Ipynb - Colaboratory
bagus arimanu
Belum ada peringkat
Ukuran Pemusatan Data 1
Dokumen14 halaman
Ukuran Pemusatan Data 1
Michael Oktavianus
Belum ada peringkat
TM Statistik Deskriptif
Dokumen11 halaman
TM Statistik Deskriptif
Queenie Damndelion
Belum ada peringkat
Variasi Dan Simpangan Baku
Dokumen3 halaman
Variasi Dan Simpangan Baku
Huda Ridlo
Belum ada peringkat
Data Mining FCM Print
Dokumen31 halaman
Data Mining FCM Print
Cassandra Shaw
Belum ada peringkat
Clustering
Dokumen36 halaman
Clustering
Asnat Grace Simamora
Belum ada peringkat
Analisis Iris Data
Dokumen15 halaman
Analisis Iris Data
Paulina Ade Cahyanti
100% (1)
LAPORAN Kecerdasan Buatan
Dokumen9 halaman
LAPORAN Kecerdasan Buatan
ahmad nizar
Belum ada peringkat
Tugas Review Artikel Whika CS (6025202009)
Dokumen12 halaman
Tugas Review Artikel Whika CS (6025202009)
whika cahyo saputro
Belum ada peringkat
Analisa Ukuran Butir
Dokumen15 halaman
Analisa Ukuran Butir
Alsod
Belum ada peringkat
Tugas 1 ISIP4215
Dokumen2 halaman
Tugas 1 ISIP4215
Ayah Ndut
100% (1)
Histogram
Dokumen7 halaman
Histogram
Priyo Raharjo
100% (6)
Uts - DW - Si - GN2022 - Novasaripadatuan
Dokumen3 halaman
Uts - DW - Si - GN2022 - Novasaripadatuan
CALISTA
Belum ada peringkat
14 Soal Kuis Datamining PDF
Dokumen1 halaman
14 Soal Kuis Datamining PDF
budiman1982
Belum ada peringkat
Bab 4
Dokumen18 halaman
Bab 4
Saima Ary
Belum ada peringkat
Statistik Deskriptif
Dokumen5 halaman
Statistik Deskriptif
Suci Harmelya
Belum ada peringkat
Rehati Ndururu
Dokumen8 halaman
Rehati Ndururu
Budi budi
Belum ada peringkat
Bju - Statistika Ekonomi Ujian The
Dokumen8 halaman
Bju - Statistika Ekonomi Ujian The
Gee Bee
Belum ada peringkat
Satrio Dwi Athallah - 2010631170120 - 6A - Tugas Individu - BigData
Dokumen13 halaman
Satrio Dwi Athallah - 2010631170120 - 6A - Tugas Individu - BigData
Satrio Dwi Athallah
Belum ada peringkat
Pertemuan 12 - Clustering
Dokumen11 halaman
Pertemuan 12 - Clustering
deannete05
Belum ada peringkat
TUGAS 1 - TUTON Pengantar Statistik Sosi
Dokumen2 halaman
TUGAS 1 - TUTON Pengantar Statistik Sosi
Adelina Berliyanti
Belum ada peringkat
Dwi Cahyo Prasetyo 041076887 T1 Isip4125.
Dokumen2 halaman
Dwi Cahyo Prasetyo 041076887 T1 Isip4125.
Prasetyo Sealehan
Belum ada peringkat
L Analisa Ayak Agg Bab 1
Dokumen21 halaman
L Analisa Ayak Agg Bab 1
naziraputritarigan
Belum ada peringkat
Soal Mikro
Dokumen7 halaman
Soal Mikro
Dea Syzbl
Belum ada peringkat
Tugas 1
Dokumen2 halaman
Tugas 1
Itha Sem
Belum ada peringkat
Fuzzy Clustering
Dokumen6 halaman
Fuzzy Clustering
Pandu Taruna Buana
Belum ada peringkat
07 Rivana Martya Sari k7119229 Uas Statistika 5d
Dokumen8 halaman
07 Rivana Martya Sari k7119229 Uas Statistika 5d
RIVANA SARI
Belum ada peringkat
131 246 1 PB
Dokumen8 halaman
131 246 1 PB
supriyadi supriyadi
Belum ada peringkat
K Means Clustering
Dokumen12 halaman
K Means Clustering
JOKO ELIYANTO
Belum ada peringkat
Algoritma K Means
Dokumen16 halaman
Algoritma K Means
Gandhix Bhamakerti
Belum ada peringkat
Tugas 1 Statistik
Dokumen4 halaman
Tugas 1 Statistik
Rissa
Belum ada peringkat
E41200652 - Ade Bagus Pratama - PCV - Minggu 4
Dokumen15 halaman
E41200652 - Ade Bagus Pratama - PCV - Minggu 4
Ade Bagus
Belum ada peringkat
Tugas 1 Statistika Dan Probabilitas
Dokumen2 halaman
Tugas 1 Statistika Dan Probabilitas
Bambangk Wish Prevent GlobalWarming
Belum ada peringkat