Clustering

Diunggah oleh

Ossas One

0% menganggap dokumen ini bermanfaat (0 suara)

11 tayangan17 halaman

Teori Clustering Dasar

Hak Cipta

Format Tersedia

PDF, TXT atau baca online dari Scribd

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Laporkan Dokumen Ini

Teori Clustering Dasar

Hak Cipta:

Format Tersedia

Unduh sebagai PDF, TXT atau baca online dari Scribd

Tandai sebagai konten tidak pantas

0% menganggap dokumen ini bermanfaat (0 suara)

11 tayangan17 halaman

Clustering

Diunggah oleh

Ossas One

Teori Clustering Dasar

Hak Cipta:

Format Tersedia

Unduh sebagai PDF, TXT atau baca online dari Scribd

Tandai sebagai konten tidak pantas

Lompat ke Halaman

Anda di halaman 1dari 17

Cari di dalam dokumen

Clustering

Unsupervised Learning
Clustering
clustering adalah sebuah proses untuk mengelompokan data ke dalam
beberapa cluster atau kelompok sehingga data dalam
satu cluster memiliki tingkat kemiripan yang maksimum dan data
antar cluster memiliki kemiripan yang minimum.
Konsep Jarak
K-Means
Ide dasar pada K-Means adalah
dengan mengelompokkan data
sejumlah k-klaster, dimana k
merupakan bilangan bulat positif
lebih dari 1. Dengan
memanfaatkan konsep jarak, data
akan dikelompokkan berdasarkan
jarak terdekat dengan centroid.
Langkah-Langkah K-Means
• Pilih jumlah cluster yang akan dibentuk.
• Pilih nilai centroid (pusat cluster). Centroid yang didefinisikan
sebanyak cluster yang diinginkan.
• Hitung jarak dari setiap centroid ke semua data /data point.
• Kelompokkan setiap data /data point ke centroid terdekat.
• Hitung rata-rata dari setiap cluster yang terbentuk untuk menjadi nilai
centroid yang baru.
• Ulangi langkah ke-3 hingga mencapai konvergensi dimana nilai
centroid sudah tidak berubah lagi.
Alternatif Lain
Dalam mengihitung nilai centroid baru, dapat mengganti metode mean
(rata-rata) dengan metode median ataupun modus (mode). Sehingga
dikenal metode clustering lainnya yang bernama K – Median dan K –
Mode.
DBSCAN
Density-based spatial clustering of
applications with noise (DBSCAN)
merupakan algoritma clustering yang
mengelompokkan titik-titik yang saling
berdekatan dengan suatu jarak yang
ditentukan dan minimum jumlah titik
yang terkumpul.
Dua parameter penting pada DBSCAN
yaitu:
Eps, parameter yang menentukan
jarak/radius/cakupan/jangkauan antar
data.
MinPoints, parameter yang digunakan
untuk menentukan jumlah minimal titik
pada suatu klaster.
Hierarchical Clustering

Hierarchical Clustering adalah

konsep pengelompokkan yang
menggunakan struktur untuk
menentukan urutan dari atas
sampai bawah. Ada dua jenis
metode untuk Hierarchical
Clustering ini, yaitu Divisive dan
Agglomerative
Hierarchical Clustering : Divisive Method
• Metode Divisive
Dalam metode Divisive atau top-
down ini, dataset yang awalnya
adalah satu kesatuan cluster akan
dipartisi menjadi dua cluster yang
paling tidak mirip. Kemudian,
lanjutkan secara rekursif pada
setiap cluster sampai ada satu
cluster untuk setiap
pengamatan/observasi.
Hiearachical Clustering : Agglomerative Method
• Metode Agglomerative
Dalam metode Agglomerative
atau bottom-up setiap
pengamatan dinyatakan sebagai
cluster pada state paling bawah.
Kemudian, hitung kesamaan
(misalnya, jarak) antara masing-
masing klaster dan gabungkan
dua klaster yang paling mirip.
Terakhir, ulangi langkah 2 dan 3
hingga hanya tersisa satu
klaster.
Hiearachical Clustering : Agglomerative Method

Untuk mementukan jarak antar dua buah cluster, ada

beberapa metode yang dapat digunakan. Berikut
penjelasannya.
Single Linkage

Dalam metode ini, jarak dua

buah klaster didefinisikan
dengan jarak terpendek dari
dua buah titik dari masing-
masing klaster.
Complete Linkage

Dalam metode ini, jarak dua

buah klaster didefinisikan
dengan jarak terpanjang dari
dua buah titik dari masing-
masing klaster.
Average Linkage

Dalam metode ini, jarak dua buah

klaster didefinisikan dengan
menghitung rata-rata jarak dari
setiap titik pada klaster satu ke
semua titik pada klaster lainnya.
Ward Linkage

Dalam metode ini, jarak dua buah

klaster didefinisikan dengan
minimum variansi dari klaster
yang akan digabungkan.
Silhouette Score
Silhouette score digunakan dalam
mengukur hasil cluster yang
terbentuk. Nilai silhouette score
berada pada rentang -1 sampai 1.
Semakin tinggi nilai maka semakin
baik klaster yang terbentuk.
𝑏−𝑎
𝑆𝑖𝑙ℎ𝑜𝑢𝑒𝑡𝑡𝑒 𝑆𝑐𝑜𝑟𝑒 =
max 𝑎, 𝑏
THANK YOU
Terima Kasih

Anda mungkin juga menyukai

Tugas01
Dokumen13 halaman
Tugas01
Citramai Zahrani
Belum ada peringkat
Test
Dokumen4 halaman
Test
Iqbal Faturrahman
Belum ada peringkat
Resume Modul Clustering
Dokumen6 halaman
Resume Modul Clustering
ruang kecil
Belum ada peringkat
Modul 9
Dokumen7 halaman
Modul 9
Victor Imannuel Kartika
Belum ada peringkat
Analisis Multivariat (Ujian)
Dokumen36 halaman
Analisis Multivariat (Ujian)
Styn Nay
Belum ada peringkat
Fuzzy Clustering
Dokumen6 halaman
Fuzzy Clustering
Pandu Taruna Buana
Belum ada peringkat
Data Mining Clustering
Dokumen8 halaman
Data Mining Clustering
NUR AINUNG
Belum ada peringkat
Analisis Cluster
Dokumen25 halaman
Analisis Cluster
Rosikh Ilmi Fillah
Belum ada peringkat
Analisis Cluster
Dokumen8 halaman
Analisis Cluster
farid
Belum ada peringkat
Data+mining+7 21
Dokumen20 halaman
Data+mining+7 21
ALDA EKAKRISANT
Belum ada peringkat
Tugas CO4 Felix Ogustino 17 - 412636 - PA - 17955
Dokumen2 halaman
Tugas CO4 Felix Ogustino 17 - 412636 - PA - 17955
FELIX OGUSTINO
Belum ada peringkat
IputuBayuKrisnaPriastawan 20210801345 DataMining Sesi-6
Dokumen4 halaman
IputuBayuKrisnaPriastawan 20210801345 DataMining Sesi-6
20210801345 I Putu Bayu Krisna Priastiawan
Belum ada peringkat
Analisis Cluster
Dokumen6 halaman
Analisis Cluster
Jerzi Djais
Belum ada peringkat
Idb Analisa Clustering
Dokumen17 halaman
Idb Analisa Clustering
Anonymous N22g3i4
Belum ada peringkat
Information Retrieval Metode Clustering Kmeans
Dokumen6 halaman
Information Retrieval Metode Clustering Kmeans
AEndah Cie Cetul
Belum ada peringkat
Multi
Dokumen28 halaman
Multi
Irtania Muthia Rizki
Belum ada peringkat
Datamining Makalah
Dokumen18 halaman
Datamining Makalah
Nur Rahmat
Belum ada peringkat
Clustering
Dokumen6 halaman
Clustering
Desy Sandra
Belum ada peringkat
Hirarki Clustering
Dokumen7 halaman
Hirarki Clustering
Fitra Hari Fadli
Belum ada peringkat
MAP Cluster
Dokumen2 halaman
MAP Cluster
BagusBudiPrabowo
Belum ada peringkat
Bab 2 Tubes
Dokumen17 halaman
Bab 2 Tubes
Siti Nur Azisyah
Belum ada peringkat
TP Modul 5
Dokumen1 halaman
TP Modul 5
Ratika Benita Nareswari
Belum ada peringkat
K Error Dan H Error
Dokumen6 halaman
K Error Dan H Error
Nadya Novita
Belum ada peringkat
Klasterisasi
Dokumen5 halaman
Klasterisasi
Annisa Anjani
Belum ada peringkat
Analisis Cluster
Dokumen21 halaman
Analisis Cluster
meliawww27
Belum ada peringkat
Clustering
Dokumen36 halaman
Clustering
Asnat Grace Simamora
Belum ada peringkat
Data Mining Sesi 6
Dokumen4 halaman
Data Mining Sesi 6
Cindy Ajj Dech
Belum ada peringkat
P9 - Cluster Analysis
Dokumen30 halaman
P9 - Cluster Analysis
Yuda Husada
Belum ada peringkat
CLUSTERING
Dokumen6 halaman
CLUSTERING
Ragelliya Halim
Belum ada peringkat
Materi 10 - K-Means Clustering 2022
Dokumen33 halaman
Materi 10 - K-Means Clustering 2022
Marvelio Lark
Belum ada peringkat
K Means
Dokumen3 halaman
K Means
Surya Amando Bangun
Belum ada peringkat
9.konsep Data Mining Tentang K-Means
Dokumen10 halaman
9.konsep Data Mining Tentang K-Means
pondok kebun
Belum ada peringkat
S MTK 1301777 Chapter3
Dokumen12 halaman
S MTK 1301777 Chapter3
Sevendipity Science
Belum ada peringkat
LPR - Week 12 - Pandas
Dokumen30 halaman
LPR - Week 12 - Pandas
Rama Dhani
Belum ada peringkat
KLASTERISASI
Dokumen4 halaman
KLASTERISASI
Lu'lu'
Belum ada peringkat
Metode Cluster Dalam Analisis Hidrologi
Dokumen3 halaman
Metode Cluster Dalam Analisis Hidrologi
Risanti Naintiwan
Belum ada peringkat
Pert5 Overview Clustering
Dokumen30 halaman
Pert5 Overview Clustering
Nisa Alya
Belum ada peringkat
Tugas Segmentasi Citra
Dokumen11 halaman
Tugas Segmentasi Citra
nasrunmc
100% (1)
Aplikasi - Database 9
Dokumen16 halaman
Aplikasi - Database 9
Yulia Witri
Belum ada peringkat
Analisis Cluster, Analisis Diskriminan & Analisis Komponen Utama
Dokumen7 halaman
Analisis Cluster, Analisis Diskriminan & Analisis Komponen Utama
Ferry Oloan Nadeak
Belum ada peringkat
Tugas Praktik Data Mining (Abs & Lat - Bel)
Dokumen59 halaman
Tugas Praktik Data Mining (Abs & Lat - Bel)
Praditya Eka Saputra
Belum ada peringkat
Quiz 12 Data Science
Dokumen8 halaman
Quiz 12 Data Science
Seno Riyanto
Belum ada peringkat
18137010-Meryam Putri Armaini - Resume MPC 4
Dokumen10 halaman
18137010-Meryam Putri Armaini - Resume MPC 4
Meryam Putri
Belum ada peringkat
Cluster
Dokumen1 halaman
Cluster
Zanquen Heinry
Belum ada peringkat
Cakaran Geostat
Dokumen4 halaman
Cakaran Geostat
Rhyo Fbr
Belum ada peringkat
Makalah Nearest Neighbors
Dokumen17 halaman
Makalah Nearest Neighbors
MuhammadNovrizal
67% (6)
Donny Sip
Dokumen13 halaman
Donny Sip
idris-luthfi-7140
Belum ada peringkat
Analisis Pengelompokan
Dokumen18 halaman
Analisis Pengelompokan
BETRAND FINSEN LENGKONG
Belum ada peringkat
Analisis Klaster
Dokumen25 halaman
Analisis Klaster
Anisa Pitriani
Belum ada peringkat
Analisis Kelompok
Dokumen9 halaman
Analisis Kelompok
ria
Belum ada peringkat
Algoritma KMeans
Dokumen11 halaman
Algoritma KMeans
Alifah Ulya
Belum ada peringkat
Data Mining Kelompok Kmeans
Dokumen15 halaman
Data Mining Kelompok Kmeans
Vici Hoo
Belum ada peringkat
Pembalajaran Mesin Algoritma K-Means
Dokumen4 halaman
Pembalajaran Mesin Algoritma K-Means
Mohammad IrhashErlangga
Belum ada peringkat
Analisis Cluster Untuk Segmentasi Pasar
Dokumen21 halaman
Analisis Cluster Untuk Segmentasi Pasar
galih whp
Belum ada peringkat
Pengenalan Pola Pada Citra Digital
Dokumen17 halaman
Pengenalan Pola Pada Citra Digital
Harri Kurniawan
Belum ada peringkat
Tugas Divisive Hierarchical Clustering
Dokumen5 halaman
Tugas Divisive Hierarchical Clustering
Sintya Dewi
Belum ada peringkat
2.2 Tinjauan Pustaka 2.1.1 Pengertian Clustring Menurut Widodo (2013) Tentang Clustring Yang Dikutip Dari Jurnal
Dokumen3 halaman
2.2 Tinjauan Pustaka 2.1.1 Pengertian Clustring Menurut Widodo (2013) Tentang Clustring Yang Dikutip Dari Jurnal
agil sujatmiko
Belum ada peringkat
Garuda 906408
Dokumen4 halaman
Garuda 906408
Wisnu Jati
Belum ada peringkat
TR Statistik
Dokumen2 halaman
TR Statistik
Rindy Endry Yani
Belum ada peringkat
Pert 1 - Pengantar
Dokumen12 halaman
Pert 1 - Pengantar
Ossas One
Belum ada peringkat
KLP 5 - Analisis Sensitivitas (Pasca-Optimalitas) PDF
Dokumen45 halaman
KLP 5 - Analisis Sensitivitas (Pasca-Optimalitas) PDF
Ossas One
Belum ada peringkat
Pengujian Beda Dua Proporsi Populasi
Dokumen8 halaman
Pengujian Beda Dua Proporsi Populasi
Ossas One
Belum ada peringkat
Pengujian Beda Dua Proporsi Populasi
Dokumen8 halaman
Pengujian Beda Dua Proporsi Populasi
Ossas One
Belum ada peringkat
Bab Ii
Dokumen63 halaman
Bab Ii
Ossas One
Belum ada peringkat
Proposal Usaha Makanan Tradisional
Dokumen8 halaman
Proposal Usaha Makanan Tradisional
Ossas One
Belum ada peringkat
Probabilitas
Dokumen49 halaman
Probabilitas
M.Rizky Juliansyah
Belum ada peringkat
Latar Belakang Pemilihan Ide Kwu
Dokumen6 halaman
Latar Belakang Pemilihan Ide Kwu
Ossas One
Belum ada peringkat
Proposal Usaha Makanan Tradisional
Dokumen8 halaman
Proposal Usaha Makanan Tradisional
Ossas One
Belum ada peringkat