𝑅 = 3𝑑 − 2𝑑+1 + 1
Misalkan digunakan data pada tabel pembelan sebelumnya dengan
jumlah item d=5, maka jumlah kemungkinan rule adalah sebesar:
𝑅 = 35 − 26 + 1 = 243 − 64 + 1 = 180
Association Rule Mining (Lanjutan)
Contoh: jika diketahui sebuah transaksi
Id_trans Items sbb:
• Density-based, dimana sebuah cluster merupakan suatu daerah titik yang padat,
yang dipisahkan oleh daerah kepadatan rendah (low-density), dari daerah
kepadatan tinggi (high-density) yang lain. Digunakan ketika cluster-cluster tidak
beraturan atau terjalin dan ketika terdapat noise dan outlier
Tipe-tipe cluster (Lanjutan)
• Shared Property atau conceptualclusters, menemukan cluster-cluster yang membagi beberapa
sifat umumnya atau menyatakan konsep tertentu.
Menghitung semua kemungkinan cara untuk membagi titik-titik kedalam cluster dan men-evaluasi
mempunyai tujuan global dan local
Algoritma clustering hierarchical mempunyai local objectives
Algoritma partitional mempunyai global obectives
Variasi dari pendekatan fungsi objektif global adalah menyusun data menjadi sebuah model yang
terukur (parameterized)
Parameter-parameter untuk model tersebut ditentukan dari data
Model campuran (mixture model) mengasumsikan bahwa data merupakan suatu campuran
bilangan yang terdistribusi secara statistik
Algoritma clustering
K-Means clustering
Menggunakan pendekatan partitional clustering. Tiap cluster
dihubungkan sebuah centroid (titik pusat). Tiap titik ditempatkan
kedalam cluster dengan centroid terdekat. Jumlah cluster, K, harus
ditentukan. Algoritma dasarnya sangat sangat sederhana, yaitu:
1. Pilih K titik sebagai centroid awal
2. Ulangi
3. Bentuk K cluster dengan menempatkan semua titik yang terdekat
4. Ulangi perhitungan centroid dari tiap cluster
5. Sampai centroid tidak berubah
Contoh soal K-Means clustering
Misalkan data X={2,3,4,10,11,12,20,25,35} akan dibagi dalam dua
cluster (k=2), dipilih dua initial centroid yaitu 1=2 dan 2=4 dan
menggunakan ukuran city-block distance. Hitung distance setiap xX
dengan city-block
1. Iterasi 1:
X 2 3 4 10 11 12 20 25 35
(x,1) 0 1 2 8 9 10 18 23 33
(x,2) 2 1 0 6 7 8 16 21 31
Min((x,1), (x,2) C1 C1 C2 C2 C2 C2 C2 C2 C2
4 + 10 + 11 + 12 + 20 + 25 + 35 112
𝜇2′ = = = 16
7 7
2. Iterasi 2
X 2 3 4 10 11 12 20 25 35
(x,1)=(x,2.5) 0.5 0.5 1.5 7.5 8.5 9.5 17.5 22.5 32.5
(x,2)=(x,16) 14 13 12 6 5 4 4 9 19
Min((x,1), (x,2) C1 C1 C1 C2 C2 C2 C2 C2 C2
10 + 11 + 12 + 20 + 25 + 35 108
𝜇2′ = = = 18
6 6
3. Iterasi 3
X 2 3 4 10 11 12 20 25 35
(x,1)=(x,3) 1 0 1 7 8 9 17 22 32
(x,2)=(x,18) 16 15 14 8 7 6 2 7 17
Min((x,1), (x,2) C1 C1 C1 C1 C2 C2 C2 C2 C2
11 + 12 + 20 + 25 + 35 98
𝜇2′ = = = 19.6
5 5
Proses iterasi berhenti jika baru = lama atau dengan kata lain elemen dalam
sebuah cluster tidak berubah