Data Mining
Data Mining
Data Mining
Pertemuan 11
R. Kristoforus JB, M.Cs.
Pln
Act
01/09
01/09
Pengantar
08/09
08/09
Fungsi Deskripsi
15/09
15/09
Fungsi Estimasi
22/09
26/09
Fungsi Prediksi
29/09
29/09
KUIS
06/10
13/10
KristoJB
Materi
DataMining
Pln
20/10
27/10
UTS
10
03/11
11
10/11
12
17/11
13
24/11
Aturan Asosiasi
14
01/12
Tambahan??
KristoJB
Act
Materi
DataMining
Algoritma Klastering
KristoJB
DataMining
Kesamaan (similarity):
ukuran kedekatan
Digunakan untuk data yang bersifat kualitatif
Block:
Contoh
Misalkan data berikut:
X
Y
Z
2
5
3
2
5
3
1
2
4
KristoJB
2
5
3
1
2
4
4
1
3
DataMining
Algoritma K-means
Klastering
Divisive:
1 klaster di kelompokkan dalam beberapa k klaster
Dari atas ke bawah: membagi
Contoh: k-means
Agglomerative
N klaster menjadi k klaster
Dari atas ke bawah menggabungkan
Contoh: single, complete, average, centroid linkage
KristoJB
DataMining
Algoritma K-means
1. Tentukan jumlah k kluster yang akan dibentuk
2. Secara acak tentukan k buah record/data sebagai titik
pusat awal kluster
3. Untuk setiap record, tentukan jarak terdekat ke pusat
kelompok, dan tetapkan record tersebut sebagai
anggota kelompok dari pusat kelompok tersebut
4. Hitung rasio antara BCV (Between Cluster Variation)
dan WVC (Within Cluster Variaton). Jika nilainya
membesar, lanjutkan ke langkah 5, jika tidak,
algortima dihentikan
5. Perbaharui pusat-pusat kelompok, kemudian kembali
ke langkah 3
KristoJB
DataMining
10
KristoJB
DataMining
11
KristoJB
DataMining
12
KristoJB
DataMining
13
KristoJB
DataMining
14
Langkah 1 & 2
Langkah 1: Tentukan jumlah kluster yang akan
dibentuk.
Ditentukan jumlah kluster, k = 3
KristoJB
DataMining
15
Langkah 3 (Iterasi 1)
Menghitung jarak tiap data ke tiap pusat data.
Misal A(1,3), C1(3,3), C2(1,2), C3(4,2)
Jarak A ke C1 = |1-3|+|3-3|= 2
Jarak A ke C2 = |1-1|+|3-2|= 1
Jarak A ke C3 = |1-4|+|3-2|= 4
Jadi jarak terdekat adalah A ke C2 dengan
demikian A masuk dalam kluster C2
KristoJB
DataMining
16
Langkah 3 (Iterasi 1)
record
C1
C2
C3
KLUSTER
A
B
C
D
E
F
G
H
2
0
1
2
3
2
4
3
1
3
4
5
0
3
1
2
4
2
1
2
3
0
4
3
C2
C1
C3
C3
C2
C3
C2
C2
KristoJB
DataMining
17
Langkah 3 (Iterasi 1)
Kelompok C1 = B
Kelompok C2 = A, E, G, H
Kelompok C3 = C, D, F
KristoJB
DataMining
18
Langkah 4 (Iterasi 1)
C1 (3,3), C2(1,2), C3(4,2)
BCV = d(C1,C2) + d(C1,C3) + d(C2,C3)
BCV = (|3-1|+|3-2|) + (|3-4|+|3-2|) + (|14|+|2-2|)
BCV = 3 + 2 + 3 = 8
KristoJB
DataMining
19
Langkah 5 (Iterasi 1)
Kelompok C1 = B (3,3)
C1baru = (3,3)
Kelompok C2 = A, E, G, H
C2baru = ([1+1+1+2]/4, [3+2+1+1]/4)
C2baru = (1.25, 1.75)
Kelompok C3 = C, D, F
C3baru = ([4+5+4]/3, [3+3+2]/3)
C3baru = (4.33, 2.67)
KristoJB
DataMining
20
Langkah 3 (Iterasi 2)
Menghitung jarak tiap data ke tiap pusat data.
Misal:
A(1,3), C1(3, 3), C2(1.25, 1.75), C3(4.33, 2.67)
Jarak A ke C1 = |1-3|+|3-3|= 2
Jarak A ke C2 = |1-1.25|+|3-1.75|= 1.5
Jarak A ke C3 = |1-4.33|+|3-2.67|= 3,66
Jadi jarak terdekat adalah A ke C2 dengan
demikian A masuk dalam kluster C2
KristoJB
DataMining
21
Langkah 3 (Iterasi 2)
record
C1
C2
C3
KLUSTER
1,5
3,66
C2
1,66
C1
0,66
C3
C3
0,5
C2
C3
C2
1,5
C2
KristoJB
DataMining
22
Langkah 3 (Iterasi 2)
Kelompok C1 = B
Kelompok C2 = A, E, G, H
Kelompok C3 = C, D, F
KristoJB
DataMining
23
Langkah 4 (Iterasi 2)
C1 (3,3), C2(1.25, 1.75), C3(4.33, 2.67)
BCV = d(C1,C2) + d(C1,C3) + d(C2,C3)
BCV = (|3-1.25|+|3-1.75|) + (|3-4.33|+|3-2.67|)
+ (|1.25-4.33|+|1.75-2.67|)
BCV = 3 + 1,66 + 4 = 8,66
WCV lihat hasil langkah 3
WCV = 1.52 + 02 + 0.662 + 12 + 0.52 + 12 + 12 + 1.52 =
8,18
Rasio BCV/WCV = 8,66/8,18 = 1,05
Karena rasio membesar, dilanjutkan ke langkah 5
KristoJB
DataMining
24
Langkah 5 (Iterasi 2)
Kelompok C1 = B (3,3)
C1baru = (3,3)
Kelompok C2 = A, E, G, H
C2baru = ([1+1+1+2]/4, [3+2+1+1]/4)
C2baru = (1.25, 1.75)
Kelompok C3 = C, D, F
C3baru = ([4+5+4]/3, [3+3+2]/3)
C3baru = (4.33, 2.67)
KristoJB
DataMining
25
Langkah 3 (Iterasi 3)
Menghitung jarak tiap data ke tiap pusat data.
Misal:
A(1,3), C1(3, 3), C2(1.25, 1.75), C3(4.33, 2.67)
Jarak A ke C1 = |1-3|+|3-3|= 2
Jarak A ke C2 = |1-1.25|+|3-1.75|= 1.5
Jarak A ke C3 = |1-4.33|+|3-2.67|= 3,66
Jadi jarak terdekat adalah A ke C2 dengan
demikian A masuk dalam kluster C2
KristoJB
DataMining
26
Langkah 3 (Iterasi 3)
record
C1
C2
C3
KLUSTER
1,5
3,66
C2
1,66
C1
0,66
C3
C3
0,5
C2
C3
C2
1,5
C2
KristoJB
DataMining
27
Langkah 3 (Iterasi 3)
Kelompok C1 = B
Kelompok C2 = A, E, G, H
Kelompok C3 = C, D, F
KristoJB
DataMining
28
Langkah 4 (Iterasi 3)
C1 (3,3), C2(1.25, 1.75), C3(4.33, 2.67)
BCV = d(C1,C2) + d(C1,C3) + d(C2,C3)
BCV = (|3-1.25|+|3-1.75|) + (|3-4.33|+|3-2.67|) +
(|1.25-4.33|+|1.75-2.67|)
BCV = 3 + 1,66 + 4 = 8,66
KristoJB
DataMining
29
Latihan
1. Kelompokkan data berikut menjadi 3 kelompok:
(2,0), (1,2), (2,2), (3,2), (2,3), (3,3), (2,4), (3,4),
(4,4), (3,5)
2. Kelompokkan data berikut menjadi 2 kelompok
0, 0, 1, 3, 3, 6, 7, 9, 10, 10
KristoJB
DataMining
30