Pertemuan08-09-10 - Teknik2 Data Mining PDF
Pertemuan08-09-10 - Teknik2 Data Mining PDF
• Analisis cluster
• Induksi (pohon keputusan dan aturan induksi)
• Jaringan syaraf buatan (Neural Network)
• Online Analytical Processing (OLAP)
• Visualisasi data
• Contoh aplikasi :
– Perangkat ‘stand-alone’ : explore data distribution
– Langkah preprocessing untuk algoritma lain
– Pengenalan pola, analisis data spasial, pengenalan citra, market
research, WWW, …
• clustering dokumen2
• clustering data log web untuk mendapatkan group dengan pola
akses yang sama
28 September 2005 Teknik-teknik Data Mining 4
Apa itu Clustering ?
• Penggelompokkan data ke cluster2
– Data yang sama satu sama lain berada pada cluster yang sama
– Yang tidak sama berada pada cluster lain
– ‘Unsupervised learning’: klas2 yang belum ditentukan
Outliers
Cluster 1
Cluster 2
Gambar 2. Clustering
• Scalability
• Kemampuan mengerjakan atribut2 dari berbagai tipe
• Penemuan clusters dengan bentuk yang tidak tentu
• Kebutuhan minimal untuk pengetahuan domain untuk menentukan
parameter input
• Dapat menerima noise dan outlier
• Tidak mengindahkan susunan record dari input
• Dimensi yang tinggi
• Menyatu dengan batasan yang dispesifikasikan oleh user
• Interpretability and usability
10 10
10
9 9
9
8 8
8
7 7
7
6 6
6
5 5
5
4 4
4
Assign 3 Update 3
3
2 each
2 the 2
1
objects
1
0
cluster 1
0
0
0 1 2 3 4 5 6 7 8 9 10 to most
0 1 2 3 4 5 6 7 8 9 10 means 0 1 2 3 4 5 6 7 8 9 10
similar
center reassign reassign
10 10
K=2 9 9
8 8
Arbitrarily choose K 7 7
6
object as initial
6
5 5
the
3 3
2 2
1 cluster 1
0
0 1 2 3 4 5 6 7 8 9 10
means 0
0 1 2 3 4 5 6 7 8 9 10
– Prediksi penjualan
– Pengontrolan proses industri
– Riset Pelanggan
– Validasi data
– Manajemen resiko
– Pemasaran target
– dll