Discovery in
Databases
KDD
Langkah-
Langkah
Proses
KDD (1)
Langkah-Langkah Proses
KDD (2)
Ciri Khas Proses KDD
Utilisasi
Arsitektur
Sistem
Data
Mining
Rantai Nilai
• Konsep Deskripsi:
karakterisasi & Diskriminasi
• Generalisasi, rangkuman
dan karakteristik data
Fungsionalitas kontras
Data Mining • Daerah kering vs
daerah basah
• Asosiasi (korelasi dan
hubungan sebab akibat)
Fungsionalitas Data
Mining
• Klasifikasi dan Prediksi
• Membangun model (fungsi) yang menguraikan dan
membedakan kelas atau konsep untuk peramalan ke
depan
• Misal; klasifikasi negara berdasar iklim, klasifikasi
mobil berdasarkan merk
• Presentasi: pohon keputusan, kaidah klasifikasi,
neural network
• Menaksir berapa nilai numerik yang tidak diketahui
atau hilang
Fungsionalitas Data Mining
• Analisis Kluster
• Jika label kelas tidak diketahui; kelompokkan data untuk
membentuk kelas baru. Misal mengelompokkan rumah untuk
mendapatkan pola distribusi
• Memaksimalkan kemiripan antar kelas dan meminimalkan
kemiripan di dalam kelas
• Analisis Outlier
• Outlier; suatu objek data yang tidak mengikuti perilaku umum
dari data
• Gangguan atau pengecualian; berguna dalam deteksi
kecurangan, analisis peristiwa yang jarang terjadi
Fungsionalitas Data Mining
Pendekatan:
Mendapatkan
Pola yang • Dapatkan seluruh pola
Menarik Saja lalu saring atau buang
yang tidak diminati
• Buat hanya pola yang
diminati ---- optimisasi
query penggalian
Data Mining; Kumpulan Disiplin Ilmu
Tinjauan dalam Data Mining
• Fungsionalitas umum
• Uraian data mining
• Uraian hal yang menarik yang bisa ditemukan dalam data
• Peramalan data mining
• Berdasarkan data sekarang dan sebelumnya, apa yang
akan terjadi
• Tinjauan multi dimensi
• Database yang akan digali
• Pengetahuan yang dicari
• Teknik-teknik yang digunakan
• Aplikasi yang disesuaikan
Relasional
Data warehouse
Database Transaksional
Multimedia
dll
Retail
Telecom
Banking
Aplikasi
yang Fraud analisis
disesuaikan
Analisis stok market
Web mining
dll
OLAP (Online Analytical Processing)
• Klasifikasi, clustering,
asosiasi
• Metodologi dan interaksi
penambangan
• Penambangan berbagai jenis
Isu pengetahuan
• Penambangan pengetahuan
Utama secara interaktif
• Penggabungan latar belakang
dalam pengetahuan
Data • Bahasa query DM
• Visualisasi hasil DM
Mining • Penanganan gangguan dan data
tak lengkap
• Ketertarikan problem
Kinerja dan skalabilitas
• Efisiensi dan skalabilitas
Isu dalam algoritma DM
Utama • Metode penambangan
parallel, tersebar dan
dalam bertumbuh
Pre-processing
Knowledge discovery
Data Mining
adalah suatu proses:
Post-processing
Database
Pengetahuan
Tinjauan dalam DM:
Teknik yang digunakan
Aplikasi