Anda di halaman 1dari 26

Knowledge

Discovery in
Databases

KDD
Langkah-
Langkah
Proses
KDD (1)
Langkah-Langkah Proses
KDD (2)
Ciri Khas Proses KDD
Utilisasi
Arsitektur
Sistem
Data
Mining
Rantai Nilai
• Konsep Deskripsi:
karakterisasi & Diskriminasi
• Generalisasi, rangkuman
dan karakteristik data
Fungsionalitas kontras
Data Mining • Daerah kering vs
daerah basah
• Asosiasi (korelasi dan
hubungan sebab akibat)
Fungsionalitas Data
Mining
• Klasifikasi dan Prediksi
• Membangun model (fungsi) yang menguraikan dan
membedakan kelas atau konsep untuk peramalan ke
depan
• Misal; klasifikasi negara berdasar iklim, klasifikasi
mobil berdasarkan merk
• Presentasi: pohon keputusan, kaidah klasifikasi,
neural network
• Menaksir berapa nilai numerik yang tidak diketahui
atau hilang
Fungsionalitas Data Mining

• Analisis Kluster
• Jika label kelas tidak diketahui; kelompokkan data untuk
membentuk kelas baru. Misal mengelompokkan rumah untuk
mendapatkan pola distribusi
• Memaksimalkan kemiripan antar kelas dan meminimalkan
kemiripan di dalam kelas
• Analisis Outlier
• Outlier; suatu objek data yang tidak mengikuti perilaku umum
dari data
• Gangguan atau pengecualian; berguna dalam deteksi
kecurangan, analisis peristiwa yang jarang terjadi
Fungsionalitas Data Mining

Trend dan deviasi:


analisis regresi
Analisis trend dan
evolusi
Penggalian pola
sekuensial, analisis
periodisitas
Analisis arah pola
lain atau statistik
Apakah Seluruh Pola yang Ditemukan
Menarik?

• Penambangan data bisa membuat ribuan pola, namun


tidak semua pola menarik
• Penambangan yang disarankan; bepusat pada manusia,
berbasis query dan terfokus
• Ukuran ketertarikan
• Suatu pola menarik jika:
• Mudah dipahami manusia
• Valid
• Potensial berguna
• Membenarkan hipotesa yang dicari user
Ukuran Ketertarikan Objektif vs Subjektif

Objektif: berdasarkan statistic dan


struktur pola

Subjektif: berdasarkan keyakinan user


terhadap suatu data, misal dugaan,
pengalaman baru
Mengambil
Seluruh
Pola
• Mendapatkan
seluruh pola
• Pencarian
heuristik vs
exhaustive
• clustering vs
asosiasi vs
klasifikasi
Problem optimasi

Pendekatan:
Mendapatkan
Pola yang • Dapatkan seluruh pola
Menarik Saja lalu saring atau buang
yang tidak diminati
• Buat hanya pola yang
diminati ---- optimisasi
query penggalian
Data Mining; Kumpulan Disiplin Ilmu
Tinjauan dalam Data Mining

• Fungsionalitas umum
• Uraian data mining
• Uraian hal yang menarik yang bisa ditemukan dalam data
• Peramalan data mining
• Berdasarkan data sekarang dan sebelumnya, apa yang
akan terjadi
• Tinjauan multi dimensi
• Database yang akan digali
• Pengetahuan yang dicari
• Teknik-teknik yang digunakan
• Aplikasi yang disesuaikan
Relasional

Data warehouse

Database Transaksional

yang akan Time series

digali Teks, xml

Multimedia

dll
Retail
Telecom
Banking
Aplikasi
yang Fraud analisis
disesuaikan
Analisis stok market
Web mining
dll
OLAP (Online Analytical Processing)

OLAP & • Integrasi data mining dan data warehouse

OLAM OLAM (Online Analytical Mining)

• Integrasi dari penggalian dan teknologi OLAP


Penggalian
pengetahuan multilevel
secara interaktif
OLAP
Mining Integrasi dari banyak
fungsi penggalian

• Klasifikasi, clustering,
asosiasi
• Metodologi dan interaksi
penambangan
• Penambangan berbagai jenis
Isu pengetahuan
• Penambangan pengetahuan
Utama secara interaktif
• Penggabungan latar belakang
dalam pengetahuan
Data • Bahasa query DM
• Visualisasi hasil DM
Mining • Penanganan gangguan dan data
tak lengkap
• Ketertarikan problem
Kinerja dan skalabilitas
• Efisiensi dan skalabilitas
Isu dalam algoritma DM
Utama • Metode penambangan
parallel, tersebar dan
dalam bertumbuh

Data Tipe data yang beragam


• Penanganan tipe data
Mining kompleks
• Penambangan informasi dari
database heterogeny
Isu Utama dalam Data Mining

Aplikasi dan integrasi


Proteksi data
data yang didapat
• Tool DM khusus • Keamanan
• Integrasi dari • Integritas
pengetahuan yang • kerahasiaan
ada dan
pengetahuan yang
didapat
Kesimpulan
Data Mining: Penemuan pola yang menarik
dari data set yang besar secara semi
otomatis

Pre-processing
Knowledge discovery
Data Mining
adalah suatu proses:
Post-processing

Database
Pengetahuan
Tinjauan dalam DM:
Teknik yang digunakan
Aplikasi

Anda mungkin juga menyukai