— Bab 1 —
Kesimpulan
October 10, 2012 Data Mining: Concepts and Techniques 2
Kenapa Data Mining?
Ledakan Pertumbuhan data : dari terabytes sampai petabytes
Pengumpulan data dan Ketersediaan data
Perkakas pengumpulan data otomatis, sitem database, Web, masyarakat
komputerisasi
Sumber-sumber Utama dari data berlimpah
Bisnis: Web, e-commerce, transactions, stocks, …
Sain: Remote sensing, bioinformatics, scientific simulation, …
Society : Berita, camera digital, YouTube
Kita tenggelam dalam data tapi lapar Pengetahuan
Kebutuhan adalah induk dari penemuan “Necessity is the mother of invention”
Data mining:Analisis otomatis dari himpunan segerombolan data
Task-relevant Data
Data Cleaning
Data Integration
Databases
October 10, 2012 Data Mining: Concepts and Techniques 7
Contoh : Kerangka Web Mining
Peningkatan potensial
untuk mendukung
keputusan bisnis End User
Decision
Making
Data Exploration
Statistical Summary, Querying, and Reporting
Teknik-teknik utilisasi
Data-intensive, data warehouse (OLAP), machine learning, statistics,
data streams
October 10, 2012 Data Mining: Concepts and Techniques 20
Analisis struktur dan jaringan
Penambangan graf (Graph mining)
Menemukan subgraf yang sering (misalnya., senayawa kimia), trees (XML),
substructures (web fragments)
Analisis jaringan informasi (Information network analysis)
Jaringan sosial (Social networks): aktor (objek, node) dan hubungan (edge)
misalnya, jaringan penulis dalam CS, jaringan teroris
sekelas, …
Link yang membawa banyak informasi semantik: Link mining
Penamabangan web (Web mining)
Web adalah jaringan informasi besar: dari PageRank untuk Google
Analisis jaringan informasi web
Penemuan komunitas Web, penambangan pendapat, penamabangan
pengguna, …
Visualization
Applications Data Mining
Mining Methodology
Mining various and new kinds of knowledge
Mining knowledge in multi-dimensional space
Data mining: An interdisciplinary effort
Boosting the power of discovery in a networked environment
Handling noise, uncertainty, and incompleteness of data
Pattern evaluation and pattern- or constraint-guided mining
User Interaction
Interactive mining
Incorporation of background knowledge
Presentation and visualization of data mining results