Edward Purba
Pengantar DM
1/52
Pengantar DM
2/52
Pengantar DM
3/52
Pengantar DM
4/52
Edward Purba
Pengantar DM
5/52
View
H elp
400
E D C B A
Storage
300
200
100
Network Traffic
Mount 431 7437 1950 79% / 02 631963 47358 H elp 93% /us
Storage
Storage
Storage
Internet
Storage
Edward Purba
Pengantar DM
6/52
Pengantar DM
7/52
Pengantar DM
8/52
Data mining Biasanya DM adalah salah satu proses KDD Knowledge discovery in databases (KDD) Istilah umum yang meliputi, preprocessing data, DM, dan postprocessing
Istilah yang tidak terlalu sering digunakan: Ekstraksi pengetahuan, arkeologi data, pengerukan data, penuaian informasi, analisa data/pola Publisitas terbaru: Kecerdasan bisnis, manajemen pengetahuan
Edward Purba
Pengantar DM
9/52
Pengantar DM
10/52
Marketing
Misal, pengaruh pada marketing Peran dan pengaruh DM yang bertumbuh pesat dan masih bertumbuh! Tetapi DM tidaklah sekedar marketing...
Edward Purba
Database Marketing
Data Warehousing
Pengantar DM
11/52
Potensi Aplikasi?
Analisis database dan dukungan keputusan: Analisis dan manajemen pasar Target pasar, manajemen relasi customer (CRM), analisis keranjang pasar, penjualan silang, segmentasi pasar Analisis dan manajemen resiko Peramalan, tindakan mempertahankan customer, peningkatan asuransi, kontrol kualitas, analisis kompetitif Deteksi dan manajemen kecurangan
Edward Purba
Pengantar DM
12/52
Potensi Aplikasi?
Aplikasi lain:
Text mining (news group, email, dokumen) dan Web mining Stream data mining Analisis DNA dan bio data
Edward Purba
Pengantar DM
13/52
Target Pasar
Mendapatkan kelompok model customer yang berbagi karakteristik yang sama: minat, tingkat pendapatan, kebiasaan belanja, dsb. Menentukan pola pembelian customer berdasarkan waktu
Pengantar DM
14/52
Pengantar DM
15/52
Pengantar DM
16/52
Edward Purba
Pengantar DM
17/52
Aplikasi Lain
Olah raga IBM Advanced Scout menganalisa statistik (shots blocked, assists, dan fouls) pertandingan NBA untuk mendapatkan keuntungan kompetitif bagi New York Knicks dan Miami Heats Astronomi Observatory JPL dan Palomar menemukan 22 quasars dengan bantuan data mining Internet Web Surf-Aid IBM Surf-Aid menerapkan algoritma data mining untuk akses logs halaman Web yang terkait dengan pasar dalam upaya mendapatkan kesukaan dan perilaku customer, mengenalisa efektifitas pemasaran Web, perbaikan situs Web organisasi, dsb.
Edward Purba
Pengantar DM
18/52
Contoh (1)
Anda seorang manajer marketing untuk perusahaan telepon cellular: Pelanggan menerima sebuah telepon gratis (nilai 1.5 juta) dengan kontrak satu tahun; anda memberikan suatu komisi penjualan sebesar 2.5 juta per kontrak
Edward Purba
Contoh (1)
Tiga bulan sebelum suatu kontrak berakhir, cari tahu customer mana yang akan keluar: Jika anda ingin mempertahankan customer yang diduga akan keluar, tawarkan customer tersebut suatu telepon baru
Edward Purba
Pengantar DM
20/52
Contoh (2)
Anda seorang petugas asuransi dan anda harus mendefinisikan suatu pembayaran bulanan yang pantas untuk seorang pemuda berusia 18 tahun yang membeli sebuah Ferrari apa yang anda akan lakukan?
Edward Purba
Pengantar DM
21/52
Contoh (2)
Kaji seluruh data customer dan data kompensasi pembayaran sebelumnya Kaji peluang penyebab kecelakaan paling banyak berdasarkan dugaan
dsb.
Jika peluang kecelakaan lebih besar dari rata-rata, aturlah pembayaran bulanan yang sesuai!
Edward Purba
Pengantar DM
22/52
Contoh (3)
Anda berada diluar negeri dan seseorang mencuri atau menggandakan kartu kredit atau telepon mobile anda
Perusahaan kartu kredit Menggunakan data histori untuk membangun model prilaku penipuan dan gunakan data mining untuk membantu didalam mengenali kejadian yang mirip Perusahaan telepon Menganalisis pola yang menyimpang dari suatu kebiasaan yang diharapkan (tujuan, durasi, dsb.)
Edward Purba
Pengantar DM
23/52
Contoh (4)
Log pengaksesan Web bisa dianalisis untuk
Excellent surfing experience!
Demikian pula
Seluruh jenis analisis log informasi
Adaptasi antarmuka/layanan user
Edward Purba
Pengantar DM
24/52
Data Mining
Task-relevant Data Data Warehouse Pembersihan Data Integrasi Data Databases Edward Purba Pemilihan
Pengantar DM
25/52
Pengantar DM
26/52
Pengantar DM
27/52
Input data
Preprocessing
Data mining
Postprocessing
Hasil-Hasil
3
Pola berguna yg terpilih 28/52
Utilisasi
Edward Purba
Pengantar DM
Utilisasi
Peningkatan potensi untuk mendukung keputusan bisnis
Pembuatan keputusan
Penyajian Data Teknik Visualisasi Data Mining Penemuan informasi
End User
Eksplorasi data Analisa statistik, query, dan pelaporan Data Warehouses / Data Marts OLAP, MDA Sumber data Kertas, Files, Penyedia informasi, Sistem database, OLTP
DBA
Edward Purba
Pengantar DM
29/52
Evaluasi Pola
Penyaringan
Basis pengetahuan
Databases
Data Warehouse
Edward Purba
Pengantar DM
30/52
Rantai Nilai
Keputusan
Promosikan produk A di Z. Kirim iklan ke keluarga dengan profil P Jual silang layanan B ke klien C
Pengetahuan
Sebanyak Y produk A digunakan di Z Customer dari kelas Y menggunakan x% dari C selama periode D
Informasi
X
Data
Data
Edward Purba
Pengantar DM
31/52
Edward Purba
Pengantar DM
32/52
Pengantar DM
33/52
Analisis outlier
Outlier: suatu objek data yang tidak mengikuti perilaku umum dari data Gangguan atau pengecualian? Tidak! Berguna dalam deteksi kecurangan, analisis peristiwa yang jarang terjadi
Edward Purba
Pengantar DM
34/52
Edward Purba
Pengantar DM
35/52
Suatu pola adalah menarik jika pola tersebut mudah dipahami oleh manusia, valid (berlaku) pada data baru atau uji dengan suatu derajat kepastian, potensial berguna, baru atau membenarkan suatu hipotesa yang dicari user untuk konfirmasi
Edward Purba
Pengantar DM
36/52
Edward Purba
Pengantar DM
37/52
Bisakah suatu sistem data mining mendapatkan seluruh pola yang menarik?
Pencarian heuristik vs. exhaustive (melelahkan) Asosiasi vs. klasifikasi vs. clustering
Edward Purba
Pengantar DM
38/52
Bisakah suatu sistem data mining mendapatkan hanya pola yang menarik?
Pendekatan
Pertama dapatkan seluruh pola lalu saring atau keluarkan yang tidak diminati
Pengantar DM
39/52
Mesin Pembelajaran
Data Mining
Visualisasi
Algoritma
Disiplin Lainnya
Pengantar DM
40/52
Edward Purba
Uraikan hal menarik apa yang bisa ditemukan dalam data ini!
Terangkan data ini ke saya!
Pengantar DM
41/52
Edward Purba
Pengantar DM
42/52
Edward Purba
43/52
Edward Purba
44/52
systems coupling
No coupling, loose-coupling, semi-tight-coupling,
tight-coupling
Edward Purba
Pengantar DM
45/52
interaktif
Kebutuhan penggalian pengetahuan dan pola pada
Pengantar DM
46/52
Pengantar DM
47/52
Pengantar DM
48/52
Edward Purba
DM/DB:
AI/ML:
Conferences: Journals:
Machine Learning, AAAI, IJCAI, ... Machine Learning, Artific. Intell., ...
Edward Purba
Pengantar DM
50/52
Kesimpulan
Data mining: penemuan pola menarik dari data set yang besar secara semi-otomatis Knowledge discovery adalah suatu proses: Preprocessing Data mining Postprocessing Untuk digali, digunakan atau dimanfaatkan Databases (relasional, object-oriented, spasial, WWW, ) Pengetahuan (karakterisasi, pengumpulan, asosiasi, ) Teknik (mesin pembelajaran, statistik, visualisasi, ) Aplikasi (retail, telecom, Web mining, analisa log, )
Edward Purba
Pengantar DM
51/52
Edward Purba
Pengantar DM
52/52