DataMiningAvi PDF
DataMiningAvi PDF
DataMiningAvi PDF
Avinanta Tarigan
22 Nov 2008
1 Pengertian Dasar
2 Classification Mining
3 Association Mining
4 Clustering
5 Penutup
Outline
1 Pengertian Dasar
2 Classification Mining
3 Association Mining
4 Clustering
5 Penutup
Latar Belakang
Data
Rekaman atau catatan terhadap fakta / transaksi / obyek
Definisi
Ekstraksi informasi yang implisit, tidak diketahui
sebelumnya, dan berpotensi berguna
Eksplorasi dan analisis, secara otomatis atau tidak, data
yang sangat besar untuk menemukan pola-pola yang
berguna dan mempunyai arti
Gabungan dari
beberapa bidang ilmu dalam
Matematik dan Ilmu Komputer
Diperlukan karena:
Data yang s(u)angat b(u)esar
Dimensi data yang besar
Data Heterogen
Data
Outline
1 Pengertian Dasar
2 Classification Mining
3 Association Mining
4 Clustering
5 Penutup
Classification Mining
Contoh Aplikasi I
Contoh Aplikasi II
Deteksi SPAM
Tujuan : mendeteksi email yang tidak diharapkan secara
dini
Direct Marketing
Tujuan : mencari pengelompokan profil pelanggan agar
target marketing sesuai
Sky Survey Cataloging
Tujuan : mengelompokkan obyek langit hasil pemotretan
teleskop ke dalam class-nya
Teknik / Metode
Outline
1 Pengertian Dasar
2 Classification Mining
3 Association Mining
4 Clustering
5 Penutup
Association Mining
Contoh Aplikasi I
Contoh Aplikasi II
Metode
Rule asosiasi : X → Y
1 Membangkitkan semua item-set yang kemunculannya
tinggi pada data
1 Bentuk Lattice (struktur yang akan memunculkan semua
subset yang diurutkan berdasarkan subset - superset)
2 Menyeleksi item-set dg Support yang tinggi. Support =
Jumlah Transaksi Yg Berisi X dan Y
Jumlah Keseluruhan Transaksi
2 Mencari pola asosiasi yang mempunyai “confidence” yang
tinggi
1 Confidence = Mengukur seberapa sering item di Y juga
muncul pada transaksi yang berisi X
2 Gunakan pencarian Bread-First-Search atau
Depth-First-Search pada Lattice tsb
3 Seleksi akhir dengan “Interestingness Measure”.
Asosiasi{Kopi} → {Gula} tentunya tidak menarik
24 Avinanta Tarigan Data Mining
Association Mining
Ilustrasi I
Pembentukan Lattice
Ilustrasi II
Seleksi “Support”
Ilustrasi III
Outline
1 Pengertian Dasar
2 Classification Mining
3 Association Mining
4 Clustering
5 Penutup
Clustering (Penggugusan)
Definition
Proses mencari gugus-gugus dari sekumpulan obyek sehingga
obyek-obyek di dalam sebuah gugus mirip satu dengan lainnya,
dan berbeda dengan obyek di luar gugusnya.
Contoh Aplikasi I
Web-Document Clustering:
Tujuan: mencari gugus dokumen-dokumen Web yang mirip
berdasarkan kemunculan istilah penting
Pendekatan: mengidentifikasi istilah yang sering muncul
pada setiap dokumen, mengukur kemiripan berdasarkan
frekwensi kemunculan istilah pada dokumen lainnya
Hasil: Web search engine memunculkan
dokumen-dokumen yang mirip (dalam 1 gugus)
berdasarkan istilah yang dicari
Contoh Aplikasi II
Segmentasi Pasar:
Tujuan: mencari gugus segmentasi pasar berdasarkan data
transaksi untuk keperluan marketing
Pendekatan:
mempersiapkan data beserta atribut data pelanggan
berdasarkan geografi dan data pribadi lainnya
mencari gugus pelanggan yang mirip berdasarkan atribut2
tsb
melakukan observasi perilaku pasar berdasarkan
gugus-gugus pelanggan yang ditemukan
Hasil: strategi marketing yang tepat sasaran
Kemiripan (Similarity):
ukuran dalam numerik [0,1] yang merepresentasikan
kemiripan antara 2 obyek
0 (tidak mirip) < range-kemiripan < 1(sama/mirip sekali)
Ketidakmiripan (Disimilarity) vs Kemiripan
Ilustrasi K-Means
Outline
1 Pengertian Dasar
2 Classification Mining
3 Association Mining
4 Clustering
5 Penutup
http://en.wikipedia.org/wiki/Data_mining
Selesai
TERIMAKASIH
http://avinanta.staff.gunadarma.ac.id