in Databases (IS704)
dan Data Mining
(CS704)
Kuliah #1
Gunawan
Jurusan Teknik Informatika
Sekolah Tinggi Teknik Surabaya
We are drowning in
information, but starving
for knowledge
(John Naisbitt)
Kita tenggelam dalam informasi,
tetapi haus akan pengetahuan
Evaluasi Kuliah
35% Nilai Ujian Tengah Semester
35% Nilai Ujian Akhir Semester
30% Nilai Tugas Harian & Assignments
5% Nilai Prerogatif Dosen (misal: dari
aktivitas kelas)
Text Book
Data Mining: Concepts and Techniques, 2nd Edition,
Jiawei Han dan Micheline Kamber, Elsevier, USA, 2006.
Data Mining: Concepts and Techniques, 1st Edition,
Jiawei Han dan Micheline Kamber, Academic Press,
USA, 2001.
Referensi Utama
Introduction to Data Mining, Pang-Ning Tan, Michael
Steinbach, Vipin Kumar, Pearson Education, Inc., USA,
2006.
Data Mining: Practical Machine Learning Tools and
Techniques with Java Implementations, Ian H. Witten
dan Eibe Frank, Academic Press, USA, 2000.
Discovering Data Mining: From Concept to
Implementation, Peter Cabena, Pablo Hadjinian, Rolf
Stadler, Jaap Verhees, dan Alesandro Zanasi, Prentice
Hall, New Jersey, USA, 1998.
Machine Learning (International Edition), Tom
Michael Mitchell, MacGraw-Hill, Singapore, 1997.
Dec 15, 2015
Referensi Tambahan
Data Mining Solution: Methods and Tools for Solving Real-World
Problems, Christopher Westphal dan Teresa Blaxton, John Wiley &
Sons, USA, 1998.
Data Warehousing, Data Mining & OLAP (International Edition),
Alex Berson dan Stephen J. Smith, McGraw-Hill, Singapore, 2001.
Data Mining, Pieter Adriaans dan Dolf Zantinge, Addison-Wesley
Longman, England, 1996.
Data Mining with Neural Networks: Solving Business Problems
from Application Development to Decision Support, Joseph P. Bigus,
MacGraw-Hill, USA, 1996.
Data Mining and Computational Intelligence (Serial Studies in
Fuzziness and Soft Computing), Abraham Kandel, Mark Last, dan
Horst Bunke (Editors), Physica-Verlag Heidelberg, Germany, 2001.
Dec 15, 2015
Definisi
Ekstraksi atau "menambang" pengetahuan dari
data dalam jumlah yang besar.(Jia Weihan, p. 5.)
Proses pencarian terhadap pengetahuan -- yang
sebelumnya tidak diketahui; valid; dan dapat
digunakan -- dari database yang besar dan
kemudian menggunakan pengetahuan tersebut
untuk membuat keputusan bisnis yang penting.
(Cabena, p. 12.)
Dec 15, 2015
Istilah-istilah Lainnya
knowledge mining from databases
knowledge extraction
data/pattern analysis
data archaelogy
data dredging
information discovery
information harvesting
Dec 15, 2015
KDD vs. DM
Data Mining = Knowledge Discovery in
Database / KDD. (Cabena).
Data Mining = subset (salah satu tahap)
dari KDD saja (Jiawei Han). Batasan ini
yang selanjutnya digunakan.
10
Tujuan
Menemukan pola-pola pengetahuan yang
tersembunyi di dalam data.
11
Data Mining
Analysis of Results
Assimilation of Knowledge
December 15, 2015
12
Business Objective
Determination (#1)
Mendefinisikan permasalahan atau tantangan bisnis
dengan jelas. Hal ini merupakan aspek yang sangat
esensial dalam setiap proyek data mining.
(Oleh beberapa peneliti KDD lainnya -- bahkan yang
terkenal -- tahapan ini cenderung diabaikan! dan jarang
disebut)
Jika tanpa sasaran bisnis yang jelas, orang berkata: "Here
is the data, please mine it.". Tetapi jika mining dilakukan
dan pengetahuan diperoleh, bagaimana dapat diketahui
bahwa solusi tersebut benar-benar dibutuhkan?
December 15, 2015
13
Business Objective
Determination (#2)
Contoh sasaran bisnis:
Akan dikembangkan suatu strategi marketing untuk
mempertahankan loyalitas customer di Jawa Tengah
dan Jawa Timur untuk produk soft drink dengan
brand dan ukuran tertentu (200ml dalam kotak
alumunium) selama bulan Nopember, Desember dan
Januari yang akan datang. Perusahaan akan
menggunakan kombinasi dari berbagai strategi
marketing (mixed marketing), yang salah satunya
adalah direct mail campaign kepada customer yang
tampaknya "mudah rusak" loyalitasnya.
December 15, 2015
14
Business Objective
Determination (#3)
Pertanyaan kuncinya:
Rumah mana yang akan dikirimi surat
supaya usaha ini berhasil?
15
Business Objective
Determination (#4)
Dampak pada keseluruhan proses KDD:
Data Selection: dipilih customers yang membeli
16
17
18
19
20
21
22
yang digunakan:
terbatas
23
24
25
26
lebih dari 345,67ml setiap kali belanja AND dengan harga ratarata soft drink per 100ml >= Rp. 550,-- THEN consumer
tersebut diprediksi Loyal.
27
Analysis of Results
Menginterpretasikan dan mengevaluasi
output dari tahap mining: patterns.
Pendekatan analisa yang digunakan akan
bervariasi menurut operasi data mining
yang digunakan, tetapi biasanya akan
melibatkan teknik visualisasi.
28
Assimilation of Knowledge
Menggunakan hasil mining yang telah
dievaluasi ke dalam perilaku organisasi
dan sistem informasi perusahaan.
29
30
31
32
Data Mining
Metode DM yang dipakai dibagi menjadi 3
kategori:
Automated Exploration / Discovery: Clustering misalnya,
33
34
35
36
37
38
39
Cluster
Dec 15, 2015
40
41
42
43
Projects)
44
Services)
Pemanfaatan jasanya disebut rute tercepat untuk proyek data
mining yang sukses.
Skill konsultan yang baik masih merupakan komoditas yang
langka.
Dec 15, 2015
45