Anda di halaman 1dari 26

Pengantar

KNOWLEDGE DISCOVERY in DATABASES

Oleh :
Asep Muhammad Indra Purnama M.Kom
DATA MINING [bagian 1 ....]

DATA MINING
Kegiatan untuk MENEMUKAN INFORMASI atau
PENGETAHUAN yang berguna SECARA OTOMATIS dari DATA
yang jumlahnya BESAR
DATA MINING [bagian 2 ....]

DATA MINING
DATA MINING merupakan salah satu PROSES dari
KESELURUHAN PROSES yang ada pada Knowledge Discovery
in Databases (KDD)
K D D [bagian 1 ....]

KNOWLEDGE DISCOVERY in DATABASE (KDD)


Merupakan SEKUMPULAN PROSES untuk menemukan
PENGETAHUAN yang BERMANFAAT dari DATA
K D D [bagian 2 ....]

PROSES dalam KDD


1. Pembersihan Data (DATA CLEANING)
2. Integrasi Data (DATA INTEGRATION)
3. Pemilihan Data (DATA SELECTION)
4. Transformasi Data (DATA TRANSFORMATION)
5. Penambangan Data (DATA MINING)
6. Evaluasi Pola (PATTERN EVALUATION)
7. Presentasi Pengetahuan (KNOWLEDGE PRESENTATION)
DATA MINING & KDD

DATA MINING hanya merupakan SALAH SATU PROSES dari


keseluruhan proses yang ada pada KDD.

Tetapi merupakan PROSES YANG SANGAT PENTING dalam


menemukan POLA-POLA yang berguna dari SEJUMLAH DATA yang
BESAR (DATA tersebut bisa disimpan dalam BASIS DATA, DATA
WAREHOUSE, atau media penyimpanan informasi lainnya)
DATA MINING & KDD

DATA WAREHOUSE
KDD

DATA MINING

DATA WAREHOUSE
K D D VS D M [bagian 1 ....]

Menurut CABENA
DATA MINING = Knowledge Discovery in Database (KDD)

Menurut JIAWEI HAN


Data Mining merupakan SUBSET (SALAH SATU TAHAP) dari
KDD saja. Sehingga, batasan ini yang selanjutkan digunakan.
K D D VS D M [bagian 2 ....]

DATA MINING bertujuan MENGEKSPLORASI BASIS DATA


untuk MENEMUKAN POLA-POLA PENGETAHUAN yang
tersembunyi di dalam DATA TERSEBUT.
Tahapan K D D [bagian 1 ....]
Menurut CABENA
1. Penentuan SASARAN BISNIS (BUSINESS OBJECTIVE
DETERMINATION)

2. PERSIAPAN DATA (PREPARATION DATA)


a. Data Selection
b. Data Preprocessing
c. Data Transformation

3. DATA MINING

4. ANALYSIS of RESULT

5. ASSIMILATION of KNOWLEDGE
Tahapan K D D [bagian 2 ....]

1. BUSINESS OBJECTIVE DETERMINATION [1]


Merupakan sebuah TAHAPAN yang mendefinisikan
PERMASALAHAN atau TANTANGAN BISNIS dengan JELAS.
Hal ini merupakan ASPEK yang SANGAT ESENSIAL dalam
setiap proyek DATA MINING
Tahapan K D D [bagian 3 ....]
1. BUSINESS OBJECTIVE DETERMINATION [2]
Contoh :
Mengembangkan suatu Strategi Marketing untuk
mempertahankan LOYALITAS CUSTOMER di JAWA BARAT dan
BANTEN untuk produk SOFT DRINK dengan BRAND dan UKURAN
TERTENTU (350ml dalam kotak alumunium) selama bulan
FEBRUARI, MARET dan APRIL yang akan datang.

Perusahaan akan menggunakan KOMBINASI dari berbagai


Strategi Marketing (Mixed Marketing), yang salah satunya adalah
DIRECT MAIL CAMPAIGN kepada CUSTOMER yang tampaknya
“MUDAH RUSAK" loyalitasnya.
Tahapan K D D [bagian 4 ....]
1. BUSINESS OBJECTIVE DETERMINATION [3]

DATA SELECTION
Dipilih CUSTOMER yang membeli produk SOFT DRINK
350ml dalam KOTAK ALUMUNIUM di JAWA BARAT dan
BANTEN
Tahapan K D D [bagian 5 ....]
1. BUSINESS OBJECTIVE DETERMINATION [4]

DATA TRANSFORMATION
CUSTOMER yang membeli produk SOFT DRINK 350ml
dalam KOTAK ALUMUNIUM disorting dalam 10 KATEGORI

Tiap KATEGORI membedakan TINGKAT LOYALITAS-nya:


membeli produk tersebut 0-10%, 11-20%, ..... , 81-90%, 91-
100% sepanjang waktu pembeliannya.

* Selanjutnya DATA inilah yang akan dibawa ke tahap DATA


MINING
Tahapan K D D [bagian 6 ....]
2. PREPARATION DATA [1]
Tahapan untuk MEMPERSIAPKAN DATA yang diperlukan
untuk proses DATA MINING.

Tujuannya adalah agar DATA YANG DIGUNAKAN sesuai


dengan PERMASALAHAN yang akan DIPECAHKAN, dapat
dijamin KEBENARANNYA, dan dalam FORMAT yang
SESUAI/TEPAT.

Tahap yang paling banyak mengkonsumsi RESOURCES


(Manusia, Biaya, Waktu) yang tersedia. Biasanya mencapai
60% Keseluruhan Proyek KDD.
Tahapan K D D [bagian 7 ....]
2. PREPARATION DATA [2]

a. DATA SELECTION
Mengidentifikasi semua SUMBER INFORMASI INTERNAL
dan EKSTERNAL dan memilih SEBAGIAN SAJA dari DATA
yang diperlukan untuk aplikasi DATA MINING
Tahapan K D D [bagian 8 ....]
2. PREPARATION DATA [3]

b. DATA PREPROCESSING
Meyakinkan KUALITAS DATA yang telah dipilih pada
tahapan sebelumnya. 2 ISSUE yang sering dihadapkan
pada tahapan ini adalah NOISY DATA dan MISSING
VALUE
Tahapan K D D [bagian 9 ....]
2. PREPARATION DATA [4]

c. DATA TRANSFORMATION
Mengubah DATA ke dalam MODEL ANALISIS serta
MEMODELKAN DATA agar sesuai dengan ANALISA yang
diharapkan dan FORMAT DATA yang diperlukan oleh
ALGORITMA DATA MINING
Tahapan K D D [bagian 10 ....]
3. DATA MINING [1]
Melakukan proses PENCARIAN PENGETAHUAN terhadap
DATA yang ditransformasikan pada tahap sebelumnya.

Contoh Pengetahuan berbentuk ASSOCIATION RULE untuk


kasus "Soft Drink“:
 IF soft drink sejenis dengan ukuran yang lebih besar
(bukan botol kecil) dibeli lebih dari 58% dalam sejarah
pembelian soft drink seorang consumer
 THEN consumer tersebut diprediksi Loyal.

Pemilihan tugas DATA MINING : pemilihan GOAL dari proses


KDD misalnya klasifikasi, regresi, clustering, dll.
Tahapan K D D [bagian 11 ....]
3. DATA MINING [2]

PROSES DATA MINING


proses mencari POLA atau INFORMASI MENARIK dalam
data terpilih dengan menggunakan teknik atau metode
tertentu.

Teknik, metode, atau algoritma dalam data mining sangat


bervariasi. Pemilihan metode atau algoritma yang tepat
sangat bergantung pada tujuan dan proses KDD secara
keseluruhan
Tahapan K D D [bagian 12 ....]
4. ANALYSIS of RESULT

MENGINTERPRETASIKAN dan MENGEVALUASI OUTPUT


dari tahap MINING : PATTERNS

Pendekatan ANALISA yang digunakan akan bervariasi


menurut OPERASI DATA MINING yang digunakan, tetapi
biasanya akan melibatkan TEKNIK VISUALISASI
Tahapan K D D [bagian 13 ....]
5. ASSIMILATION of KNOWLEDGE

Menggunakan HASIL MINING yang telah dievaluasi ke


dalam PERILAKU ORGANISASI dan SISTEM INFORMASI
PERUSAHAAN
DATA MINING dan Proses KDD
Input & Output DATA MINING
Jenis Data yg di-Mining Jenis Pengetahuan yg Didapat

1. Relational Database 1. Decision Tabel


2. Data Warehouse 2. Decision Tree
3. Transactional Database 3. Classification Rule
4. Aplikasi Database Lanjut Lainnya : 4. Association Rule
a. Object Oriented Database 5. Berbagai tree untuk Prediksi
b. Object Relational Database Numerik :
c. Spatial Database a. Regression Tree
d. dsb b. Model Tree
4. Cluster
terima KASIH

Anda mungkin juga menyukai