2
Data Minig dan Warehouseing - Budiman, S.T., M.Kom.
Intelligence Enterprise
3
Data Minig dan Warehouseing - Budiman, S.T., M.Kom.
Pengertian Data Warehouse
[Barry Davlin]
4
Data Minig dan Warehouseing - Budiman, S.T., M.Kom.
Pengertian Data Warehouse (cont’d)
5
Data Minig dan Warehouseing - Budiman, S.T., M.Kom.
Pengertian Data Warehouse (cont’d)
• Data warehouse adalah basis data yang menyimpan data sekarang dan
data masa lalu yang berasal dari berbagai sistem operasional dan sumber
yang lain (sumber eksternal) yang menjadi perhatian penting bagi
manajemen dalam organisasi dan ditujukan untuk keperluan analisis dan
pelaporan manajemen dalam rangka pengambilan keputusan
• Data warehouse digunakan untuk mendukung pengambilan keputusan,
bukan untuk melaksanakan pemrosesan transaksi
• Data warehouse hanya berisi informasi-informasi yang relevan bagi
kebutuhan pemakai yang dipakai untuk pengambilan keputusan
6
Data Minig dan Warehouseing - Budiman, S.T., M.Kom.
Pengertian Data Warehouse (cont’d)
7
Data Minig dan Warehouseing - Budiman, S.T., M.Kom.
Pengertian Data Warehouse (cont’d)
8
Data Minig dan Warehouseing - Budiman, S.T., M.Kom.
Tujuan :
9
Data Minig dan Warehouseing - Budiman, S.T., M.Kom.
Perbedaan DW dan OLTP
11
Data Minig dan Warehouseing - Budiman, S.T., M.Kom.
4 Karakteristik Data Warehouse
• Subject oriented
• Integrated
• Time variant
• Non-volatile
12
Data Minig dan Warehouseing - Budiman, S.T., M.Kom.
Subject Oriented
13
Data Minig dan Warehouseing - Budiman, S.T., M.Kom.
Subject Oriented (cont’d )
• Subjek
• Aplikasi
14
Data Minig dan Warehouseing - Budiman, S.T., M.Kom.
Integrated
15
Data Minig dan Warehouseing - Budiman, S.T., M.Kom.
Integrated (cont’d)
16
Data Minig dan Warehouseing - Budiman, S.T., M.Kom.
Integrated (cont’d)
17
Data Minig dan Warehouseing - Budiman, S.T., M.Kom.
Integrated (cont’d)
18
Data Minig dan Warehouseing - Budiman, S.T., M.Kom.
Time-Variant
19
Data Minig dan Warehouseing - Budiman, S.T., M.Kom.
Time-Variant (cont’d)
20
Data Minig dan Warehouseing - Budiman, S.T., M.Kom.
Time-Variant (cont’d)
21
Data Minig dan Warehouseing - Budiman, S.T., M.Kom.
Time-Variant (cont’d)
Operasional :
• Data pada saat ini (current value)
Datawarehouse :
• Analisa data pada masa lampau
• Informasi pada saat ini
• Forecast untuk masa yang akan datang
22
Data Minig dan Warehouseing - Budiman, S.T., M.Kom.
Nonvolatile
23
Data Minig dan Warehouseing - Budiman, S.T., M.Kom.
Nonvolatile (cont’d)
24
Data Minig dan Warehouseing - Budiman, S.T., M.Kom.
Nonvolatile (cont’d)
Operasional :
• Add, change, delete data pada sistem operasional secara real time setiap transaksi
terjadi
Datawarehouse
• Update ketika kita perlukan saja, bisa secara periodik
25
Data Minig dan Warehouseing - Budiman, S.T., M.Kom.
Nonvolatile (cont’d)
26
Data Minig dan Warehouseing - Budiman, S.T., M.Kom.
Prinsip Data Warehouse
Sumber
Data
Operasional
1 Perangkat EIS
Perangkat pelaporan
Perangkat
pengembangan
Manajer aplikasi
Sumber Data Warehouse
Data
Operasional
2
OLAP
Sumber
Data Data
Eksternal Warehouse
Data Mining
27
Data Minig dan Warehouseing - Budiman, S.T., M.Kom.
Sifat Data Warehouse
Produk 2
Produk 1
28
Data Minig dan Warehouseing - Budiman, S.T., M.Kom.
Petunjuk Membangun DW
29
Data Minig dan Warehouseing - Budiman, S.T., M.Kom.
Data Mart
30
Data Minig dan Warehouseing - Budiman, S.T., M.Kom.
Data Mart
31
Data Minig dan Warehouseing - Budiman, S.T., M.Kom.
DATAWAREHOUSE vs DATAMART
DATAWAREHOUSE DATAMART
• Perusahaan, melingkupi semua Departemen
proses
Satu bisnis proses
• Gabungan datamart
Start-Join (fakta dan dimensi)
• Data didapat dari proses
Teknologinya optimal untuk
Staging
pengaksesan dan analisis data
• Merepresentasikan data dari
perusahaan atau organisasi Cocok untuk merepresentasikan
data departemen
• Diorganisasi dlm E-R Model
32
Data Minig dan Warehouseing - Budiman, S.T., M.Kom.
DATAWAREHOUSE vs DATAMART
33
Data Minig dan Warehouseing - Budiman, S.T., M.Kom.
Data Warehousing Architecture
Metadata
Repository Analysis
Extract
Query/
External
Sources
Transform Reporting
Load Serve
Operational
Refresh Data
dbs Mining
Data Marts
34
Data Minig dan Warehouseing - Budiman, S.T., M.Kom.
Three-Tier Architecture
35
Data Minig dan Warehouseing - Budiman, S.T., M.Kom.
Two Worlds -> Two Systems
36
Data Minig dan Warehouseing - Budiman, S.T., M.Kom.
Data warehouse Component
37
Data Minig dan Warehouseing - Budiman, S.T., M.Kom.
6 Functional Components
38
Data Minig dan Warehouseing - Budiman, S.T., M.Kom.
Meta Data
39
Data Minig dan Warehouseing - Budiman, S.T., M.Kom.
Source data :
40
Data Minig dan Warehouseing - Budiman, S.T., M.Kom.
Data staging component
ada 3 komponen :
1. Ekstraksi data
2. Transformasi data,
3. Loading data (ETL)
41
Data Minig dan Warehouseing - Budiman, S.T., M.Kom.
Data Storage Component
Sistem Operasional
mendukung “day-to-day operation” (OLTP)
Data warehouse
data histori yang besar untuk kebutuhan analisa data.
42
Data Minig dan Warehouseing - Budiman, S.T., M.Kom.
KOMPONEN METADATA
=
Kamus Data/ Data Katalog dalam DBMS (Database Management System)
43
Data Minig dan Warehouseing - Budiman, S.T., M.Kom.
Metadata
Intinya
• Meta data = data mengenai data pada data warehouse
44
Data Minig dan Warehouseing - Budiman, S.T., M.Kom.
Pengenalan Metadata
TIPE-TIPE METADATA
OPERASI METADATA
EKSTRAKSI DAN TRANSFORMASI METADATA
END – USER METADATA
45
Data Minig dan Warehouseing - Budiman, S.T., M.Kom.
Pengenalan Metadata
OPERASI METADATA
Terdiri dari semua informasi tentang data sumber
Proses:
Pilih data dari sistem sumber untuk data warehouse, pisah
recordnya, gabungkan bagian record dengan file sumber lainnya,
dan berhasil dengan skema multiple coding dan panjang field
46
Data Minig dan Warehouseing - Budiman, S.T., M.Kom.
Pengenalan Metadata
47
Data Minig dan Warehouseing - Budiman, S.T., M.Kom.
Pengenalan Metadata
END-USER METADATA
48
Data Minig dan Warehouseing - Budiman, S.T., M.Kom.
Pengenalan Metadata
FUNGSI METADATA
Menggabungkan semua bagian pada data warehouse
Menyediakan informasi tentang isi dan struktur pada pengembang
Membuka pintu bagi end - user dan membuat isi yang dapat
dikenal oleh mereka.
49
Data Minig dan Warehouseing - Budiman, S.T., M.Kom.
Contoh Software Data Mart
• SmartMart (IBM)
• Visual Warehouse (IBM)
• PowerMart (Informatica)
50
Data Minig dan Warehouseing - Budiman, S.T., M.Kom.
51
Data Minig dan Warehouseing - Budiman, S.T., M.Kom.
DATA MINING
52
Data Minig dan Warehouseing - Budiman, S.T., M.Kom.
KDD
53
Data Minig dan Warehouseing - Budiman, S.T., M.Kom.
54
Data Minig dan Warehouseing - Budiman, S.T., M.Kom.
55
Data Minig dan Warehouseing - Budiman, S.T., M.Kom.
KDD vs. DM
56
Data Minig dan Warehouseing - Budiman, S.T., M.Kom.
TAHAPAN KNOWLEDGE DISCOVERY IN DATABASE
Menurut Peter Cabena, Tahapan – tahapan dalam KDD adalah sebagai berikut :
• Penentuan Sasaran Bisnis (Business Objective Determination)
• Persiapan Data (Preparation Data)
• Data Selection
• Data Preprocessing
• Data Transformation
• Data Mining
• Anaysis of Result
• Assimilation of Knowledge
57
Data Minig dan Warehouseing - Budiman, S.T., M.Kom.
Business Objective Determination - 1
58
Data Minig dan Warehouseing - Budiman, S.T., M.Kom.
Business Objective Determination - 2
59
Data Minig dan Warehouseing - Budiman, S.T., M.Kom.
Persiapan Data (Preparation Data) -1
• Merupakan tahapan untuk mempersiapkan data yang diperlukan untuk proses data
mining. Tujuannya adalah agar data yang digunakan benar-benar sesuai dengan
permasalahan yang akan dipecahkan, dapat dijamin kebenarannya, dan dalam format
yang sesuai/tepat.
• Tahap yang paling banyak mengkonsumsi resources (manusia, biaya, waktu) yang
tersedia. Biasanya mencapai 60% keseluruhan proyek KDD.
60
Data Minig dan Warehouseing - Budiman, S.T., M.Kom.
Persiapan Data (Preparation Data) -2
• Data Selection
• Mengidentifikasi semua sumber informasi internal dan eksternal dan memilih sebagian saja dari
data yang diperlukan untuk aplikasi data mining.
• Data Preprocessing
• Meyakinkan kualitas data yang telah dipilih pada tahapan sebelumnya. 2 issue yang sering
dihadapkan pada tahapan ini adalah Noisy Data dan Missing Value.
• Data Transformation
• Mengubah data ke dalam model analitis serta memodelkan data agar sesuai dengan analisa yang
diharapkan dan format data yang diperlukan oleh algoritma data mining.
61
Data Minig dan Warehouseing - Budiman, S.T., M.Kom.
Data Mining -1
62
Data Minig dan Warehouseing - Budiman, S.T., M.Kom.
Data Mining -2
63
Data Minig dan Warehouseing - Budiman, S.T., M.Kom.
Analysis of Result
64
Data Minig dan Warehouseing - Budiman, S.T., M.Kom.
Assimilation of Knowledge
65
Data Minig dan Warehouseing - Budiman, S.T., M.Kom.
DATA MINING dan PROSES KDD - 1
66
Data Minig dan Warehouseing - Budiman, S.T., M.Kom.
DATA MINING dan PROSES KDD - 2
68
Data Minig dan Warehouseing - Budiman, S.T., M.Kom.