Basis Data Lanjut - Pertemuan 14
Basis Data Lanjut - Pertemuan 14
World
Database saintifik
Wide
Web
Pustaka Digital
p Antarmuka berbeda
p Representasi data berbeda
p Duplikasi dan ketidak-konsistenan informasi
2/148
Goal: Akses Data Terpadu
Sistem Integrasi
World
Wide
Dabase
Web
Pustaka Digital Database Saintifik Personal
...
Extractor/ Extractor/ Extractor/
Monitor Monitor Monitor
...
Sumber Sumber 4/148 Sumber
Integrasi
Pembersihan Data
Pemasukan Data
Client Client
Data yang diperoleh Query & Analisis
Metadata Warehouse
Integrasi
5/148
Apa Itu Data Warehouse?
6/148
Apa Itu Data Warehouse?
“Suatu DW adalah suatu koleksi data yang bisa digunakan
untuk menunjang pengambilan keputusan manajemen, yang
berorientasi subjek (topik), terpadu, time variant, dan tidak
mudah berubah(non volatile)” —W. H. Inmon (Bp. Data
Warehousing)
Data warehousing adalah proses dimana organisasi
menyari makna dari aset informasi yang dimilikinya melalui
penggunaan data warehouse
7/148
Apa Itu Data Warehouse?
“Suatu data warehouse sederhananya adalah suatu
penyimpanan data tunggal, lengkap dan konsisten, yang
diperoleh dari berbagai sumber dan dibuat tersedia bagi
end user dalam suatu cara yang bisa mereka pahami dan
bisa mereka gunakan dalam suatu konteks bisnis.” - - Barry
Devlin, IBM Consultant
8/148
Properti Data Warehouse?
Subject Integrated
Oriented
Data
Warehouse
9/148
DW: Berorientasi Subjek (Topik)
Diorganisasikan berdasarkan kegunaan disekitar subjek
bukan aplikasi, misal: customer, product, sales.
Perhatian dipusatkan pada pemodelan dan analisa data
untuk pembuat keputusan, bukan untuk operasi harian
atau pemrosesan transaksi.
View sederhana dan ringkas disekitar subjek
pembicaraan disediakan dengan cara memisahkan data-
data yang tidak berkaitan dengan proses penunjang
keputusan
10/148
DW: Terpadu
Dibangun dengan memadukan banyak sumber data
yang heterogen
Database relasional, flat file, catatan transaksi on-line.
Teknik pembersihan dan integrasi data diterapkan
Menjamin konsistensi penamaan, penyandian struktur, ukuran
atribut, dsb., dari antara sumber-sumber data yang berbeda.
Misal, tarif hotel: mata uang, pajak, breakfast
covered, dsb.
Ketika data dipindahkan ke warehouse, data ini telah terkonversi
11/148
DW: Time Variant
Jangka waktu untuk DW secara significant lebih lama
ketimbang data pada sistem operasional
Database operasional: data dengan nilai terbaru
Data dari data warehouse: menyediakan informasi dari suatu
tinjauan historis (misal, 5-10 tahun terakhir)
Setiap struktur key didalam data dari data warehouse
memuat suatu elemen waktu baik itu yang secara eksplisit
dinyatakan maupun yang secara implisit
Tetapi setiap struktur key dari data operasional bisa atau
bisa tidak memuat elemen waktu
12/148
DW: Time Variant
Time Data
Jan-97 January
Feb-97 February
Mar-97 March
13/148
DW: Non-Volatile
Penyimpanan data yang secara fisik terpisah
ditransformasikan dari lingkungan operasional
Pengubahan data operasional tidak terjadi dalam
lingkungan data warehouse
14/148
DW: Non-Volatile
Sistem Data
Operasional Warehouse
insert update
replace
delete
Load/
change update Update
Titik Konsisten
Perubahan konstan Dalam waktu
s Secara tetap diubah s Ditambahkan secara reguler,
s Data berubah sesuai tetapi pemuatan data jarang
kebutuhan, tidak pada sekali diubah secara langsung
suatu jadwal tetap s Namun data warehouse tetap
diperbaharui
15/148
Pengubahan Data
Refresh
Refresh
16/148
DW vs. DBMS Operasional
OLTP (on-line transaction processing)
Tugas utama dari relasi DBMS tradisional
Operasi harian: purchasing, inventory, banking, manufacturing,
payroll, registration, accounting, dsb.
OLAP (on-line analytical processing)
Tugas utama dari sistem data warehouse
Analisa data dan pengambilan keputusan
17/148
OLTP vs. OLAP
OLTP (DB Standard OLAP(Data Warehouse)
Tipe users profesional IT Pekerja pengetahuan
Fungsi/kegunaan Operasi hari-ke-hari Pendukung keputusan
Rancangan DB Berorientasi
- aplikasi Berorientasi
- subjek
data current, up-to-date historikal,
detail, flat relational ringkas, multidimensional
lokal Terpadu
penggunaan berulang Khusus untuk sesuatu maksud
akses read/write Banyak mengamati
18/148
Arsitektur Warehouse
Klien Klien
Query & Analysis
Warehouse
Integrator Metadata
Query/Reporting
Saring,
Sumber Data
bersihkan,
lainnya Data Mining
transforma-
Data Marts
sikan,
kumpulkan,
muat,
ROLAP
ubah
(Relational OLAP)
20/148
Model Data Multidimensi
Model data multidimensional dirancang untuk
memfasilitasi analisis dan bukan transaksi
Umum didalam data warehouse
Konsep intuitif dari banyak dimensi atau perspektif
pengukuran bisnis atau fakta-fakta
Melihat sales dari perspektif customer, product dan time
Model konseptual
Hypercube – suatu “kubus n-sisi”
Database adalah suatu kumpulan fakta (titik) dalam
suatu ruang multidimensi
21/148
Model Data Multidimensi
Suatu fakta memiliki suatu ukuran dimensi
Besaran yang akan dianalisa, misal, sale, budget
Sekumpulan dimensi dimana data dianalisa
Misal, store, product, date yang dikaitkan dengan suatu jumlah sale
Dimensi membentuk suatu sistem koordinat populasi
Atribute-atribut dari suatu dimensi bisa berhubungan
dengan urutan parsial
Hierarki: misal, street > county >city
Kisi: misal, date> month>year, date>week>year
22/148
Model Data Multidimensi
Ukuran– data numerik yang akan diamati
Dimensi– parameter bisnis yang mendefinisikan suatu
transaksi
Contoh: analis ingin melihat data sales (ukuran)
berdasarkan dimensi geography, time, dan product
Pemodelan dimensional adalah suatu teknik untuk
menstrukturkan data disekitar konsep bisnis
Model ER menguraikan “entitas” dan “relasi”
Model dimensional menguraikan “ukuran” dan
“dimensi”
23/148
Pemodelan Data Warehouse
Data Warehouse == Pemodelan Dimensional
OLAP == Query suatu model dimensional
Jika manajer/user berkata:
“Kita menjual PRODUCT dalam berbagai MARKET dan kita
mengukur kinerja kita berdasarkan TIME”
MARKET
kubus data dalam 3 dimensi,
dimana masing-masing sel
memuat pengukuran. PRODUCT
24/148
Pemodelan Data Warehouse
Dimensi yang mungkin:
Time: day, week, month, quarter, year
Geography / Market (Space) :city, county, state, region,
nation
Product:brand, model, color, size, weight, ...
Vendor
Customer
Organizational unit / Line of Business
Salesperson
View - actual, budget, forecast...
…
Masing-masing adalah dasar untuk agregasi dan pemecahan
25/148
Dari Tabel dan Spreadsheet menjadi
Kubus Data
Suatu data warehouse didasarkan kepada suatu model
data multidimensi yang melihat data dalam bentuk suatu
kubus data
Suatu kubus data seperti Sales memungkinkan data
untuk dimodelkan dan dilihat dari banyak dimensi
Dimensi tabel, seperti item (item_name, brand, type), atau
time(day, week, month, quarter, year)
Tabel fakta memuat ukuran (seperti dollars_sold) dan kunci untuk
setiap dimensi tabel terkait
26/148
Contoh Kubus Data
27/148
Contoh Kubus Data
28/148
Data Mining
• Ekstraksi informasi atau pola yang penting atau
menarik dari data yang ada di database yang besar
sehingga menjadi informasi yang sangat berharga
• Proses penemuan yang efisien sebuah pola terbaik
yang dapat menghasilkan sesuatu yang bernilai dari
suatu koleksi data yang sangat besar
Perbedaan data warehouse dan data mining
teknologi data warehouse digunakan untuk melakukan OLAP (On-line Analytical Processing) ,
sedangkan data mining digunakan untuk melakukan information discovery
Arsitektur Data Mining
Tahap pemprosesan dalam Data Mining
•Prediction Methods
–Menggunakan beberapa variabel untuk
memprediksi sesuatu atau suatu nilai yang
akan datang.
•Description Methods
– Mendapatkan pola penafsiran
(humaninterpretable
patterns) untuk menjelaskan
data.
Penerapan Data Mining di Perusahaan
Analisa Perusahaan dan Manajemen Resiko
Perencanaan Keuangan dan Evaluasi Aset
Data Mining dapat membantu untuk melakukan analisis dan prediksi cash flow serta
melakukan contingent claim analysis untuk mengevaluasi aset. Selain itu juga dapat
menggunakannya untuk analisis trend.
Perencanaan Sumber Daya (Resource Planning)
Dengan melihat informasi ringkas (summary) serta pola pembelanjaan dan pemasukan
dari masing-masing resource, dapat memanfaatkannya untuk melakukan resource
planning.
Persaingan (Competition)
Sekarang ini banyak perusahaan yang berupaya untuk dapat melakukan competitive
intelligence. Data Mining dapat membantu untuk memonitor pesaing-pesaing dan
melihat market direction mereka.
dapat melakukan pengelompokan customer dan memberikan variasi
harga/layanan/bonus untuk masing-masing grup.
Menyusun strategi penetapan harga di pasar yang sangat kompetitif. Hal ini diterapkan
oleh perusahaan minyak REPSOL di Spanyol dalam menetapkan harga jual gas di
pasaran.
Referensi
Edward Purba. Konsep dan Teknik Data Mining : Data
Warehouse & Teknologi OLAP.
Tugas
Review Paper – Rancang Bangun Data Warehouse
Paper asli dikumpulkan
Dikumpulkan : 2 Januari 2017