Anda di halaman 1dari 58

• Subject oriented

• Integrated
• Time variant
• Non-volatile
• data warehouse diorganisasikan dalam lingkup
subjek. sebagai contoh : penjualan, produk dan
pelanggan.
• berfokus ke dalam pemodelan dan analisis data
untuk pihak-pihak pembuat keputusan
• memisahkan data yang tidak berguna di dalam
proses pendukung keputusan
• Subjek
• data warehouse dikonstruksikan dengan
cara mengintegrasikan sejumlah sumber
data yang berbeda
• data prepocessing diaplikasikan untuk
meyakinkan kekonsistensian data
Encoding
Structures

Measurement
of attributes

Multiple
Sources

Data Type
Formats
Data perlu distandarkan :
Sales Inventori Transaksi Penjualan
Format Key Key Key
Text Integer Yes/No
Description Nama pelanggan Nama pelanggan Nama pelanggan
U.N.I.J.O.Y.O UNIPAHIT Universitas majapahit
Unit Tinggi Tinggi Tinggi
centimeter meter inch
Encoding Sex Sex Sex
Yes = Laki-laki L = laki-laki 1 = Laki-laki
No = Perempuan P = Perempuan 0 = Perempuan
• menghasilkan informasi dari sudut
pandang historical (misal : 5 -10 tahun
yang lalu)
• setiap struktur kunsi mengandung elemen
waktu
Operasional :
– Data pada saat ini (current value)

Datawarehouse :
– Analisa data pada masa lampau
– Informasi pada saat ini
– Forecast untuk masa yang akan datang
• sekali data direkam maka data tidak bisa
diupdate
• data warehouse membutuhkan dua
operasi pengaksesan data, yaitu
a. initial loading of data
b. akses data
Operasional :
 Add, change, delete data pada sistem operasional
secara real time setiap transaksi terjadi

Datawarehouse
 Update ketika kita perlukan saja, bisa secara
periodik

Data pada DW dikhususkan untuk query


dan analisa data
Prinsip Data Warehouse
Sifat Data Warehouse
• Multidimensional yang
berarti bahwa terdapat
Tahun n-4
banyak lapisan kolom Tahun n-3
dan baris (Ini berbeda Tahun n-2
dengan tabel pada model Tahun n-1

relasional yang hanya


Jawa Tengah
berdimensi dua)
• Berdasarkan susunan Jawa Barat
data seperti itu, amatlah
mudah untuk
Produk 3
memperoleh jawaban
atas pertanyaan seperti: Produk 2
“Berapakah jumlah
Produk 1
produk 1 terjual di Jawa
Tengah pada tahun n-3?”
Multidimensional database structure
• Menentukan misi dan sasaran bisnis bagi
pembentukan data warehouse
• Mengidentifikasi data dari basis data operasional dan
sumber lain yang diperlukan bagi data warehouse
• Menentukan item-item data dalam perusahaan dengan
melakukan standarisasi penamaan data dan
maknanya
• Merancang basis data untuk data warehouse
• Membangun kebijakan dalam mengarsipkan data lama
sehingga ruang penyimpanan tak menjadi terlalu besar
dan agar pengambilan keputusan tidak menjadi terlalu
lamban.
• Menarik data produksi (operasional) dan meletakkan
ke basis data milik data warehouse
Data Warehousing Architecture
b Warehouse database server
– Almost always a relational DBMS; rarely flat files
b OLAP servers
– Relational OLAP (ROLAP): extended relational DBMS that
maps operations on multidimensional data to standard
relational operations.
– Multidimensional OLAP (MOLAP): special purpose server
that directly implements multidimensional data and
operations.
b Clients
– Query and reporting tools.
– Analysis tools
– Data mining tools (e.g., trend analysis, prediction)
Two Worlds -> Two Systems
Data warehouse Component
6 Functional Components

 Extract, Transform, Load (ETL) tools


 DW databases & DBMS tools
 Data marts
 Meta data
 DW administration & management tools
 Information delivery system
Meta Data
 Istilah "meta" berasal dari kata Yunani
yang menunjukkan sesuatu yang lebih
tinggi atau lebih mendasar.
 Data tentang data
 Istilah mengacu pada data apa pun yang
digunakan untuk membantu identifikasi,
deskripsi, dan lokasi sumber daya
elektronik berjaringan
Definisi dikemukakan oleh
Cunningham

Informasi terstruktur yang


menjelaskan dan / atau
memungkinkan kami menemukan,
mengelola, mengontrol, memahami,
atau menyimpan informasi lain dari
waktu ke waktu.
Metadata
– Informasi tentang logical struktur data
– Informasi file dan alamatnya
– Informasi index
– Dll

– Meta data = data mengenai data pada


data warehouse
Data tentang data
Metadata adalah data, atau informasi, tentang data.
Ini adalah:

terkait data anda


Data Reporting

Who
• created the data?
• manages the data?

Where
• is the study area?
• can I access the data?

What
• is the data content?
• source data was used?

How
• was the data created?
• is the data distributed?

When
• is the time period of the content?
• was the data created?

Why
• was the data created?
• are there missing values?

29
30
31
Metadata gives context to data content
DATA
content context
Metadata
Title
Responsible Party
Purpose
Abstract
Geographic Extent
Time Period of Content
Sources Used
Process Description
Positional Accuracy
Entities and Attributes…….

abstraction abstraction
32
Metadata enables users to search for data by:

Location Publisher

Theme Attributes

Time
more…
Period

33
Metadata ke Teknolog Informasi
• Data yang mendefinisikan elemen data dalam
sebuah tabel
• Data yang mengontrol atau menjelaskan data
lain
• Sesuatu yang bukan merupakan bagian dari
aliran bit catatan tetapi diperlukan untuk
memahami data dalam catatan
• Satu metadata sistem adalah data sistem
lainnya
Sumber Metadata
• Dibuat secara otomatis
• Disediakan oleh pencipta sumber daya
elektronik
• Disediakan oleh pihak ke-3
Sumber Data

Production Data  data operasional persh.

 Internal Data  spreadsheets, dokumen,


Profil pelanggan, dan database
departemen persh.

 Archived Data  data operasional yang telah


disimpan

 External Data  data statistik, penelitian


dari agenci luar, market share
competitor, indikator financial standar,
dll
Data staging component

Dari berbagai SO + eksternal data disimpan pd


DW yg hrs dirubah/disamakan formatnya shg
dpt disimpan u/ query & analisa

Ada 3 komponen :
1. Ekstraksi data
2. Transformasi data,
3. Loading data (ETL)
Data Storage Component

Repository data warehouse terpisah dengan


repositori sistem operasional

Sistem Operasional
mendukung “day-to-day operation” (OLTP)

Data warehouse
data histori yang besar untuk kebutuhan
analisa data.
KOMPONEN METADATA

Metadata dalam Data WareHouse

=
Kamus Data/ Data Katalog dalam DBMS
(Database Management System)
Pengenalan Meta data

Fungsi Metadata
Menggabungkan semua bagian pada data
warehouse
Menyediakan informasi tentang isi dan
struktur pada pengembang
Membuka pintu bagi end - user dan
membuat isi yang dapat dikenal oleh mereka.
Pengenalan Metadata :
Operasi Meta Data
Terdiri dari semua informasi tentang data
sumber
Proses:
Pilih data dari sistem sumber untuk data
warehouse, pisah recordnya, gabungkan
bagian record dengan file sumber lainnya, dan
berhasil dengan skema multiple coding dan
panjang field
Pengenalan Meta data

Tipe-tipe META DATA


1. Operasi Meta data
2. Ekstraksi dan Transformasi Meta
data
3. End – User Meta Data
Pengenalan Metadata : Ekstraksi dan
Transformasi Meta data

Terdiri dari data dari data extraksi data dari


sistem sumber, yaitu:
 Extraction frequencies
 Extraction method
 Business rules untuk data extraction
Pengenalan Metadata : End – User
Meta Data

Adalah Peta Navigasi pada data


warehouse
• Metadata tidak harus digital
• Metadata berhubungan dengan lebih dari
sekedar deskripsi suatu objek .
• Metadata dapat berasal dari berbagai sumber
• Metadata terus bertambah selama hidup
suatu objek atau sistem informasi .
• Metadata satu objek informasi sekaligus
dapat menjadi data objek informasi lainnya .
(Anne Gilliland-Swetland, Mengatur
Panggung)
Mengembangkan Skema
Metadata
• Identifikasi tujuan model metadata
• Tingkat kekhususan elemen
• Identifikasi sumber daya
• Infrastruktur - siapa yang akan memasoknya?
• Jenis paket informasi apa itu?
• Siapa yang akan menggunakan metadata?
• Model metadata yang ada
• Bagian dari data warehouse yang mendukung
kebutuhan pada tingkat departemen atau fungsi
bisnis tertentu dalam perusahaan. Karakteristik
yang membedakan data mart dan data warehouse
adalah sebagai berikut (Connolly, Begg, Strachan
1999).

– Data mart memfokuskan hanya pada kebutuhan-


kebutuhan pemakai yang terkait dalam sebuah
departemen atau fungsi bisnis.
– Data mart biasanya tidak mengandung data operasional
yang rinci seperti pada data warehouse.
– Data mart hanya mengandung sedikit informasi
dibandingkan dengan data warehouse. Data mart lebih
mudah dipahami dan dinavigasi.
 Data mart = subset of DW for community
users, e.g. accounting department
 Sometimes exist as Multidimensional
Database
 Info mart = summarized data + report for
community users
DATAWAREHOUSE vs DATAMART

• Datawarehouse = gabungan dari beberapa


datamart yang levelnya berada pada
perusahaan atau organisasi.

• Datamart = bagian dari datawarehouse yang


berada level departemen pada perusahaan
atau organisasi tersebut. Data mart
menangani sebuah business proses,
misalkan penjualan.
DATAWARE HOUSE DATAMART
• Perusahaan, melingkupi  Departemen
semua proses
 Satu bisnis proses
• Gabungan datamart
 Start-Join (fakta dan dimensi)
• Data didapat dari proses
Staging  Teknologinya optimal untuk
• Merepresentasikan data pengaksesan dan analisis
dari perusahaan atau data
organisasi  Cocok untuk
• Diorganisasi dlm E-R merepresentasikan data
Model departemen
• Data mart adalah suatu bagian pada data
warehouse yang mendukung pembuatan
laporan dan analisa data pada suatu unit,
bagian atau operasi pada suatu perusahaan.
• Dalam beberapa implementasi data warehouse,
data mart adalah miniature data warehouse.
• Contoh umum data mart adalah untuk departemen
penjualan, departemen persediaan dan pengiriman,
departemen keuangan, manajemen tingkat atas, dan
seterusnya.
• Data mart juga dapat digunakan untuk gudang data
segmen data untuk mencerminkan bisnis secara geografis
terletak di mana masing-masing daerah relatif otonom.
Sebagai contoh, sebuah organisasi layanan yang besar
mungkin memperlakukan pusat operasi regional sebagai
unit usaha perorangan, masing-masing dengan data mart
sendiri yang memberikan kontribusi untuk gudang data
master.
– Data mart memfokuskan hanya pada kebutuhan-
kebutuhan pemakai yang terkait dalam sebuah
departemen atau fungsi bisnis.
– Data mart biasanya tidak mengandung data
operasional yang rinci seperti pada data warehouse.
– Data mart hanya mengandung sedikit informasi
dibandingkan dengan data warehouse. Data mart
lebih mudah dipahami.
– Data marts bisa bersifat dependent atau independent.
Data warehouse merupakan gabungan dari
beberapa data mart dan levelnya berada pada
perusahaan atau organisasi. Sedangkan data
mart merupakan bagian dari data warehouse
dan berada level departemen pada perusahaan
atau organisasi tersebut. Data mart menangani
sebuah business proses, misalkan penjualan,
maka hanya proses penjualan saja yang
ditangani pada data mart
Data Warehouse Data Mart
Lingkupan perusah/enterprise Departemen
(scope)
Subjek (subjects) multiple Single
Sumber data banyak sedikit
(data sources)
Ukuran data 100 GB to > 1 TB < 100 GB
Waktu berbulan-bulan beberapa bulan
implementasi bahkan sampai
bertahun-tahun
• Data mart dapat meningkatkan waktu respon
pengguna akhir, karena berisi data mentah yang
memungkinkan sistem komputer untuk fokus pada
satu tugas, sehingga meningkatkan kinerja.
• Berbeda dengan sistem OLTP, data mart juga dapat
menyimpan data historis yang memungkinkan
pengguna untuk menganalisis kecenderungan data.
• Selain itu, data mart tidak begitu mahal dan kompleks
sebagai data gudang untuk setup dan melaksanakan
karena masalah teknis tidak begitu sulit untuk
diselesaikan.
memiliki nilai yang terbatas karena tidak dapat
melihat organisasi secara keseluruhan dan
pelaporan dan analisis potensi terbatas.
Contoh Software Data Mart

• SmartMart (IBM)
• Visual Warehouse (IBM)
• PowerMart (Informatica)

Anda mungkin juga menyukai