Anda di halaman 1dari 23

GUDANG DATA

( DATA WAREHOUSE)

Disusun oleh :
Ridowati G
T.Informatika – USD Yogyakarta
PENGERTIAN DW

„ Menurut Inmon :
Sekumpulan data yang terintegrasi, basis
data yang berorientasi subyek yang
didisain untuk mendukung fungsi sistem
pengambilan keputusan, dimana setiap
unit dari data adalah non-volatile dan
relevan untuk waktu tertentu
Pengertian (lanjutan)

„ Tempat penampungan (repository atau


archieve) informasi yang dikumpulkan dari
beberapa sumber data, kemudian
disimpan dalam struktur yang terintegrasi,
pada satu tempat. Data yg disimpan
nantinya digunakan untuk pengambilan
keputusan
Pengertian

„ Pengertian secara singkat dari gudang


data berdasarkan proses kerjanya adalah:
“Proses pengambilan,pembersihan dan
penyesuaian data dari berbagai sumber
data OLTP ke sistem data OLAP”
Asumsi

„ DW secara fisik terpisah dari seluruh


kegiatan operasional sistem.
„ DW mempertahankan data agregat dan
data transaksi (data atomic) yang
manajemennya terpisah dari database
yang digunakan untuk OLTP.
Keuntungan dari gudang data

„ Meningkatkan produktifitas pengetahuan para pekerja.


„ Mendukung seluruh data yang diperlukan oleh
pengambil keputusan
„ Menyediakan data penting yang siap diakses
„ Melindungi operasi basis data dari proses ad hock.
„ Menyediakan ringkasan informasi untuk level tingkat
tinggi
„ Menyediakan kemampuan untuk penelusuran informasi
lebih dalam.
Keuntungan (lanj..)

„ Menyediakan tempat untuk


mengkombinasikan data yg bersangkutan
dgn sumber sumber terpisah.
„ Eksplorasi data menjadi lebih mudah
untuk dilakukan.
Hasil diperoleh dari gudang
data :
„ Meningkatkan pengetahuan bisnis.
„ Mampu melakukan persaingan bisnis
bahkan menjadi pemimpin bisnis.
„ Mempertinggi servis dan kepuasan
pelanggan
„ Memberikan fasilitas pembuatan
keputusan
„ Membantu mempersingkat proses bisnis.
Gudang data digunakan untuk
organisasi yang :
„ Datanya disimpan dalam sistem yang berbeda
„ Pendekatan yang digunakan oleh manajemen
adalah berdasarkan informasi.
„ Memiliki data besar dengan bermacam-macam
jenis pengguna
„ Memiliki data yang sama dengan representasi
berbeda dalam sistem yang berbeda.
„ Format data yang tidak beraturan.
Komponen dari Gudang Data

„ Penyimpanan Data
„ Data Mart (Data Pasar)
„ Metadata
„ Sistem pendukung keputusan dan sistem
informasi eksekutif.
Penyimpanan
data
operasional

Gudang Data
Sistem Legal Gudang Data Personal

Data Pasar

Legend
Tranformasi Data
Metadata Data Expected
Data Optional

Gambar: Aliran Data dan Komponen Gudang Data


Karakteristik Utama
Karakteristik Deskripsi
Subject Oriented Datta diorganisasikan sesuai dengan kebutuhan user

Integrated Menghilangkan kerancuan dalam hal penamaan dan nilai


informasinya
Nonvolatile Data yang disimpan dalam format read only dan tidak dapat diubah
oleh user
Time Variant Data dalam rangkaian waktu, bukan data hanya pada saat tertentu
Summarized Data Operasioal dikumpulkan (diringkas) kemudian dimapping ke
dalam format untuk pengambilan keputusan

Large Volume Ukuran datanya besar karena pemeliharaan data yang dari waktu ke
waktu
Not normalized Data dapat redundant
Metadata Data mengenai data yang disimpan untuk user dan personil gudang
data

Data sources Data berasal dari sumber internal maupun eksternal


Metadata
„ Chain of abstraction
„ Contoh : Sofa. Sofa terdiri dari …….
„ Abstraksi sederhana dari sebuah data.
„ DW tanpa metadata ? Mungkinkah ??
„ Data tanpa metadata menjadi tidak berarti
„ Contoh:
„ 62465652 78723 82390 2399213 923923
„ Sebuah perusahaan X melaporkan pada 9/12/1999 bahwa pasar
peralatan mesin di Asia meningkat 33 persen.
„ Perusahaan marketing sport yang terdepan : IMG 45 persen,
SportStar 33 persen, Legends 16 persen.
Format Data
„ Konsep normalisasi data dlm sistem
transaksional yang tersimpan database
relasional merupakan hal yang harus dilakukan,
tetapi tidak untuk gudang data.
„ Dalam sistem transaksional perhatian utama
adalah mengeliminasi redundansi
„ Filosofi dw adalah mengatur data shg mudah
digunakan dan dapat diperoleh kembali dgn
cepat. Redudansi sangat dibenarkan.
Arsitektur Gudang data
3 Jenis Gudang Data
1. Gudang data virtual.
Membiarkan pemakai untuk melakukan akses
secara langsung ke dalam data operasional.
Disini gudang data bersifat virtual, tidak real.
Gudang data virtual biasanya digunakan untuk
memperkecil biaya operasional dan biasnaya
untuk mengetahui data apa yang sebenarnya
dicari oleh pemakai.
3 Jenis Gudang Data
2. Gudang data terpusat
Sebuah penyimpanan fisik basis data tunggal
yang berisi seluruh data untuk suatu area
fungsi tertentu, departement atau divisi.
Gudang data terpusat ini biasanya dipilih jika
ada data yang dibutuhkan secara umum dan
ada sejumlah pemakai yang telah siap
terhubung melalui jaringan computer.
Data yang disimpan dalam gudang data ada
secara fisik dan diakses dari suatu tempat dan
harus selalu dipelihara.
3 Jenis Gudang Data

3. Gudang data terdistribusi


Sesuai dengan namanya, komponen-
komponen dari gudang data terdistribusi
melalui sejumlah penyimpanan fisik basis
data.
Langkah Pembuatan DW

„ Disain gudang data terlebih dahulu.


„ Lakukan proses ‘cleaning’ dan
ditransformasikan.
„ Hasil pembersihan dan transformasi
disimpan dalam gudang data
„ Data yang disimpan dalam gudang data
diperbaharui secara periodik
ETL (Extract,Transform,Load)
„ Kemampuan yang perlu dimiliki oleh DW:
„ Membaca dari dan mengirim data ke berbagai sumber (file
teks,Excel,database relasional dsb)
„ Mampu menyesuaikan / transformasi data
„ Memiliki informasi metadata dalam setiap perjalanan
transformasinya
„ Memiliki audit log yang baik
„ Dapat meningkatkan performanya dengan scale up dan scale out
„ Mudah diimplementasikan
„ PROSES diatas dibagi dalam 3 proses besar yaitu ETL
Sistem Kerja Data Warehouse
Dokumen
Text / Mapping Data
Excel
Vendor
User
Database
Data Warehouse OLAP

Database SKEMA
Mapping Data
Bintang

IT
The Seven Deadly Sins of Data
Warehouse Implementation
(Denis Kozar, 1997)
„ Pada saat membangun gudang data, data akan datang
„ Kesalahan dalam membuat kerangka arsitektur gudang data
„ Ketidakmampuan dalam menyusun asumsi
„ Kesalahan dalam penentuan metodologi dan peralatan yang
digunakan
„ Kesalahan dalam siklus hidup gudang data
„ Kecenderungan dalam membatalkan data yang mengandung
perbedaan.
„ Menggagalkan dokumen yang mengandung kesalahan pada
saat membuat project DW pertama kali.
TIM Gudang Data
Database designer Orang yang membangun dan merancang gudang
data
Data Modeller Orang yang mengintegrasikan gudang data yang
baru dengan yang sudah data
Developer Orang yang menempatkan integrasi yang baru dan
mentransformasikan ke program
System Manager Orang yang menyeleksi hardware dan software
yang dibutuhkan untuk membangun gudang data
Systems Programmer Orang yang menangani rencana kapasitas dan
penyelarasan gudang data
End User Orang yang harus memahami permasalahan-
permasalahan yang akan ditangani seperti sales
manager, ahli keuangan dll.

Anda mungkin juga menyukai