Anda di halaman 1dari 16

MODUL

DATABASE

(CCS120)

MODUL SESI XIV

DATA WAREHOUSE

DISUSUN OLEH

NOVIANDI, S.Kom, M.Kom

UNIVERSITAS ESA UNGGUL

2020
BAB XIV
Data Warehouse

Tujuan

 Bagaimana data warehousing berevolusi.


 Konsep dan manfaat utama yang terkait dengan data warehousing.
 Perbedaan sistem pemrosesan transaksi online (OLTP) dengan data
warehousing.
 Masalah yang terkait dengan data warehousing.
 Arsitektur dan komponen utama data warehouse.
 Alat dan teknologi utama yang terkait dengan data warehousing.
 Masalah yang terkait dengan integrasi data warehouse dan pentingnya
mengelola metadata.
 Konsep data mart dan alasan utama mengimplementasikan data mart.
 Bagaimana Oracle mendukung data warehousing.

Teori

Konsep data warehouse


 Dibanding database tradisional, data warehouse umumnya terdiri dari data
yang berukuran sangat besar dari banyak sumber dan mungkin terdiri dari
database dari model data yang berbeda dan kadang file dari sistem dan
platform yang independen.
 Tidak seperti database tradisional, data warehouse biasanya mendukung
analisa trend an time-series, dimana keduanya membutuhkan data historic.
 Data warehouse bersifat nonvolatile, artinya informasi dalam data warehouse
jarang diubah dan bisa dianggap non real time
 Data warehouse bisa digambarkan sebagai “kumpulan teknologi pendukung
keputusan, dimaksudkan untuk memungkinkan pekerja yang berhubungan
dengan informasi (eksekutif, manajer dan analis) untuk membuat keputusan
lebih baik dan lebih cepat”
1
Data warehouse adalah data-data yang beorientasi subjek, terintegrasi, memiliki
dimensi waktu, serta merupakan koleksi tetap (non-volatile), yang digunakan dalam
mendukung proses pengambilan keputusan.

Data warehouse adalah sebuah sistem yang mengambil dan menggabungkan data
secara periodik dari sistem sumber data ke penyimpanan data bentuk dimensional
atau normal (Rainardi, 2008).

Data warehouse didesain untuk kita bisa melakukan query secara cepat. Informasi
diturunkan dari data lain, dilakukan rolling up untuk dijadikan ringkasan, dilakukan
operasi drilling down untuk mendapatkan informasi lebih detail, atau melihat pola
yang menarik atau melihat trend (kecenderungan).

Dalam definisi awal menurut Inmon (1993), datanya adalah:


 Berorientasi pada subjek
o Karena warehouse diatur di sekitar subjek utama perusahaan (seperti
pelanggan, produk, dan penjualan), daripada area aplikasi utama
(seperti faktur pelanggan, kontrol stok, dan penjualan produk).
o Hal ini tercermin dalam kebutuhan untuk menyimpan data pendukung
keputusan daripada data yang berorientasi aplikasi.
 Terintegrasi
o Karena mengumpulkan sumber data dari berbagai sistem aplikasi di
seluruh perusahaan.
o Sumber data seringkali tidak konsisten, misalnya menggunakan format
yang berbeda.
o Sumber data terintegrasi harus dibuat konsisten untuk menyajikan
tampilan data yang terpadu kepada pengguna.
 Variasi waktu
o Karena data warehouse akurat dan hanya valid di beberapa titik waktu
atau dalam interval waktu tertentu.
o Varians waktu dari data warehouse juga ditampilkan dalam waktu yang
diperpanjang saat data disimpan, asosiasi waktu implisit atau eksplisit
dengan semua data, dan fakta bahwa data tersebut mewakili
serangkaian snapshot.
2
 Nonvolatile
o Karena data tidak diperbarui secara real time tetapi diperbarui dari
sistem operasional secara teratur.
o Data baru selalu ditambahkan sebagai suplemen ke database, bukan
sebagai pengganti.
o Basis data terus menerus menyerap data baru, secara bertahap
mengintegrasikannya dengan data sebelumnya.

Manfaat Data Warehouse


Implementasi data warehouse yang berhasil dapat membawa manfaat besar bagi
organisasi, termasuk:
 Potensi pengembalian investasi yang tinggi.
Sebuah studi oleh International Data Corporation (IDC) melaporkan bahwa
proyek data warehouse menghasilkan pengembalian investasi (ROI) tiga
tahun rata-rata sebesar 401% (IDC, 1996). Lebih jauh lagi, studi IDC
selanjutnya tentang analisis bisnis yaitu, alat analitik yang mengakses data
warehouse menghasilkan ROI satu tahun rata-rata sebesar 431% (IDC,
2002).
 Keunggulan kompetitif.
o Pengembalian investasi yang sangat besar bagi perusahaan-
perusahaan yang telah berhasil mengimplementasikan data
warehouse adalah bukti keunggulan kompetitif yang menyertai
teknologi ini.
o Keunggulan kompetitif diperoleh dengan memungkinkan pengambil
keputusan mengakses data yang dapat mengungkapkan informasi
yang sebelumnya tidak tersedia, tidak diketahui, dan belum
dimanfaatkan, misalnya tentang pelanggan, tren, dan permintaan.
 Peningkatan produktivitas pengambil keputusan perusahaan.
o Data warehousing meningkatkan produktivitas pembuat keputusan
perusahaan dengan membuat database terintegrasi dari data historis
yang konsisten dan berorientasi pada subjek.
o Ini mengintegrasikan data dari beberapa sistem yang tidak kompatibel
ke dalam bentuk yang memberikan satu tampilan organisasi yang
konsisten.
3
o Dengan mengubah data menjadi informasi yang bermakna, gudang
data memungkinkan pembuat keputusan perusahaan untuk
melakukan analisis yang lebih substantif, akurat, dan konsisten.

Perbandingan Sistem OLTP dan Data Warehousing

Tabel 14.1 Perbandingan Sistem OLTP dan Data Warehousing


Karakteristik Sistem OLTP Sistem Data Warehouse

Tujuan utama Mendukung pemrosesan Mendukung pemrosesan analitik


operasional
Usia data Menangani data saat ini Menangani data masa lalu
Latensi data Real time Bergantung pada lamanya siklus
untuk suplemen data warehouse
(Tetapi trennya mengarah pada
suplemen real time)
Perincian data Data rinci Data detail, data sederhana dan
sangat ringkas
Pengolahan data Pola insert, delete, Pola queri data yang kurang dapat
update dan queri data diprediksi; tingkat throughput
yang dapat diprediksi. transaksi sedang hingga rendah
Tingkat throughput
transaksi yang tinggi
Pelaporan Pelaporan tetap yang Pelaporan dinamis, multidimensi
dapat diprediksi, satu dan sifatnya tidak terduga.
dimensi dan relative
statis
User Melayani sejumlah besar Melayani jumlah pengguna
pengguna operasional manajerial yang lebih rendah (tetapi
tren juga mendukung persyaratan
analitis pengguna operasional)

4
Masalah Data Warehouse
1. Meremehkan sumber daya untuk Extract Transform Load (ETL) data
2. Menyembunyikan masalah dengan source system
3. Data yang dibutuhkan tidak di caputured
4. Meningkatkan permintaan end-user
5. Data homogeny
6. Permintaan tinggi untuk resource
7. Kepemilikan data
8. High maintenance
9. Proyek berdurasi panjang
10. Kompleksitas integrase

Data Warehouse Architecture


Data Operational
Sumber data untuk data warehouse disuplai dari:
 Data operasional mainframe yang disimpan dalam database hierarki dan
jaringan generasi pertama.
 Data departemen disimpan dalam sistem file berpemilik seperti VSAM, RMS,
dan DBMS relasional seperti Informix dan Oracle.
 Data pribadi disimpan di workstation dan server pribadi.
 Sistem eksternal seperti Internet, database yang tersedia secara komersial,
atau database yang terkait dengan pemasok atau pelanggan organisasi.

Data store operational (ODS)


 Penyimpanan data operasional (ODS) adalah tempat penyimpanan data
operasional terkini dan terintegrasi yang digunakan untuk analisis.
 ODS sering kali dibuat ketika sistem operasional lama tidak mampu mencapai
persyaratan pelaporan.
 ODS menyediakan pengguna dengan kemudahan menggunakan database
relasional sambil tetap jauh dari fungsi pendukung keputusan dari data
warehouse.

5
Gambar 14.1 Typical architecture of a data warehouse

Menurut Connoly (2005), arsitektur data warehouse terdiri atas:


a. Operational data
b. Operational data store
c. Load manager
d. Warehouse manager
e. Query Manager
f. Detailed data
g. Lightly dan highly summarized data
h. Archieve/Backup data
i. Meta data
j. End-User Access Tools

Manajer gudang melakukan semua operasi yang terkait dengan pengelolaan data di
gudang. Operasi yang dilakukan oleh pengelola gudang meliputi:
 Analisis data untuk memastikan konsistensi;
 Transformasi dan penggabungan data sumber dari penyimpanan sementara
menjadi tabel data warehouse;
 Pembuatan indeks dan tampilan pada tabel dasar;
 Pembentukan denormalisasi (jika perlu);

6
 Generasi agregasi;
 Mencadangkan dan mengarsipkan data.

Perbandingan antara Data Operasional


Data operasional Data Warehouse
Dirancang berorientasi hanya Dirancang berdasar pada
pada aplikasi dan fungsi tertentu subjek-subjek tertentu
(utama)
Focusnya pada desain database Focusnya pada pemodelan
dan proses data dan desain data
Berisi rincian atau detail data Berisi data-data history yang
akan dipakai dalam proses
analisis
Relasi antar table berdasar Banyak aturan bisnis dapat
aturan terkini (selalu mengikuti tersaji antara table-tabel
rule (aturan) terbaru)

Integrated
Data Warehouse dapat menyimpan data-data yang berasal dari sumber-sumber
yang terpisah kedalam suatu format yang konsisten dan saling terintegrasi satu
dengan lainnya. Dengan demikian data tidak bisa dipecah-pecah karena data yang
ada merupakan suatu kesatuan yang menunjang keseluruhan konsep data
warehouse itu sendiri.

Syarat integrase sumber data dapat dipenuhi dengan berbagai cara konsisten dalam
penamaan variable konsisten dalam ukuran variable konsisten dalam struktur
pengkodean dan konsisten dalam atribut fisik dari data.

Contoh pada lingkungan operasional terapat berbagai macam aplikasi yang mungkin
pula dibuat oleh developer yang berbeda.

7
Gambar 14.2 Integrated dari Data Warehouse
Time Variant
Seluruh data pada data warehouse dapat dikatakan akurat atau valid pada rentang
waktu tertentu. Untuk melihat interval waktu yang digunakan dalam mengukur
keakuratan suatu data warehouse, kita dapat menggunakan cara antara lain:
 Cara yang paling sederhana adalah menyajikan data warehouse pada
rentang waktu tertentu, misalnya antara 5 sampai 10 tahun kedepan.
 Cara kedua, dengan menggunakan variasi/perbedaan waktu yang disajikan
dalam data warehouse baik implicit maupun eksplicit secara eksplicit dengan
unsur waktu dalam hari, minggu, bulan dan sebagainya. Secara implicit
misalnya pada saat data tersebut diduplikasi pada setiap akhir bulan, atau
pertiga bulan. Unsur waktu akan tetap ada secara implicit didalam data
tersebut.
 Cara yang ketiga, variasi waktu yang disajikan data warehouse melalui
serangkaian snapshot yang panjang. Snapshot merupakan tampilan dari
sebagian data tertentu sesuai keinginan pemakai dari keseluruhan data yang
ada bersifat read-only.

8
Gambar 14.3 Time Variant

Operasional Data Warehouse


Current Value Data Snapshot Data
 Time horizon: 60-90  Time horizon: 5-10 years
days  Key contain an element of
 Key may or may not time
have an element of time  Once snapshot is created,
 Data can be update record cannot be update

Nonvolatile
Karakteristik keempat dari data warehouse adalah non-volatile, maksudnya data
pada data warehouse tidak di-update secara real time tetapi di refresh dari sistem
operasional secara regular. Data yang baru selalu ditambahkan sebagai suplemen
bagi database itu sendiri dari pada sebuah perubahan. Database tersebut secara
kontinyu menyerap data baru, kemudian secara incremental disatukan dengan data
sebelumnya.

Berbeda dengan database operasional yang dapat melakukan update, insert dan
delete terhadap data yang mengubah isi dari database sedangkan pada data
warehouse hanya ada dua kegiatan memanipulasi data yaitu loading data
(mengambil data) dan akses data (mengakses data warehouse seperti melakukan
query atau menampilkan laporan yang dibutuhkan, tidak ada kegiatan updating data)

9
Gambar 14.4 Nonvolatile

Struktur Data Warehouse


Current Detail Data
Current detail data merupakan data detail yang aktif saat ini mencerminkan keadaan
yang sedang berjalan dan merupakan level terendah dalam data warehouse.
Didalam area ini warehouse menyimpan seluruh detail data yang terdapat pada
skema basis data.

Jumlah data sangat besar sehingga memerlukan storage yang besar pula dan dapat
diakses secara cepat. Dampak negative yang ditimbulkan adalah kerumitan untuk
mengatur data menjadi meningkat dan biaya yang diperlukan menjadi mahal.
Berikut ini beberapa alasan mengapa current detail data menjadi perhatian utama:
1. Menggambarkan kejadian yang baru terjadi dan selalu menjadi perhatian
utama
2. Sangat banyak jumlahnya dan disimpan pada tingkat penyimpanan terendah
3. Hampir selalu disimpan dalam storage karena cepat diakses tetapi mahal dan
kompleks dalam pengaturannya
4. Bisa digunakan dalam membuat rekapitulasi sehingga current detail data
harus akurat.

Older Detail Data


Data ini merupakan data historis dari current detail data, dapat berupa hasil
cadangan atau archieve data yang disimpan dalam storage terpisah. Karena bersifat
back-up, maka biasanya data disimpan dalam storage alternative seperti tape-desk.

10
Data ini biasanya memiliki tingkat frekuensi akses yang rendah. Penyusunan file
atau directory dari data ini disusun berdasarkan umur dari data yang bertujuan
mempermudah untuk pencarian atau pengaksesan kembali.

Anatomi Data Warehouse


Data warehouse fungsional
Keuntungan dari bentuk ini adalah sistem mudah dibangun dengan biaya relative
murah. Sedangkan kerugiannya adalah resiko kehilangan konsistensi data dan
terbatasnya kemampuan dalam pengumpulan data bagi pengguna.

Gambar 14.5 Bentuk Data Warehouse Fungsional

Data Warehouse Terpusat


 Data warehouse terpusat ini biasanya digunakan oleh perusahaan yang
belum memilki jaringan eksternal.
 Keuntungan dari betuk ini adalah data benar-benar terpadu karena
konsistensinya yang tinggi.
 Kerugiannya adalah biaya yang mahal serta memerlukan waktu yang cukup
lama untuk membangunnya.

11
Gambar 14.6 Bentuk Data Warehouse Terpusat

Data Warehouse Terdistribusi


 Keuntungannya adalah data tetap konsisten karena sebelum data digunakan
data terlebih dahulu disesuaikan atau mengalami proses sinkronisasi.
 Kerugiannya adalah lebih kompleks untuk diterapkan karena sistem operasi
dikelola secara terpisah juga biaya nya yang paling mahal dibandingkan
dengan dua bentuk data warehouse lainnya.

Gambar 14.7 Bentuk Data Warehouse Terdistribusi

Perencanaan dan Perancangan Data Warehouse


Beberapa factor yang harus diperhatikan dalam perencanaan data warehouse, yaitu:
1. Tujuan pembangunan data warehouse harus memenuhi kriteria dibawah ini:
 Meningkatkan kemampua akses informasi
 Meningkatkan kualitas keputusan yang diambil
 Memberikan integrase dan interfungsi dalam organisasi perusahaan
 Meningkatkan apresiasi pemakai dalam menangkap data.

12
2. Terkait dengan perencanaan strategis organisasi dalam menjalankan
aktifitasnya.
3. Merujuk pada kebutuhan masa depan dan pada kemungkinan pemakai baru
dalam organisasi.
4. Kriteria fasilitas yang dapat diberikan oleh data warehouse
 Akuisisi data yang dapat mendukung integrase data
 Navigasi yang memudahkan pemakai untuk mencari data
 Akses informasi yang mudah dan cepat

Tahap-tahap dalam pembangunan data warehouse.


Tahap 1 : Analisis Informasi Strategis
Tahap 2 : Rancangan rencana
Tahap 3 : Konstruksi atau Pengimplementasian
Tahap 4 : Dukungan Operasional

Data Mart
Database yang berisi subset data perusahaan untuk mendukung persyaratan analitis
dari unit bisnis tertentu (seperti departemen Penjualan) atau untuk mendukung
pengguna yang memiliki persyaratan yang sama untuk menganalisis proses bisnis
tertentu (seperti penjualan properti).

13
Latihan

1. Diskusikan apa yang dimaksud dengan istilah-istilah berikut saat


mendeskripsikan karakteristik data di data warehouse:
(a) Subject oriented
(b) terintegrasi
(c) varian waktu
(d) nonvolatile

2. Jelaskan perbedaan sistem pemrosesan transaksi online (OLTP) dengan


sistem data warehousing.

3. Jelaskan manfaat utama dan masalah yang terkait dengan data warehousing.

4. Arsitektur data warehouse terdiri dari banyak komponen. Jelaskan peran


masing-masing komponen.

5. Jelaskan fungsi utama dari komponen berikut di lingkungan data


warehousing:
(a) Repositori metadata;
(b) Database temporal;
(c) ETL tools;
(d) DMBS paralel;
(e) Enterprise Warehouse

14
15

Anda mungkin juga menyukai