(CSD310)
MODUL 2
ARSITEKTUR DATA WAREHOUSE
DISUSUN OLEH
Ir. Munawar, MMSI., M.Com., PhD
B. Uraian Perkuliahan
1. Arsitektur Data Warehouse
1.1. Pendahuluan
Dalam perancangan arsitektur DW ada dua pendekatan yang sangat terkenal
yaitu pendekatan top-down yang dimotori oleh Bill Inmon dan pendekatan bottom-up
yang dimotori oleh Ralp Kimball. Perbedaan mendasar diantara keduanya lebih
kepada pembuatan DW terlebih dahulu ataukah data mart (DM). Data Mart (DM)
mirip dengan DW, tetapi dirancang untuk memenuhi kebutuhan suatu departemen
atau fungsi bisnis tertentu. Perbedaan pendekatan diantara keduanya bisa dilihat
pada penjelasan berikut ini
Top-down
Pendekatan ini berfokus pada pembangunan DW secara terpusat. DW
terpusat adalah DW tunggal yang memasok kebutuhan berbagai departemen
dengan menggunakan model tunggal yang memenuhi persyaratan banyak divisi di
suatu perusahaan. Dalam DW terpusat, umpan balik dari departemen atau kelompok
pengguna dapat digunakan untuk menyesuaikan persyaratan. Persyaratan yang
berbeda di tingkat organisasi yang berbeda kemudian digabungkan untuk
membangun satu skema untuk seluruh DW. Tingkat kegagalan DW terpusat jauh
lebih tinggi daripada data mart (DM), terutama untuk organisasi dengan anggaran
dan sumber daya terbatas.
Bottom-up
Membangun data mart (DM) satu per satu adalah strategi utama yang
diadopsi dalam desain bottom-up. Di sini, DW dapat dianggap sebagai integrasi
Berikut ini adalah ringkasan kelebihan dan kekurangan dari pendekatan top-
down dan bottom-up sebagaimana yang sudah dijelaskan di atas.
Panoply
Panoply menyediakan platform manajemen data dari ujung ke ujung. Data
warehouse satu ini bisa dibilang merupakan salah satu platform yang sangat mudah
dioperasikan, karena tidak membutuhkan coding bagi yang ingin mengambil data.
Panoply menggunakan sistem mesin pembelajaran dan Natural Language
Processing (NLP) yang berfungsi untuk membentuk informasi dari berbagai sumber
dengan teknik eliminasi. Panoply akan merampingkan data yang dibutuhkan menjadi
paling spesifik yang akan mengurangi waktu pengambilan data pendukung.
Panoply akan memudahkan dalam memulai dan menambahkan berbagai data dari
berbagai sumber yang diinginkan. Koneksi antara sumber data dan sistem data bisa
di custom sesuai dengan kebutuhan yang memberikan laporan data mendalam dan
bermutu.
BigQuery
BigQuery merupakan data warehouse milik Google tanpa server, memiliki skala yang
besar dengan harga yang terjangkau. Service ini masuk dalam bagian Google Cloud
Platform dengan kapasitas yang besar. Dengan sistem NoOPs (tanpa operator)
analisis data, BigQuery menawarkan pengguna kemampuan untuk mengatur
data menggunakan SQL yang cepat seperti query untuk analisis real-time dengan
sumber terbaru yang pastinya sangat menguntungkan.
D. Kunci Jawaban
a. Tidak ada arsitektur data warehouse yang sesuai untuk semua organisasi.
Kebutuhan bisnis, infrastruktur yang ada, kapan waktu dibutuhkan serta
anggaran yang tersedia menjadi faktor penentu arsitektur yang sesuai
dengan organisasi
b. Tidak ada acuan yang pasti yang bisa berlaku general untuk semua
organisasi/ perusahaan. Anggaran yang tersedia, rentang waktu dan
kebutuhan bisnis yang akan menentukan mana yang paling sesuai.
c. Lihat kembali tabel 2.1 di atas
d. Data mart adalah bagian dari data warehouse. Data mart biasanya fokus
hanya pada satu departemen tertentu atau satu subyek area tertentu.
Semantara data warehouse mencakup satu enterprise.
Referensi
Inmon, W. H. (2005). Building the data warehouse (4th ed.): John Wiley & Sons, Inc.
New York, NY, USA.
Kimball, R. and Ross, M. (2013). Data Warehouse Toolkit. 3rd edition. Wiley
Publishing.
Kimball, R., Ross, M., Thornthwaite, W., Mundy, J. and Becker, B. (2008). The Data
Warehouse Life Cycle Toolkit: Practical Techniques for Building Data