(CSD310)
MODUL 3
SIKLUS HIDUP PEMBANGUNAN DATA WAREHOUSE
DISUSUN OLEH
Ir. Munawar, MMSI., M.Com., PhD
B. Uraian Perkuliahan
1. Siklus Data Warehouse
1.1. Pendahuluan
Pembangunan DW adalah proses yang sangat kompleks yang membutuhkan
metodologi khusus agar bisa sukses diimplementasikan. Banyaknya vendor
penyedia framework untuk pembangunan DW telah memberikan persoalan baru
kepada organisasi yang berniat untuk membangun DW, karena tidak adanya
standard baku yang bisa dijadikan pedoman. Masing-masing vendor menyediakan
platform dan teknologi yang satu dengan yang lain tidak kompetibel. Butuh ekstra
tenaga dan waktu untuk melakukan seleksi platform dan framework mana yang
paling sesuai dengan kondisi organisasi.
Meskipun banyak artikel tentang pembangunan DW telah ditulis, namun
hingga saat ini belum ada standar baku yang disetujui bersama tentang siklus hidup
pembangunan DW. Secara umum metode pembangunan DW yang paling sering
digunakan adalah sebagai berikut (Rizzi, 2009):
(1) analisis kebutuhan (requirements analysis), yang menentukan informasi yang
saling terkait dengan proses pengambilan keputusan dengan
mempertimbangkan persyaratan pengguna atau data riil yang ada di sumber
data operasional;
(2) desain konseptual (conceptual analysis), yang dimaksudkan untuk memperoleh
skema konseptual implementasi yang independen dan ekspresif (tidak
tergantung ke suatu vendor tertentu) untuk data mart (DM) atau DW;
(3) desain logik (logical design), yang memperoleh skema konseptual dan
menghasilkan skema logik yang sesuai melalui model logik yang dipilih; dan
(4) desain fisik (physical design), yang menunjukkan semua persoalan yang terkait
dengan implementasi seperti arsitektur DW.
Gambar 3.1. Fase – Fase Utama Pembangunan Data Warehouse (sumber : Rizzi,
2009)
1.2. Analisis Kebutuhan (Requirements Analysis)
Analisis kebutuhan memegang peran penting di proyek DW, dalam hal
minimalisasi tingkat kegagalan. Analisis kebutuhan adalah dasar dari semua
kegiatan proyek sistem dan mempengaruhi sebagian besar siklus hidup dari system
(Kimball et al, 2008). Meskipun penting, ternyata perusahaan atau organisasi kurang
memberikan perhatian pada analisis kebutuhan dan sering mengabaikan aspek ini
dalam proyek DW (Rizzi et al, 2006). Hal ini terutama karena (1) proyek DW adalah
proses jangka panjang, di mana sebagian besar persyaratan tidak dapat diidentifikasi
pada awal proyek, dan (2) sangat sulit untuk mendapatkan kebutuhan di seluruh
bagian organisasi/ perusahaan, disamping juga karena factor bahwa yang namanya
kebutuhan relative tidak stabil dari waktu ke waktu karena terkait dengan informasi
yang harus diperoleh dari sumber data (Winter dan Strauch, 2003). Rata-rata,
analisis kebutuhan gagal diidentifikasi dalam pengembangan DW, sehingga dapat
menghambat keberhasilan proyek DW (Schiefer et al, 2002).
Analisis kebutuhan untuk DW berbeda dengan analisis kebutuhan untuk sistem
informasi. Identifikasi informasi yang relevan untuk pengambilan keputusan adalah
fokus utama dari analisis kebutuhan untuk pembangunan DW. Pendekatan dan
instrumen yang digunakan untuk analisis kebutuhan meliputi (a) wawancara, (b)
lokakarya, (c) pembuatan prototipe, (d) pembuatan skenario dan (e) analisis area
subjek (Paim dan Castro, 2003; Sen dan Sinha, 2007). Wawancara adalah teknik
dasar untuk mendapatkan kebutuhan pengguna berdasarkan wawancara satu per
Table 3.1. Kelebihan dan Kekurangan Teknik Analisis Kebutuhan Data Warehouse
Analisis
Kelebihan Kekurangan
Kebutuhan
User-driven Keterlibatan pengguna • Ketidakfahaman pengguna tentang
akhir sangat menentukan DW, strategi bisnis maupun proses
kesuksesan penggunaan yang ada di organisasi akan
DW (Niedrite et al, 2009). berakibat ketidaksesuaian pada
skema yang dihasilkan sangat tinggi
(Niedrite et al, 2009).
• Butuh waktu lama untuk bisa
mendapatkan konsensu bersama
apa yang benar-benar dibutuhkan
karena banyaknya pengguna
dengan sudaut pandang masing-
masing yang bisa jadi berbeda-
beda. (Niedrite et al, 2009; Lujan-
Mora, 2002).
Data-driven Cara paling cepat untuk Beberapa model mungkin tidak
mendapatkan model merefleksikan fakta yang
Gambar 3.4. Skema Snowflake untuk penjualan/ sales (Moody and Kortink, 2000)
Gambar 3.5. Skema Canstellation untuk penjualan/ sales (Moody and Kortink, 2000)
Perlu dilakukan perbandingan yang komprehensif untuk melakukan pemilihan
pemodelan multidimensionalitas agar sesuai dengan kondisi organisasi. Salah satu
teknik untuk penilaian pemodelan multidimensionalitas bisa menggunakan kriteria :
Tabel 3.6. Beberapa Teknik Pengindeksan di DW (sumber: Jamil and Ibrahim, 2009)
Teknik Kelebihan Kekurangan
Pengindeksan
Indeks Bitmap Banyak dipakai di lingkungan DW Kinerjanya rendah
Waktu respons nya bisa minimal kolom kardinalitas
Ruang penyimpanan yang dibutuhkan datanya tinggi
paling kecil dibanding teknik indeksing Perlu ekstra usaha jika
Universitas Esa Unggul
http://esaunggul.ac.id 15 /
23
yang lain index dimodifikasi
Kinerja sangat bagus meski dengan Jika ada modifikasi di
memori atau CPU kecil index bitmap yang
Pemeliharaannya efisine tidak tepat maka akan
terjadi concurrency
Index Cluster Kinerja bisa dioptimalisasikan. Biaya meningkat
Bagus untuk query berbasis rentang, seiring dengan data
hanya membutuhkan data yang terurut yang tidak terurut
Perlu pengurutan ulang
jika data ditambahkan
(Davidson, 2008;
Aizawa, 2002)
Dalam konteks relasional, ada tiga jenis fragmentasi yang bisa diadopsi DW
(Ozsu dan Valduriez, 1991): fragmentasi vertikal, fragmentasi horizontal dan
fragmentasi campuran (hibrid). Pada dasarnya, fragmentasi vertikal membagi tabel
dengan kolom, sedangkan fragmentasi horizontal membagi tabel dengan baris.
Dalam fragmentasi horizontal, tabelnya sama dengan yang asli, kecuali barisnya
dibagi. Namun, dalam fragmentasi vertikal, satu tabel dibagi menjadi dua atau lebih
tabel. Di banyak kasus, fragmentasi horizontal atau vertikal sederhana tidak cukup
untuk memenuhi persyaratan aplikasi. Diperlukan fragmentasi campuran / hibrid
(fragmentasi horizontal yang diikuti oleh fragmentasi vertikal atau sebaliknya).
Universitas Esa Unggul
http://esaunggul.ac.id 16 /
23
Fragmentasi horizontal dimaksudkan untuk meminimalkan akses data yang
tidak relevan, sedangkan fragmentasi vertikal dirancang untuk mempartisi suatu
relasi menjadi sekumpulan relasi yang lebih kecil sehingga hanya satu fragmen yang
dieksekusi oleh banyak aplikasi (Ozsu dan Valduriez, 1991; Bellatreche, 2000).
Selanjutnya, fragmentasi dapat diterapkan pada DM ketika pendekatan top-down
diterapkan (DM berasal dari DW).
Fragmentasi horizontal selanjutnya dibagi menjadi dua versi fragmentasi
(Ozsu dan Valduriez, 1991) yaitu: primer dan turunan. Kedua versi ini (primer dan
turunan) berhubungan dengan atribut. Untuk yang versi primer, atribut didefinisikan
pada relasi tersebut, sedangkan pada fragmentasi turunan, atribut didefinisikan pada
relasi yang lain (berdasarkan skema fragmentasi tabel lain).
Sebelum fragmentasi horisontal dilaksanakan, ukuran tabel dan subset tupel
yang sering di query secara bersamaan harus diuji terlebih dahulu. Semakin tinggi
jumlah baris, semakin rendah ukurannya; akibatnya, waktu respons kueri meningkat,
meskipun penggunaan beberapa baris memperburuk kualitas query. Persyaratan
dan data yang di query secara bersamaan harus berfungsi sebagai dasar untuk
keputusan apakah akan menambah jumlah baris atau tidak.
D. Kunci Jawaban
Referensi
Aizawa, A. (2002). A method of cluster-based indexing of textual data. In
Proceedings of the 19thinternational conference on Computational linguistics -
Volume 1, International Conference On Computational Linguistics, Taipei,
Taiwan, pp. 1 – 7, 2002
Aouiche, K. 2005. Automatic selection of indexes in data warehouses. Research
report, Laboratory ERIC Lumière Lyon2University, Doctoral School in Cognitive
Science, December 8, 2005.
Arfaoui, N. and Akaichi, J. (2012). Data Warehouse: Conceptual and Logical
Schema – Survey. International Journal of Enterprise Computing and Business
Systems. ISSN (Online): 2230-8849. Vol. 2 Issue 1 January 2012
Artz, J. 2005. Data driven vs. metric driven data warehouse design. In Encyclopaedia
of Data Warehousing and Mining, (pp. 223 – 227). Idea Group