Data Warehouse
Perkembangan internet yang semakin pesat dewasa ini telah mengakibatkan bertambah
besar data yang ada. Data Warehouse merupakan koleksi informasi suatu perusahaan/organisasi
yang diperoleh dari operasional sistem dan sumber data lainnya, yang dapat digunakan untuk
membantu pengambilan keputusan dengan menganalisis seluruh data yang ada di suatu database.
Tujuan utama dibangunnya data warehouse adalah untuk menyediakan/ menyajikan
informasi-informasi terkait bisnis guna membantu dalam pengambilan keputusan secara cepat dan
tepat. Ada beberapa keuntungan yang bisa diperoleh dengan dimanfaatkannya data warehouse,
diantaranya adalah:
1. Data-data dapat terorganisir dengan baik sehingga bisa menghasilkan analisis yang tepat
guna mempercepat proses transaksi;
2. Perbedaan pada beberapa struktur data yang tersebar di beberapa tempat dapat diatasi;
3. Dapat mengetahui proses analisis yang hasilnya terjadi berulang-ulang;
4. Mengurangi biaya operasional perusahaan;
5. Seluruh proses proses analisis tidak mengubah sistem produksi perusahaan;
6. Akses data cepat dan konsistensi data dapat dipertahankan.
Dari penjelasan di atas, dapat disimpulkan bahwa data warehouse adalah database yang
saling berinteraksi yang dapat digunakan untuk query dan analisisis, berorientasi subjek,
terintegrasi, time-variant, tidak berubah yang digunakan untuk membantu para pengambil
keputusan.
Secara fisik data warehouse adalah database, tapi perancangan data warehouse dan
database sangat berbeda. Dalam perancangan database tradisional menggunakan normalisasi,
sedangkan pada data warehouse justru menggunakan denormalisasi. Berikut ini adalah perbedaan
antara database dengan data warehouse:
Database dipergunakan dalam Online Transactional Processing (OLTP) dan dapat pula
dipergunakan untuk kebutuhan data warehouse
Data warehouse dipergunakan dalam Online Analytical Processing (OLAP) yang mampu
membaca data historis bagi pengguna dalam proses pengambilan keputusan
Tabel dan gabungan di database sangat kompleks sehingga dapat mengurangi data
berlebihan serta menghemat ruang penyimpanan.
Tabel dan gabungan dalam data warehouse tergolong sederhana untuk mengurangi waktu
respon dan permintaan analitis.
Database berorientasi pada pelanggan (customer oriented) dan dipergunakan dalam proses
query serta transaksi, misalnya oleh kasir, pramuniaga, serta para profesional IT.
Data warehouse berorientasi pada pasar (market oriented) dan dipergunakan dalam proses
analisis data oleh orang-orang yang memiliki profesi knowlegde field, misalnya eksekutif,
manager, serta para ahli analis data.
Database mengatur dan mengolah data secara detil sehingga mudah dipergunakan dalam
proses pengambilan keputusan.
Data warehouse mengatur dan mengolah data-data historis dalam jumlah besar dan
menyediakan beberapa fitur agregasi (mengelompokkan) dan meringkas (summary), drill-
down dan drill-up serta kemampuan menyimpan dan dan mengolah data menurut tingkat
granularitas yang berbeda.
Sistem database umumnya mengambil pemodelan data “entity relationship” serta desain
yang berorientasi pada aplikasi.
Sistem data warehouse umumnya mengambil pemodelan “snowflake” atau “star” serta
desain yang berorientasi pada subyek.
Database terfokus pada data real time dalam suatu organisasi atau instansi tanpa mengacu
pada data-data historis maupun data-data dari organisasi lainnya.
Data warehouse sering menjangkau berbagai tipe skema database dikarenakan proses
evolusioner dari sebuah organisasi. Data warehouse juga berhubungan dengan berbagai
informasi yang didapatkan dari beberapa organisasi lainnya. Hal ini akan menyebabkan
jumlah volume yang sangat besar sehingga data warehouse disimpan dalam beberapa
tempat penyimpanan.
Pola akses pada database terutama terdiri dari transaksi atomik yang pendek dan sistem
seperti ini membutuhkan mekanisme “concurency control” serta “recovery”.
Pola akses pada data warehouse sebagian besar adalah “read only”. Hal ini karena sebagian
besar data yang tersimpan adalah data-data historis dan hanya sedikit data-data baru.
Namun perkembangan terkini data warehouse sudah mulai mengadopsi juga data yang
mendekati real time sehingga ada data warehouse yang sifatnya near real time.
Semua alasan diatas sangat mendukung perlunya DW tunggal yang terpusat. Namun dalam
beberapa kasus, DW yang terdistribusi dirasa tetap masuk akal karena beberapa alasan sebagai
berikut:
Bisnis yang dilakukan perusahaan secara geografis memang terpisah. Demikian juga
produksi perusahaan mungkin ada beberapa lini produk yang berbeda. Dalam kondisi
seperti ini dibutuhkan DW lokal dan DW global. DW lokal merepresentasikan pemrosesan
data kebutuhan lokal, sementara DW global merepresentasikan intergrasi bisnis
Banyaknya data yang harus diolah perlu didistribusikan melalui beberapa prosesor dan
mungkin juga perlu beberapa mesin. Dengan demikian secara fisik ada banyak DW, namun
secara logis tetap sebagai satu DW
Dari berbagai macam arsitektur DW di atas, perlu ada kajian tersendiri mana arsitektur yang pas
buat organisasi. Anggaran biaya, jumlah tenaga kerja dan waktu adalah beberapa pertimbangan
awal yang akan mennetukan arsitektur mana yang lebih cocok untuk suatu organisasi.