Data warehouse adalah kumpulan data yang memiliki sifat subjek orientasi, terpadu, waktu varian dan tetap, pada pengumpulan data untuk mendukung proses pengambilan keputusan manajemen. Data warehouse adalah database yang read-only analisis dan digunakan sebagai dasar sistem pendukung keputusan. Kumpulan data yang dimaksudkan sebagai kumpulan data yang dihasilkan untuk mendukung pengambilan keputusan, tetapi juga merupakan penyimpanan data saat ini dan masa lampau yang secara potensial diperlukan para manajer didalam organisasi. Data biasanya akan tersedia secara terstruktur dalam bentuk siap untuk kegiatan proses analisis (misalnya, pengolahan analisis secara online [OLAP(Online Analytical Processing)]), DSS(Decision Support System), data mining, query, pelaporan, dan aplikasi pendukung keputusan lainnya).
B. Tujuan Data Warehouse
1. Mempermudah pengaksesan informasi perusahaan 2. Menyediakan informasi perusahaan secara konsisten 3. Mampu beradaptasi dan tahan terhadap perubahan 4. Mampu mengamankan informasi perusahaan 5. Mampu memberikan dukungan dalam pengambilan keputusan 6. Dapat diterima dan dioperasikan dengan baik oleh pengguna
C. Manfaat Data Warehouse
Menurut Ramelho 1. Data diorganisir dengan baik untuk query analisis dan sebagai bahan untuk pemrosesan transaksi 2. Perbedaan diantara struktur data yang heterogen pada beberapa sumber yang terpisah dapat diatasi 3. Aturan untuk transformasi data diterapkan untuk memvalidasi dan mengkonsolidasi data apabila data dipindahkan dari database OLTP ke data warehouse 4. Masalah keamanan dan kinerja bisa dipecahkan tanpa perlu mengubah system produksi
Menurut Sean Nolan an Tom Huguelet
1. Kemampuan untuk memiliki data yang konsisten 2. Kemampuan kinerja analisa yang cepat 3. Mengetahui adanya hasil yang berulang ulang 4. Menemukan adanya celah pada business knowledge atau business process 5. Mengurangi biaya administrasi 6. Memberi wewenang pada semua anggota dari perusahaan dengan menyediakan kepada mereka informasi yang dibutuhkan agar kinerja isa lebih efektif. D. Karakteristik data warehouse 1. Berorientasi Subjek (Subject Oriented) Data warehouse berorientasi subjek artinya data warehouse didesain untuk menganalisa data berdasarkan subject – object tertentu dalam organisasi, bukan pada proses atau fungsi aplikasi tertentu. 2. Terintegrasi (Integrated) Data warehouse dapat menyimpan data-data yang berasal dari sumber-sumber yang terpisah kedalam suatu format yang konsisten dan saling terinteragrasi satu dengan lainnya. Dengan demikian data tidak bisa di pecah-pecah karena data yang ada merupakan suatu kesatuan yang menunjang keseluruhan konsep data warehouse itu sendiri. 3. Rentang Waktu(Time Variant) Seluruh data pada data warehouse dapat dikatakan akurat atau valid pada rentang waktu tertentu. Data tidak menyediakan status saat ini, mereka disimpan untuk lima atau sepuluh tahun atau lebih dan digunakan untuk tren, peramalan dan perbandingan. 4. Non-Volatile Maksudnya data pada data warehouse tidak di update secara real time tetapi di refresh dari ssitem operasional secara regular. Data yang baru selalu ditambahkan sebagai suplemen bagi database itu sendiri dari pada sebagai sebuah perubahan. Database tersebut secara kontinu menyerap data baru ini, kemudian secara incremental disatukan dengan data sebelumnya.
E. Tahapan Pembuatan Data Warehouse
Ada 9 tahap metodogi perncangan untuk data warehouse : 1. Pemilihan proses 2. Pemilihan sumber 3. Mengidentifikasi dimensi 4. Pemilihan fakta 5. Menyimpan pre-kalkulasi di table fakta 6. Melengkapi table dimensi 7. Pemilihan durasi database 8. Menelusuri perubahan dimensi yang perlahan 9. Menentukan prioritas dan mode query(perancangan fisik)
F. Skema Dalam Data Warehouse
1. Skema bintang 2. Snowflake
G. Berbagai macam tools dan Komponen software yang ditawarkan
Query Surge SAS CloverDX IBM-DataStage Panoply Informatica Skyvia Teradata Corporation Oracle MS SSIS Amazon Redshift Talend Open Studio SAP