Anda di halaman 1dari 3

Pengenalan Data Warehouse

Perbedaan Data Warehouse dengan Data Warehousing


Data warehouse adalah tempat penyimpanan data untuk pengolahan data Online Analytical
Processing (OLAP). Sementara, data warehousing adalah tata cara untuk membentuk data
warehouse sesuai dengan kebutuhan bisnis.

Hierarki Desain Data Warehouse

Berupa data yang sudah diagregasi atau dilakukan


grouping, sehingga data menjadi kesimpulan yang dapat
diambil insight-nya untuk dilaporkan dan dianalisis.

Data mart

Seluruh data masuk ke proses transformasi


dalam bentuk terstruktur dan
Data warehouse
didenormalisasi, sehingga data menjadi
lengkap.

Data lake

Berisi kumpulan data yang belum dan semi terstruktur


dari data internal dan eksternal. Namun di situasi
berbeda, bisa berisikan data yang sudah terstruktur
namun belum didenormalisasi.

01
Hierarki Akses Data Warehouse

Dapat diakses oleh high level management, dan


diberikan report dari data mart. Biasanya berupa report
harian, mungguan, atau bulanan.

Data mart

Dapat diakses oleh business analyst, dan


tidak untuk high level management. Hal ini
Data warehouse
karena masih dilakukan data cleansing dan
data processing.

Data lake

Hanya dapat diakses oleh data developer, karena data


lake masih menyimpan data mentah yang belum dapat
diambil insight-nya.

Hierarki Perincian Data Warehouse

Data berupa rangkuman atau disebut data summary,


yang sudah diagregasi sehingga tidak rinci dan tidak
beragam lagi. Data yang ditampilkan hanya yang
menghasilkan insight.
Data mart

Data mulai disortir, dibersihkan, dan diolah.


Tujuannya untuk memberikan dampak
Data warehouse
berbeda, karena data sudah tidak serinci
dan beragam seperti data lake.

Data lake

Memiliki data yang paling terperinci dan beragam. Data


lake menjadi tempat teraman karena sistem duplikat
data, yang membantu ketika terjadi kehilangan data.

02
Hierarki Peraturan Data Warehouse

Data harus sangat dijaga agar tidak berubah. Tujuannya


untuk menghindari kesalahpahaman saat dilihat oleh
high level management.

Data mart
Mulai terjadi peraturan data untuk
mengatur naming convention, data type,
Data warehouse dan enkripsi padat data-data konfidensial,
serta memberlakukan pengaturan hak
akses.

Data lake

Data lake dikategorikan masih toleran dan data masih


disimpan sesuai bentuk semula.

Bagian Data Warehouse


Dalam penggunaannya, data warehouse dipecah menjadi 3 bagian, yaitu:
1. Staging
Merupakan tingkat pertama saat semua data yang tidak atau semi terstruktur sudah diubah
menjadi data terstruktur. Naming convention tidak berubah dan masih menggunakan naming
dari data source. Pihak yang dapat mengakses hanya business intelligence developer, yang
bertugas untuk membentuk bagian integration.
2. Integration/standardization
Merupakan tingkat kedua saat naming convention dan data type pada suatu kolom sudah
berubah sesuai keperluan. Selain itu, data juga sudah dibentuk dan dikelompokkan berdasarkan
divisi masing-masing. Pihak yang dapat mengakses adalah business intelligence analyst.
3. Akses
Merupakan tingkat ketiga saat naming convention dan data type sudah sesuai, dan data sudah
didenormalisasi sehingga menghasilkan data utuh.

03

Anda mungkin juga menyukai