Anda di halaman 1dari 24

DATA WAREHOUSE

Pengertian

Data warehouse adalah sistem yang


mengumpulkan data dari berbagai sumber di
satu pusat penyimpanan yang digunakan untuk
pelaporan dan analisis data dan dianggap
sebagai komponen inti dari intelijen bisnis.
Kapan data warehouse digunakan?

Ada beberapa kondisi yang membuat bisnis perlu menggunakan data


warehouse:
• Perusahaan memiliki berbagai sumber data untuk diolah
– perusahaan besar umumnya memiliki data dari berbagai sumber.
Mengumpulkan data-data tersebut menjadi satu menjadi tantangan
tersendiri. Adanya data warehouse membantu dalam extract,
transform, load (ETL) data agar bisa menggabungkan berbagai data
secara terpusat dan lebih mudah dianalisis.
• Perusahaan memiliki volume data dalam jumlah besar – pada
dasarnya, memiliki lebih banyak data membuat perusahaan lebih sulit
mengelolanya. Data warehouse berfungsi dalam menyimpan data
besar tersebut.
Kapan data warehouse digunakan?

• Perusahaan perlu menerapkan machine learning – perusahaan dapat


menggunakan machine learning untuk memahami lebih banyak
tentang data, termasuk memprediksi pola pembelian dan mengirim
penawaran yang dipersonalisasi. Untuk mendapatkan data yang
mumpuni, diperlukan data warehouse khusus agar informasi yang
dikumpulkan bisa terpusat dan mudah dibaca.
Karakteristik Data Warehouse
#1 Berorientasi pada subjek (subject-oriented)
Sistem yang ada di data warehouse dirancang untuk
mengumpulkan informasi berdasarkan subjek-subjek
yang spesifik berkaitan dengan perusahaan, bukan
pada proses atau kegiatan operasional yang sedang
berjalan.
Misalnya, data warehouse di kantor perbankan
mengumpulkan data tentang nasabah, kebijakan, dan
simpan-pinjam.
Informasi yang didasarkan pada subjek memudahkan
dalam analisis data dan mengesampingkan informasi
yang tidak diperlukan saat mengambil keputusan.
#2 Terintegrasi (integrated)
Kumpulan data yang ada di data
warehouse berasal dari berbagai sumber yang
terintegrasi dalam satu platform.
Data yang diperoleh kemudian diubah
formatnya menyesuaikan data lain yang
sebelumnya sudah terkumpul dalam sistem.
#3 Memiliki interval waktu (time-variant)
Semua informasi yang ada di data
warehouse disimpan dengan rentang waktu
tertentu (seperti mingguan, bulanan, maupun
tahunan). Artinya, setiap kali data akan
dianalisis, analyst bisa mengambil data
berdasarkan rentang waktu yang diinginkan
dan berguna dalam melakukan perbandingan
dari satu waktu ke waktu lain.
#4 Tidak berubah (non-volatile)
Data yang berada di data warehouse bersifat
permanen. Ini berarti setelah data
dimasukkan, data tidak akan bisa dihapus.
Dalam data warehouse, hanya ada dua jenis
operasional data, yaitu data loading dan data
access. Tidak tersedia fungsi lain, seperti
menghapus atau menyisipkan data.
Contoh Penggunaan Data Warehouse

• Perusahaan ritel menggunakan data warehouse untuk


pemasaran dan distribusi. Dengan data warehouse,
perusahaan bisa melacak item, menetapkan harga,
serta menganalisis tren pembelian pelanggan.

• Perusahaan yang bergerak di


bidang healthcare memanfaatkan data
warehouse untuk mengubah data perusahaan menjadi
informasi yang bisa dianalisis dan ditindaklanjuti. Hasil
analisis berfungsi dalam menaikkan tingkat akurasi alat
kesehatan, pengalaman pasien, dan efisiensi waktu
pelayanan medis.
Jenis-jenis data warehouse
• Enterprise data warehouse (edw) — Pusat
penyimpanan data untuk seluruh bagian
perusahaan
• Operational data warehouse — Lokasi
penyimpanan data yang diperbarui dan digunakan
secara rutin. Contohnya, jumlah transaksi per hari.
• Data mart — Tempat penyimpanan yang dirancang
untuk departemen tertentu atau lingkup yang
kecil. Misalnya, divisi marketing.
Perbedaan Data Warehouse vs Database

Sekilas, data warehouse terlihat sama dengan


database (kumpulan data yang disimpan dengan
sistem tertentu).
Komponen Data Warehouse
Komponen Data Warehouse
1. Central database (Gudang Data)
Komponen utama harus dimiliki oleh perusahaan
dan usaha yang sudah besar adalah harus
mempunyai gudang. Gudang tersebut dijadikan
sebagai alat untuk menyimpan data-data maupun
produk.
Database terpusat berfungsi sebagai pondasi yang
menyimpan semua data bisnis. Adanya data yang
terpusat memudahkan bisnis dalam membuat
laporan. Selain itu, untuk data-data yang ada di
dalam gudang tersebut mempunyai bentuk berbeda-
beda dan disesuaikan lagi dengan kebutuhan.
Jenis gudang itu pun ada beberapa, yaitu:
• Typical relational database: database yang
menyimpan serta menyediakan data yang
saling berhubungan satu sama lain;
• Analytics database: database untuk
menyimpan serta mengelola analitik;
• Data warehouse appliance: database untuk
melakukan penyimpanan dan manajemen
data;
• Cloud-hosted database: database berbasis
cloud.
Komponen Data Warehouse
2. Tool ETL
ETL (extract, transform, load) adalah proses
integrasi data dengan cara menggabungkan data
melalui berbagai sumber. Data itu disimpan ke
dalam satu penyimpanan data yang ada
di warehouse.
• Extract: mengumpulkan data dari berbagai
sumber;
• Transform: memodifikasi data menjadi format
yang lebih rapi;
• Load: memindah data ke tujuan tertentu.
Proses ini dilakukan menggunakan tool ETL. Data
yang sudah dikumpulkan kemudian diubah ke
format yang sesuai dengan sistem di data
warehouse. Jika format data sudah selaras, analisis
data lebih cepat dilakukan.
Dengan tools ETL, kita dapat mengelola data
warehouse dengan lebih praktis. Dengan adanya
beberapa tools tersebut juga bisa akan
berpengaruh terhadap waktu, metode dan tipe
dari modifikasi data tersebut.
Contoh tools ETL ???????
Komponen Data Warehouse
3. Metadata
Meta data adalah potongan informasi yang menjelaskan isi data.
Komponen data warehouse ini bertujuan memperjelas konteks data
supaya lebih mudah dipahami saat nanti digunakan.

Jenis meta data ada dua, yaitu:


• Technical meta data: berisi rincian informasi untuk developer dan
manager untuk mengelola data warehouse;
• Business meta data: menyimpan informasi umum data warehouse.

Contoh meta data misalnya :


• Meta data suatu dokumen: ……………….
• Meta data tabel dalam laporan: ………………..
• Meta data profil karyawan: …………………….
• Meta data customer: ………………………….
Komponen Data Warehouse
4. Access tools ke data warehouse
Data warehouse yang ada di perusahaan tidak bisa bekerja
tanpa adanya tools yang menyediakan akses
ke database. Tools memungkinkan pengguna dapat berinteraksi
dengan data-data yang ada di warehouse.
Contoh access tools ???
• Query and reporting tools: membuat laporan analisis berupa
spreadsheet atau bentuk visual lainnya. Contohnya ……………..
• Application development tools: menyusun laporan sesuai
tujuannya masing-masing. Contohnya …………………………
• Data mining tools for data warehousing: membantu
pengumpulan data agarlebih sistematis. Contoh : ……...
• OLAP tools: memungkinkan analisis data warehouse dari
berbagai sudut pandang. Contoh ………………….
Komponen Data Warehouse
5. Manajemen Gudang Data
Supaya gudang mampu menyimpan serta mengelola data
dengan baik, tentu butuh Manajemen Gudang Data.
Komponen data warehouse inilah yang memastikan seluruh
proses dalam gudang berjalan lancar.
Karena itu, Manajemen Gudang Data bertanggungjawab
untuk:
• Mengamankan data;
• Memperbarui data;
• Memilih prioritas tugas;
• Menjaga kualitas hingga melakukan backup serta recovery
data jika terjadi hal buruk.
Arsitektur data warehouse
Arsitektur data warehouse
arsitektur data warehouse terdiri dari tiga
tingkatan/tier:
1. Bottom tier: server database yang menyimpan
data. Data yang sering diakses disimpan dalam
penyimpanan cepat seperti SSD. Sedangkan
yang jarang digunakan ditaruh di alat
penyimpanan lain.
2. Middle tier: memuat alat analitik seperti OLAP
yang memungkinkan data diakses dan dikelola;
3. Top tier: tingkatan terbawah yang menampilkan
laporan untuk pengguna.
Jelaskan :
a. Data source
b. Staging Area
c. Warehouse
d. Data Mart
e. User
f. Penjelasan bagan tersebut
Manfaat Data Warehouse

1. Mengakses Data Lebih Cepat


2. Informasi Konsisten Bagi Semua Pihak
3. Memprediksi Trend/Pola di Masa Depan
4. Membantu Perusahaan Mengambil
Keputusan

Anda mungkin juga menyukai