DATA WAREHOUSE
Dosen:
Randy Permana, S.Kom., M,Kom
Oleh:
2. Integrated (Integrasi)
Data warehouse dapat menyimpan data-data yang berasal dari sumber-sumber yang
terpisah ke dalam suatu format yang konsisten dan saling terintegrasi satu sama lain. Data tidak
dapat dipecah-pecah karena data yang ada merupakan suatu kesatuan yang menunjang
keseluruhan konsep data warehouse itu sendiri.
Syarat integrasi sumber data dapat dipenuhi dengan cara konsisten dalam penamaan variabel,
ukuran variabel, dan atribut fisik dari data.
Misalnya untuk tabel pelanggan yang berasal dari sumber data I, format untuk jenis
kelamin menggunakan format F dan M (Female dan Male). Sedangkan untuk tabel pelanggan
yang berasal dari sumber data II menggunakan format P dan L (Perempuan dan Laki-Laki).
Maka data tersebut sebelum masuk ke dalam data warehouse harus dilakukan integrasi terlebih
dahulu. Misalnya memilih format dari salah satu sumber data atau menggunakan format yang
baru, misalnya 0 untuk perempuan/female dan 1 untuk laki-laki/male.
4. Non Volatile
Data pada data warehouse tidak di-update secara real time, tetapi di-refresh dari
sistem operasional secara reguler. Data yang baru selalu ditambahkan sebagai tambahan bagi
database itu sendiri. Database tersebut secara berkesinambungan mengambil data baru ini, dan
kemudian disatukan dengan data sebelumnya.
Data yang berada dalam data warehouse bersifat read-only, dan tidak berubah setiap saat
sehingga hanya terdapat dua kegiatan dalam data warehouse, yaitu mengambil data (loading
data), dan akses data (mengakses data warehouse, seperti melakukan query untuk
menampilkan laporan yang dibutuhkan, tidak ada kegiatan updating data).
2. Jelaskan dengan perbedaan DB OLTP dengan OLAP ( Narasikan perbedaan
tersebut dengan menggunaan pembahasaan sendiri - sendiri )
Sedangkan ELT merupakan proses memindahkan data dari berbagai source ke target,
namun berbeda dari sisi movement. data disalin terlebih dahulu ke target kemudian di
transformasikan perbedaanya adalah ETL merupakan proses yang tradisional untuk proses
pemindahan data dari source ke target karena data yang dipindahkan tidak terlalu besar,
sedangkan ELT memindahkan data yang berukuran sangat besar dan targetnya merupakan data
engine seperti hadoop, data appliance, dalam proses loading ELT lebih cepat dibanding dengan
ETL karena data dari berbagai sumber langsung di load kemudian baru ditransformasikan.
3. Jelaskan apa yang dimaksud dengan dimensi dan multidimensi, berikan contoh
(contoh harus dirancang sendiri, tidak boleh identik dengan semua contoh di
Internet) dari dimensi dan multidimensi tersebut !
Dimensi adalah melihat data dari satu sudut pandang. Struktur tabel yang digunakan
dalam pengelompokan data untuk memudahkan pengguna dalam mencari solusi dari masalah
bisnis yang ada. Dimensi sendiri adalah stuktur data yang didesain untuk mempercapat dan
mempermudah pemanggilan data. Disederhanakan dimensi memuat sekumpulan attribut data
yang berkaitan dengan sesuatu kebutuhan bisnis (hal yang akan dianalisa).
Contoh : Data Sales yang terdiri dari biodata personalia mulai Nama, Umur, dll. Tidak ada
relational dengan tabel lain. Atau Data Produk yang bisa melihat Detail dari Produk itu sendiri.
Kalau Produk Mobil terdiri dari Nama, Nomor Mesin, Jenis Mesin, No.Reg Pol, dll.
Multidimensi adalah melihat data dari berbagai sudut pandang atau dimensi. Data
multidimensi dirancang memfasilitasi analisis dan bukan transaksi. Digunakan dalam data
warehouse. Memiliki konsep intuitif dari banyak dimesi atau perspektif pengukuran bisnis atau
fakta-fakta. Multidimensi adalah gabungan dari beberapa dimensi yang disusun sedemikian
rupa untuk mendapatkan informasi secara cepat dan akurat menggunakan OLAP.
Contoh: Multidimensi data adalah Spreadsheet, Cube. Melihat total penjualan sales Toyota
Auto2000 dengan mencari total penjualan mobil tiap area kecamatan atau kelurahan dalam
satu tahun, dan mencari 10 mobil yang paling diminati dalam tiap area kecamatan dan
kelurahan dalam waktu setahun.
Kesimpulan :
Data Warehouse merupakan database pengolahan data secara terus-menerus. Yang mana terdiri
dari gabungan datamart. Yang diorganisaikan dalam ERD Model. Sedangkan Datamart
merupakan pengolahan data ditingkat departement dengan fungsi tertenru dalam satu bisnis
proses.
5. Lakukan proses ETL pada Database Relasional dibawah ini, lalu bentuk Dimensi,
tabel grain, Star Schema dan tabel fisik Datawarehouse dari kasus dibawah ini :
Tabel Pemasok
Dimensi Pemasok
Pemasok_Key Id_Pemasok Nama_Pemasok Alamat
1 SP001 Akmal Km 13 Bypass Padang
2 SP002 Suryana Anduring No. 7B Padang
Teknologi II, No 3 Siteba
3 SP003 Jaka Padang
Dimensi Kontak
Kontak_Key Telp Email
1 08527318805 Akmal@gmail.com
2 075177514 5yana@gmail.com
3 0852631152 JakaJaka@gmail.com
Tabel Bahan Baku
Tabel Order
Dimensi Pasok
Pasok_Key Jumlah_Pasok
1 100
2 50
3 200
Dimensi Biaya
Biaya_Key Biaya
1 7500000
2 800000
3 4500000
Dimensi TglOrder
TglOrder_Key Tgl_Order
1 06/01/2018
2 06/02/2018
3 06/03/2018
4 06/04/2018
5 06/05/2018
6 06/06/2018
7 06/07/2018
8 06/08/2018
9 06/09/2018
10 06/10/2018
11 06/11/2018
12 06/12/2018
13 06/13/2018
14 06/14/2018
15 06/15/2018
16 06/16/2018
17 06/17/2018
18 06/18/2018
19 06/19/2018
20 06/20/2018
21 06/21/2018
22 06/22/2018
23 06/23/2018
24 06/24/2018
25 06/25/2018
26 06/26/2018
27 06/27/2018
28 06/28/2018
29 06/29/2018
30 06/30/2018
Tabel Produksi
Kode_Produksi Tgl_Produksi Jumlah
PR001 3-7-2018 _Produ
50
PR002 4-7-2018 ksi
50
PR003 5-7-2018 90
PR004 6-7-2018 120
Dimensi Produksi
Produksi_Key Kode_Produksi
1 PR001
2 PR002
3 PR003
4 PR004
Dimensi
TglProduksi
TglProduksi_Key Tgl_Produksi
1 07/01/2018
2 07/02/2018
3 07/03/2018
4 07/04/2018
5 07/05/2018
6 07/06/2018
7 07/07/2018
8 07/08/2018
9 07/09/2018
10 07/10/2018
11 07/11/2018
12 07/12/2018
13 07/13/2018
14 07/14/2018
15 07/15/2018
16 07/16/2018
17 07/17/2018
18 07/18/2018
19 07/19/2018
20 07/20/2018
21 07/21/2018
22 07/22/2018
23 07/23/2018
24 07/24/2018
25 07/25/2018
26 07/26/2018
27 07/27/2018
28 07/28/2018
29 07/29/2018
30 07/30/2018
31 07/31/2018
Tabel Distributor
Dimensi Distributor
Distributor_Key Id_Distributor Nama_Distributor Alamat
Jl. Padang Pariaman No. 7E
1 DS001 CV. Seruni Jaya Padang
2 DS002 CV. Rumpun Bukittinggi, Kamang
Payakumbuh, Simalanggang Km
3 DS003 CV. Ardi Putra 23
Tabel Distribusi
Dimensi TglDistribusi
TglDistribusi_Key Tgl_Distribusi
1 07/01/2018
2 07/02/2018
3 07/03/2018
4 07/04/2018
5 07/05/2018
6 07/06/2018
7 07/07/2018
8 07/08/2018
9 07/09/2018
10 07/10/2018
11 07/11/2018
12 07/12/2018
13 07/13/2018
14 07/14/2018
15 07/15/2018
16 07/16/2018
17 07/17/2018
18 07/18/2018
19 07/19/2018
20 07/20/2018
21 07/21/2018
22 07/22/2018
23 07/23/2018
24 07/24/2018
25 07/25/2018
26 07/26/2018
27 07/27/2018
28 07/28/2018
29 07/29/2018
30 07/30/2018
31 07/31/2018
TABEL FAKTA
Pemasok _key Kontak_Key Bahan_baku_Key Jumlah_Pemasok_Key Tanggal_Order_Key Biaya_key
2 2 3 1 25 1
2 2 4 2 25 2
3 3 1 3 17 3
Star Schema
Referensi :