Anda di halaman 1dari 11

UTS

DATA WAREHOUSE

Dosen:
Randy Permana, S.Kom., M,Kom

Oleh:

Nanda Hady Mulya


18101152630171
IF-1

PROGRAM STUDI TEKNIK INFORMATIKA


FAKULTAS ILMU KOMPUTER
UNIVERSITAS PUTRA INDONESIA “YPTK”
PADANG
2021
1. Jelaskan dan berikan contoh (diminta untuk memberikan contoh diluar modul
bapak) karakteristik dari Datawarehouse menurut Bill Inmon!

1. Subject Oriented (Berorientasi Subjek)


Data warehouse berorientasi subjek, artinya data warehouse berorientasi terhadap
subjek-subjek utama dalam suatu perusahaan, seperti data warehouse untuk customer, produk,
dan sebagainya. Dapat juga dikatakan bahwa data warehouse didesain untuk membantu dalam
menganalisis data berdasarkan subjek-subjek tertentu sehingga hanya data yang benar-benar
diperlukan yang dimasukkan ke dalam data warehouse.

2. Integrated (Integrasi)
Data warehouse dapat menyimpan data-data yang berasal dari sumber-sumber yang
terpisah ke dalam suatu format yang konsisten dan saling terintegrasi satu sama lain. Data tidak
dapat dipecah-pecah karena data yang ada merupakan suatu kesatuan yang menunjang
keseluruhan konsep data warehouse itu sendiri.
Syarat integrasi sumber data dapat dipenuhi dengan cara konsisten dalam penamaan variabel,
ukuran variabel, dan atribut fisik dari data.
Misalnya untuk tabel pelanggan yang berasal dari sumber data I, format untuk jenis
kelamin menggunakan format F dan M (Female dan Male). Sedangkan untuk tabel pelanggan
yang berasal dari sumber data II menggunakan format P dan L (Perempuan dan Laki-Laki).
Maka data tersebut sebelum masuk ke dalam data warehouse harus dilakukan integrasi terlebih
dahulu. Misalnya memilih format dari salah satu sumber data atau menggunakan format yang
baru, misalnya 0 untuk perempuan/female dan 1 untuk laki-laki/male.

3. Time Variant (Rentang Waktu)


Data yang berada di dalam data warehouse akurat dan valid pada titik waktu tertentu
atau dalam interval waktu tertentu (hanya pada saat proses ETL/update). Setiap data yang
dimasukkan ke data warehouse pasti memiliki dimensi waktu. Dimensi waktu ini akan
dipergunakan sebagai pembanding dalam perhitungan untuk menghasilkan laporan yang
diinginkan. Selain itu, dengan menggunakan dimensi waktu, pembuat keputusan dapat
mengenal kecenderungan dan pola dari suatu data.

4. Non Volatile
Data pada data warehouse tidak di-update secara real time, tetapi di-refresh dari
sistem operasional secara reguler. Data yang baru selalu ditambahkan sebagai tambahan bagi
database itu sendiri. Database tersebut secara berkesinambungan mengambil data baru ini, dan
kemudian disatukan dengan data sebelumnya.

Data yang berada dalam data warehouse bersifat read-only, dan tidak berubah setiap saat
sehingga hanya terdapat dua kegiatan dalam data warehouse, yaitu mengambil data (loading
data), dan akses data (mengakses data warehouse, seperti melakukan query untuk
menampilkan laporan yang dibutuhkan, tidak ada kegiatan updating data).
2. Jelaskan dengan perbedaan DB OLTP dengan OLAP ( Narasikan perbedaan
tersebut dengan menggunaan pembahasaan sendiri - sendiri )

ETL merupakan proses memindahkan data dari berbagai source (aplikasi


ERP,spreadsheet, aplikasi ERP) ke target (Datawarehouse), yang terdiri dari proses ekstraksi
yaitu membaca data dari satu atau lebih database, yang kedua proses transform yaitu mengubah
bentuk data dari source ke dalam bentuk yang perlu sehingga dapat ditempatkan kedalam
DWH, yang ketiga proses Load yaitu memindai data yang telah terintegrasi dan dibersihkan
dari staging area ke Datawarehouse.

Sedangkan ELT merupakan proses memindahkan data dari berbagai source ke target,
namun berbeda dari sisi movement. data disalin terlebih dahulu ke target kemudian di
transformasikan perbedaanya adalah ETL merupakan proses yang tradisional untuk proses
pemindahan data dari source ke target karena data yang dipindahkan tidak terlalu besar,
sedangkan ELT memindahkan data yang berukuran sangat besar dan targetnya merupakan data
engine seperti hadoop, data appliance, dalam proses loading ELT lebih cepat dibanding dengan
ETL karena data dari berbagai sumber langsung di load kemudian baru ditransformasikan.

Beberapa perbedaan besar dalam keseluruhan konsep manajemen datanya sebagai


berikut ;
1. Waktu-Beban :
• ETL Menggunakan area staging dan system, waktu tambahan untuk load
• ELT Semua dalam satu system, hanya muat satu kali
2. Waktu-Transformasi
• ETL Perlu menunggu, terutama untuk ukuran data yang besar - seiring
pertumbuhan data, waktu transformasi meningkat
• ELT Semua dalam satu sistem, kecepatan tidak tergantung pada ukuran data
3. Waktu-Pemeliharaan
• ETL Pemeliharaan yang tinggi - pilihan data untuk load dan transform dan
harus melakukannya lagi jika terhapus atau ingin meningkatkan repositori data
utama
• ELT Pemeliharaan rendah - semua data selalu tersedia
4. Kompleksitas Implementasi
• ETL Pada tahap awal, membutuhkan sedikit ruang dan hasilnya bersih
• ELT Membutuhkan pengetahuan mendalam tentang alat dan desain ahli dari
gudang repositori utama 5
5. Style Analisis dan Pengolahan
• ETL Berdasarkan beberapa skrip untuk membuat tampilan - menghapus
tampilan berarti menghapus data
• ELT Menciptakan tampilan adhoc - biaya rendah untuk pembangunan dan
pemeliharaan
6. Batasan Data atau Pembatasan dalam Supply
• ETL Dengan asumsi dan memilih data yang diprioritaskan
• ELT Dengan kebijakan hardware (tidak ada) dan data retention
7. Dukungan Data Warehouse
• ETL Model warisan yang lazim digunakan untuk data lokal dan relasional,
terstruktur
• ELT Disesuaikan untuk menggunakan infrastruktur cloud untuk mendukung
big data terstruktur dan tidak terstruktur
8. Dukungan Data Lake
• ETL Bukan bagian dari pendekatan
• ELT Memungkinkan penggunaan Lake dengan data terstruktur yang didukung
9. Kegunaan
• ETL Tabel tetap, timeline tetap, Digunakan terutama oleh IT
• ELT Ad Hoc, Agility, Fleksibilitas, Dapat digunakan oleh semua orang dari
pengembang hingga integrator awam
10. Cost-Effective
• ETL Tidak hemat biaya, untuk usaha kecil dan menengah
• ELT Scalable dan tersedia untuk semua ukuran bisnis dengan menggunakan
solusi SaaS online

3. Jelaskan apa yang dimaksud dengan dimensi dan multidimensi, berikan contoh
(contoh harus dirancang sendiri, tidak boleh identik dengan semua contoh di
Internet) dari dimensi dan multidimensi tersebut !

Dimensi adalah melihat data dari satu sudut pandang. Struktur tabel yang digunakan
dalam pengelompokan data untuk memudahkan pengguna dalam mencari solusi dari masalah
bisnis yang ada. Dimensi sendiri adalah stuktur data yang didesain untuk mempercapat dan
mempermudah pemanggilan data. Disederhanakan dimensi memuat sekumpulan attribut data
yang berkaitan dengan sesuatu kebutuhan bisnis (hal yang akan dianalisa).

Contoh : Data Sales yang terdiri dari biodata personalia mulai Nama, Umur, dll. Tidak ada
relational dengan tabel lain. Atau Data Produk yang bisa melihat Detail dari Produk itu sendiri.
Kalau Produk Mobil terdiri dari Nama, Nomor Mesin, Jenis Mesin, No.Reg Pol, dll.

Multidimensi adalah melihat data dari berbagai sudut pandang atau dimensi. Data
multidimensi dirancang memfasilitasi analisis dan bukan transaksi. Digunakan dalam data
warehouse. Memiliki konsep intuitif dari banyak dimesi atau perspektif pengukuran bisnis atau
fakta-fakta. Multidimensi adalah gabungan dari beberapa dimensi yang disusun sedemikian
rupa untuk mendapatkan informasi secara cepat dan akurat menggunakan OLAP.

Contoh: Multidimensi data adalah Spreadsheet, Cube. Melihat total penjualan sales Toyota
Auto2000 dengan mencari total penjualan mobil tiap area kecamatan atau kelurahan dalam
satu tahun, dan mencari 10 mobil yang paling diminati dalam tiap area kecamatan dan
kelurahan dalam waktu setahun.

4. Jelaskan perbedaan antara Datawarehouse dan Datamart dan berikan kesimpulan


di akhir penjelasan dari kedua model ini!
Perbedaan Data Warehouse dan Data Mart ;
Data Warehouse : Suatu database penunjang keputusan yang dikelola secara terpisah dari
database opersaional perusahaan yang menyimpan data secara terus-menerus.
1. Perusahaan, melingkupi semua proses
2. Gabungan datamart
3. Data didapat dari proses Staging
4. Merepresentasikan data dari perusahaan atau organisasi
5. Diorganisasi dalam E-R Model
Sedangkan Data Mart : Bagian dari data warehouse yang mendukung kebutuhan pada tingkat
departemen atau fungsi bisnis tertentu dalam perusahaan.
1. Departemen
2. Satu bisnis proses
3. Start-Join (fakta dan dimensi)
4. Teknologinya optimal untuk pengaksesan dan analisis data
5. Cocok untuk merepresentasikan data departemen

Kesimpulan :
Data Warehouse merupakan database pengolahan data secara terus-menerus. Yang mana terdiri
dari gabungan datamart. Yang diorganisaikan dalam ERD Model. Sedangkan Datamart
merupakan pengolahan data ditingkat departement dengan fungsi tertenru dalam satu bisnis
proses.

5. Lakukan proses ETL pada Database Relasional dibawah ini, lalu bentuk Dimensi,
tabel grain, Star Schema dan tabel fisik Datawarehouse dari kasus dibawah ini :
Tabel Pemasok

Id_Pemasok Nama_Pemasok Alamat Telp Email


SP001 Akmal Km 13 Bypass 08527318805 Akmal@gmail.com
Padang
SP002 Suryana Anduring No. 7B 075177514 5yana@gmail.com
Padang
SP003 Jaka Teknologi II, No 0852631152 JakaJaka@gmail.com
3 Siteba Padang

Dimensi Pemasok
Pemasok_Key Id_Pemasok Nama_Pemasok Alamat
1 SP001 Akmal Km 13 Bypass Padang
2 SP002 Suryana Anduring No. 7B Padang
Teknologi II, No 3 Siteba
3 SP003 Jaka Padang

Dimensi Kontak
Kontak_Key Telp Email
1 08527318805 Akmal@gmail.com
2 075177514 5yana@gmail.com
3 0852631152 JakaJaka@gmail.com
Tabel Bahan Baku

Id_BahanBaku Nama_BahanBaku Jenis_BahanBaku


IT001 Kulit Sintetis Garmen
IT002 Karton Kertas
IT003 Benag Pintal Putih Benang
IT004 Zipper Emas Zipper

Dimensi Bahan Baku


BahanBaku_Key Id_BahanBaku Nama_BahanBaku Jenis_Bahanbaku
1 IT001 Kulit Sintesis Garmen
2 IT002 Karton Kertas
3 IT003 Benang Pintal Putih Benang
4 IT004 Zipper Emas Zipper

Tabel Order

Id_Pemasok Id_BahanBak Jumlah_Pasok Biaya Tgl_Order


SP002 u
IT003 100 7.500.000 25-6-2018
SP002 IT004 50 800.000 25-6-2018
SP003 IT001 200 4.500.000 17-6-2018

Dimensi Pasok
Pasok_Key Jumlah_Pasok
1 100
2 50
3 200

Dimensi Biaya
Biaya_Key Biaya
1 7500000
2 800000
3 4500000

Dimensi TglOrder
TglOrder_Key Tgl_Order
1 06/01/2018
2 06/02/2018
3 06/03/2018
4 06/04/2018
5 06/05/2018
6 06/06/2018
7 06/07/2018
8 06/08/2018
9 06/09/2018
10 06/10/2018
11 06/11/2018
12 06/12/2018
13 06/13/2018
14 06/14/2018
15 06/15/2018
16 06/16/2018
17 06/17/2018
18 06/18/2018
19 06/19/2018
20 06/20/2018
21 06/21/2018
22 06/22/2018
23 06/23/2018
24 06/24/2018
25 06/25/2018
26 06/26/2018
27 06/27/2018
28 06/28/2018
29 06/29/2018
30 06/30/2018

Tabel Produksi
Kode_Produksi Tgl_Produksi Jumlah
PR001 3-7-2018 _Produ
50
PR002 4-7-2018 ksi
50
PR003 5-7-2018 90
PR004 6-7-2018 120

Dimensi Produksi
Produksi_Key Kode_Produksi
1 PR001
2 PR002
3 PR003
4 PR004

Dimensi
TglProduksi
TglProduksi_Key Tgl_Produksi
1 07/01/2018
2 07/02/2018
3 07/03/2018
4 07/04/2018
5 07/05/2018
6 07/06/2018
7 07/07/2018
8 07/08/2018
9 07/09/2018
10 07/10/2018
11 07/11/2018
12 07/12/2018
13 07/13/2018
14 07/14/2018
15 07/15/2018
16 07/16/2018
17 07/17/2018
18 07/18/2018
19 07/19/2018
20 07/20/2018
21 07/21/2018
22 07/22/2018
23 07/23/2018
24 07/24/2018
25 07/25/2018
26 07/26/2018
27 07/27/2018
28 07/28/2018
29 07/29/2018
30 07/30/2018
31 07/31/2018

Tabel Distributor

Id_Distributor Nama_Distribut Alamat


DS001 or Seruni Jaya Jl. Padang Pariaman no 7 E
Cv.
Padang
DS002 Cv. Rumpun Bukittinggi, Kamang
DS003 Cv. Ardi Putra Payakumbuh, SImalanggang
Km 23

Dimensi Distributor
Distributor_Key Id_Distributor Nama_Distributor Alamat
Jl. Padang Pariaman No. 7E
1 DS001 CV. Seruni Jaya Padang
2 DS002 CV. Rumpun Bukittinggi, Kamang
Payakumbuh, Simalanggang Km
3 DS003 CV. Ardi Putra 23

Tabel Distribusi

Tgl_Distribusi Id_Distributo Kode_Produksi Jumlah_Kiri


10 – 7 - 2018 rDS003 PR002 m
25
10 – 7 – 2018 DS003 PR001 25
11 – 7 – 2018 DS001 PR004 60
11 – 7 – 2018 DS002 PR003 30

Dimensi TglDistribusi
TglDistribusi_Key Tgl_Distribusi
1 07/01/2018
2 07/02/2018
3 07/03/2018
4 07/04/2018
5 07/05/2018
6 07/06/2018
7 07/07/2018
8 07/08/2018
9 07/09/2018
10 07/10/2018
11 07/11/2018
12 07/12/2018
13 07/13/2018
14 07/14/2018
15 07/15/2018
16 07/16/2018
17 07/17/2018
18 07/18/2018
19 07/19/2018
20 07/20/2018
21 07/21/2018
22 07/22/2018
23 07/23/2018
24 07/24/2018
25 07/25/2018
26 07/26/2018
27 07/27/2018
28 07/28/2018
29 07/29/2018
30 07/30/2018
31 07/31/2018

TABEL FAKTA
Pemasok _key Kontak_Key Bahan_baku_Key Jumlah_Pemasok_Key Tanggal_Order_Key Biaya_key
2 2 3 1 25 1
2 2 4 2 25 2
3 3 1 3 17 3
Star Schema
Referensi :

Lingasan. Erik. Karakteristik Data Warehouse. Erick1719. 2011.


Diakses pada 26 April 2021, dari
https://erick1719.wordpress.com/2011/02/01/karakteristik-data-
warehouse/#:~:text=Menurut%20Bapak%20Data%20Warehouse%20atau,Variant%2
C%20dan%20Non%2DVolatile.

Anda mungkin juga menyukai