LO1
a. Sebutkan dan jelaskan ketiga komponen Data Warehouse yang paling mendasar!
Operational Data
Operational Data Adalah data yang digunakan untuk Data Warehouse, umumnya
Data Warehouse berasal dari Mainframe Data, Data department dalam sistem file
atau DBMS relasional, Data server dan Workstation serta sistem eksternal seperti
dari internet.
ETL Manager
ET manajer melakukan operasi yang berhubungan dengan fungsi ETL (Extract,
Transform, Loading) data ke dalam data warehouse. Data yang diperoleh adalah
data yang telah diperoleh dari Operational Data Store
b. Sebutkan dan jelaskan perbedaan OLTP dan Data Warehouse dari beberapa aspek
(minimal 3). Anda dapat menguraikan penjelasan anda dengan memberi contoh
pada ruang lingkup industri.
1. Perbedaan Data Warehouse dan OLTP (Online-Transaction processing) yang
pertama adalah sumber data, pada Data Warehouse sumber data berasal dari
berbagai macam sumber sedangkan sumber data OLTP hanya dari satu sumber
saja.
2. Yang kedua adalah kapasitas penyimpanan, pada Data Warehouse kapasitas
penyimpanan cenderung lebih besar antara sekitar 100GB - 2TB dibandingkan
OLTP yang hanya mampu menampung data sebanyak 10MB-100GB.
3. Perbedaan ketiga adalah fungsi, fungsi utama penggunaan Data Warehouse
adalah untuk pengambilan keputusan sedangkan OLTP adalah untuk
pemrosesan transaksi online.
2. LO3
a. Sebutkan dan jelaskan skema Data Warehouse!
Skema Data Warehouse adalah isi dari Data Warehouse itu sendiri yang terdiri dari
database, tabel, tampilan, indeks dan data yang terstruktur secara teratur
menggunakan tipe desain yang telah ditentukan sebelumnya seperti star schema,
snowflake schema dan galaxy schema.
a. Star Schema
Sesuai dengan namanya, bentuk skema ini mirip dengan bintang. Dalam skema
bintang, ada satu tabel fakta di tengah dan beberapa tabel dimensi yang saling
terkait.
Tabel fakta adalah informasi utama di gudang data. Ini mengelilingi tabel
pencarian dimensi kecil yang memiliki detail tabel fakta yang berbeda. Kunci
utama yang ada di setiap dimensi terkait dengan kunci kedua yang ada di tabel
fakta .
b. Snowflake Schema
Snowflake Schema atau Skema kepingan salju adalah versi lebih kompleks dari
skema bintang, karena ada tambahan struktur.
Dalam skema ini, tabel fakta akan terhubung ke beberapa tabel dimensi yang
berbeda. Struktur tabel dimensi dalam skema ini akan dibuat lebih rinci lagi.
Tabel yang terpengaruh dalam skema ini hanya tabel dimensi dan bukan tabel
fakta.
Keuntungan dari skema snowflake adalah penggunaan ruang disk yang sedikit.
Implementasi dimensi mudah ketika data ditambahkan ke skema ini. Kumpulan
dimensi yang sama diambil dari sumber yang berbeda.
c. Galaxy Schema
Pada skema ini tabel fakta bisa lebih dari satu, skema galaksi memiliki empat
dimensi. Cara lain untuk membuat skema galaksi adalah dengan membagi
skema satu bintang menjadi lebih banyak skema bintang. Konstelasi fakta pada
skema ini dianggap lebih kompleks daripada skema bintang dan kepingan salju.
Oleh karena itu skema ini dianggap lebih fleksibel tetapi sulit untuk diterapkan
dan dipelihara. Jenis skema ini biasanya digunakan untuk aplikasi yang canggih.
b. Rancanglah sebuah skema yang dapat mentranslasi Tabel 1 menjadi sebuah
rancangan Data Warehouse! Lengkapi jawaban anda dengan penjelasan mengenai
rancangan tersebut!
3. LO4
a. Jelaskan tentang ETL dengan asumsi sampel data (Tabel 1) sebagai data yang
dimasukkan ke dalam proses tersebut!
ETL adalah singkatan dari Extract , Transform dan Load. ETL merupakan proses
mengekstrak data dari berbagai sumber yang nantinya akan diubah di staging area
sebelum dimasukkan ke Data Warehouse.
c. POIN BONUS: Tampilkan Tabel 1 dengan data yang sudah melewati tahap
preprocessing. Beri nama: Tabel 2. Hasil tahap pre-processing.
Tabel 2.Hasil tahap pre-processing
4. LO4
a. Buatlah OLAP data cube berdasarkan Tabel 1 atau Tabel 2! Lengkapi jawaban anda
dengan penjelasan mengenai OLAP data cube tersebut!
OLAP cube adalah struktur data yang dioptimalkan untuk analisis data secara cepat.
b. Sebutkan dan jelaskan operasi yang dapat dilakukan pada OLAP data cube!
Lima operasi yang dapat dilakukan dalam OLAP data cube adalah sebagai
berikut :
- Business-focused multidimensional data
Operasi ini dapat mengatur dan menganalisis data. Dalam pendekatan
multidimensi, data diatur ke dalam dimensi, di mana dimensi mencerminkan
bagaimana pengguna bisnis biasanya mengelola bisnis. Misalnya, pengguna
bisnis dapat melihat data mereka berdasarkan produk, pasar, dan dari waktu ke
waktu.
- Business-focused calculations
Dalam proses ini OLAP mengumpulkan nilai-nilai sebelumnya yang perlu
dihitung dengan cepat dalam sistem basis data relasional biasa. Mesin kalkulasi
OLAP menangani data agregasi serta kalkulasi bisnis. Dalam sistem OLAP,
kemampuan analitik tidak tergantung pada bagaimana data disajikan.
Perhitungan analitik disimpan secara terpusat dalam metadata untuk sistem,
bukan di setiap laporan.
- Speed-of-thought analysis
Analisis kecepatan pikiran atau yang biasa disebut ad hoc yaitu analis yang
dapat mengajukan pertanyaan dan mendapatkan tanggapan langsung dari
sistem OLAP. Tidak perlu menunggu data berarti lebih sedikit interupsi dalam
pemikiran analis. Analis dapat segera mengajukan kueri lain berdasarkan hasil
kueri pertama, lalu kueri lain, dan seterusnya, memimpin analis dalam perjalanan
penemuan. Waktu respons yang cepat, bersama dengan organisasi data
multidimensi yang intuitif, memungkinkan analis untuk memikirkan dan
mengeksplorasi hubungan yang mungkin terlewatkan.
- Meningkatkan Efisiensi
Untuk menghemat waktu bagi pengguna bisnis atau ilmuwan data untuk
mengumpulkan data dari berbagai sumber. Jauh lebih mudah jika data tersebut
dikumpulkan di satu tempat saja.
- Mendorong Pendapatan
Seorang pakar teknologi berpendapat bahwa “data adalah minyak baru,”
mengacu pada nilai dolar yang tinggi dari data di dunia saat ini. Membuat data
yang lebih terstandarisasi dan berkualitas lebih baik adalah kekuatan utama
gudang data, dan kekuatan utama ini diterjemahkan dengan jelas ke perolehan
pendapatan yang signifikan.
- Skalabilitas
Data Warehouse sendiri dapat diskalakan serta memungkinkan skalabilitas yang
lebih besar dalam bisnis secara keseluruhan. Yang berarti Data Warehouse
canggih saat ini dibangun sesuai skala, menangani lebih banyak pertanyaan
seiring pertumbuhan bisnis (meskipun aktivitas ini membutuhkan dukungan
banyak perangkat keras).
- Cloud
Tidak seperti database terdahulu, Data Warehouse saat ini dibangun dengan
mempertimbangkan multi cloud dan hybrid cloud. Banyak gudang data sekarang
sepenuhnya berbasis cloud, hal ini memungkinkan pengguna seluler dapat
mengakses gudang data dengan lebih baik.
b. Buatlah sebuah video yang menjelaskan potensi - potensi manfaat yang diterima
Dinas Pariwisata Provinsi Jabar jika mengimplementasikan rancangan Data
Warehouse yang anda ajukan!
Link video
Referensi jawaban