Anda di halaman 1dari 9

1.

LO1
a. Sebutkan dan jelaskan ketiga komponen Data Warehouse yang paling mendasar!
Operational Data
Operational Data Adalah data yang digunakan untuk Data Warehouse, umumnya
Data Warehouse berasal dari Mainframe Data, Data department dalam sistem file
atau DBMS relasional, Data server dan Workstation serta sistem eksternal seperti
dari internet.

Operational Data Store


Atau yang biasa disingkat ODS adalah tempat penyimpanan data operasional
yang terintegrasi, digunakan untuk memenuhi kebutuhan analisis. ODS
menyimpan data yang telah diekstrak dan telah dibersihkan dari sumber data.
Dengan demikian, proses pengintegrasian dan restrukturisasi data untuk data
warehouse menjadi lebih sederhana.

ETL Manager
ET manajer melakukan operasi yang berhubungan dengan fungsi ETL (Extract,
Transform, Loading) data ke dalam data warehouse. Data yang diperoleh adalah
data yang telah diperoleh dari Operational Data Store

b. Sebutkan dan jelaskan perbedaan OLTP dan Data Warehouse dari beberapa aspek
(minimal 3). Anda dapat menguraikan penjelasan anda dengan memberi contoh
pada ruang lingkup industri.
1. Perbedaan Data Warehouse dan OLTP (Online-Transaction processing) yang
pertama adalah sumber data, pada Data Warehouse sumber data berasal dari
berbagai macam sumber sedangkan sumber data OLTP hanya dari satu sumber
saja.
2. Yang kedua adalah kapasitas penyimpanan, pada Data Warehouse kapasitas
penyimpanan cenderung lebih besar antara sekitar 100GB - 2TB dibandingkan
OLTP yang hanya mampu menampung data sebanyak 10MB-100GB.
3. Perbedaan ketiga adalah fungsi, fungsi utama penggunaan Data Warehouse
adalah untuk pengambilan keputusan sedangkan OLTP adalah untuk
pemrosesan transaksi online.

2. LO3
a. Sebutkan dan jelaskan skema Data Warehouse!
Skema Data Warehouse adalah isi dari Data Warehouse itu sendiri yang terdiri dari
database, tabel, tampilan, indeks dan data yang terstruktur secara teratur
menggunakan tipe desain yang telah ditentukan sebelumnya seperti star schema,
snowflake schema dan galaxy schema.
a. Star Schema
Sesuai dengan namanya, bentuk skema ini mirip dengan bintang. Dalam skema
bintang, ada satu tabel fakta di tengah dan beberapa tabel dimensi yang saling
terkait.

Tabel fakta adalah informasi utama di gudang data. Ini mengelilingi tabel
pencarian dimensi kecil yang memiliki detail tabel fakta yang berbeda. Kunci
utama yang ada di setiap dimensi terkait dengan kunci kedua yang ada di tabel
fakta .

b. Snowflake Schema

Snowflake Schema atau Skema kepingan salju adalah versi lebih kompleks dari
skema bintang, karena ada tambahan struktur.

Dalam skema ini, tabel fakta akan terhubung ke beberapa tabel dimensi yang
berbeda. Struktur tabel dimensi dalam skema ini akan dibuat lebih rinci lagi.
Tabel yang terpengaruh dalam skema ini hanya tabel dimensi dan bukan tabel
fakta.

Keuntungan dari skema snowflake adalah penggunaan ruang disk yang sedikit.
Implementasi dimensi mudah ketika data ditambahkan ke skema ini. Kumpulan
dimensi yang sama diambil dari sumber yang berbeda.

c. Galaxy Schema

Pada skema ini tabel fakta bisa lebih dari satu, skema galaksi memiliki empat
dimensi. Cara lain untuk membuat skema galaksi adalah dengan membagi
skema satu bintang menjadi lebih banyak skema bintang. Konstelasi fakta pada
skema ini dianggap lebih kompleks daripada skema bintang dan kepingan salju.
Oleh karena itu skema ini dianggap lebih fleksibel tetapi sulit untuk diterapkan
dan dipelihara. Jenis skema ini biasanya digunakan untuk aplikasi yang canggih.
b. Rancanglah sebuah skema yang dapat mentranslasi Tabel 1 menjadi sebuah
rancangan Data Warehouse! Lengkapi jawaban anda dengan penjelasan mengenai
rancangan tersebut!

Gambar. Rancangan Data Warehouse


Penjelasan: Skema yang digunakan untuk mentranslasi Tabel 1 adalah skema
bintang, Tabel 1 yang berada di tengah merupakan tabel fakta yang dikelilingi
dengan empat tabel dimensi, tabel dimensi merupakan atribut dari tabel fakta.

3. LO4
a. Jelaskan tentang ETL dengan asumsi sampel data (Tabel 1) sebagai data yang
dimasukkan ke dalam proses tersebut!
ETL adalah singkatan dari Extract , Transform dan Load. ETL merupakan proses
mengekstrak data dari berbagai sumber yang nantinya akan diubah di staging area
sebelum dimasukkan ke Data Warehouse.

Pada (Tabel 1) proses ETL akan diperjelas sebagai berikut:


- Ekstraksi
Langkah pertama dari proses ETL adalah ekstraksi. Pada langkah ini, data dari
(tabel 1) akan diekstrak menjadi format database ke dalam staging area yang
tujuannya agar database tidak rusak.
- Transformasi
Setelah data diekstraksi selanjutnya mengubah format database menjadi format
standar tunggal yang melibatkan fungsi filtering, cleaning, joining, splitting dan
sorting.
- Loading
Loading atau memuat adalah proses terakhir ETL, dimana data yang telah
diubah formatnya akan dimasukkan ke Data Warehouse.
b. Jelaskan metode-metode pre-processing dan berikan gagasan anda terhadap
pengaplikasiannya pada sampel data (Tabel 1).
Metode-metode pre-processing pada (Tabel 1) sebagai berikut:
- Data cleaning : Pada proses ini noise pada data di Table 1 akan dibersihkan agar
data yang dihasilkan nanti konsisten.
- Data integration : Data yang telah bersih selanjutnya akan di integrasi untuk
menggabungkan data dari sumber yang lain.
- Data reduction : Karena data yang dikumpulkan dari berbagai sumber tentunya
akan berimbas pada kapasitas database, pada proses ini data yang telah
terintegrasi akan dilakukan pengelompokan ataupun menghilangkan redundansi
untuk mengurangi ukuran data.
- Data transformation : Pada proses ini (Table 1) akan dinormalisasi untuk
menurunkan skala data mulai dari 0,0 sampai 1,0
- Load and refresh : Setelah melewati empat tahap pre-processing selanjutnya
data akan dimasukkan ke dalam warehouse dan warehouse akan melakukan
refreshing untuk memperbaharui data yang baru masuk.

c. POIN BONUS: Tampilkan Tabel 1 dengan data yang sudah melewati tahap
preprocessing. Beri nama: Tabel 2. Hasil tahap pre-processing.
Tabel 2.Hasil tahap pre-processing

4. LO4
a. Buatlah OLAP data cube berdasarkan Tabel 1 atau Tabel 2! Lengkapi jawaban anda
dengan penjelasan mengenai OLAP data cube tersebut!
OLAP cube adalah struktur data yang dioptimalkan untuk analisis data secara cepat.

b. Sebutkan dan jelaskan operasi yang dapat dilakukan pada OLAP data cube!

Lima operasi yang dapat dilakukan dalam OLAP data cube adalah sebagai
berikut :
- Business-focused multidimensional data
Operasi ini dapat mengatur dan menganalisis data. Dalam pendekatan
multidimensi, data diatur ke dalam dimensi, di mana dimensi mencerminkan
bagaimana pengguna bisnis biasanya mengelola bisnis. Misalnya, pengguna
bisnis dapat melihat data mereka berdasarkan produk, pasar, dan dari waktu ke
waktu.
- Business-focused calculations
Dalam proses ini OLAP mengumpulkan nilai-nilai sebelumnya yang perlu
dihitung dengan cepat dalam sistem basis data relasional biasa. Mesin kalkulasi
OLAP menangani data agregasi serta kalkulasi bisnis. Dalam sistem OLAP,
kemampuan analitik tidak tergantung pada bagaimana data disajikan.
Perhitungan analitik disimpan secara terpusat dalam metadata untuk sistem,
bukan di setiap laporan.

- Trustworthy data and calculations


Sistem OLAP pada proses ini akan memastikan satu sumber data untuk semua
pengguna akhir. Beberapa sistem OLAP memusatkan semua data dalam
database multidimensi. Namun tujuannya sistem OLAP harus memastikan
pengguna akhir memiliki akses ke data dan perhitungan yang ditentukan secara
konsisten untuk mendukung pengambilan keputusan.

- Speed-of-thought analysis
Analisis kecepatan pikiran atau yang biasa disebut ad hoc yaitu analis yang
dapat mengajukan pertanyaan dan mendapatkan tanggapan langsung dari
sistem OLAP. Tidak perlu menunggu data berarti lebih sedikit interupsi dalam
pemikiran analis. Analis dapat segera mengajukan kueri lain berdasarkan hasil
kueri pertama, lalu kueri lain, dan seterusnya, memimpin analis dalam perjalanan
penemuan. Waktu respons yang cepat, bersama dengan organisasi data
multidimensi yang intuitif, memungkinkan analis untuk memikirkan dan
mengeksplorasi hubungan yang mungkin terlewatkan.

- Flexible, self-service reporting.


Sistem OLAP memungkinkan pengguna bisnis untuk membuat kueri data dan
membuat laporan menggunakan alat yang murni untuk digunakan. OLAP
menyediakan alat yang fleksibel bagi pengguna akhir untuk mempersingkat
waktu belajar, sehingga user lebih cenderung memanfaatkan sistem.
c. Berikan 2 (dua) buah contoh pengaplikasian operasi OLAP pada Tabel 1 atau Tabel
2!
Contoh pengaplikasian operasi OLAP pada tabel 2
1. Dinas Pariwisata dan Ekonomi Kreatif Provinsi Jawa Barat dapat
mengetahui destinasi wisata yang paling banyak dikunjungi selama tahun
2019.
2. Dinas Pariwisata dan Ekonomi Kreatif Provinsi Jawa Barat dapat
mengetahui berapa banyak wisatawan asing yang berkunjung ke Jawa
Barat.
5. LO2
Dibandingkan dengan pengimplementasian DBMS yang mengandalkan OLTP, tentunya
Data Warehouse mempunyai karakteristik untuk memecahkan masalah atau
menghasilkan jawaban untuk masalah yang berbeda.
a. Tuliskan manfaat yang diterima sebuah organisasi secara umum jika
mengimplementasikan infrastruktur Data Warehouse!
Manfaat secara umum organisasi yang menerapkan infrastruktur Data Warehouse
sebagai berikut:
- History Perusahaan
Dengan manfaat history pada Data Warehouse memungkinkan perusahaan
mengetahui misalnya produk apa yang paling laku dalam rentang 1 tahun
terakhir.

- Meningkatkan Kualitas Data


Bisnis perusahaan menghasilkan data dalam berbagai bentuk, termasuk data
terstruktur dan tidak terstruktur, data dari media sosial, dan data dari kampanye
penjualan. Gudang data mengubah data ini menjadi format konsisten yang
diperlukan oleh platform analitik perusahaan.

- Meningkatkan Efisiensi
Untuk menghemat waktu bagi pengguna bisnis atau ilmuwan data untuk
mengumpulkan data dari berbagai sumber. Jauh lebih mudah jika data tersebut
dikumpulkan di satu tempat saja.

- Meningkatkan Kecepatan Analisis Data


Sebuah Data Warehouse memungkinkan kecepatan menganalisis data,
keunggulan kompetitif di sektor bisnis utama, mulai dari CRM hingga SDM serta
pelaporan bisnis.

- Mendorong Pendapatan
Seorang pakar teknologi berpendapat bahwa “data adalah minyak baru,”
mengacu pada nilai dolar yang tinggi dari data di dunia saat ini. Membuat data
yang lebih terstandarisasi dan berkualitas lebih baik adalah kekuatan utama
gudang data, dan kekuatan utama ini diterjemahkan dengan jelas ke perolehan
pendapatan yang signifikan.

- Skalabilitas
Data Warehouse sendiri dapat diskalakan serta memungkinkan skalabilitas yang
lebih besar dalam bisnis secara keseluruhan. Yang berarti Data Warehouse
canggih saat ini dibangun sesuai skala, menangani lebih banyak pertanyaan
seiring pertumbuhan bisnis (meskipun aktivitas ini membutuhkan dukungan
banyak perangkat keras).
- Cloud
Tidak seperti database terdahulu, Data Warehouse saat ini dibangun dengan
mempertimbangkan multi cloud dan hybrid cloud. Banyak gudang data sekarang
sepenuhnya berbasis cloud, hal ini memungkinkan pengguna seluler dapat
mengakses gudang data dengan lebih baik.
b. Buatlah sebuah video yang menjelaskan potensi - potensi manfaat yang diterima
Dinas Pariwisata Provinsi Jabar jika mengimplementasikan rancangan Data
Warehouse yang anda ajukan!
Link video
Referensi jawaban

Oktavia, T. (2015, July 30). PERANCANGAN MODEL DATA WAREHOUSE DALAM


MENDUKUNG PERUSAHAAN JASA PENGIRIMAN | Oktavia | Seminar Nasional
Informatika (SEMNASIF). Http://103.23.20.161.
http://103.23.20.161/index.php/semnasif/article/view/1283
di Tria, F., Lefons, E., & Tangorra, F. (2017). Cost-benefit analysis of data warehouse design
methodologies. Information Systems, 63, 47–62. https://doi.org/10.1016/j.is.2016.06.006
https://www.geeksforgeeks.org/difference-between-data-warehousing-and-online-transaction-proc
essing-oltp/
https://www.researchgate.net/publication/318444359_Data_Warehousing_Architecture_and_Pre-
Processing/link/5abfac340f7e9bfc045b8a0a/download
DOI10.17148/IJARCCE.2017.6503
https://www.educba.com/data-warehouse-schema/
https://www.geeksforgeeks.org/etl-process-in-data-warehouse/
https://ecapitaladvisors.com/blog/why-olap/
https://www.quora.com/Which-tool-is-used-for-data-cleaning-in-preprocessing

Rancangan Infrastruktur Data Warehouse

Anda mungkin juga menyukai