Anda di halaman 1dari 7

Tugas 2.

1 – Data Warehousing Concept

Nama : Sweetly Miracly Manopo

NIM : 220211060246

Review question 31.1


Discuss what is meant by the following terms when describing the characteristics of the data
in a data ware house:

(a) subject – oriented


(b) integrated
(c) time – variant
(d) nonvolatile
a) Subject-Oriented (Berorientasi pada Subyek):
Data dalam data warehouse disusun dan diorganisir berdasarkan subyek atau topik
tertentu, bukan berdasarkan proses bisnis atau aplikasi. Ini memungkinkan pengguna
untuk fokus pada analisis data yang berkaitan dengan subyek tertentu, seperti
penjualan, pelanggan, atau produk, tanpa memperhatikan bagaimana data tersebut
diperoleh atau digunakan dalam operasi sehari-hari.

b) Integrated (Terintegrasi):
Karakteristik ini mengacu pada proses penggabungan data dari berbagai sumber yang
berbeda menjadi satu kesatuan yang konsisten dan dapat dipahami. Data yang
terintegrasi tidak hanya berasal dari berbagai sistem, tetapi juga diubah menjadi
format yang seragam sehingga dapat digunakan untuk analisis yang lebih baik dan
konsisten.

c) Time-Variant (Berubah seiring Waktu):


Data dalam data warehouse mencakup informasi historis dan bersifat sejarah. Ini
berarti data tersebut memiliki informasi tentang perubahan seiring waktu. Pengguna
dapat melihat tren, pola, dan sejarah peristiwa dalam data untuk mendukung
pengambilan keputusan yang berdasar pada waktu.

d) Nonvolatile (Bersifat Stabil):


Data dalam data warehouse bersifat "nonvolatile," yang berarti data tidak berubah
secara acak atau sering. Setelah data dimuat ke dalam data warehouse, itu tetap tidak
berubah kecuali jika ada proses yang sengaja untuk memperbarui atau menghapusnya.
Ini memastikan konsistensi data untuk analisis jangka panjang dan pelacakan
perubahan seiring waktu.
Review question 31.2
Discuss how online transaction processing (OLTP) systems differ from data warehousing
systems.
Sistem Pemrosesan Transaksi Online (OLTP) adalah sistem yang digunakan
untuk memproses transaksi bisnis sehari-hari, seperti penjualan dan pembelian,
dengan fokus pada pemrosesan real-time dan data yang berubah sering. Sedangkan
Sistem Pergudangan Data (Data Warehousing), di sisi lain, adalah sistem yang dirancang
untuk menyimpan dan menganalisis data historis dalam volume besar untuk
mendukung analisis bisnis jangka panjang dan pertanyaan analitis yang kompleks. Data
dalam data warehousing biasanya didenormalisasi untuk analisis yang lebih baik.

Review question 31.3


Discuss the main benefits and problems associated with data warehousing

 Manfaat Data Warehousing:


1 . Analisis Bisnis yang Mendalam: Data warehousing memungkinkan organisasi
untuk melakukan analisis bisnis yang lebih mendalam dengan menggabungkan
data dari berbagai sumber dan menyimpannya dalam format yang sesuai untuk
analisis.
2 . Pemahaman Tren dan Pola: Ini memungkinkan perusahaan untuk
mengidentifikasi tren, pola, dan hubungan dalam data historis, yang dapat
digunakan untuk membuat keputusan strategis yang lebih baik.
3 . Pengambilan Keputusan yang Didukung oleh Data: Dengan data warehousing,
pengambilan keputusan dapat didukung oleh data yang konsisten dan
terpercaya, mengurangi ketidakpastian dalam pengambilan keputusan.
4 . Akses yang Efisien: Data warehousing menyediakan akses yang efisien ke data
historis melalui alat analisis dan pelaporan bisnis, memungkinkan pengguna
untuk dengan mudah mengeksplorasi dan memahami data.
5 . Integrasi Data: Data warehousing mengintegrasikan data dari berbagai sumber,
sehingga perusahaan memiliki pandangan yang lebih lengkap tentang bisnis
mereka.
 Masalah Terkait dengan Data Warehousing:
1 . Biaya: Membangun dan memelihara data warehouse dapat mahal, termasuk
biaya perangkat keras, perangkat lunak, dan sumber daya manusia yang
diperlukan untuk pengelolaan dan pemeliharaan.
2 . Kompleksitas Implementasi: Implementasi data warehousing bisa rumit dan
memakan waktu. Memerlukan pemahaman yang kuat tentang arsitektur data
dan integrasi.
3 . Konsistensi Data: Memastikan konsistensi data dari berbagai sumber bisa
menjadi tantangan, terutama jika sumber data berubah atau diperbarui secara
teratur.
4 . Kebutuhan Kapasitas Penyimpanan: Data warehousing menghasilkan volume
data yang besar, sehingga diperlukan kapasitas penyimpanan yang signifikan.
5 . Keamanan Data: Keamanan data dalam data warehousing adalah masalah
utama. Data historis yang berharga harus dilindungi dari akses yang tidak sah.
6 . Perubahan Kebutuhan Bisnis: Bisnis selalu berubah, dan data warehousing
harus dapat menyesuaikan diri dengan perubahan ini untuk tetap relevan

Review question 31.4


Data warehouse architecture consists of many components, Explain the role of each
component shown in Figure 31.1

• ETL Manager (Ekstraksi, Transformasi, dan Loading):


Bertanggung jawab untuk mengatur, menjalankan, dan mengawasi proses ekstraksi,
transformasi, dan pemuatan data dari sumber eksternal ke dalam data warehouse.
• Warehouse Manager:
Mengelola penyimpanan fisik data dalam data warehouse, termasuk pengorganisasian
data, pengindeksan, dan mengatur data agar dapat diakses dengan efisien.
• Query Manager:
Mengatur eksekusi dan mengoptimalkan kueri yang diajukan oleh pengguna untuk
memastikan pengambilan data yang efisien dari data warehouse.
• Detailed Data:
Menyimpan data tingkat rinci atau data mentah yang diperoleh dari sumber eksternal.
Data ini sering digunakan untuk analisis yang lebih dalam.
• Lightly and Highly Summarized Data:
Menyimpan data yang sudah diolah dan disummarized. Ini mencakup data agregat
yang digunakan untuk analisis tingkat tinggi.
• Archive / Backup Data:
Menyimpan data historis yang mungkin tidak lagi digunakan secara aktif, tetapi masih
diperlukan untuk keperluan audit atau kebijakan retensi data.
• Metadata:
Menyimpan informasi tentang data dalam data warehouse, termasuk deskripsi data,
definisi struktur, dan hubungan antar tabel. Metadata membantu dalam pemahaman
dan pengelolaan data.
• End - User Access Tools:
Memberikan akses ke data warehouse kepada pengguna akhir, memungkinkan mereka
untuk menjalankan kueri, melihat laporan, dan menganalisis data.
• Reporting and Query Tools:
Alat ini membantu pengguna untuk membuat laporan dan menjalankan kueri data
dengan antarmuka yang lebih mudah digunakan.
• Application Development Tools:
Digunakan oleh pengembang aplikasi untuk mengintegrasikan data dari data
warehouse ke dalam aplikasi bisnis dan membangun solusi yang lebih kompleks.
• Online Analytical Processing (OLAP) Tools:
Memungkinkan pengguna untuk melakukan analisis multidimensional dan menjelajahi
data dengan cara yang lebih interaktif dan berfokus pada dimensi tertentu.
• Data Mining Tools:
Digunakan untuk mengidentifikasi pola, tren, dan wawasan yang mendalam dalam
data. Ini dapat membantu dalam pemahaman yang lebih mendalam tentang data yang
ada.

Review question 31.5

Describe the main functions of the following components in a data warehousing environment:
(a) Metadata repository

(b) Temporal database


(c) ETL tools
(d) Parallel DMBSs
(e) Enterprise warehouse
a. Metadata Repository (Penyimpanan Metadata):
Metadata repository adalah database yang digunakan untuk menyimpan informasi
tentang data dalam data warehouse. Ini mencakup deskripsi, struktur, asal-usul, dan
hubungan antar data. Metadata membantu dalam pengelolaan, pemahaman, dan
pencarian data dalam data warehouse.
b. Temporal Database (Database Temporal):
Database temporal mengizinkan penyimpanan data dalam konteks waktu. Ini berarti
dapat melacak perubahan data seiring waktu. Ini berguna dalam analisis tren, sejarah,
dan perbandingan data pada titik waktu tertentu.
c. ETL Tools (Tools ETL - Ekstraksi, Transformasi, dan Loading):
ETL tools digunakan untuk mengambil data dari berbagai sumber, mengubahnya ke
dalam format yang cocok untuk data warehouse, dan memuatnya ke dalam data
warehouse. Mereka memfasilitasi proses ekstraksi, transformasi, dan pemuatan data
untuk memastikan data yang berkualitas tinggi dalam data warehouse.
d. Parallel DBMSs (Sistem Manajemen Basis Data Paralel):
Parallel DBMSs adalah sistem manajemen basis data yang dirancang untuk
menjalankan operasi database secara paralel, dengan memanfaatkan beberapa
prosesor atau node komputasi. Ini meningkatkan kinerja dan skalabilitas dalam
pemrosesan data dalam data warehouse yang besar.
e. Enterprise Warehouse (Pergudangan Data Enterprise):
Enterprise warehouse adalah data warehouse sentral yang menyimpan data dari
berbagai sumber dalam organisasi. Fungsi utamanya adalah mengintegrasikan data
dari seluruh perusahaan, menyediakan akses yang efisien ke data tersebut, dan
mendukung analisis bisnis yang menyeluruh. Ini adalah sumber utama wawasan bisnis
strategis.

Review question 31.6

Describe the processes associated with data extraction, cleansing ,and transformation tools.
proses ETL:

• Ekstraksi (Extraction):
Tahap ekstraksi melibatkan pengambilan data dari berbagai sumber eksternal, seperti
basis data operasional, file Excel, sistem cloud, atau sumber data lainnya.
o Proses: Data diekstraksi dengan menggunakan alat ETL yang sesuai dengan
sumbernya. Ini bisa berarti menjalankan kueri database, mengimpor file, atau
mengakses API.
o Tantangan: Memastikan bahwa data yang diambil adalah data yang relevan dan
diperlukan, serta memahami format dan struktur asal data.
• Pembersihan (Cleansing):
Data yang diekstraksi seringkali tidak sempurna dan dapat mengandung kesalahan,
duplikat, atau ketidaksesuaian. Tahap pembersihan bertujuan untuk membersihkan
data dari anomali dan menjadikannya konsisten.
o Proses: Pembersihan melibatkan identifikasi dan penanganan masalah data
seperti nilai yang hilang, duplikat, atau kesalahan tipe data. Ini juga bisa
termasuk mengisi nilai yang hilang atau menggabungkan data duplikat.
o Tantangan: Identifikasi dan penanganan kesalahan data yang mungkin rumit,
serta memastikan bahwa data tetap konsisten dan valid.
• Transformasi (Transformation):
Setelah data dibersihkan, tahap transformasi mengubah data menjadi format yang
cocok untuk data warehouse dan analisis yang akan datang.
o Proses: Transformasi melibatkan perubahan struktur data, agregasi,
normalisasi, atau penggabungan data dari berbagai sumber. Ini juga bisa
termasuk penghitungan kolom baru atau pembentukan hierarki.
o Tantangan: Menentukan bagaimana data harus diubah untuk mendukung
kebutuhan analisis bisnis, serta memastikan integritas dan konsistensi data
dalam data warehouse.

Exercise 31.13
Oracle supports data warehousing by producing a number of required functional tools .
Analyze three more DBMSs that provide data warehousing functionalities . Compare and
contrast the functionalities provided by different vendors and write a technical report
describing the strengths and weaknesses of each DBMS when it comes to features capability,
usability and appropriateness . Conclude your report by recommending one DBMS.
Laporan Teknis: Perbandingan DBMS untuk Pergudangan Data
Dalam lingkungan pergudangan data, beberapa Database Management Systems
(DBMS) selain Oracle menyediakan fungsionalitas yang kuat. Dalam laporan ini, akan
membandingkan dan kontraskan tiga DBMS tambahan:

1 . Microsoft SQL Server:


• Kekuatan:
o Dikenal dengan dukungan ETL yang kuat melalui alat seperti SQL Server
Integration Services (SSIS).
o Integrasi yang kuat dengan alat bisnis seperti Microsoft Power BI untuk
pelaporan dan analisis yang kuat.
o Ketersediaan berbagai fitur keamanan dan manajemen.

• Kelemahan:
o Tidak sekuat Oracle dalam mengelola data berskala besar.
o Biaya lisensi dapat menjadi mahal tergantung pada konfigurasi dan fitur yang
digunakan.

2 . IBM Db2 Warehouse:


• Kekuatan:
o Memiliki kemampuan pemrosesan paralel yang kuat untuk memproses data
besar dengan cepat.
o Dukungan untuk data semi-struktural dan data unstruktural.
o Fitur-fitur keamanan yang kuat termasuk enkripsi dan otentikasi yang kuat.
• Kelemahan:
o Tidak seluas SQL Server dalam hal ekosistem alat bisnis.
o Perlu kemampuan administrasi yang tinggi untuk konfigurasi dan
pemeliharaan yang efisien.

3 . Teradata:
• Kekuatan:
o Terkenal dengan skalabilitas horizontal yang luar biasa untuk mengelola data
yang sangat besar.
o Mendukung kompresi data yang efisien.
• Kelemahan:
o Biaya lisensi dan perangkat keras yang tinggi, membuatnya kurang cocok
untuk organisasi kecil.
o Memerlukan staf administrasi yang ahli dalam pengelolaan lingkungan
Teradata.

Rekomendasi:
Pemilihan DBMS tergantung pada kebutuhan dan skala organisasi. Jika
perusahaan besar dengan kebutuhan pemrosesan data berskala besar, Teradata bisa
menjadi pilihan yang kuat, meskipun dengan biaya tinggi. SQL Server dari Microsoft
adalah pilihan yang bagus jika ingin integrasi yang kuat dengan alat bisnis Microsoft dan
memiliki anggaran yang lebih terbatas. Db2 Warehouse dari IBM adalah alternatif yang
baik untuk organisasi yang memerlukan pemrosesan paralel dan dukungan untuk berbagai
jenis data.

Setiap DBMS memiliki kekuatan dan kelemahan masing-masing, dan pemilihan


terbaik akan bergantung pada konteks bisnis dan teknis. Sebaiknya juga
pertimbangkan faktor seperti anggaran, skala, dan kemampuan tim teknis dalam
administrasi dan pengelolaan sistem.

Anda mungkin juga menyukai