NIM : 220211060246
b) Integrated (Terintegrasi):
Karakteristik ini mengacu pada proses penggabungan data dari berbagai sumber yang
berbeda menjadi satu kesatuan yang konsisten dan dapat dipahami. Data yang
terintegrasi tidak hanya berasal dari berbagai sistem, tetapi juga diubah menjadi
format yang seragam sehingga dapat digunakan untuk analisis yang lebih baik dan
konsisten.
Describe the main functions of the following components in a data warehousing environment:
(a) Metadata repository
Describe the processes associated with data extraction, cleansing ,and transformation tools.
proses ETL:
• Ekstraksi (Extraction):
Tahap ekstraksi melibatkan pengambilan data dari berbagai sumber eksternal, seperti
basis data operasional, file Excel, sistem cloud, atau sumber data lainnya.
o Proses: Data diekstraksi dengan menggunakan alat ETL yang sesuai dengan
sumbernya. Ini bisa berarti menjalankan kueri database, mengimpor file, atau
mengakses API.
o Tantangan: Memastikan bahwa data yang diambil adalah data yang relevan dan
diperlukan, serta memahami format dan struktur asal data.
• Pembersihan (Cleansing):
Data yang diekstraksi seringkali tidak sempurna dan dapat mengandung kesalahan,
duplikat, atau ketidaksesuaian. Tahap pembersihan bertujuan untuk membersihkan
data dari anomali dan menjadikannya konsisten.
o Proses: Pembersihan melibatkan identifikasi dan penanganan masalah data
seperti nilai yang hilang, duplikat, atau kesalahan tipe data. Ini juga bisa
termasuk mengisi nilai yang hilang atau menggabungkan data duplikat.
o Tantangan: Identifikasi dan penanganan kesalahan data yang mungkin rumit,
serta memastikan bahwa data tetap konsisten dan valid.
• Transformasi (Transformation):
Setelah data dibersihkan, tahap transformasi mengubah data menjadi format yang
cocok untuk data warehouse dan analisis yang akan datang.
o Proses: Transformasi melibatkan perubahan struktur data, agregasi,
normalisasi, atau penggabungan data dari berbagai sumber. Ini juga bisa
termasuk penghitungan kolom baru atau pembentukan hierarki.
o Tantangan: Menentukan bagaimana data harus diubah untuk mendukung
kebutuhan analisis bisnis, serta memastikan integritas dan konsistensi data
dalam data warehouse.
Exercise 31.13
Oracle supports data warehousing by producing a number of required functional tools .
Analyze three more DBMSs that provide data warehousing functionalities . Compare and
contrast the functionalities provided by different vendors and write a technical report
describing the strengths and weaknesses of each DBMS when it comes to features capability,
usability and appropriateness . Conclude your report by recommending one DBMS.
Laporan Teknis: Perbandingan DBMS untuk Pergudangan Data
Dalam lingkungan pergudangan data, beberapa Database Management Systems
(DBMS) selain Oracle menyediakan fungsionalitas yang kuat. Dalam laporan ini, akan
membandingkan dan kontraskan tiga DBMS tambahan:
• Kelemahan:
o Tidak sekuat Oracle dalam mengelola data berskala besar.
o Biaya lisensi dapat menjadi mahal tergantung pada konfigurasi dan fitur yang
digunakan.
3 . Teradata:
• Kekuatan:
o Terkenal dengan skalabilitas horizontal yang luar biasa untuk mengelola data
yang sangat besar.
o Mendukung kompresi data yang efisien.
• Kelemahan:
o Biaya lisensi dan perangkat keras yang tinggi, membuatnya kurang cocok
untuk organisasi kecil.
o Memerlukan staf administrasi yang ahli dalam pengelolaan lingkungan
Teradata.
Rekomendasi:
Pemilihan DBMS tergantung pada kebutuhan dan skala organisasi. Jika
perusahaan besar dengan kebutuhan pemrosesan data berskala besar, Teradata bisa
menjadi pilihan yang kuat, meskipun dengan biaya tinggi. SQL Server dari Microsoft
adalah pilihan yang bagus jika ingin integrasi yang kuat dengan alat bisnis Microsoft dan
memiliki anggaran yang lebih terbatas. Db2 Warehouse dari IBM adalah alternatif yang
baik untuk organisasi yang memerlukan pemrosesan paralel dan dukungan untuk berbagai
jenis data.