Diajukan Untuk Memenuhi Salah Satu Tugas Mata Kuliah Sistem Informasi Manajemen dan
Database
Disusun Oleh :
Kelompok 3
AKUNC-2022-02
UNIVERSITAS KUNINGAN
KATA PENGANTAR
Penulis mengucapkan terima kasih kepada Tuhan semesta alam, Allah SWT.. Kami
dapat menyelesaikan makalah dengan cepat berkat bantuan-Nya. Penulis juga
mengucapkan salam dan shalawat kepada junjungan Nabi Muhammad SAW, dengan
harapan bahwa syafaatnya akan mengalir pada kita di akhir zaman.
1. Bapak Arief Nurhandika selaku dosen mata kuliah Sistem Informasi Manajemen dan
Database
Akhir kata, penulis menyadari bahwa karya ini masih jauh dari sempurna. Penulis
sangat mengharapkan agar pembaca memberi kritik dan saran. Kami berharap makalah ini
akan bermanfaat bagi banyak orang. Aamiin
i
DAFTAR ISI
KATA PENGANTAR..............................................................................................................................i
DAFTAR ISI.........................................................................................................................................ii
BAB 1................................................................................................................................................1
PENDAHULUAN.................................................................................................................................1
1.1 Latar Belakang.........................................................................................................................1
1.2 Rumusan Masalah...................................................................................................................1
1.3 Tujuan.....................................................................................................................................1
BAB II................................................................................................................................................2
PEMBAHASAN...................................................................................................................................2
2.1 Pengantar ke Data Warehouse ( Introduction to Data Warehouse ).......................................2
2.1.1 Karakteristik Data Warehouse..........................................................................................3
2.1.2 Evolusi Data Warehousing...............................................................................................4
2.1.3 Konsep Penyimpanan Data...............................................................................................5
2.1.4 Manfaat dari Data Warehousing......................................................................................6
2.1.5 Perbandingan Sistem OLTP dan Data Warehousing..........................................................7
2.1.6 Masalah-masalah dalam Penyimpanan Data....................................................................9
2.2 Arsitektur Gudang Data ( Data Warehouse Architecture )....................................................11
2.2.1 Data Operasional............................................................................................................11
2.2.2 Penyimpanan Data Operasional.....................................................................................12
2.2.3 Manajer Beban...............................................................................................................13
2.2.4 Manajer Gudang............................................................................................................13
2.2.5 Manajer Kueri.................................................................................................................13
2.2.6 Alat Akses Pengguna Akhir.............................................................................................15
2.3 Aliran Data Gudang Data ( Data Warehouse Data Flows ).....................................................17
2.3.1 Arus Masuk ( Inflow ).....................................................................................................18
2.3.2 Aliran ke Atas ( Upflow ).................................................................................................19
2.3.3 Arus Bawah ( Downflow )...............................................................................................20
ii
2.3.4 Aliran Keluar ( Outflow ).................................................................................................20
2.3.5 Metaflow........................................................................................................................21
2.4 Alat dan Teknologi Penyimpanan Data ( Data Warehousing Tools and Technologies )..........22
2.4.1 Alat Ekstraksi, Pembersihan, dan Transformasi..............................................................22
2.4.2 DBMS Gudang Data........................................................................................................23
2.4.3 Metadata Gudang Data..................................................................................................26
2.4.4 Alat Administrasi dan Manajemen.................................................................................28
2.5 Data Mart..............................................................................................................................29
2.5.1 Alasan Membuat Data Mart antara lain:......................................................................30
2.5.2 Masalah dengan Data Mart............................................................................................31
BAB III.............................................................................................................................................33
PENUTUP........................................................................................................................................33
3.1 Kesimpulan............................................................................................................................33
3.2 Saran.....................................................................................................................................33
Daftar pustaka.................................................................................................................................34
iii
BAB 1
PENDAHULUAN
1.3 Tujuan
1. Mampu menjelaskan Data Warehouse
2. Mampu menjelaskan mengenai Arsitektur Data Warehouse
3. Mampu menjelaskan Data Warehouse Data Flows
4. Mampu menjelaskan mengenai Alat dan Teknologi Data Warehouse
5. Mampu menjelaskan Data Marts
1
BAB II
PEMBAHASAN
1. Vidette poe
Data warehouse adalah database yang read – only analisis dan digunakan sebagai
dasar system pendukung Keputusan.
2. Ramelho
Data Warehouse merupakan pendekatan untuk menyimpan data Dimana sumber
data yang heterogeny (yang biasanya tersebar di beberapa basis data OLTP)
bermigrasi ke penyimpanan data dan terpisah homogen.
Data warehouse berfokus pada penyimpanan data, Dimana sumber data utama akan
dibersihkan, di tranformasikan, lalu dikatalogkan, hingga bisa digunakan oleh manager dan
professional lain.
2
Pemanfaatan Data Warehouse menggunakan data mining, OLAP (Online
Analytical Processing), dan DSS (Decision Support System) . Namun, metode untuk
mendapatkan, dan menganalisa data berupa proses extract, transform dan load data, serta
manajemen data dictionary masih termasuk pokok bahasan utama sebagai komponen
system data warehouseNamun, metode untuk mendapatkan, dan menganalisa data berupa
proses extract, transform dan load data, serta manajemen data dictionary masih termasuk
pokok bahasan utama sebagai komponen system data warehouse.
1. Subject Oriented
Data Subject Oriented di data warehouse berasal dari data yang diambil dari
aplikasi kejadian—kejadian saat ini—di sistem operasional. Di sisi lain, data yang diambil
dari aplikasi kejadian tersebut diubah menjadi data yang didasarkan pada subjek yang
terlibat pada kejadian—kejadian tersebut—di data warehouse. Misalnya, sistem
operasional sebuah super market mencatat semua penjualan di setiap kasir, pembelian
barang, dan penggajian karyawan. Selanjutnya, data gudang mengelompokkan data hasil
kejadian, yang termasuk berbagai topik seperti barang, karyawan, pemasukan, penggajian,
dan pemasok.
2. Integrated
3. Non – volatile
Data yang ada di data warehouse adalah data historis yang dapat digunakan di
masa mendatang. Dengan kata lain, sekali data dikirim, data tersebut tidak dapat diupdate
atau dihapus. Walaupun pembuatannya mahal, pelaporan dan analisis dapat menghemat
lebih banyak biaya dan waktu.
3
Dengan mengisi data warehouse terlebih dahulu, ketidakkonsistenan dapat
diidentifikasi dan diatasi, sehingga pelaporan dan analisis menjadi lebih mudah. Selain itu,
data dalam data warehouse dapat digunakan untuk sistem pendukung keputusan, dan
mereka akan tetap ada bahkan jika data dalam sistem operasional telah berubah atau
dihapus.
5. Time Variant
Semua data yang masuk ke data gudang dicatat pada waktu yang berbeda,
dimulai dari tanggal transaksi dan tanggal perubahan. Untuk memenuhi kebutuhan
analisis, kadang-kadang tabel fisik di data warehouse dapat dikelompokkan
berdasarkan waktu. Ini menjaga kinerja. Pengelompokan dan pencatatan waktu
akan sangat membantu analisis data historis.
Sejak tahun 1970-an, sebagian besar organisasi telah berinvestasi dalam sistem
komputer baru yang dapat mengotomatiskan proses bisnis. Perusahaan memperoleh
keunggulan kompetitif melalui sistem yang memberikan layanan yang lebih efisien dan
hemat biaya kepada pelanggan. Selama masa itu, perusahaan masih mengumpulkan dan
menyimpan data dalam database operasional mereka. Namun, sekarang, ketika sistem
seperti itu sudah biasa digunakan, organisasi berfokus pada cara-cara untuk menggunakan
data operasional untuk membantu dalam pengambilan keputusan dan mendapatkan
kembali keunggulan kompetitif. Karena sistem operasional tidak dirancang untuk
mendukung aktivitas bisnis seperti itu, menggunakan sistem ini untuk pengambilan
keputusan akan sangat sulit.
4
2.1.3 Konsep Penyimpanan Data
IBM awalnya berpikir tentang gudang data sebagai "gudang informasi" dan
menawarkan solusi untuk mendapatkan akses ke data yang disimpan dalam sistem non-
relasional. Rekomendasi untuk gudang informasi adalah untuk memungkinkan organisasi
menggunakan arsip data mereka untuk membantu mereka menghasilkan uang. Namun,
upaya awal untuk membuat gudang informasi sebagian besar ditolak karena kompleksitas
dan masalah kinerja yang terkait dengan penerapan solusi tersebut. Sejak saat itu, ide
warehousing data telah diangkat beberapa kali. Namun, baru beberapa tahun belakangan
ini ide ini dianggap layak dan berguna. Bill Inmon adalah pendukung terbaru dan paling
berhasil dari konsep data warehousing, dan dia diberi gelar "bapak data warehousing"
karena mendukungnya secara aktif.
5
Basis data terus menyerap data baru dan secara bertahap
menggabungkannya dengan data sebelumnya.
Ada banyak definisi data warehousing, dengan definisi sebelumnya berfokus pada
karakteristik data yang disimpan di gudang. Definisi alternatif memperluas cakupan
definisi data warehousing untuk memasukkan pemrosesan yang terkait dengan
pengaksesan data dari sumber aslinya hingga pengiriman data ke pengambil keputusan
(Anahory dan Murray, 1997).
Web adalah sumber data perilaku yang sangat besar karena individu berinteraksi
melalui browser Web mereka dengan situs Web jarak jauh. Data yang dihasilkan oleh
perilaku ini disebut clickstream. Menggunakan gudang data di Web untuk memanfaatkan
data clickstream telah mengarah pada pengembangan Data Webhouses. Diskusi lebih
lanjut tentang pengembangan variasi baru dari data warehousing ini berada di luar cakupan
buku ini, namun pembaca yang tertarik dirujuk ke Kimball dkk. (2000).
6
menemukan bahwa pengembalian investasi (ROI) rata-rata selama tiga tahun dalam
data warehousing mencapai 401%; lebih dari 90 persen perusahaan yang disurvei
mencapai ROI lebih dari 40 persen, setengah dari perusahaan mencapai ROI lebih
dari 160 persen, dan seperempat dari perusahaan mencapai ROI lebih dari 600
persen (IDC, 1996).
Keuntungan kompetitif: Pengembalian investasi yang sangat besar bagi perusahaan
yang menggunakan data warehouse menunjukkan bahwa teknologi ini sangat
kompetitif. Dengan memberikan pengambil keputusan akses ke data yang dapat
mengungkapkan informasi tentang tren, permintaan, dan pelanggan, yang
sebelumnya tidak tersedia atau tidak diketahui. Ini menghasilkan keuntungan
kompetitif.
Meningkatkan produktivitas pengambil keputusan perusahaan Data warehousing
meningkatkan produktivitas pengambil keputusan perusahaan dengan menciptakan
basis data yang terintegrasi dari data historis yang konsisten dan berorientasi pada
subjek yang berasal dari berbagai sistem yang dapat diintegrasikan ke dalam suatu
bentuk yang memberikan perspektif yang konsisten tentang organisasi. Dengan
mengubah data menjadi informasi yang bermakna, data warehouse membantu
pengambil keputusan perusahaan membuat keputusan yang lebih baik.
Sebuah organisasi biasanya akan memiliki sejumlah sistem OLTP yang berbeda
untuk proses bisnis seperti kontrol inventaris, faktur pelanggan, dan point-of-sale. Sistem-
sistem ini menghasilkan data operasional yang terperinci, terkini, dan dapat berubah. Data
OLTP diatur sesuai dengan persyaratan transaksi yang terkait dengan aplikasi bisnis dan
mendukung keputusan sehari-hari dari banyak pengguna operasional secara bersamaan.
Sistem OLTP dioptimalkan untuk sejumlah besar transaksi yang dapat diprediksi,
berulang, dan pembaruan yang intensif.
7
Sebaliknya, sebuah organisasi biasanya memiliki satu gudang data, yang
menyimpan data terperinci, historis, dan diringkas dalam berbagai tingkatan dan jarang
diubah kecuali ditambahkan data baru. Data warehouse dibuat untuk menangani jumlah
transaksi yang relatif kecil dan tidak dapat diprediksi yang membutuhkan jawaban atas
pertanyaan heuristik, ad hoc, dan tidak terstruktur. Data gudang diatur untuk memenuhi
kebutuhan pertanyaan yang mungkin terjadi dan digunakan untuk membantu keputusan
strategis jangka panjang dari tingkat manajemen yang relatif rendah.
Meskipun mereka dibangun dengan cara yang berbeda dan memiliki fitur yang
berbeda, sistem OLTP dan gudang data sangat terkait karena mereka menyediakan sumber
data untuk gudang. Masalah utama dengan hubungan ini adalah bahwa data yang dimiliki
oleh sistem OLTP dapat menjadi tidak konsisten, terfragmentasi, mudah berubah, dan
memiliki entri yang duplikat atau hilang. Oleh karena itu, sebelum dapat digunakan di
gudang data, data operasional harus "dibersihkan".
Sistem OLTP tidak dibangun untuk menjawab pertanyaan ad hoc dengan cepat.
Sistem ini juga cenderung tidak menyimpan data historis, yang diperlukan untuk
menganalisis tren. Pada dasarnya, OLTP menawarkan data mentah dalam jumlah besar,
yang tidak mudah dianalisis. Gudang data memungkinkan pertanyaan yang lebih kompleks
untuk dijawab selain hanya agregasi sederhana seperti, 'Berapa harga jual rata-rata untuk
properti di kota-kota besar di Inggris Raya? Jenis-jenis pertanyaan yang diharapkan dapat
dijawab oleh data warehouse mulai dari yang relatif sederhana hingga yang sangat
kompleks dan bergantung pada jenis alat akses pengguna akhir yang digunakan. Contoh
dari berbagai pertanyaan yang dapat didukung oleh gudang data DreamHome meliputi:
8
• Bagaimana hubungannya dengan data demografis, dan jenis properti apa yang
dijual dengan harga di atas harga jual rata-rata di kota-kota utama Inggris Raya?
Masalah tersembunyi dengan sistem sumber yang memberi makan gudang data
mungkin tidak terdeteksi selama bertahun-tahun. Pengembang harus memutuskan apakah
memperbaiki sistem sumber atau memperbaiki masalah gudang data. Sebagai contoh,
ketika memasukkan detail properti baru, area tertentu mungkin mengizinkan nilai nol. Ini
dapat menyebabkan staf memasukkan data properti yang tidak lengkap, bahkan ketika
data tersebut tersedia dan dapat digunakan.
9
seperti tanggal pendaftaran di kedua kasus tersebut.
Homogenisasi data
Data warehousing berskala besar dapat menjadi sebuah latihan
homogenisasi data yang mengurangi nilai dari data tersebut. Sebagai
contoh, dalam menghasilkan pandangan yang terkonsolidasi dan terintegrasi
dari data organisasi, perancang gudang mungkin tergoda untuk menekankan
kesamaan daripada perbedaan dalam data yang digunakan oleh area aplikasi
yang berbeda seperti penjualan properti dan penyewaan properti.
Kepemilikan data
10
reorganisasi proses bisnis dan sistem sumber dapat mempengaruhi data warehouse. Agar
tetap menjadi sumber daya yang berharga, gudang data harus tetap konsisten dengan
organisasi yang didukungnya.
Kompleksitas integrasi
Area yang paling penting untuk pengelolaan data warehouse adalah kemampuan
integrasi. Ini berarti sebuah organisasi harus menghabiskan banyak waktu untuk
mengetahui seberapa baik berbagai alat pergudangan data yang berbeda dapat
diintegrasikan ke dalam keseluruhan solusi yang dibutuhkan. Ini bisa menjadi tugas yang
sangat sulit, karena ada sejumlah alat untuk setiap operasi gudang data, yang harus
berintegrasi dengan baik agar gudang bekerja untuk keuntungan organisasi.
Data operasional mainframe yang disimpan dalam database hirarki dan jaringan
generasi pertama. Sistem ini mungkin menampung sebagian besar data
operasional perusahaan.
11
• Data departemen disimpan dalam sistem file berpemilik seperti VSAM, RMS, dan
DBMS relasional seperti Informix dan Oracle.
• Sistem eksternal seperti Internet, database komersial yang tersedia, atau database
yang terkait dengan pemasok atau pelanggan perusahaan.
Karena ODS dapat menyediakan data yang telah dibersihkan dan diekstrak dari
sistem sumber, membangun ODS dapat menjadi langkah penting dalam membangun data
warehouse. Ini menunjukkan bahwa tugas yang tersisa untuk mengintegrasikan dan
mengorganisasikan data untuk gudang data telah disederhanakan.
12
dan program yang dirancang khusus. Manajer gudang melakukan hal-hal berikut:
Dalam beberapa kasus, manajer gudang juga dapat membuat profil kueri
untuk menentukan indeks dan agregasi yang tepat. Profil kueri dapat dibuat untuk
setiap gudang data, kelompok pengguna, atau pengguna individu, dan didasarkan
pada informasi tentang fitur kueri seperti frekuensi, tabel target, dan ukuran set
hasil.
a. Data terperinci
Semua data terperinci disimpan dalam skema database di area gudang ini. Dalam
kebanyakan kasus, data terperinci tidak disimpan secara online, tetapi dapat diakses
dengan menggabungkan tingkat detail lebih lanjut. Namun, secara teratur, data terperinci
ditambahkan ke gudang untuk melengkapi data agregat.
13
Area gudang ini menyimpan semua data agregat yang dibuat oleh manajer
gudang. Area gudang ini sementara karena akan berubah terus-menerus untuk
menyesuaikan dengan profil permintaan yang berubah.
c. Arsipkan/Data Cadangan
Untuk pengarsipan dan pencadangan, area gudang ini menyimpan ringkasan dan
data terperinci. Meskipun ringkasan dibuat dari data terperinci, mungkin perlu untuk
mencadangkan ringkasan online jika data ini disimpan lebih lama. Data ditransfer ke arsip
seperti pita magnetik atau disk optik.
Semua definisi metadata, atau data tentang data, yang digunakan oleh semua
proses gudang disimpan di area gudang ini. Metadata digunakan untuk berbagai tujuan,
seperti:
d. Metadata
Struktur metadata berbeda untuk setiap proses karena berbagai tujuan. Ini
menunjukkan bahwa sejumlah salinan metadata yang menggambarkan item data yang
sama disimpan di dalam gudang data. Selain itu, sebagian besar alat vendor untuk
manajemen salinan dan akses data pengguna akhir menggunakan versi metadata mereka
sendiri. Secara khusus, alat manajemen salinan menggunakan metadata untuk memahami
14
aturan pemetaan yang akan diterapkan untuk mengubah data sumber menjadi bentuk
umum. Alat akses pengguna akhir juga menggunakan metadata untuk memahami
cakupan data sumber. Tidak boleh diremehkan bahwa mengelola metadata dalam data
warehouse adalah pekerjaan yang sangat kompleks.
Meskipun definisi alat akses pengguna akhir dapat tumpang tindih, untuk tujuan
diskusi ini, kami mengkategorikan alat ini ke dalam lima kelompok utama (Berson dan
Smith, 1997):
Alat bantu pelaporan meliputi alat bantu pelaporan produksi dan penulis laporan.
Alat bantu pelaporan produksi digunakan untuk menghasilkan laporan operasional reguler
atau mendukung pekerjaan batch bervolume tinggi, seperti pesanan/faktur pelanggan dan
cek gaji staf. Sebaliknya, penulis laporan adalah alat bantu desktop murah yang dirancang
untuk pengguna akhir.
Alat bantu kueri untuk gudang data relasional dirancang untuk menerima SQL
atau menghasilkan pernyataan SQL untuk menanyakan data yang disimpan di gudang.
Alat- alat ini melindungi pengguna akhir dari kerumitan SQL dan struktur basis data
dengan menyertakan lapisan meta antara pengguna dan basis data. Meta-layer adalah
15
perangkat lunak yang menyediakan tampilan berorientasi subjek dari database dan
mendukung pembuatan SQL dengan cara 'tunjuk-dan-klik'. Contoh alat kueri adalah
Query-By- Example (QBE). Fasilitas QBE dari DBMS Microsoft Office Access. Alat
bantu kueri sangat populer di kalangan pengguna aplikasi bisnis seperti analisis
demografi dan milis pelanggan. Namun, ketika pertanyaan menjadi semakin kompleks,
alat bantu ini dapat dengan cepat menjadi tidak efisien.
Sistem informasi eksekutif, yang baru-baru ini disebut sebagai 'sistem informasi
semua orang', pada awalnya dikembangkan untuk mendukung pengambilan keputusan
strategis tingkat tinggi. Namun, fokus dari sistem ini kemudian meluas hingga mencakup
dukungan untuk semua tingkat manajemen. Alat bantu EIS pada awalnya dikaitkan
dengan mainframe yang memungkinkan pengguna untuk membangun aplikasi pendukung
keputusan grafis yang disesuaikan untuk memberikan gambaran umum data organisasi
dan akses ke sumber data eksternal.
Saat ini, perbedaan antara alat bantu EIS dan alat bantu pendukung keputusan
lainnya menjadi semakin tidak jelas karena pengembang EIS menawarkan fasilitas kueri
tambahan dan menyediakan aplikasi yang dirancang khusus untuk bidang bisnis seperti
keuangan, penjualan, dan pemasaran.
Konsep basis data multidimensi adalah dasar dari alat pemrosesan analitik online
(OLAP), yang memungkinkan pengguna yang canggih menganalisis data menggunakan
16
tampilan multidimensi yang kompleks. Alat bantu ini biasanya digunakan untuk
perencanaan kapasitas, peramalan penjualan produk, dan evaluasi efektivitas kampanye
pemasaran. Alat-alat ini menganggap bahwa data disusun dalam model multi-dimensi
yang didukung oleh database multi-dimensi khusus (MDDB) atau database relasional
yang dibuat untuk memungkinkan kueri multi-dimensi.
Data mining adalah proses menemukan korelasi, pola, dan tren baru yang
bermakna dengan menambang data dalam jumlah besar menggunakan teknik statistik,
matematika, dan kecerdasan buatan (AI). Data mining memiliki potensi untuk
menggantikan kemampuan alat OLAP, karena daya tarik utama data mining adalah
kemampuannya untuk membangun model prediktif daripada model retrospektif.
Untuk mengelola aliran masuk dengan baik, mekanisme harus ditentukan untuk
menentukan kapan memulai ekstraksi data untuk melakukan transformasi yang diperlukan
dan melakukan pemeriksaan konsistensi. Sejauh mana sistem sumber "selaras" satu sama
lain menentukan kompleksitas proses ekstraksi data; sangat penting untuk memastikan
bahwa data dalam keadaan konsisten untuk menghasilkan tampilan data bisnis yang
terpadu.
18
Aliran ke atas merupakan Proses yang terkait dengan penambahan nilai pada data
di gudang melalui peringkasan, pengemasan, dan distribusi data.
Aturan partisi untuk tabel tertentu dapat didasarkan pada atribut data tertentu,
seperti jangka waktu atau wilayah negara. Partisi adalah pilihan desain yang bermanfaat
untuk database yang sangat besar karena memungkinkan Anda membagi tabel yang
mengandung banyak record menjadi banyak tabel yang lebih kecil. Misalnya, tabel
DreamHome PropertySale dapat dibagi berdasarkan negara bagian Inggris.
19
Proses dataflow mencakup proses yang memastikan bahwa status penyimpanan
data dapat direkonstruksi jika data hilang atau kegagalan perangkat lunak atau keras. Data
yang disimpan harus disimpan sedemikian rupa sehingga dapat direkonstruksi di gudang
jika diperlukan.
Gudang data berisi data ringkasan yang mampu menyediakan sejumlah sumber
data berbeda untuk menjawab kueri tertentu, termasuk data granular dan beberapa agregat
yang memenuhi kebutuhan data permintaan tersebut. Namun, performa kueri sangat
bervariasi bergantung pada karakteristik data target, yang paling jelas adalah volume data
yang akan dibaca. Saat mengelola aliran keluar, sistem harus menentukan cara paling
efisien untuk memenuhi permintaan.
20
2.3.5 Metaflow
Metaflow adalah proses yang terkait dengan manajemen metadata. Alur
sebelumnya menggambarkan manajemen data warehouse yang berkaitan dengan
bagaimana data masuk dan keluar dari gudang. Metaflow adalah proses memindahkan
metadata (data ke aliran lain). Metadata adalah deskripsi isi data dalam data warehouse,
apa isinya, dari mana asalnya, dan apa yang telah dilakukan dengannya dengan cara
pembersihan, integrasi, dan agregasi.
2.4 Alat dan Teknologi Penyimpanan Data ( Data Warehousing Tools and
Technologies )
Pada bagian ini kami akan membahas alat dan teknologi yang terkait dengan
membangun dan mengelola data warehouse dan, khususnya, kami akan berfokus pada isu-
isu yang terkait dengan integrasi alat-alat ini.
sistem dapat dilakukan baik dengan produk terpisah, atau dengan solusi tunggal yang
terintegrasi. Solusi terintegrasi termasuk dalam salah satu kategori Berikut :
Generator kode
Generator kode membuat program transformasi 3GL / 4GL yang
disesuaikan berdasarkan definisi data sumber dan target. Masalah utama dengan
pendekatan ini adalah pengelolaan sejumlah besar program yang diperlukan untuk
mendukung gudang data perusahaan yang kompleks. Vendor menyadari masalah
ini dan beberapa vendor mengembangkan komponen manajemen dengan
menggunakan teknologi seperti metode alur kerja dan sistem penjadwalan
otomatis.
21
Alat replikasi data basis data
Alat replikasi data basis data menggunakan pemicu basis data atau log
pemulihan untuk menangkap perubahan pada satu sumber data pada satu sistem
dan menerapkan perubahan pada salinan sumber data yang berada di sistem yang
berbeda. Sebagian besar produk replikasi tidak mendukung penangkapan
perubahan pada file dan database non-relasional, dan sering kali tidak
menyediakan fasilitas untuk transformasi dan peningkatan data yang signifikan.
Alat-alat ini dapat digunakan untuk membangun kembali basis data setelah
kegagalan atau membuat basis data untuk data mart, asalkan jumlah sumber data
kecil dan tingkat transformasi data relatif sederhana.
Persyaratan khusus untuk DBMS relasional yang cocok untuk data warehousing
(Red Brick Systems, 1996) yaitu sebagai berikut :
Kinerja beban
22
Sebuah gudang data memerlukan pemuatan data baru secara bertahap secara
berkala dalam rentang waktu yang singkat. Performa proses ini dapat mencapai
ratusan juta baris atau gigabyte data per jam, dan tidak boleh ada batas maksimum
yang membatasi bisnis.
Pemrosesan beban
Untuk memuat data ke dalam gudang data, banyak langkah yang harus diambil,
termasuk konversi data, pemfilteran, pemformatan ulang, pemeriksaan integritas,
penyimpanan fisik, pengindeksan, dan pembaruan metadata. Meskipun setiap
langkah mungkin sangat kecil dalam praktiknya, proses pemuatan harus dilihat
berjalan lancar.
Performa kueri
Analisis ad hoc dan manajemen berbasis fakta tidak boleh dihambat oleh RDBMS
data warehouse. Operasi penting yang melibatkan banyak permintaan harus
diselesaikan dalam waktu yang wajar.
Skalabilitas terabyte
Ukuran gudang data tumbuh dengan sangat cepat dengan ukuran mulai dari
beberapa hingga ratusan gigabyte hingga berukuran terabyte (1012 byte) dan
petabyte (1015 byte).
23
RDBMS tidak boleh memiliki batasan arsitektur terhadap ukuran database dan
harus mendukung manajemen modular dan paralel. Jika terjadi kegagalan,
RDBMS harus mendukung ketersediaan yang berkelanjutan, dan menyediakan
mekanisme untuk pemulihan. RDBMS harus mendukung perangkat penyimpanan
massal seperti optical disk dan perangkat manajemen penyimpanan hirarkis.
Terakhir, kinerja query tidak boleh bergantung pada ukuran database, tetapi lebih
pada kompleksitas query.
Pemikiran saat ini adalah bahwa akses ke gudang data terbatas pada jumlah
pengguna manajerial yang relatif rendah. Hal ini sepertinya tidak akan tetap
benar seiring dengan nilai dari data warehouse. Diperkirakan bahwa RDBMS data
warehouse harus mampu mendukung ratusan, atau bahkan ribuan, pengguna yang
bersamaan dengan tetap mempertahankan kinerja kueri yang dapat diterima.
Sistem data warehouse harus mampu bekerja sama dalam jaringan data
warehouse yang lebih besar. Data warehouse harus menyertakan alat yang
mengoordinasikan pergerakan subset data antar gudang. Pengguna harus dapat
melihat, dan bekerja dengan, beberapa data warehouse dari satu workstation klien.
Administrasi gudang
Sifat siklus waktu dan skala data warehouse menuntut kemudahan dan
fleksibilitas administrasi. RDBMS harus memberikan kontrol untuk menerapkan
batas sumber daya, akuntansi chargeback untuk mengalokasikan biaya kembali ke
pengguna, dan prioritas kueri untuk memenuhi kebutuhan kelas dan aktivitas
pengguna yang berbeda. DBMS juga harus menyediakan pelacakan dan
penyetelan beban kerja sehingga sumber daya sistem dapat dioptimalkan untuk
kinerja dan keluaran maksimum. Nilai yang paling terlihat dan terukur dari
penerapan data warehouse dibuktikan dalam akses kreatif tanpa hambatan ke data
yang disediakannya untuk pengguna akhir.
Semua orang setuju bahwa tampilan multi-dimensi bagus, dan RDBMS gudang
harus mendukung pembuatan ringkasan pra-komputasi yang cepat dan mudah,
24
yang biasa terjadi di gudang data yang besar, dan menyediakan alat pemeliharaan
untuk mengotomatiskan pembuatan ringkasan pra-komputasi ini. Perhitungan
agregat dinamis harus sesuai dengan kebutuhan kinerj.
B. DBMS parallel
25
Massively Parallel Processing (MPP) adalah satu set prosesor yang digabungkan
secara longgar dan masing-masing memiliki memori dan penyimpanan disk
sendiri.
Salah satu tujuan utama metadata adalah untuk memberi tahu administrator
gudang tentang sejarah semua item di gudang dengan menunjukkan jalur kembali ke
sumber data awal. Namun, masalahnya adalah bahwa metadata melakukan banyak hal
dalam gudang, termasuk manajemen gudang data, pembuatan kueri, dan proses
transformasi dan pemuatan data.
Selain metadata yang disebutkan di atas, manajer kueri perlu menghasilkan kueri
yang sesuai. Pada gilirannya, manajer kueri menghasilkan metadata tambahan tentang
kueri yang dilakukan, yang dapat digunakan untuk membuat riwayat dan profil kueri untuk
26
setiap kueri, kelompok pengguna, atau gudang data. Metadata yang terkait dengan
pengguna kueri juga mencakup, misalnya, informasi tentang definisi istilah "harga" atau
"harga".
Menyinkronkan metadata
Pada awalnya, Meta Data Coalition (MDC) dan Object Management Group
(OMG) mengusulkan dua standar utama untuk pemodelan metadata dan pemodelan di
bidang pergudangan data dan pengembangan berbasis komponen. Namun, MDC
menghentikan operasi independennya dan OMG sedang bekerja untuk mengintegrasikan
kedua standar tersebut.
CWM OMG dibangun di atas berbagai standar, seperti UML (Unified Modeling
Language) OMG, XMI (XML Metadata Interchange), MOF (Meta Object Facility), dan
OIM dari MDC. Banyak perusahaan, seperti IBM, Oracle, Unisys, Hyperion, Genesis,
NCR, UBS, dan Dimension EDI, adalah antara yang mengembangkan CWM OMG.
27
2.4.4 Alat Administrasi dan Manajemen
Sebuah gudang data membutuhkan alat untuk mendukung administrasi dan
manajemen lingkungan yang kompleks. Alat-alat ini relatif langka, terutama yang
terintegrasi dengan baik dengan berbagai jenis metadata dan operasi sehari-hari gudang
data. Alat administrasi dan manajemen data warehouse harus mampu mendukung tugas-
tugas berikut:
pemuatan data dari berbagai sumber;
pemeriksaan kualitas dan integritas data;
mengelola dan memperbarui metadata;
memantau kinerja basis data untuk memastikan waktu respons kueri yang efisien
dan pemanfaatan sumber daya;
mengaudit penggunaan gudang data untuk menyediakan informasi tagihan balik
pengguna;
mereplikasi, subset, dan mendistribusikan data;
mempertahankan manajemen penyimpanan data yang efisien;
membersihkan data;
pengarsipan dan pencadangan data;
menerapkan pemulihan setelah kegagalan;
manajemen keamanan.
28
a. Ciri-ciri yang membedakan pusat data dan gudang data adalah:
Pusat data hanya menangani kebutuhan pengguna yang terkait dengan
departemen atau fungsi bisnis.
Data mart biasanya tidak memiliki data operasional yang rumit seperti
gudang data.
figure 31.3
29
Penyimpanan data lebih mudah dipahami dan dinavigasi karena
mengandung lebih sedikit data daripada gudang data.
Ada beberapa cara untuk menciptakan pasar data. Salah satu pilihannya adalah
membangun beberapa pasar data yang bertujuan untuk berintegrasi dengan gudang;
pendekatan lain adalah membangun infrastruktur gudang data perusahaan dan pada saat
yang sama membangun satu atau lebih data logger untuk memenuhi kebutuhan bisnis yang
mendesak. Arsitektur Data Mart dapat dibangun sebagai aplikasi database dua atau tiga
tingkat. Gudang data Gudang data adalah tingkat pertama opsional (jika gudang data
menyediakan data tanda data), data mart adalah tingkat kedua dan stasiun kerja pengguna
akhir adalah tingkat ketiga, seperti pada gambar 31.3. Data didistribusikan antar level.
30
2.5.2 Masalah dengan Data Mart
1. Fungsionalitas data mart
31
Salah satu opsinya adalah menyalin data di antara penyimpanan data yang
berbeda atau membuat penyimpanan data alternatif pasar data virtual. Penyimpanan data
virtual adalah layar atau repositori data perusahaan yang disesuaikan dengan kebutuhan
kelompok pengguna tertentu. Ada produk komersial yang mendominasi pasar data virtual.
32
BAB III
PENUTUP
3.1 Kesimpulan
Data warehouse adalah koleksi atau kumpulan sumber daya yang dapat diakses
untuk mendapatkan informasi. Secara sederhana, data warehouse adalah koleksi data yang
sangat besar dan kompleks. Tujuan dari desain data warehouse adalah untuk membuat
analis dan pelaporan data menjadi bentuk informasi yang lebih berharga.
IBM merancang konsep awal penyimpanan data, "gudang informasi", sebagai
solusi untuk mengakses data yang disimpan dalam sistem non-relasional. Gudang
informasi dimaksudkan untuk memungkinkan organisasi menggunakan arsip data mereka
untuk membantu mereka menghasilkan uang.
Data warehouse adalah manajemen data dan teknologi analisis data. Tujuan utama
dari data warehousing adalah untuk menggabungkan semua data perusahaan ke dalam
sebuah repositori tunggal di mana orang dapat melakukan kueri, membuat laporan, dan
menganalisisnya.
Jika gudang data diimplementasikan dengan sukses, organisasi dapat memperoleh
banyak keuntungan, seperti potensi pengembalian investasi yang tinggi, keuntungan
kompetitif yang signifikan dari pengembalian investasi, dan peningkatan produktivitas
pengambil keputusan perusahaan.
3.2 Saran
Dalam membangun data warehouse perlu adanya mekanisme yang berkelanjutan,
sehingga dapat terus diperbaharui agar informasi yang didapat lebih akurat dan sempurna.
33
Daftar Pustaka
34