Data Warehouse

Anda mungkin juga menyukai

Anda di halaman 1dari 8

Data Warehouse

Pengertian Datawarehouse Data warehouse adalah database yang berisi data dari beberapa system operasional yang terintegrasi, teragreasiasi dan terstruktur sehingga dapat digunakan untuk menndukung analisa dan proses pengambilan keputusan danlam bisnis. Data warehousing telah berkembang sebagai bagian dari intelijen bisnis untuk perusahaan. Dalam data warehouse Anda mengintegrasikan dan mengubah data perusahaan menjadi informasi yang cocok untuk pengambilan keputusan strategis. Anda mengambil semua data bersejarah dari sistem operasional yang berbeda, menggabungkan data internal ini dengan data yang relevan dari luar sisi sumber, dan menarik mereka bersama-sama. Anda mengatasi konflik dengan cara data berada di sistem yang berbeda dan mengubah isi data terintegrasi ke dalam format yang sesuai untuk memberikan informasi kepada berbagai kelas pengguna. Akhirnya, Anda melengkapi dengan informasi pengiriman metode. Untuk mengatur hal sistem pengiriman informasi ini, Anda perlu komponen yang berbeda atau blok bangunan. Bangunan blok tersebut disusun bersama-sama dalam cara yang paling optimal untuk melayani tujuan yang dimaksudkan. Mereka diatur dalam sebuah arsitektur yang cocok. Sebelum kita masuk ke komponen individu dan pengaturan mereka dalam arsitektur secara keseluruhan, mari kita lihat beberapa fitur mendasar dari data warehouse. Bill Inmon (. 1996, hal 33), dianggap sebagai ayah dari data warehousing seperti yang tercantum dalam bab sebelumnya, memberikan definisi berikut: A Data Warehouse is a subject oriented, integrated, nonvolatile, and time variant collection of data in support of managements decisions. "Sebuah Gudang data adalah berorientasi subjek, terintegrasi, nonvolatile, dan waktu varian pengumpulan data dalam mendukung keputusan manajemen. " Sean Kelly, praktisi lain data warehousing terkemuka, mendefinisikan data warehouse dengan cara berikut. Data dalam data warehouse adalah: Separate, Available, Integrated, Time stamped, Subject oriented, Nonvolatile, Accessible Terpisah, tersedia, Terpadu, Waktu dicap, Subjek berorientasi, NonVolatile, diakses

Karakteristik Data Warehohuse Mari kita periksa beberapa kunci dalam mendefinisikan fitur dari data warehouse berdasarkan definisi ini. Bagaimana dengan sifat data dalam data warehouse? Bagaimana data ini yang berbeda dari data dalam sistem operasional? Mengapa harus berbeda? Bagaimana isi data dalam data warehouse digunakan?

a.

Subject-Oriented Data Data warehouse berorientasi subject artinya data warehouse didesain untuk

menganalisa data berdasarkan subject-subject tertentu dalam organisasi, bukan pada proses atau fungsi aplikasi tertentu. Tidak seperti pada operational systems, data disimpan berdasarkan aplikasi. Set data hanya terdiri dari data yg di butuhkan oleh fungsi yg terkait dengan aplikasinya. Subjek data yang dimaksud disini adalah subjek bisnis penting bagi perusahaan attau instansi terkait. Data warehouse diorganisasikan disekitar subjek-subjek utama dari perusahaan (customers, products dan sales) dan tidak diorganisasikan pada areaarea aplikasi utama (customer invoicing, stock control dan product sales). Hal ini dikarenakan kebutuhan dari data warehouse untuk menyimpan data-data yang bersifat sebagai penunjang suatu keputusan, dari pada aplikasi yang berorientasi terhadap data.

Gambar di atas membedakan antara bagaimana data disimpan dalam sistem operasional dan data warehouse. Dalam sistem operasional ditampilkan, data untuk setiap aplikasi ini diselenggarakan secara terpisah oleh aplikasi: pemrosesan order, kredit konsumen, tagihan pelanggan, piutang, klaim

pengolahan, dan rekening tabungan. Misalnya, klaim adalah subjek bisnis penting untuk perusahaan asuransi. Klaim berdasarkan kebijakan asuransi mobil diproses dalam aplikasi asuransi mobil. Klaim data untuk asuransi mobil diatur di aplikasi tersebut. Demikian pula, data klaim untuk asuransi kompensasi pekerja yang mengatur di dalam aplikasi asuransi pekerja comp. Namun dalam data warehouse sebuah perusahaan asuransi, data tentang klaim diselenggarakan sekitar subyek klaim dan bukan oleh aplikasi individual asuransi mobil dan comp pekerja.

b. Integrated Data Untuk membuat keputusan yang tepat, Anda perlu untuk bekerja sama semua data yang relevan dari berbagai aplikasi. Data dalam data warehouse berasal dari sistem operasional beberapa. Sumber data berada di basis data yang berbeda, file, dan segmen data. Ini adalah aplikasi yang berbeda, sehingga platform operasional dan sistem operasi dapat berbeda. Layout file, representasi karakter kode, dan bidang konvensi penamaan semua bisa berbeda. Selain data dari sistem operasional internal, untuk banyak perusahaan, data dari sumber luar mungkin akan sangat penting. Perusahaan seperti Metro Mail, AC Nielsen, dan IRI mengkhususkan diri dalam menyediakan data penting secara teratur. Gudang data Anda mungkin perlu data dari sumber tersebut. Ini adalah salah satu variasi lebih dalam campuran sumber data untuk data warehouse.

Gambar di atas mengilustrasikan proses yang sederhana integrasi data untuk sebuah lembaga perbankan. Berikut data dimasukkan ke dalam area subyek akun dalam data warehouse berasal dari tiga aplikasi operasional yang berbeda.

Bahkan hanya dalam tiga aplikasi, mungkin ada beberapa variasi. Konvensi penamaan dapat berbeda; atribut untuk item data dapat berbeda. Nomor rekening dalam aplikasi rekening tabungan bisa menjadi delapan byte panjang, tetapi hanya enam byte dalam aplikasi rekening koran. Sebelum data dari berbagai sumber yang berbeda dapat bermanfaat disimpan dalam sebuah gudang data, Anda harus menghapus inkonsistensi. Anda harus standarisasi unsur berbagai data dan memastikan arti dari nama data dalam setiap aplikasi sumber. Sebelum memindahkan data ke dalam gudang data, Anda harus melalui proses transformasi, konsolidasi, dan integrasi sumber data.

c.

Time-Variant Data Pada operational system, data yang disimpan merupakan data terkini.

Walaupun tidak menutup kemungkinan bahwa data yang berasal

transaksi

terdahulu juga disimpan, namun pada dasarnya yang berpengaruh pada operational systems hanya data terkini. Hal ini dikarenakan sistem ini mendukung kegiatan operasional sehari-hari Pada Data warehouse data yang disimpan merupakan data historis dalam kurun waktu tertentu, bukan hanya data terkini. Oleh karena itu setiap data yang disimpan mengandung keterangan waktu, misalnya tanggal, minggu, bulan, catur wulan dan sebagainya. Karakteristik Time Variant pada data warehouse memiliki kemampuan sebagai berikut: Melakukan analisa terhadap hal masa lalu Mencari hubungan antara informasi dengan keadaan saat ini Melakukan prediksi hal dimasa yang akan datang

d. Nonvolatile Data Data-data dalam sebuah Data Warehouse tidak dapat diubah (tidak dapat di-update). Data-data tersebut merupakan data historis yang digunakan untuk memenuhi kebutuhan analisis, bukan untuk menangani transaksi seperti pada basisdata transaksional pada umumnya.Pada gambar tersebut menunjukan karakteristik non-volatile pada data warehouse. Dapat dilihat bahwa pada operational system data di-update sesuai dengan transaksi bisnis. Setiap kali

terjadi transaksi, user dapat melakukanproses add, update atau delete pada data yang terdapat dalam operational system. Namun, tidak demikian halnya dengan data warehouse. Sekali data disimpan ke dalam data warehouse, user tidak dapat melakukan perubahan hanya berdasarkan jangka waktu tertentu yang telah ditetapkan sesuai dengan kebutuhan. Misalnya 1 kali dalam sehari, 1 kali dalam seminggu, 1 kali dalam 2 minggu, dan sebagainya

e.

Data Granularity Jika dalam operational systems data biasanya disimpan pada tingkatan

detil data terendah, maka dalam data warehouse akan lebih efisien jika data disimpan dalam bentuk ringkasan pada berbagai tingkat. Data granularity dalam data warehouse mengacu kepada tingkatan dari detail data yang disimpan. Semakin rendah tingkatannya, maka data granularity akan semakin baik. Namun, jika ingin menyimpan data dengan tingkat detil data terendah, maka data yang disimpan harus dalam jumlah besar.

Data Mart Membangun data warehouse merupakan hal yang sangat kompleks dan butuh waktu sekitar 18 bulan sampai tiga tahun. Dikarenakan warehouse berisi banyak area subjek dan lintas organisani, juga berhubungan dengan situasi pollitik tertentu. Karena itu banuka proyek data warehousing yang gagal. Juga telah banyak diperoleh keuntungan dari penggunaan warehouse, untuk memecahkan masalah bisni. Data warehouse berisi banyak subjek yang menyediakan tinjauan perusahaan secara menyeluruh. Data marts adalah subyek spesifik atau aplikasi spesifik dari data warehouses yang berisi data untuk saru

line bisnis tertentu semisal penjualan atau pemasaran. Perbedaan antara data mart dann data warehouse adalah pada ruang lingkup informasi yang disediakan. Ruang lingkup data mart lebih kecil, data didapatkan dari sumber yang lebih sediikit, dan waktu implementasinya juga lebih pendek.

Perbedaan Data Mart dengan Data Warehouse Sebenarnya Data Mart memang tidak sama dengan Data Warehouse ada banyak perbedaanya, seperti ditunjukkan pada tabel dibawah ini: Data Warehouse Menyeluruh untuk satu perusahaan Gabungan dari seluruh data marts Data diperoleh dari staging area Dilakukan queries pada sumber presentasi Strukturnya direncang untuk data secara keseluruhan Diorganisasikan dalam bentuk model Entity Relationship Data Mart Hanya untuk departemen tertentu Merepresentasikan satu proses bisnis Data diperoleh dari skema, misalnya star schema yang menyatakan hubungan antar fakta dan dimensi Optimal teknologi untuk akses dan analisa data Strukturnya dirancang untuk memenuhi sebagai data

Pendekatan Pada Data Warehouse Untuk mengimplementasikan data warehouse terdapat 2 pendekatan, yaitu top-down dan bottom-up. Pendekatan top-down adalah cara implementasi dengan membangun data warehouse terlebih dahulu, baru kemudian membaginya kedalam beberapa data marts. Sedangkan pendekatan bottom-up adalah cara implementasi dengan membangun beberapa individual data mart terlebih dahulu, baru kemudian mengkombinasikan dan menggabungkannya menjadi satu data warehouse. Berkut keuntungan dan kerugiian dari masing-masing pendeketan.

a.

Pendekatan Top Down Pendekatan ini dilakukan dengan membuat perancangan data

warehouse terlebih

dahulu secara keseluruhan. Dalam pembuatannya, ditentukan apa yang menjadi sumber data dan bagaimana cara untuk memasukkannya ke dalam data warehouse yang telah dirancang terlebih dahulu. Pendekatan ini menyatakan bahwa pembangunan desain arsitektur data warehouse adalah hal pertama yang dilakukan dalam membangun suatu data warehouse.

Kuntungan pendekatan Top Down adalah sebagai berikut: Upaya yang dikeluarkan ditujukan untu data perusahaan secata menyeluruh Arsitekturnya bukan hanya sekedar menggabungkan beberapa data marts yang terpisah Tempat penyimpanan data hanya satu dan terpusat Aturan dan kontrol dilakukan secara terpusat Jika proses implementasi dilakukan secara iteratif, maka hasilnya akan dapat diperoleh dengan cepat

Kerugian pendekatan Top Down adalah sebagai berikut: Waktu yang dibutuhkan untuk proses implementasi akan lebih lama, sekalipun dilakukan dengan metode iteratif Kemungkinan gagal saat proses implementasi lebih besar Membutuhkan keahlian tingkat tinggiuntuk dapat melakukan crossfunctional Jika tanpa konsep pembuktian, maka kemungkinan biaya pengeluaran untuk proses implementasi akan lebih besar

Pendekatan Bottom Up Berbeda dengan pendekatan Top Down, pendekatan ini menyatakan bahwa data warehouse berawal dari kumpulan data mart yang telah dibangun terlebih dahulu untuk masing-masing departemen. Data mart yang telah dibangun kemudian digabungkan untuk membangun suatu data warehouse yang utuh.

Keuntungan pendekatan Bottom Up adalah sebagai berikut: Proses yang dilakukan lebih mudah dibandingkan pendekatan top-down sehingga waktunya lebih cepat Lebih menguntungkan untuk mengembalikan investasi dan melakukan konsep pembuktian Kemungkinan gagal saat proses implementasi lebih kecil Memungkinkan tim pengembang untuk belajar dan berkembang

Kerugian pendekatan Bottom Up adalah sebagai berikut: Setiap data mart hanya memiliki ruang lingkup data yang sempit Memungkinkan adanya pengulangan data pada setiap data mart Memungkinkan terjadinya data yang inkonsisten dan tidak dapat disatukan Perkembangan antarmuka sistem tidak dapat diikendalikan

Anda mungkin juga menyukai