Anda di halaman 1dari 7

Tugas Sistem Basis Data

2
Data Werehouse

Golongan A
Nama Kelompok :
1. Novita Sanjaya Putri
(G41130030)
2. Amielia Tuscahya Sunjata(G41130286)
3. Febtika Purwaningsih
(G41130425)

PROGRAM STUDI DIV REKAM MEDIK


JURUSAN KESEHATAN
POLITEKNIK NEGERI JEMBER

2015
Pengertian Data Warehouse
Pengertian Data Warehouse dapat bermacam-macam namun
mempunyai inti yang sama, seperti pendapat beberapa ahli berikut
ini :
Menurut Paul Lane, data warehouse merupakan database relasional
yang didesain lebih kepada query dan analisa dari pada proses
transaksi, biasanya mengandung history data dari proses transaksi dan
bisa juga data dari sumber lainnya.Data warehouse memisahkan
beban kerja analisis dari beban kerja transaksi dan memungkinkan
organisasi menggabung/konsolidasi data dari berbagai macam sumber
Menurut Vidette Poe (1996, p6), data warehouse merupakan
database yang bersifat analisis dan hanya dapat dibaca saja yang
digunakan sebagai dasar dari sistem penunjang keputusan.
Menurut W.H. Inmon (2002, p31), data warehouse adalah
kumpulan data yang mendukung pengambilan keputusan manajemen
yang memiliki karakteristik berorientasi pada subjek (subject
oriented),
terintegrasi (integrated), mempunyai variasi waktu
tertentu (time-variant) dan tidak dapat berubah (non-volatile).
Berdasarkan Turban, Rainer dan Potter (2005, p69), data warehouse
adalah sebuah tempat penyimpanan dari data historis yang
berorientasi subyek yang diorganisasikan agar dapat diakses dalam
bentuk yang siap disajikan untuk proses analisis.
Wikipedia menyatakan bahwa data warehouse merupakan catatan
yang terdiri dari informasi baik operasional maupun transaksi yang lalu
dari sebuah perusahaan, yang ditempatkan dalam database yang
dirancang untuk mengistimewakan penganalisisan data dan pelaporan
(terutama OLAP).
Dari definisi-definisi yang dijelaskan tadi, dapat disimpulkan data
warehouseadalah database yang saling bereaksi yang dapat digunakan
untuk query dan analisisis, bersifat orientasi subjek, terintegrasi, timevariant,tidak berubah yang digunakan untuk membantu para
pengambil keputusan.
Arsitektur Data Warehouse
Arsitektur Data Warehouse adalah sekumpulan aturan atau struktur
yang menyediakan sebuah framework untuk keseluruhan desain dari

sistem atau produk. Di dalam arsitektur terdapat arsitektur jaringan,


arsitektur client-server, arsitektur untuk produk spesifik, dll.
Karakteristik Data Warehouse
Berdasarkan W.H. Inmon (2002, pp31-35), karakteristik data
warehouse terbagi menjadi empat bagian antara lain :
1. Subject Oriented
Subject oriented artinya data diorganisir berdasarkan topik
bisnis bukan oleh nomor pelanggan, atau nomor lainnya.
Orientasi subyek dalam data warehouse ditunjukkan pada
Gambar 2.1 di bawah ini. Sistem operasi klasik terorganisir
seputar aplikasi dari perusahaan. Untuk perusahaan asuransi,
aplikasinya adalah auto, health, life, dan casualty. Area subyek
utama dari perusahaan asuransi adalah customer, policy,
premium, dan claim.

2. Integrated
Integrated artinya data disimpan sebagai unit tunggal, bukan sebagai
kumpulan file-file yang mungkin mempunyai struktur atau pengaturan
yang berbeda.
Dari semua aspek dalam data warehouse integrasi
adalah aspek yang paling penting. Data dalam data warehouse diambil
dari sumber beragam yang terpisah. Saat data tersebut diambil, data
diubah, diformat ulang, diringkas, dirangkai ulang dan seterusnya.
Hasilnya, ketika telah terletak dalam data warehouse, data memiliki
gambaran fisik terpadu yang tunggal. Gambar 2.2 berikut
mengilustrasikan integrasi yang terjadi saat data dari lingkungan
operasional yang berorientasi aplikasi melewati data warehouse.

3. Nonvolatile
Nonvolatile artinya data tidak terus-menerus berubah, data baru dapat
ditambahkan berdasarkan jadwal tetapi data lama tidak dibuang.
Sebagaimana mestinya, data dalam lingkungan operasional diperbaharui
tetapi data dalam data warehouse menunjukkan serangkaian karakteristik
yang berbeda. Data dalam data warehouse biasanya diisi dan diakses
tetapi tidak diperbaharui. Sebaliknya, data akan dimuat dalam snapshot
static format saat data dalam data warehouse dimuat. Saat perubahan
berikutnya terjadi, snapshot record yang baru ditulis. Dengan begitu,
sejarah data disimpan dalam data warehouse.

4. Time Variant
Karakteristik terakhir yang menonjol dari data warehouse
adalah variasi waktu. Time variant artinya dimensi waktu secara
eksplisit termasuk dalam data sehingga kecenderungan dan
perubahan seiring waktu dapat dipelajari. Perbedaan waktu
menunjukkan bahwa setiap unit data dalam data warehouse
akurat satu kali dalam satu waktu. Dalam beberapa kasus,
sebuah record diberi keterangan waktu. Dalam kasus lainnya,
sebuah record memiliki tanggal transaksi. Tetapi pada setiap
kasus, terdapat beberapa bentuk penandaan waktu untuk
menunjukkan waktu pada saat record tertentu akurat.
Gambar 2.4 mengilustrasikan bagaimana variasi waktu dari
data dalam data warehouse dapat ditampilkan dalam beberapa
cara.

Arsitektur data warehouse (lihat gambar di bawah) mencakup proses ETL (Extraction,
Transformation, Loading) untuk memindahkan data dari operational data source dan
sumber data eksternal lainnya ke dalam data warehouse . Berikut adalah penjelasan
dari tiap proses.

Ekstraksi Data (Extract)


Ekstraksi data adalah proses dimana data diambil atau diekstrak dari
berbagai sistem operasional, baik menggunakan query, atau aplikasi
ETL. Terdapat beberapa fungsi ekstraksi data, yaitu :
1.
2.
3.
4.
5.

Ekstraksi data secara otomatis dari aplikasi sumber.


Penyaringan atau seleksi data hasil ekstraksi.
Pengiriman data dari berbagai platform aplikasi ke sumber data.
Perubahan format layout data dari format aslinya.
Penyimpanan
dalam file sementara
untuk
penggabungan
dengan hasil ekstraksi dari sumber lain.

Transformasi Data (Transformation)


Transformasi adalah proses dimana data mentah (raw data) hasil
ekstraksi disaring dan diubah sesuai dengan kaidah bisnis yang
berlaku. Langkah-langkah dalam transformasi data adalah sebagai
berikut :
1. Memetakan data input dari skema data aslinya ke skema data
warehouse.
2. Melakukan konversi tipe data atau format data.
3. Pembersihan serta pembuangan duplikasi dan kesalahan data.
4. Penghitungan nilai-nilai derivat atau mula-mula.
5. Penghitungan nilai-nilai agregat atau rangkuman.
6. Pemerikasaan integritas referensi data.
7. Pengisian nilai-nilai kosong dengan nilai default.
8. Penggabungan data.
Pengisian Data (Loading)
Proses terakhir yang perlu dilakukan adalah proses pemuatan data
yang
didapatkan
dari
hasil
transformasi
ke
dalam data
warehouse. Cara untuk memuat data adalah dengan menjalankan
SQLscript secara periodik.
Kerugian Data Werehouse

Data warehouse bukan merupakan lingkungan yang cocok untuk


data yang tidak terstruktur.
Data perlu di ekstrak, diubah (ETL) dan di load ke data
warehouse sehingga membutuhkan tenggang waktu untuk
memindahkannya.

Semakin lama dipelihara, semakin besar biaya untuk merawat


sebuah data warehouse.
Data warehouse dapat menjadi ketinggalan dari data terbaru
yang relatif cepat, karena data yang digunakan di data warehouse
tidak di update secara cepat. sehingga data yang ada tidak optimal.

Keuntungan Data Warehouse


Data warehouse merupakan pendekatan untuk menyimpan data
dimana sumber-sumber data yang heterogen(yang biasanya tersebar
pada beberapa database OLTP) dimigrasikan untuk penyimpanan data
yang homogen dan terpisah. Keuntungan yang didapatkan dengan
menggunakan data warehouse tersebut dibawah ini (Ramelho).

Data diorganisir dengan baik untuk query analisis dan sebagai


bahan untuk pemrosesan transaksi.
Perbedaan diantara struktur data yang heterogen pada
beberapa sumber yang terpisah dapat diatasi.
Aturan untuk transformasi data diterapkan untuk memvalidasi
dan mengkonsolidasi data apabila data dipindahkan dari
database OLTP kedata warehouse.
Masalah keamanan dan kinerja bisa dipecahkan tanpa perlu
mengubah sistem produksi.

Membangun data warehouse tentu saja memberikan keuntungan lebih


bagi suatu perusahaan, karena data warehouse dapat memberikan
keuntungan strategis pada perusahaan tersebut melebihi pesaingpesaing mereka. Keuntungan tersebut diperoleh dari beberapa sumber
(Sean Nolan,Tom Huguelet):

Kemampuan untuk mengakses data yang besar


Kemampuan untuk memiliki data yang konsistent
Kemampuan kinerja analisa yang cepat
Mengetahui adanya hasil yang berulang-ulang
Menemukan
adanya
celah
pada business
knowledge atau business process.
Mengurangi biaya administrasi
Memberi wewenang pada semua anggota dari perusaahan
dengan menyediakan kepada mereka informasi yang dibutuhkan
agar kinerja bisa lebih efektif.

Contoh Data Warehouse

Anda mungkin juga menyukai