Anda di halaman 1dari 19

Data Warehouse

Pertemuan 4
Pengertian Warehouse
Gudang Data (data warehouse) adalah sebuah sistem
komputer untuk mengarsipkan dan menganalisis data
historis suatu organisasi seperti data penjualan, gaji, dan
informasi lain dari operasi sehari-hari. Secara umum,
sebuah organisasi menyalin informasi dari sistem
operasional seperti penjualan dan SDM ke gudang data
menurut jadwal teratur, misalnya setiap malam atau setiap
akhir pekan.
Setelah itu, manajemen dapat melakukan query kompleks
dan analisis (misalnya, data mining) terhadap informasi
tersebut tanpa membebani sistem operasional
Pengertian Data Warehouse
Sebuah tempat penyimpanan data yang lengkap dan konsisten yang berasal
dari sumber-sumber yang berbeda dibuat untuk penggunanya agar mereka
dapat mengerti dan menggunakannya dalam konteks bisnis.[Barry Davlin]
Menurut W.H. Inmon dan Richard DH, data warehouse adalah kumpulan data
yang memiliki sifat subjek berorientasi, terpadu, waktu-varian, dan tetap pada
pengumpulan data untuk mendukung proses pengambilan keputusan
manajemen.
Menurut Vidette Poe, data warehouse adalah database yang read-only analisis
dan digunakan sebagai dasar sistem pendukung keputusan.
Menurut Paul Lane, data warehouse merupakan database relasional yang
dirancang lebih untuk query dan analisis proses transaksi, biasanya
mengandung sejarah data transaksi dan mungkin juga data dari sumber lain.
Data warehouse memisahkan beban kerja analisis dari beban kerja transaksi
dan memungkinkan organisasi untuk menggabungkan / konsolidasi data dari
berbagai sumber
Pengertian Data Warehouse
Menurut Ramelho, data warehouse merupakan pendekatan untuk menyimpan
data di mana sumber data yang heterogen (yang biasanya tersebar di beberapa
basis data OLTP) bermigrasi ke penyimpanan data dan terpisah homogen.
Menurut Usama Fayyad, pengguna menerapkan keahliannya dalam hal masalah,
dan komputer melakukan analisis data yang canggih untuk memilih data yang
tepat dan menempatkannya dalam format yang sesuai untuk pengambilan
keputusan.
Dengan demikian, data warehouse merupakan metode dalam perancangan
database, yang menunjang DSS (Decision Support System) dan EIS (Executive
Information System). Secara fisik, data warehouse adalah database, tapi
perancangan data warehouse dan database sangat berbeda. Dalam desain
database tradisional menggunakan normalisasi, sedangkan pada data warehouse
normalisasi bukanlah cara terbaik
Karakteristik Data Warehouse
Karakteristik Data Warehouse Sistem basis data ini memiliki
karakteristik yang membuatnya berbeda dari database lain. Ada
empat karakteristik yang menjadi ciri khas database ini, yaitu:
❑Berorientasi kepada subjek (subject-oriented)
Data warehouse diorganisasikan ke dalam banyak subjek yang utama
seperti customer, product, dan sales. Data warehouse tidak
berkonsentrasi pada kegiatan operasional sehari-hari dan proses
transaksi pada suatu organisasi, data warehouse fokus terhadap
modeling dan analisis data untuk pengambilan keputusan, oleh karena
itu, data warehouse menghasilkan pandangan sederhana dan ringkasan
terhadap subjek tertentu dan mengabaikan data yang tidak relevan
terhadap proses pendukung keputusan
Karakteristik Data Warehouse
❑Data yang dimiliki terintegrasi (data integrated)
Data warehouse dapat menyimpan data dari sumber yang terpisah ke
dalam format yang konsisten dan terintegrasi satu sama lain. Dengan
demikian, data tidak dapat rusak karena data merupakan entitas yang
mendukung konsep keseluruhan data warehouse itu sendiri. Syarat
integrasi sumber data dapat dipenuhi dengan berbagai cara seperti
konsisten dalam penamaan variabel, konsisten dalam variabel ukuran,
konsisten dalam coding dan struktur yang konsisten dalam atribut fisik
dari data. Dengan demikian tidak ada kebingungan karena perbedaan
nama, format, dan sebagainya. Kemudian data dapat dikategorikan
sebagai data yang terintegrasi karena kekonsistenannya
Karakteristik Data Warehouse
❑ Dibuat dalam rentang waktu tertentu (time variant) Semua data dalam data
warehouse dapat dikatakan akurat atau valid pada rentang waktu tertentu.
Untuk melihat interval waktu yang digunakan untuk mengukur keakuratan data
warehouse, kita dapat menggunakan cara berikut:
1.Cara termudah adalah untuk menyajikan data warehouse pada rentang waktu
tertentu, misalnya, antara 5 sampai 10 tahun ke depan.
2.Cara kedua, dengan menggunakan variasi perbedaan waktu / disajikan dalam
data warehouse adalah baik secara implisit maupun eksplisit. Eksplisit dengan
unsur waktu dalam sehari, seminggu, sebulan dan lain-lain. Secara implisit
misalnya, saat data diduplikasi pada setiap akhir bulan, atau kuartalan. Unsur
waktu akan tetap tersirat dalam data.
3.Cara ketiga, variasi waktu dari data warehouse yang disajikan melalui
serangkaian foto-foto yang lama. Snapshot adalah pandangan sebagian besar
data yang spesifik yang sesuai keinginan pengguna dari semua data yang ada
adalah read-only
Karakteristik Data Warehouse
❑Data yang disimpan bersifat tetap (non-volatile) Artinya data dalam
gudang data tidak diperbarui secara real-time tetapi dalam refresh
sistem operasi secara teratur. Data baru yang ditambahkan sebagai
suplemen untuk database itu sendiri bukan sebagai perubahan.
Database ini terus menyerap data baru, maka secara bertahap
bersama-sama dengan data sebelumnya. Berbeda dengan database
operasional yang dapat melakukan update, insert, dan menghapus
data yang mengubah isi dari database. Data warehouse, sementara
hanya ada dua peristiwa untuk memanipulasi data yaitu memuat data
(mengambil data) dan akses data (akses ke gudang data seperti
melakukan query atau menampilkan laporan yang diperlukan, tidak
ada aktivitas memperbarui data).
Arsitektur Data Warehouse
1. Data warehouse server Merupakan tingkatan paling bawah pada
arsitektur data warehouse. Data warehouse server merupakan relational
database system. Back-end tools dan utilities digunakan untuk
menghasilkan data ke tingkat bawah dari operasional database atau
sumber eksternal lainnya (misalnya, informasi profil pelanggan yang
disediakan oleh konsultan eksternal). Tools dan utilities menghasilkan
data extraction, cleaning, dan transformation (misalnya, untuk
menggabungkan data yang sama dari sumber yang berbeda ke dalam
format yang terintegrasi), seperti fungsi load dan refresh untuk update
ke dalam data warehouse
Arsitektur Data Warehouse
2. Online Analitical Proccesing (OLAP) Server Merupakan
tingkatan menengah dalam arsitektur data warehouse. Biasanya
diimplementasikan baik menggunakan model relasional OLAP
(ROLAP) (yaitu, perpanjangan dari relasional DBMS yang
memetakan operasi pada data multidimensi pada operasi
relasional standar), atau model multidimensional OLAP (MOLAP)
(yaitu, server yang mempunyai tugas yang khusus untuk
mengarahkan implementasi multidimensi data dan operasi).
3. Front End Client Layer Merupakan tingkatan atas pada
arsitektur data warehouse. Berisikan tool query, alat analisis,
dan tools data mining (Contoh, trend analysis, prediction dan
sebagainya)
Tugas Data Warehouse
1. Pembuatan Laporan, yaitu proses pembuatan laporan merupakan salah
satu kegunaan data warehouse yang paling umum dilakukan. Dengan
menggunakan query sederhana didapatkan laporan dengan jangka waktu yang
diinginkan.
2. OLAP, yaitu dengan adanya data warehouse, semua informasi baik detail
maupun hasil summary yang dibutuhkan dalam proses analisa mudah didapat.
3. Data Mining, yaitu merupakan proses untuk menggali pengetahuan dan
informasi baru dari data yang berjumlah banyak pada data warehouse,
dengan menggunakan kecerdasan buatan (artificial intelligence), statistika
dan matematika.
4. Proses Informasi Eksekutif, yaitu data warehouse dapat membuat ringkasan
informasi yang penting dengan tujuan membuat keputusan bisnis tanpa harus
menjelajahi keseluruhan data. Dengan data warehouse segala laporan telah
diringkas dan mempermudah untuk proses pengambilan keputusan
Keuntungan Data Warehouse
1. Potential high returns on investment, suatu organisasi harus
menjalankan sejumlah besar sumber daya untuk memastikan
kesuksesan implementasi dari data warehouse dengan biaya yang
sangat variatif. Nilai investasi yang ditanamkan lebih cepat kembali
dengan menggunakan data warehouse.
2. Competitive advantage, keuntungan kompetitif dapat dicapai
dengan memungkinkannya akses pengambil keputusan ke data yang
sebelumnya sangat tidak mungkin.
3. Increased productivity of corporate decision-makers, data
warehouse dapat meningkatkan produktivitas pengambil keputusan
dengan membangun database terintegrasi yang konsisten, berorientasi
subjek, dan data history. Dengan memindahkan data ke dalam bentuk
yang lebih berarti, data warehouse memungkinkan manajer bisnis
untuk menampilkan analisa yang lebih substantif, akurat dan konsisten
ETL (Extract, Transform, Load)
ETL merupakan sebuah proses untuk menghasilkan data
warehouse. ETL merupakan sistem yang dapat membaca data dari
satu data store, mengubah bentuk data, dan menyimpan ke data
store yang lain. Data store yang dibaca ETL disebut data source
sedangkan data store yang disimpan ETL disebut target.
ETL
ETL (Extract, Transform, Load) Extraction. Ekstraksi data adalah
proses pengambilan data dari satu database atau beberapa
database yang berbeda. Proses ekstraksi mencakup tugas
memvalidasi data dan membuang data yang tidak cocok dengan
pola yang diharapkan.
Terdapat beberapa fungsi ekstraksi data, yaitu:
❑ Ekstraksi data secara otomatis dari aplikasi sumber.
❑ Penyaringan atau seleksi data hasil ekstraksi.
❑ Pengiriman data dari berbagai platform aplikasi ke sumber data.
❑ Perubahan format layout data dari format aslinya.
❑ Penyimpanan dalam file sementara untuk penggabungan dengan
hasil ekstraksi dari sumber lain
Bagaimana Big data disimpan dan diproses
ETL (Extract, Transform, Load) Transformation. Transformasi adalah proses
mengubah data dari data operasional menjadi format data warehouse. Proses
transformasi berupa tugas-tugas seperti mengonversi tipe data, melakukan
beberapa perhitungan, penyaringan data yang tidak relevan, dan meringkasnya.
Langkah-langkah dalam transformasi data adalah sebagai berikut:
❑ Memetakan data input dari skema data aslinya ke skema data warehouse.
❑ Melakukan konversi tipe data atau format data.
❑ Pembersihan serta pembuangan duplikasi dan kesalahan data.
❑ Penghitungan nilai-nilai derivatif atau mula-mula.
❑ Penghitungan nilai-nilai agregat atau rangkuman.
❑ Pemeriksaan integritas referensi data.
❑ Pengisian nilai-nilai kosong dengan nilai default.
❑ Penggabungan data
Tantangan Big data
ETL (Extract, Transform, Load) Load. Merupakan proses terakhir
yang perlu dilakukan yaitu proses pemuatan data yang
didapatkan dari hasil transformasi ke dalam data warehouse.
Cara untuk memuat data adalah dengan menjalankan SQL script
secara periodik
Istilah yang berhubungan dengan Data Warehouse

❑ Data Mart Adalah suatu bagian pada data warehouse yang


mendukung pembuatan laporan dan analisa data pada suatu unit,
bagian atau operasi pada suatu perusahaan.
❑ On-Line Analytical Processing (OLAP) Merupakan suatu
pemrosesan database yang menggunakan tabel fakta dan dimensi
untuk dapat menampilkan berbagai macam bentuk laporan,
analisis, query dari data yang berukuran besar.
❑ On-Line Transaction Processing (OLTP) Merupakan suatu
pemrosesan yang menyimpan data mengenai kegiatan
operasional transaksi sehari-hari
Istilah yang berhubungan dengan data Warehouse

❑ DimensionTable Tabel yang berisikan kategori dengan ringkasan data detail


yang dapat dilaporkan. Seperti laporan laba pada tabel fakta dapat dilaporkan
sebagai dimensi waktu(yang berupa per bulan, per kuartal dan per tahun).
❑ FactTable Merupakan tabel yang umumnya mengandung angka dan data
history di mana key (kunci) yang dihasilkan sangat unik, karena key tersebut
terdiri dari foreign key (kunci asing) yang merupakan primary key (kunci
utama) dari beberapa dimension table yang berhubungan.
❑ Decision Support System (DSS) Merupakan sistem yang menyediakan
informasi kepada pengguna yang menjelaskan bagaimana sistem ini dapat
menganalisis situasi dan mendukung suatu keputusan yang baik
Tugas

Berikan penjelasan menurut Anda!


1. Apa Itu Data Warehouse dan Manfaatnya Bagi Perusahaan
2. Perancangan Data Warehouse
3. Bagaimana Implementasi Data Warehouse di Perusahaan?
4. Bagaimana Data Warehouse Membantu Dalam Decision Making?
5. Contoh Penerapan Data Warehouse untuk Kampus
6. Contoh Penerapan Data Warehouse di Industri Kesehatan

Anda mungkin juga menyukai