Anda di halaman 1dari 55

Decision Support and Business

Intelligence Systems

M. Afdal, ST., M.Kom


afdal.alfatih@gmail.com

Lecture 3, Data Warehouse & OLAP


Copyright © M. Afdal’ 2017
Tujuan Pembelajaran
 Memahami definisi dan konsep dasar dari data warehouse
 Memahami arsitektur data warehouse
 Menjelaskan proses yang digunakan dalam mengembangkan
dan mengelola data
 warehouse
 Menjelaskan operasi data warehousing
 Menjelaskan peran data warehouse untuk mendukung
pengambilan keputusan
 Menjelaskan integrasi data dan ekstraksi, transformasi, dan
beban (ETL) proses
 Menjelaskan real-time (aktif) data warehousing
Topik Utama
 DW definitions
 Characteristics of DW
 Data Marts
 ODS, EDW, Metadata
 DW Framework
 DW Architecture & ETL Process
 DW Development
DEFINISI DAN KONSEP DATA
WAREHOUSE

 Menggunakan data warehouse secara real-time


dalam kaitan dengan Sistem Pengambilan Keputusan
(Decision Support Systems – DSS) dan alat-alat
Inteligensia Bisnis (Business Intelligence ) merupakan
cara penting melakukan bisnis.

 Beberapa perusahaan menunjukkan skenario di mana


real-time data warehouse mendukung proses
pengambilan keputusan dengan menganalisis
sejumlah besar data dari berbagai sumber guna
memberikan hasil yang cepat untuk mendukung
proses yang kritis.
 Dengan arus data yang real -time, perusahaan dapat
melihat keadaan bisnis terkini dan dengan cepat
mengidentifikasi masalah

 Pelanggan dapat memperoleh informasi real-time


tentang produk, jasa, dan informasi akun lainnya,
sehingga sistem juga memberikan keuntungan
kompetitif yang signifikan atas pesaing.
Apa yang dimaksud dengan Data
Warehouse…?

 Dalam istilah yang sederhana, data warehouse


(DW) adalah dimaksudkan sebagai kumpulan
data yang dihasilkan untuk mendukung pengambilan
keputusan,

 merupakan penyimpanan data saat ini dan masa


lampau yang secara potensial diperlukan para
manajer di dalam organisasi.
 Data biasanya akan tersedia secara terstruktur dalam
bentuk siap untuk kegiatan proses analisis.
(misalnya, pengolahan analisis secara online [OLAP], data mining, query,
pelaporan, dan aplikasi pendukung keputusan lainnya).

 Sebuah data warehouse adalah kumpulan data


berorientasi subJek, terpadu, varians terhadap
waktu, serta merupakan kumpulan data nonvolatile
(tidak berubah) untuk mendukung proses
pengambilan keputusan para manajemen.
Karakteristik Data Warehouse

Ada 4 karakteristik Data Warehouse:


Cara mudah untuk memperkenalkan data warehouse adalah
dengan merujuk pada karakteristik dasar/fundamental dari data
warehouse (lihat Inmon, 2005).

 1)Subject Oriented
 2)Integrated
 3)Time Variant
 4)Non-Volatile
1) Subject Oriented

 Data yg disusun menurut subjek berisi hanya informasi yg


penting bagi pemprosesan Decision Support (DSS).

 Data diorganisasikan berdasarkan detil subjek, seperti


penjualan, produk, atau pelanggan, gudang, pasar dll, berisi
informasi yang relevan untuk mendukung keputusan.

 Data berorientasi subjek memungkinkan pengguna untuk


menentukan tidak saja bagaimana mereka menjalankan bisnis
tapi juga mengapa.
 Orientasi subjek memberikan pandangan yang lebih
komprehensif pada organisasi.

 Semua Informasi tsb disimpan dalam suatu sistem


data warehouse.

 Data-data di setiap subjek dirangkum ke dalam


dimensi, misalnya : periode waktu, produk, wilayah,
dsb, shg dapat memberikan nilai sejarah untuk bahan
analisa.
Database Operasional VS Data Warehouse
2)Integrated

 Data Warehouse dapat menyimpan data-data yg berasal dari


sumber yg terpisah kedalam suatu format yg konsisten dan
saling terintegrasi satu dgn lainnya.

 Untuk melakukannya, kita harus berurusan dengan penamaan


data yang berbeda dan kesenjangan antar satuan ukuran.

 Sebuah data warehouse harus dibuat sedemikian rupa sehingga


benar-benar terintegrasi.
 Data terintegrasi
3)Time Variant

 Sebuah data warehouse menyimpan data histori.

 Data yg tersimpan dlm rentang 5-10 tahun/lebih, suatu ketika


dpt digunakan untuk perbandingan atau perkiraan sbg data yg
valid dan akurat, dan data ini tidak dapat diperbaharui.

 Ini dapat digunakan untuk melakukan trend analysis dari


data tersebut.
Cara yg digunakan untuk melihat interval waktu dlm mengukur
keakuratan suatu data warehouse:

 a)Paling sederhana : menyajikan data warehouse pada rentang


waktu tertentu.

 b)Menggunakan variasi/perbedaan waktu yg disajikan dalam


data warehouse baik implicit maupun explicit; secara explicit
dengan unsur waktu dalam hari, minggu, bulan dan waktu
tertentu.

 c)Variasi waktu yg disajikan data warehouse melalui


serangkaian snapshot yg panjang.
4)Non-Volatile (tidak gampang berubah)

 Data dalam data warehouse tidak diupdate scr real-time/terus


menerus (spt inserts, updates, deletes) spt dalam sebuah sistem
OLTP, tetapi hanya dpt ditambah dan dilihat.

 Pada data warehouse hanya ada 2 kegiatan memanipulasi data


yaitu :
 loading data (mengambil data), dan
 akses data (mengakses data warehouse).
 Data di dalam data warehouse scr periodik di upload
dlm jangka waktu yang sama (misal. setiap sore /
setiap tanggal 2)
 Ada beberapa karakteristik tambahan mungkin termasuk yang
berikut:

 Berbasis web. Data warehouse biasanya dirancang untuk


disediakan pada lingkungan komputasi yang efisien untuk
aplikasi berbasis Web.

 Relasional / multidimensi Sebuah data warehouse


menggunakan baik struktur relasional atau struktur
multidimensi. Sebuah survei terbaru pada struktur multidimensi
dapat ditemukan pada bukunya Romero dan Abello (2009).
 Client / Server. Sebuah data warehouse menggunakan
arsitektur client / server guna memberikan kemudahan akses
bagi pengguna akhir.

 Real-time. Versi data warehouse yang baru, menyediakan


akses data real-time, atau aktif, dan kemampuan untuk
melakukan analisis (lihat Basu, 2003, dan Bonde dan Kuckuk,
2004)

 Menyertakan metadata. Sebuah data warehouse berisi


metadata (data tentang data) yang menjelaskan bagaimana
data diatur dan cara yang efektif untuk menggunakannya
3 Jenis utama dari data warehouse

 Data mart
 Penyimpanan data operasional
(operational data store - ODS)
 Enterprise data warehouse (EDW).
1. Data mart
 Data warehouse biasanya menggabungkan database
di seluruh perusahaan.
 Data mart biasanya lingkupnya lebih kecil dan
berfokus pada subjek atau departemen tertentu
 Sebuah data mart bisa merupakan subjet dari data
warehouse (misalnya, subyek pemasaran,
operasional dsb).
 Data mart adalah suatu bagian
pada data warehouse yang mendukung
pembuatan laporan dan analisa data pada
suatu unit bagian atau operasi pada suatu
perusahaan.

 Data mart adalah miniatur data warehouse.


 Tingginya biaya pembuatan data warehouse
membatasi penggunaannya untuk perusahaan-
perusahaan besar saja.

 Namun sebagai, alternatif banyak perusahaan


menggunakan biaya yang lebih rendah, dengan versi
data warehouse skala kecil yang disebut sebagai data
mart independen.
2. Operational Data Store (ODS)
 Penyimpanan data operasional (ODS) menyediakan
bentuk layanan baru sebuah file informasi
pelanggan (Customer Information File - CIF).
 Isi dari ODS diperbarui melalui operasi bisnis.
 Biasanya ODS digunakan untuk keputusan jangka
pendek.
 Sebagai perbandingan, data warehouse jangka
panjang menyimpan informasi yang lebih
permanen
3. Enterprise Data Warehouse (EDW)

EDW adalah data warehouse skala besar


yang digunakan di seluruh perusahaan untuk
pendukung keputusan.

 Jenis data warehouse tersebut menjelaskan


bahwa perusahaan dikembangkan.
 Sifat skala besar berarti menyediakan
integrasi data dari berbagai sumber ke
dalam format standar untuk BI yang
efektif dan untuk aplikasi dukungan
pengambilan keputusan.
 EDW digunakan untuk menyediakan data untuk
berbagai jenis DSS, termasuk :

 Manajemen respon pelanggan (Customer Response Management –


CRM),
 Manajemen rantai pasokan (Suplay-Chain Management - SCM),
 Manajemen kinerja bisnis (Business Performance Management -
BPM),
 Pemantauan kegiatan usaha (Business Activity Monitoring - BAM),
 Manajemen siklus hidup produk manajemen (Product Lifecycle
Management - PLM),
 Manajemen pendapatan (Revenue Management – RM),
 Manajemen pengetahuan (Knowledge Management System - KMS).
Metadata
 Metadata adalah data tentang data (lihat Sen,
2004, dan Zhao, 2005).

 Metadata menggambarkan struktur dan


beberapa arti tentang data, sehingga
berkontribusi untuk penggunaan data yang
efektif atau tidak efektif.
 Mehra (2005) menunjukkan bahwa hanya
sedikit organisasi benar-benar memahami
tentang metadata.

 dan lebih sedikit lagi yang memahami


bagaimana merancang dan meng
implementasikan strategi metadata.
 Menurut Kassam (2002), metadata bisnis
terdiri atas informasi untuk meningkatkan
pemahaman kita tentang data traditional
(yaitu, terstruktur).

 Tujuan utama dari metadata adalah


memberikan konteks untuk data yang
dilaporkan, yaitu menyediakan pengkayaan
informasi yang mengarah pada penciptaan
pengetahuan.
Metadata adalah informasi terstruktur yang
mendeskripsikan, menjelaskan, menemukan,
atau setidaknya menjadikan suatu informasi
mudah untuk ditemukan kembali, digunakan,
atau dikelola.

Metadata sering disebut sebagai data


tentang data atau informasi tentang
informasi.
TINJAUAN PROSES DATA WAREHOUSING

 Organisasi, swasta dan publik, terus mengumpulkan


data, informasi dan pengetahuan pada tingkat yang
semakin cepat dan menyimpannya dalam sistem
komputerisasi.

 Banyak organisasi perlu membuat data warehouse,


penyimpanan data yang besar, timeseries data untuk
mendukung pengambilan keputusan.
komponen utama dari proses data
warehouse

 1. Sumber data
Data yang bersumber dari yang beberapa
operasional sistem "legacy“ independen dan
kemungkinan dari penyedia data eksternal
(seperti kantor sensus.) Data juga. dapat
berasal dari sistem OLTP atau ERP. Data Web
dalam bentuk web log juga mungkin
dibutuhkan untuk data warehouse.
 2. Ekstraksi data
Data yang diekstrak dengan menggunakan
perangkat lunak yang ditulis atau perangkat
lunak komersial

 3. Pemuatan Data
Data dimuat ke area tahapan (staging area).
Dimana data ditransformasikan dan
dibersihkan. Data kemudian siap untuk
dimuat ke dalam data warehouse.
 4. Database Komprehensif
Pada dasarnya, ini adalah EDW untuk
mendukung semua analisis keputusan
dengan menyediakan rangkuman yang
relevan dan informasi rinci yang berasal dari
berbagai sumber

 5. Metadata
Metadata dipelihara sehingga dapat dilakukan
analisis oleh personil IT dan pengguna akhir.
 6. Perangkat Middleware

Perangkat Middleware memungkinkan akses


ke data warehouse dapat dilakukan.

Pengguna utama seperti misalnya para analis


perusahaan dapat menulis sendiri Queries
SQL.
Langkah Penerapan Data Warehouse
DATA WAREHOUSING
ARSITEKTUR

Beberapa dasar arsitektur data


warehouse:

 Pada umumnya arsitektur berbentuk


two-tier. (2 tingkat)
 atau three-tier
 tapi kadang-kadang ada hanya one-tier.
 Hoiffer et al (2007), membedakan
ketiga arsitektur ini dengan membagi
data warehouse menjadi 3 bagian:

 1. Data warehouse itu sendiri, yang


berisi data dan perangkat lunak terkait.
 2. Perangkat lunak Akusisi Data
(back-end)

yang meng-ekstrak data dari sistem


“legacy” dan sumber eksternal,
mengkonsolidasikan dan meringkasnya,
serta memuat ke dalam data warehouse
 3. Perangkat lunak Klien (Front-
end)

yang memungkinkan pengguna untuk


mengakses dan menganalisis data dari
perangkat warehouse (DSS / BI / Bisnis
Analytics [BA]).
 Dalam arsitektur tiga tingkat (three
tier), sistem operasional berisi data dan
perangkat lunak untuk akuisisi data
dalam satu tier (yaitu, server),
 data warehouse merupakan tier lain,
 tingkat ketiga meliputi mesin DSS / BI /
BA (yaitu, application server).
 Keuntungan dari arsitektur tiga tier
adalah pemisahan fungsi dari data
warehouse, yang menghilangkan
sumber daya kendala dan
memungkinkan untuk dengan mudah
membuat data mart.
 Dalam arsitektur two-tier, mesin DSS secara fisik
dijalankan pada platform perangkat keras yang
sama seperti data warehouse
 Oleh karena itu, arsitektur two-tier lebih
ekonomis dari pada three-tier
 namun arsitektur two-tier dapat memiliki
masalah performansi khusunya untuk data
warehouse yang besar yang bekerja dengan data
– aplikasi intensif untuk pendukung pengambilan
keputusan.
 banyak konsultan dan vendor perangkat
lunak, fokus pada salah satu bagian
dari arsitektur,

 karena keterbatasan kapasitas dan


motivasi untuk membantu organisasi
melalui pilihan yang berdasarkan
kebutuhannya.
Arsitektur Data Warehouse Berbasis Web
 Data warehousing dan internet adalah dua
teknologi kunci yang memberikan
solusipenting untuk mengelola data
perusahaan.

 Integrasi dari kedua teknologi tersebut


menghasilkan data warehousing berbasis
web.
 Pada gambar 3 ditunjukkan arsitektur arsitektur
data warehouse berbasis Web yaitu arsitektur
three-tier dan klien pc, server Web dan server
Aplikasi
 Pada sisi klien, kebutuhan pengguna adalah
koneksi internet dan browser web
 Internet / extranet / intranet adalah media
komunikasi antara klien dan server.
 Pada sisi server, server Web yang digunakan
untuk mengelola arus keluar / masuknya
informasi antara klien dan server.
 Aryachandra dan Watson (2005) mengidentifikasi 10
faktor yang berpotensi mempengaruhi keputusan
pemilihan arsitektur:

 1. Saling ketergantungan informasi antar unit


organisasi
 2. Kebutuhan informasi manajemen tingkat atas
 3. Mendesaknya kebutuhan untuk data warehouse
 4. Sifat dan perilaku tugas-tugas pengguna akhir
 5. Kendala pada sumber daya
 6. Strategis tampilan data sebelum
implementasi
 7. Kompatibilitas sistem yang ada
 8. Persepsi kemampuan staf IT internal
 9. Masalah-masalah teknis
 10.Faktor-faktor Sosial/Politik
Langkah-langkah untuk menilai
keberhasilan arsitektur:

 1. Informasi yang berkualitas


 2. Sistem Mutu
 3. Dampak Individual
 4. Dampak Organisasional
KESIMPULAN
Para pembuat keputusan memerlukan informasi yang
dapat diandalkan mengenai operasi perusahaan, kecenderungan,
dan perubahan. Padahal data sering terfragmentasi dalam sistem
operasional yang berbeda-beda, sehingga manajer sering membuat
keputusan dengan informasi parsial, yang dianggap terbaik. Data
warehouse dapat membantu melewati rintangan ini dengan
mengakses, mengintegrasikan, dan mengorganisir data operasional
kunci dalam bentuk yang konsisten, dapat diandalkan, tepat waktu,
dan tersedia, dimanapun dan kapanpun diperlukan.
SEKIAN

Anda mungkin juga menyukai