Anda di halaman 1dari 43

DATA WAREHOUSE

Arsitektur & Metode


Pengembangan

By : Rima Rizqi Wijayanti, S.ST,MMSI


Data Warehouse
ARSITEKTUR
DATA WAREHOUSE
ARSITEKTUR DATA
Arsitektur data menyediakan kerangka dengan mengidentifikasikan
dan memahami bagaimana data akan pindah melalui sistem dan
digunakan dalam perusahaan.

Arsitektur data untuk data warehouse mempunyai komponen utama


yaitu read-only basis data.
KARAKTERISITIK
ARSITEKTUR DATA
WAREHOUSE
Data diambil dari sistem asal (sistem informasi yang ada),
basis data dan file.
Data dari sistem asal diintegrasikan dan ditransformasi
sebelum disimpan ke dalam Database Management
System (DBMS) seperti Oracle,Ms SQL Server, Sybase
dan masih banyak yang lainnya.
Data warehouse merupakan sebuah basis data terpisah
bersifat hanya dapat dibaca yang dibuat khusus untuk
mendukung pengambilan keputusan
Pemakai mengakses data warehouse melalui aplikasi front
end tool.
INFRASTRUKTUR
DATA WAREHOUSE
 Merupakan software, hardware, pelatihan dan komponen-
komponen lainnya yang memberikan dukungan yang dibutuhkan
untuk mengimplementasikan data warehouse

 Salah satu instrumen yang mempengaruhi keberhasilan


pengembangan data warehouse adalah pengidentifikasian
arsitektur mana yang terbaik dan infrasruktur apa yang
dibutuhkan.

 Arsitektur yang sama, mungkin memerlukan infrastruktur yang


berbeda.
MODEL ARSITEKTUR
DATA WAREHOUSE
1. Generic Two-Level Architecture.
2. Independent Data Mart.
3. Dependent Data Mart.
4. Logical Data Mart dan Active Data
Warehouse.
Generic Two-Level
Architecture
Model arsitektur ini adalah data diekstrak dari berbagai sumber data
(internal dan external), kemudian data tersebut ditransformasikan
terlebih dahulu sebelum dimasukkan ke sebuah data warehouse
yang besar.
GENERIC TWO-LEVEL
ARCHITECTURE
Independent Data Mart
Model arsitektur independent data mart datanya tidak disimpan
dalam sebuah data warehouse yang besar tetapi dalam beberapa
data mart.
INDEPENDENT DATA
MART
Dependent Data Mart
 Pada arsitektur independent data mart ada keterbatasan dalam
proses Extraction, Tranformation dan Loading (ETL).
 Dependent data mart dikembangkan untuk mengurangi
keterbatasan tersebut.
 Dependent data mart menggunakan data warehouse yang
terpusat untuk hasil ETLnya.
 kapabilitas melakukan drill-down pada independent data mart,
dapat dihilangkan dengan menyediakan suatu sumber terintegrasi
untuk seluruh operasional data dalam suatu operasional data
store.
DEPENDENT DATA
MART
Logical Data Mart dan Real-Time Data
Warehouse
Karakteristik dari arsitektur ini meliputi:
• Logical data mart tidak secara fisik terpisah dengan basis data tetapi
hanya perbedaan view terhadap fisik basis data.
• Beberapa data dipindahkan ke dalam data warehouse untuk
meningkatkan utilisasi kinerja pada komputasi yang tinggi.
• Data mart baru dapat dibuat dengan cepat karena tidak ada basis
data secara fisik dan tidak ada pemuatan data ke basis data secara
rutin.
• Data mart selalu up-to-date karena data dibuat dari view ketika view
diacu.
LOGICAL DATA MART DAN REAL-TIME DATA
WAREHOUSE
LAPISAN – LAPISAN
ARSITEKTUR DATA
WAREHOUSE
1. Operational database layer / Lapisan basis
data operasional
2. Data Access Layer/ Lapisan Akses Data
3. Metadata Layer / Lapisan Metadata
4. Informational access layer (lapisan akses
informasi)
OPERATIONAL DATABASE
LAYER (LAPISAN BASIS
DATA OPERASIONAL)
 Sumber data (source) untuk datawarehouse
 Data lengkap, Data hari ke hari
 Mempunyai nilai saat ini/ data berarti.
 Tingkat kemungkinan data besar.
DATA ACCESS LAYER
(LAPISAN AKSES DATA)

Tools untuk mengekstrak, mengubah dan


mengambil(load) data.
 Meliputi karakteristik datawarehouse.
METADATA LAYER
(LAPISAN METADATA)

File data tersimpan / Direktori


Lebih detil dari direktori data sistem,
maksudnya lebih mendalam dari file data yang
tersedia sebelumnya.
Ada pentunjuk untuk keseluruhan warehouse
dan ada petunjuk data yang dapat diakses report
khusus untuk di analisis.
INFORMATIONAL ACCESS
LAYER (LAPISAN AKSES
INFORMASI)

Akses data dan juga tool untuk laporan dan


analisis.
Tools Business Intelligence masuk ke tahap ini.
METODE
PENGEMBANGAN DATAWAREHOUSE
DEFINISI UMUM
Methodology
“A recommended collection of philosophies,
phases, procedures, rules,techniques, tools,
documentation,management and training”
British Computer Society, 1983

(“ Kumpulan dari tahapan, prosedur, aturan,


teknik, tools, dokumentasi, manajemen dan
training untuk pengembangan sistem
informasi/Sistem DW. “)
KEGUNAAN
Umumnya kita menggunakan methodology untuk:
• Mendapatkan produk yang lebih baik
• Mendapatkan proses pengembangan yang lebih baik
• Mendapatkan proses pengembangan yang terstandarisasi

Apakah data warehousing berbeda


• Tool dan teknik yang berbeda
• Data warehousing adalah sebuah proses bukan suatu benda
INGAT: DATA WAREHOUSING
ADALAH
SEBUAH PROSES/SIKLUS
Dinamika fundamental pada inti dari data warehouse
• Pendukung keputusan adalah sebuah proses pembelajaran

1. Data pada warehouse mengubah pengertian pengguna


terhadap pekerjaan mereka
2. Dengan berubahnya pengertian mereka, keperluan
informasi mereka juga berubah
3. Dengan berubahnya keperluan informasi mereka, data
warehouse juga berubah
4. Kembali ke 1.
Metode
Metode
Pengembangan
Pengembangan

Requirement
Requirement
Data
Data Driven
Driven
Driven
Driven
Approach
Approach
Approach
Approach

User-Driven
User-Driven Process-Driven
Process-Driven Goal-Driven
Goal-Driven
Approach
Approach Approach
Approach Approach
Approach
DATA-DRIVEN
APPROACH
 Pengembangan model dilakukan berdasarkan
eksplorasi model dan data dari sumber data.
 Model konseptual untuk sebuah data warehouse
berasal dari model data sumber yang ditransformasi.
 Kebutuhan organisasi tidak diidentifikasi sama sekali
atau diidentifikasi sebagian.
 Beberapa ahli yang menyarankan metode ini adalah
Golfarelli, Inmon, serta Phipps dan Davis.
 Inmon bahkan mengusulkan agar tahap analisis
kebutuhan pengguna dilakukan setelah implementasi
data warehouse.
REQUIREMENT-
DRIVEN APPROACH
 Dalam bidang data warehouse kebutuhan yang
dimaksud adalah kebutuhan informasi, bukan
kebutuhan fungsional sebagaimana digunakan dalam
SDLC.
 Terdapat beberapa cara yang berbeda dalam
memperoleh kebutuhan pengguna, yaitu :
 user-driven approach [Westerman, Goeken, dan Kimball
]
 process-driven approach [Kaldeich dan Oliveira ]
 goal-driven approach [Georgini]
 Sebuah metode dapat menggunakan lebih dari satu
pendekatan.
PENDEKATAN METODOLOGI
OLEH BEBERAPA AHLI
Bill Inmon (1994)
Ives (1995)
Kimball (1996)
McFadden (1996)
PENDEKATAN INMON
( 1994 )
PENDEKATAN INMON
( 1994 )
Kelebihan
• Integrasi
• Perulangan
• Arsitektur pengembangan berimbang yang
terkonsentrasi
Kelemahan
• Kesulitan dan biaya mendisain model data perusahaan
• Pengertian model ER (dalam 3NF)
• Feedback dari penggunaan?
PENDEKATAN IVES
( 1995 )
PENDEKATAN IVES
( 1995 )
Kelebihan
• Teknik untuk perumusan keperluan Integrasi
• Teknik representasi berganda
Kelemahan
• Kekompleksan dan potensi berbiaya tinggi
• Waktu penyelesaian
• Kemampuan beradaptasi
• Bagaimana bila strategi bisnis berubah?
• Feedback pengguna?
PENDEKATAN
KIMBALL (1996)
PENDEKATAN
KIMBALL (1996)
Kelebihan
• Pemodelan berdimensi
• Mudah dimengerti

Kelemahan
• Integrasi
• Mapping dari pemodelan berdimensi ke sistem yang sudah
ada
PENDEKATAN
MCFADDEN (1996)
Kelebihan
• Partisipasi Pengguna
• Fokus pada pencarian sumber data

Kelemahan
• Membagi data warehouse yang besar
• Tidak ada guidelines untuk disain secara fisik
METODOLOGY DW
PADA PERUSAHAAN :
NCR
SIS Institute
Microsoft
Perbandingan oleh O’Donell, Arnott & Gibson
PENDEKATAN NCR
PENDEKATAN NCR
 Hampir sama dengan Inmon
 3NF dan model perusahaan
 Penekanan pada normalisasi dan DBMS standar
 Penekanan pada arsitektur
 Digunakan dalam beberapa sistem yang sangat besar
SAS INSTITUTE
SAS INSTITUTE
 Memakai teknik time-box
 Data warehousing cepat
 Keterkaitan selama 3 bulan (90 hari)
 Prototyping 2 bulan + 1 bulan untuk pengembangan ‘solid’

 Banyak menggunakan prototyping dan workshop


dengan pengguna
 Bergantung pada kemampuan analis sistem yang bagus
PENDEKATAN
MICROSOFT (1999)
PENDEKATAN
MICROSOFT (1999)
Kelebihan
• Memberikan perhatian pada pengguna secara eksplisit
• Tapi apa sebenarnya kelemahan ini?
• Berputar
• Terkait dengan beberapa tool yang specific yang
mengintegrasikan RDBMS dan OLAP (misalnya SQL server
& Layanan Analisa/Pelaporan

Kekurangan
• Terkait dengan beberapa tool yang specific, tetapi banyak
yang tidak mempercayai (walaupun ini berubah)
• Mapping sistem sumber
PERBANDINGAN
EMPAT METODE

Anda mungkin juga menyukai