Anda di halaman 1dari 21

DATA WAREHOUSE

Pertemuan ke-1 (GUDANG DATA)


Materi Kuliah:
Data warehouse
• Pemodelan Data Warehouse
• OLAP (online analytical processing)
• ETL (Extraction Transformation Loading)
Cakupan /Fokus:
– Rekayasa (engineering) untuk memecahkan
masalah
– Analisis dan Perancangan
1. Mengapa belajar DW?
2. Untuk apa belajar DW?
3. Apa manfaat belajar
DW bagi saya ?
Mengapa DW?
• Digitalisasi, kemajuan sistem informasi >
data, data, data (Tera > Peta)
• Web 2.0 > berita, blog, twitter, forum, flickr,
fb, youtube, flickr
• Streaming data  sensor, internet of thing
(IoT)
Data yang sangat besar!
Mengapa DWM: Banjir Data
• Indomaret: 4500an gerai, asumsi 3 transaksi per
menit = 12 juta transaksi per hari se Indonesia.
• Kartu kredit visa: berlaku di 200 negara. 10 ribu
transaksi per detik > 850 juta transaksi per hari.
• Twitter: 8000an tweet per detik  600 juta tweet
per hari.
• Facebook: 30 milyar item (link, status, note, foto
dst) per bulan. 900 juta user menghabiskan 700
milyar menit per bulan di situs FB.
Bagaimana mengelolanya?

Apa yang bisa dilakukan perusahaan

dengan data sebanyak itu?

Informasi apa yang bisa didapat?


Banjir Data
Large Hadron
Collider:
15 petabytes data per
tahun

• 1 Peta = 1 Juta Giga


• 1 Tera = 1000 Giga
http://nextnature.net/wp-content/uploads/2009/09/lhc-530.jpg?
iact=hc&vpx=1076&vpy=276&dur=1031&hovh=260&hovw=194&tx
• 1 Peta = 1000 Tera
=158&ty=231&sig=112386718339487151050&ei=io1GUO-
NCMjorQeJ2oCgBw&page=2&tbnh=149&tbnw=113&start=18&ndsp=24&ved=1t:42
9,r:35,s:18,i:40
Penyimpanan Petabytes

• 1562 kali hardisk 640GB


• Harga: Rp.5 Milyar
Evolusi DB
• 60-an: koleksi data (file system primitif)
• 70-80: MIS (Sistem Informasi Management)
• 80-sekarang: OO, Deductive, Spatial, Multimedia
• 90-sekarang: Web based (XML, web mining),
Datawarehouse, OLAP, Text Database, Text + Data
mining
• 05-sekarang: Stream data management and mining,
Cloud, Web
Tenggelam dalam data,
tapi lapar dalam
pengetahuan !
Jiawei Han
Masalah Utama
• Data berjumlah besar
• Aliran besar (volume per satuan waktu)
• Dimensi besar > jumlah field
– Bayangkan indomaret:
• Data: Produk per toko, jenis produk, transaksi
• Laporan: transaksi per waktu (hari/bulan/tahun),
transaksi per wilayah (kabu-kota/propinsi),
transaksi per produk per wilayah dst.
• Bagaimana mengelola data?
• Bagaimana mendapatkan pengetahuan &
pemahaman?
Solusi
• Datawarehouse
• Datamining
Apa Data warehouse?
• Database pendukung keputusan yang
terpisah dengan database operasional
– Apa database operasional?
• Platform untuk penggabungan data
historis untuk analisis
• Subject oriented (multi dimensi),
terintegrasi, historis, non volatile
Pengertian Data Warehouse

Sebuah tempat penyimpanan data yang lengkap dan konsisten yang

berasal dari sumber-sumber yang berbeda dibuat untuk

penggunanya agar mereka dapat mengerti dan menggunakannya

dalam konteks bisnis.

[Barry Davlin]
Intelligence Enterprise
Pengertian Data Warehouse

Sebuah proses transformasi data ke dalam sebuah informasi dan

membuat informasi ini dapat diakses oleh penggunanya tepat

waktu untuk membuat perubahan-perubahan (strategi bisnis).

[Forrester Research, 1996]


Pengertian Data Warehouse (cont’d)

1. Berorientasi subjek,

2. Diintegrasikan,

3. Time-variant,

4. Nonvolatile,

Koleksi data untuk medukung proses pembuatan manajemen


pengambilan keputusan.

[Bill Inmon]
Pengertian Data Warehouse (cont’d)

• Data warehouse adalah basis data yang menyimpan data


sekarang dan data masa lalu yang berasal dari berbagai
sistem operasional dan sumber yang lain (sumber eksternal)
yang menjadi perhatian penting bagi manajemen dalam
organisasi dan ditujukan untuk keperluan analisis dan
pelaporan manajemen dalam rangka pengambilan keputusan
• Data warehouse digunakan untuk mendukung pengambilan
keputusan, bukan untuk melaksanakan pemrosesan
transaksi
• Data warehouse hanya berisi informasi-informasi yang
relevan bagi kebutuhan pemakai yang dipakai untuk
pengambilan keputusan

Anda mungkin juga menyukai