Pertemuan 1
DEFINISI
a) suatu proses yang digunakan untuk melakukan permintaan terhadap data dalam bentuk yang kompleks dan
menganalisa data yang bervolume besar.
b) OLAP seringkali disebut analisis data multidimensi. Berbentuk 3 dimensi yang disebut kubus (cube). Cube
adalah bagian utama dari OLAP. Cube berisi kumpulan banyak data yang telah disatukan (diagregasi) sehingga
mempercepat hasil query. Misal, data penjualan yang telah disatukan dengan data periode waktu dan jenis
barang, menampilkan data penjualan per minggu, atau per bulan dan berdasarkan jenis barang tertentu.
c)Data yang disajikan biasanya merupakan suatu fungsi agregasi seperti summary, max, min, average dan lain-lain.
d)OLAP merupakan bagian dari Business Intelligence yang berguna untuk menyediakan laporan analisis, seperti
penjualan, marketing, BPM (Business Process Management), budgeting, forecasting, keuangan dan sebagainya.
Data Multidimensi
a. User (Pengguna)
d. Design DB (Desain Database)
Dalam OLTP, penggunanya adalah user, sedangkan
Desain dalam OLTP bersifat Entity Relational atau databasenya dinormalisasi dulu sebelum digunakan.
OLAP penggunanya adalah Knowledge worker Untuk OLAP desain databasenya di de-normalisasi.
Ukuran database untuk OLTP sekitar MB-GB, sedangkan OLAP bisa sampai GB-TB
Dalam OLTP datanya adalah data transaksi rutin
sedangkan OLAP datanya adalah sekarang dan data f. Penggunaan
yang lalu berguna untuk melakukan analisis ke
OLTP digunakan setiap saat, sedangkan OLAP digunakan seperlunya saja.
depan.
c. Function (Fungsi)
OLTP pekerjaannya hanya sederhana misalnya transaksi dalam swalayan. Untuk OLAP query untuk menampilkan data sangat kompleks
OLTP sekitar ratusan sampai ribuan, tapi jika OLAP data yang diakses bisa sampai jutaan bahkan milyaran.
j. Jumlah Pengguna
Untuk OLTP penggunanya adalah puluhan, tapi kalau OLAP penggunanya bisa sampai ratusan bahkan ribuan
Tugas 1
Pertemuan 2
Definisi
Ralph Kimbali
Data warehouse adalah suatu sistem yang mengekstrak, melakukan pembersihan, menyesuaikan diri serta mengirimkan sumber data pada suatu data
penyimpanan dimensional dan selanjutnya memberi dukungan pada implementasi query serta analisa dalam rangka pengambilan keputusan.
Data warehouse merupakan dasar dari proses pengambilan keputusan. Bill Inmon disebut-sebut sebagai Bapak Data Warehouse.
Data warehouse merupakan tempat penyimpanan data historikal yang diorganisasikan berdasarkan pada subyek untuk pengambilan keputusan pada organisasi.
* Sebuah kumpulan database yang terintegrasi, didesain untuk menyediakan informasi untuk decision making
* Ide dasar dari data warehouse adalah untuk mengumpulkan berbagai macam data yang ada pada dan dihasilkan oleh suatu institusi, lalu
mentransformasi seluruh data yang ada untuk kepentingan penyajian informasi strategis bagi institusi.
Karakteristik Data Warehouse
A. Subject Oriented (Berorientasi Subjek). Didesain untuk menganalisis data berdasarkan subjek-subjek tertentu sehingga hanya data yang benar-benar
diperlukan. Data warehouse diorganisasikan disekitar subjek-subjek utama dari perusahaan(customers,products dan sales) dan tidak diorganisasikan pada area-
area aplikasi utama(customer invoicing,stock control dan product sales).
B. Integrated (Integrasi). Menyimpan data-data yang berasal dari sumber-sumber yang terpisah ke dalam suatu format yang konsisten dan saling terintegrasi
satu sama lain
C. Time Variant (Rentang Waktu). Data akurat dan valid pada titik waktu tertentu atau dalam interval waktu tertentu.
D. Non Volatile. Tidak di-update secara real time, tetapi di-refresh dari sistem operasional secara reguler.
Data yang baru selalu ditambahkan sebagai suplemen bagi database itu sendiri dari pada sebagai sebuah perubahan. Database tersebut secara kontinyu
menyerap data baru ini, kemudian secara incremental disatukan dengan data sebelumnya.
Istilah-istilah yang berhubungan dengan data warehouse
A. Data Mart
Adalah suatu bagian pada data warehouse yang mendukung pembuatan laporan dan analisa data pada suatu unit, bagian atau operasi pada suatu perusahaan. .
Data mart adalah bagian dari data warehouse. Data mart biasanya dibuat pada tiap departemen pada perusahaan tersebut. Tujuan dari pembuatan data mart
adalah supaya karyawan atau staff yang terkait pada suatu departemen tertentu dapat mengakses data yang diperlukan dengan cepat tanpa harus melakukan
query pada database utama sehingga dapat mengurangi beban server utama.
B. On-Line Analytical Processing(OLAP)
Merupakan suatu pemrosesan database yang menggunakan tabel fakta dan dimensi untuk dapat menampilkan berbagai macam bentuk laporan, analisis, query
dari data yang berukuran besar
C. On-Line Transaction Processing(OLTP)
Merupakan suatu pemrosesan yang menyimpan data mengenai kegiatan operasional transaksi sehari-hari.
D. Dimension Table
Tabel yang berisikan kategori dengan ringkasan data detail yang dapat dilaporkan. Seperti laporan laba pada tabel fakta dapat dilaporkan sebagai dimensi
waktu(yang berupa perbulan, perkwartal dan pertahun).
E.Fact Table
Merupakan tabel yang umumnya mengandung angka dan data history dimana key (kunci) yang dihasilkan sangat unik, karena key tersebut terdiri dari foreign
key(kunci asing) yang merupakan primary key (kunci utama) dari beberapa dimension table yang berhubungan.
Tugas Datawarehouse
Pembuatan laporan
Pembuatan laporan merupakan salah satu kegunaan data warehouse yang paling umum dilakukan. Dengan menggunakan query sederhana didapatkan laporan
perhari,perbulan, pertahun atau jangka waktu kapanpun yang diinginkan.
Dengan adanya data warehouse,semua informasi baik detail maupun hasil summary yang dibutuhkan dalam proses analisa mudah didapat.
OLAP mendayagunakan konsep data multi dimensi dan memungkinkan para pemakai menganalisa data sampai mendetail, tanpa mengetikkan satupun
perintah SQL karena adanya fasilitas rool-up dan drill-down. Drill-down adalah kemampuan untuk melihat detail dari suatu informasi dan roll-up adalah
kebalikannya.
Data mining
Data mining merupakan proses untuk menggali(mining) pengetahuan dan informasi baru dari data yang berjumlah banyak pada data warehouse
Dengan menggunakan data warehouse segala laporan telah diringkas dan dapat pula mengetahui segala rinciannya secara lengkap, sehingga mempermudah
proses pengambilan keputusan.
Definisi
Informatica PowerCenter
Ab Initio
ETL tools yang gratis (open source):
CloverETL
Jasper ETL
Kelebihan model skema bintang:
Memudahkan mencari isi karena kesederhanaannya dengan cara melihat step by step dari masing-masing dimensinya
Ukuran data lebih besar karena ada data yang disimpan ulang
Sulit mencari data yang dibutuhkan karena melihat strukturnya yang kompleks dan bercabang-cabang
Skema Apa yang harus Dipilih?
Penerapan skema bintang adalah pada data mart suatu perusahaanPenerapan skema snowflake
Penerapan skema snowflake dalam data warehouse suatu perusahaan dapat menghemat ruang penyimpanan yang dibutuhkan.
Persamaan dan Perbedaan antara star dan snowflake
A. Skema snowflake juga menyimpan data yang sama seperti pada skema bintang.
B. Tabel fakta yang digunakan pada skema bintang maupun pada skema snowflake berisi field-field yang sama.
A. Semua tabel dimensi pada skema snowflake telah dinormalisasi. Proses normalisasi tabel-tabel dimensi pada skema snowflake ini disebut dengan
proses snowflaking,sehingga tampilan tabel-tabel pada skema snowflake bentuknya menyerupai snowflake. Sebaliknya pada skema star belum dinormalisasi.
B. Skema snowflake memiliki kompleksitas query yang lebih kompleks dibandingkan dengan skema bintang.
Pada skema ini terdapat beberapa tabel fakta yang menggunakan satu atau beberapa tabel dimensi secara bersama-
sama sehingga jika digambarkan akanterlihat seperti sekumpulan bintang. Schema yang memiliki dua atau lebih tabel
fakta yang terhubung dengan banyak dimensi