Anda di halaman 1dari 42

OLTP CONCEPT

Pertemuan 1
DEFINISI

Online Transaction Processing (OLTP), adalah sebuah


sistem komputerisasi yang melakukan dan mencatat
setiap transaksi perharisecara online yang dperlukan
untuk pengambil keputusan yang membantu manager
dalam mendapatkan data informasi yang akurat secara
Real-time.

OLAP (Online Analitycal Processing) merupakan


teknologi yang digunakan dalam pengambilan
keputusan menganalisa data warehouse, memiliki
kemampuan mengeksplorasi data multi dimensi dan
menampilkannya secara lengkap dan terstruktur
(Bimonte dan Tchounikine, 2007).
Gambaran kaitan OLTP DAN OLAP dengan Datawarehouse
Point OLAP

a) suatu proses yang digunakan untuk melakukan permintaan terhadap data dalam bentuk yang kompleks dan
menganalisa data yang bervolume besar.

b) OLAP seringkali disebut analisis data multidimensi. Berbentuk 3 dimensi yang disebut kubus (cube). Cube
adalah bagian utama dari OLAP. Cube berisi kumpulan banyak data yang telah disatukan (diagregasi) sehingga
mempercepat hasil query. Misal, data penjualan yang telah disatukan dengan data periode waktu dan jenis
barang, menampilkan data penjualan per minggu, atau per bulan dan berdasarkan jenis barang tertentu.

c)Data yang disajikan biasanya merupakan suatu fungsi agregasi seperti summary, max, min, average dan lain-lain.
d)OLAP merupakan bagian dari Business Intelligence yang berguna untuk menyediakan laporan analisis, seperti
penjualan, marketing, BPM (Business Process Management), budgeting, forecasting, keuangan dan sebagainya.
Data Multidimensi

Data Multidimensi adalah data yang dapat


dimodelkan sebagai atribut dimensi dan
atribut ukuran

contoh, atribut dimensi adalah nama barang


dan warna barang, sedangkan contoh
atribut ukuran adalah jumlah barang
Kemampuan Olap

1. Konsolidasi (roll up) melibatkan


pengelompokkan data

2. Drill-down -data ringkas dijabarkan


menjadi lebuh detail

3. Slicing aand dicing (Pivoting)


menjabarkan pada kemampuan untuk
melihat data berbagai sudut pandang
Hasil Proses Drill Down
Rotation / Pivoting
Slicing /+Dicing

Sebagai contoh seorang manajer ingin mendapatkan data pendidikan pegawai


negeri sipil pada tahun lulus 1997 pada semua lokasi dengan jenis pendidikan
SLTA.
PERBEDAAN OLTP DENGAN OLAP

a. User (Pengguna)
d. Design DB (Desain Database)
Dalam OLTP, penggunanya adalah user, sedangkan
Desain dalam OLTP bersifat Entity Relational atau databasenya dinormalisasi dulu sebelum digunakan.
OLAP penggunanya adalah Knowledge worker Untuk OLAP desain databasenya di de-normalisasi.

b. Data e. Ukuran Database

Ukuran database untuk OLTP sekitar MB-GB, sedangkan OLAP bisa sampai GB-TB
Dalam OLTP datanya adalah data transaksi rutin
sedangkan OLAP datanya adalah sekarang dan data f. Penggunaan
yang lalu berguna untuk melakukan analisis ke
OLTP digunakan setiap saat, sedangkan OLAP digunakan seperlunya saja.
depan.

c. Function (Fungsi)

OLTP digunakan sehari-hari untuk proses bisnis


seperti toko atau swalayan, sedangkan OLAP
digunakan untuk pengambilan keputusan.
g. Unit Pekerjaan

OLTP pekerjaannya hanya sederhana misalnya transaksi dalam swalayan. Untuk OLAP query untuk menampilkan data sangat kompleks

h. Jumlah rekaman yang di akses

OLTP sekitar ratusan sampai ribuan, tapi jika OLAP data yang diakses bisa sampai jutaan bahkan milyaran.

j. Jumlah Pengguna

Untuk OLTP penggunanya adalah puluhan, tapi kalau OLAP penggunanya bisa sampai ratusan bahkan ribuan
Tugas 1

Carilah 5 contoh masing-masing OLTP dan OLAP


DATAWAREHOUSE CONCEPT

Pertemuan 2
Definisi

Ralph Kimbali

Data warehouse adalah suatu sistem yang mengekstrak, melakukan pembersihan, menyesuaikan diri serta mengirimkan sumber data pada suatu data
penyimpanan dimensional dan selanjutnya memberi dukungan pada implementasi query serta analisa dalam rangka pengambilan keputusan.

Bill Inmon (1996)

Data warehouse merupakan dasar dari proses pengambilan keputusan. Bill Inmon disebut-sebut sebagai Bapak Data Warehouse.

Malik, Shadan (2005)

Data warehouse merupakan tempat penyimpanan data historikal yang diorganisasikan berdasarkan pada subyek untuk pengambilan keputusan pada organisasi.

* Sebuah kumpulan database yang terintegrasi, didesain untuk menyediakan informasi untuk decision making

* Ide dasar dari data warehouse adalah untuk mengumpulkan berbagai macam data yang ada pada dan dihasilkan oleh suatu institusi, lalu
mentransformasi seluruh data yang ada untuk kepentingan penyajian informasi strategis bagi institusi.
Karakteristik Data Warehouse

A. Subject Oriented (Berorientasi Subjek). Didesain untuk menganalisis data berdasarkan subjek-subjek tertentu sehingga hanya data yang benar-benar
diperlukan. Data warehouse diorganisasikan disekitar subjek-subjek utama dari perusahaan(customers,products dan sales) dan tidak diorganisasikan pada area-
area aplikasi utama(customer invoicing,stock control dan product sales).

B. Integrated (Integrasi). Menyimpan data-data yang berasal dari sumber-sumber yang terpisah ke dalam suatu format yang konsisten dan saling terintegrasi
satu sama lain

C. Time Variant (Rentang Waktu). Data akurat dan valid pada titik waktu tertentu atau dalam interval waktu tertentu.

D. Non Volatile. Tidak di-update secara real time, tetapi di-refresh dari sistem operasional secara reguler.

Data yang baru selalu ditambahkan sebagai suplemen bagi database itu sendiri dari pada sebagai sebuah perubahan. Database tersebut secara kontinyu
menyerap data baru ini, kemudian secara incremental disatukan dengan data sebelumnya.
Istilah-istilah yang berhubungan dengan data warehouse

A. Data Mart

Adalah suatu bagian pada data warehouse yang mendukung pembuatan laporan dan analisa data pada suatu unit, bagian atau operasi pada suatu perusahaan. .
Data mart adalah bagian dari data warehouse. Data mart biasanya dibuat pada tiap departemen pada perusahaan tersebut. Tujuan dari pembuatan data mart
adalah supaya karyawan atau staff yang terkait pada suatu departemen tertentu dapat mengakses data yang diperlukan dengan cepat tanpa harus melakukan
query pada database utama sehingga dapat mengurangi beban server utama.
B. On-Line Analytical Processing(OLAP)

Merupakan suatu pemrosesan database yang menggunakan tabel fakta dan dimensi untuk dapat menampilkan berbagai macam bentuk laporan, analisis, query
dari data yang berukuran besar
C. On-Line Transaction Processing(OLTP)

Merupakan suatu pemrosesan yang menyimpan data mengenai kegiatan operasional transaksi sehari-hari.

D. Dimension Table

Tabel yang berisikan kategori dengan ringkasan data detail yang dapat dilaporkan. Seperti laporan laba pada tabel fakta dapat dilaporkan sebagai dimensi
waktu(yang berupa perbulan, perkwartal dan pertahun).

E.Fact Table

Merupakan tabel yang umumnya mengandung angka dan data history dimana key (kunci) yang dihasilkan sangat unik, karena key tersebut terdiri dari foreign
key(kunci asing) yang merupakan primary key (kunci utama) dari beberapa dimension table yang berhubungan.
Tugas Datawarehouse

Pembuatan laporan

Pembuatan laporan merupakan salah satu kegunaan data warehouse yang paling umum dilakukan. Dengan menggunakan query sederhana didapatkan laporan
perhari,perbulan, pertahun atau jangka waktu kapanpun yang diinginkan.

On-Line Analytical Processing (OLAP)

Dengan adanya data warehouse,semua informasi baik detail maupun hasil summary yang dibutuhkan dalam proses analisa mudah didapat.

OLAP mendayagunakan konsep data multi dimensi dan memungkinkan para pemakai menganalisa data sampai mendetail, tanpa mengetikkan satupun
perintah SQL karena adanya fasilitas rool-up dan drill-down. Drill-down adalah kemampuan untuk melihat detail dari suatu informasi dan roll-up adalah
kebalikannya.

Data mining

Data mining merupakan proses untuk menggali(mining) pengetahuan dan informasi baru dari data yang berjumlah banyak pada data warehouse

Proses informasi executive

Dengan menggunakan data warehouse segala laporan telah diringkas dan dapat pula mengetahui segala rinciannya secara lengkap, sehingga mempermudah
proses pengambilan keputusan.
Definisi

ETL adalah sekumpulan proses yang harus dilalui dalam


pembentukan data warehouse.
TUJUAN ETL

mengumpulkan, menyaring, mengolah dan


menggabungkan datadata yang relevan dari
berbagai sumber untuk disimpan ke
dalam data warehouse.

Terdapat 3 proses dari ETL:


extracting, transforming, loading
1. Extract

Extract adalah proses memilih dan mengambil


data dari satu atau beberapa sumber dan
membaca/mengakses data yang dipilih
tersebut. Proses ini dapat menggunakan query,
atau aplikasi ETL
2. Transform

Pada Proses ini data yang telah


diambil pada proses extract akan
dibersihkan dan mengubah data
dari bentuk asli menjadi bentuk
yang sesuai dengan kebutuhan
data warehouse.
3. Load

Load adalah proses terakhir yang berfungsi untuk


memasukkan data ke dalam target akhir, yaitu ke
dalam data warehouse. Cara untuk memasukkan
data adalah dengan menjalankan SQL script
secara periodik.
ETL Tools yang berbayar:

 IBM Infosphere DataStage

 Informatica PowerCenter

 Oracle Warehouse Builder (OWB)

 Oracle Data Integrator (ODI)

 SAS ETL Studio

 Business Objects Data Integrator(BODI)

 Microsoft SQL Server Integration Services(SSIS)

 Ab Initio
ETL tools yang gratis (open source):

 Pentaho Data Integration (Kettle)

 Talend Integrator Suite

 CloverETL

 Jasper ETL
Kelebihan model skema bintang:

 Cenderung mudah dipahami karena modelnya yang lebih sederhana

 Memudahkan mencari isi karena kesederhanaannya dengan cara melihat step by step dari masing-masing dimensinya

 Proses query lebih cepat pada saat proses OLAP

Kekurangan model skema bintang:

 Ukuran data lebih besar karena ada data yang disimpan ulang

 Maintenance dan update lebih sulit


Kelebihan model skemasnowflake:

 Ukuran data lebih kecil di dalam tempat penyimpanan

 Lebih mudah dilakukan maintenance dan update

 Proses query lebih cepat pada saat proses ETL

Kekurangan model skemasnowflake:

 Cenderung lebih sulit dipahami karena kompleksitasnya

 Sulit mencari data yang dibutuhkan karena melihat strukturnya yang kompleks dan bercabang-cabang
Skema Apa yang harus Dipilih?

Penerapan skema bintang

Penerapan skema bintang adalah pada data mart suatu perusahaanPenerapan skema snowflake

Penerapan skema snowflake

Penerapan skema snowflake dalam data warehouse suatu perusahaan dapat menghemat ruang penyimpanan yang dibutuhkan.
Persamaan dan Perbedaan antara star dan snowflake

Persamaan Star dengan Snowflake

A. Skema snowflake juga menyimpan data yang sama seperti pada skema bintang.

B. Tabel fakta yang digunakan pada skema bintang maupun pada skema snowflake berisi field-field yang sama.

Perbedaan Star dengan Snowflake

A. Semua tabel dimensi pada skema snowflake telah dinormalisasi. Proses normalisasi tabel-tabel dimensi pada skema snowflake ini disebut dengan
proses snowflaking,sehingga tampilan tabel-tabel pada skema snowflake bentuknya menyerupai snowflake. Sebaliknya pada skema star belum dinormalisasi.

B. Skema snowflake memiliki kompleksitas query yang lebih kompleks dibandingkan dengan skema bintang.
Pada skema ini terdapat beberapa tabel fakta yang menggunakan satu atau beberapa tabel dimensi secara bersama-
sama sehingga jika digambarkan akanterlihat seperti sekumpulan bintang. Schema yang memiliki dua atau lebih tabel
fakta yang terhubung dengan banyak dimensi

Anda mungkin juga menyukai