2011-2-00973-SI Bab2001

BAB 2
LANDASAN TEORI
2.1
Teori Umum
2.1.1 Definisi Database
Menurut Connolly dan Begg (2010, p65), Database adalah
kumpulan data yang berhubungan satu dengan yang lainnya dan
digunakan secara bersama-sama, dan sekumpulan data didesain guna
memenuhi informasi suatu perusahaan.
Menurut W.H. Inmon (2005, p493), Database adalah sebuah
koleksi data yang saling berelasi pada data yang telah disimpan (sering
dikendalikan dengan redudansi yang terbatas) berdasarkan skema yang
ada. Database bisa digunakan sebagai aplikasi tunggal maupun ganda.
2.1.2 Definisi OLTP (Online Transaction Processing)
Menurut W.H. Inmon (2005, p500), OLTP adalah lingkungan
pemrosesan transaksi performance tingkat tinggi. OLTP (Online
Transaction Processing) menggambarkan kebutuhan sistem dalam
ruang lingkup operasional dan merupakan proses yang mendukung
operasi bisnis sehari-hari.
OLTP dirancang untuk memungkinkan terjadinya pengaksesan
secara bersamaan oleh beberapa user terhadap sumber data yang sama
dan mengatur proses yang diperlukan.Sesuai dengan namanya,OLTP
mengijinkan transaksi untuk mengakses langsung ke database. Transaksi

yang dilakukan termasuk operasi insert, update, dan delete. Database
OLTP biasanya bersifat relasional dan dalam bentuk normal ketiga, serta
yang terpenting, database OLTP dibangun untuk mampu menangani
banyak transaksi dengan performa tinggi.
2.1.3 Definisi DBMS (Database Management System)
Menurut Connolly dan Begg (2010, p66), Database management
system adalah sistem perangkat lunak yang dapat memungkinkan user
untuk mendefinisikan, membuat, dan mengontrol akses ke database.
Menurut Inmon (2005, p494), Database management system
merupakan
komputer
berbasis
sistem
perangkat
lunak
untuk
membangun dan merancang data.

2.1.4 Definisi Data Mining
Menurut Connolly dan Begg (2010, p180), Data mining
merupakan proses pemindahan yang sesuai serta yang belum diketahui
sebelumnya, dapat dipahami, dan pertambangan informasi yang
bermanfaat dari database besar dan menggunakannya untuk membuat
keputusan bisnis yang penting.
Menurut Mandala (2011, p5), Data mining adalah proses
mencari dan menggali hubungan antar data yang bergunabagi
penggunanya.
Menurut Inmon (2005, p494), Data mining merupakan proses

menganalisis data dalam jumlah besar untuk mencari yang belum
ditemukan sebelumnya pada pola bisnis tertentu.
2.1.5 Definisi Data Warehouse
Menurut Connolly dan Begg (2010, p1197), Data warehouse
adalah kumpulan data yang berorientasi subjek, terintegrasi, timevariant, dan non-volatile, yang mendukung proses pengambilan
keputusan dalam manajemen.
Menurut Inmon (2005, p1151), Data warehouse adalah sebuah
koleksi yang saling terintegrasi, database yang berorientasi subjek lalu
dirancang untuk mendukung fungsi DSS, dimana setiap unit data yang
relevan untuk beberapa saat dalam waktu tertentu.
Menurut McLeod dan Schell (2006, p205), data warehouse
adalah perkembangan dari konsep database yang menyediakan suatu
sumber data yang lebih baik bagi para pemakai dan memungkinkan
pemakai untuk memanipulasi dan menggunakan data tersebut secara
intuitif. Data warehouse berukuran sangat besar, kualitas datanya tinggi,
dan sangat mudah diambil datanya.
Menurut O'Brien (2010, p703), data warehouse adalah
kumpulan terpadu dari data yang diambil dari database operasional,
historis, dan eksternal, yang dibersihkan, diubah, dan dikatalogkan
untuk penelusuran dan analisis untuk menyediakan kecerdasan bisnis
bagi pengambilan keputusan bisnis.
10
2.1.6 Karakteristik Data Warehouse

Menurut
Inmon
(2005,
p29),
Karakteristik
dalam
data
warehouse adalah sebagai berikut :

2.1.6.1Subject Oriented (Berorientasi Subjek)
Data warehouse bersifat subject oriented artinya data
warehouse digunakan untuk memanfaatkan data yang sudah ada
untuk dianalisa berbasis subjek-subjek tertentu dalam organisasi,
dan tidak berorientasi pada aplikasi-aplikasi tertentu.
Data warehouse diorganisasikan disekitar subjek-subjek
utama dari perusahaan (customer, products, dan sales) dan tidak
diorganisasikan
pada
area-area
aplikasi
utama
(customer
invoicing, stock control, dan product sales). Hal ini dikarenakan

kebutuhan dari data warehouse untuk menyimpan data-data yang
bersifat sebagai penunjang suatu keputusan, daripada aplikasi
yang berorientasi terhadap data.
2.1.6.2Integrated (Terintegrasi)
Data warehouse dapat menyimpan data-data yang berasal
dari sumber-sumber yang terpisah kedalam suatu format yang
konsisten dan saling terintegrasi satu dengan yang lainnya.
Dengan demikian data tidak bisa dipecah-pecah karena data yang
sudah ada merupakan suatu kesatuan yang dapat menunjang
keseluruhan konsep data warehouse itu sendiri.
11
Integrasi sumber data dapat dipenuhi dengan berbagai cara

sepeti konsisten dalam penamaan variable, konsisten dalam
ukuran variable, konsisten dalam struktur pengkodean dan
konsisten dalam atribut fisik dari data.
Contoh pada lingkungan operasional terdapat berbagai
macam aplikasi yang mungkin pula dibuat oleh developer yang
berbeda. Oleh karena itu, mungkin dalam aplikasi-aplikasi
tersebut ada variabel yang memiliki maksud yang sama tetapi
nama dan formatnya berbeda. Variabel tersebut harus dikonversi
menjadi nama yang sama dan format yang disepakati bersama.
Dengan demikian tidak ada lagi kerancuan karena perbedaan
nama, format dan lain sebagainya. Barulah data tersebut bisa
dikategorikan
sebagai
data
yang
terintegrasi
kekonsistenannya.
Gambar 2.1 Integrasi Data Warehouse

(Sumber : Inmon, 2005, p31)
karena
12
2.1.6.3Time-Variant (Rentang Waktu)

Seluruh data pada data warehouse dapat dikatakan akurat
atau valid pada rentang waktu tertentu. Untuk melihat interval
waktu yang digunakan dalam mengukur keakuratan suatu data
warehouse, kita dapat menggunakan cara antara lain :
Cara yang paling sederhana adalah menyajikan data
warehouse pada rentang waktu tertentu, misalnya antara 5
sampai 10 tahun ke depan.
Cara yang kedua, dengan menggunakan variasi/perbedaan
waktu yang disajikan dalam data warehouse baik implicit
maupun explicit secara explicit dengan unsur waktu dalam
hari, minggu, bulan, dan sebagainya. Secara implicit misalnya
pada saat data tersebut diduplikasi pada setiap akhir bulan,
atau per tiga bulan. Unsur waktu akan tetap ada secara
implicit didalam data tersebut.
Cara yang ketiga, variasi waktu yang disajikan data
warehouse melalui serangkaian snapshot yang panjang.
Snapshot merupakan tampilan dari sebagian data tertentu
sesuai keinginan pemakai dari keseluruhan data yang ada
bersifat read-only.
2.1.6.4Non-Volatile
Karakteristik keempat dari data warehouse adalah nonvolatile, maksudnya data pada data warehouse tidak di-update
13
secara real time tetapi di refresh dari sistem operasional secara

reguler. Data yang baru selalu ditambahkan sebagai suplemen
bagi database itu sendiri dari pada sebagai sebuah perubahan.
Database tersebut secara berlanjut menyerap data baru ini,
kemudian secara incremental disatukan dengan data sebelumnya.
Berbeda dengan database operasional yang dapat
melakukan update, insert dan delete terhadap data yang
mengubah isi dari database sedangkan pada data warehouse
hanya ada dua kegiatan memanipulasi data yaitu loading data
(mengambil data) dan access data (mengakses data warehouse
seperti melakukan query atau menampilan laporan yang
dibutuhkan, tidak ada kegiatan updating data).
Gambar 2.2 Non VolatileData Warehouse

2.1.7 Perbandingan Data Warehouse Dengan OLTP

Menurut Connoly dan Begg (2010, p1199), biasanya sebuah
organisasi mempunyai beberapa system Online Transaction Processing
14
(OLTP) yang berbeda untuk setiap proses bisnis, seperti pengawasan

persediaan (inventory control), pesanan pelanggan (invoicing customer),
dan tingkat penjualan. Sistem ini menghasilkan data operasional yang
detil, terbaru, dan selalu berubah. Sistem OLTP optimal jika digunakan
untuk sejumlah transaksi yang dapat diramalkan, berulang, dan sering
diperbaharui. Data OLTP diorganisasikan berdasarkan syarat-syarat dari
transaksi dihubungkan dengan aplikasi bisnis dan mendukung keputusan
per hari dalam sejumlah besar operasional user yang konkruen.
Umumnya organisasi hanya mempunyai satu data warehouse
yang menyimpan data secara historis, detil, dan ringkasan dengan
beberapa tingkatan dan sangat jarang berubah. Data warehouse didesain
untuk mendukung transaksiyang tidak dapat diramalkan (unpredictable)
dan memerlukan jawaban untuk query khusus (adhoc), tidak terstruktur,
dan heuristic. Data warehouse diorganisasikan berdasarkan pada syaratsyarat query yang potensial dan mendukung keputusan strategis jangka
panjang dari sejumlah kecil user tingkat manajerial.
Dibawah ini adalah table perbandingan antara system OLTP
dengan system data warehouse:
15
Tabel 2.1 Perbandingan antara sistem OLTP dan sistem Data

Warehouse(Sumber : Connolly dan Begg, 2010, p1199)
OLTP System
Data Warehouse
Characteristic
Tujuan
Mendukung proses
Mendukung proses
utama
operasional
analisis
Data lampau sampai
Umur data
Sekarang
yang sekarang
Data latency
Waktu yang sedang
Tergantung pada
berjalan
panjang siklus
Data yang detail, ringan,
Data
Data yang detail
ringkas
granularity
Proses data
Pola prediksi dari data

Kurangnya pola prediksi
dimasukkan, dihapus,
dari data query
diupdate, dan di query
Laporan
Pengguna
Dapat di prediksi suatu
Tidak bisa di prediksi,
dimensi, relatif, laporan
multi dimensional,
sudah tetap
laporan yang dinamis
Melayani sejumlah besar
Melayani sebagian
pengguna operasional
pengguna manajerial
2.1.8 Definisi Data Mart

Menurut Inmon (2005, p494), Data mart adalah sebuah struktur
data yang terbagi-bagi yang diperoleh dari data warehouse di mana data
16
tersebut telah didenormalisasi berdasarkan kebutuhan informasi

manajemen.
Menurut Connolly dan Begg (2010, p1214), Data mart adalah
bagian dari data warehouse yang mendukung kebutuhan informasi dari
departemen tertentu atau fungsi bisnis dalam perusahaan.
2.1.9 Keuntungan dan Kegunaan Data Warehouse
Menurut Connolly dan Begg (2010, p1198), data warehouse
yang telah diimplementasikan dengan baik dapat membawa keuntungan
besar bagi perusahaan antara lain :
1. Pengembalian yang besar dari investasi yang ada.
2. Keuntungan kompetitif.
3. Meningkatkan produktivitas para pembuat keputusan.
2.1.10 Bentuk Data Warehouse
Bentuk dari data warehouse yaitu :
2.1.10.1 Functional Data Warehouse (Data Warehouse Fungsional)
Kata operasional disini merupakan database yang
diperoleh dari kegiatan sehari-hari. Data warehouse dibuat
lebih dari satu dan dikelompokkan berdasar fungsi-fungsi yang
ada di dalam perusahaan seperti fungsi keuangan (financial),
marketing, personalia, dan lain-lain.
Keuntungan dari bentuk data warehouse seperti ini
adalah, sistem mudah dibangun dengan biaya relatif murah
17
sedangkan kerugiannya adalah resiko kehilangan konsistensi

data dan terbatasnya kemampuan dalam pengumpulan data
bagi pengguna.
Gambar 2.3 Bentuk Data Warehouse Fungsional

(Sumber :
http://t3.gstatic.com/images?q=tbn:ANd9GcQ39Qp6XIF2IM1mx5c13SnkSQ
o_6sgBNHtgVo2ywUMuJREYif8i)
2.1.10.2 Centralized Data Warehouse (Data Warehouse Terpusat)

Bentuk ini terlihat seperti bentuk data warehouse
fungsional, namun terlebih dahulu sumber data dikumpulkan
dalam satu tempat terpusat, kemudian data disebar ke dalam
fungsinya masing-masing, sesuai kebutuhan perusahaan. Data
warehouse terpusat ini, biasa digunakan oleh perusahaan yang
belum memiliki jaringan eksternal.
Keuntungan :
o Benar-benar terpadu karena konsistensinya yang tinggi.
Kerugiannya :
o Biaya yang mahal serta memerlukan waktu yang lama
untuk membangunnya.
18
Gambar 2.4 Bentuk Data Warehouse Terpusat

(Sumber :
http://t3.gstatic.com/images?q=tbn:ANd9GcRK1QVqqF_McYTc
vyF9qhsIUJ3BlFSgWrIgoeYa4PJmOTgbXY5A)
2.1.10.3Distributed Data Warehouse (Data Warehouse Terdistribusi)

Pada data warehouse terdistribusi ini, digunakan gateway
yang berfungsi sebagai jembatan penghubung antara data
warehouse dengan workstation yang menggunakan sistem
beraneka ragam. Dengan sistem terdistribusi seperti ini
memungkinkan perusahaan dapat mengakses sumber data yang
berada diluar lokasi perusahaan (eksternal).
Keuntungannya adalah data tetap konsisten karena
sebelum data digunakan data terlebih dahulu di sesuaikan atau
mengalami proses sinkronisasi. Sedangkan kerugiannya adalah
lebih kompleks untuk diterapkan karena sistem operasi dikelola
secara terpisah juga biayanya yang paling mahal dibandingkan
dua bentuk data warehouse lainnya.
19
Gambar 2.5 Bentuk Data WarehouseTerdistribusi

(Sumber : http://t3.gstatic.com/images?q=tbn:ANd9GcTkmol4syO71YpHIyIXc0gJ57SFZi7MIhg2_LjhjDddMHjlx_0zw)
2.1.11 Arsitekur Data Warehouse

Tipe arsitektur dari data warehouse menurut Connolly dan Begg
(2010, p1203) :
2.1.11.1 Operasional Data
Sumber data dari data warehouse diambil dari :
Mainframe operasional data dipegang oleh hierarki generasi
pertama dan jaringan database.
Data departemental dipegang penuh oleh file system seperti
VSAM, RMS, dan DBMS yang berelasi seperti Informix
dan Oracle.
Data pribadi dipegang oleh workstations dan server pribadi.
20
Sistem eksternal seperti Internet, database yang tersedia

bersifat komersil, atau asosiasi data dengan organisasi
penyedia atau konsumen.
2.1.11.2Penyimpanan Data Operasional
Sebuah data store operasional (ODS) adalah operasional
repository data saat ini dan data terintegrasi yang digunakan
untuk analisis. ODS sering dibuat ketika sistem operasional
warisan dirasa tidak mampu mendapatkan laporan yang
dibutuhkan.
Membangun ODS dapat membantu langkah membantu
membangun data warehouse, karena sebuah ODS dapat mensupply data yang telah di pindah dari sumber sistem dan
dibersihkan.
2.1.11.3 Manajer ETL
Manajer ETL melakukan semua operasi yang ter-asosiasi
dengan ETL dari data ke warehouse.
2.1.11.4 Warehouse Manager
Manajer warehouse melakukan semua operasi yang terasosiasi dengan manajemen dari data dalam warehouse.
Operasi yang dijalankan oleh manajer warehouse adalah :
Analisis data untuk memastikan konsistensi.
21
Transformasi
dan
penggabungan
sumber
data
dari
penyimpanan sementara ke tabel data warehouse.

Pembuatan index dan tampilan dasar dari tabel.
Generasi dari denormalisasi (jika perlu).
Generasi dari aplikasi.
Back up pengarsipan data.
2.1.11.5 Manajer Query
Manajer query melakukan semua operasi yang ter-asosiasi
dengan manajemen dari pengguna query. Kerumitan dari
manajer query ditentukan penyedia fasilitas oleh end-user
access tools dan database.
2.1.11.6 Detil data
Area dari penyimpanan data warehouse semua detil data
dalam skema database.
2.1.11.7 Lightly and Highly Summarized Data
Area penyimpanan warehouse ini semua yang telah
ditetapkan menghasilkan lightly and highly summarized data
oleh manajer warehouse.
Tujuan dari ringkasan informasi
untuk mempercepat performa query. Ringkasan data di update

ketika data baru dimasukan ke warehouse.
22
2.1.11.8 Arsip / Back Up Data

Area penyimpanan warehouse ini di detilkan dan data
yang diringkas untuk proses pengarsipan dan back up.
2.1.11.9 Metadata
Dalam data warehouse, metadata digunakan sebagai
tempat penyimpanan semua definisi metadata (keterangan
mengenai data) yang digunakan di seluruh proses data
warehouse. Metadata bertujuan untuk :
1. Proses extracting dan loading
Melakukan pemetaan sumber data pada data warehouse.
2. Proses warehouse management
Mengotomatiskan produksi pada tabel-tabel produksi.
3. Sebagian proses query management
Mengarahkan permintaan ke sumber data yang tepat.
2.1.11.10 End-user Access Tools (EUAT)
Prinsip atau tujuan utama dari dibangunnya data
warehouse adalah untuk menyediakan informasi bisnis
kepada user-user untuk dapat melakukan pengambilan
keputusan secara cepat dan tepat. User ini berinteraksi
dengan warehouse melalui end-user access tools. Data
warehouse harus secara efisien mendukung secara khusus
kebutuhan user serta secara rutin melakukan analisis.
23
Performa yang baik dapat dicapai dengan merencanakan

dahulu
keperluan-keperluan
untuk
melakukan
joins,
summations dan laporan-laporan per-periode dengan endusers. End-user access tools dikelompokkan menjadi 5
golongan:
2.1.11.10.1 Reporting dan Query Tools
Reporting tools meliputi production
reporting
tools dan report writers. Production repoting tools

digunakan untuk menghasilkan laporan operasional
biasa, sedangkan report writer adalah desktop tools
yang dirancang untuk end user.
Query tools untuk data warehouse relasional
dirancang untuk menerima SQL atau menghasilkan
pernyataan SQL untuk query data yang disimpan dalam
data warehouse.
2.1.11.10.2 Application Development Tools
Aplikasi
yang
dapat
digunakan
user
yaitu
graphical data access yang dirancang untuk sisi client

server.
Beberapa
application
development
tools
terintegrasi dengan OLAP tools dan dapat mengakses

semua sistem basis data utama, mencakup Oracle,
Sybase dan Infomix.
24
2.1.11.10.3 Executive Information System (EIS) Tools

Executive Information System (EIS) tools semula
dikembangkan
untuk
mendukung
pengambilan
keputusan tingkat tinggi kemudian meluas untuk

mendukung semua tingkat manajemen. EIS tools yang
terisolasi
dengan
mainframe
memungkinkan
user
membuat aplikasi pendukung pengambilan keputusan

untuk menyediakan overview data dan mengakses
sumber data eksternal. Saat ini perbedaan antara EIS dan
decision support tools lainnya semakin tidak jelas, sejak
EIS menyediakan aplikasi custom build untuk area bisnis
seperti penjualan, marketing, dan keuangan.
2.1.11.10.4 Online Analysis Processing (OLAP) Tools
Online
Analytical
Processing
(OLAP)
tools
berbasis pada konsep database multidimensional dan

memungkinkan pengguna untuk menganalisis data
menggunakan
view
yang
kompleks
dan
multidimensional. Tools ini mengasumsikan data diatur

dalam model multidimensi yang didukung spesial
multidimensional database (MDDB) atau basis data
relasional yang dirancang untuk mendapatkan multi
dimensional query.
25
2.1.11.10.5 Data Mining Tools

Data mining adalah proses menemukan korelasi,
pola dan arah baru yang berarti menambang sejumlah
besar data dengan menggunakan teknik statistik,
matematika dan artificial intelligence. Data mining
berpotensi mengganti kemampuan dari OLAP tools.
Arsitektur
dan
komponen
utama
dari
data
warehouse dapat dilihat padagambar berikut ini :
Gambar 2.6 Arsitektur dan Komponen Utama

Data Warehouse
(Connolly dan Begg, 2010, p1204)
2.1.12 Struktur Data Warehouse

Seperti yang kita lihat sebelumnya pada arsitektur data
warehouse, ada beberapa struktur yang spesifik terdapat pada bagian
26
warehouse manager. Bagian tersebut merupakan struktur data

warehouse.
Menurut Inmon (2005, p33) data mengalir dari lingkungan
operasional ke dalam lingkungan data warehouse dimana data
mengalami transformasi dari tingkatan opersional ke tingkatan data
warehouse. Pada perumusan data dapat dilihat digambar, data
disampaikan dari current detail ke older detail. Setelah data diringkas,
data tersebut disampaikan dari current detail ke lightly summarized
data, kemudian dari lightly summarized data ke highly summarized data.
Komponen dari struktur data warehouse adalah:
Gambar 2.7 Struktur Data Warehouse

2.1.12.1Current Detail Data

Current detail data merupakan data detil yang aktif saat
ini, mencerminkan keadaan yang sedang berjalan dan
27
merupakan level terendah dalam datawarehouse. Didalam area

ini warehouse menyimpan seluruh detil data yang terdapat pada
skema basis data. Jumlah data sangat besar sehingga
memerlukan storage yang besar pula dan dapat diakses secara
cepat. Dampak negatif yang ditimbulkan adalah kerumitan
untuk mengatur data menjadi meningkat dan biaya yang
diperlukan menjadi mahal. Berikut ini beberapa alasan
mengapa current detail data menjadi perhatian utama :
1. Menggambarkan kejadian yang baru terjadi dan selalu
menjadi perhatian utama.
2. Sangat banyak jumlahnya dan disimpan pada tingkat
penyimpanan terendah.
3. Hampir selalu disimpan dalam storage karena cepat di
akses tetapi mahal dan kompleks dalam pengaturannya.
4. Bisa digunakan dalam membuat rekapitulasi sehingga
current detail data harus akurat.
2.1.12.2 Older Detail Data
Data ini merupakan data historis dari current detail data,
dapat berupa hasil cadangan atau archive data yang disimpan
dalam storage terpisah. Karena bersifat back-up (cadangan),
maka biasanya data disimpan dalam storage alternatif seperti
tape-desk. Data ini biasanya memilki tingkat frekuensi akses
yang rendah. Penyusunan file atau directory dari data ini
28
disusun
berdasarkan
umur
dari
data
yang
bertujuan
mempermudah untuk pencarian atau pengaksesan kembali.

2.1.12.3 Lightly Summarized Data
Data ini merupakan ringkasan atau rangkuman dari
current detail data. Data ini dirangkum berdasar periode atau
dimensi lainnya sesuai dengan kebutuhan. Ringkasan dari
current detail data belum bersifat total summary. Data-data ini
memiliki detil tingkatan yang lebih tinggi dan mendukung
kebutuhan warehouse pada tingkat departemen. Tingkatan data
ini di sebut juga dengan data mart. Akses terhadap data jenis
ini banyak digunakan untuk view suatu kondisi yang sedang
atau sudah berjalan.
2.1.12.4 Highly Summarized Data
Data ini merupakan tingkat lanjutan dari Lightly
summarized data, merupakan hasil ringkasan yang bersifat
totalitas, dapat di akses misal untuk melakukan analisis
perbandingan data berdasarkan urutan waktu tertentu dan
analisis menggunakan data multidimensi.
2.1.12.5 Metadata
Metadata bukan merupakan data hasil kegiatan seperti
keempat jenis data diatas. Metadata berisikan data yang
menyimpan proses perpindahan data meliputi database
29
structure, contents, detail data dan summary data, matrics,

versioning, aging criteria, versioning, transformation criteria.
Metadata khusus dan memegang peranan yang sangat penting
dalam data warehouse.
Metadata sendiri mengandung :
2.1.12.5.1 Struktur Data
Sebuah direktori yang membantu user untuk
melakukan analisis Decission Support System dalam
pencarian letak/lokasi dalam data warehouse.
2.1.12.5.2 Algoritma
Algoritma
digunakan
untuk
summary
data.
Metadata sendiri merupakan panduan untuk algoritma

dalam melakukan pemrosesan summary data antara
current detail data dengan lightly summarized data dan
antara
lightly
summarized
data
dengan
highly
summaried data.
2.1.12.5.3 Mapping
Sebagai panduan pemetaan (mapping) data pada
saat data di transform/diubah dari lingkup operasional
menjadi lingkup data warehouse.
30
2.1.13 ETL (Extraction, Transformation, Loading)

Menurut Inmon (2005, p497), ETL adalah proses melakukan
pencarian data, mengintegrasikan dan menempatkan data ke dalam
sebuah data warehouse.
Menurut Connolly dan Begg (2010, p1208), ETL adalah
kumpulan proses menyiapkan data dari operational source untuk data
warehouse. Proses ini terdiri dari extracting, transforming, loading dan
beberapa proses yang dilakukan sebelum publikasikan ke data
warehouse.
Proses ETL ini terdiri dari 3 tahap,yaitu:
2.1.13.1Extraction
Langkah pertama dari proses ETL adalah proses
penarikan data dari satu atau lebih sistem operasional sebagai
sumber data (misalnya diambil dari sistem OLTP). Kebanyakan
proyek data warehouse menggabungkan data dari sumbersumber yang berbeda. Proses ektraksi ini merupakan proses
penguraian dan pembersihan data yang diekstrak untuk
mendapatkan pola atau struktur data yang diinginkan.
2.1.13.2 Transformation
Data transformation merupakan proses terpenting yang
ada di dalam perancangan data warehouse. Data transformation
adalah suatu proses perpindahan data operasional ke dalam
31
suatu media pusat pengumpulan data yang akan digunakan

sebagai pembangunan data warehouse.
Dalam melakukan data transformasi ini, sumber data
diambil dari database yang ada, kemudian di-transform
menggunakan fasilitas DTS ( Data Transformation Service )
dalam Microsoft SQL Server.
2.1.13.3 Loading
Merupakan tahap akhir dalam proses ETL, yaitu proses
memasukkan data kedalam target akhir, dalam hal ini adalah
data warehouse. Data berasal dari proses transformasi. Setelah
data yang dihasilkan dari proses transformasi sesuai dengan
kondisi yang diinginkan di data warehouse maka proses
loading akan berjalan. Data dari staging area akan dipindahkan
ke dalam data warehouse.
Gambar 2.8 Proses ETL

(Sumber :
http://t2.gstatic.com/images?=q=tbn:ANNd9GcTT55rjroeAQainRbK5
QOk2GUL7OCkc30G7SZ5QCbsEHOHavvwae_w)
32
2.1.14 Metodologi Perancangan Database Untuk Data Warehouse

Menurut Ralph Kimball yang dipaparkan kembali dalam buku
Connolly dan Begg, 2010, p1231-1236, ada enam tahap metodologi
dalam perancangan database untuk data warehouse, yaitu :
Langkah 1 : Pemilihan proses
Data mart yang pertama kali dibangun haruslah data mart yang
dapat dikirim tepat waktu dan dapat menjawab semua pertanyaan
bisnis yang penting.
Pilihan terbaik untuk data mart yang pertama adalah yang
berhubungan dengan sales, misal property sales, property leasing,
property advertising.
Langkah 2 : Pemilihan sumber
Untuk
memutuskan
secara
pasti
apa
yang
diwakili
atau
direpresentasikan oleh sebuah tabel fakta.

Misalkan, jika sumber dari sebuah tabel fakta properti sale adalah
properti sale individual maka sumber dari sebuah dimensi pelanggan
berisi rincian pelanggan yang membeli properti utama.
Langkah 3 : Mengidentifikasi dimensi
Set dimensi yang dibangun dengan baik, memberikan kemudahan
untuk memahami dan menggunakan data mart.
Dimensi ini penting untuk menggambarkan fakta-fakta yang terdapat
pada tabel fakta.
33
Misalkan, setiap data pelanggan pada tabel dimensi pembeli

dilengkapi dengan id_pelanggan, no_pelanggan, tipe_pelanggan,
tempat_tinggal, dan lain sebagainya.
Jika ada dimensi yang muncul pada dua data mart, kedua data mart
tersebut harus berdimensi sama, atau paling tidak salah satunya
berupa subset matematis dari yang lainnya.
Jika sebuah dimensi digunakan pada dua data mart atau lebih, dan
dimensi ini tidak disinkronisasi, maka keseluruhan data warehouse
akan gagal, karena dua data mart tidak bisa digunakan secara
bersama-sama.
Langkah 4 : Pemilihan fakta
Sumber dari sebuah tabel fakta menentukan fakta mana yang bisa
digunakan dalam data mart.
Semua fakta harus diekspresikan pada tingkat yang telah ditentukan
oleh sumber.
Langkah 5 : Menyimpan pre-kalkulasi di tabel fakta
Hal ini terjadi apabila fakta kehilangan statement.
Langkah 6 : Melengkapi tabel dimensi
Pada tahap ini kita menambahkan keterangan selengkap-lengkapnya
pada tabel dimensi.
Keterangannya harus bersifat intuitif dan mudah dipahami oleh
pengguna.
34
2.1.15 Model Untuk Data Warehouse

Berikut di bawah ini adalah penjelasan dari model untuk data
warehouse :
2.1.15.1Model Dimensional
Model dimensional merupakan rancangan logikal yang
bertujuan untuk menampilkan data dalam bentuk standar dan
intuitif yang memperbolehkan akses dengan performa yang
tinggi.
Model
dimensional
menggunakan
konsep
model
hubungan antar entity (ER) dengan beberapa batasan yang

penting. Setiap model dimensi terdiri dari sebuah tabel dengan
sebuah komposit primary key, disebut dengan tabel fakta, dan
satu set tabel yang lebih kecil disebut tabel dimensi. Setiap
tabel dimensi memiliki sebuah simple primary key yang
merespon tepat pada satu komponen primary key pada tabel
fakta. Dengan kata lain primary key pada tabel fakta terdiri dari
dua atau lebih foreign key. Struktur karakteristik ini disebut
dengan skema bintang atau join bintang.
Fitur terpenting dalam model dimensional ini adalah
semua natural keys diganti dengan kunci pengganti (surrogate
keys). Maksudnya yaitu setiap kali join antar tabel fakta dengan
tabel dimensi selalu didasari kunci pengganti. Kegunaan dari
kunci pengganti adalah memperbolehkan data pada data
35
warehouse
untuk
memiliki
beberapa
kebebasan
dalam
penggunaan data, tidak seperti halnya yang diproduksi oleh

sistem OLTP.
Sebuah sistem OLTP memerlukan normalisasi untuk
mengurangi redudansi,validasi untuk input data, mendukung
volume yang besar dari transaksi yang bergerak sangat cepat.
Model OLTP sering terlihat seperti jaring laba-laba yang terdiri
atas ratusan bahkan ribuan tabel sehingga sulit untuk
dimengerti.
Sebaliknya, dimension model yang sering digunakan
pada data warehouse adalah skema bintang atau snowflake
yang mudah dimengerti dan sesuai dengan kebutuhan bisnis,
mendukung query sederhana dan menyediakan performa query
yang superior dengan meminimalisasi tabel-tabel join.
2.1.15.2Skema Bintang
Skema bintang merupakan struktuk logikal yang
memiliki tabel fakta yang terdiri atas data faktual ditengahnya,
dan dikelilingi oleh tabel-tabel dimensi yang berisi referensi
data.
36
Gambar 2.9 Contoh Skema Bintang

(Sumber : Connolly dan Begg, 2010, p1228)
Jenis-jenis Skema Bintang, yaitu :

a. Skema Bintang Sederhana
Dalam skema ini, setiap tabel harus memiliki
primary key yang terdiri dari satu kolom atau lebih.
Primary key dari tabel fakta terdiri dari satu atau
lebih foreign key. Foreign key merupakan primary key
pada tabel lain.
Gambar 2.10 Skema Bintang Sederhana

(Sumber : https://encryptedtbn1.google.com/images?q=tbn:ANd9GcRZXVFBN6hEvtSy6MnT
1laeNFkdpUucGwN0B3fnWylyCG3ylB2SUVuS6bw)
37
b. Skema bintang dengan banyak tabel fakta

Skema bintang juga bisa terdiri dari satu atau
lebih tabel fakta. Dikarenakan tabel fakta tersebut ada
banyak, misalnya disamping penjualan terdapat tabel
fakta forecasting dan result. Walaupun terdapat lebih
dari satu tabel fakta, mereka tetap menggunakan tabel
dimensi bersama-sama.
Gambar 2.11 Skema Bintang Dengan Banyak Tabel Fakta

(Sumber : https://encryptedtbn1.google.com/images?q=tbn:ANd9GcSYMDGurc65_QjTowVx7Zj
7KIqvvnxjXgYCJBZyhHe1iBvByWqSzvZs5uqQ)
38
Adapun ketentuan dalam pembacaan skema bintang

adalah
o
Bagian yang ada di bawah judul tabel merupakan

kolom-kolom tabel tersebut.
Primary key dan foreign key diberi kotak.
Primary key diarsir sedang foreign key yang bukan

primary tidak.
Foreign key yang berhubungan ditunjukkan dengan

garis yang menghubungkan tabel.
Kolom yang bukan kunci disebut kolom data pada
tabel fakta dan atribut pada tabel dimensi.

2.1.15.3 Snowflake Schema
Menurut Ponniah (2010,p238), keuntungan skema
snowflake adalah :
Memerlukan tempat penyimpanan yang lebih kecil.
Struktur yang normal akan lebih mudah untuk diperbaharui
dan dikelola.
Merupakan varian dari skema bintang dimana tabeltabel dimensi tidak terdapat data yang di denormalisasi.
Dengan kata lain satu atau lebih tabel dimensi tidak bergabung
secara langsung kepada tabel fakta tapi pada tabel dimensi
lainnya, seperti contoh dibawah ini :
39
Gambar 2.12Snowflake Schemes

(Sumber : Connolly dan Begg, 2010, p1229)
2.1.15.4 Star atau Snowflake

Keduanya
merupakan
model-model
dimensional,
perbedaannya terletak pada implementasi fisikal.Skema

snowflake memberi kemudahan pada perawatan dimensi,
dikarenakan strukturnya yang lebih normalisasi. Sedangkan
skema bintang lebih efisien serta sederhana dalam membuat
query dan mudah diakses secara langsung oleh pengguna.
Adapun
starflake
merupakan
gabungan
diantara
keduanya. Keuntungan menggunakan masing-masing model

tersebut dalam data warehouse antara lain :
Efisien dalam hal mengakses data.
Dapat beradaptasi terhadap kebutuhan-kebutuhan user.
Bersifat
fleksibel
khususnya
terhadap
perubahan
perkembangan.
yang
perubahan
yang
mengarah
terjadi
pada
40
Memiliki kemampuan dalam memodelkan situasi bisnis

secara umum.
Meskipun skema yang dihasilkan sangat kompleks, tetapi

pemrosesan query dapat diperkirakan, hal ini dikarenakan
pada level terendah, setiap tabel fakta harus di query secara
independen.
2.1.15.5 Fact Table (Tabel Fakta)

Menurut Inmon (2005, p497), tabel fakta adalah tabel
pusat dari skema bintang dimana data sering muncul akan
ditempatkan di tabel tersebut. Tabel fakta disebut juga tabel
utama (major table), merupakan inti dari skema bintang dan
berisi data aktual yang akan dianalisis (data kuantitatif dan
transaksi).
Tabel
fakta
adalah
tabel
yang
umumnya
mengandung angka dan data historis dimana key (kunci) yang

dihasilkan sangat unik karena merupakan kumpulan foreign
key dan primary key yang ada pada masing-masing tabel
dimensi yang berhubungan atau merupakan tabel terpusat dari
skema bintang. Tabel fakta menyimpan tipe-tipe measure
yang berbeda, seperti measure yang secara langsung
berhubungan dengan tabel dimensi dan measure yang tidak
berhubungan dengan table dimensi.
41
Menurut Connoly dan Begg (2010, p1246), tabel fakta

adalah tabel pada dimensional model yang isinya composite
primary key (PK).
2.1.15.6 Dimensional Tabel (Tabel Dimensi)
Menurut Inmon (2005, p495), tabel dimensi adalah
tempat dimana data-data yang tidak berhubungan yang
berelasi dengan tabel fakta ditempatkan di dalam table
dimensional.
Tabel dimensi juga disebut tabel kecil (minor table),
karena memegang data deskriptif yang mencerminkan dimensi
suatu bisnis. Tabel dimensi merupakan tabel yang berisi
kategori
dengan
ringkasan
data
detil
yang
dapat
dilaporkan,seperti laporan keuntungan pada tabel fakta dapat

dilaporkan sebagai dimensi waktu (berupa per bulan atau per
tahun).
2.2
Teori Khusus
2.2.2 Konsep Penjualan
Menurut Joel G. Siegel dan Joe K. Shim (2006, p404),
penjualan adalah penerimaan yang diperoleh dari pengiriman barang
dagangan atau dari penyerahan pelayanan dalam bursa sebagai barang
pertimbangan. Pertimbangan ini dapat dalam bentuk tunai peralatan kas
atau harta lainnya. Pendapatan dapat diperoleh pada saat penjualan,
42
karena terjadi pertukaran,harga jual dapat ditetapkan dan bebannya

diketahui.
Dalam kegiatan ini penjualan akan melibatkan debitur atau
disebut juga pembeli serta barang-barang atau jasa yang diberikan dan
dibayar oleh debitur tersebut dengan cara tunai ataupun kredit.
Penjualan barang dagang oleh sebuah perusahaan dagang
biasanya hanya disebut penjualan, jumlah transaksi yang terjadi
biasanya cukupbesar dibandingkan jenis transaksi lainnya. Dalam
menjual barang dagangannya perusahaan dapat menerapkan tiga metode
penjualan yang sering dikenal yaitu penjualan tunai, penjualan kredit,
dan penjualan konsinyasi.
2.2.3 Konsep Pembelian
Menurut McLeod (2006, p253), sistem pembelian terjadi dipicu
dari adanya transaksi penjualan yang terjadi secara operasional pada
perusahaan sehingga mengakibatkan pengurangan inventory yang ada
pada perusahaan dan sebelum inventory tersebut persediannya habis
atau mencapai batas persediaan kembali maka bagian pembelian harus
menyetok kembali persediannya. Bagian pembelian memiliki tanggung
jawab memilih pemasok mana yang akan bekerjasama dalam pengisian
kembali persediaan dan merundingkan pengaturannya seperti harga dan
tanggal pengiriman. Setelah memutuskan pemasok yang akan diberikan
kepada pihak pemasok untuk dipenuhi dan barang pesanan pembelian
inventory diterima perusahaan.
43
2.2.4 Konsep Persediaan

Konsep persediaan menurut Warren (2005, p452) digunakkan
untuk mengindikasi barang dagang yang disimpan untuk dijual dalam
operasi bisnis perusahaan dan bahan yang digunakan dalam proses
produksi atau disimpan untuk tujuan itu. Dalam informasi persediaan
yang terlibat adalah bagian persediaan yang melakukan pengecekan stok
barang dan pengubahan stok barang.

2011-2-00973-SI Bab2001

Diunggah oleh

Informasi Dokumen

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

2011-2-00973-SI Bab2001

Diunggah oleh

Hak Cipta:

Format Tersedia

BAB 2

mengijinkan transaksi untuk mengakses langsung ke database. Transaksi

membangun dan merancang data.

Menurut Inmon (2005, p494), Data mining merupakan proses

2.1.6 Karakteristik Data Warehouse

warehouse adalah sebagai berikut :

invoicing, stock control, dan product sales). Hal ini dikarenakan

Integrasi sumber data dapat dipenuhi dengan berbagai cara

Gambar 2.1 Integrasi Data Warehouse

2.1.6.3Time-Variant (Rentang Waktu)

secara real time tetapi di refresh dari sistem operasional secara

Gambar 2.2 Non VolatileData Warehouse

2.1.7 Perbandingan Data Warehouse Dengan OLTP

(OLTP) yang berbeda untuk setiap proses bisnis, seperti pengawasan

Tabel 2.1 Perbandingan antara sistem OLTP dan sistem Data

Waktu yang sedang

Pola prediksi dari data

Dapat di prediksi suatu

Tidak bisa di prediksi,

dimensi, relatif, laporan

laporan yang dinamis

Melayani sejumlah besar

2.1.8 Definisi Data Mart

tersebut telah didenormalisasi berdasarkan kebutuhan informasi

sedangkan kerugiannya adalah resiko kehilangan konsistensi

Gambar 2.3 Bentuk Data Warehouse Fungsional

2.1.10.2 Centralized Data Warehouse (Data Warehouse Terpusat)

Gambar 2.4 Bentuk Data Warehouse Terpusat

2.1.10.3Distributed Data Warehouse (Data Warehouse Terdistribusi)

Gambar 2.5 Bentuk Data WarehouseTerdistribusi

2.1.11 Arsitekur Data Warehouse

Sistem eksternal seperti Internet, database yang tersedia

penyimpanan sementara ke tabel data warehouse.

Tujuan dari ringkasan informasi

untuk mempercepat performa query. Ringkasan data di update

2.1.11.8 Arsip / Back Up Data

Performa yang baik dapat dicapai dengan merencanakan

tools dan report writers. Production repoting tools

graphical data access yang dirancang untuk sisi client

terintegrasi dengan OLAP tools dan dapat mengakses

2.1.11.10.3 Executive Information System (EIS) Tools

keputusan tingkat tinggi kemudian meluas untuk

membuat aplikasi pendukung pengambilan keputusan

berbasis pada konsep database multidimensional dan

multidimensional. Tools ini mengasumsikan data diatur

2.1.11.10.5 Data Mining Tools

warehouse dapat dilihat padagambar berikut ini :

Gambar 2.6 Arsitektur dan Komponen Utama

2.1.12 Struktur Data Warehouse

warehouse manager. Bagian tersebut merupakan struktur data

Gambar 2.7 Struktur Data Warehouse

2.1.12.1Current Detail Data

merupakan level terendah dalam datawarehouse. Didalam area

mempermudah untuk pencarian atau pengaksesan kembali.

structure, contents, detail data dan summary data, matrics,

Metadata sendiri merupakan panduan untuk algoritma

2.1.13 ETL (Extraction, Transformation, Loading)

suatu media pusat pengumpulan data yang akan digunakan

Gambar 2.8 Proses ETL

2.1.14 Metodologi Perancangan Database Untuk Data Warehouse

direpresentasikan oleh sebuah tabel fakta.

Misalkan, setiap data pelanggan pada tabel dimensi pembeli

2.1.15 Model Untuk Data Warehouse

hubungan antar entity (ER) dengan beberapa batasan yang