Anda di halaman 1dari 37

BAB 2

LANDASAN TEORI

2.1

Teori Umum
2.1.1 Definisi Database
Menurut Connolly dan Begg (2010, p65), Database adalah
kumpulan data yang berhubungan satu dengan yang lainnya dan
digunakan secara bersama-sama, dan sekumpulan data didesain guna
memenuhi informasi suatu perusahaan.
Menurut W.H. Inmon (2005, p493), Database adalah sebuah
koleksi data yang saling berelasi pada data yang telah disimpan (sering
dikendalikan dengan redudansi yang terbatas) berdasarkan skema yang
ada. Database bisa digunakan sebagai aplikasi tunggal maupun ganda.
2.1.2 Definisi OLTP (Online Transaction Processing)
Menurut W.H. Inmon (2005, p500), OLTP adalah lingkungan
pemrosesan transaksi performance tingkat tinggi. OLTP (Online
Transaction Processing) menggambarkan kebutuhan sistem dalam
ruang lingkup operasional dan merupakan proses yang mendukung
operasi bisnis sehari-hari.
OLTP dirancang untuk memungkinkan terjadinya pengaksesan
secara bersamaan oleh beberapa user terhadap sumber data yang sama
dan mengatur proses yang diperlukan.Sesuai dengan namanya,OLTP

7

8

mengijinkan transaksi untuk mengakses langsung ke database. Transaksi
yang dilakukan termasuk operasi insert, update, dan delete. Database
OLTP biasanya bersifat relasional dan dalam bentuk normal ketiga, serta
yang terpenting, database OLTP dibangun untuk mampu menangani
banyak transaksi dengan performa tinggi.
2.1.3 Definisi DBMS (Database Management System)
Menurut Connolly dan Begg (2010, p66), Database management
system adalah sistem perangkat lunak yang dapat memungkinkan user
untuk mendefinisikan, membuat, dan mengontrol akses ke database.
Menurut Inmon (2005, p494), Database management system
merupakan

komputer

berbasis

sistem

perangkat

lunak

untuk

membangun dan merancang data.
2.1.4 Definisi Data Mining
Menurut Connolly dan Begg (2010, p180), Data mining
merupakan proses pemindahan yang sesuai serta yang belum diketahui
sebelumnya, dapat dipahami, dan pertambangan informasi yang
bermanfaat dari database besar dan menggunakannya untuk membuat
keputusan bisnis yang penting.
Menurut Mandala (2011, p5), Data mining adalah proses
mencari dan menggali hubungan antar data yang bergunabagi
penggunanya.

9

Menurut Inmon (2005, p494), Data mining merupakan proses
menganalisis data dalam jumlah besar untuk mencari yang belum
ditemukan sebelumnya pada pola bisnis tertentu.
2.1.5 Definisi Data Warehouse
Menurut Connolly dan Begg (2010, p1197), Data warehouse
adalah kumpulan data yang berorientasi subjek, terintegrasi, timevariant, dan non-volatile, yang mendukung proses pengambilan
keputusan dalam manajemen.
Menurut Inmon (2005, p1151), Data warehouse adalah sebuah
koleksi yang saling terintegrasi, database yang berorientasi subjek lalu
dirancang untuk mendukung fungsi DSS, dimana setiap unit data yang
relevan untuk beberapa saat dalam waktu tertentu.
Menurut McLeod dan Schell (2006, p205), data warehouse
adalah perkembangan dari konsep database yang menyediakan suatu
sumber data yang lebih baik bagi para pemakai dan memungkinkan
pemakai untuk memanipulasi dan menggunakan data tersebut secara
intuitif. Data warehouse berukuran sangat besar, kualitas datanya tinggi,
dan sangat mudah diambil datanya.
Menurut O'Brien (2010, p703), data warehouse adalah
kumpulan terpadu dari data yang diambil dari database operasional,
historis, dan eksternal, yang dibersihkan, diubah, dan dikatalogkan
untuk penelusuran dan analisis untuk menyediakan kecerdasan bisnis
bagi pengambilan keputusan bisnis.

dan tidak berorientasi pada aplikasi-aplikasi tertentu.2Integrated (Terintegrasi) Data warehouse dapat menyimpan data-data yang berasal dari sumber-sumber yang terpisah kedalam suatu format yang konsisten dan saling terintegrasi satu dengan yang lainnya.6.1. dan sales) dan tidak diorganisasikan pada area-area aplikasi utama (customer invoicing. Dengan demikian data tidak bisa dipecah-pecah karena data yang sudah ada merupakan suatu kesatuan yang dapat menunjang keseluruhan konsep data warehouse itu sendiri. . products.1.1. 2.6 Karakteristik Data Warehouse Menurut Inmon (2005. Karakteristik dalam data warehouse adalah sebagai berikut : 2. stock control.1Subject Oriented (Berorientasi Subjek) Data warehouse bersifat subject oriented artinya data warehouse digunakan untuk memanfaatkan data yang sudah ada untuk dianalisa berbasis subjek-subjek tertentu dalam organisasi. Data warehouse diorganisasikan disekitar subjek-subjek utama dari perusahaan (customer. dan product sales).10 2.6. p29). daripada aplikasi yang berorientasi terhadap data. Hal ini dikarenakan kebutuhan dari data warehouse untuk menyimpan data-data yang bersifat sebagai penunjang suatu keputusan.

Dengan demikian tidak ada lagi kerancuan karena perbedaan nama. mungkin dalam aplikasi-aplikasi tersebut ada variabel yang memiliki maksud yang sama tetapi nama dan formatnya berbeda. Variabel tersebut harus dikonversi menjadi nama yang sama dan format yang disepakati bersama. Contoh pada lingkungan operasional terdapat berbagai macam aplikasi yang mungkin pula dibuat oleh developer yang berbeda. p31) karena .11 Integrasi sumber data dapat dipenuhi dengan berbagai cara sepeti konsisten dalam penamaan variable. Gambar 2. Barulah data tersebut bisa dikategorikan sebagai data yang terintegrasi kekonsistenannya.1 Integrasi Data Warehouse (Sumber : Inmon. Oleh karena itu. konsisten dalam ukuran variable. 2005. format dan lain sebagainya. konsisten dalam struktur pengkodean dan konsisten dalam atribut fisik dari data.

variasi waktu yang disajikan data warehouse melalui serangkaian snapshot yang panjang.1. Untuk melihat interval waktu yang digunakan dalam mengukur keakuratan suatu data warehouse.6.4Non-Volatile Karakteristik keempat dari data warehouse adalah nonvolatile. dengan menggunakan variasi/perbedaan waktu yang disajikan dalam data warehouse baik implicit maupun explicit secara explicit dengan unsur waktu dalam hari.6. Secara implicit misalnya pada saat data tersebut diduplikasi pada setiap akhir bulan. dan sebagainya. Unsur waktu akan tetap ada secara implicit didalam data tersebut. misalnya antara 5 sampai 10 tahun ke depan.  Cara yang ketiga.12 2. Snapshot merupakan tampilan dari sebagian data tertentu sesuai keinginan pemakai dari keseluruhan data yang ada bersifat read-only. atau per tiga bulan.3Time-Variant (Rentang Waktu) Seluruh data pada data warehouse dapat dikatakan akurat atau valid pada rentang waktu tertentu. kita dapat menggunakan cara antara lain :  Cara yang paling sederhana adalah menyajikan data warehouse pada rentang waktu tertentu. 2. bulan.  Cara yang kedua. minggu.1. maksudnya data pada data warehouse tidak di-update .

1. p1199). Berbeda dengan database operasional yang dapat melakukan update. Data yang baru selalu ditambahkan sebagai suplemen bagi database itu sendiri dari pada sebagai sebuah perubahan. 2005. insert dan delete terhadap data yang mengubah isi dari database sedangkan pada data warehouse hanya ada dua kegiatan memanipulasi data yaitu loading data (mengambil data) dan access data (mengakses data warehouse seperti melakukan query atau menampilan laporan yang dibutuhkan. Database tersebut secara berlanjut menyerap data baru ini. p32) 2.13 secara real time tetapi di refresh dari sistem operasional secara reguler. kemudian secara incremental disatukan dengan data sebelumnya. Gambar 2.2 Non VolatileData Warehouse (Sumber : Inmon. tidak ada kegiatan updating data).7 Perbandingan Data Warehouse Dengan OLTP Menurut Connoly dan Begg (2010. biasanya sebuah organisasi mempunyai beberapa system Online Transaction Processing .

tidak terstruktur. terbaru. dan sering diperbaharui. Sistem ini menghasilkan data operasional yang detil. dan tingkat penjualan. Umumnya organisasi hanya mempunyai satu data warehouse yang menyimpan data secara historis. seperti pengawasan persediaan (inventory control). detil. dan ringkasan dengan beberapa tingkatan dan sangat jarang berubah. pesanan pelanggan (invoicing customer). Data warehouse diorganisasikan berdasarkan pada syaratsyarat query yang potensial dan mendukung keputusan strategis jangka panjang dari sejumlah kecil user tingkat manajerial. Data OLTP diorganisasikan berdasarkan syarat-syarat dari transaksi dihubungkan dengan aplikasi bisnis dan mendukung keputusan per hari dalam sejumlah besar operasional user yang konkruen. dan selalu berubah. Sistem OLTP optimal jika digunakan untuk sejumlah transaksi yang dapat diramalkan. berulang. dan heuristic. Data warehouse didesain untuk mendukung transaksiyang tidak dapat diramalkan (unpredictable) dan memerlukan jawaban untuk query khusus (adhoc). Dibawah ini adalah table perbandingan antara system OLTP dengan system data warehouse: .14 (OLTP) yang berbeda untuk setiap proses bisnis.

8 Definisi Data Mart Menurut Inmon (2005.15 Tabel 2. relatif. Data mart adalah sebuah struktur data yang terbagi-bagi yang diperoleh dari data warehouse di mana data . p494). dimensi. Data Data yang detail ringkas granularity Proses data Pola prediksi dari data Kurangnya pola prediksi dimasukkan. dihapus. p1199) OLTP System Data Warehouse Characteristic Tujuan Mendukung proses Mendukung proses utama operasional analisis Data lampau sampai Umur data Sekarang yang sekarang Data latency Waktu yang sedang Tergantung pada berjalan panjang siklus Data yang detail. 2010. ringan.1 Perbandingan antara sistem OLTP dan sistem Data Warehouse(Sumber : Connolly dan Begg. dari data query diupdate. laporan multi dimensional. sudah tetap laporan yang dinamis Melayani sejumlah besar Melayani sebagian pengguna operasional pengguna manajerial 2. dan di query Laporan Pengguna Dapat di prediksi suatu Tidak bisa di prediksi.1.

Data warehouse dibuat lebih dari satu dan dikelompokkan berdasar fungsi-fungsi yang ada di dalam perusahaan seperti fungsi keuangan (financial). data warehouse yang telah diimplementasikan dengan baik dapat membawa keuntungan besar bagi perusahaan antara lain : 1. Keuntungan kompetitif.10.1.16 tersebut telah didenormalisasi berdasarkan kebutuhan informasi manajemen.9 Keuntungan dan Kegunaan Data Warehouse Menurut Connolly dan Begg (2010. p1214). dan lain-lain. Meningkatkan produktivitas para pembuat keputusan.1. 3. Menurut Connolly dan Begg (2010. sistem mudah dibangun dengan biaya relatif murah . 2. Pengembalian yang besar dari investasi yang ada.1. 2. Keuntungan dari bentuk data warehouse seperti ini adalah. 2. p1198). marketing.1 Functional Data Warehouse (Data Warehouse Fungsional) Kata operasional disini merupakan database yang diperoleh dari kegiatan sehari-hari. personalia. Data mart adalah bagian dari data warehouse yang mendukung kebutuhan informasi dari departemen tertentu atau fungsi bisnis dalam perusahaan.10 Bentuk Data Warehouse Bentuk dari data warehouse yaitu : 2.

10. Data warehouse terpusat ini. namun terlebih dahulu sumber data dikumpulkan dalam satu tempat terpusat. .gstatic.1. sesuai kebutuhan perusahaan.2 Centralized Data Warehouse (Data Warehouse Terpusat) Bentuk ini terlihat seperti bentuk data warehouse fungsional.com/images?q=tbn:ANd9GcQ39Qp6XIF2IM1mx5c13SnkSQ o_6sgBNHtgVo2ywUMuJREYif8i) 2.17 sedangkan kerugiannya adalah resiko kehilangan konsistensi data dan terbatasnya kemampuan dalam pengumpulan data bagi pengguna. Gambar 2. kemudian data disebar ke dalam fungsinya masing-masing. Keuntungan : o Benar-benar terpadu karena konsistensinya yang tinggi.3 Bentuk Data Warehouse Fungsional (Sumber : http://t3. Kerugiannya : o Biaya yang mahal serta memerlukan waktu yang lama untuk membangunnya. biasa digunakan oleh perusahaan yang belum memiliki jaringan eksternal.

3Distributed Data Warehouse (Data Warehouse Terdistribusi) Pada data warehouse terdistribusi ini.4 Bentuk Data Warehouse Terpusat (Sumber : http://t3. .1.10. Sedangkan kerugiannya adalah lebih kompleks untuk diterapkan karena sistem operasi dikelola secara terpisah juga biayanya yang paling mahal dibandingkan dua bentuk data warehouse lainnya. Keuntungannya adalah data tetap konsisten karena sebelum data digunakan data terlebih dahulu di sesuaikan atau mengalami proses sinkronisasi. Dengan sistem terdistribusi seperti ini memungkinkan perusahaan dapat mengakses sumber data yang berada diluar lokasi perusahaan (eksternal). digunakan gateway yang berfungsi sebagai jembatan penghubung antara data warehouse dengan workstation yang menggunakan sistem beraneka ragam.gstatic.com/images?q=tbn:ANd9GcRK1QVqqF_McYTc vyF9qhsIUJ3BlFSgWrIgoeYa4PJmOTgbXY5A) 2.18 Gambar 2.

 Data departemental dipegang penuh oleh file system seperti VSAM.19 Gambar 2.5 Bentuk Data WarehouseTerdistribusi (Sumber : http://t3.  Data pribadi dipegang oleh workstations dan server pribadi.gstatic. dan DBMS yang berelasi seperti Informix dan Oracle.11.1.1 Operasional Data Sumber data dari data warehouse diambil dari :  Mainframe operasional data dipegang oleh hierarki generasi pertama dan jaringan database.1.11 Arsitekur Data Warehouse Tipe arsitektur dari data warehouse menurut Connolly dan Begg (2010.com/images?q=tbn:ANd9GcTkmol4syO71YpHIyIXc0gJ57SFZi7MIhg2_LjhjDddMHjlx_0zw) 2. RMS. . p1203) : 2.

2Penyimpanan Data Operasional Sebuah data store operasional (ODS) adalah operasional repository data saat ini dan data terintegrasi yang digunakan untuk analisis.3 Manajer ETL Manajer ETL melakukan semua operasi yang ter-asosiasi dengan ETL dari data ke warehouse. . 2. Membangun ODS dapat membantu langkah membantu membangun data warehouse.4 Warehouse Manager Manajer warehouse melakukan semua operasi yang terasosiasi dengan manajemen dari data dalam warehouse. karena sebuah ODS dapat mensupply data yang telah di pindah dari sumber sistem dan dibersihkan. atau asosiasi data dengan organisasi penyedia atau konsumen.20  Sistem eksternal seperti Internet.11.11. database yang tersedia bersifat komersil.1.1.11.1. 2. Operasi yang dijalankan oleh manajer warehouse adalah :  Analisis data untuk memastikan konsistensi. 2. ODS sering dibuat ketika sistem operasional warisan dirasa tidak mampu mendapatkan laporan yang dibutuhkan.

 Generasi dari denormalisasi (jika perlu). Kerumitan dari manajer query ditentukan penyedia fasilitas oleh end-user access tools dan database.  Pembuatan index dan tampilan dasar dari tabel. 2.1. 2. .5 Manajer Query Manajer query melakukan semua operasi yang ter-asosiasi dengan manajemen dari pengguna query.  Back up pengarsipan data.11. Ringkasan data di update ketika data baru dimasukan ke warehouse.6 Detil data Area dari penyimpanan data warehouse semua detil data dalam skema database.11.21  Transformasi dan penggabungan sumber data dari penyimpanan sementara ke tabel data warehouse.  Generasi dari aplikasi. Tujuan dari ringkasan informasi untuk mempercepat performa query.11.1. 2.7 Lightly and Highly Summarized Data Area penyimpanan warehouse ini semua yang telah ditetapkan menghasilkan lightly and highly summarized data oleh manajer warehouse.1.

8 Arsip / Back Up Data Area penyimpanan warehouse ini di detilkan dan data yang diringkas untuk proses pengarsipan dan back up.1.11. 2.9 Metadata Dalam data warehouse. User ini berinteraksi dengan warehouse melalui end-user access tools. 2.22 2.11. Sebagian proses query management Mengarahkan permintaan ke sumber data yang tepat.11. Proses extracting dan loading Melakukan pemetaan sumber data pada data warehouse.1. Metadata bertujuan untuk : 1. Data warehouse harus secara efisien mendukung secara khusus kebutuhan user serta secara rutin melakukan analisis.10 End-user Access Tools (EUAT) Prinsip atau tujuan utama dari dibangunnya data warehouse adalah untuk menyediakan informasi bisnis kepada user-user untuk dapat melakukan pengambilan keputusan secara cepat dan tepat. 2. 3.1. Proses warehouse management Mengotomatiskan produksi pada tabel-tabel produksi. . metadata digunakan sebagai tempat penyimpanan semua definisi metadata (keterangan mengenai data) yang digunakan di seluruh proses data warehouse.

.1. End-user access tools dikelompokkan menjadi 5 golongan: 2. summations dan laporan-laporan per-periode dengan endusers.10. mencakup Oracle.11.23 Performa yang baik dapat dicapai dengan merencanakan dahulu keperluan-keperluan untuk melakukan joins.10. Query tools untuk data warehouse relasional dirancang untuk menerima SQL atau menghasilkan pernyataan SQL untuk query data yang disimpan dalam data warehouse.1.11.2 Application Development Tools Aplikasi yang dapat digunakan user yaitu graphical data access yang dirancang untuk sisi client server. 2. Sybase dan Infomix. sedangkan report writer adalah desktop tools yang dirancang untuk end user.1 Reporting dan Query Tools Reporting tools meliputi production reporting tools dan report writers. Beberapa application development tools terintegrasi dengan OLAP tools dan dapat mengakses semua sistem basis data utama. Production repoting tools digunakan untuk menghasilkan laporan operasional biasa.

Tools ini mengasumsikan data diatur dalam model multidimensi yang didukung spesial multidimensional database (MDDB) atau basis data relasional yang dirancang untuk mendapatkan multi dimensional query. marketing. EIS tools yang terisolasi dengan mainframe memungkinkan user membuat aplikasi pendukung pengambilan keputusan untuk menyediakan overview data dan mengakses sumber data eksternal.10. 2.24 2.4 Online Analysis Processing (OLAP) Tools Online Analytical Processing (OLAP) tools berbasis pada konsep database multidimensional dan memungkinkan pengguna untuk menganalisis data menggunakan view yang kompleks dan multidimensional.11. Saat ini perbedaan antara EIS dan decision support tools lainnya semakin tidak jelas. dan keuangan. sejak EIS menyediakan aplikasi custom build untuk area bisnis seperti penjualan.10.1.3 Executive Information System (EIS) Tools Executive Information System (EIS) tools semula dikembangkan untuk mendukung pengambilan keputusan tingkat tinggi kemudian meluas untuk mendukung semua tingkat manajemen. .11.1.

Data mining berpotensi mengganti kemampuan dari OLAP tools.1.25 2. 2010.1. ada beberapa struktur yang spesifik terdapat pada bagian . pola dan arah baru yang berarti ‘menambang’ sejumlah besar data dengan menggunakan teknik statistik. Arsitektur dan komponen utama dari data warehouse dapat dilihat padagambar berikut ini : Gambar 2.6 Arsitektur dan Komponen Utama Data Warehouse (Connolly dan Begg.12 Struktur Data Warehouse Seperti yang kita lihat sebelumnya pada arsitektur data warehouse.5 Data Mining Tools Data mining adalah proses menemukan korelasi. matematika dan artificial intelligence. p1204) 2.10.11.

kemudian dari lightly summarized data ke highly summarized data. p33) data mengalir dari lingkungan operasional ke dalam lingkungan data warehouse dimana data mengalami transformasi dari tingkatan opersional ke tingkatan data warehouse. data disampaikan dari current detail ke older detail. p34) 2. Menurut Inmon (2005. Bagian tersebut merupakan struktur data warehouse. mencerminkan keadaan yang sedang berjalan dan . data tersebut disampaikan dari current detail ke lightly summarized data.1. Pada perumusan data dapat dilihat digambar. Komponen dari struktur data warehouse adalah: Gambar 2.1Current Detail Data Current detail data merupakan data detil yang aktif saat ini.26 warehouse manager.7 Struktur Data Warehouse (Sumber : Inmon. Setelah data diringkas. 2005.12.

Bisa digunakan dalam membuat rekapitulasi sehingga current detail data harus akurat.12.2 Older Detail Data Data ini merupakan data historis dari current detail data. Sangat banyak jumlahnya dan disimpan pada tingkat penyimpanan terendah. 2. dapat berupa hasil cadangan atau archive data yang disimpan dalam storage terpisah. Berikut ini beberapa alasan mengapa current detail data menjadi perhatian utama : 1. Dampak negatif yang ditimbulkan adalah kerumitan untuk mengatur data menjadi meningkat dan biaya yang diperlukan menjadi mahal. Hampir selalu disimpan dalam storage karena cepat di akses tetapi mahal dan kompleks dalam pengaturannya. 3. 4. Karena bersifat back-up (cadangan). 2. Menggambarkan kejadian yang baru terjadi dan selalu menjadi perhatian utama. Penyusunan file atau directory dari data ini .27 merupakan level terendah dalam datawarehouse.1. maka biasanya data disimpan dalam storage alternatif seperti tape-desk. Didalam area ini warehouse menyimpan seluruh detil data yang terdapat pada skema basis data. Data ini biasanya memilki tingkat frekuensi akses yang rendah. Jumlah data sangat besar sehingga memerlukan storage yang besar pula dan dapat diakses secara cepat.

Tingkatan data ini di sebut juga dengan data mart. Akses terhadap data jenis ini banyak digunakan untuk view suatu kondisi yang sedang atau sudah berjalan.4 Highly Summarized Data Data ini merupakan tingkat lanjutan dari Lightly summarized data.28 disusun berdasarkan umur dari data yang bertujuan mempermudah untuk pencarian atau pengaksesan kembali. Data ini dirangkum berdasar periode atau dimensi lainnya sesuai dengan kebutuhan.12.12. 2. Data-data ini memiliki detil tingkatan yang lebih tinggi dan mendukung kebutuhan warehouse pada tingkat departemen. 2. merupakan hasil ringkasan yang bersifat totalitas. Metadata berisikan data yang menyimpan proses perpindahan data meliputi database .1. 2.1.12.1.3 Lightly Summarized Data Data ini merupakan ringkasan atau rangkuman dari current detail data. Ringkasan dari current detail data belum bersifat total summary.5 Metadata Metadata bukan merupakan data hasil kegiatan seperti keempat jenis data diatas. dapat di akses misal untuk melakukan analisis perbandingan data berdasarkan urutan waktu tertentu dan analisis menggunakan data multidimensi.

detail data dan summary data.12.1 Struktur Data Sebuah direktori yang membantu user untuk melakukan analisis Decission Support System dalam pencarian letak/lokasi dalam data warehouse. aging criteria. versioning.12.5. .1.2 Algoritma Algoritma digunakan untuk summary data.12. matrics. contents.5. versioning.1. Metadata sendiri merupakan panduan untuk algoritma dalam melakukan pemrosesan summary data antara current detail data dengan lightly summarized data dan antara lightly summarized data dengan highly summaried data.1. transformation criteria. 2.5.29 structure. Metadata khusus dan memegang peranan yang sangat penting dalam data warehouse. Metadata sendiri mengandung : 2.3 Mapping Sebagai panduan pemetaan (mapping) data pada saat data di transform/diubah dari lingkup operasional menjadi lingkup data warehouse. 2.

1. Data transformation adalah suatu proses perpindahan data operasional ke dalam . mengintegrasikan dan menempatkan data ke dalam sebuah data warehouse. Proses ETL ini terdiri dari 3 tahap. Loading) Menurut Inmon (2005.1Extraction Langkah pertama dari proses ETL adalah proses penarikan data dari satu atau lebih sistem operasional sebagai sumber data (misalnya diambil dari sistem OLTP). Proses ini terdiri dari extracting.13. p497).2 Transformation Data transformation merupakan proses terpenting yang ada di dalam perancangan data warehouse. ETL adalah proses melakukan pencarian data. loading dan beberapa proses yang dilakukan sebelum publikasikan ke data warehouse. Proses ektraksi ini merupakan proses penguraian dan pembersihan data yang diekstrak untuk mendapatkan pola atau struktur data yang diinginkan. Transformation. ETL adalah kumpulan proses menyiapkan data dari operational source untuk data warehouse.13. Menurut Connolly dan Begg (2010.30 2.13 ETL (Extraction. p1208).1.yaitu: 2. transforming.1. Kebanyakan proyek data warehouse menggabungkan data dari sumbersumber yang berbeda. 2.

sumber data diambil dari database yang ada.1. kemudian di-transform menggunakan fasilitas DTS ( Data Transformation Service ) dalam Microsoft SQL Server.8 Proses ETL (Sumber : http://t2.3 Loading Merupakan tahap akhir dalam proses ETL.31 suatu media pusat pengumpulan data yang akan digunakan sebagai pembangunan data warehouse. 2. Data dari staging area akan dipindahkan ke dalam data warehouse. Setelah data yang dihasilkan dari proses transformasi sesuai dengan kondisi yang diinginkan di data warehouse maka proses loading akan berjalan. Gambar 2. Data berasal dari proses transformasi. yaitu proses memasukkan data kedalam target akhir. dalam hal ini adalah data warehouse.13.com/images?=q=tbn:ANNd9GcTT55rjroeAQainRbK5 QOk2GUL7OCkc30G7SZ5QCbsEHOHavvwae_w) .gstatic. Dalam melakukan data transformasi ini.

property leasing. . 2010.14 Metodologi Perancangan Database Untuk Data Warehouse Menurut Ralph Kimball yang dipaparkan kembali dalam buku Connolly dan Begg.32 2. yaitu : Langkah 1 : Pemilihan proses  Data mart yang pertama kali dibangun haruslah data mart yang dapat dikirim tepat waktu dan dapat menjawab semua pertanyaan bisnis yang penting.  Pilihan terbaik untuk data mart yang pertama adalah yang berhubungan dengan sales. ada enam tahap metodologi dalam perancangan database untuk data warehouse.1. property advertising.  Dimensi ini penting untuk menggambarkan fakta-fakta yang terdapat pada tabel fakta. Langkah 3 : Mengidentifikasi dimensi  Set dimensi yang dibangun dengan baik. jika sumber dari sebuah tabel fakta properti sale adalah properti sale individual maka sumber dari sebuah dimensi pelanggan berisi rincian pelanggan yang membeli properti utama.  Misalkan. misal property sales. memberikan kemudahan untuk memahami dan menggunakan data mart. p1231-1236. Langkah 2 : Pemilihan sumber  Untuk memutuskan secara pasti apa yang diwakili atau direpresentasikan oleh sebuah tabel fakta.

karena dua data mart tidak bisa digunakan secara bersama-sama.  Jika sebuah dimensi digunakan pada dua data mart atau lebih. setiap data pelanggan pada tabel dimensi pembeli dilengkapi dengan id_pelanggan. kedua data mart tersebut harus berdimensi sama. atau paling tidak salah satunya berupa subset matematis dari yang lainnya.  Semua fakta harus diekspresikan pada tingkat yang telah ditentukan oleh sumber. dan dimensi ini tidak disinkronisasi.  Keterangannya harus bersifat intuitif dan mudah dipahami oleh pengguna. . dan lain sebagainya. Langkah 5 : Menyimpan pre-kalkulasi di tabel fakta  Hal ini terjadi apabila fakta kehilangan statement. maka keseluruhan data warehouse akan gagal. Langkah 6 : Melengkapi tabel dimensi  Pada tahap ini kita menambahkan keterangan selengkap-lengkapnya pada tabel dimensi. no_pelanggan.33  Misalkan. Langkah 4 : Pemilihan fakta  Sumber dari sebuah tabel fakta menentukan fakta mana yang bisa digunakan dalam data mart.  Jika ada dimensi yang muncul pada dua data mart. tipe_pelanggan. tempat_tinggal.

1.15 Model Untuk Data Warehouse Berikut di bawah ini adalah penjelasan dari model untuk data warehouse : 2.34 2. Kegunaan dari kunci pengganti adalah memperbolehkan data pada data .1. Struktur karakteristik ini disebut dengan skema bintang atau join bintang. Fitur terpenting dalam model dimensional ini adalah semua natural keys diganti dengan kunci pengganti (surrogate keys). disebut dengan tabel fakta. Model dimensional menggunakan konsep model hubungan antar entity (ER) dengan beberapa batasan yang penting. Maksudnya yaitu setiap kali join antar tabel fakta dengan tabel dimensi selalu didasari kunci pengganti. Setiap tabel dimensi memiliki sebuah simple primary key yang merespon tepat pada satu komponen primary key pada tabel fakta. Setiap model dimensi terdiri dari sebuah tabel dengan sebuah komposit primary key.15. dan satu set tabel yang lebih kecil disebut tabel dimensi. Dengan kata lain primary key pada tabel fakta terdiri dari dua atau lebih foreign key.1Model Dimensional Model dimensional merupakan rancangan logikal yang bertujuan untuk menampilkan data dalam bentuk standar dan intuitif yang memperbolehkan akses dengan performa yang tinggi.

1. Model OLTP sering terlihat seperti jaring laba-laba yang terdiri atas ratusan bahkan ribuan tabel sehingga sulit untuk dimengerti. mendukung volume yang besar dari transaksi yang bergerak sangat cepat. mendukung query sederhana dan menyediakan performa query yang superior dengan meminimalisasi tabel-tabel join. Sebaliknya.15.2Skema Bintang Skema bintang merupakan struktuk logikal yang memiliki tabel fakta yang terdiri atas data faktual ditengahnya. . 2. tidak seperti halnya yang diproduksi oleh sistem OLTP.35 warehouse untuk memiliki beberapa kebebasan dalam penggunaan data. dan dikelilingi oleh tabel-tabel dimensi yang berisi referensi data.validasi untuk input data. Sebuah sistem OLTP memerlukan normalisasi untuk mengurangi redudansi. dimension model yang sering digunakan pada data warehouse adalah skema bintang atau snowflake yang mudah dimengerti dan sesuai dengan kebutuhan bisnis.

google.10 Skema Bintang Sederhana (Sumber : https://encryptedtbn1.36 Gambar 2. yaitu : a.com/images?q=tbn:ANd9GcRZXVFBN6hEvtSy6MnT 1laeNFkdpUucGwN0B3fnWylyCG3ylB2SUVuS6bw) . setiap tabel harus memiliki primary key yang terdiri dari satu kolom atau lebih. Gambar 2.9 Contoh Skema Bintang (Sumber : Connolly dan Begg. Primary key dari tabel fakta terdiri dari satu atau lebih foreign key. Foreign key merupakan primary key pada tabel lain. 2010. p1228) Jenis-jenis Skema Bintang. Skema Bintang Sederhana Dalam skema ini.

mereka tetap menggunakan tabel dimensi bersama-sama. Dikarenakan tabel fakta tersebut ada banyak. Walaupun terdapat lebih dari satu tabel fakta. Skema bintang dengan banyak tabel fakta Skema bintang juga bisa terdiri dari satu atau lebih tabel fakta. Gambar 2. misalnya disamping penjualan terdapat tabel fakta forecasting dan result.11 Skema Bintang Dengan Banyak Tabel Fakta (Sumber : https://encryptedtbn1.com/images?q=tbn:ANd9GcSYMDGurc65_QjTowVx7Zj 7KIqvvnxjXgYCJBZyhHe1iBvByWqSzvZs5uqQ) .google.37 b.

o Foreign key yang berhubungan ditunjukkan dengan garis yang menghubungkan tabel. Kolom yang bukan kunci disebut kolom data pada tabel fakta dan atribut pada tabel dimensi. seperti contoh dibawah ini : . Dengan kata lain satu atau lebih tabel dimensi tidak bergabung secara langsung kepada tabel fakta tapi pada tabel dimensi lainnya. 2. o Primary key dan foreign key diberi kotak.1. keuntungan skema snowflake adalah :  Memerlukan tempat penyimpanan yang lebih kecil.15.p238). Merupakan varian dari skema bintang dimana tabeltabel dimensi tidak terdapat data yang di denormalisasi. o Primary key diarsir sedang foreign key yang bukan primary tidak.3 Snowflake Schema Menurut Ponniah (2010.38 Adapun ketentuan dalam pembacaan skema bintang adalah o Bagian yang ada di bawah judul tabel merupakan kolom-kolom tabel tersebut.  Struktur yang normal akan lebih mudah untuk diperbaharui dan dikelola.

dikarenakan strukturnya yang lebih normalisasi. Sedangkan skema bintang lebih efisien serta sederhana dalam membuat query dan mudah diakses secara langsung oleh pengguna. perbedaannya terletak pada implementasi fisikal. yang perubahan yang mengarah terjadi pada .  Bersifat fleksibel khususnya terhadap perubahan perkembangan.Skema snowflake memberi kemudahan pada perawatan dimensi.1.12Snowflake Schemes (Sumber : Connolly dan Begg.15. 2010. Keuntungan menggunakan masing-masing model tersebut dalam data warehouse antara lain :  Efisien dalam hal mengakses data.4 Star atau Snowflake Keduanya merupakan model-model dimensional.  Dapat beradaptasi terhadap kebutuhan-kebutuhan user.39 Gambar 2. p1229) 2. Adapun starflake merupakan gabungan diantara keduanya.

tabel fakta adalah tabel pusat dari skema bintang dimana data sering muncul akan ditempatkan di tabel tersebut. hal ini dikarenakan pada level terendah. Tabel fakta adalah tabel yang umumnya mengandung angka dan data historis dimana key (kunci) yang dihasilkan sangat unik karena merupakan kumpulan foreign key dan primary key yang ada pada masing-masing tabel dimensi yang berhubungan atau merupakan tabel terpusat dari skema bintang.5 Fact Table (Tabel Fakta) Menurut Inmon (2005.  Meskipun skema yang dihasilkan sangat kompleks. merupakan inti dari skema bintang dan berisi data aktual yang akan dianalisis (data kuantitatif dan transaksi). tetapi pemrosesan query dapat diperkirakan. . Tabel fakta disebut juga tabel utama (major table).40  Memiliki kemampuan dalam memodelkan situasi bisnis secara umum. setiap tabel fakta harus di query secara independen.1.15. p497). seperti measure yang secara langsung berhubungan dengan tabel dimensi dan measure yang tidak berhubungan dengan table dimensi. 2. Tabel fakta menyimpan tipe-tipe measure yang berbeda.

Pertimbangan ini dapat dalam bentuk tunai peralatan kas atau harta lainnya. Pendapatan dapat diperoleh pada saat penjualan. tabel dimensi adalah tempat dimana data-data yang tidak berhubungan yang berelasi dengan tabel fakta ditempatkan di dalam table dimensional.41 Menurut Connoly dan Begg (2010.2 Teori Khusus 2.6 Dimensional Tabel (Tabel Dimensi) Menurut Inmon (2005.2. tabel fakta adalah tabel pada dimensional model yang isinya composite primary key (PK). 2.15. penjualan adalah penerimaan yang diperoleh dari pengiriman barang dagangan atau dari penyerahan pelayanan dalam bursa sebagai barang pertimbangan. 2. Tabel dimensi merupakan tabel yang berisi kategori dengan ringkasan data detil yang dapat dilaporkan. p495).1.2 Konsep Penjualan Menurut Joel G. . Shim (2006. karena memegang data deskriptif yang mencerminkan dimensi suatu bisnis.seperti laporan keuntungan pada tabel fakta dapat dilaporkan sebagai dimensi waktu (berupa per bulan atau per tahun). Tabel dimensi juga disebut tabel kecil (minor table). p1246). p404). Siegel dan Joe K.

harga jual dapat ditetapkan dan bebannya diketahui. Penjualan barang dagang oleh sebuah perusahaan dagang biasanya hanya disebut “penjualan”. dan penjualan konsinyasi. p253). Dalam kegiatan ini penjualan akan melibatkan debitur atau disebut juga pembeli serta barang-barang atau jasa yang diberikan dan dibayar oleh debitur tersebut dengan cara tunai ataupun kredit. 2. Dalam menjual barang dagangannya perusahaan dapat menerapkan tiga metode penjualan yang sering dikenal yaitu penjualan tunai. Setelah memutuskan pemasok yang akan diberikan kepada pihak pemasok untuk dipenuhi dan barang pesanan pembelian inventory diterima perusahaan. penjualan kredit. Bagian pembelian memiliki tanggung jawab memilih pemasok mana yang akan bekerjasama dalam pengisian kembali persediaan dan merundingkan pengaturannya seperti harga dan tanggal pengiriman. . sistem pembelian terjadi dipicu dari adanya transaksi penjualan yang terjadi secara operasional pada perusahaan sehingga mengakibatkan pengurangan inventory yang ada pada perusahaan dan sebelum inventory tersebut persediannya habis atau mencapai batas persediaan kembali maka bagian pembelian harus menyetok kembali persediannya. jumlah transaksi yang terjadi biasanya cukupbesar dibandingkan jenis transaksi lainnya.3 Konsep Pembelian Menurut McLeod (2006.2.42 karena terjadi pertukaran.

p452) digunakkan untuk mengindikasi barang dagang yang disimpan untuk dijual dalam operasi bisnis perusahaan dan bahan yang digunakan dalam proses produksi atau disimpan untuk tujuan itu.4 Konsep Persediaan Konsep persediaan menurut Warren (2005. Dalam informasi persediaan yang terlibat adalah bagian persediaan yang melakukan pengecekan stok barang dan pengubahan stok barang. .43 2.2.