Data mart adalah suatu bagian pada data warehouse yang mendukung
pembuatan laporan dan analisa data pada suatu unit, bagian atau operasi
pada suatu perusahaan. Dalam beberapa implementasi data warehouse,
data mart adalah miniature data warehouse. Data mart sering digunakan
untuk memberikan informasi kepada segmen fungsional organisasi.
Contoh umum data mart adalah untuk departemen penjualan,
departemen persediaan dan pengiriman, departemen keuangan,
manajemen tingkat atas, dan seterusnya. Data mart juga dapat digunakan
untuk gudang data segmen data untuk mencerminkan bisnis secara
geografis terletak di mana masing-masing daerah relatif otonom. Sebagai
contoh, sebuah organisasi layanan yang besar mungkin memperlakukan
pusat operasi regional sebagai unit usaha perorangan, masing-masing
dengan data mart sendiri yang memberikan kontribusi untuk gudang data
master.
Kata operasional disini merupakan database yang diperoleh dari kegiatan sehari-
hari. Data warehouse dibuat lebih dari satu dan dikelompokkan berdasar fungsi-
fungsi yang ada di dalam perusahaan seperti fungsi
keuangan(financial),marketing,personalia dan lain-lain.
Keuntungan dari bentuk data warehouse seperti ini adalah, sistem mudah
dibangun dengan biaya relatif murah sedangkan kerugiannya adalah resiko
kehilangan konsistensi data dan terbatasnya kemampuan dalam pengumpulan
data bagi pengguna.
Artikel terkait : Pengertian dan Contoh Arsitektur Data Warehouse
Terbaik
Bentuk ini terlihat seperti bentuk data warehouse fungsional, namun terlebih
dahulu sumber data dikumpulkan dalam satu tempat terpusat, kemudian data
disebar ke dalam fungsinya masing-masing, sesuai kebutuhan persuhaan. Data
warehouse terpusat ini, biasa digunakan oleh perusahaan yang belum memiliki
jaringan eksternal.
1. Data diambil dari sistem asal (sistem informasi yang ada), database dan
file.
Arsitektur dan komponen utama dari data warehouse dapat dilihat pada
gambar berikut ini :
a. Operational Data
Sumber data dari data warehouse dapat diambil langsung dari mainframe, basis
data relasional seperti Oracle, Ms SQL server dan sebagainya. Selain itu dapat
melaluo Operational Data Source(ODS). ODS menampung data yang diekstrak
dari sistem utama atau sumber-sumber data yang ada dan kemudian data hasil
ekstrasi tersebut dibersihkan.
b. Load manager
c. Warehouse Manager
d. Query manager
Prinsip atau tujuan utama dari dibangunnya data warehouse adalah untuk
menyediakan informasi bisnis kepada user-user untuk dapat melakukan
pengambilan keputusan secara cepat dan tepat.User ini berinteraksi dengan
warehouse melalui end-user access tools. Data warehouse harus secara efisien
mendukung secara khusus kebutuhan user serta secara rutin melakukan analisis.
Performa yang baik dapat dicapai dengan merencanakan dahulu keperluan-
keperluan untuk melakukan joins,summations dan laporan-laporan per periode
dengan end-users.
Berdasarkan kategori yang dikemukakan oleh Berson dan Smith terdapat lima
grup utama dari tools tersebut, antara lain :
Arsitektur dan infrastruktur dari data warehouse sangat erat hubungannya dan
satu dengan lainnya saling berkaitan.
Menurut Poe, Vidette, data warehouse memiliki struktur yang spesifik dan
mempunyai perbedaan dalam tingkatan detail data dan umur data.
Gambar 5. Struktur Data Warehouse
Daftar Pustaka
Indrajani. (2011). Bedah Kilat 1 Jam Pengantar dan Sistem Basis Data,
ISBN 978-979-27-9695-7, Jakarta: Elex Media Computindo
Inmon, W.H. (2005). Building The Data Warehouse. Third edition. John
Wiley & Sons. New York
Selengkapnya : http://www.kompasiana.com/abduldice/data-
warehouse_5520c1428133112f7419fb4a
KARAKTERISTIK DATA WAREHOUSE
1. Berorientasi Subjek.
Data warehouse terorganisasi di seputar subjek kunci (atau entitas-entitas peringkat tinggi)
dalam perusahaan, Data warehouse adalah tempat penyimpanan berdasakan subyek bukan
berdasakan aplikasi. Subyek merupakan bagian dari suatu perusahaan. Contoh subyek pada
perusahaan manufaktur adalah penjualan, konsumen, inventori, daln lain sebagainya.
Gambar dibawah ini merupakan perbedaan mengenai data warehouse dan database
operasional.
2. Terintegrasi
Data yang tersimpan dalam data warehouse didefinisikan menggunakan konversi penamaan
yang konsisten, format-format, struktur terkodekan, serta karakteristik-karakteristik yang
berhubungan, Sumber data yang ada dalam data warehouse tidak hanya berasal dari database
operasional (internal source) tetapi juga berasal dari data diluar sistem (external source). Data
pada sumber berbeda dapat di-encode dengan cara yang berbeda. Sebagai contoh, data jenis
kelamin dapat di-enkode sebagai 0 dan 1 di satu tempat dan m dan f di tempat lain.
Contoh lain misalnya : Data dari macam-macam aplikasi transaksi (untuk bank misalnya:
tabungan, kredit, rekening koran) semua mengandung data nasabah, ada yang sama ada yang
spesifik (yang sama misalnya: nama dan alamat, yang spesifik misalnya: untuk kredit ada
kolateral, untuk rekening koran ada overdraft) didalam data warehouse data-data yang sama
harus diintegrasikan disatu database, termasuk misalnya diseragamkan formatnya (sederhana
tetapi paling sering terjadi aplikasi-aplikasi sering dibeli vendor berbeda, dibuat
dengan/dijalankan di teknologi berbeda-beda)
Data yang tersimpan dalam data warehouse mengandung dimensi waktu yang mungkin
digunakan sebagai rekaman bisnis untuk tiap waktu tertentu, Data warehouse menyimpan
sejarah (historical data). Bandingkan dengan kebutuhan sistem operasional yang hampir
semuanya adalah data mutakhir! Waktu merupakan tipe atau bagian data yang sangat penting
didalam data warehouse.
Didalam data warehouse sering disimpan macam-macam waktu, seperti waktu suatu transaksi
terjadi/dirubah/dibatalkan, kapan efektifnya, kapan masuk ke komputer, kapan masuk ke data
warehouse; juga hampir selalu disimpan versinya, misalnya terjadi perubahan definisi
kode pos, maka yang lama dan yang baru ada semua didalam data warehouse kita.
Sekali lagi, data warehouse yang bagus adalah yang menyimpan sejarah.
4. Non-volatile
Data yang tersimpan dalam data warehouse diambil dari system operasional yang sedang
berjalan, tetapi tidak dapat diperbaharui (di-update) oleh pengguna (bersifat hanya-baca),
Sekali masuk kedalam data warehouse, data-data, terutama data tipe transaksi, tidak akan
pernah di update atau dihapus (delete) Terlihat, bahwa keempat karakteristik ini saling terkait
kesemuanya harus diimplementasikan agar suatu data warehouse bisa efektif memiliki data
untuk mendukung pengambilan-keputusan. Dan, implementasi keempat karakteristik ini
membutuhkan struktur data dari data warehouse yang berbeda dengan database sistem
operasional.
Data dalam database operasional akan secara berkala atau periodik dipindahkan kedalam data
warehouse sesuai dengan jadwal yang sudah ditentukan. Misal perhari, perminggu, perbulan,
dan lain sebagainya. Sekali masuk ke dalam data warehouse, data adalah read-only . Pada
gambar 2 dibawah ini bisa dilihat bahwa database OLTP bisa dibaca, diupdate, dan dihapus.
Tetapi pada database data warehouse hanya bisa dibaca.
5. Ringkas
6. Granularity
Pada sistem operasional data dibuat secara real-time sehingga untuk mendapatkan informasi
langsung dilakukan proses query. Pada data warehouse pada menganalisis harus
memperhatikan level-of-detail misalkan perhari, ringkasan perbulan, ringkasan per-tiga-
bulan.
7. Tidak ternormalisasi
Data di dalam sebuah data warehouse biasanya tidak ternormalisasi dan sangat redundan.
Dasar dari suatu data warehouse adalah suatu data yang besar yang mengandung informasi
bisnis. Data-data yang ada di dalam data warehouse bisa berasal dari banyak sumber,
misalkan dari database operasional atau transaksional dan sumber dari luar misalkan dari
web, penyedia jasa informasi, dari perusahaan lain, dan lain sebagainya.
1. Berorientasi Subjek.
Data warehouse terorganisasi di seputar subjek kunci (atau entitas-entitas peringkat tinggi)
dalam perusahaan, Data warehouse adalah tempat penyimpanan berdasakan subyek bukan
berdasakan aplikasi. Subyek merupakan bagian dari suatu perusahaan. Contoh subyek pada
perusahaan manufaktur adalah penjualan, konsumen, inventori, daln lain sebagainya.
Gambar dibawah ini merupakan perbedaan mengenai data warehouse dan database
operasional.
2. Terintegrasi
Data yang tersimpan dalam data warehouse didefinisikan menggunakan konversi penamaan
yang konsisten, format-format, struktur terkodekan, serta karakteristik-karakteristik yang
berhubungan, Sumber data yang ada dalam data warehouse tidak hanya berasal dari database
operasional (internal source) tetapi juga berasal dari data diluar sistem (external source). Data
pada sumber berbeda dapat di-encode dengan cara yang berbeda. Sebagai contoh, data jenis
kelamin dapat di-enkode sebagai 0 dan 1 di satu tempat dan m dan f di tempat lain.
Contoh lain misalnya : Data dari macam-macam aplikasi transaksi (untuk bank misalnya:
tabungan, kredit, rekening koran) semua mengandung data nasabah, ada yang sama ada yang
spesifik (yang sama misalnya: nama dan alamat, yang spesifik misalnya: untuk kredit ada
kolateral, untuk rekening koran ada overdraft) didalam data warehouse data-data yang sama
harus diintegrasikan disatu database, termasuk misalnya diseragamkan formatnya (sederhana
tetapi paling sering terjadi aplikasi-aplikasi sering dibeli vendor berbeda, dibuat
dengan/dijalankan di teknologi berbeda-beda)
Data yang tersimpan dalam data warehouse mengandung dimensi waktu yang mungkin
digunakan sebagai rekaman bisnis untuk tiap waktu tertentu, Data warehouse menyimpan
sejarah (historical data). Bandingkan dengan kebutuhan sistem operasional yang hampir
semuanya adalah data mutakhir! Waktu merupakan tipe atau bagian data yang sangat penting
didalam data warehouse.
Didalam data warehouse sering disimpan macam-macam waktu, seperti waktu suatu transaksi
terjadi/dirubah/dibatalkan, kapan efektifnya, kapan masuk ke komputer, kapan masuk ke data
warehouse; juga hampir selalu disimpan versinya, misalnya terjadi perubahan definisi
kode pos, maka yang lama dan yang baru ada semua didalam data warehouse kita.
Sekali lagi, data warehouse yang bagus adalah yang menyimpan sejarah.
4. Non-volatile
Data yang tersimpan dalam data warehouse diambil dari system operasional yang sedang
berjalan, tetapi tidak dapat diperbaharui (di-update) oleh pengguna (bersifat hanya-baca),
Sekali masuk kedalam data warehouse, data-data, terutama data tipe transaksi, tidak akan
pernah di update atau dihapus (delete) Terlihat, bahwa keempat karakteristik ini saling terkait
kesemuanya harus diimplementasikan agar suatu data warehouse bisa efektif memiliki data
untuk mendukung pengambilan-keputusan. Dan, implementasi keempat karakteristik ini
membutuhkan struktur data dari data warehouse yang berbeda dengan database sistem
operasional.
Data dalam database operasional akan secara berkala atau periodik dipindahkan kedalam data
warehouse sesuai dengan jadwal yang sudah ditentukan. Misal perhari, perminggu, perbulan,
dan lain sebagainya. Sekali masuk ke dalam data warehouse, data adalah read-only . Pada
gambar 2 dibawah ini bisa dilihat bahwa database OLTP bisa dibaca, diupdate, dan dihapus.
Tetapi pada database data warehouse hanya bisa dibaca.
5. Ringkas
6. Granularity
Pada sistem operasional data dibuat secara real-time sehingga untuk mendapatkan informasi
langsung dilakukan proses query. Pada data warehouse pada menganalisis harus
memperhatikan level-of-detail misalkan perhari, ringkasan perbulan, ringkasan per-tiga-
bulan.
7. Tidak ternormalisasi
Data di dalam sebuah data warehouse biasanya tidak ternormalisasi dan sangat redundan.
Dasar dari suatu data warehouse adalah suatu data yang besar yang mengandung informasi
bisnis. Data-data yang ada di dalam data warehouse bisa berasal dari banyak sumber,
misalkan dari database operasional atau transaksional dan sumber dari luar misalkan dari
web, penyedia jasa informasi, dari perusahaan lain, dan lain sebagainya.
Salah satu tantangan dalam membangun Data Warehouse dan Business Intelligence adalah
membuat Star Schema yang tepat. Dengan Star Schema yang tepat, maka pembuatan BI
report/analysis akan jauh lebih mudah.
Apa itu Star Schema? Sesuai namanya Star Schema adalah schema database di mana diagram
ERD nya berbentuk seperti bintang (star) seperti pada gambar di atas.
Dalam star schema, satu table yang di tengah (lihat gambar di atas) disebut table fakta (fact
table) dan table-table di kelilingnya adalah tabel dimensi (Dimension table).
Contoh measure misalnya "jumlah penduduk", "luas wilayah", "jumlah penjualan", "jumlah
belanja", dll. Sedangkan contoh table dimensi adalah "dimensi wilayah", misalnya dalam
contoh measure "jumlah penduduk", maka dimensi wilayah bisa berisi atribut provinsi,
kabupaten/kota, kecamatan atau kelurahan. Sehingga kita bisa menampilkan jumlah
penduduk per provinsi misalnya.
Contoh lain dimensi misalnya dimensi waktu. Bila dimensi ini digunakan dalam measure
"jumlah penjualan", dimensi waktu dapat berupa tanggal, bulan, kwartal, semester atau tahun.
Sehingga kita bisa menampilkan data penjualan ini dalam rentang (dimensi) waktu yang kita
inginkan, misalnya harian atau bulanan.
Dengan adanya measure dan dimensi, penyusunan suatu laporan business intelligence sangat
mudah dilakukan, karena kita hanya perlu meletakkan dimensi ke dalam baris atau kolom
yang kita inginkan.
Table dimensi sering kali berbentuk hirarki, misalnya dimensi geografi akan memiliki hirarki
dari Negara -> Provinsi -> Kabuptan -> Kecamatan -> Kelurahan dst. Dan saat ini table
dimensi biasanya dilengkapi dengan kordinat posisi (latitude dan longitude) maupun poligon
batas wilayah. Data peta ini digunakan untuk menampilkan data tsb dalam overlay peta
seperti contoh di bawah
Untuk lebih mendalami star schema, mari kita lihat study kasus di bawah ini.
Sebagai contoh kasus, kita akan mencoba membuat suatu star schema dari data
http://dibi.bnpb.go.id/data-bencana
Kalau lihat data di atas, maka hanya ada satu measure yaitu "jumlah korban". Ada berapa
dimensi? Paling tidak ada 4 dimensi, yaitu:
Dimensi waktu adalah dimensi yang hampir selalu ada dalam setiap Business Intelligence,
sehingga semua solusi BI biasanya memiliki pre-defined tabel dimensi ini. Di Tableau
misalnya, begitu suatu kolom type nya adalah tanggal, maka otomatis dikenali sebagai
dimensi waktu lengkap dengan atribut lainnya seperti bulan, kwartal, semester, tahun, dll.
Dengan dimensi waktu yang predefined ini kita hampir tidak perlu membuat table dimensi
sendiri, namun untuk kasus ini kita akan membuat table dimensi waktu sendiri.
Dengan dimensi dan measure di atas, maka star schema nya menjadi sbb
Selanjutnya, setelah kita mendapatkan Star Schema yang sesuai adalah memasukkan data
yang ada ke masing-masing table ini.
1 Meninggal
2 Hilang
3 Terluka
4 Mengungsi
Untuk table dimensi bencana berisi
1 Banjir
3 Tanah Longsor
4 Kebakaran Hutan
5 Gempa Bumi
Aceh
1 ID Indonesia 11 Aceh 1112
Singkil
2 ID Indonesia 11 Aceh
3 ID Indonesia 11 Aceh
Sumatera
4 ID Indonesia 12
Barat
Sumatera
5 ID Indonesia 12
Barat
Sumatera
6 ID Indonesia 12
Barat
Sumatera
7 ID Indonesia 13
Utara
Sumatera
8 ID Indonesia 13
Utara
Sumatera
9 ID Indonesia 13
Utara
Kita bisa saja membuat listnya secara manual seperti di atas, atau kita bisa gunakan ETL
untuk memasukkan data ini secara program. Kita akan bahas ETL di tulisan berikut.
Untuk table facta disusun dari kolom-kolom dimensi dan measure tablenya menjadi sbb.
1 1 12-01-2016 1 1 2
geo_i jenis_bencan jenis_korba jumlah_korba
id tanggal
d a n n
2 1 12-01-2016 1 2 1
3 1 12-01-2016 1 3 2
4 1 12-01-2016 1 4 300
Dimensional modeling merupakan suatu desain logic yang merepresentasikan data dalam
bentuk standar, dan mudah dipahami , sehingga mendukung untuk akses terhadap data
dengan cepat.
Tabel Fakta adalah tabel utama dalam konsep pemodelan dimensional dimana hasil
perhitungan bisnis disimpan.
Tabel Dimensi berisi penjelasan deskriptif dari sebuah bisnis dan memiliki banyak
kolom atau atribut.
Star schema merupakan struktuk logikal yang memiliki tabel fakta yang terdiri atas data
faktual ditengahnya, dan dikelilingi oleh tabel-tabel dimensi yang berisi referensi data.
Karateristik Star Schema
2. Fact table mempunyai sebuah nilai aggregate dari data-data yang berasal dari tabel
dimensi
6. Primary key pada tabel dimensi akan menjadi key pada fact table atau dapat
diakatakan bahwa fact table memiliki kombinasi key dari tabel dimensi tersebut
Keuntungan :
Lebih simple
Mudah dipahami.
Kerugian :
Snowflake Schema Merupakan pengembangan dari star schema, ia juga mempunyai satu
atau lebih dimensi. Hanya saja pada snowflake, tabel yang berelasi pada fact table hanya
tabel dimensi utama, sedangkan tabel yang lain dihubungkan pada tabel dimensi utama.
Keuntungan :
Kerugian :
Keuntungan :
Meskipun skema yang dihasilkan sangat kompleks, tetapi pemrosesan query dapat
diperkirakan, hal ini dikarenakan pada level terendah, setiap table fakta harus di query
secara independen.
Referensi :
http://dundungismyblog.blogspot.com/2014/10/resume-pertemuan-5.html
http://library.binus.ac.id/eColls/eThesisdoc/Bab2HTML/2013100090SIBab2003/page37.html
https://www.google.com/url?
sa=t&rct=j&q=&esrc=s&source=web&cd=8&ved=0CE0QFjAH&url=http%3A%2F
%2Fthesis.binus.ac.id%2Fdoc%2FBab2%2F2012-1-00579-SI%2520bab
%25202.pdf&ei=7qBHVJGDEZONuASU04HQAw&usg=AFQjCNEB_snFB_rNRiYBa4Gh
KGuFnzuFRw&sig2=v1BtUVjWS_UOGk5VKXwsTA&bvm=bv.77880786,d.c2E&cad=rja
Perbandingan Data Warehouse, Data Center, Data Mart serta jenis intelenjensi
bisnis dari beberapa vendor ternama
Perbedaan antara data warehouse dan data mart serta data ce nter adalah sebagai
berikut :
Data warehouse merupakan gabungan dari
beberapa data mart dan levelnya berada pada
perusahaan atau organisasi.
Data mart merupakan bagian dari
datawarehouse dan berada level departemen
pada perusahaan atau organisasi tersebut. Data
mart menangani sebuah business proses,
misalkan penjualan, maka hanya proses
penjualan saja yang ditangani pada data mart.
Data warehouse sendiri adalah database yang
berisi data dari beberapa system operasional
yang terintegrasi dan terstruktur sehingga dapat
digunakan untuk mendukung analisa dan proses
pengambilan keputusan dalam bisnis. Data
warehouse didesain untuk kita bisa melakukan
query secara cepat. Informasi diturunkan dari
data lain, dilakukan rolling up untuk dijadikan
ringkasan, dilakukan operasi drilling down untuk
mendapatkan informasi lebih detail, atau melihat
pola yang menarik atau melihat trend
(kecenderungan).
Kemudian yang dimaksud data mart adalah
lapisan akses dari data warehouse lingkungan
yang digunakan untuk mendapatkan data keluar
bagi pengguna. Data mart adalah subset dari
data warehouse yang biasanya berorientasi pada
lini bisnis tertentu atau tim. Dalam beberapa
penyebaran, masing-masing departemen atau
unit bisnis dianggap sebagai pemilik data mart
yang termasuk semua perangkat lunak,
perangkat keras dan data.
Untuk lebih jelasnya perbedaan data warehouse
dan data mart adalah sebagai berikut:
Untuk Data center atau dalam bahasa Indonesia disebut pusat data adalah suatu fasilitas tempat yang digunakan
untuk meletakkan system computer beserta komponen-komponennya, system ini meliputi system komunikasi dan penyimpanan data.
Keberadaan data center sangat diperlukan oleh sebuah perusahaan bisnis, karena memiliki banyak manfaat untuk kinerja sebuah
perusahaan yang profesional. Keberadaan data center akan sangat besar manfaatnya manakala ada hal tak terduga yang melanda
sebuah perusahaan.
Oracle 11g
Sybase
Sybase IQ
Sybase ETL
Sistem transaksi
My sql