Conformed Dimension
Pemodelan dimensi (DM) adalah nama dari seperangkat teknik dan konsep yang
digunakan dalam data warehouse design. Hal ini dianggap berbeda dari entity-relationship
modeling (ER).Modeling dimensi tidak selalu melibatkan database relasional. Pendekatan
pemodelan yang sama, di tingkat logis, dapat digunakan untuk bentuk fisik apapun, seperti
database multidimensi atau file bahkan datar. Menurut konsultan data warehousing Ralph
Kimball , [1] DM adalah teknik desain untuk database dimaksudkan untuk mendukung
permintaan pengguna akhir di gudang data.Hal ini berorientasi sekitar dimengerti dan
kinerja. Menurut dia, meskipun ER berorientasi transaksi sangat berguna untuk menangkap
transaksi , harus dihindari untuk pengiriman end-user.
3. Mengidentifikasi dimensi
4. Mengidentifikasi fakta
memilih untuk melakukan hal ini dalam teks biasa atau menggunakan dasar Business
Process Modeling Notation ( BPMN ) atau panduan desain lainnya seperti Unified Modeling
Language ( UML ).
Menyatakan gandum
Setelah menjelaskan Proses Bisnis, langkah berikutnya dalam desain adalah untuk
menyatakan butir model. Gandum dari model adalah deskripsi yang tepat dari apa yang
model dimensi harus berfokus pada. Ini bisa misalnya menjadi "Item baris individu pada slip
pelanggan dari toko ritel". Untuk memperjelas apa artinya gandum, Anda harus memilih
proses pusat dan menggambarkannya dengan satu kalimat. Selain itu biji-bijian (kalimat)
adalah apa yang Anda akan membangun dimensi dan tabel fakta dari. Anda mungkin
merasa perlu untuk kembali ke langkah ini untuk mengubah gandum karena informasi baru
yang diperoleh pada apa model Anda seharusnya dapat memberikan.
Mengidentifikasi dimensi
Langkah ketiga dalam proses desain adalah untuk menentukan dimensi model. Dimensi
harus didefinisikan dalam gandum dari langkah kedua dari proses 4-langkah. Dimensi
adalah dasar dari tabel fakta, dan mana data untuk tabel fakta dikumpulkan. Biasanya
dimensi benda seperti tanggal, toko, persediaan dll Dimensi ini adalah di mana semua data
disimpan. Misalnya, dimensi tanggal bisa berisi data seperti tahun, bulan dan hari kerja.
Mengidentifikasi fakta-fakta
Setelah mendefinisikan dimensi, langkah berikutnya dalam proses ini adalah untuk membuat
kunci untuk tabel fakta. Langkah ini adalah untuk mengidentifikasi fakta-fakta numerik yang
akan mengisi setiap baris tabel fakta. Langkah ini erat terkait dengan pengguna bisnis dari
sistem, karena ini adalah di mana mereka mendapatkan akses ke data yang tersimpan
dalam data warehouse . Oleh karena itu sebagian dari baris tabel fakta adalah numerik,
tokoh aditif seperti kuantitas atau biaya per unit, dll
Snowflaking memiliki pengaruh pada struktur data yang berbeda dari banyak filosofi dari
gudang data. [3] Data Tunggal tabel (fakta) yang dikelilingi oleh beberapa deskriptif (dimensi)
tabel
[4]
Pengembang sering tidak menormalkan dimensi karena beberapa alasan:
dengan 3NF karena pengguna operasional Anda akan mencari data yang sangat
halus butir.
Ada beberapa argumen tentang mengapa normalisasi dapat berguna. [3] Hal ini dapat
menjadi keuntungan ketika bagian dari hirarki umum untuk lebih dari satu dimensi. Misalnya,
dimensi geografis mungkin digunakan kembali karena kedua pelanggan dan pemasok
dimensi menggunakannya.
Perluasan - Model Dimensi yang extensible dan mudah menampung data baru yang
tak terduga. Tabel yang ada dapat diubah di tempat baik dengan hanya menambahkan
baris data baru ke dalam tabel atau mengeksekusi SQL mengubah perintah meja. Tidak
ada pertanyaan atau aplikasi lain yang duduk di atas Gudang perlu memprogram untuk
mengakomodasi perubahan.Query Lama dan aplikasi terus berjalan tanpa
menghasilkan hasil yang berbeda. Namun dalam model dinormalisasi setiap modifikasi
harus dipertimbangkan dengan hati-hati, karena ketergantungan yang kompleks antara
tabel database.
Pemodelan dimensi (DM) adalah nama dari teknik desain logis sering digunakan
untuk gudang data.Hal ini berbeda dari, dan kontras dengan, entitas-hubungan
pemodelan (ER). Artikel ini menunjukkan banyak perbedaan antara kedua teknik
dan menarik garis di pasir. DM adalah satu-satunya teknik yang layak untuk
database yang dirancang untuk mendukung permintaan pengguna akhir di gudang
data. ER sangat berguna untuk menangkap transaksi dan fase administrasi data
membangun data warehouse, tetapi harus dihindari untuk pengiriman end-user.
11
DM adalah teknik desain logis yang berusaha untuk menyajikan data dalam
kerangka intuitif standar yang memungkinkan untuk akses kinerja tinggi. Hal ini
inheren dimensi, dan menganut disiplin yang menggunakan model relasional
dengan beberapa pembatasan penting. Setiap model dimensi terdiri dari satu meja
dengan kunci multi, disebut tabel fakta, dan satu set meja kecil yang disebut tabel
dimensi. Setiap tabel dimensi memiliki satu bagian primary key yang sesuai persis
dengan salah satu komponen kunci multipart dalam tabel fakta. (Lihat Gambar 2.)
Karakteristik struktur "Bintang-seperti" ini sering disebut bintang
bergabung. Bintang Istilah bergabung tanggal kembali ke hari-hari awal database
relasional.
Sebuah tabel fakta, karena memiliki primary key multi bagian yang terdiri dari dua
atau lebih kunci asing, selalu mengungkapkan banyak-ke-banyak hubungan. Tabel
fakta yang paling berguna juga mengandung satu atau lebih tindakan numerik, atau
"fakta," yang terjadi untuk kombinasi tombol yang mendefinisikan setiap
record. Dalam Gambar 2, fakta-fakta Dolar Terjual, Unit Terjual, dan Dolar
Biaya. Fakta yang paling berguna dalam tabel fakta adalah numerik dan
aditif. Aditivitas sangat penting karena aplikasi data warehouse hampir tidak pernah
mengambil fakta catatan tabel tunggal, melainkan, mereka mengambil ratusan,
ribuan, atau bahkan jutaan catatan ini pada satu waktu, dan satu-satunya hal yang
berguna untuk dilakukan dengan begitu banyak catatan adalah untuk
menambahkan mereka up.
Pesona desain database pada Gambar 2 adalah bahwa hal itu sangat dikenali oleh
pengguna akhir dalam bisnis tertentu. Saya telah mengamati ratusan kasus di mana
pengguna akhir segera setuju bahwa ini adalah "bisnis mereka."
Pertama, mari kita mulai dengan membahas apa proses bisnis tidak. Ketika
merancang sebuah model dimensi, proses bisnis tidak mengacu pada departemen
bisnis, organisasi atau fungsi.Demikian juga, tidak harus mengacu pada satu
laporan atau analisis spesifik.
12
Untuk pembuat model dimensi, proses bisnis adalah suatu peristiwa atau kegiatan
yang menghasilkan atau mengumpulkan metrik. Metrik ini pengukuran kinerja bagi
organisasi. Analis bisnis pasti ingin meneliti dan mengevaluasi metrik ini dengan
kombinasi tampaknya tak terbatas dari filter dan kendala. Sebagai pemodel
dimensi, itu tugas kita untuk menyajikan metrik ini dalam struktur yang mudah
untuk memahami bahwa merespon dengan cepat untuk pertanyaan tak terduga.
4. Proses bisnis biasanya dipicu oleh input dan hasil output yang perlu
dipantau. Misalnya, proposal yang diterima adalah masukan untuk proses
pemesanan yang menghasilkan order penjualan dan metrik terkait. Dalam
skenario ini, proses bisnis penjualan pemesanan, Anda akan memiliki tabel
fakta pesanan dengan pesanan penjualan sebagai dimensi merosot
potensial dan jumlah pesanan dan dianggap sebagai fakta. Cobalah untuk
membayangkan aliran umum dari input ke dalam proses bisnis, sehingga
metrik output. Di kebanyakan organisasi, ada serangkaian proses bisnis di
mana output dari satu proses menjadi input ke yang berikutnya. Dalam
bahasa pembuat model dimensi, proses bisnis ini akan menghasilkan
serangkaian tabel fakta.
BAB 2
LANDASAN TEORI
13
mana data itu sendiri tidak memiliki arti dan data juga adalah fakta-
transaksi bisnis.
Berdasarkan pengertian yang dijabarkan oleh para ahli diatas
yang telah disusun ke dalam bentuk yang memiliki arti dan berguna
bagi manusia.
Berdasarkan pengertian yang dijabarkan oleh para ahli diatas
komponen yang saling terkait dan saling berinteraksi dengan batas yang
dari aplikasi bisnis yang sistem informasi dapat lakukan dari sebuah
Informasi
kumpulan data secara logis terkait, dan deskripsi dari data ini, didesain
secara logis atau salah satu komponen yang saling berhubungan dan
organisasi.
2.1.6 DBMS (Database Management System)
Menurut Sreevani dan Rao (2010:56), dalam jurnalnya
yang baru.
6. Peforma kinerja menurun.
7. Tingkat kegagalan yang lebih besar.
2.1.6.4 Fasilitas DBMS (Database Management System)
update.
3. SQL (Structured Query Language) adalah suatu bahasa
aliran sekuensial.
yang sama dengan data warehouse. Tapi data mart selalu terbatas pada
mart adalah subset dari data warehouse dan berfokus pada topik
lain:
Dependent Data Mart, adalah sebuah subset yang dibuat secara
data.
Independent Data Mart, adalah data mart yang mendukung konsep
dapat disimpulkan bahwa pengertian data mart adalah subset dari data
berfokus pada topik tertentu atau departemen yang biasanya terdiri dari
dalam perusahaan.
20
2. Integrated
Integrasi berhubungan erat dengan subject orientation.
yang baru.
2.1.10.3 Lifecycle Diagram
Menurut Kimball dan Ross (2010:97), Lifecycle
sebenarnya.
subyek yang ada dari sebuah bagian data mart. Data mart
property advertising.
Penyesuaian Dimensi)
Menurut Kimball dan Ross (2010:211), Dalam
Jika ada dimensi yang digunakan pada dua data mart, maka
mart.
Dimensi tersebut penting untuk menggambarkan fakta-
lainnya.
Jika sebuah dimensi digunakan pada dua data mart atau
ditambah.
Sumber dari sebuah tabel fakta menentukan fakta mana
kerugian.
6. Round Out The Dimension Tables (Memastikan
Tabel Dimensi)
Menurut Kimball dan Ross (2010:214), Dalam
yaitu:
Tipe 1, Atribut dimensi yang diubah dituliskan ulang.
Tipe 2, Atribut dimensi yang diubah menyebabkan
Fisik)
Menurut Kimball dan Ross (2010:215), Dalam
berhubungan.
Intelligence (BI).
29
akses cepat.
Dimensionality Modeling menggunakan konsep model Entity-
dimensi terdiri dari satu tabel dengan satu composite primary key yang
disebut fact table dan memiliki kumpulan dari tabel yang lebih
2.1.11.2 Snowflake
Menurut Connolly dan Begg (2010:1229), Snowflake
mengandung denormalisasi.
dapat disimpulkan bahwa tabel fakta pada star schema dikelilingi oleh
snowflake.
dan mengirim data dari sumber data ke data warehouse. Dalam proses
pengambilan data, data harus bersih agar didapat kualitas data yang
baik. Contohnya ada nomor telepon yang invalid, ada kode buku yang
tidak eksis lagi, ada beberapa data yang null, dan lain sebagainya.
yaitu:
1. Extract
Extract adalah proses penentuan source yang akan digunakan
menentukan data apa saja yang diperlukan, tabel apa saja yang
transformasi, yaitu:
a. Hanya memilih kolom tertentu saja untuk dimasukkan ke dalam
data warehouse.
b. Menterjemahkan nilai-nilai yang berupa kode, misalnya sumber
qty.
d. Mengkodekan nilai-nilai ke dalam bentuk bebas seperti
sumber.
3. Load
Load adalah proses memasukkan data-data yang sudah di
yang dilakukan cukup sederhana seperti insert, update, dan delete. Hal
utama yang menjadi perhatian dari sistem yang dilakukan OLTP adalah
melakukan query secara cepat dan mudah untuk diperbaiki dan dapat
diakses.
2.1.14 OLAP (Online Analytical Processing)
2.1.14.1 Pengertian OLAP (Online Analytical Processing)
Menurut Turban, Sharda, Delen, dan King (2011:77)
cocok untuk analisis yang cepat dan dekat dari sejumlah besar
baru.
service reporting dan analisis data yang cepat dan efisien dari
berbagai perspektif.
2.1.14.2 Arsitektur OLAP
Menurut Scheps (2008:77), Sistem OLAP
pandang.
2.1.15 Perbedaan OLAP dan OLTP
Menurut Vercellis (2009:49) terdapat perbedaan antara OLAP
dan OLTP, antara lain dapat dilihat pada tabel dibawah ini:
36
konsolidasi
Update Periodic dan regular Berlanjut dan tidak
regular
Aktivitas Tidak dapat diprediksi Berulang kali
Fleksibilitas Tinggi Rendah
Kinerja Rendah untuk query yang Tinggi, satu detik per
kompleks query
User Knowledge workers Karyawan
Fungsi Analisis Operasional
Tujuan Query kompleks dan Transaksi
gigabyte
merupakan data itu sendiri. Metadata ini hampir sama dengan sebuah
proses menemukan pola yang menarik dan pengetahuan dari data yang
berjumlah besar.
pemecahan masalah.
Interpretasi
Tujuan dari interpretasi adalah untuk mengetahui pola dari data dan
dimengerti eksekutif.
Prediksi
Tujuan dari prediksi adalah untuk mengestimasikan kejadian-
analisis yang terjadi secara interatif dan menemukan pola yang menarik,
satu set objek data ke dalam himpunan bagian. Setiap himpunan bagian
adalah cluster, sehingga objek yang di dalam cluster mirip satu sama
cluster yang lain. Partisi tidak dilakukan dengan manual tetapi dengan
pembuatan keputusan.
perusahaan.
utama yaitu:
1. Data sources
40
marts.
3. Data exploration
Pada level ketiga ini, tools-tools yang berfungsi untuk
beragam.
6. Decisions
Pada level terakhir ini yang menjadi persoalan utama
dengan masalah.
2. Insight
Fase kedua membuat pengambil keputusan mengerti lebih
disiplin terkait.
2. The Advanced Analytics sub-system
Meliputi analisis fungsi berdasarkan statistik, data mining,
terkait.
3. The Business Performance Management sub-system
Terdiri dari proses untuk tujuan strategis dan tujuan,
bisnis.
4. The Information Delivery sub-system
Memberikan pengguna bisnis kemampuan untuk
Tactical Dashboard
Mengukur produktivitas jangka pendek dan efektivitas. Hasilnya
spesifikasi pada tim atau level unit bisnis. Level dashboard ini dapat
tujuan korporasi.
2.1.21 Management Reporting
Menurut Jan Barned (2011:4), dalam jurnalnya mengatakan
lebih efisien.
- Meningkatkan keyakinan dalam kualitas keputusan manajemen oleh
staf lembaga.
- Meningkatkan responsivitas terhadap isu-isu yang muncul
kepada lembaga dan staf manajemen dengan tepat, akurat dan tepat
pada fungsi instansi dari laporan manajemen tingkat yang lebih tinggi.
diperlukan.
6. Peranan sebagai pengawas; pelatih harus melakukan pengawasan
terjaga.
7. Peranan sebagai motivator; instruktur perlu secara berkelanjutan
lapangan pekerjaan.
2.2.2 Pengertian Penilaian
Menurut Ahyan (2011), dalam artikelnya mengatakan bahwa
ukuran baik atau buruk, sehat atau sakit, panjang atau pendek, pandai
sesuatu seperti menentukan sejauh mana, dalam hal apa, dan bagian