Anda di halaman 1dari 3

Business Intelligence Adalah Suatu fungsi dalam bisnis yang bertugas untuk mengumpulkan data

lalu diproses hingga menjadi informasi yang digunakan untuk bisnis user
Data Warehouse : Kumpulan data dari berbagai sumber lalu disimpan pada suatu penyimpanan yang
berukuran besar lalu di proses menjadi bentuk penyimpanan multidimensional dan di desain untuk
reporting dan querying
Karakteristik DW
- Subject oriented : data disimpan sesuai dengan proses bisnisnya
- Time Variant : Data disimpan bersifat historical
- Integrated : Semua data satu media penyimpanan
- Non-Volatile : Data cendrung tidak berubah
Tujuan datawarehouse : Mempermudah dalam mengambil keputusan
Sifat datawarehouse : multidimensional yang berarti bahwa terdapat banyak lapisan dan kolom dan
berdasarkan susunan
Anatomi data warehouse :
- Functional Data Warehouse: merupakan database yang diperoleh dari kegiatan sehari-hari
- Centralized Data warehouse : Sumber data yang dikumpulkan lalu disebar ke dalam
fungsinya masing- masing sesuai kebutuhan perusaan
- Distributed datawarehouse : berfungsi sebagai jembatan penghubung antara data warehouse
dengan workstation yg menggunakan system beraneka ragam
Komponen DataWarehouse
Operational Data
- ETL Manager : melakukan semua operasi yang berhubungan dengan fungsi ETL (Extract,
Transform, Loading)
- Metadata : Komponen ini menyimpan semua definisi metadata(informasi mengenai data)
yang digunakan dalam proses data warehouse.
- Warehouse Manajer : melakukan semua operasi yang berhubung dengan manajemen data
dalam data warehouse.
Proses yang terjadi dari basis data operasional
1. Melakukan ekstraksi data dari berbagai sumber
2. Melakukan integrasi data ke tempat yang umum
3. Menyimpan data dalam format yang dapat digunakan oleh pengguna
Data warehouse vs OLTP
1. Workload
- Data warehouse didesain untuk menampung query dalam jumlah yang besar
- OLTP hanya mendukung operasi tertentu
2. Data modification
- Data warehouse diupdate secara regular
- Pada OLTP, user melakukan proses update data secara rutin dan langsung
3. Schema Design
- Data warehouse biasanya ternormalisai secara sebagian bahkan dalam keadaan tidak
ternormalisasi
- OLTP ternormalisasi penuh untuk meningkatkan proses update/insert/delete dan
meningkatkan konsistensi data

4. Typical operation
- Data warehouse menjalankan query yang memproses banyak baris (ratusan atau milyaran),
contoh : total penjualan semua customer pada akhir tahun
- OLTP hanya mengkases record tertentu, contoh : mencari data order untuk customer tertentu
5. Historical data
- Data warehouse menyimpan data selama beberapa bulan atau tahun.
- OLTP menyimpan data hanya beberapa minggu atau bulan
ETL : suatu proses mengambil(extract) data dari berbagai sumber dan mengubah (transform) data
tersebut menjadi format data kemudian data yang di ubah dimasukan (load) ke dalam pusat
data/datawarehouse
EKSTRAK DATA : mengambil data dari satu atau beberapa sumber lalu mengakses data yang ingin
di ambil contohnya mengambil data dari database
Langkah membuat Peta Logika :
1. Mengidentifikasi sumber data
2. Menganalisa sumber data
3. Memahami kebutuhan data
4. Melakukan validasi formula
Metode Ekstraksi
1. Statis
Dilakukan pada saat system OLTP tidak berjalan
2. Terjadwal
Berdasarkan waktu
3. Seketika
Dengan mekanisme log transaksi
TRANSFORM : Mengubah data yang diektraksi dari bentuk sebelumnya menjadi data yang
diperlukan sehingga dapat ditempatkan ke dalam datawarehouse
Contoh :
1. Konversi Format
Pengubahan Tipe data dan Panjang data
2. Manipulasi string
(m -> male, F -> female)
3. Fungsi aritmatika
4. Data yang tidak konsisten dihilangkan
5. Mengelola data duplikasi
6. Mengolala data anomaly
7. Pemecahan nilai tunggal
8. Penggabungan data
9. Restrukturisasi key dan query agregat
LOAD : proses mengirim data yang telah menjalani proses transformasi ke dalam data target contoh
hasil dari proses traansformasi disimpan dkedalam file microsoft
DUA LOADING DATA :
INISIAL LOAD : Proses yang dilakukan pada saat setelah selesai mendesign dan membangun
datawarehouse
INCREMENTAL LOAD : proses yang dilakukan Ketika datawarehouse telah dioperasikan
4 mode Loading:
1. Panggil : Menghapus data dan menggantinya
2. TAMBAH : menambah data
3. Destructive merge : Merubah record yang ada
4. Constructive merge : menambah record baru dan menandai record baru
Perbedaan OLAP dan OLTP
Desain : desain yang digunakan OLAP data multidimensional sedangkan OLTP menggunakan entity
Relationship diagram (ERD)
Tujuan : tujuan olap untuk efisiensi waktu query sedangkan OLTP efisiensi terhadap space/storage
DATA Multidimensional : data yang dimodelkan sebagai dimensi (dimension) dan atribut
(fact/measure)
CUBE : kumpulan data yang disatukan untuk mempercepat query
KOMPONEN :
Fact table : data yang ingin di Analisa dan biasanya memiliki value
Dimention Tabe : memuat informasi mengenai kapan,dimana, apa dan lainnya
TAHAPAN PROSES DESAIN :
 Memilih proses bisnis
 Memilih inti dari fact table
 Memilih dimensi
 Memilih fact yang terukur
 Melengkapi desain
Skema model data multidimensi :
1. Star Schema : alat dimana pemodelan dimensional nberisi sebuah tabel fakta pusat
Karakteristik star skema : pusat dari star disebut fact table dan setiap table berelasi
langsung dengan fact table
Kelebihan star skema : mudah dimengerti, query lebih sederhana dan lebih simple
Kekurangan : lebih boros dalam space
2. Snowflake schema : merupakan perluasan dari star yang sama-sama punya satu atau lebih
dimensi
Kelebihan : pemakaian space lebih sedikit
Kekurangan : skema data kompleks dan performa query menurun akibat join yang lebih
banyak

Anda mungkin juga menyukai