Anda di halaman 1dari 20

DATA WAREHOUSE

1812501201 Renaldi Setiawan Putra


1812501748 Ilham Farros
1812500112 Dede lukman hakim
1812500120 Rahma Putri Purnamasari
PENGERTIAN

DATA WAREHOUSE ADALAH KUMPULAN DATA YANG BERORIENTASI SUBYEK,


TERINTEGRASI, TIDAK DAPAT DIUPDATE, MEMILIKI DIMENSI WAKTU, YANG
DIGUNAKAN UNTUK MENDUKUNG PROSES MANAJEMEN DALAM MENGAMBIL
KEPUTUSAN DAN KECERDASAN BISNIS.
TUJUAN PENERAPAN DATA WAREHOUSE

1. MEMPERMUDAH PENGAKSESAN INFORMASI PERUSAHAAN


2. MENYEDIAKAN INFORMASI PERUSAHAAN SECARA KONSISTEN
3. MAMPU BERADAPTASI DAN TAHAN TERHADAP PERUBAHAN
4. MAMPU MENGAMANKAN INFORMASI PERUSAHAAN
5. MAMPU MEMBERIKAN DUKUNGAN DALAM PENGAMBILAN KEPUTUSAN
6. DAPAT DITERIMA DAN DIOPERASIKAN DENGAN BAIK OLEH PENGGUNA
PROSES UTAMA DATA WAREHOUSE

1. DATA DI-IMPORT DARI BERBAGAI SUMBER DATA INTERNAL MAUPUN EKSTERNAL


2. DATA DI-CLEANSED ATAU DIBERSIHKAN DAN DIORGANISIR SECARA KONSISTEN
SESUAI DENGAN KEBUTUHAN PERUSAHAAN
• A) DATA DI-LOAD ATAU DI-EXPORT ATAU DIMASUKKAN KE DATA WAREHOUSE
ENTERPRISE, ATAU B). DATA DI-LOAD/EXPORT/DI MASUKKAN KE DATA
MARTS DARI EDW (ENTERPRISE DATA WAREHOUSE), ATAU B) DATA
MARTS DISATUKAN MENJADI EDW
• ANALISA DILAKUKAN KETIKA DIPERLUKAN
KARAKTERISTIK DW
1. BERORIENTASI SUBJEK.
• DATA WAREHOUSE TERORGANISASI DI SEPUTAR SUBJEK
KUNCI (ATAU ENTITAS-ENTITAS PERINGKAT TINGGI) DALAM
PERUSAHAAN, DATA WAREHOUSE ADALAH TEMPAT
PENYIMPANAN BERDASAKAN SUBYEK BUKAN BERDASAKAN
APLIKASI. SUBYEK MERUPAKAN BAGIAN DARI SUATU
PERUSAHAAN. CONTOH SUBYEK PADA PERUSAHAAN
MANUFAKTUR ADALAH PENJUALAN, KONSUMEN,
INVENTORI, DALN LAIN SEBAGAINYA.
• CONTOH LAIN MISALNYA DI BANK, APLIKASI KREDIT
MENGOTOMASI FUNGSI-FUNGSI: VERIFIKASI LAMARAN
DAN CREDIT CHECKING, PEMERIKSAAN KOLATERAL,
APPROVAL, PENDANAAN, TAGIHAN, DAN SETERUSNYA.
DIDALAM DATA WAREHOUSE DATA-DATA YANG DIHASILKAN
DARI PROSES KREDIT INI, DIATUR KEMBALI
(DIKELOMPOKKAN) DAN DIINTEGRASIKAN (DIGABUNG)
DENGAN DATA-DATA DARI FUNGSI-FUNGSI LAIN, AGAR
BERORIENTASI PADA MISALNYA NASABAH DAN PRODUK.
2. TERINTEGRASI

• DATA YANG TERSIMPAN DALAM DATA WAREHOUSE DIDEFINISIKAN MENGGUNAKAN KONVERSI PENAMAAN YANG
KONSISTEN, FORMAT-FORMAT, STRUKTUR TERKODEKAN, SERTA KARAKTERISTIK-KARAKTERISTIK YANG
BERHUBUNGAN, SUMBER DATA YANG ADA DALAM DATA WAREHOUSE TIDAK HANYA BERASAL DARI DATABASE
OPERASIONAL (INTERNAL SOURCE) TETAPI JUGA BERASAL DARI DATA DILUAR SISTEM (EXTERNAL SOURCE). DATA
PADA SUMBER BERBEDA DAPAT DI-ENCODE DENGAN CARA YANG BERBEDA. SEBAGAI CONTOH, DATA JENIS
KELAMIN DAPAT DI-ENKODE SEBAGAI 0 DAN 1 DI SATU TEMPAT DAN ”M” DAN ”F” DI TEMPAT LAIN.
• CONTOH LAIN MISALNYA : DATA DARI MACAM-MACAM APLIKASI TRANSAKSI (UNTUK BANK MISALNYA:
TABUNGAN, KREDIT, REKENING KORAN) SEMUA MENGANDUNG DATA NASABAH, ADA YANG SAMA ADA YANG
SPESIFIK (YANG SAMA MISALNYA: NAMA DAN ALAMAT, YANG SPESIFIK MISALNYA: UNTUK KREDIT ADA
KOLATERAL, UNTUK REKENING KORAN ADA OVERDRAFT) DIDALAM DATA WAREHOUSE DATA-DATA YANG SAMA
HARUS DIINTEGRASIKAN DISATU DATABASE, TERMASUK MISALNYA DISERAGAMKAN FORMATNYA (SEDERHANA
TETAPI PALING SERING TERJADI – APLIKASI-APLIKASI SERING DIBELI VENDOR BERBEDA, DIBUAT
DENGAN/DIJALANKAN DI TEKNOLOGI BERBEDA-BEDA)
3. MEMILIKI DIMENSI WAKTU (TIME VARIANT)

• DATA YANG TERSIMPAN DALAM DATA WAREHOUSE MENGANDUNG DIMENSI WAKTU YANG MUNGKIN
DIGUNAKAN SEBAGAI REKAMAN BISNIS UNTUK TIAP WAKTU TERTENTU, DATA WAREHOUSE
MENYIMPAN SEJARAH (HISTORICAL DATA). BANDINGKAN DENGAN KEBUTUHAN SISTEM
OPERASIONAL YANG HAMPIR SEMUANYA ADALAH DATA MUTAKHIR! WAKTU MERUPAKAN TIPE ATAU
BAGIAN DATA YANG SANGAT PENTING DIDALAM DATA WAREHOUSE.
• DIDALAM DATA WAREHOUSE SERING DISIMPAN MACAM-MACAM WAKTU, SEPERTI WAKTU SUATU
TRANSAKSI TERJADI/DIRUBAH/DIBATALKAN, KAPAN EFEKTIFNYA, KAPAN MASUK KE KOMPUTER,
KAPAN MASUK KE DATA WAREHOUSE; JUGA HAMPIR SELALU DISIMPAN VERSINYA, MISALNYA
TERJADI PERUBAHAN DEFINISI KODE POS, MAKA YANG LAMA DAN YANG BARU ADA SEMUA
DIDALAM DATA WAREHOUSE KITA. SEKALI LAGI, DATA WAREHOUSE YANG BAGUS ADALAH YANG
MENYIMPAN SEJARAH.
4. NON-VOLATILE
• DATA YANG TERSIMPAN DALAM DATA WAREHOUSE DIAMBIL DARI
SYSTEM OPERASIONAL YANG SEDANG BERJALAN, TETAPI TIDAK
DAPAT DIPERBAHARUI (DI-UPDATE) OLEH PENGGUNA (BERSIFAT
‘HANYA-BACA), SEKALI MASUK KEDALAM DATA WAREHOUSE,
DATA-DATA, TERUTAMA DATA TIPE TRANSAKSI, TIDAK AKAN
PERNAH DI UPDATE ATAU DIHAPUS (DELETE) TERLIHAT, BAHWA
KEEMPAT KARAKTERISTIK INI SALING TERKAIT KESEMUANYA
HARUS DIIMPLEMENTASIKAN AGAR SUATU DATA WAREHOUSE BISA
EFEKTIF MEMILIKI DATA UNTUK MENDUKUNG PENGAMBILAN-
KEPUTUSAN. DAN, IMPLEMENTASI KEEMPAT KARAKTERISTIK INI
MEMBUTUHKAN STRUKTUR DATA DARI DATA WAREHOUSE YANG
BERBEDA DENGAN DATABASE SISTEM OPERASIONAL.
• DATA DALAM DATABASE OPERASIONAL AKAN SECARA BERKALA
ATAU PERIODIK DIPINDAHKAN KEDALAM DATA WAREHOUSE
SESUAI DENGAN JADWAL YANG SUDAH DITENTUKAN. MISAL
PERHARI, PERMINGGU, PERBULAN, DAN LAIN SEBAGAINYA.
SEKALI MASUK KE DALAM DATA WAREHOUSE, DATA ADALAH
READ-ONLY . PADA GAMBAR 2 DIBAWAH INI BISA DILIHAT BAHWA
DATABASE OLTP BISA DIBACA, DIUPDATE, DAN DIHAPUS. TETAPI
PADA DATABASE DATA WAREHOUSE HANYA BISA DIBACA.
5. RINGKAS
• JIKA DIPERLUKAN, DATA OPERASIONAL DIKUMPULKAN KE DALAM RINGKASAN-RINGKASAN
6. GRANULARITY
• PADA SISTEM OPERASIONAL DATA DIBUAT SECARA REAL-TIME SEHINGGA UNTUK
MENDAPATKAN INFORMASI LANGSUNG DILAKUKAN PROSES QUERY. PADA DATA
WAREHOUSE PADA MENGANALISIS HARUS MEMPERHATIKAN LEVEL-OF-DETAIL MISALKAN
PERHARI, RINGKASAN PERBULAN, RINGKASAN PER-TIGA-BULAN.
7. TIDAK TERNORMALISASI
• DATA DI DALAM SEBUAH DATA WAREHOUSE BIASANYA TIDAK TERNORMALISASI DAN
SANGAT REDUNDAN.
DASAR DARI SUATU DATA WAREHOUSE ADALAH SUATU DATA YANG BESAR YANG
MENGANDUNG INFORMASI BISNIS. DATA-DATA YANG ADA DI DALAM DATA WAREHOUSE
BISA BERASAL DARI BANYAK SUMBER, MISALKAN DARI DATABASE OPERASIONAL ATAU
TRANSAKSIONAL DAN SUMBER DARI LUAR MISALKAN DARI WEB, PENYEDIA JASA
INFORMASI, DARI PERUSAHAAN LAIN, DAN LAIN SEBAGAINYA.
SKEMA DATAWAREHOUSE

• DALAM MEMBUAT RELASI PADA DATA WAREHOUSE ADA 2 PENDEKATAN YANG


DAPAT DIGUNAKAN YAITU DENGAN SKEMA BINTANG (STAR SCHEMA) DAN
SKEMA BUTIRAN SALJU (SNOWFLAKE SCHEMA).
• SKEMA BINTANG DAN SKEMA SNOWFLAKE ADALAH SARANA UNTUK
MENGORGANISIR DATA MART – DATA MART ATAU GUDANG-GUDANG DATA
DENGAN MENGGUNAKAN BASIS DATA RELASIONAL. KEDUA SKEMA TERSEBUT
MENGGUNAKAN TABEL-TABEL DIMENSI UNTUK MENDESKRIPSIKAN DATA-DATA
YANG TERDAPAT DI DALAM TABEL FAKTA.
SKEMA BINTANG
• ENTITY RELATIONSHIP DIAGRAM ATAU ERD-NYA YANG MENYERUPAI BINTANG,
TABEL FAKTA BERADA DI TENGAH DENGAN DIKELILINGI TABEL DIMENSI DI
SAMPINGNYA.
• MERUPAKAN STRUKTUR LOGICAL YANG TERDIRI DARI TABEL FAKTA YANG
BERISI DATA FAKTUAL DIKELILINGI OLEH TABEL DIMENSI YANG BERISI
REFERENSI DATA
• SKEMA BINTANG YANG PALING SEDERHANA BIASANYA TERDIRI DARI SATU
TABEL FAKTA DAN BEBERAPA TABEL DIMENSI
• TIAP DIMENSI MEMILIKI RELASI ONE-TO-MANY KE TABEL FAKTA DAN TABEL
DIMENSI HANYA MEMILIKI SATU PRIMARY KEY, PRIMARY KEY TERSEBUT
MERUPAKAN FOREIGN KEY DARI TABEL FAKTA.
SKEMA SNOWFLAKE

• SKEMA SNOWFLAKE MERUPAKAN SKEMA BINTANG TELAH DINORMALISASI.


• PROSES NORMALISASI TABEL-TABEL DIMENSI PADA SKEMA SNOWFLAKE INI
DISEBUT DENGAN PROSES SNOWFLAKING, SEHINGGA TAMPILAN TABEL-TABEL
PADA SKEMA SNOWFLAKE BENTUKNYA MENYERUPAI SNOWFLAKE.
NORMALISASI

• NORMALISASI ADALAH PERBEDAAN UTAMA ANTARA SKEMA BINTANG DENGAN SKEMA SNOWFLAKE. BEBERAPA HAL
YANG HARUS DIPERHATIKAN ADALAH SEBAGAI BERIKUT:
• SKEMA SNOWFLAKE MENGGUNAKAN RUANG PENYIMPANAN YANG LEBIH KECIL DIBANDINGKAN RUANG
PENYIMPANAN PADA SKEMA BINTANG. HAL INI DISEBABKAN KARENA TABEL-TABEL DIMENSI YANG TELAH
DINORMALISASI MEMILIKI RECORD-RECORD YANG EFISIEN KARENA TIDAK TERJADI PENGULANGAN DATA-DATA YANG
SAMA.
• TABEL DIMENSI YANG TIDAK DINORMALISASI DAPAT MENYEBABKAN MASALAH INTEGRITAS DATA. KARENA DATA-
DATA YANG SAMA BISA MUNCUL BERULANG-ULANG, BAHKAN BISA JUGA TERJADI KESALAHAN PENGETIKAN PADA
DATA-DATA YANG SAMA TERSEBUT. SEHINGGA PADA SKEMA BINTANG HARUS DILAKUKAN PENGECEKAN
DAN MAINTENANCE SECARA BERKALA.
• PENYIMPANAN DATA PADA SKEMA SNOWFLAKE LEBIH TERORGANISIR DAN LEBIH RAPI DIBANDINGKAN DENGAN
SKEMA BINTANG.
QUERY

• PADA SKEMA SNOWFLAKE MELIBATKAN LEBIH BANYAK TABEL SEBAGAI AKIBAT DARI PROSES NORMALISASI,
SEHINGGA MENGGUNAKAN PERINTAH JOIN YANG LEBIH BANYAK DIBANDINGAN DENGAN SKEMA BINTANG.
• PADA SKEMA BINTANG,HANYA ADA SATU PERINTAH JOIN UNTUK SETIAP TABEL DIMENSI. NAMUN JIKA TIDAK
MELIBATKAN TABEL DIMENSI, MAKA PERINTAH JOIN TIDAK PERLU DIGUNAKAN. SEDANGKAN PADA
SKEMA SNOWFLAKE, JUMLAH PERINTAH JOIN YANG DIGUNAKAN BISA BERVARIASI TERGANTUNG KEBUTUHAN.
• MENGGABUNGKAN DUA TABEL MEMERLUKAN WAKTU KARENA DATABASE MANAGEMENT SYSTEM (DBMS)
MEMERLUKAN WAKTU YANG LEBIH LAMA UNTUK MEMPROSES PERMINTAAN QUERY TERSEBUT. SEBAGAI
CONTOH TABEL DIM_STORE DAN DIM_CITY TERLIHAT BERDEKATAN PADA GAMBAR SKEMA DI ATAS, NAMUN
SECARA FISIK KEDUA TABEL TERSEBUT MUNGKIN TIDAK TERLETAK BERDEKATAN DALAM MEDIA PENYIMPANAN.
AKAN TETAPI DATA-DATA YANG TERLETAK PADA SATU TABEL, KEMUNGKINAN BESAR SECARA FISIK DATA-DATA
TERSEBUT TERLETAK BERDEKATAN DALAM MEDIA PENYIMPANAN.
CONTOH STUDI KASUS

• DATA WAREHOUSE PENJUALAN MOBIL DIDESAIN MENJADI MEMILIKI DELAPAN


TABLE DIMENSI DAN SATU TABEL FACT YANG MENGHUBUNGKAN TABEL-TABEL
DIMENSI YANG ADA. NAMA DARI DATABASE INI ADALAH ASCO. KEDELAPAN
TABEL DIMENSI ITU ADALAH T_MOBIL, T_CUSTOMER, T_CABANG,
T_JENISPELUNASAN, T_LEASING, T_LOKASI, T_WAKTU, DAN T_WARNA. DARI
SEMUA TABEL DIMENSI TERSEBUT, NANTINYA AKAN DIHUBUNGKAN MELALUI
SATU TABEL FACT YANG DALAM SISTEM INI BERNAMA TABEL
T_FACT_PENJUALAN.
• SECARA JELAS KOLOM-KOLOM YANG TERDAPAT PADA TABEL FACT INI
MENUPAKAN FOREIGN KEY ATAU KUNCI TAMU YANG BERASAL DARI KUNCI
UTAMA (PRIMARY KEY) SCTIAP TABEL DIMENSI KOLOM KOLOM TERSEBUT
YAKNI NO SO (MARCHAR 15), NO ND (MVARCHAR 15), TGL ND (CHAR 4) YANG
MERUPAKAN KUNCI TAMU DARI TABEL DIMENSI T WAKTU, KODE CUSTOMER
(MARCHAR 10) YANG MERUPAKAN KUNCI TAMU DARI TABEL DIMENSI T
CUSTOMER, KODE_TIPE (NVARCHAR 6) YANG MERUPAKAN KUNCI TAMU DARI
TABEL DIMENSI T MOBIL, KODE CABANG (CHAR 6) YANG MERUPAKAN KUNCI
TAMU DARI TABEL DIMENSI T CABANG, KODE KELURAHAN (CHAR 10) YANG
MERUPAKANKUNCI TAMU DARI TABEL DIMENSI T LOKASI, JENIS PEHUNASAN
(CHAR 10) YANG MERUPAKAN KUNCI TAMU DARI TABEL DIMENSI T
JENISPEKUNASAN, KODE LEASING (MVARCHAR 4) YANG MERUPAKAN KUNCI
TAMU DARI TABEL DIMENSI T LEASING SELAIN ITU JUGA TERDAPAT KOLOM
YANG BERFUNGSI SEBHAGAI PENGUKURAN (MEASURES) TINGKAT PENJUALAN
MOBIL YAKNI KOLOM GROSS PROFIT (MONEY 8), DAN JUMLAH UNIT (BIGINT 8)

Anda mungkin juga menyukai