Anda di halaman 1dari 3

data warehouse biasanya mulai keluar sebagai database yang sangat besar, yang

berisi jutaan bahkan


ratusan juta rekaman data. Sebagai data ini dikumpulkan dari berbagai produksi
sistem, database sejarah dibangun bahwa analis bisnis dapat digunakan untuk melacak
perubahan dalam
organisasi dari waktu ke waktu dan menganalisis kondisi saat ini. Untuk tetap segar dan
akurat, yang
data warehouse menerima update reguler
Memperbarui data warehouse harus cepat, efisien, dan otomatis, atau
nilai akhir dari data warehouse dikorbankan. Hal ini umum untuk data warehouse untuk
mengandung tiga sampai sepuluh tahun data saat ini dan sejarah. alat data-pembersihan
dapat menggabungkan
data dari banyak sumber ke dalam satu database, mengotomatisasi pengumpulan data dan
verifikasi, menghapus
data yang tidak diinginkan, dan menjaga data dalam sistem manajemen database

Elemen-elemen dasar Data Warehouse


1.Source System

Operasional sistem yang berfungsi mencatat transaksi dari


suatu bisnis. Source System biasa disebut juga sebagai
Legacy System.
2.Data Staging Area
Tempat penyimpanan data sementara, untuk melakukan
proses Clean, Transform, Combine, Deduplicate,
Household, archive, dan menyiapkan sumber data untuk
digunakan Data Warehouse.
Staging Area tidak diperuntukkan sebagai sumber data
untuk reporting karena datanya masih kotor dan bersifat
sementara.
3.Presentation Server
Target mesin yang secara fisik adalah mesin dimana data
dari Data Warehouse di organisasikan dan disimpan untuk
dilakukan query oleh End User, Reporting dan aplikasi yang
lain. Disini data disimpan dengan framework Dimmensional.
Jika menggunakan Relational Database maka tabel akan
diorganisasikan dalam bentuk Star-Schema, namun
jika tidak menggunakan Relational Database maka akan
disimpan dalam bentuk OLAP.
(mengenai OLAP akan dibahas pada sesi tersendiri)

Relational Database : Suatu konsep penyimpanan data secara terstruktur


Flat files adalah file sistem operasi yang record dalam filenya tidak berisi informasi tentang
struktur file atau hubungan antar record yang dikomunikasikan ke aplikasi yang
menggunakannya. Flat file bukan database karena tidak masuk dalam kriteria di atas yang
sudah dibahas
Spreadsheet adalah lembaran kertas yang menunjukkan akuntansi atau data lain dalam baris dan
kolom;

ekstraksi data adalah tindakan atau proses mengambil data dari sumber data (biasanya tidak
terstruktur atau tidak terstruktur) untuk pengolahan data lebih lanjut atau penyimpanan data
(migrasi data).
Proses pembersihan data adalah proses menggabungkan
data dari banyak sumber ke dalam satu database, mengotomatisasi pengumpulan data dan
verifikasi, menghapus
data yang tidak diinginkan, dan menjaga data dalam sistem manajemen database8

Setelah proses pembersihan data selesai dilakukan selanjutnya Data tersebut dikumpulkan dan
dimasukkan kedalam query sehingga dapat dianalisis dalam tools-tools analisis. Sehingga data
yang telah selesai dianalisis dapat diterima dan digunakan oleh pengguna dengan akses yang
sesuai.

Anda mungkin juga menyukai