Anda di halaman 1dari 16

Data Warehouse

MATERI 2

Dr. Wilda Susanti, M. Kom


Komponen Data Warehouse
Staging Area, juga dikenal sebagai zona pendaratan, adalah wilayah penyimpanan sementara yang
digunakan untuk Pemrosesan Data. Area Staging Data terletak di antara Sumber Data dan Target Data,
yang biasanya berupa Gudang Data, Data Mart, atau Repositori Data lainnya.

Data Source merupakan sumber data yang akan dilakukan analisis. Data source dapat berupa
database, file spreadsheet dan lainya.

Data Storage Merupakan tempat penyimpanan data yang telah di extract dan dianalisis.

Metadata merupakan data yang tersimpan dan menerangkan mengenai data tempat metadata
tersimpan. Metadata dapat juga diartikan sebagai data yang merepresentasikan data lainya.

Information Delivery merupakan salah satu komponen data warehouse yang menangani pengiriman
(delivery) data dari satu tempat ke tempat lainya dalam data warehouse

Management and Control komponen data warehouse yang memiliki fungsi untuk mengatur
manajemen akses ke dalam data warehouse. Hanya user yang berhak yang dapat mengakses sumber
daya yang ada di data warehouse
Jenis-Jenis Data Warehouse

Enterprise data warehouse.


Merupakan basis data pusat untuk dukungan keputusan di dalam seluruh perusahaan.

Data Mart. Adalah bagian dari warehouse yang khusus untuk lini bisnis tertentu seperti sales
atau finance. Dalam jenis data ini, biasanya data berasal langsung dari sumber.

Operational Data Store. Jenis ini memiliki ruang lingkup perusahaan yang luas tapi tidak seperti
seperti jenis yang pertama. Sebab data di dalamnya ter-update secara real time dan berguna
untuk kegiatan bisnis yang rutin.
Istilah yang Berhubungan dengan Data Warehouse

Merupakan bagian dari gudang data yang mendukung


•Data Mart pembuatan laporan dan analisis data untuk unit, bagian
atau operasi perusahaan.

pemrosesan basis data yang menggunakan tabel fakta dan


•Online Analytical Processing (OLAP) dimensi untuk menampilkan berbagai bentuk laporan,
analisis, dan queri dari sejumlah besar data.

•Pemrosesan transaksi online (OLTP) Adalah pemrosesan yang menyimpan data tentang operasi
transaksi sehari-hari.

Tabel berisi kategori dengan data ringkasan terperinci yang dapat


dilaporkan. Laporan hasil juga dapat ditentukan dalam tabel fakta
•Tabel dimensi
sebagai dimensi waktu (dalam bentuk bulanan, triwulanan, dan
tahunan).
Ini adalah tabel yang umumnya berisi angka dan data historis, di mana
kunci yang dihasilkan (kunci) sangat unik karena kunci tersebut terdiri
•Tabel fakta dari kunci asing (foreign key), yang merupakan kunci utama (primary key)
dari beberapa dimensi tabel terkait .

Merupkan sistem yang memberi pengguna informasi yang


menjelaskan bagaimana sistem ini dapat menganalisis situasi dan
•DSS mendukung keputusan yang baik.
Proses KDD (Knowledge Discovery in Database)

Pemilihan pengumpulan data operasional (pemilihan) Data darurat harus


1. Pemilihan data dilakukan sebelum langkah penggalian informasi dalam KDD dimulai.
Hasil pemilihan data yang digunakan untuk proses penambangan data
disimpan dalam file terpisah dari basis data operasional.

Sebelum proses penambangan data dapat dilakukan, proses pembersihan data harus
2. Pra- dilakukan untuk menjadi fokus KDD.
pemrosesan / Proses pembersihan mencakup, antara lain, menghilangkan duplikasi data,
pembersihan memeriksa ketidakkonsistenan data dan memperbaiki kesalahan dalam data, seperti
B. Kesalahan pengetikan.

3. Transformasi Pengkodean adalah proses transformasi data sehingga data tersebut cocok untuk
proses penambangan data. Pengkodean dalam proses KDD adalah proses kreatif dan
sangat tergantung pada jenis atau pola informasi yang dicari dalam database
Penambangan data menggunakan teknik atau metode untuk menemukan
pola atau informasi menarik dalam data yang dipilih. Teknik, metode, dan
4. Penambangan data algoritma dalam penambangan data sangat berbeda. Memilih metode atau
algoritma yang tepat sangat tergantung pada tujuan umum dan proses
KDD.

Informasi sampel yang dihasilkan dari proses penambangan data harus


5. Interpretasi / evaluasi ditampilkan dalam bentuk yang mudah dipahami oleh pihak yang
berkepentingan. Fase ini merupakan bagian dari proses KDD, yang
disebut interpretasi. Fase ini termasuk memeriksa apakah pola atau
informasi yang ditemukan bertentangan dengan fakta atau hipotesis
yang ada.

KDD mencakup seluruh proses pencarian pola atau informasi dalam database, dari pemilihan dan
kompilasi data hingga representasi pola dalam bentuk yang mudah dipahami oleh pihak yang
berkepentingan. Penambangan data adalah salah satu komponen dalam KDD yang berfokus pada
mengekstraksi pola tersembunyi dalam database.
Bagaimana pengembangan Data Warehouse
penerimaan Mahasiswa Baru Untuk Informasi
Strategik Pada Universitas?
Bentuk informasi strategik adalah ringkasan informasi baik yang berasal dari lingkungan internal
maupun eksternal organisasi, dan penggunanya adalah manajemen di tingkat puncak

Karakteristik yang harus dimiliki oleh sebuah sistem informasi strategik

Integreted Harus memiliki pandangan yang menyeluruh tentang


perusahaan

Informasi yang disajikan harus akurat dan memenuhi aturan


Data Integrity
serta proses bisnis perusahaan

Accessible Informasi harus dapat diakses dengan mudah dan dapat


dianalisis

Setiap factor terkait dengan kegiatan bisnis harus memiliki


Cradible tepat satu nilai

Informasi harus tersedia dalam time frame yang telah


Timely
ditentukan
Sumber data warehouse berasal dari berbagai OnLine Transaction Processing (OLTP)
database

OLAP (Online Analytical Processing) adalah suatu metode khusus untuk melakukan analisa
terhadap data yang terdapat dalam media penyimpanan data (database) dan kemudian
membuat laporannya sesuai dengan permintaan pengguna

Data yang terdapat dalam data warehouse merupakan hasil ekstraksi dari database operasional.
Kemudian dengan query tertentu, data tersebut dimanfaatkan oleh Business Intelligence Application
untuk menyajikan informasi strategik yang akan digunakan sebagai instrumen penunjang dalam
proses evaluasi, perencanaan dan pengambilan keputusan strategik oleh pimpinan puncak.
Metode Perancangan Datawarehouse
a. Metode Inmon

Arsitektur data warehouse


menurut Inmon terbagi menjadi
4 level yaitu Operasional, Data
Warehouse, Data Mart dan
Individual.
Inmon menggunakan pendekatan top-down dalam desain data warehouse.
Perancangan data warehouse Bill Inmon menggunakan model subject
oriented dimana semua data terkait operasional dimasukkan ke dalam data
warehouse tanpa mempertimbangkan prioritas dari pengguna. Semua data
yang ada di data warehouse akan menjadi acuan bagi setiap data mart dimana
setiap perubahan dalam data warehouse akan mempengaruhi data dalam
data mart
Proses desain data warehouse menurut Inmon meliputi:

• Ekstraksi data dari sumber data operasional (database operasional) ke data staging
area.
• Data dinormalisasi dengan aturan 3NF. Data kemudian dikelompokkan berdasarkan
kategori kemudian data yang telah dinormalisasi dipecah menjadi entitas-entitas.
• Entitas yang telah dibuat kemudian disimpan ke dalam tabel di database
warehouse.
• Data warehouse kemudian dipecah menjadi data mart yang dapat digunakan per
departemen.
b. Metode Kimball

Kimball menggunakan pendekatan bottom-up dimana data dari setiap data mart
menjadi acuan dalam pembuatan data warehouse. Setiap perubahan dalam data
mart akan mempengaruhi isi dari data warehouse secara keseluruhan.

Berbeda dengan Inmon yang tidak


melibatkan end user selama
proses perancangan data
warehouse, Kimball melibatkan
end user selama proses
perancangan data warehouse.
Arsitektur data warehouse
menurut Kimball terbagi menjadi
4 level meliputi Operational, Data
Mart, Data Warehouse dan
Individual.
Proses pembuatan desain data warehouse menurut
Kimball meliputi:

• Ekstraksi data dari sumber data operasional ke data staging area.


• Data tidak dinormalisasi namun dibuat menjadi tabel fakta (fact table) dan tabel
dimensional dimana tabel fakta berkorelasi dengan tabel dimensi.
• Data yang telah terkumpul kemudian dibuat data mart.
• Kumpulan dari data mart dibuat menjadi data warehouse
STUDI KASUS

Membuat suatu sistem On Line Analytical Processing (OLAP)


pada Sistem Penjualan yang menangani analisis data penjualan
sehingga dapat memberi kemudahan untuk mendapatkan
informasi strategis sebagai acuan dalam pengambilan
keputusan
 Penjualan rumah
Hasil yang didapat adalah informasi  Penjualan motor
tentang tren penjualan  Penjualan barang
di minimarket dll

 Lakukan perancangan database dengan ERD


 Lakukan Analisa dan Perancangan Data Warehouse

Anda mungkin juga menyukai