Anda di halaman 1dari 30

DATA WAREHOUSE

Kelompok :
Siva Rahmatullah (2217020071)
Muhammad Fauzan (2217020075)
Raissa Almaira (2217020077)
Eradirawati S. (2217020081)
Pengertian

Data warehouse adalah sistem yang


mengumpulkan data dari berbagai sumber di
satu pusat penyimpanan yang digunakan untuk
pelaporan dan analisis data dan dianggap
sebagai komponen inti dari intelijen bisnis.
Kapan data warehouse digunakan?

Ada beberapa kondisi yang membuat bisnis perlu menggunakan data


warehouse:
• Perusahaan memiliki berbagai sumber data untuk diolah
– perusahaan besar umumnya memiliki data dari berbagai sumber.
Mengumpulkan data-data tersebut menjadi satu menjadi tantangan
tersendiri. Adanya data warehouse membantu dalam extract,
transform, load (ETL) data agar bisa menggabungkan berbagai data
secara terpusat dan lebih mudah dianalisis.
• Perusahaan memiliki volume data dalam jumlah besar – pada
dasarnya, memiliki lebih banyak data membuat perusahaan lebih sulit
mengelolanya. Data warehouse berfungsi dalam menyimpan data
besar tersebut.
Kapan data warehouse digunakan?

• Perusahaan perlu menerapkan machine learning – perusahaan dapat


menggunakan machine learning untuk memahami lebih banyak
tentang data, termasuk memprediksi pola pembelian dan mengirim
penawaran yang dipersonalisasi. Untuk mendapatkan data yang
mumpuni, diperlukan data warehouse khusus agar informasi yang
dikumpulkan bisa terpusat dan mudah dibaca.
Karakteristik Data Warehouse
#1 Berorientasi pada subjek (subject-oriented)
Sistem yang ada di data warehouse dirancang untuk
mengumpulkan informasi berdasarkan subjek-subjek
yang spesifik berkaitan dengan perusahaan, bukan
pada proses atau kegiatan operasional yang sedang
berjalan.
Misalnya, data warehouse di kantor perbankan
mengumpulkan data tentang nasabah, kebijakan, dan
simpan-pinjam.
Informasi yang didasarkan pada subjek memudahkan
dalam analisis data dan mengesampingkan informasi
yang tidak diperlukan saat mengambil keputusan.
#2 Terintegrasi (integrated)
Kumpulan data yang ada di data
warehouse berasal dari berbagai sumber yang
terintegrasi dalam satu platform.
Data yang diperoleh kemudian diubah
formatnya menyesuaikan data lain yang
sebelumnya sudah terkumpul dalam sistem.
#3 Memiliki interval waktu (time-variant)
Semua informasi yang ada di data
warehouse disimpan dengan rentang waktu
tertentu (seperti mingguan, bulanan, maupun
tahunan). Artinya, setiap kali data akan
dianalisis, analyst bisa mengambil data
berdasarkan rentang waktu yang diinginkan
dan berguna dalam melakukan perbandingan
dari satu waktu ke waktu lain.
#4 Tidak berubah (non-volatile)
Data yang berada di data warehouse bersifat
permanen. Ini berarti setelah data
dimasukkan, data tidak akan bisa dihapus.
Dalam data warehouse, hanya ada dua jenis
operasional data, yaitu data loading dan data
access. Tidak tersedia fungsi lain, seperti
menghapus atau menyisipkan data.
Contoh Penggunaan Data Warehouse

• Perusahaan ritel menggunakan data warehouse untuk


pemasaran dan distribusi. Dengan data warehouse,
perusahaan bisa melacak item, menetapkan harga,
serta menganalisis tren pembelian pelanggan.

• Perusahaan yang bergerak di


bidang healthcare memanfaatkan data
warehouse untuk mengubah data perusahaan menjadi
informasi yang bisa dianalisis dan ditindaklanjuti. Hasil
analisis berfungsi dalam menaikkan tingkat akurasi alat
kesehatan, pengalaman pasien, dan efisiensi waktu
pelayanan medis.
Jenis-jenis data warehouse
• Enterprise data warehouse (edw) — Pusat
penyimpanan data untuk seluruh bagian
perusahaan
• Operational data warehouse — Lokasi
penyimpanan data yang diperbarui dan digunakan
secara rutin. Contohnya, jumlah transaksi per hari.
• Data mart — Tempat penyimpanan yang dirancang
untuk departemen tertentu atau lingkup yang
kecil. Misalnya, divisi marketing.
Perbedaan Data Warehouse vs Database

Sekilas, data warehouse terlihat sama dengan


database (kumpulan data yang disimpan dengan
sistem tertentu).
Database Data Warehouse
Pengambilan Data
• Database : Pengambilan data secara real-time pada database merujuk pada proses mengambil informasi dari database
secara langsung saat data tersebut tersedia atau diperbarui. Dengan menggunakan teknik ini, aplikasi atau sistem dapat
mendapatkan akses langsung ke data terbaru tanpa perlu menunggu proses pembaruan atau sinkronisasi manual. Hal ini
memungkinkan untuk mendapatkan informasi yang lebih akurat dan terkini dalam waktu yang sangat singkat.
• Data Warehouse : Pengambilan data saat dibutuhkan pada data warehouse merujuk pada pendekatan di mana data diambil
dari penyimpanan data ketika ada permintaan atau kebutuhan spesifik. Ini berarti data tidak selalu disimpan secara real-
time seperti pada database transaksional, tetapi diambil dari data warehouse ketika ada permintaan untuk analisis atau
pelaporan. Pendekatan ini membantu mengoptimalkan kinerja penyimpanan data dan memungkinkan untuk melakukan
analisis lebih efisien terhadap data yang tersedia.

Penyimpanan Data
• Database : Penyimpanan database terbatas pada satu aplikasi mengacu pada praktik membatasi penggunaan atau akses
database hanya untuk satu aplikasi tertentu. Ini berarti bahwa database hanya dapat diakses, dimanipulasi, atau
dimodifikasi oleh aplikasi yang spesifik dan tidak bisa diakses oleh aplikasi lain atau oleh pengguna secara langsung.
• Data Warehouse : Penyimpanan data warehouse fleksibel pada satu aplikasi mengacu pada kemampuan untuk menyimpan
dan mengelola berbagai jenis data dalam satu tempat yang disebut sebagai data warehouse, dan memungkinkan akses,
analisis, dan manipulasi data tersebut melalui aplikasi tunggal dengan cara yang mudah disesuaikan atau disesuaikan
dengan kebutuhan bisnis atau pengguna.

Tipe Data
• Database : Tipe data data terbaru pada database mengacu pada format atau jenis data yang digunakan untuk
merepresentasikan informasi terbaru yang dimasukkan atau diperbarui dalam database. Ini dapat mencakup berbagai jenis
data, seperti teks, angka, tanggal, gambar, atau jenis data lainnya yang relevan dengan konteks penggunaan database
tersebut. Mereka adalah representasi aktual dari entitas atau informasi yang baru saja dimasukkan ke dalam database.
• Data Warehouse : Tipe data data historis hingga terbaru pada data warehouse merujuk pada jenis data yang mencakup
rentang waktu dari data historis hingga data terbaru yang tersimpan dalam penyimpanan data tersebut. Ini berarti data
warehouse menyimpan sejarah perubahan data dari waktu ke waktu, memungkinkan analisis tren dan pola dari data masa
lalu hingga saat ini. Dengan cara ini, pengguna dapat melihat evolusi data dari masa lalu hingga saat ini untuk mendapatkan
wawasan yang lebih lengkap dan mendalam tentang bisnis atau proses yang mereka analisis.
Meta Data
• Database : Metadata ringkasan data detail pada database merujuk pada informasi yang memberikan gambaran umum
tentang data yang disimpan di dalamnya dengan tingkat detail yang lebih mendalam. Ini termasuk metadata tentang
struktur tabel, kolom, tipe data, indeks, serta batasan integritas data yang diterapkan. Selain itu, metadata ini mungkin juga
mencakup statistik tentang distribusi nilai dalam kolom, informasi tentang kunci primer dan kunci asing, dan detail lainnya
yang membantu dalam pengelolaan dan analisis data yang lebih mendetail. Metadata ringkasan data detail ini membantu
pengguna untuk memahami struktur dan konten data dengan lebih mendalam, sehingga memfasilitasi pengelolaan dan
analisis data yang lebih cermat dan efektif.
• Data Warehouse : Metadata ringkasan data umum pada data warehouse merujuk pada informasi yang memberikan
gambaran umum tentang data yang disimpan di dalamnya. Ini termasuk metadata tentang struktur keseluruhan dari data
warehouse, sumber data, hubungan antar-tabel, dan deskripsi umum tentang jenis data yang tersedia. Metadata ringkasan
semacam ini membantu pengguna untuk memahami secara cepat konten dan struktur data warehouse, sehingga
memudahkan pengguna dalam menjelajahi dan memahami data yang tersedia untuk analisis dan pelaporan lebih lanjut.
Komponen Data Warehouse
Komponen Data Warehouse
1. Central database (Gudang Data)
Komponen utama harus dimiliki oleh perusahaan
dan usaha yang sudah besar adalah harus
mempunyai gudang. Gudang tersebut dijadikan
sebagai alat untuk menyimpan data-data maupun
produk.
Database terpusat berfungsi sebagai pondasi yang
menyimpan semua data bisnis. Adanya data yang
terpusat memudahkan bisnis dalam membuat
laporan. Selain itu, untuk data-data yang ada di
dalam gudang tersebut mempunyai bentuk berbeda-
beda dan disesuaikan lagi dengan kebutuhan.
Jenis gudang itu pun ada beberapa, yaitu:
• Typical relational database: database yang
menyimpan serta menyediakan data yang
saling berhubungan satu sama lain;
• Analytics database: database untuk
menyimpan serta mengelola analitik;
• Data warehouse appliance: database untuk
melakukan penyimpanan dan manajemen
data;
• Cloud-hosted database: database berbasis
cloud.
Komponen Data Warehouse
2. Tool ETL
ETL (extract, transform, load) adalah proses
integrasi data dengan cara menggabungkan data
melalui berbagai sumber. Data itu disimpan ke
dalam satu penyimpanan data yang ada
di warehouse.
• Extract: mengumpulkan data dari berbagai
sumber;
• Transform: memodifikasi data menjadi format
yang lebih rapi;
• Load: memindah data ke tujuan tertentu.
Proses ini dilakukan menggunakan tool ETL. Data
yang sudah dikumpulkan kemudian diubah ke
format yang sesuai dengan sistem di data
warehouse. Jika format data sudah selaras, analisis
data lebih cepat dilakukan.
Dengan tools ETL, kita dapat mengelola data
warehouse dengan lebih praktis. Dengan adanya
beberapa tools tersebut juga bisa akan
berpengaruh terhadap waktu, metode dan tipe
dari modifikasi data tersebut.
Contoh tools ETL ???????
Contoh Tools ETL
Berikut adalah beberapa contoh tools ETL (Extract, Transform, Load)
yang sering digunakan dalam industri:

Apache Spark
Meskipun bukan secara khusus dirancang untuk ETL, Apache Spark
adalah kerangka kerja pemrosesan data yang sangat cepat dan
serbaguna yang dapat digunakan untuk mengimplementasikan alur kerja
ETL yang kompleks dan efisien.

Pentaho Data Integration (Kettle)


Sebuah platform ETL open-source yang kuat yang menyediakan berbagai
alat untuk mengekstrak, mentransformasi, dan memuat data dari
berbagai sumber ke dalam berbagai destinasi.
Komponen Data Warehouse
3. Metadata
Meta data adalah potongan informasi yang menjelaskan isi data.
Komponen data warehouse ini bertujuan memperjelas konteks data
supaya lebih mudah dipahami saat nanti digunakan.

Jenis meta data ada dua, yaitu:


• Technical meta data: berisi rincian informasi untuk developer dan
manager untuk mengelola data warehouse;
• Business meta data: menyimpan informasi umum data warehouse.

Contoh meta data misalnya :


• Meta data suatu dokumen:
• Meta data tabel dalam laporan: ………………..
• Meta data profil karyawan: …………………….
• Meta data customer: ………………………….
Meta data suatu dokumen: nama pembuat,
judul dokumen, dan tanggal dibuat;
Meta data tabel dalam laporan: judul tabel,
nama kolom, serta isiannya;
Meta data profil karyawan: nama lengkap,
alamat, jabatan, departemen;
• Meta data customer: nama lengkap, nama
panggilan, alamat email, histori produk yang
dibeli.
Komponen Data Warehouse
4. Access tools ke data warehouse
Data warehouse yang ada di perusahaan tidak bisa bekerja
tanpa adanya tools yang menyediakan akses
ke database. Tools memungkinkan pengguna dapat berinteraksi
dengan data-data yang ada di warehouse.
Contoh access tools ???
• Query and reporting tools: membuat laporan analisis berupa
spreadsheet atau bentuk visual lainnya. Contohnya ……………..
• Application development tools: menyusun laporan sesuai
tujuannya masing-masing. Contohnya …………………………
• Data mining tools for data warehousing: membantu
pengumpulan data agarlebih sistematis. Contoh : ……...
• OLAP tools: memungkinkan analisis data warehouse dari
berbagai sudut pandang. Contoh ………………….
Contoh Access Tools
1. Application development tools
Contoh : Visual Studio: Lingkungan pengembangan terintegrasi (IDE) yang
dikembangkan oleh Microsoft, yang mendukung pengembangan berbagai jenis aplikasi
termasuk aplikasi desktop, web, dan mobile.

2. Data Mining
Contoh : Oracle Data Mining: Komponen dari Oracle Advanced Analytics yang
membantu pembuatan model prediktif dan mencakup beberapa teknik seperti multiple
regression, prediction, dan lain-lain. Membantu perusahaan untuk mengidentifikasi dan
mengacu kepada audiensi potensial, memperkirakan pelanggan potensial, mengelas
profil pelanggan, dan mendeteksi frauda secara langsung

3. OLAP
Contoh : SAP BusinessObjects: Suite perangkat lunak BI yang menyediakan berbagai alat
analisis data termasuk yang berbasis OLAP untuk pembuatan laporan dan analisis data.
Komponen Data Warehouse
5. Manajemen Gudang Data
Supaya gudang mampu menyimpan serta mengelola data
dengan baik, tentu butuh Manajemen Gudang Data.
Komponen data warehouse inilah yang memastikan seluruh
proses dalam gudang berjalan lancar.
Karena itu, Manajemen Gudang Data bertanggungjawab
untuk:
• Mengamankan data;
• Memperbarui data;
• Memilih prioritas tugas;
• Menjaga kualitas hingga melakukan backup serta recovery
data jika terjadi hal buruk.
Arsitektur data warehouse
Arsitektur data warehouse
arsitektur data warehouse terdiri dari tiga
tingkatan/tier:
1. Bottom tier: server database yang menyimpan
data. Data yang sering diakses disimpan dalam
penyimpanan cepat seperti SSD. Sedangkan
yang jarang digunakan ditaruh di alat
penyimpanan lain.
2. Middle tier: memuat alat analitik seperti OLAP
yang memungkinkan data diakses dan dikelola;
3. Top tier: tingkatan terbawah yang menampilkan
laporan untuk pengguna.
Jelaskan :
a. Data source : Sumber atau asal data yang digunakan dalam sistem komputer atau
aplikasi untuk berbagai tujuan, termasuk analisis, pelaporan, atau pengolahan informasi
lainnya. Contoh nya database, file data dan sistem aplikasi
b. Staging Area : merujuk pada tempat penyimpanan sementara di dalam proses ETL
(Extract, Transform, Load) atau ELT (Extract, Load, Transform) dalam pengolahan data.
Staging area berfungsi sebagai tempat untuk menampung data mentah yang diekstrak
dari sumber data sebelum diproses dan dimuat ke dalam data warehouse atau sistem
penyimpanan data lainnya.
c. Warehouse : merujuk pada komponen utama tempat data disimpan, diatur, dan diakses
untuk analisis bisnis. Warehouse dalam konteks ini mirip dengan gudang fisik di mana
data disimpan secara terstruktur dan dapat diakses oleh pengguna untuk tujuan analisis
dan pelaporan.
d. Data Mart : subset dari data warehouse yang mengandung data yang disesuaikan untuk
kebutuhan spesifik suatu departemen atau unit bisnis dalam organisasi. Data mart sering
kali dibangun untuk menyediakan akses cepat dan efisien ke data yang relevan dan
digunakan secara khusus oleh satu atau beberapa departemen atau tim dalam organisasi.
e. User : mengacu pada individu atau entitas yang menggunakan data warehouse untuk
tujuan analisis, pelaporan, dan pengambilan keputusan. Pengguna dapat mencakup
berbagai pihak, termasuk pengambil keputusan bisnis, analis data, manajer departemen,
dan staf lain yang membutuhkan akses ke informasi untuk menjalankan tugas mereka.
f. Penjelasan bagan tersebut
Data source: Data diekstrak dari data source dan
disimpan di staging area.
Staging area: Data di staging area dibersihkan, diubah
formatnya, dan divalidasi sebelum dipindahkan ke data
warehouse.
Data warehouse: Data warehouse menyimpan data
historis dari berbagai data source.
Data mart: Data mart dibuat dari data warehouse dan
difokuskan pada kebutuhan bisnis tertentu.
• Users: Users menggunakan data warehouse dan data
mart untuk analisis data, pelaporan, dan pengambilan
keputusan.
Manfaat Data Warehouse
1. Mengakses Data Lebih Cepat:
Dengan kemampuan untuk mengakses data lebih cepat, perusahaan dapat merespons perubahan
pasar atau kebutuhan pelanggan dengan lebih efektif. Ini membantu dalam pengambilan keputusan
yang lebih cepat dan tepat waktu.

2. Informasi Konsisten Bagi Semua Pihak


Dengan menyediakan informasi yang konsisten bagi semua pihak terkait, baik internal maupun
eksternal perusahaan, dapat meningkatkan transparansi, kepercayaan, dan kolaborasi di antara mereka.

3. Memprediksi Trend/Pola di Masa Depan


Dengan menganalisis data historis, perusahaan dapat mengidentifikasi tren atau pola di masa depan.
Ini membantu dalam perencanaan strategis, pengembangan produk, dan pemasaran yang lebih efektif.

4. Membantu Perusahaan Mengambil Keputusan


Dengan memanfaatkan data untuk analisis yang lebih mendalam, perusahaan dapat membuat
keputusan yang lebih informasional dan tepat sasaran. Ini dapat mengurangi risiko dan meningkatkan
kinerja keseluruhan perusahaan.

Anda mungkin juga menyukai