Day-11 Maintenance Data Warehouse
Day-11 Maintenance Data Warehouse
Warehouse
By : Sumadi Eko Putra
Apakah Data Warehouse Maintenance Itu ?
• Cara kita dalam mengukur bisnis kita akan berubah seiring waktu.
• Melihat perilaku pengguna yang berbeda, atau mencoba membuat model
prediktif dengan adanya peluncuran product baru.
• Kita perlu melacak metrik baru yang terkadang ini berarti membuat field
terhitung baru atau kolom, tampilan, atau tabel baru.
Mengapa metrik baru menyebabkan masalah di Data
Warehouse?
• Saat engineer atau analis membuat tabel, kolom, atau tampilan baru
untuk melacak metrik, mereka tidak selalu mengikuti konvensi penamaan
yang ditetapkan untuk Data Warehouse.
• Interpretasi menjadi sulit oleh seorang analis yang tidak terbiasa dengan
metrik baru.
• Dapat membuat pekerjaan duplikat
Cara menambahkan metrik baru dengan benar.
• Konvensi Penamaan
– Kita juga perlu memastikan tampilan, tabel, dan kolom ini mengikuti konvensi
penamaan Data Warehouse.
Mengapa metrik lama penting?
• Metrik mungkin menjadi tidak akurat atau tidak lagi layak untuk
dianalisis. Kita ingin mencegah data tersebut ditanyakan sehingga orang
lain dapat mencapai kesimpulan yang salah.
Mengapa masalah metrik lama terjadi?
Masalah izin terjadi ketika tool BI atau akses Data Warehouse tidak
mencerminkan status karyawan.
• Karyawan baru perlu meminta akses ke Data Wareouse
• Karyawan berganti peran
• Karyawan tidak lagi bekerja
• Izin khusus
• Berbagi akun
Cara menangani izin dengan benar.
• Memastikan tingkat akses tool BI mencerminkan status pekerjaan
karyawan untuk membantu Anda melacak pengguna dan mencegah
masalah keamanan.
• Sebaiknya atur izin pengguna di tingkat tim karena saat Anda
meningkatkan penggunaan dan menambahkan lebih banyak pengguna,
pelacakan akan lebih mudah dilakukan.
• Berbagi akun membuat pengguna tidak mungkin bertanggung jawab atas
tindakan apa yang telah mereka lakukan.
• Sebaiknya tambahkan dan hapus pengguna secara terprogram untuk
untuk memastikan mereka tidak mempertahankan akses ke data yang
seharusnya tidak mereka miliki.
Mengapa pemodelan penting?
• Jumlah data yang Anda miliki akan bertambah seiring pertumbuhan
bisnis dan tujuan berubah dan Anda mulai melacak metrik baru.
• Seiring bertambahnya data, Anda perlu mempertimbangkan apakah cara
mendesain objek Data Warehouse; skema, tabel, tampilan, dan kolom
masih masuk akal berdasarkan cara penggunaan datanya.
• Query non-kompleks membutuhkan waktu terlalu lama untuk dijalankan
Mengapa DWH membutuhkan optimasi berkelanjutan?
• Seiring pertumbuhan perusahaan, data yang ditanyakan juga berubah.
• Data baru, analisis baru, dan tujuan bisnis baru akan mengubah data apa
yang ditanyakan.
• Struktur asli objek Data Warehouse mungkin perlu dikonfigurasi ulang
untuk mengoptimalkan penggunaan dan kinerja berdasarkan cara
kuerinya.
Bagaimana cara terus mengoptimalkan DWH?
• Identifikasi kueri lambat dan tambahkan indeks
– Kita dapat menggunakan perintah EXPLAIN dan perintah EXPLAIN ANALYZE.
Perintah EXPLAIN menunjukkan rencana kueri yang dihasilkan tetapi tidak
menjalankan kueri. Untuk melihat hasil eksekusi query yang sebenarnya, Anda dapat
menggunakan perintah EXPLAIN ANALYZE.
Secara prinsip, restore memang hampir sama dengan backup yang memiliki
tujuan untuk menyelamatkan data. Bedanya, jika backup ini cara kerjanya dengan
cara menduplikasi atau menyalin data, sedangkan restore yang bertugas
mengembalikan data maupun sistem sama seperti pada keadaan awalnya.
Data Warehouse Lifecycle
Data Warehouse Lifecycle