Basic Knowledge
Jika datasource dan data yang akan ditampilkan relatif kecil maka proses query harus nya
bisa diselesaikan dengan cepat, tapi jika proses query nya lama maka perlu kita cek Kembali
query nya mungkin ada sub query yang membuat proses menjadi lama dan kurang optimal
8. Apa yang anda ketahui tentang ETL (Extract, Transform, Load)? Serta seberapa pentingkah ETL
dalam suatu proses data untuk kebutuhan perusahaan atau pengembangan bisnis?
ETL (Extract, Transform, Load) merupakan dasar pengolahan data, dimana pengolahan data
tersebut merupakan upaya integrasi data dari berbagai sumber untuk menghasilkan informasi
sesuai dengan kebutuhan.
ETL sangat penting untuk kebutuhan perusahaan dalampengembangan bisnis karena dengan
ETL suatu perusahaan akan dapat dengan mudah mendapatkan data/informasikan yang
dibutuhkan dengan akurat dengan beberapa manipulasi struktur dari data tersebut.
9. Apa yg dimaksud dengan data-mart? Apa hubungan data-mart dengan ETL dan jelaskan?
Data-mart merupakan bagian dari datawarehouse yang sangat memungkinkan untuk diolah
menjadi sebuah informasi atau reporting bahkan untuk keperluan analisis data.
Menurut pemahan saya, Data-mart adalah sebuah datasource atau data sumber yang bisa kita
olah untuk keperluan reporting ataupun analisis atau keperluan bisnis dimana untuk mengolah
Data-mart tersebut kita menggunakan istilah ETL (Extract, Transform, Load) untuk memanipulasi
struktur data supaya menampilkan data sesuai dengan yang dibutuhkan dan mudah dipahami
oleh user dalam hal ini pelaku bisnis orang yang membutuhkan data tersebut.
Secara singkat hubungan data-mart dengan ETL adalah Data-marat-> data sumber sedangan ETL
-> cara untuk mengolah data-mart tersebut.
10. Dalam suatu perusahaan pasti membutuhkan sebuah laporan yg dapat menentukan langkah
bisnis untuk kedepan, untuk mengakomodir hal tersebut apa yg perlu dilakukan oleh seorang
data engineer agar menghasilkan reporting yang optimal?
Menurut pendapat saya untuk mengoptimalkan reporting ada 2 pendekatan :
1. Proses data
Untuk data reguler maka perlu kita proses dengan automation karena format dan struktur
data akan sama dan berkelanjutan, tujuan dari automation adalah konsisten dalam
penyediaan data.
2. Struktur Data
Dari struktur data maka kita olah data sesuai dengan kebutuhan, menyajikan informasi
sesuai dengan kebutuhan dari tim bisnis. Oleh karena itu perlu berkoordinasi dengan tim
bisnis untuk kebutuhan data yang diharapkan lebih optimal.
Use Case
1. Buatlah struktur database untuk penjualan produk yang outputnya bisa menampilkan laporan
penjualan semua produk dengan filtering antara lain:
a. Berdasar cabang tertentu
b. Berdasarkan range tanggal tertentu
Dokumentasi DDL
CREATE DATABASE penjualan;
Capture :
Semua transaksi
2. Di era saat ini, tentu Anda sudah tidak asing lagi dengan aplikasi pengantar makanan semacam
grab-food atau go-food. Buatlah struktur database dari aplikasi layanan pesan antar tersebut
menurut pengamatan Anda.
a. Table pembeli
b. Table penjual
c. Table transaksi
d. Detail transaksi
e. Table Barang
g. Table provinsi
Relasi Antar Tabel
3. Tolong provide data mart yang dapat mendukung output reporting (laporan) sebagai berikut:
a. Kategori produk yang paling banyak diminati
b. SELECT b.nama, COUNT(a.id_barang) AS total_terjual From detail_transaksi
A INNER JOIN barang B ON detail_transaksi.'id_barang'=barang.’id_barang'
GROUP BY b.nama ORDER BY total_terjual DESC;
Grafik penjualan produk per jam, per hari, per minggu, per bulan, per tahun
Data penjualan per jam
SELECT hour,COUNT(*) AS jumlah_jam FROM tbl_transaksi WHERE
hour=DATE(NOW()) GROUP BY hour;
f. Top 5 customer dengan pembelian terbanyak beserta detail kategori produk apa yang paling
banyak dibeli
SELECT b.nama, COUNT(a.id_pembeli) AS total_beli From transaksi A INNER
JOIN pembeli B ON transaksi.'id_pembeli'=pembeli.’id_pembeli' GROUP BY
b.nama ORDER BY total_beli DESC LIMIT 5;
4.
Langkah-langkah untuk melakukan proses ETL untuk keperluan reporting pengeluaran tiap business
unit setiap bulannya.
a. Extract data
Sebelum proses extract dilakukan, terlebih dahulu kita definisikan kebutuhan terhadap
sumber data yang akan kita gunakan. Dalam study case ini datasource sudah bersih sehingga
tidak perlu lagi dilakukan extract data dan data tersebut sudah bisa lanut ke proses
selanjutnya.
b. Transform
Pada proses ini mengubah bentuk atau struktur data diolah menjadi sesuai dengan
kebutuhan, dalam case ini struktur yang kita butuhkan adalah
- Id
- Nama
- Email
- Position
- Date
- Value
- Name (business unit)
c. Load
Pada proses ini kita menjalankan script query untuk mengeluarkan data berupa informasi
yang sesuai dengan kebutuhan, kitab isa juga memasukan (load) data hasil olahan kedalam
database.