Pengenalan ETL
ETL adalah singkatan dari Extract, Transform, dan Load. ETL berperan untuk membentuk data
yang siap dianlisis dari sumber data yang sudah ada. Caranya dengan menggabungkan fact dan
dimension table untuk mendapatkan data lengkap.
ETL memproses data dari data transaksi yang disebut Online Transaction Processing (OLTP)
sehingga bisa disimpan kembali menjadi Online Analytical Processing (OLAP).
01
3. Data null atau string kosong
Untuk kesalahan ini, perlu dilakukan pengecekan mengenai izin penggunaan data null, dan
pengaruhnya pada operasional pengaksesan data.
4. Data yang duplikat
Jika menemukan data duplikat, berarti perlu dilakukan deduplikasi (distinct) untuk
menghilangkan data-data yang duplikat. Namun pengguna perlu mengecek backend system lebih
lanjut mengenai penerimaan data duplikat.
5. Ukuran data yang besar
Karena ukuran data yang besar, maka pengguna membutuhkan waktu lebih lama untuk
memproses data. Dengan demikian, dibutuhkan resource mesin yang besar.
02
Cara terbaik mendapatkan source adalah dengan mengumpulkan seluruh data menjadi 1,
menyimpannya sebagai file, dan diubah menjadi Json format.
Pengenalan ELT
ELT adalah singkatan dari Extract, Load, dan Transform. Seluruh proses ELT berada pada database
yang berfungsi sebagai data lake. Biasanya ELT hanya digunakan saat membutuhkan proses query
dan mentranformasi data warehouse ke akses level yang lebih tinggi.
ETL ELT
1. ETL menyimpan data pada staging server 1. ELT menggunakan source dan destination
terlebih dahulu, kemudian di-load ke tempat yang sama.
berbeda.
2. Waktu development cenderung lebih 2. Waktu development cenderung lebih
lama, karena menggunakan framework atau singkat, karena cukup menggunakan query
tools tertentu sesuai kebutuhan. based.
3. ETL dapat menggabungan berbagai data, 3. ELT menggabungkan data di data lake,
dari internal dan eksternal. sehingga memudahkan proses denormalisasi
data.
03