ETL
(Extract – Transform – Load)
Tanpa ada fungsi ini, maka data warehouse tidak memiliki informasi
strategis.
ETL menjalankan proses ekstraksi sumber data agar sesuai persyaratan,
bersih, dan terintergasi dalam format yang sesuai,untuk pemprosesan
query, dan membentuk backbone data warehouse.
ETL
Data akan bergerak dari sumber ke database sumber target data
Fokus: Menyiapkan data untuk peraporan / Analisis
Sources DSA DW
TAHAP-TAHAP UTAMA PROSES ETL
Solusi : algoritma kompleks harus dirancang untuk menyesuaikan record dari ketiga file dan
membentuk kelompok dari record yang cocok. Tidak ada algoritma kecocokan yang dapat secara
lengkap menentukan kelompok. Apabila kriteria kecocokan terlalu ketat, maka record akan keluar
dari group, sebaliknya apabila kreteria kecocokan terlalu longgar, suatu kelompok dapat
memasukan lebih dari satu konsumen
Multiple Sources Problem
• Satu elemen data memiliki lebih dari satu sumber.
• Solusi langsung adalah dengan menetapkan prioritas yang lebih tinggi
pada satu dari dua sumber, dan mengambil unit cost produk dari
sumber tersebut. Kadangkala, solusi langsung seperti ini tidak sesuai
dengan kebutuhan pengguna data warehouse. Kita harus memilih file
berdasarkan tanggal update terakhir, atau untuk beberapa situasi,
menentukan sumber yang sesuai tergantung filed lain yang
berhubungan.
DATA LOADING
Pemuatan/Loading data
• Pemuatan data mengambil data yang telah disiapkan, dan
menerapkan dan menyimpannya dalam data warehouse
• Terminologi:
• Initial Load — mengisi semua tabel pada tabel data warehouse untuk
pertama kali
• Incremental Load — menerapkan perubahan yang berjalan secara periodic
• Full Refresh —menghapus seluruh isi satu atau lebih tabel dan memuat ulang
data baru (initial load adalah refresh semua tabel dalam tabel)
Menerapkan data: Teknik dan proses
• load,
• append,
• Destructive merge,
• constructive merge.
Load
• Apabila tabel target yang akan dimuatkan telah ada, dan telah
memiliki data didalamnya, proses load akan menghapus seluruh data
yang ada, dan menerapkan data dari file yang datang.
• Apabila tabel telah kosong sebelum di muatkan, proses pemuatan
data dilakukan langsung dari file yang datang
Mode Penerapan data
Append
• Penambahan/extension dari pemuatan
• Apabila data telah ada dalam table, proses penambahan dilakukan
secara langsung terhadap data yang datang, dengan
mempertahankan data yang ada pada tabel target.
• Apabila record yang datang duplikasi dengan record yang telah ada,
kita dapat mendefinisikan bagaimana untuk menangani duplikasi data
yang datang:
• Record yang datang dapat ditambahkan sebagai duplikat
• Opsi lainnya, record duplikat yang datang ditolak sepanjang proses penambahan
Mode penerapan data
Destructive Merge
• Menerapkan data yang datang pada target data
• Apabila primary key dari record yang datang sesuai dengan key record
yang ada, maka akan dilakukan update record yang sesuai tersebut
• Apabila record yang datang merupakan record baru tidak sama
dengan record yang ada, maka dilakukan penambahan record pada
target tabel
Model penerapan data
Constructive Merge
• Sedikit berbeda dengan destructive merge
• Apabila primary key dari record yang datang sesuai dengan key record
yang ada, maka record tersebut akan dibiarkan dan menambahkan
record baru dengan memberi tanda (mark) sebagai record
supercending dari record lama.
Model perapan data
Opsi perangkat ETL
• Mesin transformasi data
• Memperoleh data melalui replikasi
• Generator Kode
Mesin transformasi data
• Terdiri dari algoritma pengolahan/manipulasi data yang dinamis dan rumit
• Perangkat ini mengambil data dari sekumpulan system sumber pada interval yang
didefinisikan, menjalankan transformasi data secara terperinci, mengirimkan hasil
pada lingkungan target, dan merapkan data pada file target
• Perangkat tersebut memberikan fleksibiltas untuk mengarahkan berbagai system
sumber, memilih metode yang sesuai untuk transformasi data, dan menerapkan
pemuatan penuh dan pemuatan bertahap
• Fungsionalitas perangkat tersebut meliputi seluruh proses ETL
Memperoleh data melalui replikasi