1. Apa yang dimaksud dengan ETL? Exract Transform Loading (ETL) merupakan tahapan dalam membangun Data warehouse Extract adalah proses pengambilan data yang diperlukan dari sumber datawarehouse dan selanjutnya dimasukkan pada staging area untuk diproses pada tahap berikutnya. Transform proses standarisasi terhadap data pada satu format yang konsisten. Beberapa contoh ketidakkonsistenan data tersenut dapat diakibatkan oleh tipe data yang berbeda, data length dan lain sebagainya Loading adalah memindahkan data ke datawarehouse. Ada dua loading data yang kita lakukan pada datawarehouse, yaitu inisial load dan Incremental Load
2. Jelaskan proses-proses yang terjadi pada proses Extraction ! Jawab: Tahap penemuan Data (Data Discovery Phase), dilakukan dengan cara mengumpulkan dan mendokumentasikan sumber data, Tahap Analisa konten data (Data Content Analysis), merupakan pemahaman mengenai isi data yang digunakan dalam penentuan proses selanjutnya Tahap Penentuan perubahan Data (Determining Changed Data), meliputi proses menganalisa tiap nilai data, menghilangkan/eliminasi data yang tidak sesuai.
3. Jelaskan proses-proses yang terjadi pada proses Transformation ! Jawab: Cleaning Data membersikan data yang memiliki anomali, redudensi dan inkonsisten. Proses cleaning ini terdiri atas beberapa tahapan: a) Parsing menempatkan dan mengidentifikasi elemen data individual dalam file sumber dan kemudian mengisolasi elemen-elemen data dalam file sasaran. b) Correcting memperbaiki komponen data menggunakan algoritma tertentu dan sumber data skunder. c) Standardizing mengubah data menjadi format pilihan data yang konsisten dengan menggunakan standar dan aturan bisnis tertentu. d) Matching Mencari dan mencocokkan catatan pada data, dikoreksi dan standarisasi data berdasarkan aturan bisnis yang telah ditetapkan untuk menghilangkan duplikasi. e) Consolidating Menganalisis dan mengidentifikasi hubungan antara catatan yang sesuai dan mengkonsolidasikan / menggabungkannya ke dalam satu representasi. Confirming Data pembentukan struktur dan nilai data
4. Jelaskan 3 Jenis penanganan perubahan data yang terjadi pada proses Loading
Jawab: Loading dimensions pembentukan dimensi table, yang terdiri atas 3 yaitu: 1 dimesi, 2 dimensi dan 3 dimensi Contoh 1 dimensi Waktu Jumlah Waktu A 1,000,000 Waktu B 1,300,000 Waktu C 1,700,000
Contoh 2 dimensi Waktu Barang A Barang B Waktu A 1,000,000 2,000,000 Waktu B 1,300,000 2,800,000 Waktu C 1,700,000 2,500,000
Contoh 3 dimensi
Loading Fact pemuatan table fakta dengan pengukuran yang ada Managing partition Partisi memungkinkan tabel (dan indeks nya) secara fisik dibagi menjadi minitables untuk tujuan administratif dan untuk meningkatkan kinerja query