Anda di halaman 1dari 8

Nama

: Abdul Karim

NIM

: 1412401054

MK

: Advanced Database Systems

Revisi Personal Assignment 2

Tinjau Pertanyaan
1.

Jelaskan integrasi data

2.

Jelaskan tiga teps dari proses ETL

3.

Mengapa proses ETL sangat penting bagi upaya data warehouse?

4.

Apa yang dimaksud dengan data warehouse real-time

5.

Sebutkan berbagai keuntungan dari data warehouse real-time

6.

Sebutkan berbagai perbedaan antara data ware house tradisional dengan data warehouse
real-time

7.

Jelaskan berbagai motivasi yang mendorong dikembangkannya data warehouse real-time

Jawaban No 1 Asli
Integrasi data adalah meliputi kombinasi data yang berada pada sumber berbeda dan
menyediakan user dengan tampilan terpadu untuk data-data tersebut. Proses ini menjadi sangat
signifikan dalam beberapa situasi, yang mencakup domain komersial (saat 2 perusahaan harus
menggabungkan database mereka) maupun secara ilmiah (mengkombinasikan hasil pencarian,
misalnya dari repositori bioinformatik). Integrasi data muncul dengan frekuensi yang meningkat
seperti volume dan kebutuhan untuk berbagi ledakan data yang ada.Halini telah menjadi fokus
dari pekerjaan teoritis yang luas, dan beberapa masalah terbuka tetap belum terpecahkan. Dalam
lingkaran manajemen, orang sering merujuk pada integrasi data sebagai Enterprise Information
Integration (Informasi Integrasi Perusahaan) atau EII.

Sistem integrasi data biasanya disebut secara formal sebagai tripel GSM. G untuk global
schema (skema global), S untuk set dari skema sumber yang heterogen, dan M untuk mapping
(pemetaan) antara query dari sumber dan skema global. G dan S diekspresikan dalam bahasa
alfabetis yang disusun oleh simbol untuk tiap hubungan respektifnya. Pemetaan M terdiri dari
pernyataan antara query dari G dan query dari S. Saat user mengajukan query dari sistem data
integrasi, mereka mengajukan query dari G dan pemetaannya kemudian menegaskan koneksi
antara elemen di skema global dengan skema sumber.
Revisi
1. Yang dimaksud dengan integrasi data adalah proses penggabungan antara dua data atau lebih
agara dapat mempermudah dalam menggunakan dan menganalisisi data tersebut dalam
mendukung manajemen informasi sebuah pekerjaan. Integrasi data dapat terpenuhi dengan
cara konsitensi dalam menenetukan variable, ukuran variable, struktur pengkodean dan atribut
data. Inilah contoh gambar integrasi data.

Sumber Data

awaban No2 Asli


Tiga teps dari proses ETL
ETL istilah yang merupakan singkatan dari ekstraksi, transformasi, & loading batch atau
dijadwalkan proses integrasi data yang meliputi penggalian data dari sumber data operasional
atau eksternal, mengubah data ke dalam format yang sesuai, dan memuat data ke dalam
repositori data warehouse. ETL memungkinkan gerakan fisik data dari sumber ke target
penyimpanan data. Langkah pertama, ekstraksi, adalah untuk mengumpulkan atau ambil data
dari dari sumbernya (s). Langkah kedua, transformasi, adalah untuk mengkonversi, memformat,
membersihkan data ke dalam format yang dapat digunakan menjadi database target. Akhirnya

langkah terakhir, pemuatan, adalah mengimpor data berubah menjadi database target, data
warehouse, atau data mart.
Langkah 1 - Ekstraksi
Langkah ekstraksi dari proses ETL melibatkan menghubungkan ke sistem sumber, dan
keduanya memilih dan mengumpulkan data yang diperlukan yang diperlukan untuk pengolahan
analisis dalam data warehouse atau data mart. Biasanya data konsolidasi dari berbagai sistem
sumber yang berbeda yang dapat menyimpan tanggal dalam format yang berbeda. Dengan
demikian proses ekstraksi harus mengkonversi data ke format yang sesuai untuk pengolahan
transformasi.Kompleksitas dari proses ekstraksi dapat bervariasi dan tergantung pada jenis dan
jumlah sumber data.

Langkah 2 - Transformasi
Langkah transformasi proses ETL melibatkan pelaksanaan serangkaian aturan atau fungsi
untuk data yang diambil untuk mengubahnya menjadi format standar. Ini mencakup validasi
catatan dan penolakan mereka jika mereka tidak dapat diterima. Jumlah manipulasi yang
dibutuhkan untuk proses transformasi tergantung pada data. Sumber data yang baik akan
memerlukan sedikit transformasi, sedangkan yang lain mungkin memerlukan satu atau lebih
teknik transformasi untuk memenuhi kebutuhan bisnis dan teknis dari database target atau data
warehouse. Proses yang paling umum digunakan untuk transformasi adalah konversi,
membersihkan duplikat, standardisasi, penyaringan, pemilahan, menerjemahkan dan mencari
atau memverifikasi jika sumber data tidak konsisten.
Langkah 3 - Peta
Beban adalah langkah terakhir dari proses ETL melibatkan mengimpor diekstraksi dan
diubah data ke dalam database target atau data warehouse. Beberapa proses beban fisik
memasukkan setiap record sebagai baris baru ke dalam tabel gudang sasaran memanfaatkan
pernyataan SQL insert. Sedangkan proses beban lainnya mencakup memasukkan massal besar
data menggunakan rutin beban massal. SQL insert adalah rutinitas lambat untuk impor data,
tetapi tidak memungkinkan untuk memeriksa integritas dengan setiap record. Rutinitas beban

massal mungkin lebih cepat untuk banyak data dalam jumlah besar, tetapi tidak memungkinkan
untuk memeriksa integritas pada beban setiap catatan individu.
Revisi
2. Penegertian ETL adalah proses yang harus dilakukan dalam pembuatan datawarehous. Di dalam
ETL ada tiga proses yaitu.
a. Ekstraksi data (Extract) proses pengambilan data dari berbagai system baik menggunaka
query ataupun aplikasi ETK itu sendiri. Ada lima pungsi eksterak data
1. Ekstrak data secara otomatis dari data sumber
2. Penyaringan data dari hasil ekstrak
3. Pengiriman data dari berbagai platform aplikasi dumber
4. Perubahan format tampilan dari format aslinya
5. Penympanan file sementara untuk penggabungan hasil ekstrak data sumber yang lain
b. Tranformasi data (Transformation) proses pengambilan data mentah dari hasil ekstraksi
disaring dan diubah sesuai dengan ketentuan yang berlaku. Ada beberapa langkah dalam
tranformasi data.
1. Memetakan input data dari skema aslinya ke skema data warehouse
2. Melakukan koversi dari tipe atau format data
3. Pembersian duplikat dan kesalahan data
4. Perhitungan nilai derivate
5. Perhitungan nilai agregat
6. Pemeriksaan integritas data
7. Pengisian nilai kosong dengan nilai aslinya
8. Pengabungan data
c. Pengisian Data (loading) proses yang dilakukan adalah proses pemuatan data dari hasil
tranformasi kedalam datawarehous dengan menjalankan SQL Script secara teratur.

Jawaban No 3 Asli
Proses ETL sangat penting bagi upaya data warehouse Karena Extract, transform, dan
load ( ETL ) merupakan sebuah sistem yang dapat membaca data dari suatu data store, merubah
bentuk data, dan menyimpan ke data store yang lain. Data store yang dibaca ETL disebut data
source, sedangkan data store yang disimpan ETL disebut target. Proses pengubahan data
digunakan agar data sesuai dengan format dan kriteria, atau sebagai validasi data dari source
system. Proses ETL tidak hanya menyimpan data ke data warehouse, tetapi juga digunakan
untuk berbagai proses pemindahan data.

Kebanyakan ETL mempunya mekanisme untuk membersihkan data dari source system
sebelum disimpan ke warehouse. Pembersihan data merupakan proses identifikasi dan koreksi
data yang kotor. Proses pembersihan ini menerapkan aturan-aturan tertentu yang mendefinisikan
data bersih. Sehingga ETL Sangat di butuhkan di database warehouse.
3. Proses ETL (Extract, Tranformation, Loading) bagi penggunaan datawarehous proses ekstrak,
tranformasi dan pengisian data merupakan system yang dapat membaca dari suatu
penyimpanan data, merubah dan meyimpan data ketempat penyimpanan data yang lainya.
Penyimpanan data yang dibaca oleh ETL disebut data source, perubahan data dilakukan agar
data sesuai dengan format yang ditentukan.

Jawaban No 4 Asli
Yang dimaksud dengan data warehouse real-time adalah komponen historis dan analitik dari
aliran data tingkat perusahaan. Aliran data ini mendukung terus menerus, asynchronous,
pengiriman multipoint data. Dengan kata lain, data yang bergerak lurus dari sumber yang berasal
untuk semua penggunaan yang tidak memerlukan beberapa bentuk pementasan. Gerakan ini
terjadi segera setelah data asli ditulis. Setiap penundaan waktu karena semata-mata untuk
mengangkut latency dan (opsional) waktu pengolahan sangat kecil untuk mengirimkan atau
mengubah contoh data yang disampaikan.
Revisi
4. Yang dimaksud degan database warehouse real time adalah sebuah gudang data yang terdapat
beberapa database sehingga datawarehous rieal time berperan meyediakan data yang
diperlukan oleh Manager, kapanpun data dibutuhkan maka datawarehous rieal time siam
memberikan data tersebut.

Jawaban No 5 Asli
Keuntungan dari data warehouse real-time Adalah Data warehouse merupakan pendekatan
untuk menyimpan data dimana sumber-sumber data yang heterogen(yang biasanya tersebar pada
beberapa database OLTP) dimigrasikan untuk penyimpanan data yang homogen dan terpisah.

Keuntungan yang didapatkan dengan menggunakan data warehouse tersebut dibawah ini
(Ramelho).
o Data diorganisir dengan baik untuk query analisis dan sebagai bahan untuk pemrosesan
transaksi.
o Perbedaan diantara struktur data yang heterogen pada beberapa sumber yang terpisah
dapat diatasi.
o Aturan untuk transformasi data diterapkan untuk memvalidasi dan mengkonsolidasi data
apabila data dipindahkan dari database OLTP kedata warehouse.
o Masalah keamanan dan kinerja bisa dipecahkan tanpa perlu mengubah sistem produksi.
Revisi
5. Keuntungan dari data warehouse real time adalah dapat memberikan sebuah data yang
dibutuhkan setiap waktu. Dan ada bebrapa keuntungan lainya
a. Data tertata dengan baik untuk analisis sebagai bahan pemrosesan transaksi
b. Penggabungan data dari sumber yang beebedah
c. Tranformasi data untuk memvalidasi dan mengkonsulidasi data saat data dipindahkan dari
OLTP ke datawarehoue
d. Masalah keamanan dapat diatasi dengan baik

Jawaban No 6 Asli
Perbedaan antara data ware house tradisional dengan data warehouse real-time Adalah : Data
warehouse memisahkan beban kerja analisis dari beban kerja transaksi dan memungkinkan
organisasi menggabung/konsolidasi data dari berbagai macam sumber. Jadi, data warehouse
merupakan metode dalam perancangan database, yang menunjang DSS(Decission Support
System) dan EIS (Executive Information System). Secara fisik data warehouse adalah database,
tapi perancangan data warehouse dan database sangat berbeda. Dalam perancangan database
tradisional menggunakan normalisasi, sedangkan pada data warehouse normalisasi bukanlah cara
yang terbaik. Dan Data warehouse rial-time melakukan perubahan kapan saja bisa.

Revisi

6. Perbedaan data warehouse tradisional dan datawarehous real time adalah didalam
perancangan untuk pengolahan databasenya. Datawarehous tradisional menggunakan
normalisasi sedangkat datawarehous real time normalisasi tidak menjadipatokan melainkan
perubahan data kapan saja bisa dilakukan disaat top manager memerlukan

Jawaban No 7 Asli
Motivasi yang mendorong dikembangkannya data warehouse real-time Adalah Membangun
data warehouse tentu saja memberikan keuntungan lebih bagi suatu perusahaan, karena data
warehouse dapat memberikan keuntungan strategis pada perusahaan tersebut melebihi pesaingpesaing mereka. Keuntungan tersebut diperoleh dari beberapa sumber (Sean Nolan,Tom
Huguelet):
Kemampuan untuk mengakses data yang besar
Kemampuan untuk memiliki data yang konsistent
Kemampuan kinerja analisa yang cepat
Mengetahui adanya hasil yang berulang-ulang
Menemukan adanya celah pada business knowledge atau business process.
Mengurangi biaya administrasi
Memberi wewenang pada semua anggota dari perusaahan dengan menyediakan kepada
mereka informasi yang dibutuhkan agar kinerja bisa lebih ef
Revisi

7. Motivasi Dalam pembangunan datawarehous real time adalah keuntungan lebih banyak yang
didapat oleh perusahaan karena datawarehous memberikan keuntungan strategis kepada
perusahaan itu sendiri dan dengan banyaknya pesaing sehingga perusahaan harus
menggunakan data warehouse. Ada banyak keuntungan yang didapat dari datawarehous yaitu
a.
b.
c.
d.

Kemanpuan akses data yang besar


Kemampuan data yang konsiste
Kemanpuan kinerja yang cepat
Mengetahui adanya hasi yang berulang

e. Menemukan adanya celah pad ape getahun bisnis dan proses bisnis
f. Mengurangi biaya administrasi
g. Memberikan wewenang pada semua anggota dari perusahaan dan informasi yang
dibutuhkan agar kinerja menjadi lebih baik.

Anda mungkin juga menyukai