1.
Pendahuluan
a. Data Warehouse
Data Warehouse merupakan koleksi data yang memiliki sifat object-oriented, timevariant, dan terintegrasi dalam sebuah koleksi data sebagai pendukung dalam proses
pengambilan keputusan. Data Warehouse berperan sebagai gudang data, yang nantinya data-data
yang ada di dalamnya dapat digunakan untuk diolah sewaktu-waktu diperlukan. Data Warehouse
digunakan untuk ruang lingkup yang lebih spesifik seperti pada suatu organisasi atau perusahaan.
b. Fungsi DW
- sebagai tempat menyimpan segala macam data dalam skala besar yang bisa di ambil
sewaktu waktu.
-
c. Keuntungan menggunakan DW
- Data diorganisir dengan baik untuk query analisis dan sebagai bahan untuk pemrosesan
-
transaksi.
Perbedaan diantara struktur data yang heterogen pada beberapa sumber yang terpisah
dapat diatasi.
Aturan untuk transformasi data diterapkan untuk memvalidasi dan mengkonsolidasi data
pada artikel sebelumnya tentang Data Warehouse dan Beberapa Karakteristiknya di link
ini]
4. a). Bila diinginkan, data marts dibuat sebagai subset atau bagian dari EDW (enterprise
data warehouse), atau b) Data marts disatukan menjadi EDW
5. Analisa dilakukan ketika diperlukan
Apa saja yang menjadi komponen-komponen utama dari suatu data warehouse?
Data sources: data bersumber dari berbagai sistem operasional dan mjngkin juga berasal
dari berbagai sumber data eksternal.
Data extraction: Data di-ekstrak dengan menggunakan software komersial atau bisa juga
software yang dibuat sendiri yang biasa disebut dengan istilah ETL (Extract-TransformLoad)
Data loading: Data di-load/dimasukkan dalam staging area, dimana data di transform
dan dibersihkan. Data kemudian siap untuk di-load ke data warehouse.
Metadata: Metadata di-maintain untuk akses oleh pengguna dan staf IT. Metadata
meliputi berbagai rules untuk mengorganisir ringkasan data yang mudah untuk di-index
dan di-search
2.
a.
yang informasinya lebih ditujukan untuk seorang Data Analyst dan Business Analyst
(dengan ditambah visualisasi tentunya). Dalam prakteknya, data mining juga mengambil
data dari data warehouse. Hanya saja aplikasi dari data mining lebih khusus dan lebih
spesifik dibandingkan OLAP mengingat database bukan satu-satunya bidang ilmu yang
3.
-
4.
Big Data
Big Data adalah sebuah teknologi baru di dunia teknologi informasi dimana
memungkinan proses pengolahan, penyimpanan dan analisis data yang
sangat kompleks dalam beragam bentuk/format (Variety), berjumlah besar
(Volume) dan pertambahan data yang sangat cepat (Velocity). Pengolahan
dan analisis data dalam jumlah sangat besar ini memerlukan waktu yang
relatif jauh lebih singkat dengan menggunakan Big Data dibanding teknologi
data sebelumnya, misalnya relational database seperti MySQL.
5.
DW dan D mart
a. Data mart
Data Mart merupakan bagian dari Data Warehouse yang mendukung pada
tingkat departemen atau fungsi bisnis tertentu pada perusahaan dengan kata
lain, sebuah data mart adalah bentuk sederhana dari sebuah gudang data yang
difokuskan
pada
subjek
tunggal
(atau
area
fungsional),
seperti
Penjualan,
Keuangan, atau Marketing. Data Mart sering dibangun dan dikendalikan oleh satu
departemen dalam sebuah organisasi. Mengingat subjek tunggal fokus departemen
tersebut, data mart biasanya menggambar data dari hanya beberapa sumber.
Sumber bisa sistem operasional internal, data warehouse pusat, atau data
eksternal.
b. ETL
Proses ETL (Extraction, Transformation, Loading) merupakan proses yang
harus dilalui dalam pembentukan data warehouse. ETL adalah suatu proses
mengambil dan mengirim data dari data sumber ke data warehouse. Dalam proses
pengambilan data, data harus bersih agar didapat kualitas data yang baik.
Contohnya ada nomor telepon yang invalid, ada kode buku yang tidak eksis lagi,
ada beberapa data yang null, dan lain sebagainya. Pendekatan tradisional pada
proses ETL mengambil data dari data sumber, meletakan pada staging area, dan
kemudian mentransform dan meng-load ke data warehouse.
c. ELT
ELT merupakan variasi dari ETL (Extraction, Transformation, Loading). ELT
memungkinkan data mentah dimuat secara langsung pada data warehouse yang
kemudian akan transformasi pada aata warehouse tersebut. Kemampuan ini sangat
berguna untuk memproses set data yang besar yang diperlukan untuk Business
Intelligence dan analisis data yang besar. Salah satu kemampuan utama ELT adalah
pengurangan waktu loading jika dibandingkan dengan model ETL. Mengambil
keuntungan dari kemampuan pemrosesan yang dibangun dalam infrastruktur data
warehouse dapat mengurangi waktu yang dihabiskan data untuk melakukan transit
dan lebih hemat biaya.
d. OLAP
OLAP adalah singkatan dari Online Analytical Processing. OLAP digunakan
untuk pengambilan keputusan, OLAP berguna dalam melakukan analisis data yang
sudah ada untuk membantu dalam pengambilan keputusan di masa yang akan
datang. OLAP merupakan teknologi yang memproses data di dalam database dalam
struktur multidimensi, menyediakan jawaban yang cepat untuk query dan analisis
yang kompleks. Data yang disajikan biasanya merupakan suatu fungsi agregasi
seperti summary (rangkuman), max (nilai
data)
dan delete (menghapus data) berbagai macam data, seperti penjualan, pembelian,
produksi dan lain sebagainya. OLTP bertujuan untuk memproses suatu transaksi
secara langsung melalui komputer yang tergabung didalam jaringan. Contohnya
seperti aplikasi yang digunakan minimarket dalam melayani penjualan, jika ada
suatu transaksi penjualan, seorang kasir dapat langsung memasukan data kedalam
aplikasi yang terhubung didalam jaringan, sehingga pemrosesan data terbantu oleh
adanya OLTP tersebut. Berdasarkan datanya, OLTP menggunakan data asli atau hari
ini dan dapat di update setiap saat. OLTP biasanya memiliki ukuran yang relatif
kecil.
Cloud Based