- Index Compression
o Index compression akan secara otomatis dilakukan oleh oracle pada saat pembuatan
index Bitmap atau B-Tree
o Tujuan dari index compression adalah untuk efisiensi storage, namun akan
meningkatkan kinerja CPU
- Local attribute :
o Normal table structure (columns, constraint)
o Partition type
o Key & Value
o Row movement
- Physical attribute :
o Tablespace
o Extent size, block attribute
- Equipartitioning
o Jika dua tabel memiliki partition key dan partition key value yang sama, maka bisa
dikatakan tabel tersebut merupakan equipartitioned
o Sangat berguna untuk tabel yang memiliki common key (key yang pasaran), seperti
relasi master-detail (misal tabel-user & tabel-detail-user)
o Operasi partitionwise join membutuhkan adanya equipartitioning
o Index dapat di equipartitioned dengan tabel
- Full partitionwise joins
o Full partitionwise join membagi large join menjadi small join
o Tabel yang di join-kan harus equipartition pada key join-nya
o Ketika full partitionwise join di eksekusi secara paralel, hasilnya akan berupa partisi
- Partial partitionwise joins
o Partial partitionwise join hanya membutuhkan satu tabel yang terpartisi pada join
key nya
o Tabel yang terpartisi dinamai reference table
o Tabel lainnya akan secara dinamis dipartisi ulang sesuai dengan partisi yang ada di
reference table
o Partial partitionwise join hanya dapat dilakukan secara paralel
EXTRACTION
o Extraction memiliki dua metode
Logical, terdapat dua jenis
Full extraction
o Semua data di pull (diambil)
o Hanya sedikit informasi yang di track (tidak perlu
menspesifikan yang mana yang akan di pull, langsung di
gradak)
o Membutuhkan waktu yang lebih lama untuk pulling data
Incremental extraction
o Data di pull dalam beberapa bagian
o Harus melakukan track data apa yang ingin di pull (harus
menspesifikan data mana yang akan di pull)
o Waktu yang dibutuhkan lebih cepat untuk pulling data
o Dapat dlakukan dengan menggunakan CDC, CDC dapat
capture dan publish data yang telah di commit dengan
mode,
Synchronous
Trigger pada source database
memperbolehkan data yang berubah di
capture pada saat itu juga
Asynchrounous
Data yang berubah dapat di capture setelah
terjadi operasi DML di commit
Physical, memiliki dua jenis
Online extraction
o Pull data langsung dari source system
Offline extraction
o Pull data yang ada di staging area
o Staging area meliputi flat files, dump files, dan transportable
tablepspace
Flat files, membutuhkan data yang predefined
dengan generic format
Dump files, harus dalam format oracle
Redo dan archive log, data terletak pada dump files
yang spesifik
Transportable tablespace, merupakan metode yang
bagus, dan cepat untuk memindahkan data dengan
volume besar
o Pilihan tentang bagaimana data dieksrak secara logical mempengaruhi cara data di
ekstrak secara physical
o Untuk implementasi ekstraksi file, dapat dilihat
Ekstraksi data ke file
Menggunakan spooling dari SQLPlus
Menggunakan OCI atau Pro*C untuk dump file
Menggunakan Data Pump untuk meng-export data ke oracle dump
file
Menggunakan external tables
Ekstraksi melalui distributed operation, dengan menggunakan teknologi ini,
database oracle dapat secara langsung melakukan query table yang
lokasinya ada di bermacam-macam source system
o Hal-hal yang perlu diperhatikan pada saat menentukan method adalah sebagai
berikut
Business needs (Mempertimbangkan kebutuhannya)
Lokasi dari source dan target system
Ketersediaan (availabbility) dari source system
Waktu yang diperlukan untuk mengekstrak data
TRANSPORTATION
o Terdapat tiga pilihan dasar yang dapat dipilih pada saat melakukan transportation
Transportation menggunakan flat files
Dengan metode ini, data disimpan dalam bentuk file dan dikirimkan
melalui metode pengiriman standar, ftp, secara fisik, download atau
yang lainnya. Memungkinkan untuk mentransfer data antar system
yang berbeda
Tingkat kegagalan baru akan diketahui pada saat flat file di proses
untuk dimasukan ke target system
Sangat efisien dan efektif jika transportasinya antara system yang
sama
Transportation melalui distributed operation
Metode transportation ini memungkin target system secara
langsugn mengakses data yang ada pada source system dengan cara
query secara langsung.
Tingkat kegagalan dapat diketahui secara langsung dari hasil query
yang dilakukan
Transportation menggunakan transportable tablespaces
Dengan menggunakan transportable tablespace, data files (yang
berisi table, index dan semua object database yang ada) dapat
secara langsung di transfer ke database lainnya. Dapat dikatakan
hanya sekadar export & import database
Merupakan metode tercepat untuk perihal memindahkan data yang
sangat besar
Source dan target database bisa memiliki block size yang berbeda
Sangat berguna untuk mentransfer data dari OLTP ke data
warehouse,
Namun, sebelum oracle 10g, database source dan target harus
menggunakan OS yang sama
LOADING
o Terdapat beberapa mekanisme data-loading, yaitu
SQL *Loader
Akan melakukan load data yang ada di flat file ke tabel yang sudah
ada
Dapat melakukan operasi transformasi sederhana ketika loading
Irect-path loading bisa digunakan untuk mengurangi load time
Ketika menggunakan metode ini, data pada flat file tidak dapat
diakses (not accessible) sampai dengan data selesai di load
External Tables
External tables merupakan read-only tables dimana data disimpan di
luar database tepatnya di flat file
Data dapat di query (seperti virtual table) menggunakan supported
language pada database
Tidak boleh ada operasi DML dan tidak satupun index dapat dibuat
Mendeskripsikan bagaimana external data harus
ditampilkan/direpresentasikan pada database
Sangat berguna pada environment dimana external source harus di-
join dengan obje database lain lalu harus ditransformasi
Dan sangat berguna ketika external data berukuran sangat besar
dan tidak sering di query
OCI dan direct-path APIs
Memungkinkan untuk transformation dan loading pada waktu yang
bersamaan
Source system diakses secara online
Tidak perlu tahapan perantara seperti flat file
Export/Import
Sangat efektif untuk small loads
Memudahkan transfer antara database oracle dengan OS yang
berbeda-beda
Data Pump
TRANSFORMATION
o Data transformation merupakan tahapan paling kompleks dan paling costly (mahal)
dari proses ETL
o Transformation dapat berupa hanya konversi data sederhana sampai dengan
operasi yang lebih kompleks
o Banyak operasi transformation dapat dilakukan di database oracle
o Data dapat di transformasi dengan dua cara
Multistage
Flat file di load ke staging table
Terbentuk table (contoh : NEW_SALES_S1)
Validasi key nya dengan cara melihat dimension tablenya
Terbentuk table kedua (contoh : NEW_SALES_S2)
Konversi source key sesuaikan dengan key yang ada pada
warehouse
Terbentuk table ketiga (contoh : NEW_SALES_S3)
Insert data yang sudah di konversi ke tabel yang ada di warehouse
Jadilah data baru di tabel (contoh : SALES)
Pipeline
Flat files, berisi external table
Validasi key nya dengan melihat dimension tablenya
Lalu konversi source key sesuai dengan key yang ada pada
warehosue
Insert pada tabel di warehouse
Data baru di insert pada tabel warehouse
PERTANYAAN
- Nomor 1
o Pengertian ETL, klik
o Ekstraksi Logika dan Fisik, klik
o Tipe Transformasi, klik
- Nomor 2
o Pengertian dan manfaat partisi, klik
o Jenis partisi tabel atau partisi index, klik
o Rekomendasi partisi dengan SQL berdasarkan kota
- Nomor 3
o Pengertian dan manfaat materialized view, klik
o Kegunaan query rewrite
Fitur untuk secara otomatis menulis ulang(rewrite) SQL query yang
dieksekusi oleh user dengan SQL query yang lain. Dalam penerapan
materialized view, query rewrite akan me-rewrite query user menjadi query
SQL untuk menggunakan summary tables
Contohnya adalah, jika user melakukan query