Pertemuan II
Metadata
Non Volatile
Butiran Data
Data Operasional
Dataset
Data Berorientasi Subjek
Data Operasional
Dataset
Data Berorientasi Subjek
Manajer Analis
Direktur
Distribusi Bisnis
Penjualan
Surat
Proses Pemesanan
Pinjaman Konsumen
Tagihan Pelanggan
Pendapatan Rekening
Apps Perusahaan
Asuransi
Proses Klaim
Tabungan Rekening
2/1/2018 Data Warehouse 151
7
Data Berorientasi Subjek (Contoh: Data Warehouse)
Perusahaan
Asuransi
Klaim Klaim
Otomotif Pekerja
Data Warehouse:
2/1/2018
Klaim
Data Warehouse 151 8
Data Terintegrasi
Sisi Penghimpunan
Sisi Dataset
Berbeda Aplikasi
Berbeda OS
Berbeda Jenis
2/1/2018
2 Data Warehouse 151 8
/1/2018
Data Terintegrasi
Sisi Penghimpunan
Berbeda Penamaan:
Sisi Dataset Customer_file.xls, File_cust14.xls
Berbeda Atribut:
Cust_name, customer_nm
Berbeda Format:
Rp100.000,00; 200£; 100$
2/1/2018
2 Data Warehouse 151 9
/1/2018
Data Terintegrasi
Kelebihan
• Berbasis korporat
• Dirancang dengan arsitektur yang relevan
• Penyimpanan data bersifat tunggal
• Pengawasan dan peraturan yang terpusat
• Dapat melihat hasil dengan cepat dalam pembangunan iteratif
• Kelemahan
• Memakan waktu lama
• Sangat mungkin gagal
• Membutuhkan kemampuan lintas-fungsional tinggi
• Pengeluaran tinggi tanpa jaminan
Kelebihan
• Pembangunan bagian-bagian menjadi lebih cepat dan mudah
• Lebih mudah balik modal dan ada jaminan
• Kemungkinan gagal kecil
• Bersifat incremental, dapat menjadwalkan data mart yang penting dulu
• Memungkinkan tim proyek tumbuh dan belajar
Kekurangan
• Tiap data mart memiliki pandangan sempit
• Memungkinkan adanya redundansi dalam tiap data mart
• Data bisa bersifat inkonsisten dan tidak ramah
• Antarmuka yang tak terkendali
Data Source
Data Staging
Information
Delivery
Data produksi
Data internal
Data terarsip
Data eksternal
Data Source
Data produksi
• Berasal dari bermacam-macam sistem operasional dari perusahaan
• Satu makna « sebuah akun » bisa berarti banyak dari sistem operasional yang
berbeda-beda
• Tantangan:
• menstandardisasi perbedaan satu data dengan lainnya (berdasar sistem)
• Mengkonversi data (format, nama, atribut, dst)
• Integrasi butiran data menjadi data yang bermakna untuk disimpan
Data internal
• Contoh: data pribadi pengguna, profil konsumen, data departemen
• Tidak bisa diabaikan, karena menambah nilai informasi yang
ditampilkan
• Tantangan:
• format berkas yang berbeda
• Menyambungkan dengan database per departemen
Data Terarsip
• Penggunaan data lawas dalam data warehouse
• Banyak metode pengarsipan, bergantung pada tingkat ke-lawas-an data
• Data warehouse menyimpan snapshot historis dari data.
• Berguna untuk menganalisis tren
Data eksternal
• Data statistik dari agen eksternal
• Mengatasi keterbatasan data dari dalam perusahaan
• Umumnya, dibutuhkan konversi format dari data eksternal ke dalam data
warehouse perusahaan
Extraction
• Menghadapi data source yang berbeda-beda
• External tools/in-house program
• Hasil ekstraksi data ke lingkungan fisik yang berbeda
Transformation
• Cleaning
• Standardisasi data
• Kombinasi butiran data dari berbagai sumber
• Peringkasan
• Data siap = data bersih, terstandardisasi, dan teringkas
Load
• Initial load biasanya besar
• Update kemudian, data warehouse cukup menambahkan perubahan data dan
revisi data
• Siapa penggunanya?
• Pengguna biasa dan pemula laporan ad hoc
• Analis bisnis kueri kompleks, analisis multidimensi, analisis statistika
• Manajer dan direktur Sistem informasi eksekutif
• Data mining
• Online query and reports
Operasional
• Frekuensi ekstraksi
• Metode ekstraksi
• Aturan bisnis untuk ekstraksi
• Informasi mengenai proses transformasi
Tipe Metadata
End-user