serat, dan untuk ketersediaan tinggi kita memiliki dua switch Fibre Channel.
Kami memperkirakan bahwa jumlah PC klien yang akan menggunakan data
warehouse adalah antara 300 dan 500.Amadeus Hiburan data warehouse
digunakan untuk mendukung CRM kegiatan, baik cus- gan APC analisis dan
manajemen kampanye operasi. Ini berarti kampanye data respon perlu
dimuat ke gudang data banyak kali sehari, dan kampanye seg- pemikiran
perlu query data warehouse banyak kali sehari. Pengguna perlu
menjalankan membeli analisis terhadap data pesanan di gudang data
beberapa kali sehari.
Mengalokasikan ruang disk pada SAN untuk analisis Layanan idealnya
harus dipisahkan dari database server untuk alasan yang sama sehingga
Anda dapat mengoptimalkan dan menyempurnakan penggunaan disk
secara terpisah. Hal ini dilakukan dengan mengkonfigurasi disk pada
jaringan area penyimpanan (SAN) menjadi dua set terpisah drive
logis.Beberapa pertimbangan untuk ukuran server database dari data
warehouse adalah sebagai berikut:
o
Apakah kita mengambil ELT atau ETL pendekatan dalam mengisi NDS
/ ODS: Sebuah pendekatan ELT load data ke server database dalam
format baku (dengan kata lain, sama seperti format sistem sumber)
dan kemudian menggunakan kekuatan server database untuk
mengubah data ke dalam format NDS atau ODS dalam operasi
berbasis set melalui prosedur yang tersimpan
Kita perlu berurusan dengan lisensi. Secara umum, ada dua SQL Server
model lisensi:
Server + lisensi CAL: Kami membeli lisensi untuk server dan lisensi
akses klien (CAL) untuk setiap klien mengakses server.
Pertimbangan penyimpanan
Database lain akan menciptakan adalah metadata. Hal ini tidak besar,
mungkin 10 20GB. Allo- cating 50GB akan cukup. ini diperkirakan
berdasarkan isi dari metadata database. The metadata database toko tujuh
jenis metadata: definisi data dan pemetaan metadata, struktur data
metadata, sistem sumber metadata, ETL proses metadata, kualitas data
metadata, audit metadata, dan penggunaan metadata.
Sebuah volume sistem berkas digunakan untuk ETL penyimpanan
sementara, mungkin 20 persen menjadi 30 persen dari ukuran data volume,
dalam RAID 5. Persentase ini ditentukan berdasarkan sumber mana tabel
sistem akan perlu untuk dipentaskan di file daripada dalam database.Kami
juga perlu membuat sebuah kuorum volume untuk mendukung cluster
failover, pada tingkat RAID 1. Quorum volume drive dapat diakses oleh
setiap node di cluster. Hal ini digunakan untuk arbitrase antara node cluster
dan untuk menyimpan data yang digunakan untuk pemulihan setelah
komunikasi gagal- ure dalam cluster.
Konfigurasi Databases
Sekarang kami telah merancang database, mari kita membuat
mereka dalam SQL Server. Berikut adalah beberapa poin yang Anda
mungkin ingin mempertimbangkan saat membuat database. Mari kita
mengambil studi kasus tainment Amadeus masukkan-sebagai contoh dalam
poin ini:
o
Menjaga nama database pendek dan ringkas. DDS, NDS, Stage, dan
Meta akan melakukan.
communication_subscription:
Tabel
communication_subscription
adalah tabel transaksi. Itu berasal dari Komunikasi Langganan fakta
meja di DDS. Ini berisi acara bisnis ketika seorang pelanggan
berlangganan surat kabar.
Tabel Ringkasan
Dari banyak hal yang dapat meningkatkan data warehouse kinerja,
tabel ringkasan adalah di bagian paling atas daftar.( Yang kedua adalah
tabel partisi, dan ketiga adalah pengindeksan.) Hal ini karena data yang
pengguna butuhkan adalah sudah precalculated. Kami akan membahas tiga
hal satu per satu di tiga bagian utama.
Partisi
Ada dua jenis partisi: partisi vertikal dan horisontal partisi. Partisi
vertikal membelah tabel vertikal menjadi beberapa tabel yang lebih kecil,
dengan masing-masing tabel yang berisi beberapa kolom dari tabel asli.
Partisi horizontal membelah tabel Horizontal menjadi beberapa tabel yang
lebih kecil, dengan masing-masing tabel yang berisi beberapa baris dari
tabel asli. Pada bagian ini, saya sedang berbicara tentang partisi horisontal,
bukan partisi vertikal.
Index
Dalam DDS, kita memiliki tabel fakta dan kita memiliki tabel dimensi.
Mereka membutuhkan pengindeksan yang berbeda dan kunci primer. Saya
akan membahas tabel dimensi pertama dan kemudian tabel fakta. Setiap
tabel dimensi memiliki kolom kunci pengganti. Ini adalah (1,1) kolom
identitas, dan nilai-nilai yang unik. Kami membuat ini kolom kunci pengganti
kunci utama dari tabel dimensi. Kami juga membuat kolom kunci pengganti
clustered index dari tabel dimensi.
Kesimpulan
Desain database adalah landasan dari data warehousing. Kami akan
membangun ETL dan aplikasi pada yayasan ini, jadi kami harus bisa
melakukannya dengan benar. Dalam bab ini, kita membahas rincian dari
platform perangkat keras dan sistem arsitektur, perhitungan ruang disk,
pembuatan database, dan meja dan melihat penciptaan.
Kami juga bahas tiga faktor yang dapat meningkatkan kinerja data
warehouse: tabel ringkasan, partisi, dan pengindeksan. Kita perlu
memastikan bahwa mereka diatur dengan benar dari awal, ketika kita
membuat database.