Anda di halaman 1dari 41

TUGAS

DATA WAREHOUSING DAN DATA MINING

Di Susun Oleh :
Nama : Fahrizal Umam
NIM

: 2012081057

Kelas

: TI. B 2012

FAKULTAS ILMU KOMPUTER


UNIVERSITAS KUNINGAN
2015

BAB 16
DATA PERGUDANGAN DAN WEB
TUJUAN BAB

Memahami apa yang Web-memungkinkan sarana gudang data dan


memeriksa alasan untuk melakukannya.
Menghargai implikasi dari konvergensi teknologi Web dan orangorang dari data gudang.
Menyelidiki semua aspek penyampaian informasi berbasis Web
Mempelajari bagaimana OLAP dan Web menghubungkan dan
mempelajari pendekatan yang berbeda untuk menipu-necting mereka.
Memeriksa langkah-langkah untuk membangun sebuah gudang data
Web-diaktifkan.

Apa fenomena yang paling dominan dalam komputasi dan komunikasi yang
dimulai pada 1990-an? Tidak diragukan lagi, itu adalah Internet dengan Web
Seluruh Dunia. Dampak dari Web pada kehidupan kita dan bisnis dapat cocok
hanya oleh sangat sedikit perkembangan lain selama beberapa tahun terakhir.
Pada 1970-an, kita mengalami terobosan besar ketika komputer pribadi diantar
dengan antarmuka yang grafis, perangkat penunjuk, dan ikon. Hari ini adalah
terobosan Web, yang dibangun di atas revolusi sebelumnya. Membuat komputer
pribadi yang berguna dan efektif adalah tujuan kami pada 1970-an dan 1980-an.
Pembuatan Web berguna dan efektif adalah tujuan kami hari ini. Pertumbuhan
Internet dan penggunaan Web telah dibayangi revolusi sebelumnya. Pada awal
tahun 2000, sekitar 50 juta rumah tangga di seluruh dunia diperkirakan akan
menggunakan Internet. Pada akhir tahun 2005, jumlah ini diperkirakan akan
tumbuh sepuluh kali lipat. Sekitar 500 juta rumah tangga di seluruh dunia akan
browsing Web saat itu.
Web mengubah segalanya, seperti yang mereka katakan. Data pergudangan
tidak terkecuali. Pada 1980-an, data warehousing masih sedang didefinisikan dan
berkembang. Selama tahun 1990-an, itu
377
378 DATA PERGUDANGAN DAN WEB

jatuh tempo. Sekarang, setelah revolusi Web dari tahun 1990-an, data
warehousing telah mengambil tempat yang menonjol dalam gerakan Web.
Mengapa?
Apa salah satu manfaat utama dari revolusi Web? Secara dramatis mengurangi
biaya komunikasi-kation. Web telah tajam berkurang biaya penyampaian
informasi. Apa relevansi itu? Apa satu tujuan utama dari data warehouse? Ini
adalah penyampaian informasi strategis. Jadi mereka cocok dengan sempurna.
Data warehouse adalah untuk memberikan in-formasi; Internet membuatnya
hemat biaya untuk melakukannya. Kami telah tiba di konsep data warehouse Webenabled atau "Data Webhouse." Web memaksa kita untuk memikirkan kembali
desain data warehouse dan penyebaran.
Dalam Bab 3, kami sempat mempertimbangkan data warehouse Web-enabled.
Secara khusus, kita membahas dua aspek topik ini. Pertama, kita dianggap cara
menggunakan Web sebagai salah satu saluran penyampaian informasi. Ini adalah
mengambil gudang ke Web, membuka gudang data ke lebih dari set tradisional
pengguna. Bab ini berfokus pada ini sebagai-pect dari hubungan antara Web dan
data warehouse.
Aspek lain, dibahas secara singkat dalam Bab 3, berkaitan dengan membawa
Web untuk gudang. Aspek ini berhubungan dengan e-commerce perusahaan Anda,
di mana data klik aliran situs Web perusahaan Anda dibawa ke Webhouse data
untuk analisis. Dalam bab ini, kita akan melewati aspek koneksi Web-gudang.
Banyak artikel oleh beberapa penulis dan praktisi, dan sebuah buku yang sangat
baik co-ditulis oleh Dr Ralph Kimball jangan keadilan yang memadai baru ke
topik Webhouse data. Silakan lihat Referensi untuk informasi lebih lanjut.
WEB-ENABLED DATA WAREHOUSE
Sebuah gudang data Web-enabled menggunakan Web untuk pengiriman informasi
dan kolaborasi di antara pengguna. Seperti bulan berlalu, semakin banyak gudang
data sedang terhubung ke Web. Pada dasarnya, ini berarti peningkatan akses
informasi dalam data gudang-rumah. Peningkatan akses informasi, pada
gilirannya, berarti peningkatan tingkat pengetahuan dari perusahaan. Memang
benar bahwa bahkan sebelum menghubungkan ke Web, Anda bisa memberikan
akses informasi untuk lebih banyak pengguna Anda, tetapi dengan banyak
kesulitan dan peningkatan proporsional dalam biaya komunikasi. Web telah
mengubah semua itu. Sekarang jauh lebih mudah untuk menambahkan lebih
banyak pengguna. Infrastruktur komunikasi yang sudah ada. Hampir semua
pengguna Anda memiliki browser Web. Tidak ada perangkat lunak klien

tambahan diperlukan. Anda dapat memanfaatkan Web yang al-siap ada.


Pertumbuhan eksponensial dari Web, dengan jaringan, server, pengguna, dan
halaman, telah membawa adopsi dari internet, intranet, dan ekstranet sebagai
media transmisi informa-tion. Data warehouse Web-enabled mengambil tengah
panggung dalam revolusi Web. Mari kita melihat mengapa.
Mengapa Web?
Ini tampaknya cukup alami untuk menghubungkan data warehouse ke Web.
Mengapa kita mengatakan ini? Untuk sesaat, memikirkan bagaimana pengguna
Anda melihat Web. Pertama, mereka melihat Web sebagai sumber besar
informasi. Mereka menemukan konten data yang berguna dan menarik. Pengguna
internal Anda, pelanggan, dan mitra bisnis yang sudah menggunakan Web sering.
Mereka tahu bagaimana untuk bisa terhubung. Web di mana-mana. Matahari tidak
pernah terbenam di Web. Satu-satunya perangkat lunak klien dibutuhkan adalah
browser Web, dan hampir semua orang, tua dan muda, telah belajar bagaimana
untuk memulai dan menggunakan browser. Sejumlah besar vendor perangkat
lunak memiliki al-siap membuat produk mereka Web-siap.

WEB-ENABLED DATA
379
WAREHOUSE
Sekarang perhatikan gudang data Anda dalam kaitannya dengan Web. Pengguna
Anda membutuhkan data warehouse untuk informasi. Mitra bisnis Anda dapat
menggunakan beberapa informa-tion dari data warehouse. Apa semua ini
memiliki kesamaan? Keakraban dengan Web dan kemampuan untuk
mengaksesnya dengan mudah. Ini adalah alasan yang kuat untuk data gudangrumah Web-enabled.
Bagaimana Anda memanfaatkan teknologi Web untuk gudang data Anda?
Bagaimana Anda menghubungkan gudang ke Web? Mari kita segera meninjau
mekanisme pengiriman tiga informasi yang perusahaan telah mengadopsi berbasis
teknologi Web. Dalam setiap kasus, pengguna mengakses informasi dengan Web
browser.
Internet. Media pertama adalah, tentu saja, internet, yang menyediakan
penerbangan murah trans-misi informasi. Anda dapat bertukar informasi dengan
siapa pun dalam atau di luar perusahaan. Karena informasi yang dikirimkan
melalui jaringan publik, masalah keamanan harus diatasi.
Intranet. Dari waktu istilah "intranet" diciptakan pada tahun 1995, konsep ini dari
jaringan pri-swasta telah mencengkeram dunia usaha. Intranet adalah jaringan
komputer pribadi berdasarkan standar komunikasi data Internet publik. Aplikasi
pasca-ing informasi lebih intranet semua berada dalam firewall dan, karena itu,
lebih se-menyembuhkan. Anda dapat memiliki semua manfaat dari teknologi web
populer. Selain itu, Anda dapat mengatur keamanan yang lebih baik pada intranet.
Extranet. Internet dan intranet telah diikuti oleh ekstranet. Extranet tidak
sepenuhnya terbuka seperti Internet, tidak juga dibatasi hanya untuk penggunaan
internal seperti di-tranet. Extranet adalah intranet yang terbuka untuk akses
selektif oleh pihak luar. Dari intranet Anda, selain mencari ke dalam dan ke
bawah, Anda bisa melihat keluar untuk pelanggan, pemasok, dan mitra bisnis
Anda.
Gambar 16-1 mengilustrasikan bagaimana informasi dari gudang data dapat
dikirim melalui mekanisme penyampaian informasi tersebut. Perhatikan
bagaimana data warehouse Anda dapat dikerahkan melalui Web. Jika Anda
memilih untuk membatasi data warehouse untuk pengguna internal, maka Anda

mengadopsi intranet. Jika itu harus dibuka kepada pihak luar dengan otorisasi
yang tepat, Anda pergi dengan ekstranet. Dalam kedua kasus, teknologi
penyampaian informasi dan protokol trans-misi yang sama.
Intranet dan extranet yang datang dengan beberapa keunggulan. Berikut adalah
beberapa:

Dengan browser universal, pengguna Anda akan memiliki satu titik


masuk untuk informa-tion.
Pelatihan yang minimal diperlukan untuk mengakses informasi.
Pengguna sudah tahu bagaimana menggunakan browser.
Browser Universal akan berjalan pada sistem.
Teknologi web membuka berbagai format informasi kepada pengguna.
Mereka dapat kembali ceive teks, gambar, grafik, bahkan video dan
audio.
Sangat mudah untuk menjaga intranet / extranet diperbarui sehingga akan
ada satu sumber di-formasi.
Membuka gudang data untuk mitra bisnis Anda selama menumbuhkan
extranet dan memperkuat kemitraan.
Penyebaran dan biaya pemeliharaan rendah untuk Web-memungkinkan
gudang data Anda. Terutama, biaya jaringan kurang. Biaya infrastruktur
juga rendah.

380 DATA PERGUDANGAN DAN WEB

Konvergensi Teknologi
Tidak ada semakin jauh dari kenyataan bahwa teknologi Web dan data
pergudangan telah berkumpul, dan obligasi hanya semakin kuat. Jika Anda tidak
mengaktifkan Web-gudang data Anda, Anda akan tertinggal. Dari tengah tahun
1990-an, vendor telah rac-ing satu sama lain untuk merilis versi Web-enabled
produk mereka. Persembahan Web dari produk yang melebihi persembahan
client / server untuk pertama kalinya sejak Web tawaran-temuan mulai muncul.
Secara tidak langsung, versi ini memaksa konvergensi Web dan gudang data lebih
jauh.
Ingat bahwa Web adalah lebih penting daripada data warehouse. Web dan fiturfiturnya akan memimpin dan gudang data harus mengikuti. Web telah dipatok
harapan para pengguna pada tingkat tinggi. Pengguna karena itu akan
mengharapkan data warehouse untuk tampil di tingkat tinggi. Mempertimbangkan
beberapa harapan yang dipromosikan oleh Web yang sekarang diharapkan akan
diadopsi oleh data warehouse:

Respon cepat, meskipun beberapa halaman Web yang


relatif lebih lambat.
Sangat mudah dan intuitif untuk digunakan
Sampai 24 jam sehari, 7 hari seminggu
konten Lebih up-to-date
Grafis, dinamis, dan user interface fleksibel
display Hampir pribadi
Harapan untuk menghubungkan ke mana saja dan bor di

Selama beberapa tahun terakhir, jumlah gudang data Web-enabled telah


meningkat secara substansial. Bagaimana ini gudang data Web-enabled bernasib
sejauh ini? Untuk mengerti

WEB-ENABLED DATA
381
WAREHOUSE
efek konvergensi dari dua teknologi, kita harus mempertimbangkan tiga perintah
efek dari penurunan biaya seperti yang didokumentasikan oleh Thomas W.
Malone dan John F. Rockart di awal 1990-an:
Pertama-Order Effect: substitusi sederhana dari teknologi baru untuk tua.
Kedua-Order Effect: Peningkatan permintaan untuk fungsi yang disediakan
oleh baru technol-ogy.
Ketiga-Order Effect: Munculnya struktur teknologi intensif baru.
Apa yang telah konvergensi teknologi Web dan data pergudangan dibawa
sejauh ini? Web pergudangan tampaknya telah melewati dua tahap pertama.
Perusahaan yang memiliki gudang data Web-enabled telah mengurangi biaya
dengan substitusi metode baru penyampaian informasi. Juga, permintaan untuk
informasi meningkat-follow ing tahap pertama. Bagi kebanyakan perusahaan
dengan gudang data Web-enabled, kemajuan berhenti ketika mereka mencapai
akhir tahap kedua.
Mengadaptasi Data Warehouse untuk Web
Banyak yang diharapkan dari sebuah gudang data Web-enabled. Itu berarti Anda
harus menemukan kembali data warehouse Anda. Anda harus melakukan
sejumlah tugas untuk beradaptasi gudang data untuk Web. Mari kita
mempertimbangkan ketentuan khusus untuk Web-memungkinkan gudang data
Anda.
Pertama, mari kita kembali ke pembahasan tiga tahapan sebagai berikut
pengenalan teknologi baru. Terlepas dari mengurangi biaya dari substitusi,
permintaan data informasi gudang-rumah telah meningkat. Sebagian besar
perusahaan tampaknya akan terjebak pada akhir tahap sec-ond. Hanya beberapa
perusahaan telah pindah ke tahap berikutnya dan telah menyadari hasil orde
ketiga. Apa hasil ini? Beberapa hasil tersebut termasuk extranet dan data

konsumen mart, manajemen dengan pengecualian, dan pasokan otomatis dan


rantai nilai. Ketika Anda beradaptasi gudang data Anda untuk Web, pastikan
bahwa Anda tidak tetap menaruh pada tahap kedua. Membuat rencana untuk
memanfaatkan potensi dari Web dan beralih ke tahap ketiga di mana manfaat
nyata ditemukan.
Mempelajari daftar berikut syarat untuk mengadaptasi data warehouse ke Web.
Informasi "push" Teknik. Data warehouse dirancang dan diimplementasikan
menggunakan "tarik" teknik. Sistem penyampaian informasi menarik
informasi dari gudang data berdasarkan permintaan, dan kemudian
memberikan ke pengguna. Web of-fers teknik lain. Web dapat "mendorong"
informasi kepada pengguna tanpa mereka minta-ing untuk itu setiap kali.
Gudang data Anda harus dapat mengadopsi "push" teknologi-nique.
Kemudahan Penggunaan. Dengan ketersediaan data klik aliran, Anda dapat
dengan cepat memeriksa perilaku pengguna di situs. Antara lain, data klik
aliran mengungkapkan seberapa mudah atau sulitnya bagi pengguna untuk
menelusuri halaman. Kemudahan penggunaan muncul di bagian atas daftar
persyaratan.
Respon cepat. Beberapa data warehouse memungkinkan pekerjaan untuk
menjalankan panjang untuk menghasilkan hasil de-bapak. Dalam model
Web, kecepatan yang diharapkan dan tidak dapat dinegosiasikan atau com
dijanjikan.
Tidak Downtime. Model Web dirancang sehingga sistem tersedia sepanjang
waktu. Demikian pula, data warehouse Web-enabled memiliki downtime.

382 DATA PERGUDANGAN DAN WEB


Multimedia Output. Halaman Web memiliki beberapa jenis-tekstual data,
angka, grafik, suara, video, animasi, audio, dan peta. Jenis ini diharapkan
untuk menunjukkan sebagai keluar-menempatkan dalam sistem penyampaian
informasi dari data warehouse Web-enabled.
Pasar penyampaian informasi Satu Web. Yang cenderung menjadi sangat
personal, dengan halaman XML yang dibuat secara dinamis mengganti statis
coding HTML. Gudang data web-enabled harus mengikutinya.
Skalabilitas. Akses lebih, lebih banyak pengguna, dan lebih banyak data-ini
adalah hasil dari Web-en-abling data warehouse. Oleh karena itu, skalabilitas
menjadi perhatian utama.
Web sebagai Sumber Data
Ketika Anda berbicara tentang Web-memungkinkan data warehouse, yang
pertama, dan mungkin satu-satunya pikiran yang datang ke pikiran adalah
penggunaan teknologi Web sebagai mekanisme penyampaian informasi.
Ironisnya, jarang melintasi pikiran Anda bahwa konten Web adalah sumber data
berharga dan po-tenda untuk gudang data Anda. Anda mungkin ragu-ragu sebelum
penggalian data dari Web untuk data warehouse Web-enabled Anda.
Konten informasi di Web begitu berbeda dan terfragmentasi. Anda perlu
membangun pencarian dan ekstrak sistem khusus untuk menyaring melalui
gundukan informasi dan mengambil apa yang relevan untuk gudang data Anda.
Asumsikan bahwa tim proyek Anda mampu membangun suatu sistem ekstraksi,
maka seleksi dan ekstraksi terdiri dari langkah-langkah yang berbeda beberapa.
Sebelum ekstraksi, Anda harus memverifikasi keakuratan data sumber. Hanya
karena data ditemukan di Web, Anda tidak dapat secara otomatis menganggap itu
adalah akurat. Anda bisa mendapatkan petunjuk untuk ac-wilayah gereja dari jenis
sumber. Silakan lihat Gambar 16-2 menunjukkan susunan komponen untuk
seleksi data dan ekstraksi dari Web.

BERBASIS WEB
INFORMASI
PENGIRIMAN

383

Bagaimana Anda dapat menggunakan konten Web untuk memperkaya data


warehouse Anda? Berikut adalah impor-tant beberapa menggunakan:

Menambahkan atribut lebih deskriptif dengan dimensi bisnis.


Sertakan data nominal atau ordinal tentang dimensi sehingga lebih
banyak pilihan yang berhasil-mampu untuk berputar dan tabulasi silang.
Menambahkan data linkage ke dimensi sehingga analisis korelasi
dengan dimensi lain dapat dilakukan.
Membuat tabel dimensi baru.
Buat tabel fakta baru.

Apa yang telah kita bahas di sini adalah lebih jauh penggunaan biasa dari Web
sebagai media penyampaian informa-tion. Seleksi data dan ekstraksi data dari
Web adalah paradigma baru yang radikal. Jika tim proyek Anda bersedia untuk
mencobanya di lingkungan data warehouse Anda, hasilnya akan berharga.
BERBASIS WEB INFORMASI PENGIRIMAN
Kita telah melihat bagaimana konvergensi teknologi Web dan data pergudangan
tidak bisa dihindari. Dua teknologi berurusan dengan memberikan informasi.
Teknologi web mampu memberikan informasi lebih mudah, sekitar jam. Hal ini
tidak mengherankan bahwa perusahaan ingin web-mengaktifkan gudang data
mereka.
Keuntungan dan kemungkinan lain juga muncul ketika Anda menghubungkan
gudang ke Web. Salah satu manfaat tersebut adalah kemampuan untuk
menemukan cara-cara baru untuk membuat data gudang-rumah yang lebih efektif
melalui data mart extranet dan sejenisnya. Kami juga melihat di possi-bility
menggunakan Web sebagai sumber data untuk gudang Anda.
Namun demikian, pengiriman informasi yang lebih baik tetap alasan yang
paling menarik untuk mengadaptasi gudang data untuk Web. Web membawa
pandangan baru pada penyampaian informasi dan merevolusi proses. Mari kita,
oleh karena itu, meluangkan waktu pengiriman informasi berbasis Web.
Bagaimana Web meningkat penggunaan data warehouse? Apa manfaat dan apa

saja tantangan? Bagaimana Anda menangani perubahan dramatis dalam


penyampaian informasi yang dibawa oleh Web?
Penggunaan diperluas
Tidak peduli bagaimana Anda melihatnya, keuntungan dari menghubungkan data
warehouse ke Web tampak menakjubkan. Pengguna dapat menggunakan browser
untuk melakukan permintaan mereka dengan mudah dan setiap saat sepanjang
hari. Tidak ada sakit kepala yang berhubungan dengan sinkronisasi didistribusikan
gudang data yang ada di lingkungan client / server. Penggunaan data warehouse
memperluas melampaui pengguna internal. Pihak yang berkepentingan dari luar
sekarang dapat diberikan penggunaan konten gudang. Sebagai penggunaan
mengembang, skalabilitas tidak lagi menimbulkan masalah serius. Bagaimana
dengan biaya pelatihan pengguna? Tentu saja, biaya pelatihan yang minimal
karena penggunaan browser Web. Semuanya tampak mengembang baik dan
penggunaan.
Mari kita memahami apa yang terjadi pada pertumbuhan. Awalnya, data
gudang-rumah Web-enabled Anda mungkin menerima hanya 500 sampai 5000
hits sehari, tapi tergantung pada audiens Anda, num- ini

384 DATA PERGUDANGAN DAN WEB


ber bisa meroket dalam waktu singkat. Apa lebih banyak pengguna menyiratkan?
Cukup, lebih banyak data. Juga, lebih banyak data dalam lingkungan 24 7. Web
tidak pernah dimatikan.
Memeriksa fenomena ini pertumbuhan yang luar biasa. Akses universal
menghasilkan seluruh rangkaian tantangan yang harus dihadapi. Terutama, ini
membebankan beban tambahan pada data warehouse Web-enabled Anda.
Meskipun skalabilitas untuk mengakomodasi lebih banyak pengguna dan ekspansi
yang cepat dalam penggunaan tidak lagi sebagai berat seperti dalam lingkungan
client / server, itu masih merupakan tantangan dasar.
Mari kita memahami pola pertumbuhan ini dalam penggunaan. Dua faktor yang
berbeda mendorong pertumbuhan: pertama, jendela benar-benar terbuka yang
pernah menutup, selanjutnya, mekanisme akses mudah dan intuitif melalui
browser Web di mana-mana. Akibatnya, Anda memiliki dua tantangan untuk concenderung dengan. Yang pertama adalah peningkatan populasi pengguna. Yang
kedua adalah cepat acceler-asi pertumbuhan. Jika Anda telah membuka gudang
data untuk pelanggan dan mitra bisnis melalui extranet, Anda akan melihat kurva
ekspansi curam bahkan lebih.
Mari kita sebut pertumbuhan yang luar biasa ini "supergrowth" dan memeriksa
fenomena tersebut. Silakan lihat Gambar 16-3, yang grafik fenomena ini. Fitur
mencolok dari super-pertumbuhan memanifestasikan dirinya dalam
ketidakmampuan Anda untuk meningkatkan dalam waktu mengandung
pertumbuhan. Basis pengguna akan tumbuh lebih cepat dari kemampuan Anda
untuk meningkatkan data warehouse Web-enabled Anda untuk memenuhi
persyaratan penggunaan berkembang. Anda tidak dapat hanya menambahkan
prosesor, disk drive, atau memori cukup cepat untuk memenuhi permintaan yang
meningkat, jadi bagaimana Anda menangani super pertumbuhan?
Mari kita mengusulkan pendekatan awal. Apakah mungkin untuk
mengantisipasi masalah dan menghindari sama sekali di tempat pertama? Dengan
kata lain, Anda dapat mengontrol pertumbuhan dan dengan demikian datang
untuk mengatasi masalah ini. Bila Anda Web-mengaktifkan gudang data Anda,
naluri pertama adalah menjadi overenthusiastic dan membuka gudang langsung
kepada publik. Ini seperti pembukaan pintu air tanpa peringatan. Tetapi untuk
mengontrol pertumbuhan, Anda harus mengandung semangat Anda dan membuka

gudang di tahap didefinisikan dengan baik. Hal ini menjadi ab-solutely diperlukan
jika pola penggunaan sangat tidak jelas. Jangan membuka gudang ke

BERBASIS WEB INFORMASI


PENGIRIMAN

385

publik sama sekali, awalnya. Pertama, biarkan beberapa pengguna internal Anda
memiliki akses. Kemudian tambahkan beberapa pengguna ke dalam grup.
Termasuk lebih dan lebih secara bertahap bertahap. Dengan cara ini, Anda terusmenerus dapat memantau pola pertumbuhan dalam penggunaan. Mengadopsi
pendekatan peringatan yang sama ketika datang ke membuka data warehouse
untuk umum pada gelombang kedua.
Bagaimana jika keadaan Anda menjamin membuka data warehouse Webenabled dalam satu kali untuk semua pengguna, internal dan eksternal?
Bagaimana jika pendekatan bertahap yang dijelaskan di atas tidak layak dalam
kasus Anda? Bagaimana jika Anda tidak dapat menghindari supergrowth? Kunci
untuk menjawab pertanyaan-pertanyaan ini terletak pada karakteristik khusus dari
kurva pertumbuhan. Perhatikan bahwa super-pertumbuhan hanya terjadi dalam
tahap sangat awal. Setelah tahap awal, kurva penggunaan tampaknya tingkat off,
atau setidaknya laju peningkatan menjadi dikelola. Dengan fakta ini dalam
pikiran, mari kita lihat bagaimana kita dapat menangani supergrowth.
Rahasianya terletak pada menemukan titik hingga yang penggunaan akan
tumbuh dan kemudian tingkat off. Kembali ke Gambar 16-3 menunjukkan kurva
supergrowth. Grafik menunjukkan bahwa tahap hiper-pertumbuhan berlangsung
sampai awal November dan diharapkan tingkat off di pengguna 750. Bahkan jika
Anda mulai dengan 100 pengguna, Anda cenderung memukul tingkat pengguna
750 segera. Jadi, bahkan jika tujuannya adalah untuk memulai dengan hanya 100
pengguna, biarkan penawaran awal Anda dari gudang data Web-enabled memiliki
sumber daya yang cukup untuk mengakomodasi pengguna 750. Tapi bagaimana
Anda datang dengan jumlah pengguna 750 dan bahwa titik meratakan off adalah
awal November? Tidak ada grafik standar industri untuk memprediksi pola
supergrowth. Pola supergrowth gudang data Anda sepenuhnya tergantung pada
situasi dan kondisi lingkungan Anda. Anda harus menentukan grafik untuk
lingkungan Anda dengan menggunakan teknik terbaik untuk estimasi.
Informasi baru Strategi
Ketika gudang data dan teknologi Web bertemu, apa harapan dari data
warehouse? Bagaimana seharusnya user interface untuk data warehouse menjadi
modi-fied dan ditingkatkan pada model Web? Sampai gudang data Anda adalah

Web-enabled, harapan pengguna diperintah oleh satu set standar yang ditetapkan.
Sekarang, setelah Web-memungkinkan, ketika pengguna pendekatan gudang
menggunakan browser yang sama seperti yang mereka lakukan untuk data
internet lainnya, tolak ukur yang berbeda. Sekarang pengguna mengharapkan
jenis yang sama antarmuka informasi seperti yang digunakan dalam sesi Internet.
Memahami harapan ini akan membantu Anda dalam strategi penyampaian
informasi baru de-veloping untuk Anda gudang Web-enabled.
Informasi Pedoman Pengiriman. Mari kita meringkas pedoman untuk
merumuskan strategi penyampaian informasi baru. Mempelajari daftar berikut.
Kinerja. Industri ahli setuju pada waktu respon kurang dari 10 detik untuk
Halaman untuk memberikan layar pertama dari isi berguna. Halaman dapat
menyimpan beban untuk waktu yang lama, asalkan isi berguna dapat dilihat
dalam waktu 10 detik. Desain untuk modem dengan kecepatan terendah.
Tombol navigasi layar segera. Mengungkapkan con-tenda dalam rangka
direncanakan: yang berguna segera, diikuti oleh orang-orang di tingkat
berikutnya kegunaan. Kembali grafis lambat dan berlebihan. Gunakan
halaman teknik caching. Memastikan bahwa desain database fisik
memungkinkan waktu respon yang cepat.
Pilihan Pengguna. Pengguna dikondisikan untuk mengharapkan untuk melihat
beberapa pilihan standar ketika mereka tiba di halaman Web. Ini termasuk
pilihan navigasi. Tombol navigasi untuk data warehouse Web-enabled
termasuk pilihan drill-down, halaman rumah,

386 DATA PERGUDANGAN DAN WEB


mata pelajaran utama, peta situs, pencarian, dan website rincian sponsor.
Juga, termasuk pilihan-gudang tertentu, menu bantuan, dan pilihan untuk
berkomunikasi dengan perusahaan sponsor. Lebih khusus, untuk data
warehouse, pilihan pengguna harus menyertakan navigasi untuk
perpustakaan laporan, pilihan untuk menelusuri bisnis Dimen-keputusan dan
atribut dalam setiap dimensi, dan antarmuka untuk metadata bisnis.
Pengalaman pengguna. Tujuan terindah Setiap Web desainer adalah untuk
membuat setiap halaman menyenangkan pengalaman bagi pengguna.
Pengguna bersemangat untuk mengunjungi dan tinggal di sebuah halaman
yang baik untuk-kusut. Jika ada terlalu banyak gangguan dan masalah,
pengguna cenderung menghindari halaman. Jadilah bijaksana dalam
penggunaan font, warna, berkedip grafis, teks tebal, di bawah-garis, klip
audio, dan segmen video.
Proses. Adalah penting bahwa proses bisnis harus dibuat untuk bekerja dengan
lancar dan jahitan-lessly di Web. Untuk data warehouse Web-enabled,
persyaratan ini diterjemahkan ke dalam perampingan interaksi Web saat sesi
analisis. Membiarkan pengguna dapat berpindah dari satu langkah ke depan,
mudah dan anggun.
Dukungan Pengguna. Dalam proses yang panjang, pengguna harus memiliki
jaminan bahwa tidak akan ada hilang di tengah proses. Pengguna harus tahu
di mana dia berada dalam proses sehingga melanjutkan lebih lanjut tidak
akan terganggu. Selama akses ke data warehouse Web-enabled, membiarkan
pengguna mengetahui informasi status perantara. Misalnya, dalam
menjalankan laporan, memberikan status laporan kepada pengguna.
Menyelesaikan Masalah. Pengguna harus dapat mundur dari kesalahan
mereka, membuat koreksi, dan kemudian lanjutkan. Pengguna juga harus
mampu untuk melaporkan masalah.
Informasi dalam Konteks. Membuka gudang data dengan cara Web
menyediakan miring baru tentang bagaimana informasi dapat dilihat dalam
konteks yang lebih luas. Sampai sekarang, queriers bisa menemukan jawaban
atas pertanyaan langsung dari "berapa banyak" dan "seberapa sering."
Jawaban untuk pertanyaan seperti itu ditemukan dalam batas sempit kerangka
perusahaan. Dengan dibukanya intelijen bisnis melalui Web, lingkaran

melebar dalam-clude seluruh rantai pasokan dan beberapa kekhawatiran yang


kompetitif. Informasi sekarang bisa diperoleh dalam kerangka strategis yang
lebih besar.
Personalized Informasi. Hal ini hampir mustahil untuk memberikan
pertanyaan yang telah ditetapkan bahwa akan memenuhi persyaratan setiap
orang dalam rantai nilai, sehingga berusaha untuk memberikan kemampuan
ad hoc untuk meminta jenis pertanyaan yang terkait dengan jenis data di
gudang.
Swalayan Access. Sebagai Web membuka data warehouse untuk lebih banyak
pengguna, baik di sisi dan di luar perusahaan, alat harus menyediakan akses
otonom untuk informa-tion. Pengguna harus dapat menavigasi dan bor keluar
untuk sumber informasi. Ini harus menjadi praktis lingkungan dengan akses
layanan mandiri di mana pengguna dapat melayani mereka-diri.
HTML File. Dalam lingkungan data warehouse Web-enabled, standar HTML
dokumen atau berkas, juga dikenal sebagai halaman Web, adalah sarana utama
untuk komunikasi. Halaman Web adalah sumber daya untuk menampilkan
informasi di internet atau net-kerja internal. Alat antarmuka informasi
menghasilkan file HTML dari query pengguna ad hoc atau dari prosedur yang
tersimpan dalam database.
Anda dapat menghasilkan HTML mengajukan satu waktu atau secara teratur
menggunakan pemicu. Seperti yang Anda tahu, pemicu adalah jenis khusus dari
prosedur yang tersimpan yang secara otomatis dijalankan ketika sebuah
pernyataan manipulasi data ditentukan di meja tertentu ditemui. Sebagai contoh,
sebuah program pemicu otomatis dapat menghasilkan laporan pengecualian dalam
bentuk HTML

BERBASIS WEB
INFORMASI
PENGIRIMAN

387

mengajukan ketika beberapa nilai ambang batas yang telah ditetapkan terlampaui.
Para pengguna kemudian dapat melihat lat-est terjadinya dengan memanggil
halaman Web yang sesuai.
Sistem manajemen database menawarkan mempublikasikan-dan-berlangganan
fungsi dalam mesin database mereka. Langganan A memungkinkan halaman
HTML yang akan dibuat dari awal atau refresh setiap kali kebakaran pemicu
dalam sumber data tertentu. Sebuah halaman HTML yang diterbitkan dapat
meliputi data yang disaring langsung dari satu atau lebih tabel, hasil dari query
diterjemahkan secara internal ke dalam laporan SQL, atau output dari prosedur
yang tersimpan. Namun, langganan fa-cility terbatas pada data dalam database
tertentu.
Pelaporan Sebagai Strategis Alat. Selanjutnya mari kita beralih ke pelaporan
sebagai metode penyampaian informasi berbasis web. Di Web, Anda dapat
mempublikasikan atau mendistribusikan file melalui e-mail. Fitur-fitur ini
membuka kemungkinan besar untuk melaporkan sebagai alat strategis. Sekarang
Anda dapat mengintegrasikan mitra bisnis ke dalam rantai pasokan. Manajer dan
eksekutif dapat mengarahkan laporan diresepkan untuk dikirim secara otomatis
kepada pelanggan tertentu dan pemasok. Mereka dapat mengatur batas atas
tingkat persediaan dan memiliki laporan dikirim hanya bila kadarnya di luar batas.
Laporan manajemen dapat mencakup kedua jenis laporan. Laporan rutin dan
pengecualian re-port dapat dijadwalkan untuk distribusi. Anda dapat membuat
sejumlah parameter-driven ulang port yang dapat dibuat tersedia melalui Web.
Anda bahkan mungkin label laporan dengan nama bisnis dan mengkategorikan
mereka sesuai dengan kelas pengguna, tergantung pada pangkat atau otorisasi
keamanan tingkat.
Beberapa teknik manajemen laporan yang mungkin: laporan parameter-driven,
laporan cus-tomizable, laporan pengecualian, laporan yang telah ditetapkan, dan
sebagainya. Salah satu teknik dapat menyediakan OLAP drill-down. Dalam teknik
ini, pengguna meminta laporan pertama yang menunjukkan hasil pada tingkat
ringkasan tinggi. Laporan ini dapat digunakan untuk melangkah lebih jauh dengan
Analy-sis. Ketika laporan pertama datang kembali, laporan yang berfungsi

sebagai landasan untuk analisis lebih lanjut. Pengguna mengubah parameter


permintaan dan bor bawah pada data ringkasan untuk rincian tambahan tanpa
harus membuat laporan baru. Lain teknik yang berguna re-lambatnya ke halaman
on-demand. Ketika laporan dengan beberapa halaman kembali, pengguna dapat
menavigasi ke halaman yang diinginkan melalui hyperlink bukan paging melalui,
satu halaman pada satu waktu.
Teknologi Browser untuk Data Warehouse
Teknologi web dan teknologi browser yang hampir identik. Browser adalah
perangkat lunak klien com-mon dalam lingkungan data warehouse Web-enabled.
Pengguna Anda akan mengakses informasi dengan menggunakan browser standar.
Mari kita membahas beberapa rincian sehingga Anda dapat menjadi akrab dengan
teknologi browser. Sebuah aplikasi berbasis browser datang dengan banyak benecocok. Antarmuka pengguna-browser-praktis bebas. Anda tidak perlu
mengkonfigurasi dan di-kios aplikasi berbasis browser pada klien; aplikasi
berjalan pada server. Segera, Anda mengamati bahwa penyebaran aplikasi
menjadi mudah bahkan ketika ada ratusan atau ribuan desktop.
Saat ini, empat teknologi yang biasa digunakan untuk membangun user
interface Web-enabled. Ini adalah HTML, Java, ADO, dan plug-in. Lihatlah
Gambar 16-4, yang membandingkan empat teknologi dalam hal kekuatan dan
kelemahan.
Silakan mempelajari deskripsi singkat berikut empat teknologi:
HTML HTML., Yang paling sederhana dan paling mudah untuk mengelola
teknologi, bekerja pada browser apapun terlepas dari platform. Pengguna dapat
menavigasi dengan mengklik hyperlink. Mendukung HTML

388 DATA PERGUDANGAN DAN WEB

grafis dan bentuk. Ini adalah "stateless," yang berarti bahwa konteks link jaringan
antara browser dan aplikasi tidak dipertahankan antara aplikasi. Anda dapat
mensimulasikan fitur OLAP seperti berputar dan drill-down dengan menghasilkan
halaman HTML baru. Tapi Anda harus membayar harga menunggu halaman hasil
yang akan dihasilkan dan di-download ke desktop. HTML adalah baik untuk
laporan statis. Hal ini sangat cocok bila aplikasi Anda tidak tahu fitur dari
platform target.
Java. Apakah Anda perlu canggih visualisasi 3-D, drill-melalui, drag dan drop,
atau mirip fungsi high-end? Maka Java adalah teknologi untuk Anda. Java tersedia
pada semua platform klien utama. Seperti applet Java tidak diperbolehkan untuk
menulis ke hard drive atau mencetak ke printer lokal, untuk beberapa aplikasi ini
bisa menimbulkan masalah. Karena Java adalah bahasa interpretatif, agak lambat
dari bahasa dikompilasi. Desktop harus dilengkapi dengan browser Java. Seperti
applet Java harus di-download dari server setiap kali, kadang-kadang waktu
download yang lama tidak dapat diterima. Java cocok untuk klien interaktif, di
mana beban kali panjang mungkin tidak menjadi faktor.

ADO. Ini adalah solusi Microsoft untuk sistem berbasis Web didistribusikan.
ADO, menerapkan-ed sebagai DLL Microsoft atau data link perpustakaan, dapat
diinstal dengan men-download dari server menggunakan browser. Seperti yang
diharapkan, ADO hanya berjalan pada platform Windows, sehingga tidak
termasuk UNIX dan Mac konfigurasi. Menjadi antarmuka dikompilasi, ADO
lebih cepat dari Jawa. ADO / MD, ekstensi Microsoft untuk ADO sebagai bagian
dari Pivot Table-Services, dapat digunakan untuk membuat kontrol ActiveX di
Visual Basic untuk memanipulasi data dalam layanan OLAP dari halaman Web.
ADO dibatasi untuk platform Windows di mana Anda memiliki kontrol yang baik
dari DLL.
Plug-in. Ini adalah program khusus browser yang mengeksekusi dalam browser
itu sendiri. Plug-in dapat diinstal pada drive lokal. Karena masing-masing browser
kebutuhan sendiri plug-in-nya,

OLAP DAN
WEB

389

Anda mungkin ingin standarisasi browser di lingkungan Anda jika Anda memilih
ini ap-proach. OLAP klien pada berbagai platform, terutama yang menggunakan
Java, mungkin memiliki masalah karena keterbatasan bandwidth.
Masalah keamanan
Tanpa ragu, ketika Anda membuka data warehouse Web-enabled untuk pengguna
melalui-out perusahaan melalui intranet dan mitra bisnis di luar melalui extranet,
Anda cenderung untuk memaksimalkan nilai. Tergantung pada organisasi Anda,
Anda bahkan mungkin mendapatkan nilai lebih ketika Anda mengambil langkah
berikutnya dan membuka gudang untuk umum di Internet. Tapi tindakan ini
mengangkat isu-isu keamanan yang serius. Anda mungkin harus memberlakukan
pembatasan keamanan pada tingkat yang berbeda.
Pada tingkat jaringan, Anda mungkin melihat ke dalam solusi yang mendukung
enkripsi data dan mekanisme pengalihan kembali stricted. Keamanan di tingkat
jaringan adalah salah satu bagian dalam skema proteksi-tion. Hati-hati
melembagakan sistem keamanan di tingkat aplikasi. Pada tingkat ini, sistem
keamanan harus mengelola otorisasi pada siapa yang diizinkan untuk masuk ke
aplikasi dan apa setiap pengguna diperbolehkan untuk mengakses.
Pernahkah Anda mendengar dari Teroris Informasi? Ini mempekerjakan-ee
loyal atau dipercaya yang memiliki otorisasi untuk mengakses informasi aman
adalah ancaman besar bagi keamanan gudang. Memasukkan lubang ini sulit dan
Anda perlu untuk mengatasi aspek keamanan.
OLAP DAN WEB
Sejumlah besar waktu dan uang yang diinvestasikan dalam membangun data
warehouse dengan harapan bahwa perusahaan akan mendapatkan informasi yang
dibutuhkan untuk membuat keputusan strategis nilai abadi. Untuk
memaksimalkan potensi nilai, Anda perlu untuk memenuhi sebagai besar grup
pengguna mungkin untuk memanfaatkan potensi gudang. Ini termasuk
perpanjangan kemampuan OLAP untuk kelompok yang lebih besar dari analis.

Perusahaan OLAP
Gudang awal dimulai sebagai sistem pendukung keputusan skala kecil untuk
dipilih tangan ful analis tertarik. Mainframe awal sistem pendukung keputusan
yang tersedia kemampuan analisis yang kuat meskipun cukup tak tertandingi
untuk sistem OLAP hari ini. Karena sistem-sistem yang sulit untuk digunakan,
mereka jarang mencapai luar sekelompok kecil analis yang bisa membajak
melalui kesulitan.
Generasi berikutnya dari sistem pendukung keputusan diganti kompleks
mainframe comput-ing dengan mudah digunakan GUI dan point-and-klik
antarmuka. Ini generasi kedua sys tems-berjalan pada arsitektur client / server
yang secara bertahap mampu mendukung OLAP di Addi-tion untuk query
sederhana dan pelaporan. Namun, penyebaran dan biaya pemeliharaan dicegah
perpanjangan dukungan keputusan untuk jumlah yang lebih besar dari pengguna.
OLAP dan OLAP seperti capabili-hubungan masih terbatas pada sejumlah kecil
pengguna.
Web telah menempatkan miring secara dramatis berbeda pada penyampaian
informasi. Gudang data web-enabled dapat membuka pintu mereka kepada
sekelompok besar pengguna baik di dalam maupun di luar perusahaan, dan jasa
OLAP diperluas ke lebih dari kelompok memilih analis. Muncul pertanyaan:
Dapatkah OLAP meningkatkan sistem untuk mendukung sejumlah besar
bersamaan

390 DATA PERGUDANGAN DAN WEB


pengguna melakukan query yang kompleks dan perhitungan intensif? Bagaimana
bisa tim proyek Anda memastikan bahwa OLAP berhasil di data warehouse Webenabled Anda?
Pendekatan web-OLAP
Kombinasi yang mendasari untuk keberhasilan pelaksanaan terdiri dari Web technology, gudang data dengan sistem OLAP, serta arsitektur thin-client. Bagaimana
Anda menerapkan OLAP di lingkungan seperti itu? Bagaimana OLAP sistem
bekerja di gudang data Web-enabled Anda akan? Apa jenis arsitektur client dan
Web akan menghasilkan hasil yang optimal? Anda mungkin mendekati
pertanyaan-pertanyaan ini dalam tiga cara yang berbeda.
Browser Plug-ins. Dalam pendekatan pertama, Anda menggunakan plug-in
atau ekstensi browser. Ini hanya sedikit versi modifikasi dari lemak-klien
Windows pelaksanaan mantan kecuali bahwa konfigurasi klien lebih ke arah
bahwa dari thin client. Dukungan-menggugat merayap di dan pendekatan ini
memiliki masalah skalabilitas.
Dokumen HTML Precreated. Dalam pendekatan berikutnya, Anda
memberikan precreated dokumen HTML bersama dengan alat-alat navigasi
untuk menemukan ini. Dokumen-dokumen yang set hasil operasi analitis.
Pendekatan ini mengambil keuntungan dari Web technolo-gy dan ekonomi
thin-client, namun pengguna terbatas pada menggunakan laporan yang telah
ditetapkan. Pendekatan ini tanpa analisis on-demand; pengguna tidak dapat
melakukan khas pengolahan analisis online.
OLAP di Server. Pendekatan terbaik adalah dengan menggunakan server untuk
melakukan semua secara online pengolahan analyti-kal dan menyajikan hasil
pada antarmuka informasi thin-client yang benar. Pendekatan ini menyadari
manfaat ekonomi dari Web dan thin-client Architec-mendatang. Pada saat
yang sama, ia menyediakan lingkungan server terpadu terlepas dari mesin
klien. Pemeliharaan diminimalkan karena aplikasi dan logika yang terpusat
di server. Kontrol versi juga konsisten. Semua orang berbagi komponen yang
sama: Server, metadata, dan laporan. Pendekatan ini bekerja dengan baik di
lingkungan pro-duksi.

OLAP Desain Mesin


Ketika data warehouse adalah Web-enabled dan tingkat operasi OLAP dinaikkan,
de-tanda mesin OLAP menentukan kemungkinan scaling up. Dalam produk
OLAP Anda pilih untuk data warehouse Web-enabled Anda, desain mesin OLAP
peringkat tinggi di kritis-ity. Sebuah mesin yang dirancang dengan baik
menghasilkan kurva kinerja yang tetap linear sebagai jumlah pengguna secara
bersamaan meningkat. Mari kita mempertimbangkan beberapa pilihan:
Ketergantungan pada RDBMS. Mesin OLAP bergantung sepenuhnya pada
RDBMS untuk melakukan pengolahan multidimensi, menghasilkan kompleks,
SQL multipass untuk mengakses data ringkasan. Bergabung, agregasi, dan
perhitungan semua dilakukan dalam database, pos-ing masalah serius bagi sistem
Web-enabled. Sejumlah besar tabel sementara akan datang diperlukan. Overhead
untuk menciptakan, memasukkan, menjatuhkan, mengalokasikan ruang disk,
memeriksa perizinan, dan memodifikasi tabel sistem untuk setiap perhitungan
sangat besar. Hanya lima pengguna bersamaan dapat membawa sistem OLAP
bertekuk lutut.
Ketergantungan pada mesin tersebut. Berikut mesin menghasilkan SQL untuk
mengakses ringkasan data dan melakukan semua pengolahan pada tingkat
menengah. Anda akan melihat dua masalah daerah di

MEMBANGUN WEBENABLED DATA


WAREHOUSE

391

pendekatan ini. Lalu lintas jaringan berat dan persyaratan memori yang besar
membuat pendekatan ini tidak diinginkan. Anda mungkin mendapatkan kurva
kinerja linear, tapi kurva cenderung menjadi terlalu curam karena potensi DBMS
tidak digunakan.
Cerdas OLAP mesin. Mesin ini memiliki kecerdasan untuk menentukan jenis
permintaan dan di mana ia akan dilakukan secara optimal. Karena kecerdasan,
mesin ini mampu mendistribusikan bergabung, agregasi, dan perhitungan antara
komponen mesin dan RDBMS. Dalam model ini, Anda dapat memisahkan
presentasi, logika, dan lapisan data baik secara logis dan fisik. Oleh karena itu,
pengolahan sistem skor dan lalu lintas jaringan dioptimalkan. Saat ini, ini
tampaknya menjadi pendekatan yang terbaik, mencapai kurva perfor-Mance yang
tetap linear dengan kemiringan bertahap karena jumlah pengguna secara
bersamaan meningkat.
MEMBANGUN WEB-ENABLED DATA WAREHOUSE
Mari kita meringkas apa yang telah kita pelajari sejauh ini. Kami dirasakan
bagaimana Web telah mengubah segalanya termasuk desain dan penyebaran
gudang data. Kami mengerti bagaimana teknologi Web dan data pergudangan
telah berkumpul, membuka possibili-hubungan yang luar biasa. Tujuan utama dari
data warehouse adalah untuk memberikan informasi, dan Web membuat
menyediakan informasi yang mudah. Apa kombinasi yang bagus dari teknologi!
Sekarang nilai data warehouse Anda dapat diperpanjang untuk array yang lebih
luas dari pengguna.
Ketika kita cocok fitur dari gudang data dengan karakteristik dari Web, kita
mengamati bahwa kita harus melakukan beberapa hal untuk desain dan
penyebaran metode untuk beradaptasi gudang ke Web. Kami pergi melalui
sebagian besar tugas. Web telah mengubah cara informasi disampaikan dari
gudang data. Pengiriman infor-masi berbasis web lebih inklusif, lebih mudah
digunakan, tetapi juga berbeda dari metode tradi-nasional. Kami telah
menghabiskan beberapa waktu pengiriman informasi berbasis Web. Kami juga
menyentuh pada OLAP dalam kaitannya dengan Web. Jadi, di mana kita

sekarang? Kami sekarang siap untuk kembali tampilan pertimbangan untuk


membangun data warehouse Web-enabled.
Sifat Webhouse data
Pada pertengahan tahun 1999, Dr. Ralph Kimball dipopulerkan istilah baru, "Data
Webhouse," yang includ-ed gagasan data warehouse Web-enabled. Dia
menyatakan bahwa data warehouse mengambil panggung pusat dalam revolusi
Web. Dia melanjutkan untuk menyatakan bahwa ini memerlukan ulangan dan
menyesuaikan pemikiran data warehouse kami. Bagaimana benar!
Dalam usaha untuk merumuskan prinsip-prinsip untuk membangun data
warehouse Web-enabled, mari kita meninjau sifat data Webhouse. Kami akan
menggunakan pengetahuan ini untuk menentukan pelaksanaan pertimbangan.
Sebelum pergi fitur utama, melihat Gambar 16-5, yang memberi Anda gambaran
yang luas dari data yang Webhouse. Sekarang mari kita tinjau fea-tulisan. Berikut
adalah daftar fitur utama dari Webhouse Data:

Ini adalah sebuah sistem sepenuhnya didistribusikan. Banyak node


independen membuat keseluruhan. Seperti Dr. Kimball akan mengatakan,
tidak ada pusat data Webhouse.
Ini adalah sebuah sistem Web-enabled; itu berada di luar sistem client /
server. Pembagian tugas dan susunan komponen yang berbeda secara
radikal.

392 DATA PERGUDANGAN DAN WEB

Web browser adalah kunci untuk penyampaian informasi. Sistem ini


memberikan hasil permintaan informasi melalui browser terpencil.
Karena keterbukaan, keamanan merupakan masalah serius.
Web ini mendukung semua tipe data termasuk tekstual, numerik, grafis,
foto-ic, audio, video, dan banyak lagi. Oleh karena itu berikut bahwa data
Webhouse mendukung berbagai bentuk data.
Sistem ini memberikan hasil permintaan informasi dalam waktu respon
yang wajar.
Desain antarmuka pengguna adalah sangat penting untuk kemudahan
penggunaan dan untuk publikasi yang efektif di Web. Berbeda dengan
interface dalam konfigurasi lainnya, Web memiliki metode yang pasti
untuk mengukur efektivitas dari user interface. Analisis data clickstream
memberitahu Anda seberapa baik antarmuka.
Secara alami, data Webhouse memerlukan arsitektur compris-ing data mart
skala kecil baik didistribusikan.
Karena susunan komponen didasarkan pada "bus" arsitektur data mart
terkait, penting untuk memiliki dimensi sepenuhnya sesuai dan lengkap-ly
sesuai atau fakta standar.

Web tidak pernah tidur. Data Anda Webhouse diharapkan sepanjang


waktu.
Akhirnya, ingat bahwa data Webhouse dimaksudkan untuk menjadi
terbuka untuk semua kelompok pengguna, baik di dalam dan di luar
perusahaan-karyawan, pelanggan, pemasok, dan lainnya mitra bisnis.

MEMBANGUN WEBENABLED DATA


WAREHOUSE

393

Pertimbangan Implementasi
Fitur utama yang dijelaskan di atas membawa kita ke faktor yang perlu Anda
pertimbangkan untuk menerapkan-ing data warehouse Web-enabled. Setiap fitur
yang tercantum di atas menuntut penyesuaian dari prinsip-prinsip pelaksanaan.
Sebagian besar, dengan pergi melalui daftar fitur, Anda dapat memperoleh apa
yang dibutuhkan. Kami ingin menyoroti hanya pertimbangan pelaksanaan
beberapa yang penting.
Jika data Webhouse diharapkan akan didistribusikan secara luas, bagaimana
Anda bisa mengelola itu? Bagaimana Anda bisa membuat semua komponen
pekerjaan arsitektur bersama dan masuk akal? Apakah Anda tidak merasa bahwa
tanpa sesuatu di tengah, tampaknya tidak mungkin untuk membuatnya bekerja?
Dalam dunia nyata, banyak dari kelompok yang terhubung mungkin
menggunakan berbagai technolo-gies dan platform yang berbeda. Bagaimana
Anda bisa mengikat mereka semua bersama-sama? Dari mana?
Silakan mempelajari pengamatan berikut dengan seksama:

Untuk mencapai koherensi arsitektur dasar antara unit didistribusikan,


fer-vently mengadopsi model dimensi sebagai teknik pemodelan dasar.
Menggunakan arsitektur bus data warehouse. Arsitektur ini, dengan
dimensi sepenuhnya sesuai dan fakta-benar standar, yang kondusif untuk
arus informasi yang benar.
Dalam lingkungan terdistribusi, yang sesuai dimensi dan fakta? Dalam
bab-bab sebelumnya, kita telah membahas arti sesuai dimensi dan fakta.
Pada dasarnya, implikasinya adalah untuk memiliki definisi yang sama di
seluruh. Salah satu saran adalah untuk sentralisasi definisi dimensi sesuai
dan fakta con-terbentuk. Kebutuhan ini tidak sentralisasi fisik;
sentralisasi logis akan bekerja. Sentralisasi ini memberikan kemiripan
pusat data Webhouse.
Masih pertanyaannya tetap: yang benar-benar sesuai dimensi dan fakta?
An-swer tergantung pada apa yang akan bekerja untuk lingkungan Anda.
Jika layak, menetapkan tugas sesuai dimensi dan fakta kepada kelompok-

kelompok lokal peserta. Setiap kelompok mendapat tanggung jawab


untuk datang dengan definisi untuk dimensi atau satu set fakta.
Nah, bagaimana semua unit menjadi sadar set lengkap definisi untuk
semua di-mensions dan fakta? Di sinilah Web berguna. Anda dapat
memiliki Defin-itions diterbitkan di Web; mereka kemudian menjadi
standar untuk sesuai Dimen-keputusan dan fakta.
Bagaimana Anda secara fisik melaksanakan tabel dimensi sesuai dan
tabel fakta con-terbentuk? Tabel dimensi sering fisik digandakan. Sekali
lagi, melihat apa yang layak di lingkungan Anda. Jumlah sentralisasi
fisik semua tabel Dimen-sion mungkin tidak praktis, tetapi tabel fakta
sesuai jarang diduplikasi. Umumnya, tabel fakta yang sangat besar
dibandingkan dengan tabel dimensi.
Salah satu pertimbangan terakhir. Sekarang kita memahami data
Webhouse sebagai satu set didistribusikan dimensi dan fakta berdasarkan
teknologi database mungkin berbeda. Bagaimana Anda bisa membuat
seperti sebuah karya koleksi didistribusikan sebagai suatu kesatuan yang
utuh? Ini adalah apa alat query atau penulis laporan diperlukan untuk
melakukan sedemikian Konfigurasi-tion didistribusikan. Mari kita
mengatakan salah satu pengguna jauh mengeksekusi query tertentu. Alat
query harus membangun koneksi ke masing-masing penyedia tabel fakta
yang diperlukan dan mengambil set hasil yang dibatasi oleh dimensi
sesuai. Kemudian alat ini harus menggabungkan semua hasil set yang
diambil di server aplikasi menggunakan single-pass

394 DATA PERGUDANGAN DAN WEB


sort-merge. Kombinasi tersebut akan menghasilkan hasil akhir yang benar
diatur hanya akan menyebabkan-dimensi semua sesuai.
Menempatkan Potongan Bersama
Dalam ayat ini, mari kita pergi ke berbagai komponen yang perlu ditarik bersamasama untuk membuat data warehouse Web-enabled. Simak daftar berikut:

Data konfigurasi Webhouse luar komputasi client / server. Dua tingkat


atau tiga-tier biasa teknologi tidak memadai. Karena jumlah pengguna
meningkat tajam, server baru harus ditambahkan tanpa kesulitan apapun.
Oleh karena itu, mempertimbangkan komponen arsitektur terdistribusi.
Dengan node pengguna menyebar, Anda harus berusaha untuk
administrasi minimum pada sisi klien. Teknologi thin-client sejati seperti
Java cenderung memberikan setup klien nol-administrasi yang-trasi.
Teknologi client diharapkan menjadi kombinasi thin client dan klien
penuh. Memastikan integrasi metadata lengkap. Kedua IT dan berbagai
jenis pengguna akan mendapatkan keuntungan dari metadata terpadu.
Pilih database yang tepat untuk mendukung lingkungan terdistribusi.
Seperti Anda mungkin menggunakan Java, sebuah RDBMS dengan
mesin Java dalam database akan berguna.
Dalam banyak aplikasi Web, server HTTP menjadi titik kemacetan karena
semua data dari sesi diumpankan ke browser melalui server ini. Anda
akan menemukan scalabili-ty menjadi sulit kecuali Anda menerapkan
model CORBA. CORBA menyediakan distrib-usikan komputasi objek
dan skalabilitas karena server dan klien komunikasi-cate melalui
CORBA.
Pastikan bahwa Anda membayar perhatian yang cukup untuk administrasi
dan pemeliharaan. Ini harus mencakup identifikasi dimensi, hirarki dalam
dimensi, fakta, dan ringkasan. Ringkasan manajemen bisa sulit.
Antarmuka Web terdiri dari browser, mesin pencari, groupware,
mendorong technolo-gies, halaman rumah, link hypertext, dan didownload Java applet dan ActiveX.
Alat pendukung HTML dapat digunakan secara universal. Namun, untuk
kompleks Analy-sis, HTML rumit. Gunakan HTML sebanyak mungkin
dan cadangan Jawa atau plug-in untuk analisis ad hoc yang kompleks.

Pengolahan Model web

Pertama mari kita lihat konfigurasi arsitektur Web. Lihat Gambar 16-6
menunjukkan susunan keseluruhan. Perhatikan bahwa arsitektur adalah lebih
kompleks bahwa arsitektur client / server dua tingkat atau tiga-tier. Anda perlu
tingkatan tambahan untuk mengakomodasi kebutuhan komputasi Web. Minimal,
Anda harus memiliki server Web antara browser klien dan database. Juga,
perhatikan firewall untuk melindungi aplikasi perusahaan Anda dari gangguan
luar.
Ini mencakup keseluruhan arsitektur. Lihat Gambar 16-7 menunjukkan model
untuk menyampaikan informasi. Model ini menggambarkan bagaimana halaman
HTML dijabarkan ke dalam query SQL diteruskan ke DBMS menggunakan script
CGI. Model ini menunjukkan komponen untuk pengiriman infor-masi melalui
halaman HTML. Model ini dapat digeneralisasi untuk menggambarkan teknologi
lainnya.

MEMBANGUN WEBENABLED DATA


WAREHOUSE

395

396 DATA PERGUDANGAN DAN WEB


BAB RINGKASAN

Web adalah fenomena komputasi yang paling dominan dari tahun 1990an dan yang technol-ogy dan data warehousing berkumpul untuk
menghasilkan hasil yang dramatis.
Sebuah gudang data Web-enabled menyesuaikan Web untuk pengiriman
informasi dan Collab-orasi di kalangan pengguna.
Mengadaptasi data warehouse ke Web berarti termasuk fitur seperti informasi "push" teknik, kemudahan penggunaan, respon cepat, tidak ada
downtime, keluaran multimedia, dan skalabilitas.
Penyampaian informasi berbasis web memperluas penggunaan data
warehouse dan membuka strategi informasi baru.
Kombinasi OLAP dan teknologi Web menghasilkan manfaat yang besar
bagi pengguna.
Karena sifat terbuka dari Web, mengadaptasi data warehouse ke Web
panggilan untuk pelaksanaan pertimbangan serius.

PERTANYAAN REVIEW
1.
2.
3.
4.

Jelaskan secara singkat dua fitur utama dari data warehouse Web-enabled.
Bagaimana Internet, intranet, extranet dan berlaku untuk data warehouse?
Apa harapan pengguna dari sebuah gudang data Web-enabled?
Bagaimana Anda bisa menggunakan Web sebagai sumber data untuk data
warehouse Anda? Apa jenis informasi yang bisa Anda dapatkan dari Web?
5. Nama setiap empat pilihan standar pada halaman Web menyampaikan
informasi dari data warehouse.
6. Apakah empat teknologi umum untuk membangun user interface Webenabled untuk gudang data Anda?
7. Mengapa keamanan data menjadi perhatian utama untuk data warehouse
Web-enabled?
8. Daftar setiap empat fitur dari data Webhouse.
9. Nama dua pendekatan untuk sistem OLAP berfungsi dalam data
warehouse Web-enabled.
10. Apa arsitektur bus data warehouse? Bagaimana cara masuk dalam data
warehouse Web-enabled?

LATIHAN
Menunjukkan jika benar atau salah:

Extranet yang tidak termasuk mitra bisnis di luar dari mengakses data
warehouse perusahaan.

Teknologi web dalam data warehouse membuka berbagai format informasi


kepada pengguna.

Penyampaian informasi yang lebih baik kepada pengguna adalah satusatunya alasan untuk Web-memungkinkan gudang data Anda.

LATIHAN 397

Supergrowth merupakan fenomena langka di Web-enabled data warehouse


environ-ment.

Web ini mempromosikan "swalayan" akses.

Data Webhouse memerlukan arsitektur terdistribusi.

Teknologi web membuatnya lebih mudah untuk menambahkan lebih


banyak pengguna untuk data warehouse.

Web dan fitur-fiturnya tidak kompatibel dengan data warehouse.

Untuk antarmuka informasinya, data warehouse Web-enabled tidak dapat


menggunakan kedua "push" dan "menarik" teknik.

Dalam data warehouse Web-enabled, HTML atau XML standar file adalah
prin-cipal berarti untuk komunikasi.

Informasi berbasis web dalam hasil data warehouse di "supergrowth." Diskusikan


pertumbuhan yang fenomenal ini dan menjelaskan bagaimana Anda akan
memberikan supergrowth.
Tim proyek Anda telah diarahkan untuk menyediakan semua pembuatan laporan
dan pengiriman melalui Internet. Membuat rencana untuk mengadopsi
teknologi Web untuk semua pelaporan dari gudang data Anda. Membahas
semua implikasi.
Data warehouse Web-enabled tidak memiliki pusat. Ini adalah lingkungan
terdistribusi. An-alyze implikasi dari pernyataan-pernyataan ini. Dari perspektif
ini, apa con-siderations untuk menjaga tabel dimensi dan fakta?
Sebagai spesialis Web pada tim proyek, menyiapkan dokumen menyoroti
pertimbangan ma-jor untuk Web-memungkinkan gudang data Anda. Hanya
daftar-tions considera, bukan teknik pelaksanaan.

Anda mungkin juga menyukai