Anda di halaman 1dari 2

Nama: Fathya Cici Hanifah

NPM : 5210311142
Data Warehouse merupakan penyimpanan dalam bentuk
elektronik di komputer induk atau data cloud di internet. Data
Warehouse digunakan untuk mendukung pengambilan
keputusan, bukan untuk melaksanakan pemroresan transaksi.
Konsep Data Warehouse

- Sumber data (Data Sources) berasal dari berbagai aplikasi


yang ada di perusahaan dan/atau penyedia data eksternal. -
Data Extraction (E) & Transformation (T): Data diekstraksi
& diubah (dengan benar) menggunakan perangkat lunak
tertentu. Data Loading (L): Data dimuat (ke staging area),
Karakteristik Data Warehouse: - Subject Oriented: Data untuk diubah & dibersihkan, sehingga data siap dimuat ke
disusun menurut subyek, berisi informasi yang penting bagi dalam data warehouse. - Metadata mencakup program
pemprosesan decision support. Database dengan semua perangkat lunak tentang data & aturan untuk mengatur
informasi yang tersimpan, dikelompokkan berdasarkan subyek ringkasan yang mudah diindeks & dicari (terutama dibasis
tertentu, misalnya: pelanggan, gudang, pasar, dsb– Integrated: Web). Metadata dipertahankan sehingga dapat dinilai oleh
Jika data terletak pada berbagai aplikasi yang terpisah dalam personel TI dan pengguna (user). - Enterprise Data Warehouse
suatu lingkungan operasional (encoding data sering tidak (EDW) merupakan basis data yang komprehensif
seragam) sehingga jika data dipindahkan ke data warehouse (comprehensive database), diperlukan untuk mendukung
maka coding akan diasumsikan sama seperti lazimnya. – Time semua analisis keputusan dengan memberikan informasi yang
Variant: Data warehouse adalah tempat untuk storing data dirangkum dan terperinci yang relevan, yang berasal dari
selama 5 sampai 10 tahun atau lebih. Data digunakan untuk berbagai sumber. - Data Marts: bagian dari data warehouse
perbandingan atau perkiraan, dan data ini tidak dapat yang mendukung kebutuhan pada tingkat departemen atau
diperbaharui. – Non-Voltatile: Data tidak dapat diperbaharui fungsi bisnis tertentu dalam perusahaan, biasanya berorientasi
atau diubah tetapi hanya dapat ditambah dan dilihat. untuk suatu tujuan yang spesifik atau subjek data yang
Membangun Data Warehouse: • Menentukan misi dan didistribusikan untuk mendukung kebutuhan bisnis. - API /
sasaran bisnis bagi pembentukan data warehouse. Middleware: berupa alat middleware (middleware tools) yang
•Mengidentifikasi data dari basis data operasional dan sumber memungkinkan akses ke data warehouse. - Applications
lain yang diperlukan bagi data warehouse. • Menentukan item- (Visualization): aplikasi untuk visualisasi data/informasi. Ada
item data dalam perusahaan dengan melakukan standarisasi banyak aplikasi front-end yang dapat digunakan pengguna
penamaan data dan maknanya. • Merancangbasisdatauntukdata untuk berinteraksi dengan data yang disimpan di repositori
warehouse. • Membangun kebijakan dalam mengarsipkan data data, seperti OLAP, (termasuk Data Mining), tools pelaporan,
lama, sehingga ruang penyimpanan tak menjadi terlalu besar dan tools visualisasi data lainnya. - OLAP (OnLine Analytical
dan agar pengambilan keputusan tidak menjadi terlalu lamban. Processing): suatu jenis pemrosesan yang memanipulasi &
•Menarik data produksi (operasional) dan meletakkan ke basis menganalisa data bervolume besar. Perangkat lunak OLAP
data milik data warehouse. Contoh perangkat lunak yang digunakan oleh pemakai untuk mengakses data warehouse
digunakan untuk administrasi dan manajemen data warehouse:
• HPIntelligent Warehouse (Hewlett Packard) • FlowMark
(IBM) • SourcePoint (Software AG)

Langkah Penerapan Data Warehouse

Fungsi Staging Area menyederhanakan proses pembuatan


summary & management warehouse secara umum.
Data Mining adalah proses yang menggunakan teknik 1. Star Schema: Skema ini mengikuti bentuk bintang, dimana
statistika, matematika, dan kecerdasan buatan untuk terdapat satu tabel fakta di pusat bintang dengan beberapa tabel
mengestrak dan mengidentifikasi informasi dan pengetahuan dimensi yang mengelilinginya. Semua tabel dimensi
(dengan mengenali pola) yang berguna dari kumpulan data berhubungan dengan ke tabel fakta. Tabel fakta memiliki
yang besar. beberapa primary key dalam tabel dimensi.

1. Data cleaning (Pembersihan Data) : untuk membuang data


yang tidak konsisten dan noise) 2. Data integration :
penggabungan data dari beberapa sumber 3. Data Mining 2. Snowflake Schema merupakan perluasan dari star schema
Engine : Mentranformasikan data menjadi bentuk yang sesuai dengan tambahan beberapa tabel dimensi yang tidak
untuk di mining 4. Pattern evaluation : untuk menemukan yang berhubungan secara langsung dengan tabel fakta. Tabel dimensi
bernilai melalui knowledge base 5. Graphical User Interface tersebut berhubungan dengan tabel dimensi yang lain.
(GUI) : untuk end user.

3. Skema Constellation Pada skema ini terdapat beberapa


Tahapan Proses Knowledge In Database: 1. Data Selection: tabel fakta yang menggunakan satu atau beberapa tabel
himpunan data, atau memfokuskan pada subset variabel atau dimensi.
sampel data, dimana penemuan (discovery) akan dilakukan. 2.
Pre-Processing / Cleaning (1): Pemprosesan pendahuluan dan
pembersihan data merupakan operasi dasar seperti
penghapusan noise dilakukan. 3. Pre-Processing / Cleaning
(2): Proses cleaning mencakup antara lain membuang duplikasi
data, memeriksa data yang inkonsisten, dan memperbaiki
kesalahan pada data, seperti kesalahan cetak (tipografi).
4.Transformation: Merupakan proses transformasi pada data
yang telah dipilih, sehingga data tersebut sesuai untuk proses
data mining. 5. Data Mining: Proses Data mining yaitu proses
mencari pola atau informasi menarik dalam data terpilih OLAP (On-Line Analytical Processing) adalah teknologi
dengan menggunakan teknik atau metode tertentu. Teknik, yang memproses data ke dalam struktur multidimensi,
metode, atau algoritma dalam data mining sangat bervariasi. menyediakan jawaban yang cepat untuk query analisis yang
Pemilihan metode atau algoritma yang tepat sangat bergantung kompleks dengan tujuan untuk mengorganisir sejumlah data
pada tujuan dan proses KDD secara keseluruhan. 6. yang besar, agar bisa dianalisa dan dievaluasi dengan cepat
Interpretation / Evaluation: Tahap ini merupakan bagian dari serta menyediakan kecepatan dan fleksibelitas untuk
proses KDD yang mencakup pemeriksaan apakah pola atau mendukung analisa dalam waktu nyata. Karakteristik OLAP,
informasi yang ditemukan bertentangan dengan fakta atau yaitu : 1. Mengijinkan pelaku bisnis melihat data dari sudut
hipotesa yang ada sebelumnya. pandang logical dan multidimensional pada data warehouse. 2.
Memfasilitasi query yang kompleks dan analisa bagi pengguna.
Model Dimensional Data Mart: Model dimensional pada data
3. Mengijinkan pengguna melakukan drill-down untuk
mart terdiri dari tabel fakta dan tabel dimensi, Ada beberapa
menampilkan data yang lebih detail atau roll-up untuk agregasi
model skema yang terdapat pada pemodelan data mart, yaitu
dari suatu dimensi atau beberapa dimensi. 4. Menyediakan
skema star, skema snowflake, dan skema constellation.
proses kalkulasi dan perbandingan data. 5. Menampilkan hasil
Penjelasan dari masing-masing model skema adalah sebagai
dalam bentuk tabel atau grafik.
berikut :

Anda mungkin juga menyukai