TUGAS KE-12
DATA WAREHOUSE DAN DATA MINING
Nama: Muhammad Irfan Baari
Jurusan: Ilmu Pengetahuan Alam (IPA)
Program Studi: Teknik Informatika (TI)
NIM: 421910004
Berikut ini adalah 3 jenis dasar dalam data warehouse dan data mining, adalah sebagai
berikut:
Functional Data Warehouse (Data Warehouse Functional)
Kata operasional disini merupakan basis data (database), yang telah
diperoleh dari kegiatan sehari-hari.. Data warehouse, yang dibuat lebih
dari satu dan juga dikelompokan berdasarkan fungsi-fungsi yang ada di
dalam perusahaan seperti contoh misal nya, adanya, fungsi keuangan
(financial, marketing, persolity, dan lain sebagainya)..
Keuntungan dari bentuk data warehouse, seperti ini adalah sistem
lebih mudah, dibuat dengan biaya relative lebih murah.. Sedangkan
dengan kerugian nya, adalah resiko kehilanan konsistensi data dan juga terbatasnya,
dari kemampuan dalam pengumpulan data untuk bagi pengguna yang lain nya..
Functional
Source Data
Warehouse
Source
Functional
Source Data
Warehouse
Source Source
Centralized
Source Data
Warehouse
Functional
Source Data
Warehouse
Source
Data Warehouse
Gateway
Source
Source
A. Data Operasional:
Sumber data dari data warehouse, itu bisa dapat diambil dan juga dapat diakses langsung
oleh Mainframe, bais data relasional, seperti itu Oracle, MS, MySQL, SQL, Server, dan lain
sebagainya.. Selain itu juga dapaat melalui operasional Data Source (ODS).. ODS, itu mampu
menampung data yang telah diekstrak, dari sistem utama atau sumber-sumber data yang telah
ada dan lalu kemudian data hasil ekstraksi tersebut, akan dibersihkan.. Dan lain sebagainya..
B. Load Manager:
Load Manager, itu juga dapat disebut sebagai sebuah kompoen-kompoen front-end, yang
bertugas melakukan seluruh operasi
Gambaryang berhubungan
2.3.4-Arsiektur dengan
Data ekstraksi dan Load-load Manager
Warehouse
data warehouse, yang lain nya.. Dan lain sebagainya..
C. Data Warehouse Managre:
Data warehouse manager, itu melakukan seluruh operasi-operasi, yang berhubungan
dengan kegiatan manajemen data di dalam data warehous.. Operasi-operasi tersebut akan
menjadi sebagai berikut:
Analisis terhadap data untuk memastikan konsistensi
Transformasi dan juga penggabungan sumber data dari tempat penyimpanan
sementara akan menjadi tabel-tabel data warehouse
Penciptaan indeks-indeks dan penampilan view berdasarkan tabel-tabel dasar
Melakuakn denormalisasi dan juga agregasi jika diperlukan
Melakukan pencadangan data (backup data), dan juga pengarsipan data..
Dan lain sebagainya..
D. Query Manager:
Query manager, juga dapat disebut sebuah komponen back-end, yang melakukan operasi-
operasi yang berhubungan dengan manajemen user dan query.. Operasi-operasi, oleh kompoen
ini, termasuk mengarahkan query, kepada tabel-tabel yang tepat dan juga menjadwalkan
pengeksekusian query data tersebut..
Highly
Summarized
M
Lighty
E
Summarized
T
A
D
Current
A
T
A
detail data
Older detail
Gambar 2.3.5 Metadata data
Berikut ini beberapa alasan mengapa current detail data menjadi perhatian utama:
1. Menggambarkan kejadian yang terbaru terjadi dan selalu menjadi perhatian uatama
2. Sangat banyak jumlah nya, dan juga disimpan pada tingkat penyimpanan terendah
3. Hampir selalu disimpan dalam storage penyimpanan, oleh karenaitu lebih sangat cepat
diakses tetapi mahal dan kompleks di dalam pengaturan nya..
4. Bisa dapat digunakan dalam pembuatan rekapitulasi sehingga current detail data harus
tetap akurat..
4. Metadata:
Metadata, ini bukan merupakan data hasil kegiatan seperti keempat jenis data yang
diatas.. Menurut Poe, metadata, adalah data tentang data, yang menyediakan informasi tentang
struktur data dan juga hubungan antara struktur data di dalam atau antara storage penyimpanan
(tempat penyimpanan data)..
Metadata, ini telah berisikan data yang telah menyimpan proses dari perpindahan data
yang meliputi basis data (database), structure, contents, detail, data dan juga summary data,
matrics, versioning, aging criteria, versioning, transformation criteria.. Metadata telah khusus
dan juga menjaga peranan yang sangat penting dalam data warehouse tersebut.. Dan lain
sebagainya..
Algoritma
Algoritma itu digunakan untuk melakukan ringkasan data Metadata, sendiri
merupakan panduan untuk algoritma dalam melakukan pemprosesan ringkasan data
antara current detail data, dengan lightly summarized data, dan juga lightly summarized
data, dengan hightly summarized data warehouse.. Dan lain sebagainya..
Mapping
Sebagai panduan pemetaan/(mapping), data pada saat melakukan pen
transformasian data/data dirubah dari lingkup operasional yang akan menjadi ruang
lingkup data warehouse tersebut.. Dan lain sebagainya..
Pilihan terbaik untuk data mart, yang pertama adalah yang saling berhubungan dengan
sales harga jual, seperti contoh misal nya, adanya property sales leasing, property
advertising.. Dan lain sebagainya..
Seperti contoh misalnya, jika sumber dari sebuah tabel fakta property sales, adalah
property sales individual, maka jadinya, sumber informasi dari sebuah dimensi
pelanggan yang membeli property utama.. Dan lain sebagainya..
Seperti contoh misalnya, setiap data pelanggan pada tabel dimensi pembeli yang telah
dilengkapi dengan id_pelangan, no_pelanggan, tipe_pelanggan, tempat_tinggal, dan lain
sebagainya..
Maka jadinya, jika ada dimensi yang masih muncul pada dua data mart, kedua data mart,
itu tersebut, akan harus berdimensi sama, atau paling tidak salah satunya, adalah harus
berupa subset matematis dari yang lain nya.. Dan lain sebagainya..
Maka jadinya, jika sebuah dimensi digunakan pada dua data mart, atau lebih dan dimensi
ini tidak disinkronisasi, maka jadinya, secara keseluruhan data warehouse, akan gagal..
Oleh karena itu ada dua data mart, yang tidak bisa digunakan secara bersama-sama.. Dan
lain sebagainya..
dengan kebutuhan bisnis, yang mendukung query database, sederhana.. Dan juga menyediakan
performa query database, yang lebih sangat superior, dengan meminimalisasi tabel-tabel join..
Dan lain sebagainya..
Berikut ini adalah contoh perbandingan antara model data OLTP, dengan dimensi tabel
data warehouse, adalah sebagai berikut, dibawah ini:
jumlah_tabungan
Kelas
foto
nama
tabungan pemakai_tabungan
-id_tabungan: varchar(10 -id_pt: int(9)
-nis: bight(9) -nis:bight(10)
-nama: varchar(40) -nama:varchar(20)
-kelas: varchar(19) -kelas: varchar(19)
-tahun_ajaran: varchar(20) -tahun_ajaran:varchar(10)
1 1
-jumlah_nominal: int(11) siswa -jumlah_pemakaian: int(40)
-tanggal: date() -nis: bight(10) -keterangan: varchar(30)
+add() 1 -tanggal: date()
-nama: varchar(29)
+get tanggal now() -tahun_ajaran: varchar(30)
user +add()
+get nis() -jenis_kelamin: varchar(30)
-nis: bigth(10) +get nist()
-nama: varchar(50) -kelas: varchar(19) +get tanggal now()
-id_level: int(11) -jumlah_normal_tabungan: level
11 int(10)
-password: varchar(10) -id_level: int(3)
+add()
-foto: blob -level: varchar(40)
+update()
+add() +add()
+delete()
+update() +update()
+delete() +delete()
1
1
Skema
Bintang Table
Jenis-jenis- Skema
Bintang:
Skema
bintang
sederhana
Dalam skema ini, setiap tabel harus memiliki kunci primary key yang terdiri dari satu
kolom atau lebih dari satu kolom tersebut.. Dan lain sebagainya..
Kunci primary key, dari tabel fakta yang terdiri dari satu atau foreign key, yang
merupakan kunci primary key.. Pada tabel..
Adapun dari ketentuan dalam pembacaan skema bintang adalah sebagai berikut:
Bagian yang ada di bawah judul tabel merupakan kolom-kolom tabel tersebut
Kunci primary key, dan kunci foreign key dapat diberikan kota
Kunci primary key yang diarsir kunci foreign key yang bukan kunci primary key atau
tidak
Kunci foreign key, yang saling berhubungan dan ditunjukan dengan garis yang
menghubungkan tabel
Kolom yang bukan kunci disebut kolom data pada tabel fakta dan atribut pada tabel
dimensi tersebut.. Dan lain sebagainya..
Snowflake Schema