Anda di halaman 1dari 7

LAPORAN PRAKTIKUM

MATA KULIAH DATA WAREHOUSE DATA MINING


MODUL PERTEMUAN 7
(Data Warehouse Concept Preparation For Data Mining)

Disusun Oleh:

Nama : Rendy Anwar Prasetya


Kelas : SI 5
NRP : 14621665

PROGRAM STUDI SISTEM INFORMASI


SEKOLAH TINGGI ILMU KOMPUTER (STIKOM) POLTEK
CIREBON
2023
MODUL 7

KONSEP DATA WAREHOUSE


UNTUK PERSIAPAN DATA MINING

A. TEORI SINGKAT

1. Star Schema
Dalam data warehouse, data-datanya akan disimpan dalam tabel fakta
dan tabel dimensi. Tabel fakta akan menyimpan data-data utama sementara
tabel dimensi mendeskripsikan setiap nilai dari suatu dimensi dan dapat
direlasikan ke tabel fakta jika diperlukan. Data fakta merupakan data yang
terukur besarannya, sebagai contoh adalah jumlah siswa, banyaknya rupiah
yang diperoleh, rata-rata IPK, dan sejenisnya.

Tabel dimensi memiliki primary key sederhana yang mengandung hanya


satu atau dua kolom saja. Namun, tabel fakta akan memiliki sekumpulan
foreign key yang disusun dari primary key komposit dan merupakan
gabungan kolomkolom tabel dimensi yang berelasi. Untuk lebih jelasnya,
berikut contoh struktur star schema.

Gambar 1. Contoh star schema

Untuk struktur star schema seperti gambar 1, data dalam tabel fakta yang diukur
adalah hasil penjualan (dalam mata uang dollar) berdasarkan dimensi atau kondisi
produk yang dijual (product) serta waktu penjualan (time). Misalkan dimensi
produk, yang menyimpan informasi-informasi seputar produk. Produk ini dapat
dikelompokkan ke dalam kategori, dan di dalam kategori ini pun bisa ditemukan
sub- kategori.
Laporan Praktikum DWDM Rendy Anwar Prasetya 1|Page
2. Snowflake Schema
Struktur basis data ini lebih kompleks dari pada star schema, dengan
menormalisasi tabel-tabel dimensi yang berukuran besar dengan satu atau lebih
kolom yang memiliki duplikasi data. Misalkan jika tabel dimensi Product
dinormalisasi maka akan menghasilkan struktur seperti berikut:

Gambar 2. Contoh bentuk Snowflake


Tabel dimensi dinormalisasi untuk mengurangi redudansi data
(duplikasi), sehingga struktur tabelnya akan lebih ramping. Dengan
pengelompokan ini, data akan lebih mudah dibaca dan membantu
pengembang aplikasi untuk menata desain antarmuka sistem dan filtering
data.
Data atau tabel dalam data warehouse tersebut dapat dimodelkan
dengan menggunakan alat bantu pemodelan seperti E-R diagram, star
schema, snowflake schema, atau FCO-IM (Fully Communication Oriented
Information Modelling). Tetapi pada umumnya alat bantu yang digunakan
adalah star schema atau snowflake schema. Star schema digunakan untuk
menggambarkan fact table, yaitu tabel yang merepresentasikan measure,
sebagai “pusat data”. Tabel ini nantinya akan terkoneksi dengan tabel-tabel
yang mendeskripsikan dimensi untuk measure tersebut (dimension table).
Sebagai contoh, snowflake schema untuk data warehouse penjualan di
sebuah perusahaan batik adalah:

Gambar 3. Snowflake Schema Penjualan

Laporan Praktikum DWDM Rendy Anwar Prasetya 2|Page


Karakteristik schema snowflake

Dilansir dari Geeks for Geeks, salah satu karakteristik utama


dari snowflake schema adalah ukurannya yang kecil. Selain itu, mudah juga untuk
menambahkan dimensi pada skema saat kamu mau. Akan tetapi, karena ada begitu
banyak tabel di dalamnya, performa skema ini pun cenderung lebih lambat. Namun,
setiap dimension table-nya bisa memiliki dua atau lebih set atribut yang mendefinisikan
informasi dalam grain data yang berbeda.

Manfaat schema snowflake:

 Manfaat utama adalah kemajuan dalam kinerja kueri, karena


memerlukan penyimpanan disk minimal dan bergabung dengan tabel
pencarian dengan ukuran lebih kecil
 Menawarkan fleksibilitas yang lebih baik untuk hubungan timbal balik
antara komponen dan tingkat dimensi
 Mudah dirawat, karena tidak ada redundansi Meningkatkan kinerja
keseluruhan karena tabel yang lebih kecil digabungkan
Kekurangan Snowflake:

 Snowflaking mengurangi ruang yang dikonsumsi oleh tabel dimensi, tetapi


dibandingkan dengan seluruh data warehouse, penghematan biasanya tidak
signifikan.

 Hindari kepingan salju atau normalisasi tabel dimensi, kecuali diminta dan sesuai.
 Jangan hierarki kepingan salju dari tabel satu dimensi ke dalam tabel terpisah.
Hierarki seharusnya hanya milik tabel dimensi dan tidak boleh di-snowfalk.
 Beberapa hierarki dapat memiliki dimensi yang sama telah dirancang pada detail
serendah mungkin
Kasus untuk snowflake meliputi:

 Atribut yang jarang diisi, di mana sebagian besar catatan anggota dimensi
memiliki nilai NULL untuk atribut, dipindahkan ke sub-dimensi.
 Atribut kardinalitas rendah yang dipertanyakan secara independen. Misalnya,
dimensi produk dapat berisi ribuan produk, tetapi hanya segelintir jenis
produk. Memindahkan atribut tipe produk ke tabel dimensinya sendiri dapat
meningkatkan kinerja ketika tipe produk ditanyai secara independen.
 Atribut yang merupakan bagian dari hierarki dan dipertanyakan secara
independen. Contohnya termasuk atribut tahun, kuartal, dan bulan dari
hierarki tanggal dan atribut negara dan negara dari hierarki geografis.

Laporan Praktikum DWDM Rendy Anwar Prasetya 3|Page


B. DETAIL PROSES PRAKTIKUM

Perancangan Star Schema Dan Snowflake

Menggambar Star Schema dengan menggunakan DB Desaigner :

1. Jalankan program aplikasi DB Designer untuk membuat desain star schema.

2. Klik button new table kemudian klik pada area kerja sehingga akan
menghasilkan table baru.

3. Double klik pada table baru untuk membuka table editor, ganti nama pada
table nama dengan nama dimensi_kategori_RendyAnwar_14621665, kemudian
isikan atribut table dengan data sebagai berikut :

Laporan Praktikum DWDM Rendy Anwar Prasetya


4. Klik pada column name kode_kategori untuk mengatur kode_kategori sebagai
primary key sehingga berubah menjadi logo key.

5. Klik Tombol cheklist untuk menutup table editor sehingga table


dimensi_kategori_RendyAnwar_14621665

menjadi :

6. Ulangi Kembali Langkah 2 sampai 5 untuk membuat table


dimensi_sub_kategori, dimensi_pola, dimensi_produk, dimensi_waktu,
fakta_penjualan, dimensi_wilayah, dimensi_pelanggan, dan
dimensi_jenis_kelamin.
7. Setelah semua table dibuat, hubungkan setiap table dengan table lain dengan
button sebagai berilut :

Keterangan : klik salah satu button yang sesuai dengan kebutuhan kemudian kllik
table yang akan dihubungkan.

8. Ubah nama relationship dengan membuka relationship editor, sehingga


setelah selesai hasil akhir menjadi seperti berikut :

Laporan Praktikum DWDM Rendy Anwar Prasetya


C. KESIMPULAN

Skema bintang adalah jenis skema data yang paling sederhana dan pendekatan
yang paling banyak digunakan untuk mengembangkan gudang data dimensional
dan metadata. Skema bintang terdiri dari satu atau lebih tabel fakta yang
mereferensikan beberapa tabel dimensi. Skema bintang adalah kasus khusus
yang penting dari skema kepingan salju dan lebih efektif dalam menangani kueri
yang lebih sederhana. Skema Kepingan Salju merupakan perpanjangan dari
Skema Bintang dan menambahkan dimensi tambahan. Disebut kepingan salju
karena diagramnya terlihat seperti kepingan salju.

D. DAFTAR PUSTAKA

Perbandingan model Skema Bintang Dan model Skema snowflake Pada data
warehouse. (2017, April 10). Master of Computer
Science. https://mti.binus.ac.id/2017/04/10/perbandingan-model-skema-
bintang-dan-model-skema-snowflake-pada-data-warehouse/

Rahmalia, N. (2020, December 10). Kenalan dengan snowflake schema,


Struktur database Yang Menyerupai Kepingan Salju. Glints
Blog. https://glints.com/id/lowongan/snowflake-schema-adalah/

Laporan Praktikum DWDM Rendy Anwar Prasetya

Anda mungkin juga menyukai