OLEH :
STIMIK-STIKOM INDONESIA
Penulis mengucapkan syukur kepada Tuhan YME atas limpahan nikmat sehat-Nya, baik itu berupa
sehat fisik maupun akal pikiran, sehingga penulis mampu untuk menyelesaikan pembuatan
makalah sebagai tugas dari mata Jaringan dan Komunikasi.
Penulis tentu menyadari bahwa makalah ini masih jauh dari kata sempurna dan masih banyak
terdapat kesalahan serta kekurangan di dalamnya. Untuk itu, penulis mengharapkan kritik serta
saran dari pembaca untuk makalah ini, supaya makalah ini nantinya dapat menjadi makalah yang
lebih baik lagi. Kemudian apabila terdapat banyak kesalahan pada makalah ini penulis mohon
maaf yang sebesar-besarnya.
Penulis
Daftar Isi
Kata pengantar…………………………………………………………………………………i
Daftar Isi………………………………………………………………………………………...ii
BAB I
PENDAHULUAN……………………………………………………………………………….1
BAB II
PEMBAHASAN…………………………………………………………………………………2
BAB III
PENUTUP………………………………………………………………………………………15
3.1. Kesimpulan………………………………………………………………………………15
3.2. Saran……………………………………………………………………………………..15
DAFTAR PUSTAKA…………………………………………………………………………16
BAB I
PENDAHULUAN
Salah satu efek yang dihasilkan dari adanya suatu sistem informasi adalah munculnya
banyak data. Data yang ada ini berasal dari sistem operasional yang berfungsi untuk menangani
transaksi yang terkait dengan proses bisnis yang ditangani oleh sistem informasi tersebut. Anda
tinggal kalikan saja apabila ingin menghitung jumlah data yang disimpan selama seminggu waktu
operasional, sebulan, hingga setahun. Itu baru satu sistem informasi saja. Di korporasi yang besar
sistem informasi yang ada berjumlah banyak dengan berbagai fungsi dan tujuannya. Akhirnya
masalah berikutnya muncul.
Data warehouse adalah data-data yang beorientasi subjek, terintegrasi, memiliki dimensi
waktu, serta merupakan koleksi tetap (non-volatile), yang digunakan dalam mendukung proses
pengambilan keputusan. Sedangkan data mining muncul setelah banyak dari pemilik data baik
perorangan maupun organisasi mengalami penumpukan data yang telah terkumpul selama
beberapa tahun, misalnya data pembelian, data penjualan, data nasabah, data transaksi, email dan
sebagainya. Kemudian muncul pertanyaan dari pemilik data tersebut, apa yang harus dilakukan
terhadap tumpukan data tersebut.
PEMBAHASAN
Dalam komputasi , skema bintang adalah gaya paling sederhana dari skema data mart dan
merupakan pendekatan yang paling banyak digunakan untuk mengembangkan gudang
data dan data mart dimensi. Skema bintang terdiri dari satu atau lebih tabel fakta yang
mereferensikan sejumlah tabel dimensi . Skema bintang adalah kasus khusus penting dari
skema kepingan salju , dan lebih efektif untuk menangani pertanyaan yang lebih
sederhana.
Skema bintang mendapatkan namanya dari kemiripan model fisik dengan bentuk bintang
dengan tabel fakta di pusatnya dan tabel dimensi yang mengelilinginya mewakili titik-titik
bintang.
Skema bintang memisahkan data proses bisnis menjadi fakta, yang menyimpan data
kuantitatif terukur tentang bisnis, dan dimensi yang merupakan atribut deskriptif yang
terkait dengan data fakta. Contoh data fakta termasuk harga jual, jumlah penjualan, dan
waktu, jarak, kecepatan dan pengukuran berat. Contoh atribut dimensi terkait mencakup
model produk, warna produk, ukuran produk, lokasi geografis, dan nama penjual.
Skema bintang yang memiliki banyak dimensi kadang-kadang disebut skema kelabang .
Memiliki dimensi hanya beberapa atribut, sementara lebih mudah dipelihara,
menghasilkan kueri dengan banyak tabel bergabung dan membuat skema bintang lebih
mudah digunakan.
Skema bintang merupakan struktur logical yang terdiri dari tabel fakta yang berisi data
faktual dikelilingi oleh tabel dimensi yang berisi referensi data. Skema bintang yang
paling sederhana biasanya terdiri dari satu tabel fakta dan beberapa tabel dimensi.Tiap
dimensi memiliki relasi one-to-many ke tabel fakta dan tabel dimensi hanya memiliki
satu primary key, primary key tersebut merupakan foreign key dari tabel fakta.
Dalam star schema, satu table yang di tengah disebut table fakta (fact table) dan table-table di
kelilingnya adalah tabel dimensi (Dimension table).
Tabel fakta atau disebut juga tabel utama (major table) terdiri dari data fakta atau kuantitatif
tentang informasi bisnis yang akan di–query. Informasi ini biasanya berupa ukuran numerik dan
dapat terdiri dari banyak kolom dan jutaan baris.
Tabel dimensi atau disebut juga dengan tabel kecil (minor tabel) umumnya lebih kecil
dibandingkan tabel fakta dan menyimpan data deskriptif yang menggambarkan dimensi suatu
bisnis. SQL query menggunakan relasi yang telah didefinisikan sebelumnya dan didefinisikan user
antara tabel fakta dan tabel dimensi, dengan batasan pada data untuk mengembalikan informasi
yang dipilih.
Menurut Kimball (2008, p10), Tabel fakta merupakan fondasi dari data warehouse. Tabel fakta
mengandung ukuran fundamental dari perusahaan, dan ia merupakan target utama dari
kebanyakan query data warehouse.
Menurut Connolly dan Begg (2005, p1183), Tabel fakta merupakan sebuah tabel yang memiliki
sebuah composite primary key dimana tabel tersebut akan membentuk sebuah model
dimensional.
Menurut Connolly dan Begg (2005, p1183), Tabel dimensi merupakan sekumpulan dari tabel-
tabel yang lebih kecil yang memiliki sebuah primary key sederhana yang merespon secara benar
terhadap salah satu komponen dari composite key yang ada dari tabel fakta.
Kapan kita menggunakan star schema??
1. Ketika akan melakukan pemodelan data warehouse dan OLAP yang dibangun
berdasarkan multidimensional data
2. Digunakan untuk memudahkan akses berkecepatan tinggi terhadap data yang besar
3. Digunakan baik untuk data mart yang sederhana maupun data warehouse yang sangat
besar
Table dimensi berisi atribut yang menjelaskan table fakta. Sedangkan table fakta adalah table yang
berisi measure, yaitu suatu yang bisa dihitung atau diukur dalam suatu angka.
Contoh measure misalnya "jumlah penduduk", "luas wilayah", "jumlah penjualan", "jumlah
belanja", dll. Sedangkan contoh table dimensi adalah "dimensi wilayah", misalnya dalam contoh
measure "jumlah penduduk", maka dimensi wilayah bisa berisi atribut provinsi, kabupaten/kota,
kecamatan atau kelurahan. Sehingga kita bisa menampilkan jumlah penduduk per provinsi
misalnya.
Contoh lain dimensi misalnya dimensi waktu. Bila dimensi ini digunakan dalam measure "jumlah
penjualan", dimensi waktu dapat berupa tanggal, bulan, kwartal, semester atau tahun. Sehingga
kita bisa menampilkan data penjualan ini dalam rentang (dimensi) waktu yang kita inginkan,
misalnya harian atau bulanan.
Dengan adanya measure dan dimensi, penyusunan suatu laporan business intelligence sangat
mudah dilakukan, karena kita hanya perlu meletakkan dimensi ke dalam baris atau kolom yang
kita inginkan.
Table dimensi sering kali berbentuk hirarki, misalnya dimensi geografi akan memiliki hirarki
dari Negara -> Provinsi -> Kabuptan -> Kecamatan -> Kelurahan dst. Dan saat ini table dimensi
biasanya dilengkapi dengan kordinat posisi (latitude dan longitude) maupun poligon batas
wilayah. Data peta ini digunakan untuk menampilkan data tsb dalam overlay peta seperti contoh
di bawah
Sebagai contoh kasus, kita akan mencoba membuat suatu star schema dari data bencana
Kalau lihat data di atas, maka hanya ada satu measure yaitu "jumlah korban". Ada berapa
dimensi? Paling tidak ada 4 dimensi, yaitu:
Dimensi waktu adalah dimensi yang hampir selalu ada dalam setiap Business Intelligence,
sehingga semua solusi BI biasanya memiliki pre-defined tabel dimensi ini. Di Tableau misalnya,
begitu suatu kolom type nya adalah tanggal, maka otomatis dikenali sebagai dimensi waktu
lengkap dengan atribut lainnya seperti bulan, kwartal, semester, tahun, dll. Dengan dimensi
waktu yang predefined ini kita hampir tidak perlu membuat table dimensi sendiri, namun untuk
kasus ini kita akan membuat table dimensi waktu sendiri.
Dengan dimensi dan measure di atas, maka star schema nya menjadi sbb
Selanjutnya, setelah kita mendapatkan Star Schema yang sesuai adalah memasukkan data yang
ada ke masing-masing table ini.
1 Meninggal
2 Hilang
3 Terluka
4 Mengungsi
1 Banjir
2 Angin Puting Beliung
3 Tanah Longsor
4 Kebakaran Hutan
5 Gempa Bumi
Kita bisa saja membuat listnya secara manual seperti di atas, atau kita bisa gunakan ETL untuk
memasukkan data ini secara program. Kita akan bahas ETL di tulisan berikut.
Untuk table facta disusun dari kolom-kolom dimensi dan measure tablenya menjadi sbb.
Skema Bintang
SELECT
dim_store.store_address,
SUM(fact_sales.quantity) ASquantity_sold
FROM
fact_sales
WHERE
dim_time.action_year = 2016
ANDdim_store.city = ‘Berlin’
ANDdim_product.product_type = ‘phone’
GROUPBY
dim_store.store_id,
dim_store.store_address
2.2 Manfaat
Skema bintang didenormalisasi , artinya aturan normalisasi normal yang diterapkan pada
basis data relasional transaksional dilonggarkan selama perancangan dan implementasi
skema bintang. Manfaat denormalisasi skema bintang adalah:
Kueri yang lebih sederhana - logika bergabung skema bintang umumnya lebih
sederhana daripada logika gabungan yang diperlukan untuk mengambil data dari skema
transaksional yang sangat normal.
Logika pelaporan bisnis yang disederhanakan - bila dibandingkan dengan skema yang
sangat dinormalisasi, skema bintang menyederhanakan logika pelaporan bisnis yang
umum, seperti periode-periode dan periode pelaporan.
Keuntungan kinerja kueri - skema bintang dapat memberikan peningkatan kinerja
untuk aplikasi pelaporan hanya-baca bila dibandingkan dengan skema yang sangat
normal .
Agregasi cepat - kueri yang lebih sederhana terhadap skema bintang dapat
menghasilkan peningkatan kinerja untuk operasi agregasi.
Skema makan kubus - bintang digunakan oleh semua sistem OLAP untuk membangun
kubus OLAP eksklusif secara efisien; pada kenyataannya, sebagian besar sistem OLAP
utama menyediakan mode operasi ROLAP yang dapat menggunakan skema bintang
secara langsung sebagai sumber tanpa membangun struktur kubus berpemilik.
2.3 Kekurangan
Kerugian utama dari skema bintang adalah bahwa integritas data tidak ditegakkan dengan
baik karena berada dalam keadaan sangat dinormalisasi. Sisipan dan pembaruan satu kali
dapat mengakibatkan anomali data yang dirancang untuk dihindari oleh skema normal .
Secara umum, skema bintang dimuat dengan cara yang sangat terkontrol melalui
pemrosesan batch atau "trickle feeds" waktu-dekat, untuk mengimbangi kurangnya
perlindungan yang diberikan oleh normalisasi . Skema bintang juga tidak fleksibel dalam
hal kebutuhan analitis seperti model data yang dinormalisasi. Model yang dinormalisasi
memungkinkan segala jenis pertanyaan analitis untuk dieksekusi selama mereka mengikuti
logika bisnis yang didefinisikan dalam model. Skema bintang cenderung lebih dibangun
untuk tujuan tertentu dari data, sehingga tidak memungkinkan analisis yang lebih
kompleks. Skema bintang tidak mendukung hubungan banyak-ke-banyak antara entitas
bisnis - setidaknya tidak terlalu alami. Biasanya hubungan ini disederhanakan dalam skema
bintang agar sesuai dengan model dimensi sederhana.
Ukuran data lebih besar karena ada data yang disimpan ulang
Maintenance dan update lebih sulit
Skema kepingan salju adalah varian dari skema bintang. Di sini, tabel fakta terpusat
terhubung ke beberapa dimensi. Dalam skema kepingan salju, dimensi hadir dalam
dinormalisasi dari dalam beberapa tabel terkait. Struktur kepingan salju terwujud ketika
dimensi skema bintang dirinci dan sangat terstruktur, memiliki beberapa tingkat hubungan,
dan tabel anak memiliki beberapa tabel induk. Efek kepingan salju hanya memengaruhi
tabel dimensi dan tidak memengaruhi tabel fakta.
Tabel dimensi Karyawan sekarang berisi atribut: EmployeeID, EmployeeName,
DepartmentID, Region, Territory. Atribut DepartmentID terhubung dengan tabel
Karyawan dengan tabel dimensi Departemen. Dimensi Departemen digunakan untuk
memberikan detail tentang masing-masing departemen, seperti Nama dan Lokasi
departemen. Tabel dimensi Pelanggan sekarang berisi atribut: CustomerID,
CustomerName, Address, CityID. Atribut CityID menautkan tabel dimensi Pelanggan
dengan tabel dimensi Kota. Tabel dimensi Kota memiliki detail tentang setiap kota seperti
CityName, Kode Pos, Negara Bagian dan Negara.
Atribut yang jarang diisi, di mana sebagian besar catatan anggota dimensi memiliki
nilai NULL untuk atribut, dipindahkan ke sub-dimensi.
Atribut kardinalitas rendah yang dipertanyakan secara independen. Misalnya,
dimensi produk dapat berisi ribuan produk, tetapi hanya segelintir jenis produk.
Memindahkan atribut tipe produk ke tabel dimensinya sendiri dapat meningkatkan
kinerja ketika tipe produk ditanyai secara independen.
Atribut yang merupakan bagian dari hierarki dan dipertanyakan secara independen.
Contohnya termasuk atribut tahun, kuartal, dan bulan dari hierarki tanggal; dan
atribut negara dan negara dari hierarki geografis.
2.7 Manfaat skema kepingan salju:
Skema kepingan salju berada dalam keluarga yang sama dengan model logis skema
bintang. Bahkan, skema bintang dianggap sebagai kasus khusus dari skema kepingan salju.
Skema kepingan salju memberikan beberapa keunggulan dibandingkan skema bintang
dalam situasi tertentu, termasuk: Beberapa alat pemodelan basis data multidimensi OLAP
dioptimalkan untuk skema kepingan salju. Atribut normalisasi menghasilkan penghematan
penyimpanan, pengorbanan menjadi kompleksitas tambahan dalam kueri sumber bergabung.
• Hindari kepingan salju atau normalisasi tabel dimensi, kecuali diminta dan sesuai.
• Jangan hierarki kepingan salju dari tabel satu dimensi ke dalam tabel terpisah. Hierarki
seharusnya hanya milik tabel dimensi dan tidak boleh di-snowfalk.
• Beberapa hierarki dapat memiliki dimensi yang sama telah dirancang pada detail
serendah mungkin
Ralph Kimball, guru data warehousing, mengusulkan tiga kasus di mana implementasi
kepingan salju tidak hanya dapat diterima tetapi juga merupakan kunci untuk desain yang
sukses:
Dimensi pelanggan besar di mana, misalnya, 80 persen pengukuran tabel fakta
melibatkan anonim pengunjung tentang siapa Anda kumpulkan detail kecil, dan 20
persen melibatkan pelanggan terdaftar yang andal
siapa Anda mengumpulkan banyak data rinci dengan melacak banyak dimensi
Dimensi produk keuangan untuk bank, rumah pialang, dan perusahaan asuransi,
karena masing-masing
setiap produk memiliki sejumlah atribut khusus yang tidak dimiliki oleh produk lain
Dimensi kalender multi-bisnis karena setiap organisasi memiliki periode fiskal
istimewa,
musim, dan hari libur
• Penerapan skema snowflake dalam data warehouse suatu perusahaan dapat menghemat
ruang penyimpanan yang dibutuhkan.
Ini berisi tabel fakta yang dikelilingi Satu tabel fakta dikelilingi oleh tabel dimensi
oleh tabel dimensi. oleh tabel dimensi yang pada gilirannya dikelilingi
Desain DB Sederhana. Desain DB yang sangat kompleks.
Struktur dan kueri data yang Struktur Data Normalisasi.
dinormalisasi juga berjalan lebih
cepat.
Redundansi data tingkat tinggi Redundansi data tingkat sangat rendah
Tabel Dimensi Tunggal berisi data Pemecahan Data menjadi Tabel Dimensi
gabungan.. yang berbeda
Pemrosesan kubus lebih cepat. Pemrosesan kubus mungkin lambat
Karena sambungan yang rumit.
Menawarkan kueri berkinerja lebih Skema Serpihan Salju diwakili oleh tabel
tinggi menggunakan Star Join Query
Optimization. Tabel dapat
dihubungkan
dengan beberapa dimensi.
fakta terpusat yang tidak mungkin
terhubung dengan beberapa dimensi.
BAB III
PENUTUP
3.1. Kesimpulan
skema bintang adalah gaya paling sederhana dari skema data mart dan merupakan
pendekatan yang paling banyak digunakan untuk mengembangkan gudang data dan data
mart dimensi. Skema bintang terdiri dari satu atau lebih tabel fakta yang mereferensikan
sejumlah tabel dimensi . Skema bintang adalah kasus khusus penting dari skema kepingan
salju , dan lebih efektif untuk menangani pertanyaan yang lebih sederhana. Skema
Snowflake adalah perpanjangan dari Skema Bintang, dan itu menambah dimensi
tambahan. Disebut kepingan salju karena diagramnya menyerupai kepingan salju.
3.2. Saran
Penulis menyadari bahwa makalah diatas banyak sekali kesalahan dan jauh dari
kesempurnaan. Penulis akan memperbaiki makalah tersebut dengan berpedoman pada
banyak sumber yang dapat dipertanggungjawabkan. Maka dari itu penulis mengharapkan
kritik dan saran mengenai pembahasan makalah dalam kesimpulan di atas.
DAFTAR PUSTAKA
https://en.wikipedia.org/wiki/Star_schema
https://www.guru99.com/star-snowflake-data-warehousing.html
https://www.geeksforgeeks.org/star-schema-in-data-warehouse-modeling/
https://www.vertabelo.com/blog/data-warehouse-modeling-star-schema-vs-snowflake-schema/
https://en.wikipedia.org/wiki/Snowflake_schema
https://www.geeksforgeeks.org/snowflake-schema-in-data-warehouse-model/
https://searchdatamanagement.techtarget.com/definition/snowflaking