Makalah Data Integration

MAKALAH DATA INTEGRATION
OLEH :
Ni Komang SriAdiningsih (18101320)
Maria archagela Geraldine (18101250)
Ni Made Dian Larasati (18101272)
STIMIK-STIKOM INDONESIA
JL.TUKAD PAKERISAN NO 97,DENPASAR,BALI,INDONESIA
TAHUN AJARAN 2019/2020

Kata pengantar
Segala puji syukur kepada Tuhan YME yang telah memberikan kami kemudahan sehingga kami
dapat menyelesaikan makalah ini dengan tepat waktu. Tanpa pertolongan-Nya tentunya kami tidak
akan sanggup untuk menyelesaikan makalah ini dengan baik. Doa serta salam semoga terlimpah
curahkan kepada Tuhan YME.
Penulis mengucapkan syukur kepada Tuhan YME atas limpahan nikmat sehat-Nya, baik itu berupa
sehat fisik maupun akal pikiran, sehingga penulis mampu untuk menyelesaikan pembuatan
makalah sebagai tugas dari mata Jaringan dan Komunikasi.
Penulis tentu menyadari bahwa makalah ini masih jauh dari kata sempurna dan masih banyak
terdapat kesalahan serta kekurangan di dalamnya. Untuk itu, penulis mengharapkan kritik serta
saran dari pembaca untuk makalah ini, supaya makalah ini nantinya dapat menjadi makalah yang
lebih baik lagi. Kemudian apabila terdapat banyak kesalahan pada makalah ini penulis mohon
maaf yang sebesar-besarnya.
Demikian, semoga makalah ini dapat bermanfaat. Terima kasih.
Denpasar,14 Oktober 2019
Penulis
Daftar Isi
Kata pengantar…………………………………………………………………………………i
Daftar Isi………………………………………………………………………………………...ii
BAB I
PENDAHULUAN……………………………………………………………………………….1
1.1. Latar Belakang…………………………………………………………………………….1

1.2. Rumusan Masalah…………………………………………………………………………1
BAB II
PEMBAHASAN…………………………………………………………………………………2
2.1 Skema Bintang……………………………………………………………………………2
2.2 Manfaat …………………………………………………………………………………9

2.3 Kekurangan ……………………………………………………………………………..10
2.4 Skema Snowflaks………………………………………………………………………..10
2.5 Karakteristik Skema Snowflake…………………………………………………………..11
2.6 Kasus untuk kepingan salju meliputi……………………………………………………..11
2.7 Manfaat skema kepingan salju……………………………………………………………12
2.8 Karakteristik skema kepingan salju………………………………………………………12
2.9 Kekurangan Snowflaks…………………………………………………………………12
2.10 Kapan Anda menggunakan Implementasi Skema Snowflake dan star……………….12
BAB III
PENUTUP………………………………………………………………………………………15
3.1. Kesimpulan………………………………………………………………………………15
3.2. Saran……………………………………………………………………………………..15
DAFTAR PUSTAKA…………………………………………………………………………16
BAB I
PENDAHULUAN
1.1 Latar Belakang
Salah satu efek yang dihasilkan dari adanya suatu sistem informasi adalah munculnya
banyak data. Data yang ada ini berasal dari sistem operasional yang berfungsi untuk menangani
transaksi yang terkait dengan proses bisnis yang ditangani oleh sistem informasi tersebut. Anda
tinggal kalikan saja apabila ingin menghitung jumlah data yang disimpan selama seminggu waktu
operasional, sebulan, hingga setahun. Itu baru satu sistem informasi saja. Di korporasi yang besar
sistem informasi yang ada berjumlah banyak dengan berbagai fungsi dan tujuannya. Akhirnya
masalah berikutnya muncul.
Data warehouse adalah data-data yang beorientasi subjek, terintegrasi, memiliki dimensi
waktu, serta merupakan koleksi tetap (non-volatile), yang digunakan dalam mendukung proses
pengambilan keputusan. Sedangkan data mining muncul setelah banyak dari pemilik data baik
perorangan maupun organisasi mengalami penumpukan data yang telah terkumpul selama
beberapa tahun, misalnya data pembelian, data penjualan, data nasabah, data transaksi, email dan
sebagainya. Kemudian muncul pertanyaan dari pemilik data tersebut, apa yang harus dilakukan
terhadap tumpukan data tersebut.
1.2 Rumusan Masalah
1. Apa itu Skema Bintang?

2. Apa saja Manfaat Skema bintang?
3. Apa saja Kekurangan Skema bintang?
4. Apa itu Skema Snowflaks?
5. Apa saja Karakteristik Skema Snowflake?
6. Kasus untuk kepingan salju ?
7. Manfaat skema kepingan salju?
8. Karakteristik skema kepingan salju?
9. Kekurangan Snowflaks ?
10. Kapan menggunakan Implementasi Skema Snowflake dan skema star ?
BAB II
PEMBAHASAN
2.1 Skema Bintang
Dalam komputasi , skema bintang adalah gaya paling sederhana dari skema data mart dan
merupakan pendekatan yang paling banyak digunakan untuk mengembangkan gudang
data dan data mart dimensi. Skema bintang terdiri dari satu atau lebih tabel fakta yang
mereferensikan sejumlah tabel dimensi . Skema bintang adalah kasus khusus penting dari
skema kepingan salju , dan lebih efektif untuk menangani pertanyaan yang lebih
sederhana.
Skema bintang mendapatkan namanya dari kemiripan model fisik dengan bentuk bintang
dengan tabel fakta di pusatnya dan tabel dimensi yang mengelilinginya mewakili titik-titik
bintang.
Skema bintang memisahkan data proses bisnis menjadi fakta, yang menyimpan data
kuantitatif terukur tentang bisnis, dan dimensi yang merupakan atribut deskriptif yang
terkait dengan data fakta. Contoh data fakta termasuk harga jual, jumlah penjualan, dan
waktu, jarak, kecepatan dan pengukuran berat. Contoh atribut dimensi terkait mencakup
model produk, warna produk, ukuran produk, lokasi geografis, dan nama penjual.
Skema bintang yang memiliki banyak dimensi kadang-kadang disebut skema kelabang .
Memiliki dimensi hanya beberapa atribut, sementara lebih mudah dipelihara,
menghasilkan kueri dengan banyak tabel bergabung dan membuat skema bintang lebih
mudah digunakan.
Skema bintang merupakan struktur logical yang terdiri dari tabel fakta yang berisi data
faktual dikelilingi oleh tabel dimensi yang berisi referensi data. Skema bintang yang
paling sederhana biasanya terdiri dari satu tabel fakta dan beberapa tabel dimensi.Tiap
dimensi memiliki relasi one-to-many ke tabel fakta dan tabel dimensi hanya memiliki
satu primary key, primary key tersebut merupakan foreign key dari tabel fakta.
Dalam star schema, satu table yang di tengah disebut table fakta (fact table) dan table-table di
kelilingnya adalah tabel dimensi (Dimension table).
Apa beda table fakta dan dimensi?
 Tabel fakta (fact tabel)
Tabel fakta atau disebut juga tabel utama (major table) terdiri dari data fakta atau kuantitatif
tentang informasi bisnis yang akan di–query. Informasi ini biasanya berupa ukuran numerik dan
dapat terdiri dari banyak kolom dan jutaan baris.
 Tabel dimensi (dimension table)
Tabel dimensi atau disebut juga dengan tabel kecil (minor tabel) umumnya lebih kecil
dibandingkan tabel fakta dan menyimpan data deskriptif yang menggambarkan dimensi suatu
bisnis. SQL query menggunakan relasi yang telah didefinisikan sebelumnya dan didefinisikan user
antara tabel fakta dan tabel dimensi, dengan batasan pada data untuk mengembalikan informasi
yang dipilih.
Tabel Fakta dan Tabel Dimensi
Menurut Kimball (2008, p10), Tabel fakta merupakan fondasi dari data warehouse. Tabel fakta
mengandung ukuran fundamental dari perusahaan, dan ia merupakan target utama dari
kebanyakan query data warehouse.
Menurut Connolly dan Begg (2005, p1183), Tabel fakta merupakan sebuah tabel yang memiliki
sebuah composite primary key dimana tabel tersebut akan membentuk sebuah model
dimensional.
Menurut Connolly dan Begg (2005, p1183), Tabel dimensi merupakan sekumpulan dari tabel-
tabel yang lebih kecil yang memiliki sebuah primary key sederhana yang merespon secara benar
terhadap salah satu komponen dari composite key yang ada dari tabel fakta.
Kapan kita menggunakan star schema??
1. Ketika akan melakukan pemodelan data warehouse dan OLAP yang dibangun
berdasarkan multidimensional data
2. Digunakan untuk memudahkan akses berkecepatan tinggi terhadap data yang besar
3. Digunakan baik untuk data mart yang sederhana maupun data warehouse yang sangat
besar
Kapan harus menggunakan snowflake schema??
Snowflake schemamemberi kemudahan pada perawatan dimensi, dikarenakan strukturnya

yang lebih normal. Snowflakeschema merupakan model data dimensional yang memiliki sebuah
tabel fakta sebagai pusatnya, dikelilingi berbagai tabel dimensi yang ternormalisasi. Snowflake
schemadibuat berdasarkan OLTP sehingga semua data akan termuat detail dalam setiap tabel fakta
dan tabel dimensi. Tahap terakhir dari perancangan data warehouse, akan dibuat rancangan skema
data warehouse, yaitu kumpulan objek-objek basis data seperti tabel, view, indeks, dan objek
lainnya yang mendeskripsikan suatu data warehouse. Pada rancangan snowflake schema, terdapat
beberapa konsep, yaitu: adanya mekanisme normalisasi tabel dimensi, membutuhkan kapasitas
penyimpanan yang relatif lebih kecil, efektifitas browsing/selectdatadapat ditingkatkan karena
tidak harus melibatkan banyak querydari berbagai macam tabel.
Table dimensi berisi atribut yang menjelaskan table fakta. Sedangkan table fakta adalah table yang
berisi measure, yaitu suatu yang bisa dihitung atau diukur dalam suatu angka.
Contoh measure misalnya "jumlah penduduk", "luas wilayah", "jumlah penjualan", "jumlah
belanja", dll. Sedangkan contoh table dimensi adalah "dimensi wilayah", misalnya dalam contoh
measure "jumlah penduduk", maka dimensi wilayah bisa berisi atribut provinsi, kabupaten/kota,
kecamatan atau kelurahan. Sehingga kita bisa menampilkan jumlah penduduk per provinsi
misalnya.
Contoh lain dimensi misalnya dimensi waktu. Bila dimensi ini digunakan dalam measure "jumlah
penjualan", dimensi waktu dapat berupa tanggal, bulan, kwartal, semester atau tahun. Sehingga
kita bisa menampilkan data penjualan ini dalam rentang (dimensi) waktu yang kita inginkan,
misalnya harian atau bulanan.
Dengan adanya measure dan dimensi, penyusunan suatu laporan business intelligence sangat
mudah dilakukan, karena kita hanya perlu meletakkan dimensi ke dalam baris atau kolom yang
kita inginkan.
Table dimensi sering kali berbentuk hirarki, misalnya dimensi geografi akan memiliki hirarki
dari Negara -> Provinsi -> Kabuptan -> Kecamatan -> Kelurahan dst. Dan saat ini table dimensi
biasanya dilengkapi dengan kordinat posisi (latitude dan longitude) maupun poligon batas
wilayah. Data peta ini digunakan untuk menampilkan data tsb dalam overlay peta seperti contoh
di bawah
Sebagai contoh kasus, kita akan mencoba membuat suatu star schema dari data bencana
Kalau lihat data di atas, maka hanya ada satu measure yaitu "jumlah korban". Ada berapa
dimensi? Paling tidak ada 4 dimensi, yaitu:
1. Dimensi waktu (waktu kejadian (tgl/bln/tahun)

2. Dimensi geografi (provinsi, kabupaten)
3. Dimensi bencana (banjir, puting beliung, dll)
4. Dimensi jenis korban (meninggal, hilang, dll)
Dimensi waktu adalah dimensi yang hampir selalu ada dalam setiap Business Intelligence,
sehingga semua solusi BI biasanya memiliki pre-defined tabel dimensi ini. Di Tableau misalnya,
begitu suatu kolom type nya adalah tanggal, maka otomatis dikenali sebagai dimensi waktu
lengkap dengan atribut lainnya seperti bulan, kwartal, semester, tahun, dll. Dengan dimensi
waktu yang predefined ini kita hampir tidak perlu membuat table dimensi sendiri, namun untuk
kasus ini kita akan membuat table dimensi waktu sendiri.
Dengan dimensi dan measure di atas, maka star schema nya menjadi sbb
Selanjutnya, setelah kita mendapatkan Star Schema yang sesuai adalah memasukkan data yang
ada ke masing-masing table ini.
Untuk table dimensi korban hanya ada 4 baris, yaitu:
1 Meninggal
2 Hilang
3 Terluka
4 Mengungsi
Untuk table dimensi bencana berisi
1 Banjir
2 Angin Puting Beliung
3 Tanah Longsor
4 Kebakaran Hutan
5 Gempa Bumi
Untuk dimensi geografi

id kode_negara negara kode_prov Provinsi kd_kabupaten kabupaten
1 ID Indonesia 11 Aceh 1112 Aceh Singkil
2 ID Indonesia 11 Aceh
3 ID Indonesia 11 Aceh
4 ID Indonesia 12 Sumatera Barat
7 ID Indonesia 13 Sumatera Utara
Kita bisa saja membuat listnya secara manual seperti di atas, atau kita bisa gunakan ETL untuk
memasukkan data ini secara program. Kita akan bahas ETL di tulisan berikut.
Untuk table facta disusun dari kolom-kolom dimensi dan measure tablenya menjadi sbb.
id geo_id tanggal jenis_bencana jenis_korban jumlah_korban

1 1 12-01-2016 1 1 2
2 1 12-01-2016 1 2 1
3 1 12-01-2016 1 3 2
4 1 12-01-2016 1 4 300
Perhatikan bahwa kolom-kolum jenis korban di transpose (pivot)
 Skema Bintang
SELECT
dim_store.store_address,
SUM(fact_sales.quantity) ASquantity_sold
FROM
fact_sales
INNERJOINdim_product ONfact_sales.product_id = dim_product.product_id

INNERJOINdim_time ONfact_sales.time_id = dim_time.time_id
INNERJOINdim_store ONfact_sales.store_id = dim_store.store_id
WHERE
dim_time.action_year = 2016
ANDdim_store.city = ‘Berlin’
ANDdim_product.product_type = ‘phone’
GROUPBY
dim_store.store_id,
dim_store.store_address
2.2 Manfaat
Skema bintang didenormalisasi , artinya aturan normalisasi normal yang diterapkan pada
basis data relasional transaksional dilonggarkan selama perancangan dan implementasi
skema bintang. Manfaat denormalisasi skema bintang adalah:
 Kueri yang lebih sederhana - logika bergabung skema bintang umumnya lebih
sederhana daripada logika gabungan yang diperlukan untuk mengambil data dari skema
transaksional yang sangat normal.
 Logika pelaporan bisnis yang disederhanakan - bila dibandingkan dengan skema yang
sangat dinormalisasi, skema bintang menyederhanakan logika pelaporan bisnis yang
umum, seperti periode-periode dan periode pelaporan.
 Keuntungan kinerja kueri - skema bintang dapat memberikan peningkatan kinerja
untuk aplikasi pelaporan hanya-baca bila dibandingkan dengan skema yang sangat
normal .
 Agregasi cepat - kueri yang lebih sederhana terhadap skema bintang dapat
menghasilkan peningkatan kinerja untuk operasi agregasi.
 Skema makan kubus - bintang digunakan oleh semua sistem OLAP untuk membangun
kubus OLAP eksklusif secara efisien; pada kenyataannya, sebagian besar sistem OLAP
utama menyediakan mode operasi ROLAP yang dapat menggunakan skema bintang
secara langsung sebagai sumber tanpa membangun struktur kubus berpemilik.
2.3 Kekurangan
Kerugian utama dari skema bintang adalah bahwa integritas data tidak ditegakkan dengan
baik karena berada dalam keadaan sangat dinormalisasi. Sisipan dan pembaruan satu kali
dapat mengakibatkan anomali data yang dirancang untuk dihindari oleh skema normal .
Secara umum, skema bintang dimuat dengan cara yang sangat terkontrol melalui
pemrosesan batch atau "trickle feeds" waktu-dekat, untuk mengimbangi kurangnya
perlindungan yang diberikan oleh normalisasi . Skema bintang juga tidak fleksibel dalam
hal kebutuhan analitis seperti model data yang dinormalisasi. Model yang dinormalisasi
memungkinkan segala jenis pertanyaan analitis untuk dieksekusi selama mereka mengikuti
logika bisnis yang didefinisikan dalam model. Skema bintang cenderung lebih dibangun
untuk tujuan tertentu dari data, sehingga tidak memungkinkan analisis yang lebih
kompleks. Skema bintang tidak mendukung hubungan banyak-ke-banyak antara entitas
bisnis - setidaknya tidak terlalu alami. Biasanya hubungan ini disederhanakan dalam skema
bintang agar sesuai dengan model dimensi sederhana.
Kekurangan model skema bintang:
 Ukuran data lebih besar karena ada data yang disimpan ulang
 Maintenance dan update lebih sulit
2.4 Skema Snowflaks

Dalam komputasi, skema kepingan salju adalah pengaturan logis dari tabel dalam basis
data multidimensi sehingga diagram hubungan entitas menyerupai bentuk kepingan salju.
Skema kepingan salju diwakili oleh tabel fakta terpusat yang terhubung ke beberapa
dimensi. "Snowflaking" adalah metode normalisasi tabel dimensi dalam skema bintang.
Ketika sepenuhnya dinormalisasi di sepanjang semua tabel dimensi, struktur yang
dihasilkan menyerupai kepingan salju dengan tabel fakta di tengah. Prinsip di balik
kepingan salju adalah normalisasi tabel dimensi dengan menghilangkan atribut
kardinalitas rendah dan membentuk tabel terpisah.
 Skema kepingan salju mirip dengan skema bintang. Namun, dalam skema kepingan
salju, dimensi dinormalisasi menjadi beberapa tabel terkait, sedangkan dimensi skema
bintang dinasionalisasi dengan masing-masing dimensi yang diwakili oleh tabel
tunggal. Bentuk kepingan salju yang kompleks muncul ketika dimensi skema
kepingan salju rumit, memiliki beberapa tingkat hubungan, dan tabel anak memiliki
beberapa tabel induk ("garpu di roa
Skema kepingan salju adalah varian dari skema bintang. Di sini, tabel fakta terpusat
terhubung ke beberapa dimensi. Dalam skema kepingan salju, dimensi hadir dalam
dinormalisasi dari dalam beberapa tabel terkait. Struktur kepingan salju terwujud ketika
dimensi skema bintang dirinci dan sangat terstruktur, memiliki beberapa tingkat hubungan,
dan tabel anak memiliki beberapa tabel induk. Efek kepingan salju hanya memengaruhi
tabel dimensi dan tidak memengaruhi tabel fakta.
Tabel dimensi Karyawan sekarang berisi atribut: EmployeeID, EmployeeName,
DepartmentID, Region, Territory. Atribut DepartmentID terhubung dengan tabel
Karyawan dengan tabel dimensi Departemen. Dimensi Departemen digunakan untuk
memberikan detail tentang masing-masing departemen, seperti Nama dan Lokasi
departemen. Tabel dimensi Pelanggan sekarang berisi atribut: CustomerID,
CustomerName, Address, CityID. Atribut CityID menautkan tabel dimensi Pelanggan
dengan tabel dimensi Kota. Tabel dimensi Kota memiliki detail tentang setiap kota seperti
CityName, Kode Pos, Negara Bagian dan Negara.
2.5 Karakteristik Skema Snowflake:

• Manfaat utama skema kepingan salju ini menggunakan ruang disk yang lebih kecil.
• Lebih mudah untuk mengimplementasikan dimensi ditambahkan ke Skema
• Karena beberapa tabel, kinerja kueri berkurang
• Tantangan utama yang akan Anda hadapi saat menggunakan Skema kepingan salju
adalah bahwa Anda perlu melakukan lebih banyak upaya pemeliharaan karena tabel
pencarian yang lebih banyak.
2.6 Kasus untuk kepingan salju meliputi:
 Atribut yang jarang diisi, di mana sebagian besar catatan anggota dimensi memiliki
nilai NULL untuk atribut, dipindahkan ke sub-dimensi.
 Atribut kardinalitas rendah yang dipertanyakan secara independen. Misalnya,
dimensi produk dapat berisi ribuan produk, tetapi hanya segelintir jenis produk.
Memindahkan atribut tipe produk ke tabel dimensinya sendiri dapat meningkatkan
kinerja ketika tipe produk ditanyai secara independen.
 Atribut yang merupakan bagian dari hierarki dan dipertanyakan secara independen.
Contohnya termasuk atribut tahun, kuartal, dan bulan dari hierarki tanggal; dan
atribut negara dan negara dari hierarki geografis.
2.7 Manfaat skema kepingan salju:
1. Manfaat utama adalah kemajuan dalam kinerja kueri, karena memerlukan

penyimpanan disk minimal dan bergabung dengan tabel pencarian dengan
ukuran lebih kecil
2. Menawarkan fleksibilitas yang lebih baik untuk hubungan timbal balik antara
komponen dan tingkat dimensi
3. Mudah dirawat, karena tidak ada redundansi
Meningkatkan kinerja keseluruhan karena tabel yang lebih kecil digabungkan
2.8 Karakteristik skema kepingan salju:

1. Skema kepingan salju menggunakan ruang disk kecil.
2. Dimensi implementasi yang mudah ditambahkan ke skema.
3. Ada beberapa tabel, jadi kinerjanya berkurang.
4. Tabel dimensi terdiri dari dua atau lebih set atribut yang mendefinisikan informasi
pada butir yang berbeda.
5. Set atribut dari tabel dimensi yang sama sedang diisi oleh sistem sumber yang
berbeda.
Skema kepingan salju berada dalam keluarga yang sama dengan model logis skema
bintang. Bahkan, skema bintang dianggap sebagai kasus khusus dari skema kepingan salju.
Skema kepingan salju memberikan beberapa keunggulan dibandingkan skema bintang
dalam situasi tertentu, termasuk: Beberapa alat pemodelan basis data multidimensi OLAP
dioptimalkan untuk skema kepingan salju. Atribut normalisasi menghasilkan penghematan
penyimpanan, pengorbanan menjadi kompleksitas tambahan dalam kueri sumber bergabung.
2.9 Kekurangan Snowflaks:

• Snowflaking mengurangi ruang yang dikonsumsi oleh tabel dimensi, tetapi
dibandingkan dengan seluruh data warehouse, penghematan biasanya tidak signifikan.
• Hindari kepingan salju atau normalisasi tabel dimensi, kecuali diminta dan sesuai.
• Jangan hierarki kepingan salju dari tabel satu dimensi ke dalam tabel terpisah. Hierarki
seharusnya hanya milik tabel dimensi dan tidak boleh di-snowfalk.
• Beberapa hierarki dapat memiliki dimensi yang sama telah dirancang pada detail
serendah mungkin
2.10 Kapan Anda menggunakan Implementasi Skema Snowflake dan star?
Ralph Kimball, guru data warehousing, mengusulkan tiga kasus di mana implementasi
kepingan salju tidak hanya dapat diterima tetapi juga merupakan kunci untuk desain yang
sukses:
 Dimensi pelanggan besar di mana, misalnya, 80 persen pengukuran tabel fakta
melibatkan anonim pengunjung tentang siapa Anda kumpulkan detail kecil, dan 20
persen melibatkan pelanggan terdaftar yang andal
siapa Anda mengumpulkan banyak data rinci dengan melacak banyak dimensi
 Dimensi produk keuangan untuk bank, rumah pialang, dan perusahaan asuransi,
karena masing-masing
setiap produk memiliki sejumlah atribut khusus yang tidak dimiliki oleh produk lain
 Dimensi kalender multi-bisnis karena setiap organisasi memiliki periode fiskal
istimewa,
musim, dan hari libur
kondisi yang tepat di dalam menerapkan skema bintang

Penerapan skema bintang adalah pada data mart suatu perusahaan. Data mart adalah bagian
dari data warehouse. Data mart biasanya dibuat pada tiap departemen pada perusahaan
tersebut. Tujuan dari pembuatan data mart adalah supaya karyawan atau staff yang terkait
pada suatu departemen tertentu dapat mengakses data yang diperlukan dengan cepat tanpa
harus melakukan query pada database utama sehingga dapat mengurangi beban server utama.
kondisi yang tepat dalam menerapkan skema snowflaks:
• Penerapan skema snowflake dalam data warehouse suatu perusahaan dapat menghemat
ruang penyimpanan yang dibutuhkan.
Skema Star Vs Snowflake: Perbedaan Utama
Skema Bintang Skema Serpihan Salju
 Hierarki untuk dimensi disimpan Hierarki dibagi ke dalam tabel terpisah.

dalam tabel dimensi.
 Ini berisi tabel fakta yang dikelilingi Satu tabel fakta dikelilingi oleh tabel dimensi
oleh tabel dimensi. oleh tabel dimensi yang pada gilirannya dikelilingi
 Desain DB Sederhana. Desain DB yang sangat kompleks.
 Struktur dan kueri data yang Struktur Data Normalisasi.
dinormalisasi juga berjalan lebih
cepat.
 Redundansi data tingkat tinggi Redundansi data tingkat sangat rendah
 Tabel Dimensi Tunggal berisi data Pemecahan Data menjadi Tabel Dimensi
gabungan.. yang berbeda
 Pemrosesan kubus lebih cepat. Pemrosesan kubus mungkin lambat
Karena sambungan yang rumit.
 Menawarkan kueri berkinerja lebih Skema Serpihan Salju diwakili oleh tabel
tinggi menggunakan Star Join Query
Optimization. Tabel dapat
dihubungkan
dengan beberapa dimensi.
fakta terpusat yang tidak mungkin
terhubung dengan beberapa dimensi.
BAB III
PENUTUP
3.1. Kesimpulan
skema bintang adalah gaya paling sederhana dari skema data mart dan merupakan
pendekatan yang paling banyak digunakan untuk mengembangkan gudang data dan data
mart dimensi. Skema bintang terdiri dari satu atau lebih tabel fakta yang mereferensikan
sejumlah tabel dimensi . Skema bintang adalah kasus khusus penting dari skema kepingan
salju , dan lebih efektif untuk menangani pertanyaan yang lebih sederhana. Skema
Snowflake adalah perpanjangan dari Skema Bintang, dan itu menambah dimensi
tambahan. Disebut kepingan salju karena diagramnya menyerupai kepingan salju.
3.2. Saran
Penulis menyadari bahwa makalah diatas banyak sekali kesalahan dan jauh dari
kesempurnaan. Penulis akan memperbaiki makalah tersebut dengan berpedoman pada
banyak sumber yang dapat dipertanggungjawabkan. Maka dari itu penulis mengharapkan
kritik dan saran mengenai pembahasan makalah dalam kesimpulan di atas.
DAFTAR PUSTAKA
https://en.wikipedia.org/wiki/Star_schema
https://www.guru99.com/star-snowflake-data-warehousing.html
https://www.geeksforgeeks.org/star-schema-in-data-warehouse-modeling/
https://www.vertabelo.com/blog/data-warehouse-modeling-star-schema-vs-snowflake-schema/
https://en.wikipedia.org/wiki/Snowflake_schema
https://www.geeksforgeeks.org/snowflake-schema-in-data-warehouse-model/
https://searchdatamanagement.techtarget.com/definition/snowflaking

Makalah Data Integration

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Makalah Data Integration

Diunggah oleh

Hak Cipta:

Format Tersedia

MAKALAH DATA INTEGRATION

Ni Komang SriAdiningsih (18101320)

Maria archagela Geraldine (18101250)

Ni Made Dian Larasati (18101272)

JL.TUKAD PAKERISAN NO 97,DENPASAR,BALI,INDONESIA

TAHUN AJARAN 2019/2020

Demikian, semoga makalah ini dapat bermanfaat. Terima kasih.

Denpasar,14 Oktober 2019

1.1. Latar Belakang…………………………………………………………………………….1

2.1 Skema Bintang……………………………………………………………………………2

2.2 Manfaat …………………………………………………………………………………9

1.1 Latar Belakang

1.2 Rumusan Masalah

1. Apa itu Skema Bintang?

2.1 Skema Bintang

Apa beda table fakta dan dimensi?

 Tabel fakta (fact tabel)

 Tabel dimensi (dimension table)

Tabel Fakta dan Tabel Dimensi

Kapan harus menggunakan snowflake schema??

Snowflake schemamemberi kemudahan pada perawatan dimensi, dikarenakan strukturnya

1. Dimensi waktu (waktu kejadian (tgl/bln/tahun)

Untuk table dimensi korban hanya ada 4 baris, yaitu:

Untuk table dimensi bencana berisi

Untuk dimensi geografi

id geo_id tanggal jenis_bencana jenis_korban jumlah_korban

Perhatikan bahwa kolom-kolum jenis korban di transpose (pivot)

INNERJOINdim_product ONfact_sales.product_id = dim_product.product_id

INNERJOINdim_store ONfact_sales.store_id = dim_store.store_id

Kekurangan model skema bintang:

2.4 Skema Snowflaks

2.5 Karakteristik Skema Snowflake:

2.6 Kasus untuk kepingan salju meliputi:

1. Manfaat utama adalah kemajuan dalam kinerja kueri, karena memerlukan

2.8 Karakteristik skema kepingan salju:

2.9 Kekurangan Snowflaks:

2.10 Kapan Anda menggunakan Implementasi Skema Snowflake dan star?

kondisi yang tepat di dalam menerapkan skema bintang

kondisi yang tepat dalam menerapkan skema snowflaks:

Skema Star Vs Snowflake: Perbedaan Utama

Skema Bintang Skema Serpihan Salju

 Hierarki untuk dimensi disimpan Hierarki dibagi ke dalam tabel terpisah.

Anda mungkin juga menyukai