NPM : 4337857201210019
Kelas : Malam
Sistem informasi
Database adalah kumpulan data yang terstruktur dan terorganisir secara sistematis agar mudah
diakses, dikelola, dan diperbarui. Database biasanya menggunakan perangkat lunak khusus yang
disebut Sistem Manajemen Basis Data (DBMS) untuk mengelola data. DBMS memungkinkan
pengguna untuk menyimpan, mengambil, memperbarui, dan menghapus data dari database.
Database sering digunakan dalam berbagai aplikasi, seperti sistem manajemen pelanggan, sistem
manajemen inventaris, situs web, dan banyak lagi.
Metadata adalah informasi yang mendeskripsikan atau menjelaskan data. Metadata memberikan
konteks dan pemahaman tentang data yang ada dalam database atau dalam suatu konteks tertentu.
Metadata dapat berisi informasi seperti nama kolom dalam tabel, tipe data, panjang maksimum
kolom, kapan data tersebut dibuat atau diubah terakhir kali, dan deskripsi singkat tentang data
tersebut. Metadata sangat penting dalam manajemen basis data karena membantu pemahaman,
pencarian, dan penggunaan data yang lebih efisien.
1. Pemodelan Bintang atau Salju: Pada OLAP, fokus utamanya adalah pada analisis
data dan pembuatan laporan. Model bintang atau salju digunakan untuk
mengorganisir data dalam cara yang memungkinkan untuk pengolahan dan analisis
yang efisien. Model ini terdiri dari fakta (tabel yang berisi data terukur) yang
terhubung ke tabel dimensi (yang berisi atribut atau metadata).
2. Denormalisasi: Dalam pemodelan OLAP, denormalisasi sering digunakan untuk
menggabungkan data dari beberapa tabel dimensi ke dalam tabel fakta. Hal ini
dilakukan untuk meningkatkan kinerja analisis data dengan mengurangi jumlah join
yang diperlukan.
3. Pengindeksan yang Dikhususkan: Dalam OLAP, pengindeksan yang dikhususkan
sering digunakan untuk mempercepat akses ke data dalam basis data besar. Ini
melibatkan penggunaan indeks kolom tertentu yang sering digunakan dalam analisis.
4. Menggunakan Agregasi: Agregasi digunakan untuk menghitung ringkasan data,
seperti total, rata-rata, atau nilai maksimum, yang sering digunakan dalam analisis
OLAP. Data agregat dapat disimpan dalam tabel terpisah untuk mempercepat
pengambilan data.
3. OLAP dapat digunakan untuk melakukan 3 hal antara lain : Konsolidasi, Drilldown, Slicing & Dicing,
jelaskan !
1. Konsolidasi (Roll-up):
o Deskripsi: Konsolidasi dalam OLAP merujuk pada proses menggabungkan
data yang lebih rendah ke dalam level yang lebih tinggi dalam hierarki data.
Ini berguna untuk melihat ringkasan data yang lebih tinggi tingkatnya.
Contohnya, jika kita memiliki data penjualan yang dipecah berdasarkan
wilayah, konsolidasi akan memungkinkan kita untuk melihat total penjualan
untuk seluruh negara atau kawasan.
o Contoh: Dalam tabel OLAP, kita mungkin memiliki data penjualan
berdasarkan kota, dan dengan melakukan operasi konsolidasi, kita dapat
melihat total penjualan untuk setiap negara.
2. Drilldown (Drill-Down):
o Deskripsi: Drilldown adalah kebalikan dari konsolidasi. Ini memungkinkan
pengguna untuk menggali lebih dalam ke dalam data dengan melihat detail
pada tingkat yang lebih rendah dalam hierarki data. Pengguna dapat
menjelajahi data untuk mendapatkan pemahaman yang lebih mendalam
tentang aspek tertentu.
o Contoh: Dalam kasus data penjualan, jika kita mulai dengan total penjualan
negara, kita dapat melakukan drilldown untuk melihat penjualan berdasarkan
wilayah atau bahkan kota-kota dalam wilayah tersebut.
3. Slicing & Dicing:
o Deskripsi: Slicing & dicing adalah teknik yang memungkinkan pengguna
untuk memotong (slice) dan memotong (dice) data untuk menghasilkan
tampilan data yang lebih spesifik atau dimensi yang berbeda. Pengguna dapat
memilih subset data dengan menghilangkan dimensi tertentu atau merinci data
dengan memilih dimensi tambahan.
o Contoh: Misalnya, dalam data penjualan, seorang pengguna dapat "slice" data
untuk hanya menampilkan penjualan dari tahun tertentu atau "dice" data untuk
melihat penjualan berdasarkan produk tertentu dalam rentang waktu tertentu.
Ini memungkinkan analisis yang lebih mendalam dan pemahaman yang lebih
kaya tentang data.
Star Schema adalah salah satu model pemodelan data multidimensi yang paling sederhana
dan populer. Dalam Star Schema, data terorganisir dalam dua jenis tabel utama: tabel fakta
(fact table) dan tabel dimensi (dimension tables).
• Tabel Fakta (Fact Table): Tabel fakta berisi data terukur yang berhubungan dengan
kejadian bisnis atau transaksi tertentu, seperti penjualan, pendapatan, atau inventaris.
Tabel fakta biasanya berisi kunci-kunci asing yang menghubungkannya ke tabel
dimensi.
• Tabel Dimensi (Dimension Tables): Tabel dimensi berisi atribut atau metadata yang
menggambarkan dimensi yang relevan dalam data. Contoh tabel dimensi dapat
mencakup tabel pelanggan, tabel produk, atau tabel waktu. Tabel dimensi berisi kunci
primer yang digunakan untuk menghubungkannya ke tabel fakta.
Keuntungan dari Star Schema adalah kesederhanaannya. Ini membuat query OLAP menjadi
cepat dan efisien karena hanya memerlukan beberapa join untuk mengakses data. Namun,
karena tabel dimensi seringkali tidak terdenormalisasi, ini bisa menghasilkan beberapa
redudansi dalam penyimpanan data.
2. Snowflake Schema:
Snowflake Schema adalah perluasan dari Star Schema yang lebih kompleks. Dalam
Snowflake Schema, tabel dimensi dibagi lagi menjadi sub-dimensi yang lebih kecil atau
terdenormalisasi lebih lanjut. Ini menghasilkan struktur yang menyerupai salju yang
menyebar dan terpecah menjadi banyak bagian (snowflake).
Keuntungan Snowflake Schema adalah mengurangi redudansi data karena tabel dimensi lebih
terdenormalisasi. Namun, kelemahan utamanya adalah kompleksitas query yang lebih tinggi
karena memerlukan lebih banyak join untuk mengakses data, yang dapat mengurangi kinerja.
Selain itu, desain Snowflake Schema cenderung lebih rumit, sehingga memerlukan lebih
banyak usaha dalam perencanaan dan pemeliharaan.
Pilihan antara Star Schema dan Snowflake Schema tergantung pada kebutuhan bisnis dan
desain yang diinginkan. Star Schema lebih sederhana dan cocok untuk kasus-kasus di mana
kinerja query sangat penting. Snowflake Schema cocok untuk mengurangi redudansi data,
tetapi dapat mengorbankan kinerja dalam beberapa situasi. Pemilihan schema harus
mempertimbangkan kompromi antara kinerja dan kompleksitas desain.
Sebuah "Cube" atau "Data Cube" adalah struktur data tiga dimensi yang digunakan dalam
OLAP (Online Analytical Processing) untuk mewakili data dengan cara yang memungkinkan
analisis multidimensional. Cube ini memiliki tiga dimensi utama: baris, kolom, dan tinggi,
yang mewakili berbagai dimensi atau atribut data yang ingin dianalisis. Contoh pemodelan
data multidimensi dalam bentuk kubus adalah sebagai berikut:
• Dimensi Baris: Ini mungkin berisi waktu (bulan, tahun), pelanggan, atau wilayah
geografis.
• Dimensi Kolom: Ini mungkin berisi produk, kategori produk, atau departemen dalam
bisnis.
• Dimensi Tinggi: Ini mungkin berisi ukuran-ukuran seperti penjualan, pendapatan,
atau stok.
Contoh analisis yang dapat dilakukan dengan menggunakan kubus adalah melihat total
penjualan produk tertentu selama berbagai periode waktu atau melihat penjualan berdasarkan
pelanggan di berbagai wilayah. Pengguna dapat memutar, melipat, atau memotong kubus ini
untuk menggali lebih dalam dan mendapatkan wawasan yang lebih mendalam tentang data.
Spreadsheet atau lembar kerja adalah bentuk pemodelan data multidimensi yang sering
digunakan dalam aplikasi seperti Microsoft Excel atau Google Sheets. Dalam spreadsheet,
data disusun dalam baris dan kolom yang memungkinkan untuk menganalisis data dengan
berbagai cara. Spreadsheet memungkinkan pengguna untuk membuat grafik, tabel pivot, dan
rumus yang kompleks untuk melakukan analisis data.
• Baris: Baris dapat mewakili berbagai entitas seperti waktu (bulan, tahun), produk,
atau pelanggan.
• Kolom: Kolom dapat mewakili ukuran-ukuran seperti penjualan, pendapatan, atau
biaya.
• Rumus: Rumus dapat digunakan untuk melakukan perhitungan seperti pengukuran
rasio, perbandingan, atau perhitungan lainnya.