Anda di halaman 1dari 5

The Need for Data Analysis / Kebutuhan Analisis Data

Tekanan Konstan dari eksternal dan internal membutuhkan keputusan taktis dan strategis
yang cepat

Waktu siklus pengambilan keputusan berkurang, sementara permasalahan yang semakin


kompleks dengan semakin berkembangnya sejumlah variabel internal dan eksternal.

Manajer membutuhkan sistem pendukung untuk memfasilitasi dengan cepat pengambilan


keputusan dalam lingkungan yang kompleks.

Decision Support Systems / Sistem Pendukung Keputusan

adalah metodologi yang dirancang untuk mengekstrak informasi dari data dan menggunakan
informasi tersebut sebagai dasar untuk pengambilan keputusan.

Sebuah sistem pendukung keputusan (DSS) adalah pengaturan alat komputerisasi yang
digunakan untuk membantu manajerial pengambilan keputusan dalam sebuah bisnis.

• Sebuah DSS biasanya membutuhkan data ekstensif "massaging" untuk menghasilkan


informasi.
• DSS digunakan di semua tingkatan dalam suatu organisasi dan sering kali disesuaikan
untuk fokus pada bisnis tertentu atau masalah.
• DSS bersifat interaktif dan menyediakan kueri ad hoc / alat untuk mengambil data
dan untuk menampilkan data dalam format yang berbeda.

Empat Komponen DSS :

• Komponen penyimpanan data (data store) pada dasarnya adalah database DSS.
• Komponen ekstraksi dan penyaringan data (data extraction and filtering) digunakan
untuk mengekstrak dan memvalidasi data yang diambil dari database operasional
dan sumber data eksternal.
• Alat kueri pengguna akhir (The end user query tool) digunakan oleh analis data
untuk membuat kueri yang mengakses database.
• Alat presentasi pengguna akhir (The end user presentation tool) digunakan oleh
analis data untuk mengatur dan menyajikan data.

Data Operasional (Operational Data) vs. Data Pendukung Keputusan (Decision Support
Data)

• Sebagian besar data operasional disimpan dalam database relasional di mana


strukturnya cenderung sangat dinormalisasi.
• Penyimpanan data operasional dioptimalkan untuk mendukung transaksi yang
mewakili operasi sehari-hari.
• Data DSS memberikan arti bisnis taktis dan strategis untuk data operasional.
Tiga Area Utama Di Mana Data DSS Berbeda dari Data Operasional

• Rentang waktu (Time span)


o Data operasional mewakili transaksi (atomik) saat ini.
o Data DSS cenderung mencakup kerangka waktu yang lebih lama.
• Granularitas (Granularity)
o Data operasional mewakili transaksi tertentu yang terjadi pada waktu
tertentu.
o Data DSS harus disajikan pada berbagai tingkat pengumpulan.
• Kematraan / Dimensionality
o Fokus data operasional untuk merepresentasikan atom transaksi.
o Data DSS dapat dianalisis dari berbagai dimensi.

Persyaratan (Requirements) Basis Data DSS

• Skema Database
o Skema database DSS harus mendukung kompleks (non-dinormalisasi)
representasi data.
o Kueri harus dapat mengekstrak multidimensi irisan waktu.

Ekstraksi dan Pemuatan Data (Data Extraction and Loading)

• DBMS harus mendukung alat ekstraksi dan penyaringan data tingkat lanjut.
• Kemampuan ekstraksi data harus mendukung sumber data yang berbeda dan
beberapa vendor.
• Kemampuan pemfilteran data harus mencakup kemampuan untuk memeriksa data
yang tidak konsisten atau aturan validasi data.
• DBMS harus mendukung data lanjutan integrasi, agregasi, dan kemampuan
klasifikasi.

Antarmuka Analitik Pengguna Akhir (End-User Analytical Interface)

• DSS DBMS harus mendukung pemodelan data tingkat lanjut dan alat presentasi
data, alat analisis data, dan komponen pembuatan kueri dan pengoptimalan.
• Antarmuka analitik pengguna akhir adalah salah satu komponen yang paling penting

Persyaratan Ukuran Basis Data (Database Size Requirements)

• Database DSS cenderung sangat besar.


• DBMS mungkin diperlukan untuk menggunakan perangkat keras canggih, seperti
beberapa array disk dan teknologi multi-prosesor.

The Data Warehouse (Gudang Data)

Data Warehouse adalah database yang terintegrasi, berorientasi subjek, varian waktu, dan
tidak mudah berubah yang memberikan dukungan untuk pengambilan keputusan.

• Integrated (Terintegrasi)
Data Warehouse adalah database terpusat dan terkonsolidasi yang
mengintegrasikan data yang diambil dari keseluruhan organisasi.
• Subject-Oriented (Berorientasi Subjek)
Data Data Warehouse disusun dan dioptimalkan untuk memberikan jawaban atas
pertanyaan yang datang dari beragam area fungsional dalam perusahaan.
• Time Variant (Variasi Waktu)
Data Warehouse mewakili aliran data melalui waktu. Bahkan dapat berisi data yang
diproyeksikan.

Data Warehouse adalah database yang terintegrasi, berorientasi subjek, varian waktu, dan
tidak mudah berubah yang memberikan dukungan untuk pengambilan keputusan.

• Non-Volatile (Non-Volatile)
Setelah data masuk ke Data Warehouse, mereka tidak pernah dihapus. Data
Warehouse selalu berkembang.

Data Mart

• Data mart adalah gudang data subjek tunggal yang kecil subset yang memberikan
dukungan keputusan kepada sekelompok kecil orang.
• Data Mart mengatasi masalah lokal atau departemen, sementara Gudang Data
melibatkan upaya di seluruh perusahaan untuk: mendukung pengambilan keputusan
di semua tingkatan dalam organisasi.
• Data Mart dapat berfungsi sebagai kendaraan uji bagi perusahaan yang
mengeksplorasi potensi manfaat Data Warehouse.

Dua Belas Aturan Yang Mendefinisikan Gudang Data (Data Warehouse)

1. Gudang Data dan lingkungan operasional adalah terpisah.


2. Data Data Warehouse terintegrasi
3. Data Warehouse berisi data historis dalam jangka waktu yang lama cakrawala
waktu.
4. Data Warehouse adalah data snapshot yang diambil pada titik waktu yang diberikan.
5. Data Data Warehouse berorientasi pada subjek.
6. Data Data Warehouse sebagian besar hanya-baca dengan pembaruan batch berkala
dari data operasional. Tidak ada pembaruan online yang diizinkan.
7. Siklus hidup pengembangan Data Warehouse berbeda dari pengembangan sistem
klasik. Pengembangan Data Warehouse didorong oleh data; pendekatan klasik
adalah didorong proses.
8. Data Warehouse berisi data dengan beberapa level: rinci; data detail terkini, data
detail lama, ringkasan ringan, dan data ringkasan tinggi.
9. Lingkungan Data Warehouse dicirikan oleh: transaksi hanya-baca ke kumpulan data
yang sangat besar. Lingkungan operasional dicirikan oleh banyak memperbarui
transaksi ke beberapa entitas data pada saat itu.
10. Lingkungan Data Warehouse memiliki sistem yang melacak sumber daya data,
transformasi, dan penyimpanan.
11. Metadata Gudang Data adalah komponen penting dari lingkungan ini. Metadata
menyediakan sumber, transformasi, integrasi, penyimpanan, penggunaan,
hubungan, dan sejarah setiap elemen data.
12. Data Warehouse berisi mekanisme charge-back untuk penggunaan sumber daya
yang memaksakan penggunaan data secara optimal oleh pengguna akhir.
Pemodelan Konseptual Data Warehouse (Conceptual Modeling of Data Warehouse)

Pemodelan gudang data: dimensi & pengukuran

• Star Schema : Sebuah objek tunggal (tabel fakta) ditengah terhubung ke sejumlah
objek (tabel dimensi, satu untuk setiap dimensi).
• Snowflake schema : Penyempurnaan star schema di mana hierarki dimensi
direpresentasikan secara eksplisit dengan menormalkan tabel dimensi.
• Fact Constellations : Beberapa tabel fakta berbagi tabel dimensi (skema galaksi).

Star Schema

Star schema adalah teknik pemodelan data digunakan untuk memetakan pendukung
keputusan multidimensi ke dalam database relasional. Star schema menghasilkan model
yang mudah diimplementasikan untuk analisis data multidimensi sambil tetap
mempertahankan struktur relasional dari database operasional.

Terdapat empat Komponen:

• Facts (Fakta)
• Dimensions (Dimensi)
• Attributes (Atribut)
• Attribute hierarchies (Hirarki atribut)

• Facts
o Fakta adalah pengukuran numerik (nilai) yang mewakili aspek atau aktivitas
bisnis tertentu.
o Tabel fakta berisi fakta-fakta yang dihubungkan melalui dimensinya.
o Fakta dapat dihitung atau diturunkan pada metrik run-time
• Dimension
o Dimensi adalah karakteristik kualifikasi yang memberikan perspektif
tambahan untuk fakta tertentu.
o Dimensi disimpan dalam tabel dimensi.
• Attributes
o Setiap tabel dimensi berisi atribut. Atribut sering digunakan untuk mencari,
menyaring, atau mengklasifikasikan fakta.
o Dimensi memberikan karakteristik deskriptif tentang fakta melalui
atributnya.
• Attributes Hierarchies
o Atribut dalam dimensi dapat diurutkan dalam hierarki atribut yang
terdefinisi dengan baik.
o Hirarki atribut menyediakan organisasi data top-down yang digunakan untuk
dua tujuan utama:
• Agregasi
• Analisis data drill-down/roll-up

Representasi (Representation) star schema

• Fakta dan dimensi biasanya diwakili oleh tabel fisik dalam database gudang data.
• Tabel fakta terkait dengan setiap tabel dimensi dalam hubungan banyak-ke-satu
(M:1).
• Tabel fakta dan dimensi terkait dengan kunci asing dan tunduk pada kunci
utama/asing kendala.

Teknik Peningkatan Kinerja (Performance-Improving Techniques)

• Normalisasi tabel dimensi


• Beberapa tabel fakta yang mewakili tingkat agregasi yang berbeda
• Denormalisasi tabel fakta
• Partisi tabel dan replikasi

Dua Strategi Data Warehousing (Two Data Warehousing Strategies)

• Gudang seluruh ( Enterprise-wide) perusahaan, top down, metodologi Inmon


• Data mart, bottom up, metodologi Kimball
• Ketika dijalankan dengan benar, keduanya menghasilkan gudang data di seluruh
perusahaan

The Enterprise-wide Strategy

• Sebuah gudang yang komprehensif dibangun pada awalnya


• Data mart dependen awal dibangun menggunakan subset data di gudang
• Data mart tambahan dibangun menggunakan subset data di gudang
• Seperti semua proyek yang kompleks, itu mahal, memakan waktu, dan rentan
terhadap kegagalan
• Ketika berhasil, ini menghasilkan gudang yang terintegrasi dan skalabel

The Data Mart Strategy

• Pendekatan yang paling umum


• Dimulai dengan satu mart dan diarsitektur mart ditambahkan dari waktu ke waktu
untuk lebih banyak bidang studi
• Relatif murah dan mudah diterapkan
• Dapat digunakan sebagai bukti konsep untuk data warehousing
• Memerlukan rencana integrasi keseluruhan

Anda mungkin juga menyukai