Anda di halaman 1dari 29

Data Mart, OLAP, Mining

Ipung Permadi, S.Si, M.Cs

LOGO
• Data warehouse memberikan storage,
fungsionalitas yang lebih dan lebih responsif
terhadap query dibandingkan kemampuan
database yang bersifat transaksi
• Banyak orang hanya butuh data read-access tapi
butuh akses yang cepat pada data yang sangat
bear dan bisa diunduh ke desktop, seringkali data
itu datangnya dari lebih dari 1 database. DW, DM
dan OLAP menyediakan fungsi ini.
Konsep Data Warehous

• Subject-oriented, integrated, nonvolatile,


time-variant collection of data in support
of management’s decisions (Inmon, 1992)
• Dibanding database tradisional, DW
umumnya terdiri dari data yang berukuran
sangat besar dari banyak sumber dan
mungkin terdiri dari database dari model
data yang berbeda dan kadang file dari
sistem dan platform yang independen
Konsep Data Warehouse (2)

• Tidak seperti database transaksional, DW


biasanya mendukung analisa tren dan time-
series, di mana keduanya membutuhkan data
historik
• DW itu nonvolatile. Artinya informasi dalam DW
jarang diubah dan bisa dianggap non-real-time
• DW bisa digambarkan sebagai “kumpulan
teknologi pendukung keputusan, dimaksudkan
untuk memungkinkan pekerja yang berhubungan
dengan informasi (eksekutif, manajer dan analis)
untuk membuat keputusan lebih baik dan lebih
cepat”
Ciri-ciri Data Warehouse
• Konsep multidimensi
• Deminsi generic
• Tingkat agregasi dan dimensi tak terbatas
• Operasi lintas dimensi tak terbatas
• Penanganan matriks dinamis
• Arsitektur client-server
• Dukungan multi-user
• aksesibilitas
• Transparansi
• Manipulasi data yang intuitif
• Performa reporting yang konsisten
• Reporting yang fleksibel
Model Data untuk
Data Warehouse
• Contoh dimensi dalam DW adalah periode fiskal, produk
dan region perusahaan
• Spreadsheet standar biasanya matrix 2 dimensi. Contohnya
spreadsheet sales regional berdimensi produk untuk satu
jangka waktu tertentu. Produk ditampilkan per baris
dengan pendapatan sales untuk masing-masing region
ditampilkan per kolom.
• Menambah dimensi waktu seperti kuartal fiskal perusahaan
menjadikannya matrix 3 dimensi yang ditampilkan sebagai
kubus data
• Menambah dimensi tambahan, bisa menghasilkan
hypercube, tapi sulit untuk divisualisasikan
Model Data untuk
Data Warehouse (2)
• Mengubah dari satu (orientasi) hirarki dimensi ke
hirarki lain bisa dikerjakan dalam satu kubus data
dengan teknik pivoting (juga disebut rotasi)
• Model multidimensi memiliki view hirarki yang
dikenal dengan roll-up display dan drill-down.
• Roll-up display memindahkan ke atas secara
hirarki, mengelompokkan ke unit yang lebih
besar
• Drill-down display lebih mendetailkan
Model Data untuk
Data Warehouse (3)

• Model storage multidimensi melibatkan 2


tipe tabel: tabel dimensi dan tabel fakta
• Tabel dimensi terdiri dari tupel atribut
tuples dari diemsni
• Tabel fakta bisa digambarkan memiliki
banyak tupel. Satu tupel untuk satu fakta
yang tercatat. Fakta ini berisikan data dan
dimensi mengidentifikasikan masing-
masing tupel dalam data tersebut
Model Data untuk
Data Warehouse (4)

• Skema multidimensi yang umum adalah


skema bintang dan skema snowflake.
• Skema bintang terdiri dari sebuah tabel
fakta dengan satu tabel untuk masing-
masing dimensi
• Skema snowflake adalah variasi skema
bintang di mana di dalamnya tabel
dimensi dari skema bintang diorganisir
menjadi hirarki dengan normalisasi.
Star Bintang (Star Schema)
skema snowflake
Membangun Data Warehouse

• Perlu pandangan luas untuk antisipasi


penggunaan warehouse
• Design harus mendukung ad-hoc
querying, yaitu mengakses data dengan
kombinasi nilai apa saja untuk atribut
dalam tabel dimensi atau tabel fakta.
Akuisisi data untuk warehouse

• Data diekstrak dari sumber yang banyak


dan heterogen
• Data harus diformat untuk konsistensi
dalam warehouse
• Data harus bersih untuk memastikan
validitas
• Data harus bisa masuk dalam model data
warehouse
• Data harus dimuat dalam warehouse
Fungsi Umum Data Warehouse
• Data warehouse ada untuk memfasilitasi queri ad hoc yang
terjadi sering dan kompleks. Untuk itu, data warehouse
harus menyediakan dukungan query yang lebih efisien
• Roll-up: data dirangkum dengan generalisasi
• Dril-down: meningkatkan tingkat detail
• Pivot: lintas tabulasi (juga disebut rotasi)
• Potong dan iris: melakukan operasi proyeksi terhadap
dimensi
• Sorting: data diurut berdasarkan nilai ordinal
• Selection: data tersedia dalam nilai atau range
• Derived attributes: atribut dihitung oleh operasi dalam nilai
yang disimpan atau turunan
Data Mart

• Bagian dari data warehouse yang


mendukung kebutuhan pada tingkat
departemen atau fungsi bisnis tertentu
dalam perusahaan.
• Karakteristik yang membeda- kan data
mart dan data warehouse adalah sbb :
(Connolly, Begg, Strachan 1999).
Data Mart (2)

1. Data mart memfokuskan hanya pada


kebutuhan-kebutuhan pemakai yang
terkait dalam sebuah departemen atau
fungsi bisnis.
2. Data mart biasanya tidak mengandung
data operasional yang rinci seperti pada
data warehouse.
3. Data mart hanya mengandung sedikit
informasi dibandingkan dengan data
warehouse. Data mart lebih mudah
dipahami dan dinavigasi.
OnLine Analytical Processing (OLAP)

• OLAP digunakan untuk menganalisisis data dan


informasi yang nantinya akan digunakan sebagai
Decision Support System (DSS)
• Beberapa aktivitas yang dapat dilakukan melalui
OLAP antara lain seperti :
– melakukan proses query,
– meminta laporan,
– mendukung analisis statistik,
– melakukan analisis interaktif, dan
– membangun aplikasi multimedia.
DataMINING

• Perangkat lunak yang digunakan untuk


menemukan pola-pola tersembunyi maupun
hubungan-hubungan yang terdapat dalam basis
data yang besar dan mengha silkan aturan-
aturan yang digunakan untuk memperkirakan
perilaku di masa medatang
• Data mining sering dikatakan berurusan dengan
“penemuan pengetahun” dalam basis data. Suatu
aturan yang dihasilkan oleh data mining misalnya
seperti berikut : “Kebanyakan pembeli mobil
Forsa adalah wanita berusia di atas 30 th”
DataMINING (2)

• DATA MINING adalah usaha penemuan


pengetahuan di intelejensia buatan
(bidang machine learning) atau analisis
statistik dengan mencari atau menemukan
aturan-aturan, pola-pola dan struktur dari
himpunan data yang besar.
Kemampuan DataMINING

• Data mining mengotomatisasi proses pencarian


informasi pemprediksi di dalam basis data yang
besar. Pertanyaan-pertanyaan yang berkaitan
dengan prediksi ini dapat cepat dijawab langsung
dari data yang tersedia.
• Contoh dari masalah prediksi ini misalnya target
pemasaran,peramalan kebangkrutan dan bentuk
bentuk kerugian lainnya.
Kemampuan DataMINING

• Mengotomatisasi penemuan pola-pola yang tidak


diketahui sebelumnya.
• Contoh dari penemuan pola ini adalah analisis
pada data penjulan ritel untuk mengidentifikasi
produk-produk,yang kelihatannya tidak
berkaitan, yang seringkali dibeli secara
bersamaan oleh kustomer.
• Contoh lain adalah pendeteksian transaksi palsu
dengan kartu kredit
Cara Kerja DataMINING

1. DataMINING untuk menentukan Prospek


Model ini dapat diterapkan untuk menarik kesimpulan dari informasi
khusus (sebagai data prospek), dimana saat ini informasi khusus
tersebut tidak dimiliki oleh perusahaan. Dengan model ini, calon-
calon kustomer baru dapat ditarget secara selektif.
Cara Kerja DataMINING

2. DataMINING untuk prediksi


memprediksi apa yang akan terjadi di
masa mendatang
Level Data

Increasing potential
to support
business decisions End User
Making
Decisions

Data Presentation Business


Analyst
Visualization Techniques

Data Mining Data


Information Discovery Analyst

Data Exploration
Statistical Analysis, Querying and Reporting

Data Warehouses / Data Marts


OLAP, MDA DBA
Data Sources
Paper, Files, Information Providers, Database Systems, OLTP
DataMINING dan Teknologi Databases

• Dari gambar di atas terlihat bahwa teknologi data


warehouse digunakan untuk melakukan OLAP(On-line
Analytical Processing)
• datamining digunakan untuk melakukan information
discovery yang informasinya lebih ditujukan untuk seorang
Data Analyst dan Business Analyst.
• Dalam prakteknya, data mining juga mengambil data dari
data warehouse. Hanya saja aplikasi dari data mining lebih
khusus dan lebih spesifik dibandingkan OLAP mengingat
database bukan satu-satunya bidang ilmu yang
mempengaruhi data mining,
Perbedaan

• beda data mining dengan data warehouse


dan OLAP (On-line Analytical Processing)?
Adalah teknologi yang ada di data
warehouse dan OLAP dimanfaatkan penuh
untuk melakukan data mining.

Anda mungkin juga menyukai