SISTEM PENDUKUNG
KEPUTUSAN
BAB-5
CHAPTER 5
BUSINESS INTELLIGENCE: DATA WAREHOUSING, DATA ACQUISITION,
DATA MINING, BUSINESS ANALYTICS, AND VISUALIZATION
Tujuan Pembelajaran
Menjelaskan masalah dalam manajemen data.
Memahami konsep dan kegunaan DBMS.
Mempelajari data warehousing dan data marts.
Menjelaskan business intelligence/business analytics.
Membahas bagaimana meningkatkan pengambilan keputusan
melalui manipulasi data dan analisa.
Memahami interaksi antara teknologi Web dan database.
Menjelaskan bagaimana teknologi database digunakan dalam
business analytics.
Memahami pengaruh Web terhadap business intelligence dan
analytics.
5-2
Pengantar
Banyak Organisasi memiliki data yang jumlahnya terus
meningkat sangat cepat.
Menghapus data-data penting menjadi suatu masalah?
Efektif, dan tidak efektif dan bermasalah bagi sebagian
organisasi
Solusi: menggunakan piranti analitik untuk meningkatkan
pengambilan keputusan, dengan menempatkan arsitektur
data dengan benar.
Kecerdasan bisnis=membuat analisis keputusan melalui
akses ke sisfo yang relevan meliputi Data Warehousing,
OLAP, Data Mining, visualisasi serta multidimensial.
5-3
Data warehouse memberikan sebuah arsitektur data
strategis untuk melakukan analisis pendukung
keputusan.
Data warehouse memungkinkan data mining, sebuah
kemampuan secara otomatis mensintesakan
sejumlah besar informasi untuk menemukan
kebenaran-kebenaran tersembunyi di dalam data.
Portal data muncul sebagai generasi di era data
warehouse (web enabled).
5-4
Information Sharing a Principle Component of the National
Strategy for Homeland Security Vignette
5-6
Data, Information, Knowledge
Seorang pengambil keputusan membutuhkan data, informasi dan
pengetahuan
Pengambil keputusan harus mampu menerapkan piranti analisis
OLAP, data mining dll sehingga data, informasi, dan pengetahuan
bermanfaat.
Kecerdasan bisnis membuat para pengambil keputusan dapat
mengidentifikasi hubungan diantara item-item data sehingga
memberikan pemahaman dan keunggulan kompetitif
Data diintegrasikan dalam sebuah data warehouse dan dianalisis
secara otomatis via piranti data mining atau para analis dengan
menggunakan OLAP.
Semua sistem pendukung keputusan menggunakan data, informasi
dan atau pengetahuan.
5-7
Data, Information, Knowledge
Data
Sesuatu yang menjadi gambaran paling mendasar mengenai
sesuatu, benda, peristiwa, aktifitas dan transaksi yg direkam.
Terdiri dari internal (data korporat) atau eksternal (komersial,
Sensor dan Satelit (GIS), lembaga riset, bank, biro sensus dll )
Data dan pengetahuan personal
Informasi
Data yang telah diolah menjadi sesuatu yang lebih berarti dan
bernilai
Knowledge
Data dan atau informasi yg diorganisasi dan proses untuk
pemahaman, pengalaman, pembelajaran akumulatif, dan keahlian
yang diaplikasikan terhadap suatu masalah atau aktifitas saat ini
dalam sebuah SPK
5-8
Data (Pengumpulan data, Masalah dan Kualitas)
Data mentah diperoleh secara manual atau menggunakan
instrumen (alat/sensor scanner/GPS/PDA/RFID) metode time
study, surve, kuesioner, observasi dan wawancara
Masalah2 Data (GIGO)
Kualitas Data merupakan sesuatu yang penting
Kualitas menentukan manfaat
Contextual data quality (Relevansi, nilai tambah, batasan waktu, kelengkapan, dan
jmlah data)
Intrinsic data quality (akurasi, objectivitas, kemampuan u/ dapat dipercaya, reputasi)
Accessibility data quality (kemudahan akses, dan keamanan akses)
Representation data quality (pemahaman, kemampuan untuk diinterpretasikan
(representasi tepat dan konsisten)
Sering kali terlupakan atau ditangani begitu saja
Masalah akan terungkap ketika data terangkum (Aplikasi datawarehouse
mengharuskan data dibersihkan/program jaminan kualitas data aktif)
5-9
Data Problems
5-10
Data
Membersihkan data
Ketika menggunakan warehouse
Data quality action plan
Best practices untuk kualitas data
Mengukur hasil
Topik terkait dengan Integritas Data
Uniformity (Keseragaman)
Version (pemeriksaan versi ketika diubah menggunakan
metadata dan memastikan data asli tidak berubah)
Completeness check (Periksa kelengkapan)
Conformity check (Periksa konsistensi)
Genealogy or drill-down (silsilah/turunan)
5-11
Data
Integrasi Data
(mengatasi sistem pengarsipan lemah, konflik data, tipe dan ukuran)
5-12
Sumber Data Eksternal
Mengumpulkan data dari banyak sumber
eksternal bisa sangat rumit.
Web (kebanyakan sumber data ekst. Aadalah web)
Intelligent agents
Document management systems
Content management systems
Commercial databases
Membeli/Menjual akses ke database tertentu
5-13
Contoh: Layanan database komersial
CompuServe and the source (compuserve.com)
menyediakan bank data statistik, bibliografi (berita,
referensi, perpustakaan, dan ensiklopedi)
Compustat (compustat.com) menyediakan statistik
keuangan puluhan ribu korporasi, statistik pertanian,
perbankan, komoditi, demografi, ekonomi, energi,
keuangan, asuransi dll.
Dow Jone Information service
Lockheed in information system
Mead data centarla (mead.com)
Dll
5-14
Database Management Systems
Software program
Mendukung Sistem Operasi
Mengelola data
Menjalankan Query dan menghasilkan reports
Keamanan Data
Dikombinasikan dengan modeling language
untuk pengembangan DSS
5-15
Database Models
Hierarchical
Top down, seperti struktur pohon
Fields hanya memiliki satu “parent”, setiap “parent” dapat memiliki beberapa
“children”
Cepat
Network
Relationships dibuat melalui linked lists, dengan menggunakan pointers
“Children” dapat memiliki beberapa “parents”
Sangat fleksibel
Relational
Flat, tabel dua dimensi dengan multiple access queries
Menganalisa relasi antar tabel
Fleksibel, cepat, dan diperluas dengan data independence
Object oriented
Data dianalisa pada tingkat konseptual
Inheritance, abstraction, encapsulation
5-16
Database Structure
5-17
Database Models, lanjutan
Multimedia Based
Multiple data formats
JPEG, GIF, bitmap, PNG, sound, video, virtual reality
Membutuhkan hardware tertentu untuk dapat menampilkan
semua feature yang tersedia
Document Based
Penyimpanan dan manajemen dokumen
Intelligent Based
Intelligent agents dan Artificial Neural Network
Inference engines (menyederhanakan akases ke dan manipulasi
database kompleks dengan kemampuan inferensi) ex: query
optimizer
5-18
Data Warehouse
Subject oriented (diorganisasi berdasar subjek tertentu: Pelanggan, klaim
dll)
Terintegrasi: Sudah dibersihkan sehingga data menjadi standar meski
diperoleh dari berbagai sumber
Time series; no current status (data 5 tahun, 10 tahun)
Nonvolatile
Read only dan eklusif untuk akses data
Ringkas/Rangkuman
Tidak normal; mungkin saja terjadi kerangkapan data (redundant)
Menyajikan data dari sumber internal dan eksternal
Mencakup Metadata
Data tentang data
Business metadata
Semantic metadata
Note: Metadata digambarkan sebagai data tentang data
yang dimasukkan
5-19
ARSITEKTUR
May have one or more tiers
Ditentukan oleh warehouse (data dan perangkat lunak
terkait), data acquisition (back end) yang mengektraksi
data dari sistem legacy dan sumber ekstrenal, dan
perangkat lunak client (front end) yang mengizinkan
pengguna mengakses dan meneliti data di dalam
warehouse.
One tier, dimana semua dijalankan dalam platform yang sama,
sangat jarang
Two tier biasanya menggabungkan DSS engine (client) dengan
warehouse
Lebih ekonomis
Three tier memisahkan kedua fungsi ini (DSS engine dan
warehouse)
5-20
Data Warehouse Framework and Views
5-21
5-22
Migrasi Data
Business rules
Tersimpan dalam metadata repository
Diaplikasikan pada data warehouse secara terpusat
Data di-extract dari berbagai sumber yang relevan
Di-load melalui data-transformation tools atau programs
Terpisah antara operation dan decision support
environments
Memperbaiki masalah kualitas sebelum data
disimpan
Proses membersihkan dan mengorganisasikan dilakukan
dengan konsisten
5-23
Perancangan Data Warehouse
Dimensional modeling
Retrieval based
Diimplementasikan dengan star schema
Central fact table
Dimension tables
Grain
Highest level of detail
Drill-down analysis
5-24
Pengembangan Data Warehouse
Teknik Implementasi Data warehouse
Top down
Bottom up
Hybrid
Federated
Projects may be data centric or application centric
Implementation factors
Organizational issues
Project issues
Technical issues
Scalable
Fleksibel
5-25
Data Marts
Data mart adalah sebuah subkumpulan (subset) data
warehouse, terdiri dari subject tunggal (mis: pemasaran,
operasional)
Dependent
Dibuat dari warehouse
Replika
Functional subset dari warehouse
Independent
Skala lebih kecil, versi data warehouse yang “lebih murah”
Dirancang untuk sebuah departemen/bagian
Perusahaan mungkin saja memiliki beberapa data marts
Sulit untuk diintegrasikan
5-26
Business Intelligence and Analytics
Business intelligence
Akuisisi/penggabungan dari data dan informasi
untuk digunakan dalam kegiatan pengambilan
keputusan
Business analytics
Models and solution methods
Data mining
Menerapkan model dan metod pada data untuk
mengidentifikasi pola dan kecenderungan (trend)
5-27
OLAP
Aktivitas yang dilakukan oleh end users pada online systems
Specific, open-ended query generation
SQL
Ad hoc reports
Statistical analysis
Building DSS applications
Modeling and visualization capabilities
Special class of tools
DSS/BI/BA front ends
Data access front ends
Database front ends
Visual information access systems
5-28
Data Mining
Mengorganisasikan dan menggunakan informasi dan
knowledge dari beberapa database
Statistical, mathematical, artificial intelligence, and
machine-learning techniques
Otomatis dan cepat
Tools yang digunakan untuk mencari pola
Simple models
Intermediate models
Complex Models
5-29
Data Mining
Data mining application classes of problems
Classification
Clustering
Association
Sequencing
Regression
Forecasting
Others
Hypothesis or discovery driven
Iterative
Scalable
5-30
Tools and Techniques
Data mining
Statistical methods
Decision trees
Case based reasoning
Neural computing
Intelligent agents
Genetic algorithms
Text Mining
Hidden content
Group by themes
Determine relationships
5-31
Knowledge Discovery in Databases
5-32
Data Visualization
Teknologi pendukung visualisasi dan
interpretasi
Digital imaging, GIS, GUI, tables, multidimensions,
graphs, VR, 3D, animation
Mengidentifikasi relasi dan trends
Manipulasi Data memungkinkan untuk
melihat performance data secara real time
5-33
Multidimensionality
Data diorganisasikan menurut standar bisnis, bukan
ditentukan oleh seorang analis
Konseptual
Faktor
Dimensi
Ukuran
Waktu
Overhead dan storage yang signifikan
Mahal
Kompleks
5-34
Analytic systems
Real-time queries and analysis
Real-time decision-making
Real-time data warehouses yang di-update
harian atau lebih sering
Update dapat dilakukan bersamaan dengan
menjalankan query
Tidak semua data ter-update secara terus
menerus
Pengunaan aplikasi business analytic
5-35
GIS
Sistem terkomputerisasi untuk mengelola dan
memanipulasi data dengan peta digital
Berorientasi Geografis
Geographic spreadsheet for models
Software memungkinkan web mengakses peta
Digunakan untuk modeling dan simulasi
5-36
GIS Application
5-37
Web Analytics/Intelligence
Web analytics
Aplikasi dari business analytics pada Web sites
Web intelligence
Aplikasi dari teknik business intelligence pada
Web sites
5-38