Anda di halaman 1dari 8

PERTEMUAN 1 • Jika kebutuhan untuk menganalisa data ini

semakin banyak.
Kecerdasan Bisnis
• Jika Kita ingin melihat tren dari waktu ke
• Kecerdasan Bisnis (Business intelligence)
waktu-umum atas transaksi yang ada
adalah serangkaian kegiatan untuk
mengumpulkan dan menganalisis data • Beberapa data yang diperlukan untuk
sehingga dapat digunakan untuk proses analisis tidak tersedia dalam database
pengambilan keputusan yang lebih baik perusahaan
agar dapat digunakan dalam proses
pengambilan keputusan bisnis. • Jika kualitas data tidak memenuhi syarat

• BI digunakan untuk dapat membantu Dukungan untuk Pengambilan


bisnis dalam proses pengambilan Keputusan
keputusan strategis seperti perencanaan
• Solusi BI dibuat untuk mendukung usaha
anggaran tahunan, penentuan target sales,
pengambilan keputusan oleh perusahaan.
menganalisa dan memprediksi bisnis trend
serta melakukan data konsolidasi untuk • solusi BI akan membantu Kita menilai dan
keperluan para pengambil keputusan. menanggapi kondisi bisnis, apakah Kita
memerlukan perkiraan yang meliputi
• BI digunakan untuk membuat referensi
semua seluruh organisasi perusahaan atau
prediksi sehingga kita dan orang lain dapat
perspektif departemen, kelompok kerja,
mengukur dampak keputusan yang dibuat
atau bahkan sebuah tim saja.
berdasarkan data yang ada.
• Tujuan dari solusi BI adalah untuk
• BI merupakan proses yang berulang-ulang
membantu menganalisa data dan
dengan cara menganalisis data untuk
menemukan jawaban untuk pertanyaan
melihat apa yang terjadi.
dengan cara melacak, konsolidasi,
• Kemudian mengambil tindakan untuk reformatting dan merapikan data itu
melanjutkan setiap hasil positif serta sendiri.
menghentikan jika ada potensi menuju
arah negatif, sekaligus mengukur hasil dari BI Framework
setiap keputusan yang ada terhadap faktor • Menyediakan semua alat yang anda
pendukung eksternal maupun internal yang butuhkan untuk membangun, mengelola
bagi bisnis perusahaan dan menggunakan solusi BI pada
perusahaan
Kapan kita memerlukan BI
• Platform untuk membuat data warehouse
• Jika Database disimpan dalam platform
dan data mart:
yang berbeda –beda (misalnya: SQL
Server, Oracle, DB2, MySQL Dan • Microsoft SQL Server 2008
lainnya), konsolidasi data akan menjadi
perkara yang tidak mudah apalagi jika • Pentaho Data Integration
akan di gunakan untuk keperluan analisis
data. • Spago BI

• Jika Definisi data mungkin tidak konsisten • IBM Cognos, dll


di dengan database-database yang ada,
penyeragaman data yang tampaknya
serupa akan menjadi perkara sulit.
• Sebagai contoh, kode produk di database
Sales pada system SAP Finance bisa jadi
berbeda dengan kode produk yang di
gunakan pada database sales pada system
oracle finance.
SKEMA BI 4 Komponen BI :
1. Data warehouse adalah kumpulan dari
komponen perangkat keras dan perangkat
lunak yang dapat digunakan untuk
mendapatkan analisa yang lebih baik dari
data yang berjumlah sangat besar sehingga
dapat membuat keputusan yang baik.
manfaat atau kegunaan dari data
warehouse ialah: memahami trend bisnis
dan membuat perkiraan keputusan yang
lebih baik dan menganalisa informasi
Solusi BI mengenai penjualan harian dan membuat
keputusan yang cepat dalam
Ada 3 komponen penting yang diperlukan mempengaruhi performance perusahaan.
untuk membangun sebuah solusi BI dalam 2. business analytics adalah suatu aplikasi
BI Framework yang menyediakan proses pengambilan
1. Proses ETL (extract, transform dan keputusan dengan akses berbasis waktu
load) Proses untuk terhubung dengan dari berbagai sumber data. Pengguna dapat
beragam sumber data, dan membuat data menggunakan Business intelligence untuk
tersebut tersedia bagi proses selanjutnya. mengakses suatu dimensional data
warehouse yang interaktif dengan
Implementasi proses ETL ini bukan memanfaatkan OLAP untuk proses slice
hanya masalah IT tapi bisnis secara dan dice, drilling up serta drilling down.
keseluruhan harus dilibatkan untuk 3. user interface (dashboard) adalah satu
memastikan mampu memenuhi kebutuhan kategori dari aplikasi business intelligence
bisnis.Proses ELTP bertanggung jawab yang secara real time akan memonitoring
untuk menghubungkan dan mengekstrak berbagai informasi yang dibutuhkan oleh
data dari satu sumber atau suatu organisasi atau perusahaan dengan
lebih,mengubahnya sesuai dengan aturan berbagai macam format seperti graphical
bisnis yang ditetapkan dan memasukannya gadgets, typically
ke dalam model data 4. business performance management
(BPM) adalah berfungsi menyediakan tool
2. Proses analisis dengan pendekatan tool yang mereka butuhkan untuk
OLAP (online analytical processing), pengelolaan aplikasi mereka.
Analisis data sendiri dengan pendekatan
Cube dan dimensi bisa dilakukan dengan kegunaan BI :
SQL Server Analysis services. 1. Analisa dalam perilaku konsumen,pola
3. Proses reporting yang di gunakan sebagai pembelian dan trend penjualan
representasi hasil analisis data yang sudah 2. Mengukur,melacak dan memprediksi
dilakukan yang dapat di buat dengan penjualan dan kinerja keuangan
menggunakan Tools SQL Server 3. Penggangaran,perencanaan dan peramalan
Reporting services. 4. Mengetahui kinerja kegiatan pemasaran
5. Optimalisasi proses dan kinerja
Merancang struktur data warehouse operasional
merupakan langkah pertama yang harus
dilakukan untuk membuat solusi BI PERTEMUAN 2
Dengan menggunakan data warehouse Data Integration
yang sudah di design akan di isi dengan
integrasi data merupakan proses menggabungkan
data dari external data source seperti dari
atau menyatukan dua atau lebih sebuah data dari
legacy system, Flat file atau file dokumen
berbagai sumber database yang berbeda ke dalam
lainnya.
sebuah penyimpanan seperti gudang data (data
warehouse).
Mengapa Integrasi Data?
• Mempermudah dalam proses menganalisa
untuk pengambilan keputusan.
• Sharing data antar lingkungan kerja.
• Terhindar dari adanya duplikat data.

Tools Data Integration


• Pentaho Data Integration (PDI)
• Talend (Open Source ETL)
• SQL SQL Server Integration Service
(SSIS), etc. 2. Pan
- Merupakan utilitas yang digunakan untuk
Pentaho Data Integration (PDI) mengeksekusi transformation
• Pentaho Data Integration (PDI) atau Kettle - Umumnya dijalankan pada saat
adalah utilitas ETL open source di bawah otomatisasi terjadwal (scheduled
Pentaho Corp. Amerika. automation)
• Matt Casters, seorang programmer dan - Dipaketkan dengan nama file pan.bat
konsultan Business Intelligence (BI) dari (batch Script) dan pan.sh (BASH shell
belgia yang telah menangani berbagai script)
proyek BI untuk perusahaan besar.
3. Kitchen
• Kettle merupakan utilitas ETL yang sangat
- Merupakan utilitas yang digunakan
popular dan salah satu yang terbaik di
untuk mengeksekusi job
pasaran. - Umumnya dijalankan pada saat
otomatisasi terjadwal (scheduled
Kelebihan PDI automation)
• Memiliki koneksi modul pengolahan data - Dipaketkan dengan nama file pan.bat
yang cukup banyak. Lebih dari 100 modul (batch script) dan pan.sh (BASH shell
atau step. script)
• Memiliki modul yang memudahkan
perancangan model data warehouse seperti 4. Carte
slowly Changing Dimension dan Junk - Merupakan utilitas cluster web server
Dimension. yang digunakan untuk mengeksekusi
job / transformation
• Performa dan Kemampuan skalabilitas
- Terutama digunakan untuk
yang baik dan sudah terbukti.
meningkatkan performa ETL dengan
• Dapat dikembangkan dengan berbagai pembagian load kerja pada berbagai
plugin tambahan. node Carte (master dan slave)

Komponen Aplikasi Kettle (TOOLS)


Komponen Pentaho Data Integration
Kettle terdiri dari 4 utilitas dalam bentuk shell dan
batch script yaitu:
1. SPOON
- Merupakan utilitas yang digunakan
untuk merancang dan menjalankan job
/ transformation secara visual (GUI)
- Dipaketkan dengan nama file
spoon.bat (batch script) dan spoon.sh
(BASH shell script)
PERTEMUAN 3

Extract Transform Load (ETL)


• ETL adalah sekumpulan proses yang harus
dilalui dalam pembentukan data warehouse.
• Tujuan ETL adalah mengumpulkan,
menyaring, mengolah dan menggabungkan
datadata yang relevan dari berbagai sumber
untuk disimpan ke dalam data warehouse.
 Load
- Load adalah proses terakhir yang berfungsi
untuk memasukkan data ke dalam target
akhir, yaitu ke dalam data warehouse.
- Cara untuk memasukkan data adalah dengan
menjalankan SQL script secara periodik.
- Pada proses ini akan mengubah data kedalam
bentuk Dimensional Data Store agar format
data cocok untuk diterapkan pada proses
analisis dan telah terintegrasi dengan
beberapa sumber data.
- Proses Load yang termasuk proses terakhir
dalam ETL akan sampai ke berbagai macam
 Extract
output yang sesuai dengan skemanya, yaitu
- Extract adalah proses memilih dan mengambil
terdiri dari proses load-up data (lodupd), load-
data dari satu atau beberapa sumber dan
insert data (lodins), dan load bulk data
membaca/mengakses data yang dipilih tersebut.
(lodbld).
- Proses ini dapat menggunakan query, atau
aplikasi ETL.
- Sebaiknya sebelum proses extract kita lakukan,
akan lebih mudah jika user sudah
mendefinisikan kebutuhan terhadap sumber data
yang akan kita butuhkan.

PERTEMUAN 4

On Line Transaction Processing


(OLTP)
OLTP adalah sistem yang berorientasi proses
yang memproses transaksi secara langsung
melalui komputer yang terhubung dalam
 Transform jaringan.
- Pada Proses ini data yang telah diambil pada • OLTP = On Line Transaction Processing
proses extract akan dibersihkan dan mengubah • Aplikasi yang dirancang khusus untuk
data dari bentuk asli menjadi bentuk yang sesuai menangani operasional sehari-hari
dengan kebutuhan data warehouse. • Bersifat mission critical
- Kendala yang biasanya terjadi pada proses • Biasanya berbasiskan SQL
transform adalah sulitnya menggabungkan data • Contoh : SAP, Microsoft Axapta /
dari beberapa sistem yang harus dibersihkan Dynamics, Compiere / Adempiere, dll
sehingga data bersifat konsisten.
OLAP  Terintegrasi
 OLAP = On Line Analytical Processing - berarti data dikumpulkan kedalam data
 Aplikasi yang dirancang khusus untuk warehouse dari beragam sumber yang berbeda
laporan analis dan digabungkan dalam kesatuan yang koheren.
 Skema database OLAP berbeda dengan - Dibangun dari berbagai macam sumber data
skema database OLTP (On Line - RDBMS, flat file, catatan transaksi
Transaction Processing) - Menerapkan proses data cleaning dan teknik
 Database OLAP biasanya dihasilkan integrasi
melalui proses data warehousing - Memastikan konsistensi penamaan, pengkodean,
unit yang digunakan dari berbagai macam data
source
- Misal harga: ada yang dalam bentuk dolar ($)
PERTEMUAN 5-6 dan rupiah (Rp) semuanya harus dikonversi
Data Warehouse kedalam satuan yang sama
• Istilah ini baru diperkenalkan pada tahun - Ketika data dipindahkan ke data warehouse,
1988 maka data itu harus sudah di konversi
(10 tahun setelah diperkenalkannya istilah
DSS)  Time-variant
• Yang memperkenalkan adalah W. H. berarti semua data dalam data warehouse
Inmon dalam bukunya “Data Architecture: diidentifikasikan dengan periode waktu tertentu.
The Information Paradigm” adalah sebagai - Rentang waktu yang ada pada data warehouse
koleksi data yang berorientasi subyek, jauh lebih lama daripada rentang waktu yang ada
teritegrasi, non-volatile dan time –variant pada operational system
untuk mendukung keputusan-keputusan o Database operasional: menyimpan data sekarang
manajemen (Inmon,1996) o Data warehouse: menyimpan data historian
• Sebuah sistem yang mengambil dan - Setiap struktur dalam data warehouse:
mengonsolidasi data secara periodik dari o Memiliki elemen waktu secara implisit atau
sistem-sistem sumber kedalam tempat eksplisit
penyimpanan data yang dimensional atau o Tapi dalam database operasional, data tidak
ternormalisasi (Rainardi, 2008) selalu mempunyai elemen waktu
• Data warehouse adalah tempat
penyimpanan data  Non-volatile
• Datanya berasal dari berbagai macam - berarti data baru ditambahkan kedalam data
sumber warehouse namun data lama tidak dihapus
• Digunakan untuk kepentingan - Data warehouse memiliki fisik yang terpisah dari
pengambilan keputusan manajemen database operasional
- Operasi update data, tidak ada dalam data
Karakteristik Data Warehouse warehouse, tetapi data diupdate dengan cara
Mola dan Miele (2005) menjelaskan bahwa : batch processing pada waktu-waktu tertentu
- Data warehouse hanya memiliki dua operasi:
 Berorientasi subyek - Initial loading
- berarti data yang tersimpan dalam data - Access data
warehouse memberi informasi mengenai
subyek tertentu dan bukan kegiatan operasional Penggunaan DW
sehari-hari organisasi.
- Fokus kepada subjek tertentu, seperti
penjualan, produksi, customer.
- Fokus kepada modeling dan analisis data untuk
pengambilan keputusan, bukan berdasarkan
operasional atau transaksi harian
- Menyediakan informasi yang sudah
disederhanakan dan ringkas tentang isu utama.
Tidak termasuk data yang kurang berguna
dalam pengambilan keputusan
Arsitektur Data Warehouse (Menggunakan
Arsitektur Data Warehouse (Basic) Staging Area dan Data Mart)

Menunjukan arsitektur sederhana dari data


Mengilustrasikan dimana data pembeli,penjualan
warehouse,user dapat langsung mengakses data
dan penyimpanan dipisahkan ,sehingga
yang diambil dari beberapa souce melalui gudang
memudahkan seorang analist dalam menganalisis
data. Seperti ilustrasi di dalam Data warehouse
data penjualan bulan tertentu atau dalam jangka
architecture (basic),pengguna (users) langsung
waktu tertentu. . penjelasan = apabila dat
bisa mengakses data yang dikirimkan oleh
warehouse menggunakan staging area masih
beberapa sumber melalui data warehouse tanpa
belum cukup dalam mengakomodir organisasi
harus membersihkan dan memproses data terlebih
data,kita bisa menambahkan kelompok organisasi
dahulu.
lain dengan cara menambahkan data marts,pada
Arsitektur Data Warehouse (Menggunakan sistem yang sudah ada beberapa desain organisasi
Staging Area) untuk bisnis.
Multi Dimension Model (MDM)
• Data warehouse dibangun berdasarkan model
multi dimensional dimana kita melihat data
dalam bentuk kubus.
• Model multi dimensi terdiri dari dua
komponen
- Fakta (Fact) adalah data yang dapat
diukur.
- Seperti data penjualan, produksi,
keuntungan, pengeluaran
- Dimensi (Dimension) adalah satuan
Arsitekture gudang data menggunakan staging atau elemen data. Contoh: waktu (hari,
area dapat menyederhanakan proses pembuatan minggu, bulan, tahun), lokasi (daerah,
summary dan management warehouse secara kota, wilayah, negara)
umum,data akan dibersihkan dan diproses
sebelum dimasukan ke dalam data warehouse  Bentuk Normal Ketiga (3NF): data
.penjelasan = kita perlu melaukan pembersihan disimpan dalam bentuk tabel relasional
dan memroses data terlebih dahulu sebelum biasa
dimasukkan ke datawarehouse  Star Scheme: tabel fakta berada di tengah,
dihubungkan dengan tabel dimensi yang ada
di sekelilingnya
 Snowflake Scheme: modifikasi dari star
scheme, yang mana tabel dimensi
dinormalisasikan menjadi beberapa table
 Fact Constellation: beberapa tabel fakta
menggunakan tabel dimensi yang sama,
sehingga terlihat membentuk pola
(konstelasi)
Aspek Penting Data Warehouse (DW) Drill up and Drill down
Menavigasi antara tingkat data mulai dari
 Proses ETL
yang paling diringkas (atas) ke yang paling
 OLTP -> OLAP rinci (bawah)
Roll Up
 Pembersihan (Clean) Menghitung semua hubungan data untuk satu
atau lebih dimensi
Penyesuaian data (Conform
Pivot
Operasi ini disebut juga memutar.
Memutar data dalam rangka memberikan
PERTEMUAN 7
presentasi alternatif data (laporan) atau
OLAP mengambil tampilan halaman dengan
orientasi dimensi yang berbeda.
• Online Analytical Processing (OLAP) adalah
teknologi yang digunakan untuk menata database
besar bisnis dan mendukung kecerdasan bisnis.
• Database OLAP dibagi menjadi satu atau beberapa
kubus, dan kubus setiap ditata dan didesain oleh
administrator kubus agar pas dengan cara yang
Anda ambil dan menganalisis data sehingga lebih
mudah untuk membuat dan menggunakan
PivotTable laporan dan laporan PivotChart yang
Anda butuhkan.
• OLAP = OnLine Analytical Processing Komponen Flow
• OLAP adalah tools untuk menganalisa data
multi dimensional yang disimpan dalam  Job: Control Flow
database
 Transformation: Data Flow
• OLAP dapat menjawab pertanyaan seperti:
• Produk apakah yang paling diminati  Step: Task atau Modul terkecil di Pentaho
konsumen selama periode tahun Data Integration
2012?
• Daerah manakah yang memiliki  Hop: Flow linkage
kontribusi tinggi dalam penjualan?  Praktek: Pada Modul
• Kapankah produksi paling tinggi?
 Mencari value (lookup) dari suatu stream
Jenis-jenis OLAP (reference) berdasarkan data dari sumber
 MOLAP (multidimensional OLAP) data utama (main stream)
Data disimpan dalam bentuk multi-
 Dengan demikian membutuhkan dua
dimensional
stream.
 ROLAP (relational OLAP)
Data disimpan dalam bentuk realsional  Identik dengan VLOOKUP (tapi dengan
 HOLAP (hybrid OLAP) lebih dari 1 key)
Kombinasi antara MOLAP dengan ROLAP
 Padanan perintah SQL :
Operasi Dalam OLAP
Select
 Roll up (drill up)
main_table.*,
Rekapitulasi data
reference_table.lookup_value
 Rool down (drill down) from main_table left outer join reference_table on
Detail data main_table.key1 =
 Slice and dice reference_table.key1
 Pivot (rotate)
 Drill across
 Drill through