Anda di halaman 1dari 43

8

Conformed Dimension

Jika menggunakan referensi dari kimball, maka terdapat istilah conformed


dimension. Conformed dimension adalah dimensi memiliki arti hal yang sama
dengan setiap tabel fakta yang mungkin yang dapat bergabung.
Pembentukan conformed dimension adalah langkah yang sangat signifikan.
Jadi conformed dimension berarti dimensi indentik yang sama di setiap
data mart. Contoh conformed dimension yaitu: kostumer, produk, lokasi,
promosi dan waktu (Kimball et al, 1998).

Pemodelan dimensi (DM) adalah nama dari seperangkat teknik dan konsep yang
digunakan dalam data warehouse design. Hal ini dianggap berbeda dari entity-relationship
modeling (ER).Modeling dimensi tidak selalu melibatkan database relasional. Pendekatan
pemodelan yang sama, di tingkat logis, dapat digunakan untuk bentuk fisik apapun, seperti
database multidimensi atau file bahkan datar. Menurut konsultan data warehousing Ralph
Kimball , [1] DM adalah teknik desain untuk database dimaksudkan untuk mendukung
permintaan pengguna akhir di gudang data.Hal ini berorientasi sekitar dimengerti dan
kinerja. Menurut dia, meskipun ER berorientasi transaksi sangat berguna untuk menangkap
transaksi , harus dihindari untuk pengiriman end-user.

Pemodelan dimensi selalu menggunakan konsep fakta (ukuran), dan dimensi


(konteks). Fakta biasanya (tetapi tidak selalu) nilai numerik yang dapat dikumpulkan, dan
dimensi adalah kelompok hirarki dan deskriptor yang menentukan fakta-fakta. Sebagai
contoh, jumlah penjualan adalah fakta, timestamp, produk, daftar #, toko #, dll adalah
elemen dimensi. Model dimensi yang dibangun oleh area proses bisnis, misalnya toko
penjualan, persediaan, klaim, dll Karena area proses bisnis yang berbeda berbagi beberapa
tapi tidak semua dimensi, efisiensi dalam desain, operasi, dan konsistensi, ini dicapai
dengan menggunakan dimensi serupa , yaitu menggunakan salah satu salinan dimensi
dibagi di seluruh bidang studi. Istilah "sesuai dimensi" berasal oleh Ralph Kimball .

Proses pemodelan dimensi [ sunting ]


Model dimensi dibangun pada skema bintang seperti ., dengan dimensi sekitar tabel
fakta [2] [3] Untuk membangun skema, model desain berikut digunakan:

1. Pilih proses bisnis


2. Menyatakan gandum

3. Mengidentifikasi dimensi

4. Mengidentifikasi fakta

Pilih proses bisnis


Proses pemodelan dimensi didasarkan pada metode desain 4-langkah yang membantu
untuk memastikan kegunaan dari model dimensi dan penggunaan data warehouse . Dasar-
dasar dalam desain membangun proses bisnis yang sebenarnya dimana data
warehouse harus mencakup. Oleh karena itu langkah pertama dalam model adalah untuk
menggambarkan proses bisnis yang model dibangun di atas. Ini bisa misalnya menjadi
situasi penjualan di toko ritel. Untuk menggambarkan proses bisnis, seseorang dapat
9

memilih untuk melakukan hal ini dalam teks biasa atau menggunakan dasar Business
Process Modeling Notation ( BPMN ) atau panduan desain lainnya seperti Unified Modeling
Language ( UML ).

Menyatakan gandum
Setelah menjelaskan Proses Bisnis, langkah berikutnya dalam desain adalah untuk
menyatakan butir model. Gandum dari model adalah deskripsi yang tepat dari apa yang
model dimensi harus berfokus pada. Ini bisa misalnya menjadi "Item baris individu pada slip
pelanggan dari toko ritel". Untuk memperjelas apa artinya gandum, Anda harus memilih
proses pusat dan menggambarkannya dengan satu kalimat. Selain itu biji-bijian (kalimat)
adalah apa yang Anda akan membangun dimensi dan tabel fakta dari. Anda mungkin
merasa perlu untuk kembali ke langkah ini untuk mengubah gandum karena informasi baru
yang diperoleh pada apa model Anda seharusnya dapat memberikan.

Mengidentifikasi dimensi
Langkah ketiga dalam proses desain adalah untuk menentukan dimensi model. Dimensi
harus didefinisikan dalam gandum dari langkah kedua dari proses 4-langkah. Dimensi
adalah dasar dari tabel fakta, dan mana data untuk tabel fakta dikumpulkan. Biasanya
dimensi benda seperti tanggal, toko, persediaan dll Dimensi ini adalah di mana semua data
disimpan. Misalnya, dimensi tanggal bisa berisi data seperti tahun, bulan dan hari kerja.

Mengidentifikasi fakta-fakta
Setelah mendefinisikan dimensi, langkah berikutnya dalam proses ini adalah untuk membuat
kunci untuk tabel fakta. Langkah ini adalah untuk mengidentifikasi fakta-fakta numerik yang
akan mengisi setiap baris tabel fakta. Langkah ini erat terkait dengan pengguna bisnis dari
sistem, karena ini adalah di mana mereka mendapatkan akses ke data yang tersimpan
dalam data warehouse . Oleh karena itu sebagian dari baris tabel fakta adalah numerik,
tokoh aditif seperti kuantitas atau biaya per unit, dll

Dimensi Normalisasi [ sunting ]


Normalisasi dimensi atau snowflaking menghilangkan atribut berlebihan, yang dikenal dalam
meratakan de-dinormalisasi dimensi normal. Dimensi secara ketat bergabung bersama
dalam sub dimensi.

Snowflaking memiliki pengaruh pada struktur data yang berbeda dari banyak filosofi dari
gudang data. [3] Data Tunggal tabel (fakta) yang dikelilingi oleh beberapa deskriptif (dimensi)
tabel
[4]
Pengembang sering tidak menormalkan dimensi karena beberapa alasan:

1. Normalisasi membuat struktur data yang lebih kompleks


2. Kinerja dapat lebih lambat, karena banyak bergabung antara tabel

3. Penghematan space minimal

4. Indeks bitmap tidak dapat digunakan

5. Kinerja Query, database 3NF menderita masalah kinerja ketika menggabungkan


atau mengambil banyak nilai dimensi yang mungkin memerlukan analisis. Jika Anda
hanya akan melakukan laporan operasional maka Anda mungkin dapat bertahan
10

dengan 3NF karena pengguna operasional Anda akan mencari data yang sangat
halus butir.

Ada beberapa argumen tentang mengapa normalisasi dapat berguna. [3] Hal ini dapat
menjadi keuntungan ketika bagian dari hirarki umum untuk lebih dari satu dimensi. Misalnya,
dimensi geografis mungkin digunakan kembali karena kedua pelanggan dan pemasok
dimensi menggunakannya.

Manfaat pemodelan dimensi [ sunting ]


[5]
Manfaat dari pemodelan dimensi adalah sebagai berikut:

 Dimengerti - Dibandingkan dengan model normalisasi, model dimensi lebih mudah


untuk memahami dan lebih intuitif. Dalam model dimensi, informasi dikelompokkan ke
dalam kategori bisnis yang koheren atau dimensi, sehingga lebih mudah untuk
membaca dan menafsirkan. Kesederhanaan juga memungkinkan perangkat lunak untuk
menavigasi database efisien. Dalam model normalisasi, data dibagi menjadi banyak
entitas diskrit dan bahkan proses bisnis sederhana mungkin mengakibatkan puluhan
tabel bergabung bersama-sama dalam cara yang kompleks.
 Kinerja Query - model Dimensi lebih denormalized dan dioptimalkan untuk data
query, sementara model dinormalisasi berusaha untuk menghilangkan redudansi data
dan dioptimalkan untuk memuat transaksi dan memperbarui. Kerangka diprediksi dari
model dimensi memungkinkan database untuk membuat asumsi yang kuat tentang data
yang membantu dalam kinerja. Setiap dimensi merupakan entry point yang setara ke
dalam tabel fakta, dan struktur simetris ini memungkinkan penanganan yang efektif dari
query yang kompleks. Optimasi query untuk bergabung star database sederhana, dapat
diprediksi, dan terkendali.

 Perluasan - Model Dimensi yang extensible dan mudah menampung data baru yang
tak terduga. Tabel yang ada dapat diubah di tempat baik dengan hanya menambahkan
baris data baru ke dalam tabel atau mengeksekusi SQL mengubah perintah meja. Tidak
ada pertanyaan atau aplikasi lain yang duduk di atas Gudang perlu memprogram untuk
mengakomodasi perubahan.Query Lama dan aplikasi terus berjalan tanpa
menghasilkan hasil yang berbeda. Namun dalam model dinormalisasi setiap modifikasi
harus dipertimbangkan dengan hati-hati, karena ketergantungan yang kompleks antara
tabel database.

Pemodelan dimensi (DM) adalah nama dari teknik desain logis sering digunakan
untuk gudang data.Hal ini berbeda dari, dan kontras dengan, entitas-hubungan
pemodelan (ER). Artikel ini menunjukkan banyak perbedaan antara kedua teknik
dan menarik garis di pasir. DM adalah satu-satunya teknik yang layak untuk
database yang dirancang untuk mendukung permintaan pengguna akhir di gudang
data. ER sangat berguna untuk menangkap transaksi dan fase administrasi data
membangun data warehouse, tetapi harus dihindari untuk pengiriman end-user.
11

DM adalah teknik desain logis yang berusaha untuk menyajikan data dalam
kerangka intuitif standar yang memungkinkan untuk akses kinerja tinggi. Hal ini
inheren dimensi, dan menganut disiplin yang menggunakan model relasional
dengan beberapa pembatasan penting. Setiap model dimensi terdiri dari satu meja
dengan kunci multi, disebut tabel fakta, dan satu set meja kecil yang disebut tabel
dimensi. Setiap tabel dimensi memiliki satu bagian primary key yang sesuai persis
dengan salah satu komponen kunci multipart dalam tabel fakta. (Lihat Gambar 2.)
Karakteristik struktur "Bintang-seperti" ini sering disebut bintang
bergabung. Bintang Istilah bergabung tanggal kembali ke hari-hari awal database
relasional.

Sebuah tabel fakta, karena memiliki primary key multi bagian yang terdiri dari dua
atau lebih kunci asing, selalu mengungkapkan banyak-ke-banyak hubungan. Tabel
fakta yang paling berguna juga mengandung satu atau lebih tindakan numerik, atau
"fakta," yang terjadi untuk kombinasi tombol yang mendefinisikan setiap
record. Dalam Gambar 2, fakta-fakta Dolar Terjual, Unit Terjual, dan Dolar
Biaya. Fakta yang paling berguna dalam tabel fakta adalah numerik dan
aditif. Aditivitas sangat penting karena aplikasi data warehouse hampir tidak pernah
mengambil fakta catatan tabel tunggal, melainkan, mereka mengambil ratusan,
ribuan, atau bahkan jutaan catatan ini pada satu waktu, dan satu-satunya hal yang
berguna untuk dilakukan dengan begitu banyak catatan adalah untuk
menambahkan mereka up.

Tabel dimensi, sebaliknya, yang paling sering mengandung informasi deskriptif


tekstual. Atribut dimensi digunakan sebagai sumber sebagian besar kendala yang
menarik dalam query data warehouse, dan mereka hampir selalu sumber header
baris dalam SQL jawaban set. Dalam Gambar 2, kita membatasi pada produk
Lemon rasa melalui atribut Flavor dalam tabel Produk, dan promosi melalui Radio
atribut adtype dalam tabel Promosi. Ini harus jelas bahwa kekuatan database pada
Gambar 2 sebanding dengan kualitas dan kedalaman tabel dimensi.

Pesona desain database pada Gambar 2 adalah bahwa hal itu sangat dikenali oleh
pengguna akhir dalam bisnis tertentu. Saya telah mengamati ratusan kasus di mana
pengguna akhir segera setuju bahwa ini adalah "bisnis mereka."

Pembaca yang mengikuti pendekatan Kimball sering dapat melafalkan 4 keputusan


penting ketika merancang sebuah model dimensi: mengidentifikasi proses bisnis,
biji-bijian, dimensi dan fakta.Sementara ini terdengar sederhana, tim sering
tersandung pada langkah pertama. Mereka berjuang untuk mengartikulasikan
proses bisnis seperti itu adalah istilah yang tampaknya mengambil makna yang
berbeda tergantung pada konteksnya. Karena deklarasi proses bisnis adalah pasak
pertama di tanah ketika merancang sebuah model dimensi, kita ingin
menghilangkan kebingungan dalam konteks kita.

Pertama, mari kita mulai dengan membahas apa proses bisnis tidak. Ketika
merancang sebuah model dimensi, proses bisnis tidak mengacu pada departemen
bisnis, organisasi atau fungsi.Demikian juga, tidak harus mengacu pada satu
laporan atau analisis spesifik.
12

Untuk pembuat model dimensi, proses bisnis adalah suatu peristiwa atau kegiatan
yang menghasilkan atau mengumpulkan metrik. Metrik ini pengukuran kinerja bagi
organisasi. Analis bisnis pasti ingin meneliti dan mengevaluasi metrik ini dengan
kombinasi tampaknya tak terbatas dari filter dan kendala. Sebagai pemodel
dimensi, itu tugas kita untuk menyajikan metrik ini dalam struktur yang mudah
untuk memahami bahwa merespon dengan cepat untuk pertanyaan tak terduga.

Ketika mengidentifikasi proses bisnis untuk pemodelan dimensi, karakteristik dan


pola umum yang sering muncul.

1. Proses bisnis biasanya didukung oleh sistem operasional. Sebagai contoh,


proses bisnis penagihan didukung oleh sistem penagihan, juga untuk
pembelian, pemesanan, atau menerima proses bisnis.
2. Proses bisnis menghasilkan atau mengumpulkan pengukuran unik dengan
granularity yang unik dan dimensi yang digunakan untuk mengukur kinerja
organisasi. Kadang-kadang metrik adalah akibat langsung dari proses
bisnis. Lain kali, pengukuran adalah derivasi. Apapun, proses bisnis
memberikan metrik kinerja yang digunakan oleh berbagai proses
analitik.Sebagai contoh, proses bisnis penjualan pemesanan mendukung
banyak laporan dan analisis, seperti analisis pelanggan, kinerja penjualan
rep, dan sebagainya.

3. Proses bisnis sering dinyatakan sebagai kata kerja dengan dimensi


diasosiasikan sebagai nomina menjelaskan siapa, apa, di mana, kapan,
mengapa dan bagaimana berhubungan dengan proses. Sebagai contoh,
hasil proses bisnis penagihan akan diiris-dan-potong dadu dan dianalisis
berdasarkan tanggal, pelanggan, layanan / produk, dan sebagainya.

4. Proses bisnis biasanya dipicu oleh input dan hasil output yang perlu
dipantau. Misalnya, proposal yang diterima adalah masukan untuk proses
pemesanan yang menghasilkan order penjualan dan metrik terkait. Dalam
skenario ini, proses bisnis penjualan pemesanan, Anda akan memiliki tabel
fakta pesanan dengan pesanan penjualan sebagai dimensi merosot
potensial dan jumlah pesanan dan dianggap sebagai fakta. Cobalah untuk
membayangkan aliran umum dari input ke dalam proses bisnis, sehingga
metrik output. Di kebanyakan organisasi, ada serangkaian proses bisnis di
mana output dari satu proses menjadi input ke yang berikutnya. Dalam
bahasa pembuat model dimensi, proses bisnis ini akan menghasilkan
serangkaian tabel fakta.

5. Analis kadang-kadang ingin mengebor di seluruh proses bisnis, melihat hasil


dari satu proses di samping hasil dari yang lain. Pengeboran seluruh proses
ini tentu layak jika dimensi umum untuk kedua proses yang sesuai.

BAB 2

LANDASAN TEORI
13

2.1 Teori-Teori Umum

2.1.1 Pengertian Data


Menurut Turban dan Rainer (2009:6), data adalah fakta

mentah atau deskripsi dasar dari benda, peristiwa, aktivitas, dan

transaksi yang didapatkan, direkam, disimpan, diklasifikasi tetapi belum

terorganisir untuk menyampaikan suatu arti spesifik.


Menurut Williams dan Sawyer (2011:25), data data terdiri dari

fakta-fakta, dan gambaran mentah yang akan diproses menjadi

informasi. Data penting karena pengguna memerlukan data untuk

membuat informasi yang berguna.


Menurut Indrajani (2011:48), data adalah fakta mentah tentang

orang, tempat, kejadian, dan apapun yang penting bagi perusahaan, di

mana data itu sendiri tidak memiliki arti dan data juga adalah fakta-

fakta atau observasi yang mentah, biasanya mengenai kejadian atau

transaksi bisnis.
Berdasarkan pengertian yang dijabarkan oleh para ahli diatas

dapat disimpulkan bahwa pengertian data adalah fakta atau observasi

mentah yang biasanya menggambarkan benda, peristiwa, aktivitas, dan

transaksi yang akan diproses menjadi informasi.

2.1.2 Pengertian Informasi


Menurut Turban dan Rainer (2009:6), informasi adalah suatu

koleksi fakta (data) yang telah terorganisir dengan beberapa cara

sehingga memberikan suatu arti yang dipahami oleh penerima.


Menurut Laudon dan Laudon (2010:14), informasi adalah data

yang telah disusun ke dalam bentuk yang memiliki arti dan berguna

bagi manusia.
Berdasarkan pengertian yang dijabarkan oleh para ahli diatas

dapat disimpulkan bahwa pengertian informasi adalah data yang telah


14

terorganisir atau disusun dalam beberapa cara sehingga memberikan

suatu arti yang mudah dipahami dan berguna bagi manusia.


2.1.3 Pengertian Sistem
Menurut O’Brien dan Marakas (2011:26), sistem didefinisikan

sebagai sekumpulan komponen yang saling terkait, dengan batas yang

jelas, bekerja sama untuk mencapai suatu serangkaian tujuan umum

dengan menerima input dan menghasilkan output dalam proses

transformasi yang terorganisir.


Menurut William dan Sawyer (2011:492), sistem adalah

kumpulan dari komponen-komponen yang berhubungan dan yang

saling berinteraksi untuk melakukan suatu tugas untuk mencapai tujuan.


Berdasarkan pengertian yang dijabarkan oleh para ahli diatas

dapat disimpulkan bahwa pengertian sistem adalah sekumpulan

komponen yang saling terkait dan saling berinteraksi dengan batas yang

jelas untuk melakukan suatu tugas guna mencapai suatu tujuan.

2.1.4 Pengertian Sistem Informasi


Menurut O’Brien dan Marakas (2011:4), Sistem Informasi (IS)

adalah kombinasi yang terorganisir dari orang, perangkat keras,

perangkat lunak, jaringan komunikasi, sumber daya data, dan kebijakan

dan prosedur yang menyimpan, mengambil, mengubah, dan

mendiseminasi informasi dalam sebuah organisasi. Orang-orang

bergantung pada sistem informasi modern untuk berkomunikasi dengan

satu sama lain menggunakan berbagai perangkat keras (hardware),

petunjuk prosedur pengolahan informasi (Perangkat lunak), jaringan

komunikasi, dan data yang disimpan (data sumber daya).


Menurut O’Brien dan Marakas (2011:6), ada tiga peran utama

dari aplikasi bisnis yang sistem informasi dapat lakukan dari sebuah

business enterprise, yaitu:


15

1. Mendukung proses bisnis dan operasi (support of business

processes and operations).


2. Mendukung pengambilan keputusan oleh karyawan dan manager

(support of decision making by employees and managers).


3. Mendukung strategi untuk keunggulan kompetitif (support of

strategies for competitive advantage).

Gambar 2.1 Tiga Peran Utama dari Aplikasi Bisnis Sistem

Informasi

(Sumber: O’Brien dan Marakas, 2011, p6)

2.1.5 Pengertian Database


Menurut Indrajani (2011:48), Database adalah sebuah

kumpulan data yang saling berhubungan secara logis, dan merupakan

sebuah penjelasan dari data tersebut, yang didesain untuk menemukan

data yang dibutuhkan oleh sebuah organisasi.


Menurut Connolly dan Begg (2010:65), Database adalah

kumpulan data secara logis terkait, dan deskripsi dari data ini, didesain

untuk memenuhi kebutuhan informasi sebuah organisasi. Database

adalah tunggal, tempat penyimpanan data yang besar yang dapat

digunakan secara bersama-sama oleh banyak departemen dan pengguna.


16

Menurut Cahyono (2009:83), dalam jurnalnya mengatakan

bahwa database adalah salah satu komponen sistem informasi yang

mempunyai posisi yang sangat menentukan dalam menunjang

keberhasilan suatu sistem informasi.


Berdasarkan pengertian yang dijabarkan oleh para ahli diatas

dapat disimpulkan bahwa pengertian database adalah kumpulan data

secara logis atau salah satu komponen yang saling berhubungan dan

deskripsi dari data ini didesain untuk memenuhi kebutuhan informasi

dan menunjang keberhasilan suatu sistem informasi dalam sebuah

organisasi.
2.1.6 DBMS (Database Management System)
Menurut Sreevani dan Rao (2010:56), dalam jurnalnya

mengatakan bahwa Database Management System (DBMS) tidak dapat

memberikan informasi yang diperlukan ketika datanya tidak konsisten.


2.1.6.1 Pengertian DBMS (Database Management System)
Menurut Connolly dan Begg (2010:66), Database

Management System adalah sebuah sistem software yang

memungkinkan pengguna untuk mendefinisikan, membuat,

memlihara, dan mengontrol akses ke database.


2.1.6.2 Keuntungan DBMS (Database Management System)
Keuntungan DBMS yang diuraikan Connolly dan

Begg (2010:77), adalah sebagai berikut:


1. Mengontrol pengulangan data.
2. Data yang konsisten.
3. Dapat memperoleh informasi yang lebih banyak dan

jumlah data yang sama.


4. Pemakaian data secara bersama-sama.
5. Meningkatkan integritas data.
6. Meningkatkan keamanan.
7. Penetapan standarisasi.
8. Perbandingan skala ekonomi.
9. Menyeimbangi konflik kebutuhan.
10. Meningkatkan akses dan respon dari data.
11. Meningkatkan produktifitas.
12. Meningkatkan pemeliharaan data melalui data independen.
17

13. Meningkatkan konkurensi.


14. Meningkatkan layanan backup dan recovery.
2.1.6.3 Kekurangan DBMS (Database Management System)
Kekurangan dari DBMS menurut Connolly dan Begg

(2010:80), adalah sebagai berikut:


1. Kompleksitas.
2. Ukuran yang besar karena kompleksitas yang terjadi.
3. Biaya DBMS yang beragam tergantung pada lingkungan

dan fungsi yang disediakan.


4. Tambahan biaya untuk hardware.
5. Biaya konversi yang dibutuhkan untuk penggunaan DBMS

yang baru.
6. Peforma kinerja menurun.
7. Tingkat kegagalan yang lebih besar.
2.1.6.4 Fasilitas DBMS (Database Management System)

Menurut Connolly dan Begg (2010:66), fasilitas-

fasilitas yang disediakan oleh DBMS adalah, sebagai berikut:

1. DDL (Data Definition Language) adalah suatu bahasa

yang memperbolehkan DBA (Database Administrator)

ataupun user untuk menentukan tipe, struktur, dan batasan

keamanan data yang akan disimpan pada database.


2. DML (Data Manipulation Language) adalah suatu bahasa

yang memiliki fasilitas untuk mengoperasikan data yang

ada dalam database. Misalnya insert, edit, delete, dan

update.
3. SQL (Structured Query Language) adalah suatu bahasa

yang memberikan layanan akses terhadap data. Contoh

dari layanan akses yang diberikan adalah :


 Sistem keamanan, yang mecegah pengguna yang tidak

memiliki hak untuk mengakses database.


 Sistem integritas, yang mempertahankan konsistensi

data yang tersimpan.


18

 Sistem kontrol konkurensi, yang memungkinkan untuk

mengakses database secara bersama-sama.


2.1.7 Pengertian Activity Diagram
Menurut Satzinger et al (2010:141), Activity diagram

merupakan sebuah tipe dari diagram workflow yang menggambarkan

tentang aktivitas dari pengguna ketika melakukan setiap kegiatan dan

aliran sekuensial.

Gambar 2.2 Activity Diagram


(Sumber: Satzinger et al, 2010, p143)

2.1.8 Pengertian ERD (Entity Relationship Diagram)


Menurut Inmon (2005:496), Entity Relationship Diagram

(ERD) adalah diagram yang menunjukkan semua entitas dalam cakupan

integrasi dan hubungan langsung antar entitas tersebut.


2.1.9 Pengertian Data Mart
Menurut Scheps (2008:208) Data Mart dapat menerima data

dari data warehouse, atau secara langsung dari sistem transaksional.

Data mart dapat menampilkan transformasi dan kalkulasi pada data

yang sama dengan data warehouse. Tapi data mart selalu terbatas pada

ruang lingkupnya dan tujuan bisnis.


19

Menurut Turban, Sharda, Delen dan King (2011:53), data

mart adalah subset dari data warehouse dan berfokus pada topik

tertentu atau departemen, yang biasanya terdiri dari suatu subyek

(misalnya pemasaran, operasi). Terdapat dua jenis data mart, antara

lain:
 Dependent Data Mart, adalah sebuah subset yang dibuat secara

langsung dari data warehouse. Memiliki keuntungan dari

penggunaan data model yang konsisten dan menyediakan kualitas

data.
 Independent Data Mart, adalah data mart yang mendukung konsep

dari single enterprise-wide data model, tetapi data warehouse harus

dibuat terlebih dahulu.


Berdasarkan pengertian yang dijabarkan oleh para ahli diatas

dapat disimpulkan bahwa pengertian data mart adalah subset dari data

warehouse atau data secara langsung dari sistem transaksional yang

berfokus pada topik tertentu atau departemen yang biasanya terdiri dari

suatu subyek (misalnya pemasaran).


2.1.10 Data Warehouse
2.1.10.1 Pengertian Data Warehouse
Menurut Turban, Sharda, Delen, dan King (2011:52),

data warehouse adalah kumpulan data yang dihasilkan untuk

mendukung pengambilan keputusan. Data warehouse juga

merupakan tempat penyimpanan data saat ini dan data historis

dari kepentingan manager diseluruh organisasi.


Menurut Laudon dan Laudon (2010:233), data

warehouse adalah database yang menyimpan data penting saat

ini dan historis dari kebutuhan informasi untuk manager

dalam perusahaan.
20

Berdasarkan pengertian yang dijabarkan oleh para

ahli diatas dapat disimpulkan bahwa pengertian data

warehouse adalah kumpulan data atau database yang

digunakan sebagai tempat penyimpanan data saat ini dan data

historis dari kebutuhan informasi untuk manager diseluruh

organisasi untuk mendukung pengambilan keputusan.


2.1.10.2 Karakteristik Data Warehouse
Karakteristik data warehouse terdiri dari subject

oriented, integrated, time variant, dan non volatile.

Karakteristik Data Warehouse menurut Turban, Sharda, Delen,

dan King (2011:52), antara lain:


1. Subject Oriented
Data tersusun berdasarkan subyek yang detil, seperti sales,

product, atau customers, hanya mengandung informasi

yang relevan untuk mengambil keputusan. Subject

Oriented tidak hanya dapat membantu user untuk

menentukan bagaimana proses bisinis mereka berjalan

tetapi juga membantu dalam menentukan mengapa proses

bisnis mereka berjalan.

2. Integrated
Integrasi berhubungan erat dengan subject orientation.

Data warehouse harus menempatkan data dari sumber

yang berbeda ke dalam format yang konsisten untuk

melakukannya, mereka harus menghadapi konflik

penamaan dan perbedaan di antara satuan ukuran.


3. Time Variant
Data warehouse menyimpan data historical. Data yang

tidak selalu memberikan status. Mereka mendeteksi tren,


21

penyimpangan dan hubungan jangka panjang untuk

melakukan peramalan dan perbandingan, yang mengarah

kepada pengambilan keputusan. Setiap data warehouse

mempunyai kualitas yang sementara. Waktu adalah satu-

satunya dimensi yang penting yang semua data warehouse

harus bisa mendukung.


4. Nonvolatile
Setelah data dimasukan ke dalam data warehouse , user

tidak bisa mengganti atau meng-update data. Data yang

lama dibuang dan perubahan data disimpan sebagai data

yang baru.
2.1.10.3 Lifecycle Diagram
Menurut Kimball dan Ross (2010:97), Lifecycle

Diagram adalah roadmap yang menggambarkan secara

keseluruhan dari urutan dari tugas yang dibutuhkan untuk

desain yang efektif, pengembangan, dan penyebaran.

Gambar 2.3 Lifecycle Diagram


(Sumber: Kimball dan Ross, 2010, p97)

2.1.10.3.1 Program/Project Planning and Management


22

Menurut Kimball dan Ross (2010:98), Kotak pertama

dari roadmap adalah berfokus pada peluncuran program atau

proyek, termasuk ruang lingkup, pembenaran, dan susunan

karyawan. Keseluruhan dari lifecycle, program dan tugas proyek

manajemen memastikan aktivitas tetap pada jalur yang benar.

2.1.10.3.2 Business Requirements

Menurut Kimball dan Ross (2010:98), Memilih

kebutuhan bisnis adalah tugas utama dalam Kimball Lifecycle

karena temuan ini mendorong sebagian besar keputusan

upstream dan downstream. Kebutuhan dikumpulkan untuk

menentukan faktor kunci yang mempengaruhi bisnis dengan

berfokus pada apa yang dilakukan oleh pengguna bisnis (atau

apa yang akan dilakukan di masa mendatang), daripada bertanya

“apa yang anda inginkan dalam data warehouse?” Kesempatan

utama di seluruh perusahaan diidentifikasi, diberikan prioritas

berdasarkan pada nilai bisnis dan kelayakan, kemudian rincian

kebutuhan dikumpulkan untuk iterasi pertama dari

pembangunan sistem DW/BI.

2.1.10.3.3 Technology Track

Menurut Kimball dan Ross (2010:98), Lingkungan

Data Warehouse atau Business Intelligence berintegrasi dalam

berbagai teknologi, menyimpan data, dan metadata yang terkait.

Jalur teknologi dimulai dengan mendesain sistem arsitektur

(Technical Architecture Design) untuk membuat daftar

kemampuan yang dibutuhkan, kemudian dilanjutkan dengan


23

pemilihan dan pemasangan produk yang memuaskan kebutuhan-

kebutuhan arsitektur (Product Selection & Installation).

2.1.10.3.4 Data Track

Menurut Kimball dan Ross (2010:98), data track

dimulai dengan merancang sebuah target dari model

dimensional (Dimensional Modeling) dalam memenuhi

kebutuhan bisnis, dengan tetap mempertimbangkan data yang

sebenarnya.

Dibawah ini terdapat 9 tahapan (nine step

methodology) untuk merancang dimensional modeling menurut

Kimball dan Ross (2010:210), adalah sebagai berikut:

1. Choose The Process (Pemilihan Proses)

Menurut Kimball dan Ross (2010:211), Dalam

tahap awal ini, proses yang dipilih lebih menunjuk pada

subyek yang ada dari sebuah bagian data mart. Data mart

yang akan dibangun harus tepat waktu yang berdasarkan

dengan anggapan dari menjawab semua pertanyaan bisnis

yang banyak diutarakan atau yang paling penting. Contoh

pemilihan terbaik untuk data mart adalah yang berhubungan

dengan sales, misalnya property sales, property leasing,

property advertising.

2. Choose The Grain (Pilih Grain)


Menurut Kimball dan Ross (2010:211), Dalam

tahap kedua ini, pemilihan grain berarti menentukan secara

tepat apa yang direpresentasikan oleh record pada tabel

fakta. Ketika dalam memilih grain untuk tabel fakta, maka


24

kita baru dapat mengidentifikasi dimensi dari tabel fakta

tersebut. Keputusan dalam pemilihan grain untuk tabel fakta

juga dapat menentukan grain untuk masing-masing tabel

dimensi. Contohnya, jika sumber dari sebuah tabel fakta

property sales adalah property sales individual maka sumber

dari sebuah dimensi pelanggan berisi rincian pelanggan yang

membeli property tersebut.


3. Identify and Conform The Dimensions (Identifikasi dan

Penyesuaian Dimensi)
Menurut Kimball dan Ross (2010:211), Dalam

tahap ketiga ini, dimensi membentuk konteks untuk bertanya

tentang fakta di dalam tabel fakta. Kumpulan dimensi yang

baik membuat data mart mudah dimengerti dan digunakan.

Jika ada dimensi yang digunakan pada dua data mart, maka

dimensi tersebut harus sama atau secara matematis salah

satunya harus merupakan bagian dari yang lainnya.


Hanya dengan cara ini, maka dua data mart dapat

saling berbagi satu atau lebih dimensi pada aplikasi yang

sama. Ketika dimensi digunakan pada lebih dari satu data

mart, maka data mart mengarah sebagai conformed.

Contohnya, dimensi dokter mendeskripsikan atribut ID,

nama dokter, alamat, kota, no telepon.


 Set dimensi yang dibangun dengan baik, memberikan

kemudahan untuk memahami dan menggunakan data

mart.
 Dimensi tersebut penting untuk menggambarkan fakta-

fakta yang terdapat pada tabel fakta.


25

 Contohnya, setiap data dokter pada tabel dimensi dokter

dilengkapi dengan id_dokter, no_dokter, gelar_dokter,

tempat_tinggal dan lain sebagainya.


 Jika ada dimensi yang muncul pada dua data mart, kedua

data mart tersebut harus berdimensi sama, atau paling

tidak salah satunya berupa subset matematis dari yang

lainnya.
 Jika sebuah dimensi digunakan pada dua data mart atau

lebih, dan dimensi ini tidak disinkronisasi, maka

keseluruhan data warehouse akan gagal, karena dua data

mart tidak dapat digunakan secara bersama-sama.


4. Choose The Fact (Pemilihan Fakta)
Menurut Kimball dan Ross (2010:213), Dalam

tahap keempat ini, Grain yang berasal dari tabel fakta

digunakan untuk menentukan fakta yang dapat digunakan.

Misalnya, grain dari tabel fakta adalah setiap property,

kemudian semua fakta numerik harus menunjuk pada

penjualan ini. Fakta-fakta tersebut harus numerik dapat dapat

ditambah.
 Sumber dari sebuah tabel fakta menentukan fakta mana

yang dapat digunakan dalam data mart.


 Semua fakta harus diekspresikan pada tingkat yang telah

ditentukan oleh sumber.


5. Store Precalculations in The Fact Table (Penyimpan Pre-

kalkulasi di Tabel Fakta)


Menurut Kimball dan Ross (2010:213), Dalam

tahap kelima ini, setelah melakukan pemilihan fakta-fakta,

maka akan dilakukan pengkajian ulang untuk menentukan

apakah ada fakta-fakta yang dapat diterapkan untuk pre-


26

calculation atau kalkulasi awal. Contohnya, kebutuhan untuk

penyimapan pre-calculation muncul ketika fakta berisi

pernyataan untung dan rugi. Situasi ini akan meningkat

ketika tabel fakta didasarkan pada invoice atau sales. Contoh

lainnya adalah saat membandingkan keuntungan dan

kerugian.
6. Round Out The Dimension Tables (Memastikan

Tabel Dimensi)
Menurut Kimball dan Ross (2010:214), Dalam

tahap keenam ini, untuk memastikan tabel dimensi dengan

menambahkan gambaran teks terhadap dimensi yang

memungkinkan. Gambaran teks harus mudah dimengerti dan

digunakan oleh user. Kegunaan suatu data mart ditentukan

oleh lingkup dan atribut tabel dimensi.


 Kita menambahkan gambaran teks atau keterangan

selengkap-lengkapnya pada tabel dimensi.


 Keterangannya harus bersifat intuitif dan mudah

dipahami oleh user.


7. Duration of The Database (Durasi Database)
Menurut Kimball dan Ross (2010:215), Dalam

tahap ketujuh ini, durasi tersebut digunakan untuk mengukur

sejauh mana tabel fakta dapat melihat ke beberapa tahun ke

belakang. Banyak perusahaan yang ingin melihat apa saja

yang terjadi pada periode waktu yang sama dalam satu

tahun, dua tahun, atau tiga tahun sebelumnnya. Untuk jenis

perusahaan tertentu, mereka ingin dapat melihat data hingga

lima tahun ke belakang. Tabel fakta yang besar

menimbulkan dua persoalan. Pertama, semakin tua umur


27

data, akan muncul masalah pembacaan dan interpretasi file

lama. Kedua, menimbulkan kemungkinan versi dimensi

lama digunakan, bukan versi terbarunya.


8. Determine The Need to Track Slowly Changing

Dimensions (Determinasi yang Perlu untuk Lacak

Perubahan dari Dimensi secara Perlahan)


Menurut Kimball dan Ross (2010:215), Dalam

tahap kedelapan ini, masalah perubahan dimensi secara

perlahan memiliki arti, contoh: deskripsi yang tepat pada old

client dan old branch harus digunakan sebagai history

transaksi sebelumnya. Perubahan dimensi ini dapat berubah

secara perlahan seiring berjalannya waktu dan kebutuhan.

Terdapat tiga tipe dasar perubahan secara perlahan untuk

mengamati perubahan dari dimensi pada dimensional table,

yaitu:
 Tipe 1, Atribut dimensi yang diubah dituliskan ulang.
 Tipe 2, Atribut dimensi yang diubah menyebabkan

pembentukan record yang baru.


 Tipe 3, Atribut dimensi yang diubah mengakibatkan

sebuah atribut atau kolom alternative dibuat, jadi antara

record yang lama dan baru diakses secara bersama-sama.


9. Decide The Physical Design (Menentukan Perancangan

Fisik)
Menurut Kimball dan Ross (2010:215), Dalam

tahap terakhir ini, dapat mempertimbangkan pengaruh dari

rancangan fisik, seperti penyortiran urutan tabel fakta pada

disk dan keberadaan dari penyimpanan awal ringkasan

(summaries) atau penjumlahan. Selain itu, masalah seperti


28

administrasi, summaries, kinerja indeks, dan keamanan juga

merupakan faktor yang harus diperhatikan.

Setelah itu, model dimensional diubah menjadi

kedalam rancangan fisik (Physical Design) saat strategi

penyesuaian kinerja dipertimbangkan, kemudian rancangan

dan pembangunan diekstrak, transformasi, dan load (ETL

Design and Development) ditangani.

2.1.10.3.5 Business Intelligence Track

Menurut Kimball dan Ross (2010:99), sementara

beberapa anggota proyek berkonsentrasi pada teknologi dan

data, anggota lain berfokus untuk mengidentifikasi dan

membangun aplikasi Business Intelligence dengan cakupan yang

besar, termasuk laporan-laporan standar query berparameter,

dashboards, scorecards, model-model analisis, dan aplikasi data

mining, bersamaan dengan navigasi interface yang

berhubungan.

2.1.10.3.6 Deployment, Maintenance, and Growth

Menurut Kimball dan Ross (2010:99), tiga lifecycle

track berada pada tahap deployment, membawa teknologi, data,

dan aplikasi Business Intelligence (BI) bersama-sama.

Deployment iteration memasuki tahap pemeliharaan, sedangkan

pertumbuhan ditujukan untuk perencanaan proyek dalam iterasi

selanjutnya dari sistem data warehouse atau Business

Intelligence (BI).
29

2.1.11 Dimensionality Modelling


Menurut Connolly dan Begg (2010:1227), Dimensionality

Modeling adalah sebuah teknik desain logika yang bertujuan untuk

menampilkan data dalam bentuk standar, intuitif yang memungkinkan

akses cepat.
Dimensionality Modeling menggunakan konsep model Entity-

Relationship (ER) dengan beberapa batasan penting. Setiap model

dimensi terdiri dari satu tabel dengan satu composite primary key yang

disebut fact table dan memiliki kumpulan dari tabel yang lebih

sederhana yang disebut tabel dimensi (Dimension Table). Tiap tabel

dimensi memiliki primary key (non composite) yang akan

berkorespondensi tepat satu dengan komponen pada composite key

dalam fact table.


2.1.11.1 Star Schema
Menurut Connolly dan Begg (2010:1227), star

schema adalah model data dimensional yang mempunyai fact

table di bagian tengah, dikelilingi oleh tabel dimensi yang

terdiri dari data reference (yang bisa di-denormalized). Star

schema mengambil karakteristik dari factual data yang di-

generate oleh event yang terjadi dimasa lampau.


30

Gambar 2.4 Contoh Star Schema


(Sumber: Connolly dan Begg, 2010, p1228)

2.1.11.2 Snowflake
Menurut Connolly dan Begg (2010:1229), Snowflake

adalah jenis dari star schema dimana tabel dimensinya tidak

mengandung denormalisasi.

Gambar 2.5 Contoh Snowflake


(Sumber: Connolly dan Begg, 2010, p1229)
2.1.11.3 Starflake
Menurut Connolly dan Begg (2010:1230), Starflake

adalah struktur gabungan yang mengandung campuran dari

star schema dan snowflake.


31

Berdasarkan dari kutipan pengertian ketiga schema diatas,

dapat disimpulkan bahwa tabel fakta pada star schema dikelilingi oleh

banyak dimensi dengan hubungan one-to-many, sedangkan pada

snowflake tabel fakta terhubung banyak ke tabel dimensi, yang dimana

dimensi tersebut dapat dihubungkan ke tabel dimensi lain, sedangkan

starflake schema merupakan gabungan antara star schema dengan

snowflake.

2.1.12 Extract, Transform, Loading Data (ETL)


Menurut Rainardi (2008), ETL adalah suatu proses mengambil

dan mengirim data dari sumber data ke data warehouse. Dalam proses

pengambilan data, data harus bersih agar didapat kualitas data yang

baik. Contohnya ada nomor telepon yang invalid, ada kode buku yang

tidak eksis lagi, ada beberapa data yang null, dan lain sebagainya.

Pendekatan tradisional pada proses ETL mengambil data dari data

sumber, meletakkan pada staging area, dan kemudian mentransformasi

dan meng-load ke data warehouse.


Proses ETL (Extract, Transform, Loading) terbagi menjadi 3,

yaitu:
1. Extract
Extract adalah proses penentuan source yang akan digunakan

sebagai sumber data bagi data warehouse. Di sini kita bias

menentukan data apa saja yang diperlukan, tabel apa saja yang

dijadikan sumber. Langkah pertama pada proses ETL adalah

mengekstrak data dari sumber-sumber data. Kebanyakan proyek

data warehouse menggabungkan data dari sumber-sumber yang

berbeda. Pada hakekatnya, proses ektraksi adalah proses penguraian,


32

pembersihan dari data diekstrak untuk mendapatkan struktur atau

pola data yang diharapkan.


2. Transform
Setelah source ditentukan, maka data tersebut diubah agar sesuai

dengan standard yang ada pada data warehouse. Tahapan

transformasi menggunakan serangkaian aturan atau fungsi untuk

mengekstrak data dari sumber dan selanjutnya dimasukkan dalam

data warehouse. Dibawah ini hal-hal yang dilakukan dalam tahapan

transformasi, yaitu:
a. Hanya memilih kolom tertentu saja untuk dimasukkan ke dalam

data warehouse.
b. Menterjemahkan nilai-nilai yang berupa kode, misalnya sumber

database menyimpan nilai 1 untuk laki-laki dan nilai 2 untuk

perempuan, tetapi data warehouse yang telah ada menyimpan A

untuk dewasa dan C untuk anak-anak, maka ini disebut juga

dengan automated data cleaning (tidak ada pembersihan secara

manual yang ditunjukkan selama proses ETL).


c. Melakukan perhitungan nilai-nilai baru seperti total = h_jual *

qty.
d. Mengkodekan nilai-nilai ke dalam bentuk bebas seperti

memetakan yang umurnya “65” ke kategori “D”.


e. Membuat ringkasan dari sekumpulan baris data seperti total

penjualan untuk setiap toko atau setiap bagian.


f. Menggabungkan data secara bersama-sama dari berbagai

sumber.
3. Load
Load adalah proses memasukkan data-data yang sudah di

transformasi ke dalam data warehouse untuk disimpan sebagai

summary atau archieve. Fase load merupakan tahapan yang

berfungsi untuk memasukkan data ke dalam target akhir, yang


33

biasanya ke dalam suatu data warehouse. Jangka waktu proses ini

tergantung pada kebutuhan organisasi. Beberapa data warehouse

dapat setiap minggu menulis keseluruhan informasi yang ada secara

kumulatif, data diubah, sementara data warehouse yang lain satau

bagian lain dari data warehouse yang sama dapat menambahkan

data baru dalam suatu bentuk historical, contohnya setiap jam.

Waktu dan jangkauan untuk mengganti atau menambah data

tergantung dari perancangan data warehouse pada waktu

menganalisis keperluan informasi.


2.1.13 Pengertian On-line Transaction Processing
Menurut Stair dan Reynolds (2010), OLTP adalah suatu

bentuk pengolahan data dimana setiap transaksi diproses dengan

segera, tanpa penundaan mengumpulkan transaksi ke dalam batch.

Memiliki karakteristik dengan jumlah data yang besar namun transaksi

yang dilakukan cukup sederhana seperti insert, update, dan delete. Hal

utama yang menjadi perhatian dari sistem yang dilakukan OLTP adalah

melakukan query secara cepat dan mudah untuk diperbaiki dan dapat

diakses.
2.1.14 OLAP (Online Analytical Processing)
2.1.14.1 Pengertian OLAP (Online Analytical Processing)
Menurut Turban, Sharda, Delen, dan King (2011:77)

struktur operasional utama dalam OLAP didasarkan pada

konsep yang disebut kubus (cube). Kubus (cube) didalam

OLAP adalah struktur data multidimensional (actual atau

virtual) yang memungkinkan analisis data yang cepat. Juga

dapat didefinisikan sebagai kemampuan dari memanipulasi

dan menganalisis data secara efisien dari berbagai perspektif.

Susunan data ke dalam kubus bertujuan untuk mengatasi


34

keterbatasan database relational. Database relational tidak

cocok untuk analisis yang cepat dan dekat dari sejumlah besar

data. Sebaliknya, mereka lebih cocok untuk memanipulasi

record (menambahkan, menghapus, dan memperbarui data)

yang mewakili serangkaian transaksi.


Menurut Scheps (2008:68) Online Analytical

Processing adalah sebuah konsep data multidimensional

dengan konsep mentualisasi data transaksional perusahaan.

Bukan hanya mengagregasi data, OLAP memberikan

kemampuan pada sistem BI untuk melihat data dengan cara

baru.

Gambar 2.6 Online Analytical Processing


(Sumber: Scheps, 2008, p69)
Berdasarkan pengertian yang dijabarkan oleh para

ahli diatas dapat disimpulkan bahwa pengertian Online

Analytical Processing (OLAP) adalah sebuah konsep data

multidimensional yang mendukung kegiatan mulai dari self


35

service reporting dan analisis data yang cepat dan efisien dari

berbagai perspektif.
2.1.14.2 Arsitektur OLAP
Menurut Scheps (2008:77), Sistem OLAP

mempunyai dua kategori, yaitu:


 OLAP Cube
Di lingkungan OLAP, cube adalah penyimpan

data terspesialisasi dirancang secara spesifik untuk

menangani data ringkasan multidimensional

(multidimentional summary data). Data cube disimpan di

cell dan strukturnya seperti 3D spreadsheet.

Gambar 2.7 Cube


(Sumber: Scheps, 2008, p77)

 OLAP Access Tools


Lingkungan client yang memungkinkan

pengguna untuk memanipulasi data cube dan akhirnya

menghasilkan Business Intelligence yang berarti dari

berbagai sudut pandang dan dapat lebih dari satu sudut

pandang.
2.1.15 Perbedaan OLAP dan OLTP
Menurut Vercellis (2009:49) terdapat perbedaan antara OLAP

dan OLTP, antara lain dapat dilihat pada tabel dibawah ini:
36

Tabel 2.1 Perbedaan antara OLTP dan OLAP


(Sumber: Vercellis, 2009, p49)

Karakteristik OLAP OLTP


Volatilitas Data statis Data dinamis
Waktu Data saat ini dan historis Data saat ini
Dimensi waktu Eksplisit dan varian Implisit dan terkini
Granuality Data agregasi dan Data yang detil

konsolidasi
Update Periodic dan regular Berlanjut dan tidak

regular
Aktivitas Tidak dapat diprediksi Berulang kali
Fleksibilitas Tinggi Rendah
Kinerja Rendah untuk query yang Tinggi, satu detik per

kompleks query
User Knowledge workers Karyawan
Fungsi Analisis Operasional
Tujuan Query kompleks dan Transaksi

penggunaan pendukung keputusan


Prioritas Fleksibilitas tinggi Kinerja tinggi
Metric Respon efektif Rata-rata transaksi
Ukuran data Gigabyte hingga terabyte Megabyte hingga

gigabyte

2.1.16 Pengertian Metadata


Menurut Kimball dan Ross (2010:566), Metadata adalah

semua informasi dalam lingkungan data warehouse yang bukan

merupakan data itu sendiri. Metadata ini hampir sama dengan sebuah

insiklopedia untuk data warehouse.


2.1.17 Data Mining
37

Menurut Han dan Kamber (2011:36), data mining adalah

proses menemukan pola yang menarik dan pengetahuan dari data yang

berjumlah besar.

Menurut Vercellis (2009:77), data mining adalah aktivitas

yang menggambarkan sebuah proses analisis yang terjadi secara iteratif

pada database yang besar, dengan tujuan mengekstrak informasi dan

knowledge yang akurat dan berpotensial berguna untuk knowledge

workers yang berhubungan dengan pengambilan keputusan dan

pemecahan masalah.

Aktivitas data mining dapat dipisahkan menjadi 2,

berdasarkan tujuan dari analisis yaitu:

 Interpretasi
Tujuan dari interpretasi adalah untuk mengetahui pola dari data dan

menghasilkannya dalam bentuk aturan dan kriteria yang dapat

dimengerti eksekutif.
 Prediksi
Tujuan dari prediksi adalah untuk mengestimasikan kejadian-

kejadian yang terjadi di masa depan. Contohnya, perusahaan retail

dapat menggunakan data mining untuk memprediksikan penjualan

dari produk mereka di masa depan dengan menggunakan data-data

yang telah didapatkan dari beberapa minggu.


Berdasarkan pengertian yang dijabarkan oleh para ahli diatas

dapat disimpulkan bahwa pengertian data mining adalah sebuah proses

analisis yang terjadi secara interatif dan menemukan pola yang menarik,

serta pengetahuan dari data yang berjumlah besar.


2.1.18 Pengertian Clustering
Menurut Han dan Kamber (2011), Clustering adalah proses

pengelompokkan kumpulan data menjadi beberapa kelompok sehingga


38

objek di dalam satu kelompok memiliki banyak kesamaan dan memiliki

banyak perbedaan dengan objek dikelompok lain. Perbedaan dan

persamaannya biasanya berdasarkan nilai atribut dari objek tersebut dan

dapat juga berupa perhitungan jarak. Clustering sendiri juga disebut

Unsupervised Classification, karena clustering lebih bersifat untuk

dipelajari dan diperhatikan. Cluster analysis merupakan proses partisi

satu set objek data ke dalam himpunan bagian. Setiap himpunan bagian

adalah cluster, sehingga objek yang di dalam cluster mirip satu sama

dengan yang lainnya, dan mempunyai perbedaan dengan objek dari

cluster yang lain. Partisi tidak dilakukan dengan manual tetapi dengan

algoritma clustering. Oleh karena itu, Clustering sangat berguna dan

bisa menemukan group yang tidak dikenal dalam data.

2.1.19 Business Intelligence


2.1.19.1 Pengertian Business Intelligence
Menurut Scheps (2008:11), Business Intelligence

adalah segala aktivitas, tool, atau proses yang digunakan untuk

mendapatkan informasi yang terbaik untuk mendukung proses

pembuatan keputusan.

Menurut Vercellis (2009:3), Business Intelligence

adalah kumpulan model metematika dan metodologi analisa

yang secara sistematik menghasilkan data untuk menghasilkan

suatu informasi dan pengetahuan yang berguna untuk

mendukung proses pengambilan keputusan yang kompleks.

Tujuan utama dari business intelligence adalah untuk


39

menyediakan alat dan metodologi bagi knowledge workers

untuk membuat keputusan yang efektif dan tepat waktu.

 Keputusan yang efektif


Aplikasi dari metode analisa yang butuh ketelitian tinggi

membuat pengambil keputusan harus mengandalkan

informasi dan pengetahuan mana yang dapat diandalkan.

Hasilnya, mereka dapat membuat keputusan yang lebih

baik dan membuat suatu perencanaan yang dapat membuat

tujuan mereka tercapai dengan efektif.


 Keputusan yang tepat waktu
Perusahaan beroperasi dalam lingkungan ekonomi yang

berkarakterisasi oleh tingkatan kompetisi dan dinamisme

yang tinggi. Konsekuensinya, kemampuan untuk bereaksi

dengan pesaing dan kondisi pasar baru merupakan faktor

penting dalam kesuksesan ataupun kelangsungan hidup

perusahaan.

Berdasarkan pengertian yang dijabarkan oleh para

ahli diatas dapat disimpulkan bahwa pengertian Business

Intelligence (BI) adalah kumpulan aktivitas, tool, atau proses

yang digunakan, dan metodologi analisa yang secara

sistematis dapat menghasilkan suatu informasi dan

pengetahuan yang berguna untuk mendukung proses

pembuatan keputusan yang kompleks.

2.1.19.2 Arsitektur Business Intelligence


Menurut Vercellis (2009:9), arsitektur dari sebuah

business intelligence system, terdiri dari enam komponen

utama yaitu:
1. Data sources
40

Pada tahap pertama, diperlukan suatu proses untuk

mengumpulkan dan mengintegrasikan data-data yang

disimpan dalam berbagai sumber yang bervariasi, yang

mana saling berbeda baik itu asal maupun jenisnya.

Sumber ini kebanyakan berasal dari data-data yang

terdapat pada operational systems, tetapi bisa juga berasal

dari dokumen yang tidak terstruktur seperti email dan data-

data yang dikirimkan oleh pihak luar.


2. Data warehouse dan data marts
Dengan menggunakan extraction dan transformation tools

yang dikenal sebagai ETL (extract, transform, load), data

yang berasal dari berbagai sumber yang berbeda disimpan

ke dalam database yang ditujukan untuk mendukung

analisis business intelligence. Database inilah yang

biasanya dikenal dengan sebutan data warehouse dan data

marts.
3. Data exploration
Pada level ketiga ini, tools-tools yang berfungsi untuk

keperluan analisis business intelligence pasif digunakan.

Tools-tools ini terdiri dari query dan reporting systems,

serta statistical methods. Metodologi ini bersifat pasif

karena para pengambil keputusan harus mengambil

keputusan berdasarkan hipotesa mereka sendiri atau

mendefinisikan kriteria dari data extraction, kemudian

menggunakan tools analisis untuk menemukan jawaban

dan mencocokkannya dengan hipotesa awal mereka.


4. Data mining
41

Level keempat ini terdiri dari sejumlah metodologi

business intelligence yang bersifat aktif yang tujuannya

adalah untuk mengekstrak informasi dan pengetahuan dari

data. Metodologi ini berisi sejumlah model matematika

untuk pengenalan pola, pembelajaran mesin, dan teknik

data mining. Tidak seperti tools yang digunakan pada level

sebelumnya, model dari business intelligence yang bersifat

aktif ini tidak mengharuskan para pengambil keputusan

untuk mengeluarkan hipotesa apapun.


5. Optimization
Pada level ini, solusi terbaik harus dipilih dari sekian

alternative yang ada, yang biasanya sangat banyak dan

beragam.
6. Decisions
Pada level terakhir ini yang menjadi persoalan utama

adalah bagaimana menentukan keputusan akhir yang akan

diambil yang dikenal sebagai decision making process.

Walaupun metodologi business intelligence berhasil

diterapkan, pilihan untuk mengambil sebuah keputusan ada

pada para pengambil keputusan. Pertimbangkan untuk

mengambil keputusan ini biasanya diambil juga dari

informasi yang tidak terstruktur serta tidak formal dan

memodifikasi rekomendasi serta kesimpula yang dicapai

melalui penggunaan model matematika.


42

Gambar 2.8 Komponen utama dari Business Intelligence


(Sumber: Vercellis, 2009, p9)
2.1.19.3 Siklus Hidup Business Intelligence
Menurut Vercellis (2009:12), ada 4 siklus hidup

business intelligence, yaitu :


1. Analysis
Saat fase analisis, sangat penting untuk mengenali masalah

luar maupun dalam. Pengambil keputusan harus membuat

representasi dari kejadian yang sedang dianalisis, dengan

mengidentifikasikan faktor penting yang paling relevan

dengan masalah.
2. Insight
Fase kedua membuat pengambil keputusan mengerti lebih

dalam mengenai masalah, biasanya dalam tingkatan

kausal. Sebagai contoh, jika analisis dalam fase pertama

menunjukkan bahwa banyak pelanggan yang tidak lagi

melanjutkan asuransi mereka, dalam fase kedua sangat

penting untuk mengidentifikasi profil dan karakteristik

yang dimiliki oleh pelanggan. Informasi yang didapat dari

fase pertama ditransformasikan kedalam fase kedua.


3. Decision
Saat fase ketiga, pengetahuan yang didapat dari fase kedua

diubah menjadi suatu keputusan yang akan diikuti dengan

ksi. Metodologi business intelligence memungkinkan fase


43

analisis dan pendalaman dieksekusi berkali-kali agar

keputusan yang efektif dan tepat waktu dalam dibuat untuk

memenuhi prioritas strategis suatu perusahaan.


4. Evaluation
Fase terakhir dari Business Intelligence meliputi

pengukuran kinerja dan evaluasi. Dengan menunjukkan

indikator kinerja yang dapat digunakan untuk

mengevaluasi kinerja dari perusahaan.

Gambar 2.9 Siklus Hidup Business Intelligence

(Sumber: Vercellis, 2009, p12)

2.1.19.4 Keuntungan Business Intelligence


Menurut Khan (2012:64) dalam jurnalnya

mengatakan bahwa sementara dunia bisnis berubah dengan

cepat dan proses bisnis menjadi lebih dan lebih kompleks

sehingga lebih sulit bagi manager untuk memiliki yang

komprehensif pemahaman lingkungan bisnis. Faktor

globalisasi, deregulasi, merger dan akuisisi, kompetisi dan

inovasi teknologi, telah memaksa perusahaan untuk

memikirkan kembali strategi bisnis mereka dan hanya

perubahan besar telah menggunakan teknik Business


44

Inteligence (BI) untuk membantu mereka memahami dan

mengendalikan proses bisnis untuk mendapatkan keuntungan

kompetitif. BI terutama digunakan untuk meningkatkan

ketepatan waktu dan kualitas informasi, dan memungkinkan

manager lebih memahami posisi perubahan mereka

dibandingkan dengan pesaing.


Aplikasi dan Teknologi BI ini membantu perusahaan

untuk menganalisis perubahan tren dalam pangsa pasar,

perubahan perilaku pelanggan dan pengeluaran pola,

preferensi pelanggan, kemampuan perusahaan dan kondisi

pasar. Hal ini digunakan untuk membantu analisis dan

manager menentukan penyesuaian yang paling mungkin untuk

merespon perubahan tren. Ia telah muncul sebagai sebuah

konsep untuk menganalisis data yang dikumpulkan dengan

tujuan untuk membantu unit pengambilan keputusan

mendapatkan pengetahuan yang lebih baik yang komprehensif

dari sebuah operasi, organisasi dan dengan demikian membuat

keputusan bisnis lebih baik.


2.1.19.5 Komponen Business Intelligence
Menurut Kapoor (2010:22) dalam jurnalnya

mengatakan bahwa komponen Business Intelligence terdiri

dari 4 (empat) sub-system, yaitu:


1. The Data Management sub-system
Mencakup komponen yang berkaitan dengan data

warehouse, data mart, dan Online Analytical Processing

(OLAP). Orang-orang yang bekerja terutama di daerah ini

adalah "teknologi", yang mengkhususkan diri dalam Ilmu


45

Komputer, Sistem Informasi Manajemen (MIS), atau

disiplin terkait.
2. The Advanced Analytics sub-system
Meliputi analisis fungsi berdasarkan statistik, data mining,

peramalan, pemodelan prediktif, analisis prediktif, dan

optimasi. Orang-orang yang bekerja terutama di daerah ini

adalah "Super User", yang mengkhususkan diri dalam

Matematika, Statistik, Ilmu Manajemen atau disiplin yang

terkait.
3. The Business Performance Management sub-system
Terdiri dari proses untuk tujuan strategis dan tujuan,

pengukuran kinerja dan mentoring, menganalisis kinerja

dan membuat keputusan untuk meningkatkan kinerja

bisnis.
4. The Information Delivery sub-system
Memberikan pengguna bisnis kemampuan untuk

mengakses laporan dan terus memantau kinerja organisasi

pada perusahaan dan tingkat yang lebih rendah. Menurut

perannya sebagai teknokrat, super user, manager

menengah, manager eksekutif, atau pengguna operasional,

ia akan diberi peran berbasis hak untuk mengakses laporan

yang relevan dalam ringkasan dan atau format rinci.

Pengguna akhir juga mampu memantau kegiatan kunci

seperti tren, metrik, dan KPI dalam mudah untuk

memahami desain, seperti portal informasi dikonfigurasi,

Scorecard dan dashboard. Tergantung pada peran individu

dan tanggung jawab, disajikan dengan tren, metrik, dan


46

KPI pada tingkat agregasi yang sesuai dengan keamanan

untuk memblokir non-hak istimewa item.


2.1.20 Dashboard
Menurut Scheps (2008:95) Dashboard merupakan keturunan

langsung dari EIS lama dan sistem DSS, dengan meningkatkan

fungsional dan penampilan. Karena mereka terhubung dengan sistem

data yang kuat dan memanfaatkan KPI.

Menurut Scheps (2008:97) terdapat tiga jenis dashboard yaitu:

 Tactical Dashboard
Mengukur produktivitas jangka pendek dan efektivitas. Hasilnya

sering digunakan oleh contributor individu.


 Operational Dashboard
Mengukur efektivitas jangka pendek dari fungsi bisnis yang

spesifikasi pada tim atau level unit bisnis. Level dashboard ini dapat

secara potensial dikembangkan untuk seorang knowledge worker

atau local team manager.


 Strategic Dashboard
Dibangun untuk level pengaturan kebijakan dari organisasi.

Dashboard menampilkan metric yang menggambarkan strategi dan

tujuan korporasi.
2.1.21 Management Reporting
Menurut Jan Barned (2011:4), dalam jurnalnya mengatakan

bahwa pengertian dari Management Reporting adalah suatu pelaporan

yang bertujuan untuk memberikan informasi yang berguna secara

berkala kepada pemilik perusahaan dalam pengambilan keputusan.


Dalam Management Financial Framework (2012:1),

Pengertian Management Reporting adalah proses penyediaan informasi

kepada lembaga manajemen dengan tepat waktu, akurat dan relevan

yang dirancang untuk membantu dalam strategis dan operasional

perusahaan. Karena Management Reporting yang efektif sangat penting


47

untuk manajemen dalam membuat keputusan yang tepat, efisien, dan

efektif. Dibawah ini manfaat bagi lembaga manajemen dengan

menggunakan management reporting yang tepat waktu dan efektif,

adalah sebagai berikut:


- Meningkatkan proses pengambilan keputusan.
- Meningkatkan efektivitas manajemen.
- Penggunaan sumber daya dalam proses pengiriman jasa menjadi

lebih efisien.
- Meningkatkan keyakinan dalam kualitas keputusan manajemen oleh

staf lembaga.
- Meningkatkan responsivitas terhadap isu-isu yang muncul

Pengembangan struktur dan format dari management reporting

merupakan elemen yang mendasar dalam menyediakan informasi

kepada lembaga dan staf manajemen dengan tepat, akurat dan tepat

waktu. Misalnya, laporan diberikan kepada manajemen senior biasanya

mengenai summary laporan tentang berbagai aspek operasional.

Laporan-laporan ini akan didukung dengan fungsi drill-down yang

memungkinkan untuk ulasan transaksional bagi manajemen apabila

diperlukan. Reporting diberikan kepada manajemen lini dan staf

umumnya akan menyediakan laporan lebih bertarget dan transaksional

pada fungsi instansi dari laporan manajemen tingkat yang lebih tinggi.

2.2 Teori-Teori Khusus


2.2.1 Instruktur
Menurut Hamalik (2007:144), instruktur (pelatih) adalah

tenaga kependidikan yang bertugas dan berfungsi melaksanakan

pendidikan dan pelatihan.

Menurut Hamalik (2007: 145-147), instruktur memiliki

peranan-peranan tertentu yang meliputi:


48

1. Peranan sebagai pengajar; instruktur berperan menyampaikan

pengetahuan dengan menyajikan berbagai informasi yang

diperlukan berupa konsep-konsep, fakta, dan informasi yang dapat

memperkaya wawasan pengetahuan para peserta pelatihan dengan

cara melibatkan mereka secara aktif untuk mencari pengetahuan

sendiri yang mereka butuhkan.


2. Peranan sebagai pemimpin kelas; instruktur berperan sebagai

pemimpin kelas secara keseluruhan sehingga dari peranannya itu

pelatih perlu menyusun perencanaan, pelaksanaan, pengawasan, dan

penilaian selama berlangsungnya proses pembelajaran.


3. Peranan sebagai pembimbing; instruktur perlu memberikan bantuan

dan pertolongan bagi peseta pelatihan yang mengalami kesulitan

dalam proses pembelajaran/pelatihan yang pada akhirnya

mengarahkan peserta lebih aktif dan mandiri. Bentuk bimbingannya

dapat berupa mengarahkan, memotivasi, membantu memecahkan

masalah dan lain-lain.


4. Peranan sebagai fasilitator; instruktur berperan menciptakan

kondisi lingkungan pelatihan agar peserta pelatihan belajar aktif

sehingga proses pembelajaran menjadi efektif.


5. Peranan sebagai peserta aktif; instruktur dapat berperan serta

sebagai peserta aktif dalam kegiatan diskusi dengan cara

memberikan informasi, mengarahkan pemikiran, menunjukkan

jalan pemecahan (problem solving), dan sumber-sumber yang

diperlukan.
6. Peranan sebagai pengawas; pelatih harus melakukan pengawasan

secara terus menerus agar proses pelatihan senantiasa terarah,

kendala-kendala yang dihadapi peseta pelatihan segera tertangani,


49

disiplin kelas dapat dibina dengan baik dan ketertiban kelas

terjaga.
7. Peranan sebagai motivator; instruktur perlu secara berkelanjutan

menggerakkan motivasi belajar peserta pelatihan supaya kegiatan

belajarnya lebih aktif.


8. Peranan sebagai evaluator; instruktur berperan melakukan

penilaian pada pra-proses-akhir pelatihan melalui tes, petanyaan

lisan, pengamatan dan lain-lain agar peserta pelatihan mengetahui

kemajuan belajarnya, mengetahui kesulitan belajarnya dan

membantunya dengan bimbingan.


9. Peranan sebagai konselor; instruktur dapat berperan memberikan

penyuluhan tentang kesulitan pribadi dan sosial peserta pelatihan.


10. Peranan sebagai penyidik sikap dan nilai; sistem nilai yang

dijadikan panutan dan sikap hidup bagi semua peserta pelatihan,

mengingat semuanya akan didayagunakan sebagai tenaga kerja

yang melayani masyarakat dan dibina sesuai dengan tuntutan

lapangan pekerjaan.
2.2.2 Pengertian Penilaian
Menurut Ahyan (2011), dalam artikelnya mengatakan bahwa

penilaian adalah suatu pernyataan berdasarkan sejumlah fakta untuk

menjelskan karakteristik seseorang atau sesuatu. Menilai pada

hakikatnya adalah mengambil suatu keputusan terhadap sesuatu dengan

ukuran baik atau buruk, sehat atau sakit, panjang atau pendek, pandai

atau bodoh, dan lain sebagainya, dimana keputusan itu diambil

berdasarkan apakah sesuai atau tidak sesuai dengan kriteria yang

ditentukan. Penilaian itu sendiri bersifat kualitatif.


2.2.3 Pengertian Kinerja
Menurut Yohana (2012:133), dalam jurnalnya mengatakan

bahwa pengertian kinerja mengarah pada suatu upaya pencapaian


50

prestasi kerja yang lebih baik maka keberhasilan dalam melakukan

suatu pekerjaan sangat ditentukan oleh kinerja.


2.2.4 Pengertian Evaluasi
Menurut Sudijono (2010:1), Evaluasi adalah suatu tindakan

atau suatu proses untuk menentukan nilai dari sesuatu.


Menurut Arikunto (2010:3), Evaluasi merupakan sebuah

proses pengumpulan data untuk menentukan sejauh mana, dalam hal

apa, dan bagian mana tujuan pendidikan sudah tercapai.


Berdasarkan pengertian yang dijabarkan oleh para ahli diatas

dapat disimpulkan bahwa pengertian evaluasi adalah suatu tindakan

atau suatu proses pengumpulan data untuk menentukan nilai dari

sesuatu seperti menentukan sejauh mana, dalam hal apa, dan bagian

mana tujuan pendidikan sudah tercapai.


2.2.5 Pengertian Sertifikasi
Menurut Syafarudin (2008:33), Sertifikasi guru dapat diartikan

sebagai suatu proses pemberian pengakuan bahwa seseorang telah

memiliki kompetensi untuk melaksanakan pelayanan pendidikan pada

satuan pendidikan tertentu, setelah lulus uji kompetensi yang

diselenggarakan oleh lembaga sertifikasi.

Anda mungkin juga menyukai