Anda di halaman 1dari 5

PERANCANGAN DATA WAREHOUSE dan

DASHBOARD PT XYZ
Agus Susanto, Dewa Bagus
Magister Teknik Informatika
Universitas Bina Nusantara

Abstrak— Kontraktor adalah perusahaan yang melakukan menyediakan informasi signifikan mengenai data kontrak
kontrak kerja dengan orang atau pemerintah atau perusahaan project pada PT.XYZ yang dapat dilihat dari sudut pandang
lain untuk memasok barang atau menyelesaikan jasa tertentu. berbeda. Perancangan data warehouse ini dilakukan untuk
PT. XYZ memiliki data kontrak proyek yang sangat banyak membantu organisasi untuk menganalisis informasi sesuai
dan masih belum diolah menjadi suatu informasi. Untuk kebutuhan dan memudahkan pihak terkait dalam
memudahkan karyawan PT. XYZ dalam menganalisa dan pengambilan keputusan.
mengevaluasi project-project yang sudah berlalu ataupun yang
akan datang dibutuhkan Data Warehouse. Tujuan dari II. DATA WAREHOUSE
penelitian ini adalah merancang dan menganalisa data
warehouse yang dibutuhkan dalam penyediaan informasi A. Data Warehouse
mengenai data kontrak project pada PT. XYZ. metode Menurut Inmon dan Richard D.H (1994) data warehouse
perancangan data warehouse menggunakan 4 tahapan (Four- adalah koleksi data yang mempunyai sifat berorientasi
Step Methodology) yang diusulkan oleh Ralph Kimball dalam subjek, terintegrasi, time-variant, dan bersifat tetap dari
merancang sistem data warehouse. Hasil akhir yang akan kumpulan data dalam mendukung proses pengambilan
dicapai adalah perancangan data warehouse dan dashboard
keputusan manajemen
adalah visualisasi yang akan menyediakan informasi signifikan
mengenai data kontrak project pada PT.XYZ yang dapat Menurut Vidette Poe (1997), data warehouse merupakan
dilihat dari sudut pandang berbeda dan memudahkan pihak database yang bersifat analisis dan read only yang digunakan
terkait dalam pengambilan keputusan. Kata Kunci: data sebagai fondasi dari sistem penunjang keputusan.
warehouse, dashboard, Kimball Methodology, Pentaho, ETL.
Menurut Paul Lane (2002), data warehouse merupakan
I. PENDAHULUAN database relasional yang didesain lebih kepada query dan
analisis daripada proses transaksi, biasanya mengandung
Kontraktor adalah perusahaan yang melakukan kontrak history data dari proses transaksi dan bisa juga data dari
kerja dengan orang atau pemerintah atau perusahaan lain sumber lainnya..
untuk memasok barang atau menyelesaikan jasa tertentu.
Bidang kerjanya mungkin pembangunan gedung, pembuatan B. Konsep ETL (Extract Transform Load)
jalan raya, pembangunan instalasi listrik, dan penyediaan ETL adalah kumpulan proses menyiapkan data
ribuan generator. Dalam prakteknya, sebuah perusahaan dari operational source. Proses ini terdiri dari Extraction,
kontraktor tidak menyelesaikan pekerjaan proyek tersebut Transformation, Loading, dan beberapa proses yang
secara sendirian. Bahkan, bila nilai proyeknya besar, dilakukan sebelum dipublikasikan ke dalam data warehouse.
kontraktor tersebut mencari puluhan atau ratusan kontraktor Jadi, ETL atau extract, transform, loading adalah fase
lain untuk menyelesaikan proyek. pemrosesan data dari sumber data masuk ke dalam data
PT. XYZ adalah salah satu kontraktor yang berlokasi di warehouse. Tujuan ETL adalah mengumpulkan, menyaring,
Jakarta yang bergerak di bidang Mekanikal, Elektrikal dan mengolah dan menggabungkan data-data yang relevan dari
Teknologi. PT. XYZ memiliki data kontrak proyek yang berbagai sumber untuk disimpan ke dalam data warehouse.
sangat banyak dan masih belum diolah menjadi suatu ETL juga dapat digunakan untuk mengintegrasikan data.
informasi. Untuk memudahkan karyawan PT. XYZ dalam
menganalisa dan mengevaluasi project-project yang sudah
berlalu ataupun yang akan datang dibutuhkan Data
Warehouse.
Data Warehouse merupakan basis data yang dirancang
untuk mengerjakan proses query, membuat laporan dan
analisa. Data yang disimpan dalam sebuah Data Warehouse
adalah data histori dari sebuah organisasi atau perusahaan
yang mana data tersebut tidak tersimpan secara rincil. Data
Warehouse berbeda dengan data OLTP (Online
Transactional Processing) yang tersimpan sampai prosesnya
berlangsung secara lengkap.
Tujuan dari penelitian ini adalah merancang dan
menganalisa data warehouse yang dibutuhkan dalam
penyediaan informasi mengenai data kontrak project pada
PT. XYZ. Untuk metode perancangan data warehouse
menggunakan 4 tahapan (Four-Step Methodology) yang Gambar 1 konsep ETL
diusulkan oleh Ralph Kimball dalam merancang sistem data
warehouse.
Hasil akhir yang akan dicapai adalah perancangan data Dengan sistem yang sudah ada sebelumnya. Hasil dari
warehouse dan dashboard sebagai visualisasi yang akan proses ETL adalah dihasilkannya data yang memenuhi
kriteria data warehouse seperti data historis, terpadu,
terangkum, statis dan memiliki struktur yang dirancang untuk C. Pentaho
keperluan proses analisis. Proses ETL terdiri dari tiga tahap, Pentaho Kettle merupakan perangkat lunak (software)
yaitu : open source yang dikeluarkan oleh Pentaho. Aplikasi-
Extract aplikasi Pentaho dikembangkan oleh Pentaho corp yang
berpusat di Orlando Amerika Serikat. Software Pentaho
Langkah pertama dari proses ETL adalah proses Kettle dapat digunakan sebagai tools untuk mengintegrasikan
penarikan data dari satu atau lebih sistem operasional sebagai data. Pentaho Kettle menyediakan fasilitas untuk melakukan
sumber data (bisa diambil dari sistem OLTP, tapi bisa juga proses ETL (Extraction, Transformation dan Loading)
dari sumber data di luar sistem database). Kebanyakan (Wibisono, 2012).
proyek data warehouse menggabungkan data dari sumber-
sumber yang berbeda. Pada hakikatnya, proses ekstraksi Elemen utama dari Pentaho Kettle adalah Tranformation
adalah proses penguraian dan pembersihan data yang dan Job. Transformation merupakan sekumpulan instruksi
diekstrak untuk mendapatkan suatu pola atau struktur data untuk merubah input menjadi output yang diinginkan.
yang diinginkan. Terdapat beberapa fungsi ekstraksi data, Sedangkan Job adalah kumpulan instruksi untuk
yaitu : menjalankan transformasi. Terdapat tiga komponen utama
dalam Pentaho Kettle yaitu, Spoon, Pan dan Kitchen. Spoon
● Ekstraksi data secara otomatis dari aplikasi sumber. merupakan user interface untuk membuat Job dan
● Penyaringan atau seleksi data hasil ekstraksi. Tranformation. Pan adalah tools yang berfungsi membaca,
merubah dan menulis data, dan Kitchen adalah program yang
● Pengiriman data dari berbagai platform aplikasi ke mengeksekusi job.
sumber data.
● Perubahan format layout data dari format aslinya.
III. ANALISIS DAN PERANCANGAN DATA
● Penyimpanan dalam file sementara untuk WAREHOUSE
penggabungan dengan hasil ekstraksi dari sumber
lain. Before you begin to format your paper.

Transformation A. Analisis Data


Sumber data yang digunakan dalam penelitian ini adalah
Proses transformasi data merupakan proses mengubah
database PT XYZ. Dalam database yang ada berisi informasi
data dari format operasional menjadi format data warehouse.
mengenai informasi kontrak proyek termasuk data besaran
Proses transformasi berupa tugas-tugas seperti mengkonversi
proyek. Dengan data tersebut metode perancangan data
tipe data, melakukan beberapa perhitungan, penyaringan data
warehouse yang digunakan dalam penelitian ini
yang tidak relevan, dan meringkasnya. Proses transformasi
menggunakan metode Nine-Step Methodology (Kimball,
dibutuhkan untuk memenuhi kebutuhan bisnis suatu
2002). Sembilan langkah tersebut yaitu :
perusahaan. Langkah-langkah dalam transformasi data
adalah sebagai berikut : 1. Choosing the process
● Memetakan data input dari skema data aslinya ke 2. Choosing the grain
skema data warehouse. 3. Identifying and Conforming The Dimensions
4. Choosing The Fact
● Melakukan konversi tipe data atau format data. 5. Storing Pre-Calculation in The Fact Table
● Pembersihan serta pembuangan duplikasi dan 6. Rounding Out The Dimension Tables
kesalahan data. 7. Choosing The Duration of Database
● Penghitungan nilai-nilai derivat atau mula-mula. 8. Tracking Slowly Changing Dimension
● Penghitungan nilai-nilai agregat atau rangkuman. 9. Deciding The Query Priorities and The Query
Models
● Pemeriksaan integritas referensi data.
● Pengisian nilai-nilai kosong dengan nilai default. B. Perancangan Data Warehouse
● Penggabungan data. ● Choosing The Process (Memilih Proses)
Proses bisnis yang terjadi dalam PT. XYZ
Loading meliputi:
Fase load merupakan tahapan yang berfungsi untuk 1. Input data/pendaftaran Customer
memasukkan data ke dalam target akhir, yaitu ke dalam suatu 2. Kontrak project customer
data warehouse. Waktu dan jangkauan untuk mengganti atau 3. Kategori project
menambah data tergantung pada perancangan data 4. Nilai project
warehouse pada waktu menganalisa keperluan informasi. 5. Durasi project
Fase load berinteraksi dengan suatu database, constraint
didefinisikan dalam skema database sebagai suatu trigger
yang diaktifkan pada waktu melakukan load data (contohnya
: uniqueness,referential, integrity, mandatory fields), yang
juga berkontribusi untuk keseluruhan tampilan dan kualitas
data dari proses ETL.
● Choosing The Grain ( Memilih Grain)
Proses ini dilakukan setelah diketahui
proses bisnis yang terjadi. Grain ini nantinya akan
dijadikan sebagai fact table dalam Data Warehouse.
Berdasarkan proses bisnis yang telah didefinisikan,
grain yang dihasilkan meliputi, nama project, besar
nilai project, durasi project

● Identifying and Confirming The Dimensions


(Mengidentifikasi dan Penyesuaian Dimensi)
Langkah ketiga dalam perancangan Data
Warehouse yaitu identifikasi dimensi yang
berhubungan dengan tabel fakta. Dari hasil
identifikasi maka dapat ditentukan dimensi yang
terlibat meliputi:
1. Dimensi Customer,
2. Dimensi kategori,
3. Dimensi durasi,
4. Dimensi date,
Gambar 3 Star Scheme

● Choosing The Fact (Memilih Fakta) ● Choosing The Duration of Database (Pemilihan
Durasi Database)
Langkah berikutnya adalah memilih fact
table berdasarkan pemilihan grain sebelumnya. Tabel Dalam perancangan Data Warehouse
fakta yang didapat dari analisis adalah fact project. perpustakaan ini durasi waktu yang digunakan
Ilustrasinya terdapat pada start schema berikut selama 3 tahun. Data yang disimpan dalam Data
Warehouse ini nanti adalah data 3 tahun terakhir.

IV. IMPLEMENTASI DATA WAREHOUSE

A. Implementasi ETL dengan Pentaho


Dalam proses ETL data diekstrak dari basis data
operasional, kemudian ketiga basis data tersebut di
transformasi untuk mendapatkan format yang sesuai dengan
struktur data yang terdapat di dalam data warehouse. Data
yang terdapat di dalam basis data akan diserap secara berkala
ke dalam data warehouse. Berikut ini adalah tahapan yang
digunakan pada proses ETL dengan menggunakan perangkat
lunak Pentaho Data Integration
Pentaho Data Integration (PDI) merupakan perangkat
lunak open source yang digunakan untuk melakukan proses
Integrasi data. Keuntungan yang dimiliki PDI yaitu
Gambar 2 ERD
1. Memiliki koleksi tahap transformasi yang cukup
banyak,
2. Modulnya mudah untuk digunakan dalam
perancangan data warehouse
● Storing Pre-Calculation in The Fact Table 3. Memiliki kinerja dan skalabilitas yang baik, serta
(Menyimpan pre-Calculation dalam Tabel Fakta) 4. Dapat dikembangkan dengan berbagai plugin
Agregasi pada tabel fakta project adalah tambahan.
customer, kategori, durasi, kontrak, nilai project, Berikut adalah contoh tahapan ETL yang digunakan
nama project. dalam proses ektraksi, transformasi dan pemindahan data dari
● Rounding Out The Dimension Tables (Melengkapi basis data operasional ke dalam data warehouse
Tabel Dimensi)
Tabel Dimensi pada perancangan ini yaitu :
Gambar 8 Proses ETL FactProject

Gambar 4 Proses ETL DimCustomer B. Implementasi Dashboard dengan Qlik


Dashboard adalah salah satu jenis visualisasi yang
merupakan alat komunikasi modern. Tujuan utama dari
visualisasi data adalah untuk mengkomunikasikan informasi
secara jelas dan efisien kepada penggunanya melalui grafik
informasi yang dipilih, seperti tabel tabel atau grafik.
Visualisasi yang efektif membantu penggunanya dalam
menganalisis dan penalaran tentang data dan bukti, sehingga
data yang kompleks menjadi mudah dipahami dan berguna.
Perancangan Dashboard bertujuan untuk merepresentasikan
atau memvisualisasikan data yang terdapat di dalam data
warehouse agar mudah untuk dimengerti sehingga membantu
Gambar 5 Proses ETL DimKategori pihak manajemen untuk melakukan analisis data. Dashboard
visualisasi dilakukan menggunakan tools Qlik Sense.
Visualisasi pada data warehouse dikelompokkan menjadi 1
halaman untuk memudahkan user memahami informasi yang
tersedia. Visualisasi dashboard meliputi:
1. Dashboard Kategori, menampilkan kategori proyek
yang terdiri dari 5 kategori yaitu Trading, SOME,
Service, Project, Maintenance. Pada dashboard ini
manajemen dapat melihat besar nilai proyek pada
setiap kategori.

Gambar 6 Proses ETL DimDurasi

Gambar 9 Dashboard Kategori Project


2. Dashboard Customer, menampilkan data customer.
Pada dashboard ini manajemen dapat melihat besar
customer dan jumlah proyek pada masing-masing
customer.
Gambar 7 Proses ETL DimDate

Gambar 10 Dashboard Customer


DAFTAR PUSTAKA

3. Dashboard Durasi, menampilkan data durasi dan nilai


proyek. Pada dashboard ini manajemen dapat melihat [1] V. Poe, S. Brobst, and P. Klauer, Building a data
nilai proyek terbesar dari masing-masing customer warehouse for decision support. Prentice-Hall, Inc.,
berdasarkan nila proyek per menit (nilai proyek total 1997.
dibagi durasi total dalam menit) [2] R. Kimball and J. Caserta, The data warehouse ETL
toolkit. John Wiley & Sons, 2004.
[3] P. Ponniah, Data warehousing fundamentals: a
comprehensive guide for IT professionals. John
Wiley & Sons, 2004.
[4] Y. Wibisono, “Modul Pengantar Pentaho Kettle,”
Ilmu Komput. UPI, 2012.
[5] P. Lane, “Oracle9i Data Warehousing Guide,” 2001.
[6] A. L. Hanifah, “PEMBANGUNAN BUSINESS
INTELLIGENCE PADA TOSERBA KOPERASI
KARYAWAN SEMEN PADANG (KKSP)
BERBASIS DASHBOARD SYSTEM.” Universitas
Andalas, 2020.
Gambar 11 Dashboard Durasi
4. Dashboard Proyek 3 Tahun terakhir, menampilkan
data tahun dan nilai proyek. Pada dashboard ini
manajemen dapat melihat nilai proyek terbesar pada
tiap-tiap tahun selama 3 tahun terakhir

Gambar 12 Dashboard Nilai Proyek tiap tahun

V. SIMPULAN
Pada perancangan Data Warehouse PT XYZ ini dapat
diambil kesimpulan :
1. Sebelum ada Data Warehouse, PT XYZ kesulitan
melakukan analisis data dengan mudah dan cepat
terkait proyek
2. Pada percobaan ini Data warehouse yang dirancang
memiliki 4 dimensi dan 1 fakta yang terdiri dari
dimKategori, dimDurasi, DimCustomer, DimDate dan
factProject.
3. Dengan menggunakan struktur Data Warehouse proses
analisis data terkait nilai proyek menjadi lebih mudah
dan cepat
4. Perancangan Dashboard 3 tahun terakhir membantu
menganalisis data waktu lampau dan waktu saat ini
terkait proyek yang dilakukan PT XYZ

Anda mungkin juga menyukai