04-Modul DW - Peran DQ Dalam DW
04-Modul DW - Peran DQ Dalam DW
(CSD310)
MODUL 4
KUALITAS DATA
DALAM PEMBANGUNAN DATA WAREHOUSE
DISUSUN OLEH
Ir. Munawar, MMSI., M.Com., PhD
B. Uraian Perkuliahan
1. Kualitas Data dalam Pembangunan Data Warehouse
1.1. Pendahuluan
Kualitas adalah konsep kunci dalam pembangunan DW, di mana semua
tahapan dalam pembangunan DW berkontribusi terhadap kesuksesan pembangunan
DW. Oleh karena itu penting kiranya pemahaman mengenai dimensi kualitas
khususnya kualitas data (data quality – DQ) di setiap fase pembangunan DW.
Meskipun DQ dalam pembangunan DW sangat penting, namun hingga saat ini
belum ada kesepakatan mengenai dimensi DQ yang harus dimaksimalkan untuk
pembangunan DW. Konsensus yang ada baru sebatas bahwa kualitas melibatkan
beberapa dimensi (Ballou dan Tayi, 1999; Cowie dan Burstein, 2007; Jarke et al,
1999; Pipino et al, 2002; Prakash et al, 2004), namun tetap tidak ada kesepakatan
bersama mengenai dimensi kualitas data yang mana yang perlu diberikan prioritas.
DQ yang bagus akan menjamin kepercayaan pengguna terhadap DW
sehingga bisa dimanfaatkan untuk optimalisasi bisnis khususnya dalam pengambilan
keputusan (Kumar, dan Thareja, 2013). Namun, mendeteksi cacat dan meningkatkan
kualitas data selalu berkaitan dengan biaya. Jika target kualitasnya terlalu tinggi
biaya yang diperlukanpun juga tinggi. Hal ini seringkali menegasikan manfaat yang
didapatkan. Oleh karena itu perlu dilakukan keseimbangan antara biaya dan manfaat
yang ingin diperoleh dari pembangunan DW.
Beberapa survei menunjukkan prosentase yang signifikan atas kegagalan DW
memenuhi harapan bahkan gagal total. Tingkat kegagalan bervariasi, ada yang
menyebutkan antara 20% hingga 50% (Agosta, 2004; Conner, 2003; Watson et al,
Konten terkait dengan informasi aktual itu sendiri, sementara akses berkaitan
dengan pengelolaan informasi. Konten berkaitan dengan relevansi dan kondisi yang
baik dari informasi, sedangkan akses terkait dengan proses dan infrastruktur.
Informasi yang relevan adalah informasi yang memadai bagi yang membutuhkannya.
Memadai dalam konteks ini menunjukkan ruang lingkup/ luasnya informasi yang
cukup komprehensif, dengan ketepatan dan tingkat perincian yang mencukupi, serta
kejelasan argumentasi (dapat dipahami, dapat ditafsirkan, serta cukup jelas)
sehingga mudah diterapkan.
Informasi yang baik adalah informasi yang memiliki karakteristik intrinsik
tertentu yang menjadikannya berkualitas tinggi terlepas dari komunitas yang
berhubungan dengan informasi tersebut. Informasi dapat dikatakan baik jika tidak
mengandung elemen yang berlebihan atau ringkas, konsisten, tidak mengandung
kesalahan serta tidak usang/ terkini.
Tabel 4.2. Kualitas Data di Semua Fase Pembangunan Data Warehouse (sumber :
Munawar, 2016)
C. Latihan
a. Dalam konteks data, apa pengertian data yang berkualitas?
b. Mengapa kualitas data perlu diintegrasikan ke dalam pembangunan data
warehouse?
c. Mengapa kualitas data perlu diintegrasikan di setiap fase pembangunan
data warehouse?
a. Fit for use – sesuai dengan penggunaan adalah adalah definisi yang
paling sesuai untuk kualitas data
b. Tinggal kegagalan pembangunan DW yang cukup besar penyebab
terbesarnya karena ketiadaan kualitas data. Oleh karena itu integrasi
kualitas data perlu diintegrasikan dalam fase pembangunan DW
c. Semua fase pembangunan DW saling mempengaruhi satu sama lain
karena hasil dari suatu fase akan menjadi input di fase berikutnya. Oleh
karena itu integrasi kualitas data di keseluruhan fase pembangunan DW
akan mempengaruhi kualitas DW secara keseluruhan.
Referensi
Agosta, L. (2004). Data Warehousing Lessons Learned: A Time of Growth for Data
Warehousing, in DM Review Magazine, 2004, pp. Retrieved on 29/3/2011, from
http://www.dmreview.com/article_sub.cfm?articleId=1012461.
Akbar, K., Krishna, S.M and Reddy, V.R. (2013). ETL Process Modeling In DWH
Using Enhanced Quality Techniques. International Journal of Database Theory
and Application Vol. 6, No. 4, August, 2013.
Amin, M.R and Arefin, M.T. (2010). The Empirical Study on the Factors Affecting
Data Warehousing Success. International Journal of Latest Trends in
Computing (E-ISSN: 2045-5364) Volume 1, Issue 2, December 2010
Ballou, D.P., Tayi, G.K. (1999). Enhancing Data Quality in Data Warehouse
Environments. Communications of the ACM 42(1), 73–78 (1999)
Chenoweth, T., Corral, K. and Demirkan, H. (2006). Seven key interventions for data
warehouse success, Communications of the ACM, vol. 49, pp. 114-119.
Conner, D. (2003). Data warehouse failures commonplace, Network World, vol. 20, p.
24.
Cowie, J. and Burstein, F. (2007). Quality of data model for supporting mobile
decision making. Decision Support Systems 43, 1675–1683
Eckerson, W (2002) Data Quality and the Bottom Line: Achieving Business Success
through a Commitment to High Quality Data. The Data Warehousing Institute,
Seattle, WA.