KELOMPOK 5
1. LUTFI RUFAIDA (3120 31492)
2. SUYATNI UTAMI (3120 31507)
3. YULI MAHRUN NISAA (3120 31512)
1
Manajemen Basis Data dan Informasi
Rumusan Masalah:
1. Apa masalah dalam mengelola sumber data dalam lingkungan file tradisional?
2. Apa saja kapabilitas utama dari sistem manajemen basis data (DBMS) dan
mengapa DBMS relasional begitu kuat? Relasional, teknologi utama,
administrasi data
3. Apa alat dan teknologi utama untuk mengakses informasi dari database untuk
meningkatkan kinerja bisnis dan pengambilan keputusan?
4. Mengapa kebijakan informasi, administrasi data, dan jaminan kualitas data
penting untuk mengelola sumber daya data perusahaan?
Tujuan pembelajaran :
1. Untuk mengetahui masalah dalam pengelolaan sumber data dalam lingkungan
file tradisional.
2. Untuk mengetahui kapabilitas utama dari system manajemen basis data
(DBMS) dan alasan mengapa DBMS begitu kuat.
3. Untuk mengetahui alat dan teknologi utama untuk mengakses informasi dari
database untuk meningkatkan kinerja bisnis dan pengambilan keputusan.
4. Untuk mengetahui pentingnya pengelolaan sumber data perusahaan dengan
mempertimbangkan kebijakan informasi, administrasi data dan jaminan
kualitas data.
2
sebagai informasi. Setiap karakteristik atau penggambaran kualitas suatu entitas
khusus disebut atribut (attribute).
Sebagai contoh, record pada Gambar 6.1 dapat mewakili file mata
pelajaran yang diambil oleh siswa, File yang berisi mata pelajaran yang diambil
oleh siswa dapat dikelompokkan ke dalam riwayat pribadi siswa dan latar
belakang keuangan untuk mencipatkan database siswa. Nomor induk siswa, mata
pelajaran, tanggal, dan niali adalah atribut dari entitas MATA PELAJARAN.
Nilai tertentu yang dapat dimiliki atribut ditemukan dalam field dari record yang
menggambarkan entitas MATA PELAJARAN.
3
Masalah-masalah yang dihasilkan adalah penggandaan data dan inkonsintensi
program data, ketergantungan program data, tidak fleksibel, kualitas data yang
buruk, dan tidak dapat membagikan data ke berbagai aplikasi.
a. Redundasi dan Inkonsistensi Data
Redudansi data (data redundancy) adalah kehadiran data ganda pada
beberapa file data yang tersimpan di beberapa tempat. Contoh redundasi
dalam kehidupan sehari-hari adalah di satu keluarga menduplikat kunci rumah
sejumlah anggota keluarga, sehingga maisng-maisng anggota keluarga dapat
memegang kunci satu-satu. Atau dalam menyimpan file komputer di beberapa
lokasi yatitu misal di Local Disk (D:) dan di Document. Redudansi data terjadi
ketika kelompok-kelompok yang berbeda secara independen mengumpulkan
data yang sama dan menyimpannya masing-masing. Penyimpanan data yang
berulang-ulang ini akan menyebabkan Inkonsistensi data (data
inconsistency) dimana atribut-atribut yang sama memiliki nilai-nilai yang
berbeda. Sebagai contoh penjualan, persediaan, dan sistem manufaktur
perusahaan ritel pakaian mungkin menggunakan kode yang berbeda-beda
dalam mewakili ukuran pakaian. Suatu sistem mungkin menggunakan suatu
ukuran pakaian menggunakan “extra large”, sementara sistem lainnya
mencantumkan kode “XL” untuk tujuan yang sama. Ketidaksamaan tersebut
akan menyebabkan sulitnya perusahaan dalam menciptakan hubungan
pelanggan, manajemen rantai pasokan, ataupun sistem perusahaan untuk
mengintegrasikan sumber-sumber data yang berbeda.
4
b. Ketergantungan Program-Data
Ketergantungan Program-Data (program-data dependence) mengacu pada
satu paket data yang tersimpan pada file dan diperlukan oleh program-program
tertentu untuk memperbarui dan mengelola file-file tertentu sehingga program
tersebut perlu mengubah data-data tersebut. Contohnya adalah ketika kita akan
membeli suatu barang di Shopee, apabila kita belum membuat akun dan
mengisi data diri, kita tidak dapat melakukan pembelian.
c. Kurangnya Fleksibilitas
Sistem file tradisional dapat mengirimkan laporan rutin sesuai jadwal setelah
dilakukan pemrograman secara ekstensif, namun tidak dapat mengirimkan
laporan khusus atau tidak merespon kebutuhan informasi yang tidak
diantisipasi tepat waktu. Informasi yang dibutuhkan oleh permintaan khusus
tersimpan di suatu tempat dalam suatu system, tetapi terlalu mahal untuk
dicari.
5
mengelola data secara efisien, dan menyediakan akses terhadap data yang
disimpan oleh program aplikasi. Contohnya bagian penggajian membutuhkan
data seperti nama karyawan, nomor jaminan sosial, gaji bruto, dan gaji neto.
DBMS dapat menyelesaikan masalah-masalah pada lingkungan file tradisional
dengan mengurangi redudansi dan inkonsistensi data dengan
meminimalisasikan file-file yang terisolasi yang berisi data yang sama
sehingga data dapat dikelola oleh perusahaan secara mudah.
b. DBMS Relasional
DBMS relasional menampilkan data menjadi tabel dua dimensi (yang disebut
relasi). Tabel dapat juga dianggap sebagai file. Setiap tabel berisi data pada
sebuah entitas berikut atributnya.
6
Gambar diatas adalah cara DBMS relasional mengorganisasikan data
pemasok dan suku cadang. Database tersebut memiliki tabel yang terpisah
untuk entitas pemasok dan sebuah tabel untuk entitas barang. Setiap elemen
individu pada data untuk setiap entitas disimpan sebagai field yang terpisah,
dan setiap field mewakili suatu atribut untuk entitas tersebut. Field pada
database ini juga disebut kolom.
Informasi aktual/lengkap mengenai seorang pemasok yang berbaris
sepanjang suatu tabel disebut baris. Baris disebut juga record (karena
mewakili satu informasi lengkap mengenai seseorang), atau dalam istilah yang
sangat teknis disebut tuples.
Setiap tabel pada database relasional memiliki satu buah field yang
ditunjuk sebagai kunci primer (primary key). Kunci primer (primary key)/
Field kunci (key field) merupakan pemberi identitas yang unik untuk setiap
informasi dalam satu baris/ record pada sebuah tabel yang sama halnya dengan
kunci primer, mereka tidak dapat diduplikasi. Ketika field Supplier_Number
muncul di tabel PART, ia disebut kunci asing (foreign key) yang merupakan
field penting untuk mencari data suku cadang berdasarkan pemasok tertentu.
7
1. Operasi select menampilkan suatu bagian berisi seluruh rekaman pada suatu
file berdasarkan kriteria yang ditentukan. Sebagai contoh, kita ingin
menampilkan record (baris) pada tabel PART di mana Part_Number -nya
adalah 137 dan 150.
2. Operasi join mengombinasikan tabel-tabel yang memiliki keterkaitan untuk
menyediakan informasi yang lebih lengkap kepada pengguna ketimbang
satu tabel saja. Sebagai contoh, kita ingin menggabungkan bagian tabel
PART dan tabel SUPPLIER yang telah diringkas secara sementara.
3. Operasi project menampilkan kolom-kolom dari suatu tabel
berdasarkan kriteria tertentu, yang memungkinkan pengguna untuk
menampilkan tabel baru yang berisi informasi-informasiyang benar
dibutuhkan. Contohnya, kita ingin menampilkan tabel baru tersebut kolom-
kolom tertentu yaitu: Part_Number, Part_Name, Supplier_Number, dan
Supplier_Name.
8
dalam perusahaan. Sebagai tambahan bagi layanan pengelolaan data berbasis
public cloud computing, perusahaan saat ini juga memiliki pilihan untuk
menggunakan database berbasis private cloud computing. Sebagai contoh,
Sabre Holdings, perusahaan perangkat (SaaS) terbesar di dunia untuk industri
penerbangan.
9
Pada Microsoft Acces, menemukan fitur-fitur yang yang memungkinkan
pengguna untuk menciptakan rangkaian permintaan informasi dengan
mengidentifikasi tabel dan field yang diinginkan berikut hasilnya.
Kemudian memilih baris pada database yang memenuhi kriteria yang
diperlukan. Tindakan ini kemudian diterjemahkan ke dalam perintah
Bahasa SQL. Gambar berikut mengilustrasikan bagaimana query yang
sama seperti query SQL untuk memilih PART dan SUPPLIER yang akan
digabungkan.
C. Merancang Database
Sebelum merancang database, harus memahami hubungan antardata, jenis
data yang dikelola, bagaimana data tersebut akan digunakan, dan bagaimana
organisasi perlu diubah untuk mengelola data dari prespektif lengkap seluruh
perusahaan. Database memerlukan:
1. Rancangan konseptual atau logis.
2. Rancangan fisik menunjukkan bagaimana database dirancang lewat akses
langsung perangkat penyimpanan.
10
a. Normalisasi dan Diagram Relasi Entitas
Rancangan konseptual suatu database menggambarkan bagaimana
elemen-elemen data pada database dikelompokkan. Proses tersebut
mengidentifikasi hubungan antara elemen-elemen data dan cara paling
efisien dalam mengelompokkan elemen-elemen data untuk menjawab
kebutuhan informasi suatu organisasi bisnis. Untuk menggunakan model
database secara rasional secara efektif, kelompok data yang rumit harus
disederhanakan untuk meminimalisasi elemen-elemen data yang ganda
serta hubungan-hubungan jamak yang janggal. Proses menciptakan
struktur data yang ringkas, stabil, serta fleksibel dan adaptif dari
kelompok-kelompok data yang rumit dinamakan normalisasi
(normalization). Gambar 6.9 dan 6.10 mengilustrasikan proses tersebut.
11
Dalam model bisnis yang dispesifikasikan di sini, suatu perintah
dapat memiliki lebih dari satu bagian, akan tetapi setiap bagian hanya
disediakan oleh satu pemasok. Jika kita membangun relasi yang dinamakan
PESANAN berikut seluruh field di dalamnya. Kita harus mengulang nama
dan alamat pemasok untuk setiap barang yang ada di pesanan, meskipun
pesanan tersebut untuk barang-barang dari satu pemasok yang sama.
Hubungan itu memuat apa yang disebut kelompok data yang berulang karena
bisa saja terdapat banyak barang pada suatu pesanan yang ditujukkan pada
satu pemasok saja. Cara yang lebih efisien untuk menyusun data tersebut
adalah dengan memperinci PESANAN menjadi relasi-relasi yang lebih kecil,
di mana tiap relasi menjelaskan suatu entitas tunggal yang utuh.
Sistem database relasional berupaya untuk menerapkan aturan
referensial terintegrasi (referential integrity) yang menjamin hubungan
antartabel tetap konsisten. Ketika suatu tabel memiliki kunci asing yang
mengacu pada tabel lainnya, anda tidak diperkenankan menambah apa pun
sampai terdapat record yang sesuai pada tabel yang berhubungan.
Perancang database mendokumentasikan model datanya dengan
sebuah diagram relasi entitas (entity-relationship diagram), seperti yang
diilustrasikan di gambar 6.11. Diagram ini mengilustrasikan relasi antara
entitas PEMASOK, SUKU CADANG, LINI_BARANG, dan PESANAN.
Kotaknya mewakili entitas. Garis yang menghubungkan tiap kotak mewakili
hubungan. Sebuah garis yang menghubungkan dua entitas yang diakhiri
dengan dua buah garis pendek menunjukkan hubungan tunggal. Sebuah garis
yang menghubungkan dua entitas yang diakhiri tanda kaki burung dengan
garis pendek diatasnya mengindikasikan hubungan satu kebanyak. Gambar
12
6.11 menunjukkan suatu PESANAN dapat berisi banyak LINI-BARANG.
(sebuah SUKU CADANG dipesan beberapa kali dan muncul banyak kali
sebagai lini barang dalam suatu pesanan). Setiap suku cadang hanya dapat
memiliki satu pemasok, namun banyak suku cadang yang bisa disediakan
oleh pemasok.
6.3 Alat dan Teknologi Utama untuk Mengakses Informasi dari Database untuk
Meningkatkan Kinerja Bisnis dan Pengambilan Keputusan.
Organisasi bisnis menggunakan database mereka untuk memantau transaksi dasar
seperti membayar pemasok. Akan tetapi, mereka juga membutuhkan database
untuk menyediakan informasi guna menjalankan bisnisnya dengan lebih efisien,
serta membantu manajer dan karyawan membuat keputusan yang lebih baik.
A. Tantangan dalam Menghadapi Besarnya Volume Data
Data besar (big data) menggambarkan rangkaian data dengan volume sangat
besar yang melampaui kemampuan DBMS dalam mengelola, menyimpan, dan
menganalisis data tersebut.
Data besar tidak mengacu pada jumlah yang spesifik, namun umumnya
mengacu pada data dalam kisaran petabyte dan Exabyte. Data besar dihasilkan
dalam jumlah yang jauh lebih besar dan lebih cepat, ketimbang data
tradisional. Sebagai contoh, meskipun “tweets” dibatasi sampai dengan 140
karakter, namun twitter menghasilkan data lebih besar dari 8 terabyte setiap
harinya. Organisasi besar tertarik dengan data besar karena mereka dapat
melihat pola yang lebih berbentuk dan anomali-anomali yang lebih menarik
ketimbang data kecil yang berpotensi memberikan wawasan baru tentang
perilaku pelanggan, pola cuaca, aktivitas pasar saham, dan fenomena lainnya.
B. Infrastruktur Intelijen Bisnis
Infrastruktur dari intelijen bisnis terkini memiliki rangakaian perangkat untuk
memperoleh informasi-informasi yang diperlukan dari berbagai jenis data
13
yang berbeda pada organisasi bisnis masa kini, termasuk data berkapasitas
besar yang semi-terstruktur maupun tidak terstruktur.
2. Hadoop
Untuk menangani data berkapasitas besar yang semi-terstruktur
ataupun tidak sama sekali, perusahaan menggunakan Hadoop. Hadoop
adalah kerangka kerja open-source yang dikelola oleh Apache Software
Foundation yang memungkinkan pendistribusian proses data berkapasitas
besar secara parallel pada komputer-komputer berbiaya terjangkau.
Hadoop memecah masalah data besar tersebut menjadi bagian-bagian
yang lebih kecil, kemudian mendistribusikannya ke ribuan titik
pemrosesan computer yang berbiaya terjangkau, lalu mengkombinasikan
menjadi rangkaian data yang lebih kecil untuk mempermudah proses
analisis.
Hadoop terdiri atas beberapa layanan pokok: Hadoop Distributed
File System (HDFS) untuk penyimpanan file data dan MapReduce untuk
pemrosesan data parallel dengan kinerja tinggi. Hadoop dapat menangani
jenis data apapun dengan kapasitas besar, termasuk data transaksi
terstruktur, data dengan struktur yang agak longgar seperti masukan dari
14
Facebook dan Twitter, data-data yang kompleks seperti log file pada
server Web, data audio dan video yang tidak terstruktur. Perusahaan
menggunakan Hadoop untuk menganalisis data dengan volume yang
sangat besar serta memfragmentasi area untuk data yang terstruktur
maupun yang tidak terstruktur sebelum disimpan ke dalam data
warehouse. Yahoo menggunakan Hadoop untuk menelusur perilaku dari
pengguna sehingga dapat memodifikasi tampilan laman pembukaan untuk
menyesuaikan dengan kepentingan mereka.
4. Platform Analitis
Platform analitis (analytic platformas) berkecepatan tinggi yang
terspesialisasi dengan menggunakan baik teknologi terkait maupun yang
tidak terkait yang dioptimalkan untuk menganalisis kumpulan data yang
besar. Platform analitis ini, seperti IBM Netezza dan Oracle Exadata,
menampilkan sistem perangkat keras dan perangkat lunak yang telah
dikonfigurasi sebelumnya, secara spesifik dirancang untuk pemrosesan
15
permintaan dan analitis. Sebagai contoh, IBM Netezza menampilkan
database yang terintegrasi secara ketat, server dan komponen-komponen
penyimpanan yang menangani pertanyaan analitis yang rumit 10 hingga
100 kali lebih cepat daripada sistem tradisional. Platform analitis juga
memasukkan sistem dalam memori dan NoSQL sistem manajemen
database non-relasional.
16
tipe informasi ini, perusahaan dapat menggunakan database
multidimensional khusus atau suatu alat yang dapat menciptakan tampilan-
tampilan multidimensional dari data dalam database yang saling
berhubungan (relational database). Analisis multidimensional
memudahkan pengguna untuk menampilkan data yang sama melalui cara
yang berbeda dengan menggunakan banyak dimensi. Istilah lain untuk
analisis data multidimensional adalah online analytical processing
(OLAP).
Gambar Multidimensional Data Model (Data Cube)
17
individual. Teknologi penggalian data dapat mengkombinasikan
informasi dari berbagai sumber untuk menciptakan image data yang rinci
mengenai masing-masing dari kita-pendapatan kita, kebiasaan kita, hobi
kita, keluarga kita, dan kepentingan politik kita. Tipe dari informasi yang
dapat diperoleh dari data mining, meliputi asosiasi, urutan, klasifikasi,
cluster dan peramalan.
Asosiasi merupakan kejadian yang dikaitkan dengan suatu peristiwa
tunggal. Sebagai contoh, penelitian mengenai pola pembelian di
supermarket akan mengungkapkan bahwa, ketika keripik jagung
dibeli, maka minuman cola akan dibeli sebanyak 65 persen, tetapi
ketika terdapat promosi, maka cola yang dibeli meningkat menjadi
85 persen. Informasi ini dapat membantu para manajer untuk
menganbil keputusan yang lebih baik, karena mereka telah
mempelajari manfaat dari suatu promosi.
Dalam sekuen, maka peristiwa-peristiwa akan dikaitkan berdasarkan
waktu. Kita dapat, menemukan contohnya, jika sebuah rumah dibeli,
terdapat 65 persen, kemungkinan sebuah kulkas baru akan dibeli juga
dalam dua minggu dan 45 persen kemungkinan sebuah oven akan
dibeli dalam waktu sebulan setelah rumah itu dibeli.
Klasifikasi membahas pola-pola yang menggambarkan kelompok,
yang mana suatu barang yang dimiliki dengan memeriksa barang
yang ada, yang telah diklasifikasikan dan dengan menarik
kesimpulan dari serangkaian aturan. Sebagai contoh, bisnis seperti
kartu kredit atau perusahaan telepon akan khawatir kehilangan para
pelanggannya yang loyal. Klasifikasi dapat membantu untuk
menemukan ciri-ciri dari para pelanggan yang memiliki
kecenderungan untuk berhenti dan dapat menyediakan suatu model
untuk membantu para manajer dalam memprediksikan siapakah para
pelanggan tersebut sehingga para manajer dapat merancang
kampanye-kampanye khusus untuk mempertahankan para pelanggan.
Pengklasteran (clustering) bekerja dengan cara yang sama, seperti
klasifikasi ketika tidak ada kelompok yang masih belum
didefinisikan. Alat bantu data mining dapat menemukan
pengelompokan yang berbeda di dalam data, seperti menemukan
daya tarik kelompok atas kartu bank atau membagi suatu database ke
dalam kelompok dari para pelanggan yang didasarkan pada
demografis dan tipe dari investasi pribadi.
Meskipun penerapan-penerapan tersebut melibatkan prediksi, tetapi
peramalan menggunakan prediksi dalam cara yang berbeda.
Peramalan menggunakan serangkaian nilai yang ada untuk
meramalkan berapa besar dari nilai lainnya. Sebagai contoh,
peramalan akan menemukan pola-pola dalam data untuk membantu
para manajer dalam mengemasi nilai masa yang akan datang dari
variabel-variabel yang terus menerus seperti angka penjualan.
18
Tabel Bagaimana bisnis menggunakan data mining
Organisasi Aplikasi Penggalian Data
Disco S.A Rantai supermarket menggunakan penggalian data
untuk menganalisis pola pembelian oleh lebih dari 1,5
juta konsumen yang berpartisipasi dalam program
pembelian di lebih dari 200 toko.
Perusahaan Katalog perusahaan demikian pula katalog penjualan
Lilian Vernon adalah untuk menentukan produk terbaik yang dijual.
Dengan menganalisis data, ditemukan bahwa banyak
yang mengunjungi web lewat katalog tulisan. Lilian
Vernon sekarang menempatkan produknya secara
dominan di website yang telah ada.
Red Robin Freenwood, menggunakan penggalian data untuk
Restoran menganalisis 86 restoran yang ada di lebih dari 100
lokasi. Dengan menganalisis harganya, biaya, dan
kualitas semua makanannya. Red Robin dapat
mengidentifikasikan semua menu dengan marjin
keuntungan yang tinggi.
Samsung Analisis data adalah untuk mengidentifikasi pesaing.
Elektronik Ditemukan bahwa monitor computer terjual dan
Amerika pesaing bertanggung jawab atas 40 persen kerugian
yang dialami.
19
seseorang untuk membeli, berhenti membeli, atau reaksi terhadap suatu
produk tertentu atau pesan yang disampaikan melalui pemasaran. Schwab
menggunakan informasi ini untuk mengambil tindakan korektif, seperti
meningkatkan komunikasi pialang secara lansung dengan pelanggan dan
mencoba untuk memecahkan permasalahan dengan segera yang membuat
pelanggan tidak puas.
Web merupakan sumber utama lainnya dari data besar yang tidak
terstruktur untuk mengungkapkan pola, kecenderungan, dan wawasan
dalam perilaku konsumen. Penemuan serta analisis pola dan informasi
yang bermanfaat dari World Wide Web disebut dengan web mining
(penelusuran web). Bisnis akan beralih kepada web mining untuk
membantu mereka dalam memahami perilaku konsumen, melakukan
evaluasi atas keefektifan situs web tertentu, atau kuantitas dari
keberhasilan suatu kampanye pemasaran.
Misal: para pemasar menggunakan Google Trend dan Google
Insight untuk layanan Search, yang menelusuri popularitas dari berbagai
jenis kata dan frase yang digunakan dalam query pencari dari Google,
untuk mempelajari apa yang diminati oleh orang-orang , dan apakah
mereka tertarik untuk membeli.
Web mining terdiri atas tiga bagian:
a. Web content mining, merupakan suatu proses untuk mengekstrak
pengetahuan dari konten dalam laman web, meliputi teks, gambar,
audio, dan data video.
b. Web structure mining, memeriksa data yang terkait dengan struktur
dari situs web tertentu. Contohnya: tautan yang menunjuk pada suatu
dokumen mengindikasikan popularitas dari dokumen tersebut,
sementara itu tautan keluar dari suatu dokumen mengindikasikan
pengayaan atau mungkin variasi dari topik yang tercakup dalam
dokumen.
c. Web usage mining, menelaah data interaksi pengguna yang dicatat
oleh server web kapanpun pemintaan dari sumber daya situs web
tersebut diterima.
20
Keuntungan menggunakan web untuk mengakses database
internal organisasi. (1) perangkat lunak browser web jauh lebih mudah
untuk digunakan daripada perangkat query yang dimiliki. (2) tampilan
web membutuhkan sedikit perubahan atau tidak sama sekali terhadap
database internal. Dibutuhkan biaya yang lebih rendah untuk
menambahkan antar muka web di depan sistem yang diwariskan
daripada merancang kembali dan membangun kembali sistem untuk
meningkatkan akses pengguna.
Mengakses database korporat melalui web menciptakan efisiensi,
peluang, dan model bisnis yang baru. Contohnya ThomasNet.com
menyediakan direktori online terkini dengan lebih dari 650.000 pemasok
produk industri, seperti bahan kimia, logam, plastik, karet, dan peralatan
otomotif. Sebelumnya disebut Thomas Register, perusahaan biasa
mengirimkan katalog kertas besar dengan informasi itu. Sekarang
mereka menyediakan informasi itu kepada pelanggan secara online
melalui situs webnya.
21
berhak mengubah dan melihat data karyawan yang sensitif, seperti gaji
karyawan atau nomor jaminan sosial, dan bahwa departemen ini bertanggung
jawab untuk membuat memastikan bahwa data karyawan tersebut akurat. Jika
berada dalam bisnis kecil, kebijakan informasi akan dibuat dan diterapkan oleh
pemilik atau manajer. Dalam organisasi besar, pengelolaan dan perencanaan
informasi sebagai sumber daya perusahaan sering kali memerlukan fungsi
administrasi data formal.
Administrasi data bertanggung jawab atas kebijakan dan prosedur
khusus di mana data dapat dikelola sebagai sumber daya organisasi. Tanggung
jawab ini mencakup pengembangan kebijakan informasi, perencanaan data,
pengawasan desain database logis dan pengembangan kamus data, dan
pemantauan bagaimana spesialis sistem informasi dan kelompok pengguna
akhir menggunakan data. Tata kelola data yang digunakan untuk
menggambarkan banyak dari aktivitas ini. Dipromosikan oleh IBM, tata kelola
data berkaitan dengan kebijakan dan proses untuk mengelola ketersediaan,
kegunaan, integritas, dan keamanan data yang digunakan di perusahaan,
dengan penekanan khusus pada peningkatan privasi, keamanan, kualitas data,
dan kepatuhan terhadap peraturan pemerintah. Sebuah organisasi besar juga
akan memiliki desain database dan grup manajemen di dalam divisi sistem
informasi perusahaan yang bertanggung jawab untuk menentukan dan
mengatur struktur dan konten database, serta memelihara database. Dalam
kerjasama erat dengan pengguna, kelompok desain menetapkan database fisik,
hubungan logis antar elemen, dan aturan akses dan prosedur keamanan. Fungsi-
fungsi yang dilakukannya disebut administrasi database.
22
Gambar contoh administrasi database My SQL Query
B. Memastikan Kualitas Data
Kebijakan database dan informasi yang dirancang dengan baik akan
sangat membantu dalam memastikan bahwa bisnis memiliki informasi yang
dibutuhkan. Namun, langkah tambahan harus diambil untuk memastikan bahwa
data dalam database organisasi akurat dan tetap dapat diandalkan. Data yang
tidak akurat, tidak tepat waktu, atau tidak konsisten dengan sumber informasi
lain dapat menyebabkan keputusan yang salah, penarikan produk, dan kerugian
finansial. Gartner Inc. melaporkan bahwa lebih dari 25 persen data penting
dalam database perusahaan besar Fortune 1000 tidak akurat atau tidak lengkap,
termasuk kode produk dan deskripsi produk yang buruk, deskripsi inventaris
yang salah, data keuangan yang salah, informasi pemasok yang salah, dan data
karyawan yang salah. Studi Keputusan Sirius tentang "Dampak Data Buruk
pada Pembuatan Permintaan" menemukan bahwa 10 hingga 25 persen catatan
pelanggan dan prospek mengandung kesalahan data kritis. Mengoreksi
kesalahan ini di sumbernya dan mengikuti praktik terbaik untuk
mempromosikan kualitas data meningkatkan produktivitas proses penjualan
dan menghasilkan peningkatan pendapatan sebesar 66 persen.
Beberapa masalah kualitas data ini disebabkan oleh data yang berlebihan
dan tidak konsisten yang dihasilkan oleh beberapa sistem. Misalnya, sistem
pemesanan penjualan dan sistem manajemen inventaris dapat menyimpan data
tentang produk organisasi. Namun, sistem pemesanan penjualan mungkin
menggunakan istilah Nomor Barang dan sistem inventaris mungkin memanggil
atribut yang sama Nomor Produk. Sistem penjualan, inventaris, atau
manufaktur dari pengecer pakaian mungkin menggunakan kode yang berbeda
untuk merepresentasikan nilai untuk suatu atribut.
Satu sistem mungkin merepresentasikan ukuran pakaian sebagai "ekstra
besar", sedangkan sistem lain mungkin menggunakan kode "XL" untuk tujuan
yang sama. Selama proses desain untuk database gudang, data yang
mendeskripsikan entitas, seperti pelanggan, produk, atau pesanan, harus diberi
23
nama dan didefinisikan secara konsisten untuk semua area bisnis menggunakan
database. Ini kemungkinan besar karena nama dipertahankan beberapa kali
dalam database. Nama pelanggan, produk, atau pesanan mungkin salah eja
karena tidak dipindai dengan benar ke dalam sistem. Karena
ketidakkonsistenan ini, database akan memperlakukan sebagai orang yang
berbeda. Kami sering menerima surat berlebihan yang dialamatkan ke Laudon,
Lavdon, Lauden, atau Landon. Jika database dirancang dengan benar dan
standar data seluruh perusahaan ditetapkan, elemen data duplikat atau tidak
konsisten harus minimal.
Namun, sebagian besar masalah kualitas data, seperti nama yang salah
eja, nomor yang dialihkan, atau kode yang salah atau hilang, berasal dari
kesalahan selama input data. Insiden kesalahan tersebut meningkat saat
perusahaan memindahkan bisnis mereka ke Web dan memungkinkan
pelanggan dan pemasok memasukkan data ke situs Web mereka yang secara
langsung memperbarui sistem internal. Sebelum database baru tersedia,
organisasi perlu mengidentifikasi dan memperbaiki data yang salah dan
menetapkan rutinitas yang lebih baik untuk mengedit data setelah database
mereka beroperasi.
Analisis kualitas data sering kali diawali dengan audit kualitas data, yaitu
survei terstruktur terhadap akurasi dan tingkat kelengkapan data dalam suatu
sistem informasi. Audit kualitas data dapat dilakukan dengan survei seluruh file
data, survei sampel dari file data, atau survei pengguna akhir untuk persepsi
mereka tentang kualitas data.
24
kumpulan data berbeda yang berasal dari sistem informasi terpisah. Perangkat
lunak pembersih data khusus tersedia untuk secara otomatis mensurvei file data,
memperbaiki kesalahan dalam data, dan mengintegrasikan data dalam format
seluruh perusahaan yang konsisten. Masalah kualitas data bukan hanya masalah
bisnis. Mereka juga menimbulkan masalah serius bagi individu, mempengaruhi
kondisi keuangan dan bahkan pekerjaan mereka.
Misalnya, data yang tidak akurat atau kadaluwarsa tentang riwayat kredit
konsumen yang dikelola oleh biro kredit dapat mencegah individu yang layak
kredit untuk mendapatkan pinjaman atau menurunkan peluang mereka untuk
menemukan atau mempertahankan pekerjaan. Sesi Interaktif tentang
Manajemen menggambarkan pengalaman American Water dengan mengelola
data sebagai sumber daya. Saat membaca kasus ini, cobalah untuk
mengidentifikasi kebijakan, prosedur, dan teknologi yang diperlukan untuk
meningkatkan manajemen data di perusahaan ini.
25