Anda di halaman 1dari 29

Bab 6

Dasar-Dasar Intelijen Bisnis:


Database dan Manajemen
Informasi
Pengalaman

yang kita peroleh dari BCP menggambarkan dengan jelas betapa pentingnya
pengelolaan data. Kinerja bisnis bergantung pada apa yang dapat dilakukan perusahaan, terhadap
data/informasi yang dimilikinya. Bank tersebut telah mengembangkan bisnisnya, namun baik
efisiensi kinerja operasional maupun sistem pengambilan keputusan telah terhambat sistem usang
yang terfragmentasi sehingga sulit untuk mengakses data yang tersimpan. Bagairmana cara
organisasi bisnis menyimpan, mengorganisasikan, dan mengelola data mereka memiipengaruh besar
bagi efektivitas mereka.
Diagram pada awal bab menekankan poin-poin penting yang disampaikan pada bab ini. Manajemen
BCP memutuskan perlu untuk meningkatkan kualitas pengelolaan data mereka. pelanggan, akun
bank, dan kepegawaian disimpan pada sejumlah sistem yang membingungkan sehingga membuat
data tersebut sulit diambil dan dianalisis. Data tersebut sering kali ganda dan inkonsistensi sehingga
mengurangi manfaatnya. Pihak manajemen tidak dapat memperoleh gambaran situasi yang jelas
tentang perusahaan.
Pada masa lalu BCP menggunakan kertas dalam jumlah besar untuk merekonsiliasi data mere yang
ganda serta tidak konsisten untuk dikumpulkan dan dilaporkan kepada pihak manajemen. Solusi ini
sangat memakan waktu dan mahal serta menghambat departemen TI di perusahaan tersebut untuk
menghasilkan pekerjaan yang bernilai lebih tinggi. Solusi yang lebih sesuai lainnya adalah dengan
meng-install perangkat keras dan perangkat lunak baru, tempat penyimpanan informasi bisnis bagi
seluruh perusahaan untuk mendukung kelancaran aplikasi bisnis. Perankat lunak baru tersebut
diantaranya adalah perangkat lunak perusahaan yang mengintegrasikan system manajemen database
dan data warehouse terkini yang dapat menyuplai data untuk keseluruhan perusahaan. Bank tersebut
harus mengorganisasikan ulang data-datanya ke dalam format standar yang ditentukan perusahaan,
mengeliminasi data-data ganda, menerapkan aturan, tanggung ia - serta prosedur untuk memperbarui
dan menggunakan data.
Sistem manajemen database dan data warehouse modern meningkatkan efisiensi dengan
mempermudah cara menemukan dan mengumpulkan data untuk laporan manajemen serta untuk
pemrosesan transaksi finansial sehari-hari. Data tersebut lebih akurat dan terpercaya serta
mengurangi biaya pengelolaan dan penyimpanan data secara signifikan.
Berikut beberapa pertanyaan yang harus Anda pikirkan: Apa saja yang menjadi masalah dalam
manajemen data bank BCP dengan sistem mereka yang lama? Apa yang harus dilakukan

sebelum bank tersebut dapat memperoleh manfaat secara efektif dari teknologi manajemen data
tersebut?
6.1 MENGORGANISASIKAN DATA DALAM LINGKUNGAN FILE TRADISIONAL
Sistem informasi yang efektif menyediakan pengguna informasi yang akurat, tepat waktu, dan
relevan. Informasi yang akurat, berarti bebas dari kesalahan. Informasi yang tepat waktu berarti
informasi yang tersedia pada saat diperlukan oleh pengambil keputusan. Informasi dianggap relevan
ketika is memberi manfaat serta sejalan dengan jenis pekerjaan dan keputusan yang akan dibuat.
Mungkin Anda akan terkejut ketika mempelajari begitu banyak organisasi bisnis yang tidak memiliki
informasi yang akurat, tepat waktu, dan relevan karena data yang terdapat pada sistem informasinya
diorganisasikan dan dikelola dengan buruk. Itulah mengapa pengelolaan data menjadi begitu penting.
Untuk memahami masalah tersebut, mari kita menyimak bagaimana sistem informasi mengatur data
pada file komputer dan metode tradisional dalam pengelolaan file.

Sistem computer mengorganisasikan data pada sebuah hierarki yang dimulai dad bit, yang mewakili 0 dan 1 dapat
dikelompokkan untuk membentuk byte yang mewakili satu karakter, angka, atau simbol, byte-byte dapat dikelompokkan
untuk membentuk field, dan fields yang saling berhubungan dapat dikumpulkan untuk membentuk record. Record-record
yang saling berhubungan dapat dikelompokkan untuk membentuk file, dan file-file yang berhubungan dapat
diorganisasikan menjadi database.

ISTILAH DAN KONSEP DALAM PENGORGANISASIAN FILE


Sistem komputer mengorganisasikan data berdasarkan suatu hierarki yang dimulai dari bit kemudian
byte, kemudian berlanjut ke field, record, file, dan database (Lihat Gambar 6.1). Satu bit (bit)
mewakili unit data terkecil yang dapat ditangani oleh komputer. Sekelompok bit disebut byte, yang
mewakili satu buah karakter tunggal, yang dapat berupa huruf, angka ataupun symbol lainnya.
Sekelompok karakter yang membentuk kata, beberapa kata ataupun serial angka (seperti nama
ataupun usia seseorang) disebut field. Sekelompok field yang saling berhubungan dinamakan record
(seperti nama siswa, mata pelajaran yang diambil, tanggal, serta tingkat nilai), sekumpulan record
dengan jenis yang sama dinamakan file.
Sebagai contoh, record pada Gambar 6.1 dapat mewakili file mata pelajaran yang diambil
oleh siswa. Sekelompok file yang saling berhubungan dinamakan database. File yang berisi mata
pelajaran yang diambil oleh siswa pada Gambar 6.1, dapat dikelompokkan ke dalam riwayat
pribadisiswa dan Tatar belakang keuangan untuk menciptakan database siswa.

Suatu record menggambarkan suatu entitas. Sebuah entitas (entity) dapat berupa orang,
tempat, barang, ataupun peristiwa yang dapat kita simpan dan kelola sebagai informasi. Setiap
karakteristik atau penggambaran kualitas suatu entitas khusus disebut atribut (attribute). Sebagai
contoh, nomor induk siswa, mata pelajaran, tanggal, dan nilai adalah atribut dari entitas MATA
PELAJARAN. Nilai tertentu yang dapat dimiliki atribut-atribut ini ditemukan di dalam field dari
record yang menggambarkan entitas MATA PELAJARAN.

MASALAH-MASALAH DALAM LINGKUNGAN DATA TRADISIONAL


Pada kebanyakan organisasi, sistem cenderung berkembang sendiri di luar rencana perusahaan.
Akuntansi keuangan, manufaktur, sumber daya manusia, penjualan, serta pemasaran semuanya
membangkan sistem dan file data sendiri. Gambar 6.2 mengilustrasikan pendekatan tradisional
pemrosesan informasi.
Setiap aplikasi tentu saja memerlukan file-nya masing-masing dan program komputer untuk
beroperasi. Sebagai contoh, area fungsional sumber daya manusia mungkin memiliki master file
karyawan yang berisi file penggajian, file asuransi medis, file tunjangan pensiun, file untuk daftar dan
sebagainya, yang mencapai puluhan atau bahkan ratusan file dan program yang ada. Bagi perusahaan
secara keseluruhan, proses tersebut akan menyebabkan penggandaan master file yang dioperasikan
dan dikelola lewat divisi atau departemen yang terpisah-pisah. Apabila proses ini ini berjalan selama
5 atau 10 tahun, organisasi tersebut akan terbebani oleh ratusan progam dan aplikasi yang sangat
sulit dirawat dan dikelola. Masalah-masalah yang dihasilkan adalah penggandaan data dan
inkonsistensi program data (tidak tahu program mana yang harus dipercaya), ketergantungan

program data, tidak flksibel, kualitas data yang buruk, dan tidak dapat membagikan data ke berbagai
aplikasi.
Redudansi dan Inkonsistensi Data
Redudansi data (data redundancy) adalah kehadiran data ganda pada beberapa file data yang
tersimpan di beberapa tempat atau lokasi. Redudansi data terjadi ketika kelompok-kelompok yang
berbeda pada sebuah organisasi secara independen mengumpulkan data yang sama dan
menyimpannya masing-masing. Data redudansi menghabiskan tempat penyimpanan data, dan vebabkan terjadinya inkonsistensi data (data inconsistency), di mana atribut-atribut yang sama,
memiliki nilai-nilai yang berbeda. Sebagai contoh, entitas MATA PELAJARAN yang dijelaskan
pada Gambar 6.1, tanggalnya mungkin sudah diperbarui pada beberapa sistem, namun belum
diperbarui pada sistem lainnya. Atribut yang sama, sebagai contoh, Nomor Induk Siswa, mungkin
memiliki nama yang berlainan pada beberapa sistem di seluruh organisasi. Beberapa sistem mungkin
menggunakan penulisan NIS, atau No. Siswa.
Kebingungan tambahan lainnya dapat terjadi pada sistem pengkodean untuk mewakili nilai
dari sebuah atribut. Sebagai contoh, penjualan, persediaan, dan sistem manufaktur perusahaan ritel
pakaian mungkin menggunakan kode yang berbeda-beda dalam mewakili ukuran pakaian. Suatu
sistem mungkin mewakili suatu ukuran pakaian sebagai "extra large", sementara sistem lainnya
mencantumkan kode "XL" untuk tujuan yang sama. Kebingungan. TiDingungan tersebut akan
mempersulit perusahaan dalam menciptakan manajemen hubungan :eianggan, manajemen rantai
pasokan, ataupun sistem perusahaan untuk mengintegrasikan sumber-sumber data yang berbeda.
Ketergantungan Program-Data
Ketergantungan program-data (program-data dependence) mengacu pada satu paket data yang
ersimpan pada file dan diperlukan oleh program-program tertentu untuk memperbarui dan
mengelola file file tertentu sehingga program tersebut perlu mengubah data-data tersebut. Setiap
program komputer tradisional harus menjelaskan lokasi dan sifat data yang bekerja padanya. Di
lingkungan fife tradisional, setiap perubahan pada program perangkat lunak, mensyaratkan
perubahan terhadap data yang diakses oleh program tersebut. Sebuah program mungkin
diimodifikasi dari 5 digit menjadi 9 digit untuk kode enkripsi. Jika file data yang asli dimodifikasi
Hari 5 digit ke 9 digit, kemudian program-program yang memerlukan 5 digit kode tidak dapat
bekerja dengan semestinya lagi. Untuk mengimplementasikan perubahan semacam itu diperlukan
biaya jutaan dolar.
Kurangnya Fleksibilitas
Sistem file tradisional dapat mengirimkan laporan rutin sesuai jadwal setelah upaya pemrograman
yang ekstensif, namun tidak dapat mengirimkan laporan-laporan ad-hoc (hanya diperlukan pada
situasi khusus saja) atau merespons kebutuhan informasi yang tidak dapat diantisipasi pada kondisi
waktu tertentu. Informasi-informasi tersebut diperlukan oleh permintaan-permintaan ad-hoc (hanya
diperlukan pada situasi khusus saja) di suatu tempat pada sistem tersebut, tetapi terlalu mahal untuk
disediakan. Beberapa pemrogram mungkin harus bekerja beberapa minggu untuk mengumpulkan
data-data yang diperlukan ke dalam sebuah file baru.
Sistem Keamanan yang Buruk

Karena longgarnya pengendalian atau pengelolaan terhadap data, akses dan penyebaran informasi
menjadi tidak terkendali. Manajemen mungkin tidak memiliki cara untuk mengetahui siapa yang
mengakses ataupun mengubah data organisasi.
Kurangnya Ketersediaan dan Pendistribusian Data
Karena bagian-bagian informasi yang terdapat pada file-file yang berbeda dan bagian - bagian
organisasi tidak dapat dihubungkan satu sama lain, jelas adalah tidak mungkin untuk
mendistribusikan dan mengakses informasi pada waktu bersamaan. Informasi tidak dapat dengan
baik lintas area fungsional, pada bagian dan divisi-divisi pada organisasi. Jika pengguna tahu nilai
yang ditemukan pada bagian informasi yang sama saling berbeda, mereka mungkin tidak akan mau
menggunakan sistem tersebut karena mereka tidak dapat memercayai akurasi datanya.
6.2

PENDEKATAN DATABASE UNTUK PENGELOLAAN DATA

Teknologi database banyak menyelesaikan masalah-masalah pada organisasi yang menggunakan


sistem file tradisional. Definisi yang lebih jelas mengenai database adalah sekumpulan data yang
diorganisasikan untuk melayani berbagai aplikasi secara efisien dengan memusatkan data dan
mengurangi penggandaan data. Ketimbang menyimpan data pada file fileyang terpisah untuk setiap
aplikasi, data yang dimunculkan kepada pengguna, berasal dari satu lokasi penyimpanan. saja.
Database tunggal yang melayani banyak aplikasi. Sebagai contoh, suatu perusahaar. ketimbang
menyimpan data kepegawaiannya pada sistem-sistem informasi dan file yang berbeda untuk data
pribadi, penggajian, dan tunjangan, perusahaan dapat menciptakan database sumbe7 daya manusia
tunggal.
SISTEM MANAJEMEN DATABASE
Sistem manajemen database (database management systemDBMS) adalah perangkat lunak, yang
memungkinkan suatu organisasi memusatkan data, mengelola mereka secara efisien, dan
menyediakan akses terhadap data yang disimpan oleh program aplikasi. DBMS bertindak sebagai
antarmuka antara program aplikasi dan file data secara fisik. Ketika program aplikasi meminta suatu
item data, seperti gaji bruto, DBMS akan menemukan item data tersebut pada database, dan
menampilkannya lewat program aplikasi. Dengan menggunakan file file data tradisional, pemrogram
harus menspesifikasikan ukuran dan format dari setiap elemen data yang digunakan dalam sebuah
program, kemudian menginformasikannya ke komputer di mana lokasi mereka.
DBMS meringankan pekerjaan pemrogram dan pengguna dengan cara memahami di mana dan
bagaimana suatu data disimpan dengan memberikan tampilan terpisah pada data fisik dan data logis
(contoh: logical drive). Tampilan data logis (logical view) menampilkan data sesuai apa yang
diharapkan/dibayangkan oleh pengguna akhir ataupun spesialis bisnis, di mana tampilan data fisik
(physical view) men ampilkan bagaimana sesungguhnya suatu data diorganisasikan dan
distrukturisasi pada media penyimpanan fisik.
Perangkat lunak DBMS memungkinkan database fisik dapat diakses secara logis oleh pengguna
akhir. Sebagai contoh, untuk database cumber daya manusia yang terdapat pada Gambar 6.3, seorang
spesialis tunjangan (orang yang khusus ditugaskan untuk mengatur tunjangantunjangan, program
pensiun, ataupun asuransi-asuransi terkait), mungkin memerlukan tampilan yang memuat nama
pegawai, nomor jaminan sosial, serta jaminan asuransi kesehatan. Anggota departemen bagian
penggajian mungkin memerlukan data seperti nama karyawan, nomor jaminan sosial, gaji bruto, dan
gaji neto. Data yang digunakan pada tampilan-tampilan ini disimpan pada suatu database tunggal, di
mana mereka dapat dikelola lebih mudah oleh organisasi.

Bagaimana DBMS Menyelesaikan Masalah-Masalah pada Lingkungan File Tradisional


DBMS mengurangi redudansi (ganda) dan inskonsistensi data dengan meminimalisasi fie-file yang
terisolasi yang berisi data sama. Mungkin DBMS tidak dapat menghilangkan redudansi data secara
keseluruhan pada suatu organisasi, namun mereka dapat meminimalkannya. Meskipun suatu
organisasi memiliki data ganda, namun dengan menggunakan DBMS, inkonsistensi data tersebut

dapat dihilangkan, karena data-data ganda memiliki nilai yang sama. DBMS memisahkan antara
program dengan data, yang memungkinkan data untuk berdiri sendiri. Akses dan ketersediaan
informasi akan meningkat serta biaya pengembangan dan pemeliharaan program akan menurun
karena pengguna dan pemrogram dapat melakukan pekerjaan-pekerjaan khusus sesuai permintaan
pada database tersebut. DBMS memungkinkan organisasi untuk mengelola, menggunakan, dan
mengamankan data secara terpusat.
DBMS Relasional
DBMS terkini menggunakan model-model yang berbeda untuk memantau entitas, atribut, dan
hubungan. Jenis DBMS yang paling populer bagi PC ataupun mainframe saat ini adalah DBMS
relasional (relational DBMS). DBMS relasional menampilkan data menjadi tabel dua dimensi (yang
disebut relasi). Tabel dapat juga dianggap sebagaifile. Setiap tabel berisi data pada sebuah entitas
berikut atributnya. Microsoft DBMS relasional untuk sistem PC, di mana DB2, Oracle Database. dan
Microsoft SQL Server adalah DBMS relasional untuk komputer berukuran sedang maupurl besar
seperti mainframe. MySQL adalah DBMS open source yang terkenal, sedangkan Oracle Database
Lite adalah DBMS untuk perangkat komputasi mobile.

Mari kita menyimak bagaimana DBMS relasional mengorganisasikan data pemasok dan suku
cadang (Gambar 6.4). Database tersebut memiliki tabel yang terpisah untuk entitas pemasok dan
sebuah tabel untuk entitas barang. Suatu tabel terdiri atas deretan kolom dan barisan data. Setiap
elemen individu pada data untuk setiap entitas disimpan sebagai field yang terpisah, dan setiap field
mewakili suatu atribut untuk entitas tersebut. Field pada database relasional disebut juga kolom.
Untuk entitas PEMASOK, nomor identifikasi pemasok, nama, jalan, kota, negara, dan kode pos
disimpan sebagai field-field yang terpisah di dalam tabel pemasok, dan setiap field mewakili satu
atribut untuk suatu entitas PEMASOK.
Informasi aktual/lengkap mengenai seorang pemasok yang berbaris sepanjang suatu tabel disebut
baris. Baris sering juga disebut sebagai record (karena mewakili satu informasi lengkap mengenai
seseorang), atau dalam istilah yang sangat teknis disebut tuples. Data untuk entitas SUKU CADANG
memiliki tabel terpisah yang tersendiri.
Field Nomor_Pemasok pada tabel PEMASOK memberikan identifikasi yang unik untuk setiap
record sehingga record tersebut dapat diambil, diperbarui, ataupun digolongkan. Dalam hal ini
Nomor_Pemasok disebut sebagai field kunci (key field). Setiap tabel pada database relasional
memiliki satu buahfie/d yang ditunjuk sebagai kunci primer (primary key). Field kunci merupakan
pemberi identitas yang unik untuk setiap informasi dalam satu baris/record pada sebuah tabel yang

sama halnya dengan kunci primer, mereka tidak dapat diduplikasi. Nomor_Pemasok_ adalah kunci
primer bagi tabel PEMASOK dan Nomor_Suku Cadang adalah kunci primer untuk tabel Suku
Cadang. Perhatikan Nomor_Pemasok muncul dua kali pada tabel PEMASOK dan tabel SUKU
CADANG. Pada tabel PEMASOK, Nomor_Pemasok adalah kunci primer. Ketika field Nomor_
Pemasok muncul pada tabel SUKU CADANG, is disebut sebagai kunci asing (foreign key) yang
merupakan field penting untuk mencari data suku cadang berdasarkan pemasok tertentu.
Operasi DBMS Relasional
Tabel database relasional dapat dikombinasikan dengan mudah untuk mengirimkan data yang
diperlukan pengguna, yang disediakan oleh dua tabel yang saling berbagi elemen data. Andaikan kita
ingin mencari nama pemasok yang memasok suku cadang dengan nomor 137 atau 150. Kita
memerlukan informasi dari 2 tabel: tabel PEMASOK dan tabel SUKU CADANG. Perhatikan, bahwa
dua file ini mempunyai satu data yang saling berbagi, yaitu: Nomor_Pemasok.
Dalam database relasional, tiga operasi dasar seperti yang ditunjukkan pada Gambar 6.5
digunakan untuk mengembangkan serangkaian data yang sangat berguna, yaitu: select, join, dan
project. Operasi select menampilkan suatu bagian yang berisi seluruh rekaman pada suatu file
berdasarkan kriteria yang ditentukan. Sebagai contoh, kita ingin menampilkan record (baris) pada
tabel SUKU CADANG di mana Nomor_Suku Cadangnya adalah 137 atau 150. Operasi join
mengombinasikan tabel-tabel yang memiliki keterkaitan untuk menyediakan informasi yang lebih
lengkap kepada pengguna ketimbang satu tabel saja. Dalam contoh, kita ingin menggabungkan
bagian tabel SUKU CADANG dan tabel PEMASOK yang telah diringkas sementara (di mana hanya
suku cadang dengan nomor_suku cadang 137 atau 150 saja yang akan ditampilkan) ke dalam satu
tabel baru.
Operasi project menampilkan kolom-kolom dari suatu tabel berdasarkan kriteria tertentu,
yang memungkinkan pengguna untuk menampilkan tabel baru yang berisi informasi-informasi yang
betul-betul diperlukan. Contohnya, kita ingin mengutip dari tabel baru tersebut kolomkolom tertentu
sebagai berikut: Nomor_Suku Cadang, Nama_Suku Cadang, Nomor_Pemasok, Nama_Pemasok.

Database Non-Relasional dan Database pada Sistem Cloud Computing


Lebih dari 30 tahun, teknologi database relasional telah menjadi standar emas. Cloud computing,
volume data yang belum pernah ada sebelumnya, beban pekerjaan yang begitu besar untuk avanan
web, serta kebutuhan untuk menyimpan data jenis baru memerlukan alternatif database selain model
lama dari database relasional dalam mengorganisasikan data guna membentuk tabel, kolom, dan
baris. Kemudian perusahaan-perusahaan beralih ke "NoSQL" yang berarti teknologi database nonrelasional. Sistem manajemen database non-relasional (non-relational database management

systems) menggunakan model data yang lebih fleksibel dan dirancang untuk mengelola data
berukuran besar yang didistribusikan pada banyak perangkat serta mempermudah dalam
meningkatkan atau menurunkan skalabilitas. Mereka sangat berguna untuk menangani permintaanpermintaan data sederhana pada data terstruktur maupun yang tidak memiliki volume besar. Seperti
web, media social, grafis, dan bentuk-bentuk data lainnya yang sulit dianalisis menggunakan
perangkat tradisional berbasis SQL.
Ada beberapa jenis database NoSQL, masing-masing memiliki fitur teknis dan perlakuan yang
berbeda. Database Oracle NoSQL salah satu contoh diantaranya adalah SimpleDB buatan Amazon,
salah satu layanan web yang beroperasi pada sistem cloud computing. SimpleDB menyediakan
layanan web dengan tampilan yang mudah dipahami untuk menciptakan dan menyimpan rangkaian
data, menganalis data dengan mudah, dan mengembalikan hasilnya. Tidak perlu mendefinisikan
terlebih dahulu ke dalam database struktur formal atau mengubah definisi apabila ada data baru ang
masuk.
Amazon dan penyedia layanan cloud computing lainnya juga menyediakan DBMS relasional.
Relational Database Service (RDS) Amazon menawarkan MySQL, SQL Server, ataupun Oracle
Database sebagai mesin pencari database. Besarnya pembayaran bergantung pada jumlah
penggunaan. Oracle memiliki Database Clou Service mengunakan relasional Oracle Database 11g,
sedangkan Microsoft SQL Azure Database adalah layanan database relasional berbasis cloud
computing yang beroperasi pada Microsoft's SQL Server DBMS. Layanan manajemen data berbasis
cloud computing memiliki daya tarik tersendiri bagi organisasi kecil dan menengah yang baru
memulai bisnisnya dengan menawarkan harga yang terjangkau, ketimbang produk database dalam
perusahaan.
TicketDirect, yang menjual tiket konser, acara olahraga, pertunjukan teater, dan bioskop di Australia
dan Selandia Baru, mengimplementasikan platform SQL Azure Database berbasis cloud computing
untuk meningkatkan kinerja manajemennya selama musim ramai penjualan tiketnya.
memindahkan datanya ke database SQL Azure. Dengan beralih menggunakan sistem cloud
computing, TicketDirect mampu menjangkau sumber-sumber komputasinya secara real-time pada
saat diperlukan dengan biaya yang murah.
Sebagai tambahan bagi layanan pengelolaan data berbasis public cloud computing, perusahaan saat
ini juga memiliki pilihan untuk menggunakan database berbasis private cloud computing. Sebagai
contoh, Sabre Holdings, perusahaan perangkat lunak (SaaS) terbesar di dunia untuk industri
penerbangan memiliki database berbasis private cloud computing yang mendukung lebih dari 100
proyek dan 700 pengguna. Database yang dikonsolidasikan menjangkau sekumpulan server
terstandardisasi yang dioperasikan pada Oracle Database 1 1 g yang menyediakan layanan database
untuk berbagai aplikasi. Perangkat untuk mengelola beban kerja menjamin tersedianya cumber daya
yang cukup bagi kebutuhan aplikasi meskipun pada saat beban kerja tersebut mengalami perubahan.
Platform perangkat kenas dan perangkat lunak terdistribusi mengurangi jumlah server, DBMS, dan
perangkat penyimpanan yang dibutuhkan untuk proyek-proyek ini, yang terdiri atas aplikasi rute
penerbangan, hotel, dan aplikasi biro perjalanan lainnya. (Baum, 2011).
Sistem private cloud computing mengonsolidasikan server, tempat penyimpanan, operasi, database,
serta beban pekerjaan ke dalam perangkat keras dan perangkat lunak terdistribusi. Dengan
mendistribusikan database pada sistem private cloud computing terkonsolidasi memungkinkan
departemen TI untuk meningkatkan kualitas pelayanan mengurangi beban modal dan biaya operasi.

Semakin tinggi tingkat kepadatan konsolidasi dicapai, semakin besar pengembalian atas investasi
yang diterima.
KAPABILITAS SISTEM MANAJEMEN DATABASE
Suatu DBMS selalu menyertakan perangkat untuk mengorganisasikan, mengelola, dan data pada
database. Dan hal yang paling penting adalah bahasa untuk mendefinisikan data, data, dan bahasa
untuk memanipulasi/memodifikasi data.
DBMS memiliki kapabilitas definisi data (data definition) untuk menspesifikasikan struktur
konten database. Definisi data digunakan untuk membuat tabel database dan untuk mendefinisikan
karakteristik field pada setiap tabel. Informasi tentang database ini akan didokumentasikan kamus
data. Kamus data (data dictionary) adalah file manual ataupun otomatis yang menyimpan definisidefinisi elemen data berikut karakteristik mereka.
Microsoft Access memiliki kemampuan kamus data yang belum sempurna, yang
menampilkan informasi seperti nama, deskripsi, ukuran, tipe, format, dan properti lainnya pada tiap
field - sebuah tabel. Kamus data bagi database perusahaan besar dapat menangkap informasi
tambahan seperti penggunaan, kepemilikan (siapa di organisasi tersebut bertanggung jawab untuk
mengelola data), otorisasi, keamanan, dan individual, fungsi-fungsi bisnis, program, serta laporan
yang menggunakan masing-masing elemen data.
Meminta Data dan Melaporkan
DBMS menyertakan perangkat untuk mengakses dan memanipulasi informasi pada dat Sebagian
besar DBMS memiliki bahasa tersendiri yang disebut bahasa manipulasi data manipulation
language) yang digunakan untuk menambah, mengubah, menghapus, dan data pada database.
Bahasa ini mengandung perintah yang memungkinkan pengguna dan spesialis pemrograman untuk
mengekstrak/menyaring data dari database untuk memenuhi kebutinformasi dan mengembangkan
aplikasi. Bahasa manipulasi data yang paling mutakhir saat ini adalah Structured Query Language
atau SQL. Anda akan mempelajari lebih banyak lagi cara meminta informasi lewat SQL pada
penelusuran pembelajaran bab ini.
Pengguna DBMS pada komputer berukuran besar dan sedang seperti DB2, Oracle, dan SQL
Server, akan menggunakan SQL untuk memperoleh informasi yang dibutuhkan dari database
mereka. Microsoft Access juga menggunakan SQL, tetapi ia memiliki perangkat tersendiri untuk
meminta informasi dari database, serta mengorganisasikan data dari database menjadi laporan yang
lebih rapi.
Pada Microsoft Access, Anda akan menemukan fitur-fitur yang memungkinkan pengguna
untuk menciptakan rangkaian permintaan informasi dengan mengidentifikasi tabel dan field yang
diinginkan berikut hasilnya. Kemudian memilih baris pada database yang memenuhi kriteria yang
diperlukan. Tindakan-tindakan ini kemudian diterjemahkan ke dalam perintah bahasa SQL.
Microsoft Access dan DBMS lainnya menyertakan kemampuan dalam penyusunan lapo sehingga
data yang diinginkan dapat ditampilkan format yang lebih terstruktur dan rapi, ketimbang sekadar
menarik informasi saja. Crystal Reports merupakan DBMS penyusun laporan perusahaan-perusahaan
berskala besar, meskipun demikian ia juga dapat bekerja sama Microsoft Access. Microsoft Access
juga memiliki kemampuan untuk mengembangkan aplikasi

sistem desktop. Diantaranya termasuk perangkat untuk membuat layar untuk memasukkan data,
laporan, dan mengembangkan logika untuk pemrosesan transaksi.
MERANCANG DATABASE
Untuk merancang database, Anda harus memahami hubungan antardata, jenis data yang dikelola
pada database, bagaimana data tersebut akan digunakan, serta bagaimana organisasi perlu diubah
untuk mengelola data dari perspektiflengkap seluruh perusahaan. Database memerlukan rancangan
konsep maupun fisik. Rancangan konseptual atau logis dari suatu database adalah model abstrak
database dari perspektif organisasi bisnis, di mana rancangan fisik menunjukkan bagaimana
database dirancang lewat akses langsung perangkat penyimpanan.
Normalisasi dan Diagram Relasi Entitas
Rancangan konseptual suatu database menggambarkan bagaimana elemen-elemen data pada
database dikelompokkan. Proses perancangan tersebut mengidentifikasi hubungan antara elemenelemen data dan cara paling efisien dalam mengelompokkan elemen-elemen data untuk menjawab
kebutuhan informasi suatu organisasi bisnis. Proses tersebut juga mengidentifikasi data-data ganda
dan pengelompokkan elemen-elemen data yang diperlukan untuk program aplikasi yang spesifik.
Sekelompok data diorganisasikan, diperbaiki, dan diditribusikan dengan lancar, sampai hubungan
logis diantara seluruh data pada database tampak jelas.
Untuk menggunakan model database relasional secara efektif, kelompok data yang rumit harus
disederhanakan untuk meminimalisasi elemen-elemen data yang ganda serta hubunganhubungan
jamak yang janggal. Proses menciptakan struktur data yang ringkas, stabil, serta tleksibel dan
adaptatif dari kelompok-kelompok data yang rumit dinamakan normalisasi (normalization). Gambar
6.7 dan 6.8 mengilustrasikan proses tersebut.
Dalam model bisnis yang dispesifikasikan di sini, suatu perintah dapat memiliki lebih dari satu
bagian, akan tetapi setiap bagian hanya disediakan oleh satu pemasok. Jika kita membangun

relasi yang dinamakan PESANAN berikut seluruh field di dalamnya, kita harus mengulang nama dan
alamat pemasok untuk setiap barang yang terdapat pada pesanan, meskipun pesanan tersebu: untuk
barang-barang dari satu pemasok yang sama. Hubungan ini memuat apa yang disebu: kelompok data
yang berulang karena bisa saja terdapat banyak barang pada satu pesanan yang ditujukan pada satu
pemasok saja. Cara yang lebih efisien untuk menyusun data tersebut adalah dengan memerinci
PESANAN menjadi relasi-relasi yang lebih kecil, di mana tiap relasi menjelaskan suatu entitas
tunggal yang utuh. Jika kita secara bertahap menjalankan dan menormalisasi relasi dalam
PESANAN, kita akan melihat hubungan yang ditampilkan pada Gambar 6.8. Anda dapat belajar
lebih banyak mengenai normalisasi, pembuatan diagram relasi entitas, serta perancangar_ database
pada Penelusuran Pembelajaran dari bab ini.
Sistem database relasional berupaya untuk menerapkan aturan referensial terintegrasi
(referential integrity) yang menjamin hubungan antartabel tetap konsisten. Ketika suatu memiliki
kunci asing yang mengacu pada tabel lainnya, Anda tidak diperkenankan menambah record apa pun
sampai terdapat record yang sesuai pada tabel yang berhubungan. Pada database, yang telah kita
jelaskan di awal bab ini, Nomor_Pemasok menghubungkan tabel SUKU CADANC ke tabel
PEMASOK. Kita tidak diperkenankan menambah record baru pada tabel SUKU CADANG untuk
barang dengan Nomor_Pemasok 8266 sampai ada record yang sesuai pada tabel PEMASOK yang
memiliki record Nomor_Pemasok 8266. Kita juga harus menghapus record yang berkaitan dengan
tabel SUKU CADANG, apabila kita menghapus suatu record pada tabel PEMASOK untuk Nomor_
Pemasok 8266. Dengan kata lain, kita seharusnya tidak memiliki suku cadang dar: pemasok yang
tidak diketahui.
Perancang database mendokumentasikan model datanya dengan sebuah diagram relasi entitas
(entity-relationship diagram), seperti yang diilustrasikan pada Gambar 6.9. Diagram ini
mengilustrasikan relasi antara entitas PEMASOK, SUKU CADANG, LINI_BARANG. dan
PESANAN. Kotaknya mewakili entitas. Garis yang menghubungkan tiap kotak mewakili hubungan.
Sebuah garis yang menghubungkan dua entitas yang diakhiri dengan dua buah garis pendek
menunjukkan hubungan tunggal. Sebuah garis yang menghubungkan dua entitas yang diakhiri
dengan tanda kaki burung dengan garis pendek diatasnya mengindikasikan hubungar. satu ke banyak.
Gambar 6.9 menunjukkan suatu PESANAN dapat berisi banyak LINI_BARANG. (Sebuah SUKU
CADANG dipesan beberapa kali dan muncul banyak kali sebagai lini barang pada suatu pesanan).
Setiap SUKU CADANG hanya dapat memiliki satu PEMASOK, namun banyak SUKU CADANG
yang bisa disediakan oleh PEMASOK.

Itu saja belum cukup: Jika organisasi bisnis tidak dapat mengimplementasikan model datanya
dengan tepat, sistem tersebut tidak akan mampu melayani bisnis tersebut dengan baik. Sistem
perusahaan tersebut tidak akan efektif karena bekerja dengan data yang tidak akurat, tidak lengkap,
serta sulit diperoleh. Memahami data suatu organisasi berikut cara bagaimana is diwakili pada suatu
database adalah pelajaran paling penting dalam bab
Sebagai contoh, Famous Footwear, perusahaan ritel alas kaki dengan 800 gerai di 49 negara,
tidak dapat untuk mencapai tujuannya untuk menjadi "tren mode sepatu yang tepat, toko yang tepat
dengan harga yang tepat." Karena database-nya tidak dirancang dengan baik untuk disesuaikan
dengan perubahan persediaan toko yang terjadi dengan cepat. Perusahaan tersebut memiliki
database relasional buatan Oracle yang dioperasikan pada komputer berkapasitas sedang, namun
database-nya cenderung dirancang untuk menghasilkan laporan standar bagi manajemen, ketimbang
bereaksi terhadap perubahan pasar. Pihak manajemen tidak dapat memiliki data tepat mengenai itemitem yang spesifik pada persediaan di gerainya. Perusahaan harus berjuang keras untuk mengatasi
masalah ini dengan membangun sebuah database baru di mana data penjualan dan persediaan dapat
diorganisasikan dengan lebih baik untuk kegiatan analisis dan manajemen persediaan.
6.3

MEMANFAATKAN DATABASE UNTUK MENINGKATKAN


KINERJA BISNIS DAN PENGAMBILAN KEPUTUSAN

Organisasi bisnis menggunakan database mereka untuk memantau transaksi dasar, seperti membayar
pemasok, memproses pesanan, memantau pelanggan, serta mengaji karyawan. Akan tetapi, mereka
juga membutuhkan database untuk menyediakan informasi guna menjalankan bisnisnya dengan
lebih efisien, serta membantu manajer dan karyawan membuat keputusan yang lebih baik. Jika suatu
perusahaan ingin mengetahui produk mana yang paling populer, atau pelanggan mana yang paling
mendatangkan banyak keuntungan, jawabannya terdapat pada data.
TANTANGAN DALAM MENANGANI BESARNYA VOLUME DATA
Sampai dengan 5 tahun yang lalu, sebagian besar data dikumpulkan oleh organisasi yang terdiri
atas data transaksi yang dapat ditempatkan dengan mudah ke dalam kolom dan baris pada
DBMS relasional. Sejak saat itu, ada lonjakan data dari lalu-lintas web, pesan surel, dan konten
media sosial (tweets, status pesan), demikian juga dari data yang dihasilkan dari mesin seperti
sensor (yang digunakan pada smart meter, sensor pabrik, dan meteran elektrik) atau dari sistem
transaksi elektronis. Data-data ini mungkin tidak memiliki struktur atau sedikit terstrukur dan
tidak sesuai dengan produk DBMS relasional yang mengorganisasikan data ke dalam bentuk
Jiom dan baris. Sekarang kita menggunakan istilah data besar (big data) untuk menggambarkan
rangkaian data dengan volume sangat besar yang melampaui kemampuan DBMS dalam mengelola
menyimpan, dan menganalisis data tersebut.
Data besar tidak mengacu pada jumlah yang spesifik, namun umumnya mengacu pada data dalam
kisaran petabyte dan Exabyte dengan kata lain miliaran sampai dengan triliunan rekaman, semua
dari sumber yang berbeda. Data besar dihasilkan dalam jumlah yang jauh lebih besar dart lebih
cepat, ketimbang data tradisional. Sebagai contoh, sebuah mesin jet dapat menghasilkan 1C terabyte
data dalam 30 menit dan lebih dari 25.000 penerbangan dilakukan setiap harinya. Meskipun "tweets"
dibatasi sampai dengan 140 karakter, namun Twitter menghasilkan data lebih dari 8 terabyte setiap
harinya. Berdasarkan riset perusahaan teknologi International Data Center (IDC), data meningkat
lebih dari dua kali lipat setiap tahunnya, jadi data yang tersedia bagi organisasiorganisasi meroket
tajam.

Organisasi bisnis tertarik dengan data besar karena mereka dapat melihat pola yang lebih
berbentuk dan anomali-anomali yang lebih menarik ketimbang data kecil, yang berpotensi
memberikan wawasan baru tentang perilaku pelanggan, pola cuaca, aktivitas pasar saham, dan
fenomena lainnya. Bagaimanapun, untuk memperoleh nilai bisnis dari data-data tersebut, organisasi
memerlukan perangkat dan teknologi baru yang mampu mengelola data non-tradisional beserta data
perusahaan mereka.
INFRASTRUKTUR INTELIJEN BISNIS
Seandainya, Anda ingin meringkas informasi penting megenai kegiatan operasional, tren, dan
perubahan terkini di seluruh organisasi. Jika Anda bekerja di perusahaan besar, data yang Anda
butuhkan mungkin terfragmentasi ke dalam sistem-sistem yang terpisah seperti penjualan. Produksi,
dan akuntansi, atau bahkan berasal dari sumber eksternal seperti demografis dan data pesaing.
Semakin Anda membutuhkan data berkapasitas besar. Infrastruktur dari intelijen bisnis terkini
memiliki rangkaian perangkat untuk memperoleh informasi-infrmasi yang diperlukan dari berbagai
jenis data yang berbeda pada organisasi bisnis masa kini, termasuk data berkapasitas besar yang
semi-terstruktur maupun tidak terstruktur. Kemampuan-kemampuan ini meliputi data warehouses,
data marts, Hadoop, in-memory computing, serta platform analitis.
Data Warehouse dan Data Mart
Perangkat tradisional untuk menganalisis data perusahaan sampai dengan 20 tahun yang lalu adalah
data warehouse. Data warehouse adalah data yang menyimpan data historis dan data terkini yang
berpengaruh bagi kepentingan pengambil keputusan di seluruh perusahaan. Data tersebut ditujukan
bagi banyak sistem operasional transaksi-transaksi penting, seperti sistem penjualan data pelanggan,
manufaktur, termasuk data dari transaksi web. Data warehouse menghasilkan data historis dan data
terkini dari berbagai sistem operasi pada organisasi. Data ini dikombinasikan dengan data sumber
eksternal, serta mengoreksi data yang tidak akurat dan kurang lengkap sekaligus memperbaiki
susunan data bagi kepentingan pelaporan dan analisis data bagi pihak manajemen sebelum
dimasukkan ke dalam data warehouse.
Data warehouse menjamin ketersediaan data bagi siapa pun untuk diakses saat dibutuhkar
namun tidak dapat diubah. Sistem data warehouse juga menyediakan rangkaian perangkat untuk
mencari keterangan baik secara khusus maupun secara terstandardisasi, beserta pelaporan dengan
fasilitas tampilan grafis.
Perusahaan-perusahaan sering membangun data warehouse bagi perusahaannya, di many
sebuah pusat data warehouse melayani seluruh divisi dan bagian dari organisasi, atau mereka
menciptakan data warehouse yang berukuran lebih kecil dan terdesentralisasi (tersebar) yang disebut
dengan data mart. Data mart adalah bagian dari data warehouse yang diringkas atau dikhususkan
untuk penanganan jenis-jenis data tertentu pada database yang terpisah untuk kelompok pengguna
yang telah ditentukan. Sebagai contoh, perusahaan bisa saja mengembangkan data mart bagi divisi
penjualan dan pemasaran untuk mengurusi informasi pelanggan. Perusahaan penjual buku Barnes &
Noble biasanya menggunakan rangkaian data mart untuk data yang dihasilkan oleh titik
penjualannya (gerainya), pada toko-toko ritelnya, toko ritel yang terdapat di kampus, dan yang
terakhir untuk penjualan secara online.
Hadoop
Produk DBMS relasional dan data warehouse tidak sesuai untuk mengorganisasikan dan
menganalisis data berkapasitas besar atau data yang tidak dapat dengan mudah dibentuk ke dalam

format kolom dan baris yang digunakan dalam model datanya. Untuk menangani data berkapasitas
besar yang semi-terstruktur ataupun tidak sama sekali, perusahaan menggunakan Hadoop. Hadoop
adalah kerangka kerja open-source yang dikelola oleh Apache Software Foundation yang
memungkinkan pendistribusian proses data berkapasitas besar secara paralel pada komputerkomputer berbiaya terjangkau. Hadoop memecah masalah data besar tersebut menjadi bagianbagian
yang lebih kecil, kemudian mendistribusikannya ke ribuan titik pemrosesan komputer yang berbiaya
terjangkau, lalu mengombinasikan hasilnya menjadi rangkaian data yang lebih kecil untuk
mempermudah proses analisis. Anda bisa menggunakan Hadoop untuk menemukan penawaran tiket
penerbangan terbaik di internet, mencari alamat sebuah restoran, melakukan pencarian pada Google,
atau terhubung dengan teman Anda di Facebook.
Hadoop terdiri atas beberapa layanan pokok: Hadoop Distributed File System (HDFS) untuk
penyimpananfi/e data dan MapReduce untuk pemrosesan data paralel dengan tampilan grafis tinggi.
HDFS menghubungkan secara bersamaan file-file sistem pada sejumlah titik dalam sebuah cluster
Hadoop untuk kemudian diubah menjadi file sistem tunggal berukuran besar. MapReduce buatan
Hadoop terinspirasi oleh MapReduce buatan Google dalam memecah rangkaian pemrosesan data
berukuran besar dan menyebarkan pekerjaan-pekerjaan tersebut ke berbagai titik dalam sebuah
cluster. Hbase, database non-relasional buatan Hadoop, menyediakan akses cepat ke data yang
tersimpan pada HDFS dan platform transaksional untuk mengoperasikan aplikasi-aplikasi real- time
berskala tinggi.
Hadoop dapat menangani jenis data apa pun dengan kapasitas besar, termasuk data transaksi
terstruktur, data dengan struktur yang agak longgar seperti masukan dari Facebook dan Twitter, datadata yang kompleks seperti log file pada server Web, data audio dan video yang tidak terstruktur.
Hadoop beroperasi pada cluster server yang tidak mahal, serta prosesornya dapat ditambahkan atau
dikurangi sesuai kebutuhan. Perusahaan menggunakan Hadoop untuk menganalisis data dengan
volume yang sangat besar serta memfragmentasi area untuk data yang terstruktur maupun yang tidak
terstruktur sebelum disimpan ke dalam data warehouse. Facebook menyimpan banyak sekali datanya
dalam cluster Hadoopnya yang sangat besar, yang diperkirakan dapat menahan 100 petabyte, sekitar
10.000 kali lebih banyak informasi daripada Perpustakaan Konggres. Yahoo menggunakan Hadoop
untuk menelusuri perilaku dari pengguna sehingga dapat memodifikasi tampilan laman pembukan
untuk menyesuaikan dengan kepentingan mereka. Perusahaan pencari Life Science NextBio
menggunakan Hadoop dan Hbase untuk memproses data bagi perusahaan farmasi yang
melaksanakan penelitian genomic. Para vendor database terkemuka, seperti IBM, Hewlett-Packard,
Oracle, dan Microsoft memiliki distribusi perangkat lunak Hadoop-nya sendiri. Para vendor lainnya
menawarkan perangkat untuk memindahkan data ke dalam dan keluar dari Hadoop atau untuk
menganalisis data di dalam Hadoop.
Komputasi Dalam-Memori
Cara lainnya untuk memfasilitasi analisis data yang besar adalah dengan menggunakan
komputasi dalam-memori (in-memory computing), yang sangat mengandalkan pada memori utama
dari komputer (computer's main memoryRAM) untuk data penyimpanan. (DBMS yang
konvensional menggunakan sistem penyimpanan disk). Para pengguna akan mengakses data yang
disimpan dalam memori sistem utama, dengan demikian dapat menghilangkan kemacetan dari
mengambil dan membaca data dalam suatu database tradisional, berdasarkan pada disk dan secara
dramatis akan mempersingkat waktu tunggu atas permintaan. Pada pemrosesan dalam memori akan
memungkinkan bagi serangkaian data yang sangat besar, sebesar ukuran data mart atau data
warehouse yang kecil, untuk meletakkan seluruhnya dalam memori. Penghitungan bisnis yang rumit

yang biasanya memerlukan waktu berjam-jam atau berhari-hari akan dapat diselesaikan dalam
hitungan detik, dan ini bahkan dapat diselesaikan dengan menggunakan perangkat genggam.
Bab sebelumnya menggarnbarkan beberapa kemajuan dalam teknologi perangkat keras
komputer modern yang memungkinkan pemrosesan dalam memori, seperti misalnya prosesor liar
biasa yang berkecepatan tinggi, pemrosesan multicore, dan akan menurunkan harga dari memori
komputer. Teknologi-teknologi ini dapat membantu perusahaan untuk mengoptimalkan penggunaan
dari memori dan mempercepat kinerja pemrosesan, sementara itu juga dapat menurunkan biayanya.
Produk-produk komersial terkemuka bagi komputasi dalam memori meliputi, High
Performance Analytics Appliance (HANA) dari SAP dan Oracle Exalytics. Masing-masing
menyediakan serangkaian komponen perangkat lunak yang terintegrasi, meliputi perangkat lunak
database dalam memori dan perangkat lunak analitis yang terspesialisasi, yang menjalankan
perangkat keras untuk pekerjaan komputasi dalam memori.
Centrica, utilitas gas dan listrik, memanfatkan HANA untuk merekam dengan cepat dan
menganalisis sejumlah data yang sangat besar yang dihasilkan oleh alat pengukur yang andal.
Perusahaan dapat menganalisis pemakaian setiap 15 menit, memberikan gambaran dari pemakaian
yang lebih ielas oleh rumah tangga, ukuran rumah, tipe bisnis yang dilayani, atau tipe gedung.
HANA juga membantu Centrica untuk menunjukkan kepada para pelanggannya pola pemakaian
energi mereka secara real-time dengan menggunakan perangkat online dan mobile.
Platform Analitis
Para vendor database komersial telah mengembangkan platform analitis (analytic platforms)
berkecepatan tinggi yang terspesialisasi dengan menggunakan baik teknologi terkait maupun yang
tidak terkait yang dioptimalkan untuk menganalisis kumpulan data yang besar. Platform analitis ini,
seperti misalnya IBM Netezza dan Oracle Exadata, menampilkan sistem perangkat keras-perangkat
lunak yang telah dikonfigurasi sebelumnya, yang secara spesifik dirancang untuk pemrosesan
permintaan dan analitis. Sebagai contoh, IBM Netezza menampilkan database yang terintegrasi
secara ketat, server, dan komponen-komponen penyimpanan yang menangani pertanyaan analitis
yang rumit 10 hingga 100 kali lebih cepat daripada sistem tradisional. Platform analitis juga
memasukkan sistem dalam memori dan NoSQL sistem manajemen database non-relasional.
Gambar 6.10 mengilustrasikan infrastruktur intelijen bisnis kontemporer dengan
menggunakan teknologi yang baru saja telah kita gambarkan. Data saat ini dan data historis akan
diekstrak dari sistem operasional yang banyak seiring dengan data web, data yang dihasilkan oleh
mesin, data audio/visual yang tidak terstruktur, dan data dari sumber-sumber eksternal yang telah
direstrukturisasi dan diorganisasikan ulang untuk pelaporan dan analisis. Cluster Hadoop melakukan
proses data yang besar sebelumnya untuk digunakan dalam data warehouse, data

mart, atau platform analitis, atau untuk permintaan langsung oleh para pengguna power.
Output meliputi laporan dan dashboard yang sama halnya dengan basil query. Bab 12 akan
membahas mengenai berbagai macam tipe dari para pengguna BI dan pelaporan BI dengan perincian
yang lebih lengkap.
PERANGKAT ANALITIS: HUBUNGAN, POLA, TREN
Ketika data telah direkam dan diorganisasikan dengan menggunakan teknologi intelijen
bisnis yang baru raja telah kita bahas, mereka tersedia bagi analisis lebih lanjut dengan menggunakan
perangkat lunak untuk men-query dan melaporkan database, analisis data multidimensional (online
analytical processingOLAP), dan data mining. Pada bagian ini akan memperkenalkan kepada
Anda, alat bantu-alat bantu tersebut, dengan lebih terperinci mengenai analitis intelijensi bisnis dan
penerapannya pada Bab 12.
Pemrosesan Analitis Online (OLAP)
Seandainya, perusahaan Anda menjual empat produk yang berbedamur, baut, cincin
penutup, dan sekrupdi kawasan Timur, Barat, dan Pusat. Jika Anda ingin mengajukan suatu
pertanyaan yang cukup jelas, seperti berapa banyak cincin penutup yang terjual selama kuartal
sebelumnya, Anda akan lebih mudah untuk menemukan jawaban dengan men-query database
penjualan Anda. Namun, bagaimana jika Anda ingin mengetahui berapa banyak yang terjual dalam
tiap-tiap wilayah penjualan Anda dan membandingkan basil yang sebenarnya dengan penjualan yang
diproyeksikan?

Untuk memperoleh jawaban tersebut, maka Anda akan memerlukan pemrosesan analitis
online (online analytical processingOLAP). OLAP mendukung analis data yang multidimensional.
yang memungkinkan bagi para pengguna untuk melihat data yang sama dalam cara-cara yang
berbeda dengan menggunakan banyak dimensi. Masing-masing aspek dari informasiproduk.
penetapan harga, biaya, wilayah, atau periode waktumewakili dimensi yang berbeda. Sehingga.
seorang manajer produk akan menggunakan alat bantu analisis data multidimensional untuk
mempelajari berapa banyak cincin penutup yang terjual di wilayah Timur pada Juni, bagaimana
angka tersebut dibandingkan dengan bulan lalu dan bulan Juni sebelumnya, serta bagaimana bila
dibandingkan dengan peramalan penjualan. OLAP memungkinkan bagi para pengguna untuk
memperoleh jawaban-jawaban secara online atas pertanyaan-pertanyaan khusus, misalnya hal
tersebut dalam jumlah waktu yang cukup cepat, bahkan ketika data disimpan dalam database yang
sangat besar, seperti angka penjualan selama beberapa tahun.
Gambar 6.11 memperlihatkan suatu model multidimensional yang dapat diciptakan untuk
mewakili produk, wilayah, penjualan aktual, dan penjualan yang diproyeksikan. Suatu matriks
mengenai penjualan secara aktual dapat ditumpuk pada bagian atas dari matriks penjualan yang
diproyeksikan untuk membentuk sebuah kubus dengan 6 sisi. Jika Anda memutar kubus 90 derajat
satu arah, maka sisi yang ditunjukkan akan menjadi produk versus penjualan aktual dengan
penjualan yang diproyeksikan. Jika Anda memutar kubus 90 derajat lagi, maka Anda akan melihat
wilayah versus penjualan aktual dengan penjualan yang diproyeksikan. Jika Anda memutar 180
derajat dari sudut pandang awal, maka Anda akan melihat penjualan yang diproyeksikan dan produk
versus wilayah. Kubus-kubus dapat diulang di dalam kubus untuk membangun sudut pandang yang
rumit atas data. Perusahaan akan menggunakan database multidimensional yang terspesialisasi
lainnya atau sebuah alat bantu yang dapat menciptakan sudut pandang multidimensional atas data
dalam database relasional.
Data Mining
Database tradisional akan melakukan query pada jawaban atas pertanyaan, misalnya, "Berapa
banyak unit dari produk nomor 403 yang dikirimkan pada Februari 2013"? OLAP, atau analisis
multidimensional, yang mendukung banyak permintaan atas informasi yang lebih rumit, misalnya,
"Bandingkan antara penjualan atas produk nomor 403 terkait dengan rencana secara kuartalan dan
penjualan di wilayah penjualan selama 2 tahun sebelumnya". Dengan OLAP dan analisis data yang
berorientasi pada query, maka para pengguna harus memiliki suatu gagasan yang baik mengenai
informasi mana yang sedang mereka amati.
Data mining lebih terdorong pada penemuan. Data mining memberikan wawasan pada
korporat, data yang tidak dapat diperoleh dengan OLAP dengan menemukan pola-pola yang
tersembunyi serta hubungan dalam database yang besar dan aturan menarik kesimpulan dari mereka
untuk memprediksikan perilaku pada masa yang akan datang. Pola-pola dan aturan-aturan yang
digunakan untuk membimbing dalam pengambilan keputusan dan peramalan dampak dari
keputusan-keputusan tersebut. Tipe dari informasi yang dapat diperoleh dari data mining, meliputi
asosiasi, urutan, klasifikasi, cluster, dan peramalan.
Asosiasi merupakan kejadian yang dikaitkan dengan suatu peristiwa tunggal. Sebagai
contoh, penelitian mengenai pola pembelian di supermarket akan mengungkapkan bahwa,
ketika keripik jagung dibeli, maka minuman cola akan dibeli sebanyak 65 persen, tetapi
ketika terdapat promosi, maka cola yang dibeli meningkat menjadi 85 persen. Informasi ini
dapat membantu

para manajer untuk mengambil keputusan yang lebih baik karena mereka telah mempelajari
manfaat dari suatu promosi.
Dalam sekuen, maka peristiwa-peristiwa akan dikaitkan berdasarkan waktu. Kita dapat

menemukan contohnya, jika sebuah rumah dibeli, terdapat 65 persen kemungkinan sebuah
kulkas baru akan dibeli juga dalam dua minggu, dan 45 persen kemungkinan sebuah oven akan
dibeli dalam waktu sebulan setelah rumah itu dibeli.
Klasifikasi membahas pola-pola yang menggambarkan kelompok yang mana suatu barang yang

dimiliki dengan memeriksa barang yang ada, yang telah diklasifikasikan dan dengan menarik
kesimpulan dari serangkaian aturan. Sebagai contoh, bisnis seperti misalnya kartu kredit atau
perusahaan telepon akan khawatir kehilangan para pelanggannya yang loyal. Klasifikasi dapat
membantu untuk menemukan ciri-ciri dari para pelanggan yang memiliki kecenderungan untuk
berhenti dan dapat meyediakan suatu model untuk membantu para manajer dalam
memprediksikan siapakah para pelanggan tersebut sehingga para manajer dapat merancang
kampanye-kampanye khusus untuk mempertahankan para pelanggan tersebut.
Pengklasteran (clustering) bekerja dengan cara yang sama seperti klasifikasi ketika tidak ada

kelompok yang masih belum didefinisikan. Alat bantu data mining dapat menemukan
pengelompokan yang berbeda di dalam data, seperti misalnya menemukan daya tarik kelompok
atas kartu bank atau membagi suatu database ke dalam kelompok-kelompok dari para pelanggan
yang didasarkan pada demografis dan tipe dari investasi pribadi.
Meskipun penerapan-penerapan tersebut melibatkan prediksi, tetapi peramalan menggunakan
prediksi dalam cara yang berbeda. Peramalan menggunakan serangkaian nilai yang ada untuk
meramalkan berapa besar dari nilai lainnya. Sebagai contoh, peramalan akan menemukan polapola
dalam data untuk membantu para manajer dalam mengestimasi nilai masa mendatang dari variabelvariabel yang terus-menerus, seperti angka penjualan.
Sistem-sistem tersebut menjalankan analisis tingkat tinggi atas pola atau kecenderungan, tetapi
mereka juga dapat menelusuri untuk menyediakan lebih terperinci ketika diperlukan. Terdapat
aplikasi data mining bagi seluruh area fungsional dalam bisnis, dan bagi pemerintah, serta pekerjaan

ilmiah. Salah satu penggunaan yang terkenal atas data mining adalah menyediakan analisis pola
dalam data pelanggan yang terperinci bagi kampanye pemasaran one-to-one atau untuk
mengidentifikasi para pelanggan yang menguntungkan. (Lihat studi kasus pada akhir bab ).
Caesars Entertainment, yang dahulunya dikenal dengan Harrah's Entertainment, merupakan
perusahaan permainan terbesar di dunia. Caesars Entertainment secara terus-menerus menganalisis
data mengenai para pelanggannya yang dikumpulkan ketika orang-orang memainkan mesin slotnya
atau ketika menggunakan kasino dan hotelnya. Departemen pemasaran korporat menggunakan
informasi tersebut untuk membangun profil permainan yang lebih terperinci, yang didasarkan pada
nilai konsumen tertentu yang sedang berlangsung terhadap perusahaan. Sebagai contoh. data mining
memungkinkan bagi Caesars Entertainment untuk mengetahui permainan yang paling disukai oleh
pelanggan rutin adalah pada salah satu dari kasino riverboat-nya, dilengkar dengan pilihan pribadi
untuk akomodasi kamar, restoran, dan hiburan. Informasi tersebut menjadi pedoman pengambilan
keputusan manajemen mengenai bagaimana mempertahankan para pelanggan yang menguntungkan,
mendorong para pelanggan untuk menghabiskan lebih banyak dana, dan menarik lebih banyak
pelanggan dengan menghasilkan pendapatan tinggi yang potensial Intelijen bisnis meningkatkan
keuntungan Caesars Entertainment sehingga menjadi pusat dari strategi bisnis perusahaan.
Teks Mining dan Web Mining
Nanaun, data yang tidak terstruktur, yang sebagian besar dalam bentuk file teks, diyakini akan
bertanggung jawab atas lebih dari 80 persen dari informasi organisasional yang bermanfaat d,
merupakan salah satu sumber utama data besar yang ingin dianalisis oleh perusahaan. Surrel, memo,
transkrip pusat panggilan, tanggapan-tanggapan atas survei, kasus legal, deskripsi pate dan laporan
layanan yang semuanya bernilai untuk menemukan pola dan kecenderungan ya] akan membantu para
karyawan dalam mengambil keputusan bisnis yang lebih baik. Perangl, text mining (penelusuran
teks) sekarang tersedia untuk membantu bisnis dalam menganalisis de tersebut. Alat-alat bantu ini
dapat mengekstrak elemen-elemen kunci dari rangkaian data yang besar yang tidak terstruktur,
menemukan pola dan hubungan, dan meringkas informasi.
Bisnis dapat beralih kepada text mining untuk menganalisis transkrip dari panggilan kepada pusat
layanan pelanggan untuk mengidentifikasi layanan utama dan menyelesaikan masalah at untuk
mengukur pendapat pelanggan mengenai perusahaan mereka. Perangkat lunak sentimen (sentiment
analysis) dapat melakukan penelusuran atas komentar teks dalam pes surel, blog, percakapan dalam
media sosial, atau bentuk survei untuk mendeteksi opini ya: menyenangkan dan yang tidak
menyenangkan mengenai topik bahasan tertentu.
Sebagai contoh, pialang diskon Charles Schwab menggunakan perangkat lunak Attens: Analyze
untuk menganalisis ratusan ribu interaksi pelanggannya tiap hulan. Perangkat lunak dapat
menganalisis catatan, surel, tanggapan survei, dan diskusi online dari layanan pelangg. Schwab untuk
menemukan tanda-tanda ketidakpuasan yang menyebabkan pelanggan berhe: menggunakan jasa dari
perusahaan. Attensity dapat secara otomatis mengidentifikasi berba macam "suara" yang digunakan
oleh pelanggan untuk mengekspresikan umpan balik mere (seperti suara yang positif, negatif, atau
sesuai dengan kondisi) untuk menunjukkan dengan keinginan dari seseorang untuk membeli,
berhenti membeli, atau reaksi terhadap suatu produk tertentu atau pesan yang disampaikan melalui
pemasaran. Schwab menggunakan informasi untuk mengambil tindakan korektif, seperti
meningkatkan komunikasi pialang secara dengan pelanggan dan mencoba untuk memecahkan
permasalahan dengan segera yang membuat pelanggan tidak puas.

Web merupakan sumber utama lainnya dari data besar yang tidak terstruktur untuk
mengungkapkan pola, kecenderungan, dan wawasan dalam perilaku konsumen. Penemuan serta
analisis pola dan informasi yang bermanfaat dari World Wide Web disebut dengan web mining
(penelusuran web). Bisnis akan beralih kepada web mining untuk membantu mereka dalam
memahami perilaku konsumen, melakukan evaluasi atas keefektifan situs web tertentu, atau
kuantitas dari keberhasilan suatu kampanye pemasaran. Misalnya, para pemasar menggunakan
Google Trend dan Google Insight untuk layanan Search, yang menelusuri popularitas dari berbagai
jenis kata dan frase yang digunakan dalam query pencari dari Google, untuk mempelajari apa yang
diminati oleh orang-orang, dan apakah mereka tertarik untuk membeli.
Web mining akan mencari pola dalam data melalui penelusuran konten, penelusuran struktur, dan
penelusuran penggunaan. Penelusuran konten dari web merupakan suatu proses untuk mengekstrak
pengetahuan dari konten dalam laman web, meliputi teks, gambar, audio, dan data video.
Penelusuran struktur dari web memeriksa data yang terkait dengan struktur dari situs web tertentu.
Sebagai contoh, tautan yang menunjuk pada suatu dokumen mengindikasikan popularitas dari
dokumen tersebut, sementara itu tautan keluar dari suatu dokumen mengindikasikan pengayaan atau
mungkin variasi dari topik yang tercakup dalam dokumen. Penelusuran penggunaan web menelaah
data interaksi pengguna yang dicatat oleh server web kapan pun permintaan dari sumber daya situs
web tersebut diterima. Catatan penggunaan data mengenai perilaku pengguna ketika pengguna
menelusuri atau membuat transaksi pada situs web dan mengumpulkan data dalam server log.
Dengan menganalisis data tersebut, dapat membantu perusahaan dalam menentukan nilai dari
pelanggan tertentu, melintasi strategi pemasaran seluruh produk, dan keefektifan dari kampanye
promosi.
Sesi Interaktif: Teknologi menggambarkan pengalaman organisasi sebagaimana mereka
menggunakan alat bantu analitis dan teknologi intelijen bisnis yang telah kita bahas untuk berjuang
terhadap tantangan "data besar".
DATABASE DAN WEB
Pernahkah Anda mencoba menggunakan web untuk menempatkan pesanan atau melihat katalog
produk? Jika pernah, Anda mungkin menggunakan situs web yang ditautkan dengan database
internal korporat. Saat ini, banyak perusahaan yang menggunakan web untuk membuat beberapa
informasi dalam database internal mereka disediakan bagi pelanggan dan rekan bisnis.
Misalnya, seorang pelanggan dengan browser web ingin mencari database peritel secara online
untuk informasi penetapan harga. Gambar 6.12 mengilustrasikan bagaimana pelanggan mengakses

database internal dari peritel tersebut melalui web. Pengguna mengakses situs web peritel melalui
internet dengan menggunakan perangkat lunak browser web pada komputer PC kliennya. Perangkat
lunak browser web akan meminta data dari database organisasi, dengan menggunakan perintah
HTML untuk berkomunikasi dengan server web.
Karena banyak database back-end tidak dapat menerjemahkan perintah tertulis dalam HTML, maka
server web mengirimkan permintaan data ini kepada perangkat lunak yang menerjemahkan perintah
HTML menjadi SQL sehingga perintah dapat diproses dengan DBMS yang bekerja sama dengan
database tersebut. Dalam lingkungan idien/server, DBMS disimpan pada komputer khusus yang
disebut server database (database server). DBMS menerima permintaan SQL dan menyediakan data
yang diperlukan. Middleware akan memindahkan informasi dari database internal organisasi
kembali kepada server web untuk dikirimkan dalam bentuk laman web kepada penggunanya.
Gambar 6.12 memperlihatkan bahwa middleware akan bekerja diantara server web dengan DBMS
dapat berupa server aplikasi yang bekerja pada komputer khusus itu sendiri (lihat Bab 5). Perangkat
lunak server aplikasi menangani semua operasional aplikasi, meliputi pemrosesan transaksi dan
akses data, antara komputer berbasis browser dengan aplikasi bisnis atau database back-end
perusahaan. Server aplikasi mengambil permintaan dari server web, menjalankan logika bisnis untuk
memproses transaksi berdasarkan permintaan-permintaan tersebut, dan menyediakan konektivitas
kepada sistem atau database back-end organisasi. Alternatif lainnya, perangkat lunak untuk
menangani operasional-operasional tersebut dapat berupa suatu program khusus atau skrip CGI.
Skrip CGI merupakan suatu program yang ringkas dengan menggunakan spesifikasi Common
Gateway Interface (CGI) untuk pemrosesan data pada server web.
Terdapat sejumlah keuntungan dengan menggunakan web untuk mengakses database internal
organisasi. Pertama, perangkat lunak browser web jauh lebih mudah untuk digunakan daripada
perangkat query yang dimiliki. Kedua, tampilan web membutuhkan sedikit perubahan atau tidak
sama sekali terhadap database internal. Dibutuhkan biaya yang lebih rendah untuk menambahkan
antar muka web di depan sistem yang diwariskan daripada merancang kembali dan membangun
kembali sistem untuk meningkatkan akses pengguna.
Mengakses database korporat melalui web menciptakan efisiensi, peluang, dan model bisnis yang
baru.ThomasNet.com menyediakan direktori online yang terkini dengan lebih dari 650.000 pemasok
produk industri, seperti bahan kimia, logam, plastik, karet, dan peralatan otomotif Sebelumnya
disebut Thomas Register, perusahaan yang digunakan untuk mengirimkan katalog kertas yang
berukuran sangat besar yang berisi informasi-informasi tersebut. Sekarang dia menyediakan
informasi itu kepada pengguna secara online melalui situs webnya dan telah menjadi perusahaan
yang semakin kecil, lebih ramping.
Perusahaan lainnya telah menciptakan bisnis yang seluruhnya baru dengan berdasarkan pada akses
menuju database yang besar melalui web. Salah satunya adalah layanan jejaring sosial Facebook,
yang membantu para penggunanya untuk tetap berkoneksi dengan satu sama lain bertemu orangorang baru. Fitur Facebook "profil" dengan informasi lebih dari 950 juta para pengguna aktif dengan
informasi mengenai mereka sendiri, meliputi ketertarikan, teman, foto dan grup di mana mereka
berafiliasi. Facebook mempertahankan database yang sangat besar pada suatu tempat dan mengelola
seluruh konten isinya.
Terdapat banyak database yang diaktitkan dengan web dalam sektor publik untuk membantu
pelanggan dan warga negara untuk mengakses informasi yang berguna. Sesi Interaktif: Organisasi

akan menggambarkan salah satu dari database tersebut, yang telah menghasilkan kontroversi atas
metode-metodenya dalam menyediakan data keselamatan atas produk konsumen.
6.4

MENGELOLA SUMBER DATA

Persiapan database hanyalah merupakan permulaan. Agar dapat memastikan bahwa data bagi bisnis
Anda tetap akurat, dapat diandalkan, dan siap tersedia bagi mereka yang memerlukannya, maka
bisnis Anda memerlukan kebijakan dan prosedur khusus untuk manajemen data.
MENETAPKAN KEBIJAKAN INFORMASI
Setiap bisnis, skala besar maupun kecil, memerlukan kebijakan informasi. Data perusahaan Anda
merupakan sumber daya yang penting, dan Anda tidak ingin seseorang melakukan sesuatu yang
mereka inginkan dengan mereka. Anda perlu memiliki aturan-aturan mengenai bagaimana data
diorganisasikan dan dipertahankan, dan siapa yang diizinkan untuk melihat data atau mengubah
mereka.
Kebijakan informasi (information policy) menentukan aturan organisasi dalam hal
pembagian, penyebaran, perolehan, standardisasi, klasifikasi, dan penyimpanan informasi. Undangundang kebijakan informasi menjelaskan prosedur dan akuntabilitas yang spesifik, mengidentifikasi
informasi dapat saling dibagikan oleh pengguna dan unit organisasi, di mana informasi dapat
didistribusikan, dan siapa yang bertanggung jawab untuk memperbarui dan memelihara
informasinya. Sebagai contoh, kebijakan informasi umumnya menentukan bahwa hanya para
anggota terpilih dari departemen penggajian dan sumber daya manusia yang memiliki hak untuk
mengubah dan melihat data karyawan yang sensitif, seperti misalnya gaji karyawan atau nomor
jaminan sosialnya, dan departemen-departemen ini yang bertanggung jawab untuk memastikan
bahwa data karyawan tersebut adalah akurat.
Jika Anda berada dalam bisnis skala kecil, maka kebijakan informasi akan ditetapkan dan
diimplementasikan oleh pemilik atau manajer. Dalam organisasi berskala besar, pengelolaan dan
perencanaan informasi sebagai sumber daya perusahaan membutuhkan fungsi administrasi data
formal. Administrasi data (data administration) bertanggung jawab atas kebijakan dan prosedur yang
mengatur data sebagai sumber daya organisasi. Tanggung jawab tersebut meliputi pengembangan
kebijakan informasi, perencanaan data, pengawasan rancangan database logis, dan pengembangan
kamus data, serta pemantauan terhadap spesialis sistem informasi dan kelompok pengguna akhir
dalam menggunakan data.
Anda mungkin pernah mendengar istilah tata kelola data (data governance) yang digunakan
untuk menggambarkan banyak hal dari aktivitas tersebut. Didukung oleh IBM, tata kelola data
berkaitan dengan kebijakan dan proses untuk mengelola ketersediaan, kegunaan, integritas, dan
keamanan dari data yang digunakan dalam suatu perusahaan, dengan penekanan khusus pada
dukungan untuk privasi, keamanan, kualitas data, dan kepatuhan terhadap berbagai aturan
pemerintah.
Organisasi yang besar juga memiliki rancangan database dan kelompok manajemen di dalam
divisi sistem informasi perusahaan yang bertanggung jawab untuk mendefinisikan dan mengatur
struktur dan isi database, serta memeliharan database tersebut. Dengan bekerja sama secara erat
dengan para pengguna, kelompok perancangan menciptakan database fisik, relasi logic antarelemennya, dan aturan akses serta prosedur keamanan. Fungsi-fungsi yang dilakukannya disebut
administrasi database (database administration).

MEMASTIKAN KUALITAS DATA


Database dan kebijakan informasi yang dirancang dengan baik akan berlanjut pada jaminan
bahwa perusahaan akan memiliki informasi yang diperlukannya. Namun, langkah-langkah tambahan
harus diambil untuk memastikan bahwa data dalam database perusahaan akurat dan tetap dapat
diandalkan.
Apa yang akan terjadi jika nomor telepon pelanggan atau saldo rekening nasabah tidak
dicatat dengan benar? Apakah dampaknya jika database memiliki harga yang keliru untuk suatu
produk yang Anda jual atau sistem penjualan dan sistem persediaan Anda memperlihatkan harga
yang berbeda untuk produk yang sama? Data yang tidak akurat, tidak tepat waktu, atau tidak
konsisten dengan sumber informasi lainnya akan mengarahkan pada pengambilan keputusan yang
tidak tepat, penarikan kembali produk, dan kerugian finansial. Gartner Inc. melaporkan bahwa lebih
dari 25 persen data yang sangat penting dalam perusahaan besar yang terdaftar dalam database
Fortune 1000 adalah tidak akurat atau tidak lengkap, meliputi kode produk dan penjelasan produk
yang buruk, kesalahan dalam gambaran persediaan, data finansial yang salah, informasi pemasok
yang tidak benar, dan data karyawan yang salah. Penelitian Sirius Decision yang dituliskan dalam
"The Impact of Bad Data on Demand Creation" menemukan bahwa 10 hingga 25 persen pelanggan
dan prospek pelanggan mencatat isi data penting yang salah. Untuk memperbaiki kesalahankesalahan tersebut pada sumber mereka dan berikutnya melaksanakan dengan baik untuk
mempromosikan kualitas data yang meningkatkan produktivitas dari proses penjualan dan
menghasilkan peningkatan sebesar 66 persen dalam pendapatan.
Beberapa dari permasalahan kualitas data tersebut disebabkan oleh data ganda dan konsisten
yang dihasilkan oleh banyaknya sistem yang dimasukkan ke dalam data warehouse Sebagai contoh,
sistem pemesanan penjualan dan sistem manajemen persediaan keduanya akan mempertahankan data
mengenai produk-produk perusahaan. Namun, sistem pemesanan penjualan menggunakan istilah
Nomor Barang dan sistem persediaan menyebut atribut yang sama dengan Nomor Produk. Sistem
penjualan, persediaan, atau manufaktur dari seorang pengecer pakaian akan menggunakan kode-kode
yang berbeda untuk mewakili nilai bagi suatu atribut. Salah satu sister': akan merepresentasikan
ukuran pakaian dengan "ekstra besar", sedangkan sistem lainnya akan menggunakan kode "XL"
untuk tujuan yang sama. Selama proses perancangan database warehouse. data menggambarkan
entitas, seperti pelanggan, produk, atau pesanan, harus diberi nama clan didefinisikan secara
konsisten untuk semua area bisnis yang menggunakan database.
Coba pikirkan berapa kali Anda menerima surat iklan yang sama pada hari yang sama. Ini
mungkin merupakan akibat dari tersimpannya nama Anda lebih dari sekali di dalam database.
Nama Anda mungkin ditulis dengan salah atau Anda menggunakan nama tengah Anda untuk
keperluan dan bukan untuk hal lain atau informasi awalnya dimasukkan ke dalam sebuah formulir
tidak dibaca dengan benar oleh sistem komputer. Karena ketidakkonsistenan ini, maka database akan
memperlakukan Anda sebagai orang yang berbeda! Kita sering kali menerima surat yang ditujukan
kepada Laudon, Lavdon, Lauden, atau Landon (padahal orang yang dituju hanya satu).
Jika database dirancang dengan tepat dan standar data keseluruhan perusahaan ditentukan
dengan baik, maka elemen data yang mengalami duplikasi atau tidak konsisten akan diminimalkar.
Sebagian besar permasalahan kualitas data, seperti salah mengeja nama, nomor terbalik, atau ko yang
tidak benar atau hilang, bersumber dari kesalahan ketika memasukkan data. Insiden kesalanan
tersebut akan meningkat seiring dengan perusahaan memindahkan kegiatan bisnisnya ke web

danmemungkinkan pelanggan dan pemasok untuk memasukkan data ke dalam situs web mereka
yang secara langsung memperbarui sistem internal.
Sebelum database baru dipergunakan, maka organisasi perlu mengidentifikasi dan
memperbaiki data yang salah dan menciptakan program-program yang lebih baik untuk mengedit
data ketika database tersebut mulai dioperasionalkan. Analisis kualitas data sering dimulai dengan
audit kualitas data (data quality audit), yang merupakan survei terstruktur atas keakuratan dan
tingkat kelengkapan dari data dalam suatu sistem informasi. Audit kualitas data dapat
diselenggarakan dengan melakukan survei keseluruhan file data, menyurvei sampel file data, atau
menyurvei pengguna data atas persepsi mereka mengenai kualitas data.
Pembersihan data (data cleansing), juga dikenal sebagai data scrubbing, terdiri atas kegiatan
mendeteksi dan mengoreksi data dalam database yang tidak benar, tidak lengkap, tidak diformat
dengan tepat, atau berlebihan. Pembersihan data bukan hanya mengoreksi kesalahan, tetapi juga
menekankan konsistensi diantara serangkaian data yang berbeda yang berasal dari sistem informasi
yang terpisah. Perangkat lunak pembersihan data yang khusus tersedia untuk menyurvei file data
secara otomatis, memperbaiki kesalahan dalam data, dan mengintegrasikan data dalam format yang
konsisten bagi semua bagian dari perusahaan.
Permasalahan kualitas data bukan hanya merupakan permasalahan dalam bisnis semata.
Mereka juga menimbulkan permasalahan yang serius bagi individual, memengaruhi kondisi
keuangan mereka, dan bahkan pekerjaan mereka. Sebagai contoh, data yang tidak akurat atau usang
mengenai riwayat kredit dari nasabah yang dikelola oleh lembaga kredit dapat mencegah para
individual yang layak diberikan kredit dari memperoleh pinjaman atau menurunkan peluang mereka
dalam menemukan atau mempertahankan suatu pekerjaan.
MODUL PENELUSURAN PEMBELAJARAN
Dalam Penelusuran Pembelajaran akan memberikan bahan yang relevan dengan topik yang
dibahas dalam bab ini:
1.

Rancangan Database, Normalisasi, dan Diagram Relasi-Entitas.

2.

Pengenalan SQL

3.

Model Data Jaringan dan Hierarkis

Rangkuman
1. Apakah yang menjadi permasalahan dalam pengelolaan sumber daya data dalam lingkungan
file tradisional dan bagaimana mereka dapat diatasi dengan sistem manajemen database?
Teknik manajemenfile tradisional menyulitkan bagi organisasi untuk menelusuri seluruh bagian
data yang mereka gunakan dengan cara sistematis dan untuk mengatur data-data tersebut sehingga
dapat lebih mudah untuk diakses. Area dan kelompok fungsional yang berbeda dimungkinkan
untuk mengembangkan file mereka sendiri dengan bebas. Dari waktu ke waktu, lingkungan
manajemenfile tradisional menciptakan permasalahan, seperti redundansi dan ketidakkonsistenan
data, ketergantungan data terhadap program, tidak fleksibel, keamanan yang buruk,
kurangnya pembagian dan ketersediaan data. Sistem manajemen database (database management
systemDBMS memecahkan permasalahan-permasalahan tersebut dengan perangkat lunak yang
mengizinkan sentralisasi data dar. manajemen data sehingga bisnis memiliki sumber tunggal yang

konsisten untuk semua kebutuhan data mereka Dengan menggunakan DBMS dapat meminimalkan
redundansi dan tidak konsistennya file.
1.

Apakah kapabilitas utama dari DBMS dan mengapa DBMS relasional menjadi sangat
ampuh?

Kapabilitas utama DBMS meliputi kemampuan untuk mendefinisikan data, kemampuan kamus
data, dan bahasa manipulasi data. Kapabilitas mendefinisikan data menentukan struktur dan konten
dari database. Kamus data merupakan file otomatis atau manual yang menyimpan informasi
mengenai data dalam database, termasuk nama, definisi, format, dan penjelasan dari elemen data.
Bahasa manipulasi data, seperti SQL, merupakan bahasa yang dispesialisasikan untuk mengakses
dan memanipulasi data di dalam database.
Database relasional adalah metode utama untuk mengorganisasikan dan memelihara data dalam
sisteinformasi karena sangat fleksibel dan dapat diakses. Database relasional menyusun data ke
dalam tabel dal dimensi dengan baris dan kolom yang disebut relasi. Setiap tabel berisi data tentang
entitas dan atributnya. Setiapbaris menggambarkan catatan dan setiap kolom mewakili atribut atau
field. Setiap tabel juga berisi field untuk mengidentifikasi secara unik setiap record untuk pencarian
dan manipulasi. Tabel database relasional dartdigabungkan dengan lebih mudah untuk
mengirimkan data yang diminta oleh pengguna, disediakan dua yang membagikan elemen data
yang umum. Database non-relasional terkenal untuk pengelolaan jenis data yang tidak dapat
ditangani dengan mudah oleh model database relasional. Baik produk database relasional dan nonrelasional tersedia dalam layanan cloud computing.
2.

Apakah prinsip-prinsip yang penting dalam perancangan database?

Merancang database membutuhkan rancangan logis dan rancangan fisik. Model rancangan logis
database dari sudut pandang bisnis. Model data organisasi seharusnya menggambarkan prosesproses bisnis dan pengambilan keputusan yang penting. Proses pembuatan struktur data yang kecil,
stabil, fleksibel, dan adaptif dari sekelompok data yang rumit ketika merancang database relasional
disebut normalisasi. Database relasional yang dirancang dengan baik tidak akan mempunyai
hubungan banyak ke banyak, dan semua atribut untuk entitas tertentu hanya akan digunakan pada
entitas itu. Database relasional berupaya untuk menegakkan aturan integritas referensial untuk
memastikan relasi diantara tabel-tabel yang berpasangan agar tetap konsisten. Diagram relasi
entitas menggambarkan secara grafts hubungan antar-entitas (tabel) dalam database relasional.
3.

Apakah berbagai perangkat dan teknologi penyediaan informasi dari database untuk
meningkatkan kinenz bisnis dan pengambilan keputusan?

Teknologi manajemen data kontemporer memiliki berbagai alat untuk memperoleh informasi yang
bermanfaat dari seluruh jenis data berbeda yang digunakan oleh bisnis saat ini, meliputi data besar
semi-terstruktur dan tidak terstruktur dalam kuantitas sangat banyak. Kapabilitas ini meliputi data
warehouse dan data mart, Hadoop, memory computing, dan platform analitis. OLAP
merepresentasikan hubungan diantara data sebagai suatu strukbar yang multidimensional, yang
dapat divisualisasikan sebagai kubus data dan kubus di dalam kubus data, memungkinkan analisis
data yang lebih canggih. Data mining menganalisis sekumpulan data yang besar, konten dari data
warehouse, untuk menemukan pola dan aturan yang dapat digunakan untuk memprediksikan
perilaku pada masa yang akan datang dan membimbing pengambilan keputusan. Alat bantu teks
mining membantu pebisnis untuk menganalisis serangkaian data yang tidak terstruktur yang terdiri
atas teks. Alat bantu web mining menitikberatkan pada analisis pola yang bermanfaat dan informasi

dari World Wide Web, memeriksa struktur dari situs web dan aktivitas dari pengguna situs web,
demikian halnya dengan konten laman web. Database konvensional dapat dikaitkan melalui
middleware ke web atau ke tampilan web untuk memfasilitasi akses dari pengguna terhadap data
internal organisasi.
5. Mengapa kebijakan informasi, administrasi data, dan jaminan kualitas data sangat penting
dalam mengelola sumber daya data perusahaan?
Mengembangkan lingkungan database memerlukan kebijakan dan prosedur dalam mengelola data
organisasional sama halnya dengan model data yang tepat dan teknologi database. Kebijakan
informasi formal mengatur pemeliharaan, distribusi, dan penggunaan informasi dalam organisasi.
Dalam korporasi-korporasi besar, fungsi administrasi data formal bertanggung jawab atas kebijakan
informasi, sama halnya dengan perencanaan data, pengembangan kamus data, dan pemantauan
penggunaan data dalam perusahaan.
Data yang tidak akurat, tidak lengkap, atau tidak konsisten akan menciptakan permasalahan
operasional yang serius dan permasalahan finansial bagi pebisnis karena mereka dapat menciptakan
ketidakakuratan dalam penetapan harga, akun pelanggan, dan data persediaan, serta mengarah pada
pengambilan keputusan yang tidak akurat mengenai tindakan-tindakan yang harus diambil oleh
perusahaan. Perusahaan mengambil langkah-langkah khusus untuk memastikan bahwa data
memiliki tingkat kualitas data tinggi. Hal ini termasuk menggunakan standar di keseluruhan bagian
di perusahaan, database dirancang untuk meminimalkan ketidakkonsistenan dan data berlebihan,
audit kualitas data, dan perangkat lunak pembersihan data.