Anda di halaman 1dari 25

BAB 6 Landasan Bisnis Intelijen: Database dan Manajemen informasi

KASUS BAB

1. Sistem BAE
2. Pemberantasan Kejahatan Berbasis Data Menjadi Global
3. Societe Generale Membangun Sistem Cerdas untuk Mengelola Arus Informasi
4. Perangkat Lunak Perusahaan Lego Memacu Pertumbuhan

BAE Systems (BAE) adalah perusahaan manufaktur terbesar di Inggris Raya dan salah satu organisasi
kedirgantaraan dan pertahanan komersial terbesar di Eropa. Produknya yang berteknologi tinggi,
berbasis informasi, dan berbagai layanan dari salah satu petarung multi-peran paling mumpuni di
dunia, Eurofighter Typhoon, ke keluarga pesawat komersial Jetstream, ke penyediaan teknologi
informasi (TI) dan sistem informasi (SI) untuk e-business untuk mengembangkan dan
mengimplementasikan layanan logistik, TI, dan e-kapabilitas. Dengan situs penjualan, manufaktur,
dan dukungan di seluruh dunia, termasuk Inggris, Eropa, Amerika Serikat, dan Australia,
mempekerjakan BAE 83.000 orang di 40 negara dan menghasilkan lebih dari € 23,8 miliar
pendapatan pada tahun 2015. Meskipun BAE telah mengkonsolidasikan posisi kompetitifnya di pasar
yang sudah mapan, dan terus berkembang menjadi pasar baru di Timur Tengah dan Asia, kinerjanya
di bagian pesawat dari bisnis itu terhalang sistem informasi warisan yang mendukung desain
komputer (CAD) dan manufaktur berbantuan komputer (CAM) pesawatnya. Sifat BAE yang
terdistribusi desain dan manufaktur situs berarti menyimpan dan menganalisis set yang akurat
mendeskripsikan data operasional komponen kompleks dari berbagai jenis pesawat untuk
memproduksi perakitan pesawat terbang laporan untuk lini produksi menjadi semakin menantang
dan menghabiskan sumber daya.

Mengakses data dari banyak sistem adalah tugas kompleks yang melibatkan banyak tantangan
teknis. Seiring dengan pertumbuhan bisnis pesawat BAE, begitu pula kemungkinan penundaan
dalam pembuatan laporan perakitan pesawat dan kumpulan data operasi lainnya yang diperlukan
untuk pengambilan keputusan manajemen produksi pesawat. Dalam kasus terburuk, produksi
pesawat di jalur perakitan akan berhenti sampai informasi yang akurat tersedia, dengan konsekuensi
jadwal dan implikasi biaya. Staf CAD / CAM BAE menyimpan dan menganalisis kumpulan data yang
bersumber dari lima lokasi desain dan manufaktur pesawat besar yang tersebar di seluruh Inggris
Raya, masing-masing menampung ribuan staf yang terlibat dalam proses desain dan manufaktur,
sehingga laporan perakitan dan data operasi lainnya dapat diproduksi. Ada banyak kesempatan
ketika gambar kertas dengan penjelasan yang berisi desain komponen dan informasi manufaktur
digunakan untuk mendamaikan ambiguitas dan ketidakkonsistenan dalam laporan perakitan.
Ketidakjelasan dan ketidakkonsistenan data ini menimbulkan rasa ketidakpastian dalam laporan
perakitan yang dihasilkan.

Yang dibutuhkan BAE adalah satu repositori untuk data CAD / CAM yang juga akan memfasilitasi
integrasi data yang disimpan dalam sistem lawasnya. Perusahaan memutuskan untuk mengganti
sistem lawasnya dengan sistem manajemen pengetahuan tingkat perusahaan yang akan membawa
data desain dan manufaktur ke dalam satu database yang dapat diakses secara bersamaan oleh
insinyur desain dan manufaktur. BAE menerapkan perangkat lunak manajemen siklus hidup produk
Teamcenter dari Siemens dan perangkat lunak CATIA CAD / CAM Dassault Systemes. Teamcenter
juga dapat dikonfigurasi untuk memanfaatkan perkembangan terbaru dalam komputasi awan
menggunakan Microsoft Azure, IBM SmartCloud Enterprise +, dan Amazon Web Services.
Menyatukan Pusat Tim Siemens dan CATIA Dassault Systemes diberikan alat manajemen data
terintegrasi yang kuat dari BAE Systems. Database Teamcenter menyertakan alat untuk markup
komponen dan kapabilitas rollup, memungkinkan pengguna untuk memvisualisasikan efek
perubahan desain komponen dan pilihan konfigurasi secara real-time. Solusi baru ini telah
menghasilkan penghematan biaya yang signifikan di BAE dalam hal desain dan manajemen serta
penyimpanan data manufaktur sambil meningkatkan kinerja. Dengan lebih sedikit sistem warisan
dan file data yang harus dikelola, BAE telah mampu memenuhi persyaratan kualitas, waktu, dan
biaya dengan mampu menghasilkan definisi dan konfigurasi komponen pesawat yang lengkap dan
akurat. BAE telah menggunakan Teamcenter untuk memperbesar model bisnisnya dengan
menyertakan pemeliharaan dan perbaikan "sepanjang masa" untuk pesawat terbang.

Pengalaman BAE Systems menggambarkan pentingnya pengelolaan data. Kinerja bisnis bergantung
pada keakuratan dan keandalan datanya. Perusahaan telah mengembangkan bisnisnya, tetapi
efisiensi operasional CAD / CAM dan pengambilan keputusan manajemen produksi terhalang oleh
data yang disimpan dalam sistem lama yang sulit diakses. Bagaimana bisnis menyimpan, mengatur,
dan mengelola data mereka berdampak besar pada keefektifan organisasi. Diagram bab-pembukaan
meminta perhatian pada poin-poin penting yang diangkat oleh kasus ini dan bab ini. Manajemen
BAE Systems memutuskan bahwa perusahaan perlu meningkatkan pengelolaan datanya. Potongan
data tentang komponen desain, komponen yang diproduksi, dan perakitan akhir mereka telah
disimpan dalam banyak sistem lama yang besar yang membuatnya sangat sulit untuk diambil
kembali dan disatukan dengan benar sehingga dapat digunakan dalam perakitan lini produksi
komponen pesawat. Data tersebut sering kali berlebihan dan tidak konsisten, sehingga membatasi
kegunaannya. Manajemen tidak dapat memperoleh tampilan perusahaan dari perusahaan.

Di masa lalu, BAE Systems telah menggunakan proses kertas manual untuk merekonsiliasi data yang
tidak konsisten dan berlebihan dan untuk mengumpulkan data untuk pelaporan manajemen. Solusi
ini sangat memakan waktu dan biaya, serta menghalangi departemen teknologi informasi
perusahaan untuk melakukan pekerjaan yang bernilai lebih tinggi. Solusi yang lebih tepat adalah
memasang perangkat keras dan perangkat lunak baru ke membuat repositori skala perusahaan
untuk informasi bisnis yang akan mendukung kumpulan aplikasi bisnis yang lebih efisien. Perangkat
lunak baru termasuk perangkat lunak perusahaan yang terintegrasi dengan sistem manajemen basis
data terkini yang dapat memasok data untuk pelaporan skala perusahaan. Perusahaan harus
mengatur ulang datanya menjadi format standar seluruh perusahaan, menghilangkan redundansi,
dan menetapkan aturan, tanggung jawab, dan prosedur untuk memperbarui dan menggunakan
data. Perangkat lunak sistem manajemen basis data yang canggih membantu BAE Systems
meningkatkan efisiensi dengan membuatnya lebih mudah untuk menemukan dan mengumpulkan
data untuk pelaporan manajemen dan untuk memproses transaksi CAD / CAM sehari-hari untuk
perakitan komponen akhir pesawat. Datanya lebih akurat dan andal, dan biaya untuk mengelola dan
menyimpan data telah jauh berkurang. Berikut adalah beberapa pertanyaan untuk dipikirkan: Jenis
masalah manajemen data apa yang dialami BAE Systems di lingkungan basis data lama? Pekerjaan
apa yang harus dilakukan sebelum perusahaan dapat secara efektif memanfaatkan teknologi
manajemen data yang baru?
6- 1 Apa masalah dalam mengelola datasumber daya di lingkungan file tradisional?

Sistem informasi yang efektif memberi pengguna informasi yang akurat, tepat waktu, dan relevan.
Informasi yang akurat bebas dari kesalahan. Informasi tepat waktu jika tersedia bagi pengambil
keputusan saat dibutuhkan. Informasi menjadi relevan bila berguna dan sesuai untuk jenis pekerjaan
dan keputusan yang membutuhkannya. Anda mungkin terkejut mengetahui bahwa banyak bisnis
tidak memiliki informasi yang tepat waktu, akurat, atau relevan karena data dalam sistem informasi
mereka tidak diatur dan dipelihara dengan baik. Itulah mengapa pengelolaan data sangat penting.
Untuk memahami masalahnya, mari kita lihat bagaimana sistem informasi mengatur data dalam file
komputer dan metode tradisional manajemen file.

Istilah dan Konsep Organisasi File

Sistem komputer mengatur data dalam hierarki yang dimulai dengan bit dan byte dan berlanjut ke
bidang, catatan, file, dan database (lihat Gambar 6. 1). Sedikit mewakili unit data terkecil yang dapat
ditangani komputer. Sekelompok bit, disebut byte, mewakili satu karakter, yang bisa berupa huruf,
angka, atau simbol lain. Pengelompokan karakter menjadi kata, kumpulan kata, atau angka lengkap
(seperti nama atau usia seseorang) disebut bidang. Sekelompok bidang terkait, seperti nama siswa,
kursus yang diambil, tanggal, dan nilainya, terdiri dari sebuah rekor; sekelompok record dengan tipe
yang sama disebut file.
Misalnya, catatan pada Gambar 6. 1 dapat merupakan file kursus siswa. Sekelompok file terkait
membuat database. File kursus siswa yang diilustrasikan pada Gambar 6. 1dapat dikelompokkan
dengan file tentang sejarah pribadi siswa dan latar belakang keuangan untuk membuat database
siswa. Rekaman menggambarkan entitas. Entitas adalah orang, tempat, benda, atau peristiwa
tempat kami menyimpan dan memelihara informasi. Setiap karakteristik atau kualitas yang
menggambarkan entitas tertentu disebut atribut. Misalnya, Student_ID, Course, Date, dan Grade
adalah atribut dari entitas KURSUS. Nilai spesifik yang dapat dimiliki atribut ini ditemukan di bidang
catatan yang menjelaskan KURSUS entitas.

Masalah dengan Lingkungan File Tradisional

Di sebagian besar organisasi, sistem cenderung tumbuh secara mandiri tanpa rencana seluruh
perusahaan. Akuntansi, keuangan, manufaktur, sumber daya manusia, serta penjualan dan
pemasaran semuanya mengembangkan sistem dan file data mereka sendiri. Gambar 6. 2
mengilustrasikan pendekatan tradisional untuk pemrosesan informasi. Setiap aplikasi, tentunya
membutuhkan file dan program komputernya sendiri untuk beroperasi. Misalnya, area fungsional
sumber daya manusia mungkin memiliki file induk personel, file penggajian, file asuransi kesehatan,
file pensiun, file milis, dan sebagainya, hingga puluhan, mungkin ratusan, file dan program yang ada.
Di perusahaan secara keseluruhan, proses ini menyebabkan beberapa file induk dibuat, dipelihara,
dan dioperasikan oleh divisi atau departemen terpisah. Karena proses ini berlangsung selama 5 atau
10 tahun, organisasi dibebani dengan ratusan program dan aplikasi yang sangat sulit untuk
dipelihara dan kelola. Masalah yang diakibatkannya adalah redundansi dan inkonsistensi data,
ketergantungan program-data, ketidakfleksibelan, keamanan data yang buruk, dan ketidakmampuan
untuk berbagi data antar aplikasi.
Redundansi dan Inkonsistensi Data

Redundansi data adalah adanya data duplikat di beberapa file data sehingga data yang sama
disimpan di lebih dari satu tempat atau lokasi. Redundansi data terjadi ketika berbagai kelompok
dalam organisasi secara independen mengumpulkan bagian data yang sama dan menyimpannya
secara independen satu sama lain. Redundansi data menghabiskan sumber daya penyimpanan dan
juga menyebabkan ketidakkonsistenan data, di mana atribut yang sama mungkin memiliki nilai yang
berbeda. Misalnya, dalam kasus KURSUS entitas diilustrasikan pada Gambar 6. 1, Tanggal dapat
diperbarui di beberapa sistem tetapi tidak di yang lain. Atribut yang sama, Student_ID, mungkin juga
memiliki nama yang berbeda di sistem yang berbeda di seluruh organisasi. Beberapa sistem mungkin
menggunakan Student_ID dan yang lainnya mungkin menggunakan ID, misalnya. Kebingungan
tambahan mungkin terjadi akibat penggunaan sistem pengkodean yang berbeda untuk
merepresentasikan nilai untuk suatu atribut. Misalnya, sistem penjualan, inventaris, dan manufaktur
dari pengecer pakaian mungkin menggunakan kode yang berbeda untuk mewakili ukuran pakaian.
Satu sistem mungkin merepresentasikan ukuran pakaian sebagai "ekstra besar", sedangkan yang lain
mungkin menggunakan kode "XL" untuk tujuan yang sama. Hasilnya kebingungan akan menyulitkan
perusahaan untuk membuat manajemen hubungan pelanggan, manajemen rantai pasokan, atau
sistem perusahaan yang mengintegrasikan data dari sumber yang berbeda.

Ketergantungan Data-Program

Ketergantungan data program mengacu pada kopling data yang disimpan dalam file dan program
khusus yang diperlukan untuk memperbarui dan memelihara file tersebut sehingga perubahan
dalam program memerlukan perubahan pada data. Setiap program komputer tradisional harus
menggambarkan lokasi dan sifat data yang digunakannya. Dalam lingkungan file tradisional, setiap
perubahan dalam program perangkat lunak mungkin memerlukan file perubahan data yang diakses
oleh program itu. Satu program dapat dimodifikasi dari kode pos lima digit menjadi sembilan digit.
Jika file data asli diubah dari kode pos lima digit menjadi sembilan digit, maka program lain yang
membutuhkan kode pos lima digit tidak akan berfungsi dengan baik. Perubahan semacam itu dapat
menghabiskan jutaan dolar untuk diterapkan dengan benar.

Kurangnya Fleksibilitas

Sistem file tradisional dapat memberikan laporan terjadwal rutin setelah upaya pemrograman yang
ekstensif, tetapi tidak dapat memberikan laporan ad hoc atau menanggapi persyaratan informasi
yang tidak terduga secara tepat waktu. Informasi yang diperlukan oleh permintaan ad hoc ada di
suatu tempat di sistem tetapi mungkin terlalu mahal untuk diambil. Beberapa programmer mungkin
harus bekerja selama berminggu-minggu untuk mengumpulkan item data yang diperlukan dalam file
baru.

Keamanan Buruk

Karena hanya ada sedikit kontrol atau pengelolaan data, akses dan penyebaran informasi mungkin di
luar kendali. Manajemen mungkin tidak memiliki cara untuk mengetahui siapa yang mengakses atau
bahkan membuat perubahan pada data organisasi.
Kurangnya Berbagi dan Ketersediaan Data

Karena potongan informasi dalam file yang berbeda dan bagian organisasi yang berbeda tidak dapat
dikaitkan satu sama lain, hampir tidak mungkin informasi dibagikan atau diakses pada waktu yang
tepat. Informasi tidak dapat mengalir dengan bebas melintasi area fungsional yang berbeda atau
bagian organisasi yang berbeda. Jika pengguna menemukan nilai yang berbeda dari bagian informasi
yang sama dalam dua sistem yang berbeda, mereka mungkin tidak ingin menggunakan sistem ini
karena mereka tidak dapat mempercayai keakuratan datanya.

6- 2 Apa saja kemampuan utama database sistem manajemen (DBMS), dan mengapa a DBMS
relasional begitu kuat?

Teknologi database mengatasi banyak masalah organisasi file tradisional. Definisi database yang
lebih ketat adalah kumpulan data yang diatur untuk melayani banyak aplikasi secara efisien dengan
memusatkan data dan mengontrol data yang berlebihan. Daripada menyimpan data dalam file
terpisah untuk setiap aplikasi, bagi pengguna tampaknya data disimpan hanya di satu lokasi. Tunggal
layanan database beberapa aplikasi. Misalnya, alih-alih perusahaan menyimpan data karyawan
dalam sistem informasi terpisah dan file terpisah untuk personel, penggajian, dan tunjangan,
perusahaan dapat membuat database sumber daya manusia tunggal yang umum.

Sistem Manajemen Basis Data

Sistem manajemen basis data (DBMS) adalah perangkat lunak yang memungkinkan organisasi untuk
memusatkan data, mengelolanya secara efisien, dan menyediakan akses ke data yang disimpan oleh
program aplikasi. DBMS bertindak sebagai antarmuka antara program aplikasi dan file data fisik.
Ketika program aplikasi memanggil item data, seperti gaji kotor, DBMS menemukan item ini dalam
database dan menyajikannya ke program aplikasi. Menggunakan file data tradisional, programmer
harus menentukan ukuran dan format dari setiap elemen data yang digunakan dalam program dan
kemudian memberitahu komputer di mana mereka berada. DBMS membebaskan programmer atau
pengguna akhir dari tugas untuk memahami di mana dan bagaimana data sebenarnya disimpan
dengan memisahkan pandangan logis dan fisik dari data. Pandangan logis menyajikan data
sebagaimana mereka akan dipersepsikan oleh pengguna akhir atau spesialis bisnis, sedangkan
tampilan fisik menunjukkan bagaimana data sebenarnya diatur dan disusun pada media
penyimpanan fisik. Perangkat lunak manajemen basis data membuat basis data fisik tersedia untuk
tampilan logis berbeda yang dibutuhkan oleh pengguna. Misalnya, untuk database sumber daya
manusia yang diilustrasikan pada Gambar 6. 3, spesialis tunjangan mungkin memerlukan tampilan
yang terdiri dari nama karyawan, nomor jaminan sosial, dan cakupan asuransi kesehatan. Seorang
anggota departemen penggajian mungkin membutuhkan data seperti nama karyawan, nomor
jaminan sosial, gaji kotor, dan gaji bersih. Data untuk semua tampilan ini disimpan dalam satu
database, yang dapat lebih mudah dikelola oleh organisasi.

Bagaimana DBMS Memecahkan Masalah Lingkungan File Tradisional

DBMS mengurangi redundansi dan inkonsistensi data dengan meminimalkan file terisolasi di mana
data yang sama diulang. DBMS mungkin tidak memungkinkan organisasi untuk menghilangkan
redundansi data sepenuhnya, tetapi dapat membantu mengontrol redundansi. Bahkan jika
organisasi memelihara beberapa data yang berlebihan, menggunakan DBMS menghilangkan
ketidakkonsistenan data karena DBMS dapat membantu organisasi memastikan bahwa setiap
kejadian data yang berlebihan memiliki nilai yang sama. DBMS melepaskan program dan data,
memungkinkan data untuk berdiri sendiri. Deskripsi data yang digunakan oleh program tidak harus
ditentukan secara rinci setiap kali program yang berbeda ditulis. Akses dan ketersediaan informasi
akan ditingkatkan dan biaya pengembangan dan pemeliharaan program berkurang karena pengguna
dan pemrogram dapat melakukan kueri ad hoc database untuk banyak aplikasi sederhana tanpa
harus menulis program yang rumit. DBMS memungkinkan organisasi untuk mengelola data,
penggunaan, dan keamanannya secara terpusat. Berbagi data di seluruh organisasi lebih mudah
karena data yang disajikan kepada pengguna berada di satu lokasi daripada terpecah-pecah di
banyak sistem dan file yang berbeda.

DBMS relasional

DBMS kontemporer menggunakan model database yang berbeda untuk melacak entitas, atribut,
dan hubungan. Jenis DBMS yang paling populer saat ini untuk PC serta untuk komputer dan
mainframe yang lebih besar adalah DBMS relasional. Database relasional merepresentasikan data
sebagai tabel dua dimensi (disebut relasi). Tabel bisa disebut sebagai file. Setiap tabel berisi data
tentang suatu entitas dan atributnya. Microsoft Access adalah DBMS relasional untuk sistem
desktop, sedangkan DB2, Oracle Database, dan Microsoft SQL Server adalah DBMS relasional untuk
mainframe besar dan komputer kelas menengah. MySQL adalah DBMS open source yang populer.
Mari kita lihat bagaimana database relasional mengatur data tentang pemasok dan suku cadang
(lihat Gambar 6. 4). Database memiliki tabel terpisah untuk entitas SUPPLIER dan tabel untuk entitas
PART. Setiap tabel terdiri dari kisi kolom dan baris data. Setiap elemen data individu untuk setiap
entitas disimpan sebagai sebuah bidang terpisah, dan setiap bidang mewakili atribut untuk entitas
itu. Bidang dalam database relasional juga disebut kolom. Untuk entitas SUPPLIER, nomor identifikasi
pemasok, nama, jalan, kota, negara bagian, dan kode pos disimpan sebagai kolom terpisah dalam
tabel SUPPLIER dan setiap kolom mewakili atribut untuk entitas SUPPLIER.
Informasi aktual tentang pemasok tunggal yang berada dalam tabel disebut baris. Baris biasanya
disebut sebagai catatan, atau dalam istilah yang sangat teknis, sebagai tupel. Data untuk entitas
PART memiliki tabel terpisahnya sendiri. Bidang untuk Supplier_Number dalam tabel SUPPLIER
secara unik mengidentifikasi setiap rekaman sehingga rekaman dapat diambil, diperbarui, atau
disortir. Ini disebut bidang kunci. Setiap tabel dalam database relasional memiliki satu bidang yang
ditetapkan sebagai kunci utamanya. Bidang kunci ini adalah pengenal unik untuk semua informasi di
setiap baris tabel dan kunci utama ini tidak dapat diduplikasi. Supplier_Number adalah kunci utama
untuk tabel SUPPLIER dan Part_Number adalah kunci utama untuk tabel PART. Perhatikan bahwa
Supplier_Number muncul di tabel SUPPLIER dan PART. Dalam tabel SUPPLIER, Supplier_Number
adalah kunci utama. Ketika bidang Supplier_Number muncul di tabel PART, itu disebut kunci asing
dan pada dasarnya adalah bidang pencarian untuk mencari data tentang pemasok bagian tertentu.

Operasi DBMS Relasional

Tabel database relasional dapat digabungkan dengan mudah untuk mengirimkan data yang
dibutuhkan oleh pengguna, asalkan dua tabel memiliki elemen data yang sama. Misalkan kita ingin
mencari dalam database ini nama-nama pemasok yang dapat memberi kita nomor bagian 137 atau
nomor bagian 150. Kita membutuhkan informasi dari dua tabel: tabel SUPPLIER dan tabel BAGIAN.
Perhatikan bahwa kedua file ini memiliki elemen data bersama: Supplier_Number. Dalam database
relasional, tiga operasi dasar, seperti yang ditunjukkan pada Gambar 6. 5, digunakan untuk
mengembangkan kumpulan data yang berguna: pilih, gabung, dan proyek. Operasi pemilihan
membuat subset yang terdiri dari semua rekaman di file yang memenuhi kriteria yang disebutkan.
Pilih membuat, dengan kata lain, subset baris yang memenuhi kriteria tertentu. Dalam contoh kita,
kita ingin memilih record (baris) dari tabel PART di mana Part_Number sama dengan 137 atau 150.
Operasi gabungan menggabungkan tabel relasional untuk memberikan informasi lebih banyak
kepada pengguna daripada yang tersedia di tabel individual. Dalam contoh kita, kita ingin
menggabungkan tabel PART yang sekarang telah dipersingkat (hanya bagian 137 atau 150 yang akan
disajikan) dan tabel SUPPLIER menjadi satu tabel baru. Operasi proyek membuat subset yang terdiri
dari kolom dalam tabel, memungkinkan pengguna untuk membuat tabel baru yang hanya berisi
informasi yang diperlukan. Dalam contoh kami, kami ingin mengekstrak dari tabel baru hanya kolom
berikut: Part_Number, Part_Name, Supplier_Number, dan Supplier_Name.

Kemampuan Sistem Manajemen Basis Data

DBMS mencakup kemampuan dan alat untuk mengatur, mengelola, dan mengakses data dalam
database. Yang terpenting adalah bahasa definisi datanya, kamus data, dan bahasa manipulasi
datanya. DBMS memiliki kemampuan definisi data untuk menentukan struktur konten database. Ini
akan digunakan untuk membuat tabel database dan untuk menentukan karakteristik bidang di setiap
tabel. Informasi tentang database ini akan didokumentasikan dalam kamus data. Kamus data adalah
file otomatis atau manual yang menyimpan definisi elemen data dan karakteristiknya. Microsoft
Access memiliki kemampuan kamus data dasar yang menampilkan informasi tentang nama,
deskripsi, ukuran, jenis, format, dan properti lain dari setiap bidang dalam tabel (lihat Gambar 6. 6).
Kamus data untuk database perusahaan besar dapat menangkap informasi tambahan, seperti
penggunaan, kepemilikan (siapa dalam organisasi yang bertanggung jawab untuk memelihara data),
otorisasi, keamanan, dan individu, fungsi bisnis, program, dan laporan yang menggunakan setiap
elemen data.

Membuat Kueri dan Pelaporan

DBMS mencakup alat untuk mengakses dan memanipulasi informasi dalam database. Kebanyakan
DBMS memiliki bahasa khusus yang disebut bahasa manipulasi data yang digunakan untuk
menambah, mengubah, menghapus, dan mengambil data dalam database. Bahasa ini berisi perintah
yang mengizinkan pengguna akhir dan spesialis pemrograman untuk mengekstrak data dari database
untuk memenuhi permintaan informasi dan mengembangkan aplikasi. Bahasa manipulasi data yang
paling menonjol hari ini adalah Structured Query Language, atau SQL. Gambar 6. 7 mengilustrasikan
kueri SQL yang akan menghasilkan tabel resultan baru pada Gambar 6. 5. Anda dapat mengetahui
lebih lanjut tentang bagaimana melakukan kueri SQL di Trek Pembelajaran kami untuk bab ini.
Pengguna DBMS untuk komputer besar dan menengah, seperti DB2, Oracle, atau SQL Server, akan
menggunakan SQL untuk mengambil informasi yang mereka butuhkan dari database. Microsoft
Access juga menggunakan SQL, tetapi menyediakan seperangkat alat yang ramah pengguna sendiri
untuk membuat kueri database dan untuk mengatur data dari database menjadi laporan yang lebih
halus.
Di Microsoft Access, Anda akan menemukan fitur yang memungkinkan pengguna membuat kueri
dengan mengidentifikasi tabel dan bidang yang mereka inginkan dan hasilnya, lalu memilih baris dari
database yang memenuhi kriteria tertentu. Tindakan ini pada gilirannya diterjemahkan ke dalam
perintah SQL. Gambar 6. 8 mengilustrasikan bagaimana kueri yang sama seperti kueri SQL untuk
memilih bagian dan pemasok akan dibuat menggunakan alat pembuatan kueri Microsoft Access.
Microsoft Access dan DBMS lainnya menyertakan kapabilitas untuk pembuatan laporan sehingga
data yang diinginkan dapat ditampilkan dalam format yang lebih terstruktur dan halus daripada yang
dimungkinkan hanya dengan membuat kueri. Crystal Reports adalah yang populer pembuat laporan
untuk DBMS perusahaan besar, meskipun dapat juga digunakan dengan Access. Access juga memiliki
kemampuan untuk mengembangkan aplikasi sistem desktop. Ini termasuk alat untuk membuat layar
entri data, laporan, dan mengembangkan logika untuk memproses transaksi.

Mendesain Database

Untuk membuat database, Anda harus memahami hubungan antar data, jenis data yang akan
disimpan dalam database, bagaimana data akan digunakan, dan bagaimana organisasi perlu
mengubah untuk mengelola data dari perspektif seluruh perusahaan. Basis data membutuhkan
desain konseptual dan desain fisik. Desain database konseptual, atau logis, adalah model abstrak
database dari perspektif bisnis, sedangkan desain fisik menunjukkan bagaimana database
sebenarnya diatur pada perangkat penyimpanan akses langsung.
Diagram Normalisasi dan Hubungan Entitas

Desain basis data konseptual menjelaskan bagaimana elemen data dalam basis data akan
dikelompokkan. Proses desain mengidentifikasi hubungan di antara elemen data dan cara paling
efisien untuk mengelompokkan elemen data bersama-sama untuk memenuhi persyaratan informasi
bisnis. Proses ini juga mengidentifikasi elemen data yang berlebihan dan pengelompokan elemen
data yang diperlukan untuk program aplikasi tertentu. Grup data diatur, disempurnakan, dan
disederhanakan sampai tampilan logis keseluruhan dari hubungan di antara semua data dalam
database muncul. Untuk menggunakan model database relasional secara efektif, pengelompokan
data yang kompleks harus disederhanakan untuk meminimalkan elemen data yang berlebihan dan
hubungan banyak ke banyak yang canggung. Proses pembuatan yang kecil, stabil, namun fleksibel
dan struktur data adaptif dari kelompok data yang kompleks disebut normalisasi. Gambar 6. 9 dan 6.
10 mengilustrasikan proses ini.
Dalam model bisnis tertentu yang dimodelkan di sini, pesanan dapat memiliki lebih dari satu bagian,
tetapi setiap bagian disediakan oleh hanya satu pemasok. Jika kita membangun relasi yang disebut
ORDER dengan semua bidang yang disertakan di sini, kita harus mengulangi nama dan alamat
pemasok untuk setiap bagian dalam pesanan, meskipun pesanan untuk suku cadang dari pemasok
tunggal. Hubungan ini berisi apa yang disebut grup data berulang karena dapat terdapat banyak
bagian dalam satu pesanan ke pemasok tertentu. Cara yang lebih efisien untuk menyusun data
adalah dengan memecah ORDER menjadi relasi yang lebih kecil, yang masing-masing
mendeskripsikan entitas tunggal. Jika kita pergi langkah demi langkah dan menormalkan relasi
ORDER, kita muncul dengan relasi yang diilustrasikan pada Gambar 6. 10. Anda dapat mengetahui
lebih lanjut tentang normalisasi, diagram relasi entitas, dan desain database dalam Jalur
Pembelajaran untuk bab ini. Sistem database relasional mencoba menerapkan aturan integritas
referensial untuk memastikan bahwa hubungan antara tabel yang digabungkan tetap konsisten.
Ketika satu tabel memiliki kunci asing yang menunjuk ke tabel lain, Anda tidak dapat menambahkan
catatan ke tabel dengan kunci asing kecuali ada catatan terkait dalam tabel tertaut. Dalam database
yang kita periksa sebelumnya pada bab ini, kunci asing Supplier_Number menghubungkan tabel
PART ke tabel SUPPLIER. Kami tidak dapat menambahkan catatan baru ke tabel BAGIAN untuk
bagian dengan Supplier_Number 8266 kecuali ada catatan yang sesuai di tabel SUPPLIER untuk
Supplier_Number 8266. Kita juga harus menghapus catatan terkait di tabel BAGIAN jika kita
menghapus catatan di SUPPLIER tabel untuk Supplier_Number 8266. Dengan kata lain, kita tidak
boleh memiliki suku cadang dari pemasok yang tidak ada! Desainer database mendokumentasikan
model data mereka dengan relasi entitas diagram, diilustrasikan pada Gambar 6. 11. Diagram ini
menggambarkan hubungan antara entitas SUPPLIER, PART, LINE_ITEM, dan ORDER. Kotak mewakili
entitas. Garis yang menghubungkan kotak mewakili hubungan. Garis yang menghubungkan dua
entitas yang diakhiri dengan dua tanda pendek menunjukkan hubungan satu-ke-satu. Garis yang
menghubungkan dua entitas yang diakhiri dengan kaki gagak yang di atasnya diberi tanda pendek
menunjukkan hubungan satu ke banyak. Gambar 6. 11 pertunjukan ORDER yang satu itu dapat berisi
banyak LINE_ITEM. (SEBUAH BAGIAN dapat dipesan berkali-kali dan muncul berkali-kali sebagai item
baris dalam satu pesanan.) Setiap BAGIAN hanya dapat memiliki satu PEMASOK, tetapi banyak
BAGIAN dapat disediakan oleh PEMASOK yang sama. Hal ini tidak dapat cukup ditekankan: Jika bisnis
tidak mendapatkan model datanya dengan benar, sistem tidak akan dapat melayani bisnis dengan
baik. Sistem perusahaan tidak akan seefektif mungkin karena harus bekerja dengan data yang
mungkin tidak akurat, tidak lengkap, atau sulit diambil. Memahami data organisasi dan bagaimana
mereka harus direpresentasikan dalam database mungkin merupakan pelajaran terpenting yang
dapat Anda pelajari dari kursus ini. Misalnya, Famous Footwear, jaringan toko sepatu dengan lebih
dari 800 lokasi di 49 negara bagian, tidak dapat mencapai tujuannya untuk memiliki "gaya sepatu
yang tepat di toko yang tepat untuk dijual dengan harga yang tepat" karena database-nya tidak
dirancang dengan benar untuk menyesuaikan inventaris toko dengan cepat. Perusahaan itu punya
database relasional Oracle yang berjalan pada komputer kelas menengah, tetapi database tersebut
dirancang terutama untuk menghasilkan laporan standar untuk manajemen daripada bereaksi
terhadap perubahan pasar. Manajemen tidak dapat memperoleh data yang tepat tentang item
tertentu dalam persediaan di setiap tokonya. Perusahaan harus mengatasi masalah ini dengan
membangun database baru di mana data penjualan dan inventaris dapat diatur dengan lebih baik
untuk analisis dan manajemen inventaris.

Database dan Database Non-relasional di Cloud

Selama lebih dari 30 tahun, teknologi database relasional telah menjadi standar emas. Komputasi
awan, volume data yang belum pernah terjadi sebelumnya, beban kerja yang sangat besar untuk
layanan web, dan kebutuhan untuk menyimpan jenis data baru memerlukan alternatif database
untuk model relasional tradisional dalam mengatur data dalam bentuk tabel, kolom, dan baris.
Perusahaan beralih ke "NoSQL" non-relasional teknologi database untuk tujuan ini. Sistem
manajemen basis data non-relasional menggunakan model data yang lebih fleksibel dan dirancang
untuk mengelola kumpulan data besar di banyak mesin terdistribusi dan untuk meningkatkan atau
menurunkan skala dengan mudah. Mereka berguna untuk mempercepat kueri sederhana terhadap
volume besar data terstruktur dan tidak terstruktur, termasuk web, media sosial, grafik, dan bentuk
data lain yang sulit dianalisis dengan alat tradisional berbasis SQL. Ada beberapa jenis database
NoSQL, masing-masing dengan fitur dan perilaku teknisnya sendiri. Oracle NoSQL Database adalah
salah satu contohnya, seperti Amazon's SimpleDB, salah satu Amazon Web Services yang berjalan di
cloud. SimpleDB menyediakan antarmuka layanan web sederhana untuk membuat dan menyimpan
beberapa kumpulan data, membuat kueri data dengan mudah, dan mengembalikan hasilnya. Tidak
perlu untuk menentukan struktur database formal atau mengubah definisi tersebut jika data baru
ditambahkan kemudian.

Misalnya, MetLife menggunakan database NoSQL open source MongoDB untuk dengan cepat
mengintegrasikan data yang berbeda pada lebih dari 100 juta pelanggan dan memberikan tampilan
yang terkonsolidasi dari masing-masing data. Basis data MetLife menyatukan data dari lebih dari 70
sistem administratif terpisah, sistem klaim, dan sumber data lainnya, termasuk data semi-terstruktur
dan tidak terstruktur, seperti gambar catatan kesehatan dan sertifikat kematian. Basis data NoSQL
dapat menggunakan informasi terstruktur, semi terstruktur, dan tidak terstruktur tanpa memerlukan
pemetaan basis data yang membosankan, mahal, dan memakan waktu.
Database Cloud

Amazon dan vendor komputasi awan lainnya juga menyediakan layanan database relasional.
Amazon Relational Database Service (Amazon RDS) menawarkan MySQL, SQL Server, Oracle
Database, PostgreSQL, MariaDB, atau Amazon Aurora DB (kompatibel dengan MySQL) sebagai mesin
database. Penetapan harga didasarkan pada penggunaan. Oracle memiliki Layanan Awan Basis Data
sendiri menggunakan Basis Data Oracle relasional, dan Basis Data Microsoft Windows SQL Azure
adalah layanan basis data relasional berbasis awan berdasarkan DBMS SQL Server Microsoft.
Layanan manajemen data berbasis cloud memiliki daya tarik khusus untuk start-up yang berfokus
pada web atau bisnis kecil hingga menengah yang mencari kemampuan database dengan harga lebih
rendah daripada produk database in-house. Selain layanan manajemen data berbasis cloud publik,
perusahaan sekarang memiliki opsi untuk menggunakan database di cloud pribadi. Misalnya, Sabre
Holdings, penyedia perangkat lunak sebagai layanan (SaaS) terbesar di dunia untuk industri
penerbangan, memiliki cloud database pribadi yang mendukung lebih dari 100 proyek dan 700
pengguna. Database terkonsolidasi yang mencakup kumpulan server standar yang menjalankan
Oracle Database menyediakan layanan database untuk beberapa aplikasi.

6- 3 Apa alat dan teknologi utama untuk mengakses informasi dari database untuk meningkatkan
kinerja dan membuat keputusan bisnis?

Bisnis menggunakan database mereka untuk melacak transaksi dasar, seperti membayar pemasok,
memproses pesanan, melacak pelanggan, dan membayar karyawan. Tetapi mereka juga
membutuhkan database untuk memberikan informasi yang akan membantu perusahaan
menjalankan bisnis dengan lebih efisien dan membantu manajer dan karyawan membuat keputusan
yang lebih baik. Jika sebuah perusahaan ingin mengetahui produk mana yang paling populer atau
pelanggan yang paling menguntungkan, jawabannya ada pada datanya.

Tantangan Data Besar

Sebagian besar data yang dikumpulkan oleh organisasi dulunya adalah data transaksi yang dapat
dengan mudah masuk ke dalam baris dan kolom sistem manajemen basis data relasional. Kami
sekarang menyaksikan ledakan data dari lalu lintas web, pesan email, dan konten media sosial
(tweet, pesan status), serta data yang dibuat oleh mesin dari sensor (digunakan dalam pengukur
pintar, sensor pabrikan, dan pengukur listrik) atau dari sistem perdagangan elektronik. Data ini
mungkin tidak terstruktur atau semi-terstruktur sehingga tidak cocok untuk database relasional
produk yang menyusun data berupa kolom dan baris. Kami sekarang menggunakan istilah big data
untuk mendeskripsikan kumpulan data ini dengan volume yang sangat besar sehingga melebihi
kemampuan DBMS biasa untuk menangkap, menyimpan, dan menganalisis. Big data tidak mengacu
pada kuantitas tertentu tetapi biasanya mengacu pada data dalam kisaran petabyte dan exabyte —
dengan kata lain, miliaran hingga triliunan record, semuanya dari sumber yang berbeda. Data besar
diproduksi dalam jumlah yang jauh lebih besar dan jauh lebih cepat daripada data tradisional.
Misalnya, mesin jet tunggal mampu menghasilkan 10 terabyte data hanya dalam 30 menit, dan ada
lebih dari 25.000 penerbangan maskapai setiap hari. Meskipun "tweet" dibatasi masing-masing 140
karakter, Twitter menghasilkan lebih dari 8 terabyte data setiap hari. Menurut firma riset teknologi
International Data Center (IDC), data bertambah lebih dari dua kali lipat setiap dua tahun, sehingga
jumlah data yang tersedia untuk organisasi meroket. Bisnis tertarik pada data besar karena mereka
dapat mengungkapkan lebih banyak pola dan hubungan yang menarik daripada kumpulan data yang
lebih kecil, dengan potensi untuk memberikan wawasan baru tentang perilaku pelanggan, pola
cuaca, aktivitas pasar keuangan, atau fenomena lainnya. Misalnya, Shutterstock, pasar gambar
online global, menyimpan 24 juta gambar, menambahkan 10.000 lebih banyak setiap hari.

Untuk menemukan cara mengoptimalkan pengalaman membeli, Shutterstock menganalisis data


besarnya untuk mengetahui di mana pengunjung situs webnya menempatkan kursor mereka dan
berapa lama mereka mengarahkan kursor ke gambar sebelum melakukan pembelian. Data besar
juga menemukan banyak kegunaan di sektor publik. Kota-kota besar di Eropa dan Europol
menggunakan Big Data untuk mengidentifikasi penjahat dan teroris (Aline, 2016). Sesi Interaktif
tentang Organisasi menjelaskan bagaimana Kota New York menggunakan data besar untuk
menurunkan tingkat kejahatannya.

Namun, untuk memperoleh nilai bisnis dari data ini, organisasi memerlukan teknologi dan alat baru
yang mampu mengelola dan menganalisis data non-tradisional bersama dengan data perusahaan
tradisional mereka. Mereka juga perlu mengetahui pertanyaan apa yang harus diajukan tentang data
dan batasan big data. Menangkap, menyimpan, dan menganalisis data besar bisa jadi mahal, dan
informasi dari data besar belum tentu membantu pembuat keputusan. Penting untuk memiliki
pemahaman yang jelas dari masalah yang akan diselesaikan oleh data besar untuk bisnis. Kasus
penutup bab membahas masalah ini.

Infrastruktur Intelijen Bisnis

Misalkan Anda menginginkan informasi yang ringkas dan andal tentang operasi saat ini, tren, dan
perubahan di seluruh perusahaan. Jika Anda bekerja di perusahaan besar, data yang Anda butuhkan
mungkin harus disatukan dari sistem terpisah, seperti penjualan, manufaktur, dan akuntansi, dan
bahkan dari sumber eksternal, seperti data demografis atau pesaing. Anda mungkin semakin perlu
menggunakan data besar. Infrastruktur kontemporer untuk kecerdasan bisnis memiliki serangkaian
alat untuk memperoleh informasi yang berguna dari semua jenis data yang berbeda yang digunakan
oleh bisnis saat ini, termasuk data besar semi-terstruktur dan tidak terstruktur dalam jumlah besar.
Kemampuan ini mencakup gudang data dan data mart, Hadoop, komputasi dalam memori, dan
platform analitik. Beberapa dari kemampuan ini tersedia sebagai layanan cloud.

Gudang Data dan Data Mart

Alat tradisional untuk menganalisis data perusahaan selama dua dekade terakhir adalah gudang
data. Gudang data adalah basis data yang menyimpan data terkini dan historis yang berpotensi
menarik bagi para pengambil keputusan di seluruh perusahaan. Data tersebut berasal dari banyak
sistem transaksi operasional inti, seperti sistem penjualan, akun pelanggan, dan manufaktur, dan
dapat mencakup data dari transaksi situs web. Gudang data mengekstrak arus dan data historis dari
berbagai sistem operasional di dalam organisasi. Data ini digabungkan dengan data dari sumber
eksternal dan diubah dengan mengoreksi data yang tidak akurat dan tidak lengkap serta
merestrukturisasi data untuk pelaporan dan analisis manajemen sebelum dimuat ke dalam gudang
data. Gudang data membuat data tersedia untuk diakses siapa saja sesuai kebutuhan, tetapi data
tidak dapat diubah. Sistem gudang data juga menyediakan berbagai alat kueri standar dan ad hoc,
alat analitik, dan fasilitas pelaporan grafis. Perusahaan sering kali membangun gudang data skala
perusahaan, di mana gudang data pusat melayani seluruh organisasi, atau mereka membuat gudang
yang lebih kecil dan terdesentralisasi yang disebut data mart. Data mart adalah bagian dari gudang
data tempat bagian data organisasi yang diringkas atau sangat terfokus ditempatkan dalam database
terpisah untuk populasi pengguna tertentu. Misalnya, perusahaan mungkin mengembangkan data
mart pemasaran dan penjualan untuk menangani informasi pelanggan.

Hadoop

Produk DBMS relasional dan data warehouse tidak cocok untuk mengatur dan menganalisis big data
atau data yang tidak mudah masuk ke dalam kolom dan baris yang digunakan dalam model datanya.
Untuk menangani data tidak terstruktur dan semi-terstruktur dalam jumlah besar, serta data
terstruktur, organisasi menggunakan Hadoop. Hadoop adalah kerangka perangkat lunak sumber
terbuka yang dikelola oleh Apache Software Foundation yang memungkinkan pemrosesan paralel
terdistribusi dari sejumlah besar data di komputer murah. Ini memecah masalah big data menjadi
sub-masalah, mendistribusikannya di antara hingga ribuan node pemrosesan komputer yang tidak
mahal, dan kemudian menggabungkan hasilnya menjadi kumpulan data yang lebih kecil yang lebih
mudah dianalisis. Anda mungkin pernah menggunakan Hadoop untuk menemukan tiket pesawat
terbaik di Internet, mendapatkan petunjuk arah ke restoran, menelusuri Google, atau terhubung
dengan teman di Facebook. Hadoop terdiri dari beberapa layanan utama, termasuk Hadoop
Distributed File System (HDFS) untuk penyimpanan data dan MapReduce untuk pemrosesan data
paralel berkinerja tinggi. HDFS menghubungkan sistem file pada banyak node dalam cluster Hadoop
untuk mengubahnya menjadi satu sistem file besar. MapReduce Hadoop terinspirasi oleh sistem
MapReduce Google untuk memecah pemrosesan kumpulan data yang sangat besar dan menugaskan
pekerjaan ke berbagai node dalam sebuah cluster. HBase, database non-relasional Hadoop,
menyediakan akses cepat ke data yang disimpan di HDFS dan platform transaksional untuk
menjalankan aplikasi real-time skala tinggi.

Hadoop dapat memproses segala jenis data dalam jumlah besar, termasuk data transaksional
terstruktur, data yang terstruktur secara longgar seperti feed Facebook dan Twitter, data kompleks
seperti file log server web, dan data audio dan video yang tidak terstruktur. Hadoop berjalan pada
sekelompok server yang tidak mahal, dan prosesor dapat ditambahkan atau dihapus sesuai
kebutuhan. Perusahaan menggunakan Hadoop untuk menganalisis volume data yang sangat besar
serta untuk area pementasan untuk tidak terstruktur dan data semi-terstruktur sebelum dimuat ke
gudang data. Yahoo menggunakan Hadoop untuk melacak perilaku pengguna sehingga dapat
mengubah beranda agar sesuai dengan minat mereka. Firma penelitian ilmu hayati NextBio
menggunakan Hadoop dan HBase untuk memproses data bagi perusahaan farmasi yang melakukan
penelitian genomik. Vendor database teratas seperti IBM, Hewlett-Packard, Oracle, dan Microsoft
memiliki distribusi perangkat lunak Hadoop mereka sendiri. Vendor lain menawarkan alat untuk
memindahkan data masuk dan keluar dari Hadoop atau untuk menganalisis data dalam Hadoop.
prosesor berkecepatan tinggi yang kuat, pemrosesan multi inti, dan harga memori komputer yang
turun. Teknologi ini membantu perusahaan mengoptimalkan penggunaan memori dan
mempercepat kinerja pemrosesan sekaligus menurunkan biaya. Produk komersial terkemuka untuk
komputasi dalam memori termasuk SAP HANA dan Oracle Exalytics. Masing-masing menyediakan
satu set komponen perangkat lunak terintegrasi, termasuk perangkat lunak basis data dalam memori
dan perangkat lunak analitik khusus, yang berjalan pada perangkat keras yang dioptimalkan untuk
pekerjaan komputasi dalam memori.
Platform Analitik

Vendor database komersial telah mengembangkan platform analitik kecepatan tinggi khusus
menggunakan teknologi relasional dan non-relasional yang dioptimalkan untuk menganalisis
kumpulan data besar. Platform analitik seperti IBM PureData System for Analytics, menampilkan
sistem perangkat keras-perangkat lunak yang telah dikonfigurasi sebelumnya yang secara khusus
dirancang untuk pemrosesan kueri dan analitik. Misalnya, IBM PureData System for Analytics
memiliki fitur database, server, dan komponen penyimpanan yang terintegrasi erat yang menangani
kueri analitik kompleks 10 hingga 100 kali lebih cepat daripada sistem tradisional. Platform analitik
juga mencakup sistem dalam memori dan sistem manajemen basis data non-relasional NoSQL.
Platform analitik sekarang tersedia sebagai layanan cloud. Gambar 6. 12 mengilustrasikan
infrastruktur intelijen bisnis kontemporer menggunakan teknologi yang baru saja kami jelaskan. Data
saat ini dan data historis diekstraksi dari beberapa sistem operasional bersama dengan data web,
data yang dibuat dengan mesin, data audio / visual tidak terstruktur, dan data dari sumber eksternal
yang telah direstrukturisasi dan diatur ulang untuk pelaporan dan analisis. Cluster Hadoop
melakukan pra-proses data besar untuk digunakan di gudang data, data mart, atau platform analitik
atau untuk kueri langsung oleh pengguna yang mahir. Keluarannya mencakup laporan dan dasbor
serta hasil kueri. Bab 12 membahas berbagai jenis pengguna BI dan pelaporan BI secara lebih rinci.

Alat Analisis: Hubungan, Pola, Tren

Setelah data diambil dan diatur menggunakan teknologi intelijen bisnis yang baru saja kami jelaskan,
data tersebut tersedia untuk analisis lebih lanjut menggunakan perangkat lunak untuk kueri dan
pelaporan database, analisis data multidimensi (OLAP), dan penambangan data. Bagian ini akan
memperkenalkan Anda pada alat-alat ini, dengan lebih detail tentang analitik dan aplikasi
kecerdasan bisnis di Bab 12.

Pemrosesan Analitik Online (OLAP)

Misalkan perusahaan Anda menjual empat produk berbeda — mur, baut, ring, dan sekrup — di
wilayah Timur, Barat, dan Tengah. Jika Anda ingin mengajukan pertanyaan yang cukup lugas, seperti
berapa banyak mesin cuci yang terjual selama kuartal terakhir, Anda dapat dengan mudah
menemukan jawabannya dengan menanyakan database penjualan Anda. Tetapi bagaimana jika
Anda ingin mengetahui berapa banyak mesin cuci yang terjual di setiap wilayah penjualan Anda dan
membandingkan hasil aktual dengan penjualan yang diproyeksikan? Untuk mendapatkan
jawabannya, Anda memerlukan pemrosesan analitik online (OLAP). OLAP mendukung analisis data
multidimensi, memungkinkan pengguna untuk melihat data yang sama dengan cara berbeda
menggunakan beberapa dimensi. Setiap aspek informasi — produk, harga, biaya, wilayah, atau
periode waktu — mewakili dimensi yang berbeda. Jadi, seorang manajer produk dapat
menggunakan alat analisis data multidimensi untuk mempelajari berapa banyak washer yang terjual
di Timur pada bulan Juni, bagaimana membandingkannya dengan bulan sebelumnya dan bulan Juni
sebelumnya, dan bagaimana membandingkannya dengan perkiraan penjualan. OLAP memungkinkan
pengguna mendapatkan jawaban online untuk pertanyaan ad hoc seperti ini dalam waktu yang
cukup cepat, bahkan ketika data disimpan dalam database yang sangat besar, seperti angka
penjualan selama beberapa tahun.

Gambar 6. 13 menunjukkan model multidimensi yang dapat dibuat untuk merepresentasikan


produk, wilayah, penjualan aktual, dan proyeksi penjualan. Matriks penjualan aktual dapat ditumpuk
di atas matriks penjualan yang diproyeksikan untuk membentuk kubus dengan enam sisi. Jika Anda
memutar kubus 90 derajat ke satu arah, tampilan wajah akan menjadi produk versus penjualan
aktual dan yang diproyeksikan. Jika Anda memutar kubus 90 derajat lagi, Anda akan melihat wilayah
versus penjualan aktual dan yang diproyeksikan. Jika Anda memutar 180 derajat dari tampilan asli,
Anda akan melihat proyeksi penjualan dan produk versus wilayah. kubus dapat disarangkan di dalam
kubus untuk membangun tampilan data yang kompleks. Perusahaan akan menggunakan database
multidimensi khusus atau alat yang membuat tampilan multidimensi data dalam database relasional.
Penambangan Data

Kueri database tradisional menjawab pertanyaan seperti "Berapa unit nomor produk 403 yang
dikirim pada Februari 2016?" OLAP, atau analisis multidimensi, mendukung permintaan informasi
yang jauh lebih kompleks, seperti "Bandingkan penjualan produk 403 relatif terhadap rencana
menurut kuartal dan wilayah penjualan selama dua tahun terakhir". Dengan OLAP dan analisis data
berorientasi kueri, pengguna harus memiliki ide bagus tentang informasi yang mereka cari.
Penambangan data lebih didorong oleh penemuan. Penambangan data memberikan wawasan ke
dalam data perusahaan yang tidak dapat diperoleh dengan OLAP dengan menemukan pola
tersembunyi

dan hubungan dalam database besar dan menyimpulkan aturan darinya untuk memprediksi perilaku
masa depan. Pola dan aturan digunakan untuk memandu pengambilan keputusan dan
memperkirakan efek dari keputusan tersebut. Jenis informasi yang dapat diperoleh dari data mining
meliputi asosiasi, urutan, klasifikasi, cluster, dan prakiraan.

 Asosiasi adalah kejadian yang ditautkan ke satu peristiwa. Misalnya, sebuah studi tentang
pola pembelian supermarket mungkin mengungkapkan bahwa, ketika keripik jagung dibeli,
minuman cola dibeli 65 persen dari waktu itu, tetapi ketika ada promosi, minuman kola
dibeli 85 persen dari waktu itu. Informasi ini membantu manajer membuat keputusan yang
lebih baik karena mereka telah mempelajari keuntungan dari promosi.
 Secara berurutan, peristiwa ditautkan dari waktu ke waktu. Kita mungkin menemukan,
misalnya, bahwa jika rumah dibeli, lemari es baru akan dibeli dalam waktu dua minggu 65
persen dari waktu, dan oven akan dibeli dalam satu bulan setelah pembelian rumah 45
persen dari waktu.
 Klasifikasi mengenali pola yang mendeskripsikan kelompok yang memiliki item dengan
memeriksa item yang sudah ada yang telah diklasifikasikan dan dengan menyimpulkan
seperangkat aturan. Misalnya, bisnis seperti perusahaan kartu kredit atau telepon khawatir
kehilangan pelanggan tetap. Klasifikasi membantu menemukan karakteristik pelanggan yang
kemungkinan akan keluar dan dapat memberikan model untuk membantu manajer
memprediksi siapa pelanggan tersebut sehingga manajer dapat merancang kampanye
khusus untuk mempertahankan pelanggan tersebut.
 Pengelompokan bekerja dengan cara yang mirip dengan klasifikasi ketika belum ada
kelompok yang ditentukan. Alat penambangan data dapat menemukan pengelompokan
berbeda dalam data, seperti menemukan kelompok afinitas untuk kartu bank atau
mempartisi database menjadi kelompok pelanggan berdasarkan demografi dan jenis
investasi pribadi..
 Meskipun aplikasi ini melibatkan prediksi, perkiraan menggunakan prediksi dengan cara
yang berbeda. Ini menggunakan serangkaian nilai yang ada untuk meramalkan apa yang
akan menjadi nilai lain. Misalnya, peramalan mungkin menemukan pola dalam data untuk
membantu manajer memperkirakan nilai variabel kontinu di masa depan, seperti angka
penjualan.

Sistem ini melakukan analisis pola atau tren tingkat tinggi, tetapi juga dapat menelusuri untuk
memberikan detail lebih lanjut bila diperlukan. Ada aplikasi data mining untuk semua area
fungsional bisnis dan untuk pemerintahan dan karya ilmiah. Salah satu penggunaan populer untuk
data mining adalah untuk memberikan analisis rinci pola dalam data pelanggan untuk kampanye
pemasaran satu-ke-satu atau untuk mengidentifikasi pelanggan yang menguntungkan. Caesars
Entertainment, sebelumnya dikenal sebagai Harrah's Entertainment, adalah perusahaan game
terbesar di dunia. Itu terus menganalisis data tentang pelanggannya yang dikumpulkan ketika orang
memainkan mesin slotnya atau menggunakan kasino dan hotelnya. Departemen pemasaran
perusahaan menggunakan informasi ini untuk membuat profil perjudian mendetail, berdasarkan
nilai berkelanjutan dari pelanggan tertentu ke perusahaan. Misalnya, data mining memungkinkan
Caesars mengetahui pengalaman bermain game favorit pelanggan tetap di salah satu kasino perahu
sungai bersama dengan preferensi orang tersebut untuk akomodasi kamar, restoran, dan hiburan.
Informasi ini memandu keputusan manajemen tentang cara membina pelanggan yang paling
menguntungkan, mendorong pelanggan tersebut untuk membelanjakan lebih banyak, dan menarik
lebih banyak pelanggan dengan potensi menghasilkan pendapatan yang tinggi. Kecerdasan bisnis
sangat meningkatkan laba Caesars sehingga menjadi inti dari strategi bisnis perusahaan.

Penambangan Teks dan Penambangan Web

Data tidak terstruktur, sebagian besar dalam bentuk file teks, diyakini mencakup lebih dari 80 persen
informasi organisasi yang berguna dan merupakan salah satu sumber utama data besar yang ingin
dianalisis perusahaan. E-mail, memo, transkrip call center, tanggapan survei, kasus hukum, deskripsi
paten, dan laporan layanan semuanya berharga untuk menemukan pola dan tren yang akan
membantu karyawan membuat keputusan bisnis yang lebih baik. Alat penambangan teks sekarang
tersedia untuk membantu bisnis menganalisis data ini. Alat ini dapat mengekstrak elemen kunci dari
kumpulan data besar yang tidak terstruktur, menemukan pola dan hubungan, dan meringkas
informasi. Bisnis mungkin beralih ke penambangan teks untuk menganalisis transkrip panggilan ke
pusat layanan pelanggan untuk mengidentifikasi masalah layanan dan perbaikan utama atau untuk
mengukur sentimen pelanggan tentang perusahaan mereka. Perangkat lunak analisis sentimen
dapat mengumpulkan komentar teks dalam pesan email, blog, percakapan media sosial, atau
formulir survei untuk mendeteksi opini yang disukai dan tidak disukai tentang subjek tertentu.

Misalnya, broker diskon menggunakan perangkat lunak analitik untuk menganalisis ratusan ribu
interaksi pelanggannya setiap bulan. Perangkat lunak tersebut menganalisis catatan layanan
pelanggan, email, tanggapan survei, dan diskusi online untuk menemukan tanda-tanda
ketidakpuasan yang mungkin menyebabkan pelanggan berhenti menggunakan layanan perusahaan.
Perangkat lunak ini dapat secara otomatis mengidentifikasi berbagai "suara" yang digunakan
pelanggan untuk mengungkapkan umpan balik mereka (seperti suara yang positif, negatif, atau
bersyarat) untuk menunjukkan dengan tepat niat seseorang untuk membeli, berniat untuk pergi,
atau reaksi terhadap produk atau pemasaran tertentu. pesan. Pialang menggunakan informasi ini
untuk mengambil tindakan korektif seperti meningkatkan komunikasi pialang langsung dengan
pelanggan dan mencoba dengan cepat menyelesaikan masalah yang membuat pelanggan tidak
senang. Web adalah sumber kaya lain dari data besar tidak terstruktur untuk mengungkap pola,
tren, dan wawasan tentang perilaku pelanggan. Penemuan dan analisis pola dan informasi yang
berguna dari World Wide Web disebut penambangan web. Bisnis mungkin beralih ke penambangan
web untuk membantu mereka memahami perilaku pelanggan, mengevaluasi keefektifan situs web
tertentu, atau mengukur keberhasilan kampanye pemasaran. Misalnya, pemasar menggunakan
layanan Google Trends, yang melacak popularitas berbagai kata dan frasa yang digunakan dalam
kueri penelusuran Google, untuk mempelajari apa yang diminati orang dan apa yang ingin mereka
beli.

Penambangan web mencari pola dalam data melalui penambangan konten, penambangan struktur,
dan penambangan penggunaan. Penambangan konten web adalah proses mengekstraksi
pengetahuan dari konten halaman web, yang dapat mencakup data teks, gambar, audio, dan video.
Penambangan struktur web memeriksa data yang terkait dengan struktur situs web tertentu.
Misalnya, link yang mengarah ke dokumen menunjukkan popularitas dokumen, sedangkan link yang
keluar dari dokumen menunjukkan kekayaan atau mungkin variasi topik yang dibahas dalam
dokumen. Penambangan penggunaan web memeriksa data interaksi pengguna yang direkam oleh
server web setiap kali permintaan sumber daya situs web diterima. Data penggunaan mencatat
perilaku pengguna ketika pengguna menjelajahi atau melakukan transaksi di situs web dan
mengumpulkan data di log server. Menganalisis data semacam itu dapat membantu perusahaan
menentukan nilai pelanggan tertentu, strategi lintas pemasaran di seluruh produk, dan keefektifan
kampanye promosi. Kasus akhir bab menjelaskan pengalaman organisasi saat mereka menggunakan
alat analisis dan teknologi intelijen bisnis yang telah kami jelaskan untuk mengatasi tantangan "data
besar".

Database dan Web

Pernahkah Anda mencoba menggunakan web untuk memesan atau melihat katalog produk? Jika
demikian, Anda menggunakan situs web yang ditautkan ke database internal perusahaan. Banyak
perusahaan sekarang menggunakan web untuk membuat beberapa informasi di database internal
mereka tersedia untuk pelanggan dan mitra bisnis. Misalkan, misalnya, pelanggan dengan browser
web ingin menelusuri database pengecer online untuk informasi harga. Gambar 6. 14
mengilustrasikan bagaimana pelanggan tersebut dapat mengakses database internal pengecer
melalui web. Pengguna mengakses situs web pengecer melalui Internet menggunakan browser web
di PC klien atau perangkat selulernya. Perangkat lunak browser web pengguna meminta data dari
database organisasi, menggunakan perintah HTML untuk berkomunikasi dengan server web. Aplikasi
memberikan akses yang lebih cepat ke database perusahaan. Karena banyak database back-end
tidak dapat menafsirkan perintah yang ditulis dalam HTML, server web meneruskan permintaan data
ini ke perangkat lunak yang menerjemahkan Perintah HTML menjadi SQL sehingga perintah tersebut
dapat diproses oleh DBMS yang bekerja dengan database. Dalam lingkungan klien / server, DBMS
menyimpan permintaan SQL dan menyediakan data yang diperlukan. Middleware mentransfer
informasi dari database internal organisasi kembali ke server web untuk dikirimkan dalam bentuk
halaman web kepada pengguna.
Gambar 6. 14 menunjukkan bahwa middleware yang bekerja antara server web dan DBMS adalah
server aplikasi yang berjalan pada komputernya sendiri (lihat Bab 5). Perangkat lunak server aplikasi
menangani semua operasi aplikasi, termasuk pemrosesan transaksi dan akses data, antara komputer
berbasis browser dan aplikasi atau database bisnis back-end perusahaan. Server aplikasi menerima
permintaan dari server web, menjalankan logika bisnis untuk memproses transaksi berdasarkan
permintaan tersebut, dan menyediakan konektivitas ke database atau sistem back-end organisasi.
Alternatifnya, perangkat lunak untuk menangani operasi ini dapat berupa program kustom atau skrip
CGI. Skrip CGI adalah program kompak menggunakan spesifikasi Common Gateway Interface (CGI)
untuk memproses data di server web. Ada sejumlah keuntungan menggunakan web untuk
mengakses database internal organisasi. Pertama, perangkat lunak browser web jauh lebih mudah
digunakan daripada alat kueri berpemilik. Kedua, antarmuka web membutuhkan sedikit atau tidak
ada perubahan ke database internal. Menambahkan antarmuka web di depan sistem lama jauh lebih
murah daripada mendesain ulang dan membangun kembali sistem untuk meningkatkan akses
pengguna.

Mengakses database perusahaan melalui web menciptakan efisiensi, peluang, dan model bisnis
baru. ThomasNet. Menyediakan direktori online terbaru lebih dari 700.000 pemasok produk industri,
seperti bahan kimia, logam, plastik, karet, dan peralatan otomotif. Sebelumnya bernama Thomas
Register, perusahaan biasanya mengirimkan katalog kertas berukuran besar dengan informasi ini.
Sekarang ini memberikan informasi ini kepada pengguna secara online melalui situs webnya dan
telah menjadi perusahaan yang lebih kecil dan lebih ramping. Perusahaan lain telah menciptakan
bisnis yang sepenuhnya baru berdasarkan akses ke database besar melalui web. Salah satunya
adalah layanan jejaring sosial Facebook, yang membantu pengguna tetap terhubung satu sama lain
dan bertemu orang baru. Facebook menampilkan "profil" dengan informasi tentang 1,6 miliar
pengguna aktif dengan informasi tentang diri mereka sendiri, termasuk minat, teman, foto, dan grup
yang berafiliasi dengan mereka. Facebook memiliki database yang sangat besar dan mengelola
semua konten ini. Ada juga banyak database yang mendukung web di sektor publik untuk
membantu konsumen dan warga negara mengakses informasi yang berguna.

6- 4 Mengapa kebijakan informasi, administrasi data, dan jaminan kualitas data penting untuk
mengelola sumber daya data perusahaan?

Menyiapkan database hanyalah permulaan. Untuk memastikan bahwa data bisnis Anda tetap akurat,
andal, dan tersedia bagi mereka yang membutuhkannya, bisnis Anda memerlukan kebijakan dan
prosedur khusus untuk pengelolaan data. Menetapkan Kebijakan Informasi Setiap bisnis, besar dan
kecil, membutuhkan kebijakan informasi. Data perusahaan Anda adalah sumber daya yang penting,
dan Anda tidak ingin orang melakukan apa pun yang mereka inginkan dengan mereka. Anda perlu
memiliki aturan tentang bagaimana data akan diatur dan dipelihara dan siapa yang diizinkan untuk
melihat data atau mengubahnya. Kebijakan informasi menetapkan aturan organisasi untuk berbagi,
menyebarkan, memperoleh, membakukan, mengklasifikasikan, dan menginventarisasi informasi.
Kebijakan informasi menjabarkan prosedur dan akuntabilitas khusus, mengidentifikasi pengguna dan
unit organisasi mana yang dapat berbagi informasi, di mana informasi dapat didistribusikan, dan
siapa yang bertanggung jawab untuk memperbarui dan memelihara informasi. Misalnya, kebijakan
informasi tipikal akan menentukan bahwa hanya anggota terpilih dari departemen penggajian dan
sumber daya manusia yang berhak mengubah dan melihat data karyawan yang sensitif, seperti gaji
karyawan atau nomor jaminan sosial, dan bahwa departemen ini bertanggung jawab untuk
membuat memastikan bahwa data karyawan tersebut akurat.

Jika Anda berada dalam bisnis kecil, kebijakan informasi akan dibuat dan diterapkan oleh pemilik
atau manajer. Dalam organisasi besar, pengelolaan dan perencanaan informasi sebagai sumber daya
perusahaan sering kali memerlukan fungsi administrasi data formal. Administrasi data bertanggung
jawab atas kebijakan dan prosedur khusus di mana data dapat dikelola sebagai sumber daya
organisasi. Tanggung jawab ini mencakup pengembangan kebijakan informasi, perencanaan data,
pengawasan desain database logis dan pengembangan kamus data, dan pemantauan bagaimana
spesialis sistem informasi dan kelompok pengguna akhir menggunakan data. Anda mungkin
mendengar istilah tata kelola data yang digunakan untuk menggambarkan banyak dari aktivitas ini.
Dipromosikan oleh IBM, tata kelola data berkaitan dengan kebijakan dan proses untuk mengelola
ketersediaan, kegunaan, integritas, dan keamanan data yang digunakan di perusahaan dengan
penekanan khusus pada promosi privasi, keamanan, kualitas data, dan kepatuhan terhadap
peraturan pemerintah. Sebuah organisasi besar juga akan memiliki desain database dan grup
manajemen di dalam divisi sistem informasi perusahaan yang bertanggung jawab untuk menentukan
dan mengatur struktur dan konten database serta memelihara database. Dalam kerjasama erat
dengan pengguna, kelompok desain menetapkan database fisik, hubungan logis antar elemen, dan
aturan akses dan prosedur keamanan. Fungsi yang dilakukannya disebut administrasi database.

Menjamin Kualitas Data

Database dan kebijakan informasi yang dirancang dengan baik akan sangat membantu dalam
memastikan bahwa bisnis memiliki informasi yang dibutuhkannya. Namun, langkah tambahan harus
diambil untuk memastikan bahwa data dalam database organisasi akurat dan tetap dapat
diandalkan. Apa yang akan terjadi jika nomor telepon atau saldo rekening pelanggan salah? Apa
dampaknya jika database memiliki harga yang salah untuk produk yang Anda jual atau sistem
penjualan dan sistem inventaris Anda menunjukkan harga yang berbeda untuk produk yang sama?
Data yang tidak akurat, tidak tepat waktu, atau tidak konsisten dengan sumber informasi lain dapat
menyebabkan keputusan yang salah, penarikan produk, dan kerugian finansial. Gartner, Inc.
melaporkan bahwa lebih dari 25 persen data penting dalam database 1000 perusahaan Global besar
tidak akurat atau tidak lengkap, termasuk kode produk dan deskripsi produk yang buruk, deskripsi
inventaris yang salah, data keuangan yang salah, informasi pemasok yang salah, dan data karyawan
yang salah . Beberapa masalah kualitas data ini disebabkan oleh data yang berlebihan dan tidak
konsisten yang dihasilkan oleh beberapa sistem yang memberi makan gudang data. Misalnya, sistem
pemesanan penjualan dan sistem manajemen inventaris dapat menyimpan data tentang produk
organisasi. Namun, sistem pemesanan penjualan mungkin menggunakan istilah tersebut.

Nomor Item dan sistem inventaris mungkin memanggil atribut yang sama dengan Nomor Produk.
Sistem penjualan, inventaris, atau manufaktur dari pengecer pakaian mungkin menggunakan kode
yang berbeda untuk mewakili nilai suatu atribut. Satu sistem mungkin merepresentasikan ukuran
pakaian sebagai "sedang", sedangkan sistem lainnya mungkin menggunakan kode "M" untuk tujuan
yang sama. Selama proses desain untuk database gudang, data yang mendeskripsikan entitas,
seperti pelanggan, produk, atau pesanan, harus diberi nama dan didefinisikan secara konsisten
untuk semua area bisnis menggunakan database. Pikirkan semua saat Anda menerima beberapa
iklan surat langsung yang sama pada hari yang sama. Ini kemungkinan besar karena nama Anda
dipertahankan beberapa kali dalam database. Nama Anda mungkin salah eja atau Anda
menggunakan inisial tengah Anda pada satu kesempatan dan tidak pada yang lain atau informasi
pada awalnya dimasukkan ke dalam formulir kertas dan tidak dipindai dengan benar ke dalam
sistem. Karena ketidakkonsistenan ini, database akan memperlakukan Anda sebagai orang yang
berbeda! Kami sering menerima surat berlebihan yang dialamatkan ke Laudon, Lavdon, Lauden, atau
Landon.

Jika database dirancang dengan benar dan standar data seluruh perusahaan ditetapkan, elemen
data duplikat atau tidak konsisten harus minimal. Namun, sebagian besar masalah kualitas data,
seperti nama yang salah eja, nomor yang dialihkan, atau kode yang salah atau hilang, berasal dari
kesalahan selama input data. Insiden kesalahan tersebut meningkat saat perusahaan memindahkan
bisnis mereka ke web dan memungkinkan pelanggan dan pemasok untuk memasukkan data ke situs
web mereka yang secara langsung memperbarui sistem internal. Sebelum database baru tersedia,
organisasi perlu mengidentifikasi dan memperbaiki data mereka yang salah dan menetapkan
rutinitas yang lebih baik untuk mengedit data setelah database mereka beroperasi. Analisis kualitas
data sering kali dimulai dengan kualitas data audit, yaitu survei terstruktur atas keakuratan dan
tingkat kelengkapan data dalam suatu sistem informasi. Audit kualitas data dapat dilakukan dengan
mensurvei seluruh file data, mensurvei sampel dari file data, atau mensurvei pengguna akhir untuk
persepsi mereka tentang kualitas data.

Pembersihan data, juga dikenal sebagai data scrubbing, terdiri dari aktivitas untuk mendeteksi dan
mengoreksi data dalam database yang salah, tidak lengkap, tidak diformat dengan benar, atau
berlebihan. Pembersihan data tidak hanya memperbaiki kesalahan tetapi juga menegakkan
konsistensi di antara kumpulan data berbeda yang berasal dari sistem informasi terpisah. Perangkat
lunak pembersih data khusus tersedia untuk secara otomatis mensurvei file data, memperbaiki
kesalahan dalam data, dan mengintegrasikan data dalam sebuah format perusahaan yang konsisten.
Masalah kualitas data bukan hanya masalah bisnis. Mereka juga menimbulkan masalah serius bagi
individu, mempengaruhi kondisi keuangan dan bahkan pekerjaan mereka. Misalnya, data yang tidak
akurat atau usang tentang riwayat kredit konsumen yang dikelola oleh biro kredit dapat mencegah
individu yang layak kredit mendapatkan pinjaman atau menurunkan peluang mereka untuk
menemukan atau mempertahankan pekerjaan. Sebagian kecil perusahaan mengizinkan masing-
masing departemen untuk bertanggung jawab menjaga kualitas datanya sendiri. Namun, praktik
administrasi data terbaik memerlukan sentralisasi tata kelola data, standarisasi data organisasi,
pemeliharaan kualitas data, dan aksesibilitas ke aset data. Sesi Interaktif tentang Manajemen
menggambarkan pengalaman Societe Generale dalam mengelola data sebagai sumber daya. Saat
Anda membaca kasus ini, cobalah untuk mengidentifikasi kebijakan, prosedur, dan teknologi yang
diperlukan untuk meningkatkan manajemen data di perusahaan ini.