Bab 6
Yayasan Bisnis
Intelijen: Database dan
Manajemen informasi
Sesi Interaktif:
Data Besar, Hadiah Besar
SISTEM BAE
dari organisasi kedirgantaraan dan pertahanan komersial terbesar di Eropa. Ini tinggi
teknologi, produk dan layanan berbasis informasi berkisar dari salah satu dunia
BAE Systems (BAE) adalah perusahaan manufaktur terbesar dan satu-satunya di Britania Raya
pesawat tempur multi-peran yang paling mumpuni, Eurofighter Typhoon, hingga keluarga
pesawat komersial Jetstream, hingga penyediaan teknologi informasi dan sistem informasi untuk e-
bisnis untuk mengembangkan dan mengimplementasikan layanan logistik, TI, dan kemampuan
elektronik. Dengan lokasi penjualan, manufaktur, dan dukungan di seluruh dunia, termasuk Inggris,
Eropa, Amerika Serikat, dan Australia, BAE mempekerjakan 88.000 orang dan menghasilkan
pendapatan tahunan lebih dari US$30 miliar.
Meskipun BAE telah mengkonsolidasikan posisi kompetitifnya di pasar yang sudah mapan,
dan terus berekspansi ke pasar baru di Timur Tengah dan Asia, kinerjanya di bagian bisnis
pesawat terhambat oleh sistem informasi lama yang mendukung desain berbantuan komputer
( CAD ) dan computer-aided manufacturing (CAM) pesawatnya. Sifat terdistribusi dari situs
desain dan manufaktur BAE berarti bahwa menyimpan dan menganalisis kumpulan data
operasional yang akurat yang menggambarkan komponen kompleks dari berbagai jenis pesawat
untuk menghasilkan laporan perakitan pesawat untuk lini produksi menjadi semakin menantang
dan menghabiskan sumber daya. Data yang menggambarkan bagian komponen pesawat yang
sama mungkin memerlukan resolusi, seperti dalam kasus berbagai konvensi dan kode penamaan bagian.
Mengakses data dari banyak sistem merupakan tugas rumit yang melibatkan banyak tantangan
teknis. Seiring pertumbuhan bisnis pesawat BAE, demikian pula kemungkinan keterlambatan
dalam pembuatan laporan perakitan pesawat dan set data operasi lainnya yang diperlukan untuk
pengambilan keputusan manajemen produksi pesawat. Dalam kasus terburuk, produksi pesawat
di jalur perakitan akan berhenti sampai tersedia informasi yang akurat, dengan konsekuensi jadwal
dan implikasi biaya. Staf CAD/CAM BAE menyimpan dan menganalisis set data yang bersumber
dari 5 situs desain dan manufaktur pesawat utama yang tersebar di seluruh Inggris, masing-
masing menampung ribuan staf yang terlibat dalam proses desain dan manufaktur, sehingga
laporan perakitan dan data operasi lainnya dapat diproduksi . Meskipun data yang diproses oleh
sistem warisan disimpan terutama dalam file komputer, ada banyak kesempatan ketika gambar
kertas dengan anotasi yang
berisi desain komponen dan
informasi pembuatan digunakan
untuk merekonsiliasi ambiguitas
dan ketidakkonsistenan dalam perakitan.
laporan bly. Ketika ambiguitas
dan ketidakkonsistenan data
ini terjadi, hal ini menimbulkan
rasa ketidakpastian dalam
laporan majelis yang dihasilkan.
Yang dibutuhkan BAE adalah dosa
gle untuk data CAD/CAM yang
juga akan memudahkan
integrasi data yang disimpan
dalam sistem warisannya.
Perusahaan memutuskan
untuk mengganti sistem
warisannya dengan sistem
manajemen pengetahuan yang
© Kristoffer Tripplaar/Alamy
luas yang akan membawa desain dan manu
239
Machine Translated by Google
memfaktur data ke dalam database tunggal yang dapat diakses secara bersamaan oleh insinyur
desain dan manufaktur. BAE menerapkan perangkat lunak manajemen siklus hidup produk
Teamcenter dari Siemens dan perangkat lunak CATIA CAD/CAM dari Dassault Systemes. Teamcenter
juga dapat dikonfigurasi untuk memanfaatkan perkembangan terbaru dalam komputasi awan
menggunakan Microsoft Azure, IBM SmartCloud Enterprise+, dan Amazon Web Services.
Menyatukan Teamcenter dari Siemens dan CATIA dari Dassault Systemes telah memberi BAE
Systems alat manajemen data terintegrasi yang kuat. Database Teamcenter menyertakan alat untuk
markup komponen dan kapabilitas rollup yang memungkinkan pengguna memvisualisasikan efek
perubahan desain komponen dan pemilihan konfigurasi secara real-time.
Solusi baru ini telah menghasilkan penghematan biaya yang signifikan di BAE dalam hal desain
dan pembuatan manajemen dan penyimpanan data, sekaligus meningkatkan kinerja. Dengan sistem
lama dan file data yang lebih sedikit untuk dikelola, BAE telah mampu memenuhi persyaratan kualitas,
waktu dan biaya dengan mampu menghasilkan definisi dan konfigurasi komponen pesawat yang
lengkap dan akurat. Teknologi basis data manufaktur dan desain baru BAE telah meningkatkan
kecepatan ke pasar dengan menyinkronkan CAD hulu dan definisi komponen CAM hilir, sehingga
memungkinkan koordinasi lintas disiplin yang lebih baik. Dengan penghematan ini, perusahaan dapat
menggunakan lebih banyak sumber daya untuk meningkatkan pengelolaan data di seluruh perusahaan.
Sumber: “BAE Systems Half-Yearly Report and Presentation 2012” www.baesystems.com, diakses 8 November
2012; “Pusat tim mendukung pesawat melalui siklus 50 tahun: BAE Systems Military Air Solutions” www.
plm.automation.siemens.com, diakses 8 November 2012; “Lembar Fakta CATIA V5” www.3ds.com, diakses 8
November 2012.
Sebagai contoh, catatan pada Gambar 6.1 dapat berupa file kursus siswa.
Sekelompok file terkait membentuk database. File kursus siswa yang diilustrasikan
pada Gambar 6.1 dapat dikelompokkan dengan file sejarah pribadi siswa dan latar
belakang keuangan untuk membuat database siswa.
Catatan menggambarkan entitas. Entitas adalah orang, tempat , benda, atau
peristiwa tempat kami menyimpan dan memelihara informasi. Setiap karakteristik
atau kualitas yang menggambarkan entitas tertentu disebut atribut . Misalnya,
Student_ID, Course, Date, dan Grade adalah atribut entitas COURSE. Nilai spesifik
yang dapat dimiliki atribut ini ditemukan di bidang catatan yang menjelaskan
KURSUS entitas.
Machine Translated by Google
Sistem komputer mengatur data dalam hierarki yang dimulai dengan bit, yang mewakili 0 atau 1. Bit dapat
dikelompokkan untuk membentuk byte yang mewakili satu karakter, angka, atau simbol. Byte dapat dikelompokkan
untuk membentuk bidang, dan bidang terkait dapat dikelompokkan untuk membentuk catatan. Catatan terkait
dapat dikumpulkan untuk membentuk file, dan file terkait dapat diatur ke dalam database.
Penggunaan pendekatan tradisional untuk pemrosesan file mendorong setiap area fungsional dalam perusahaan
untuk mengembangkan aplikasi khusus. Setiap aplikasi memerlukan file data unik yang kemungkinan merupakan
subset dari file master. Subset dari file master ini menyebabkan redundansi dan inkonsistensi data, ketidakfleksibelan
pemrosesan, dan pemborosan sumber daya penyimpanan.
Ketergantungan Program-Data
Ketergantungan program-data mengacu pada kopling data yang disimpan dalam file
dan program khusus yang diperlukan untuk memperbarui dan memelihara file tersebut
sehingga perubahan dalam program memerlukan perubahan data. Setiap program
komputer tradisional harus menggambarkan lokasi dan sifat data yang digunakannya.
Dalam lingkungan file tradisional, setiap perubahan dalam program perangkat lunak
dapat memerlukan perubahan data yang diakses oleh program tersebut. Satu program
mungkin dimodifikasi dari kode pos lima digit menjadi sembilan digit. Jika file data asli
diubah dari kode pos lima digit menjadi sembilan digit, maka program lain yang
memerlukan kode pos lima digit tidak akan berfungsi dengan baik. Perubahan semacam
itu dapat menelan biaya jutaan dolar untuk diterapkan dengan benar.
Kurangnya Fleksibilitas
Sebuah sistem file tradisional dapat mengirimkan laporan terjadwal rutin setelah upaya
pemrograman yang ekstensif, tetapi tidak dapat mengirimkan laporan ad hoc atau
menanggapi kebutuhan informasi yang tidak terduga secara tepat waktu. Informasi yang
dibutuhkan oleh permintaan ad hoc ada di suatu tempat di sistem tetapi mungkin terlalu
mahal untuk diambil kembali. Beberapa pemrogram mungkin harus bekerja selama berminggu-
minggu untuk menyusun item data yang diperlukan dalam file baru.
Keamanan yang
Buruk Karena hanya ada sedikit kontrol atau pengelolaan data, akses dan penyebaran
informasi mungkin tidak terkendali. Manajemen mungkin tidak memiliki cara untuk mengetahui
siapa yang mengakses atau bahkan membuat perubahan pada data organisasi.
ke data yang disimpan oleh program aplikasi. DBMS bertindak sebagai antarmuka
antara program aplikasi dan file data fisik. Ketika program aplikasi meminta item data,
seperti pembayaran kotor, DBMS menemukan item ini dalam database dan
menyajikannya ke program aplikasi. Menggunakan file data tradisional, pemrogram
harus menentukan ukuran dan format setiap elemen data yang digunakan dalam
program dan kemudian memberi tahu komputer di mana mereka berada.
Satu database sumber daya manusia menyediakan banyak tampilan data yang berbeda, bergantung
pada kebutuhan informasi pengguna. Diilustrasikan di sini adalah dua pandangan yang mungkin, satu
menarik bagi spesialis tunjangan dan satu lagi menarik bagi anggota departemen penggajian perusahaan.
Machine Translated by Google
sendiri. Akses dan ketersediaan informasi akan ditingkatkan dan biaya pengembangan
dan pemeliharaan program berkurang karena pengguna dan pemrogram dapat
melakukan kueri ad hoc data dalam basis data. DBMS memungkinkan organisasi untuk
mengelola data, penggunaan, dan keamanannya secara terpusat.
Database relasional mengatur data dalam bentuk tabel dua dimensi. Diilustrasikan di sini adalah tabel untuk entitas SUPPLIER dan PART yang
menunjukkan bagaimana mereka merepresentasikan setiap entitas dan atributnya. Supplier_Number adalah primary key untuk tabel SUPPLIER dan
foreign key untuk tabel PART.
Machine Translated by Google
Bab 6 Dasar Kecerdasan Bisnis: Basis Data dan Manajemen Informasi 247
deretan data. Setiap elemen data individual untuk setiap entitas disimpan sebagai bidang terpisah,
dan setiap bidang mewakili atribut untuk entitas tersebut. Bidang dalam database relasional juga
disebut kolom. Untuk entitas PEMASOK, nomor identifikasi pemasok, nama, jalan, kota, negara
bagian, dan kode pos disimpan sebagai bidang terpisah dalam tabel PEMASOK dan setiap bidang
mewakili atribut untuk entitas PEMASOK.
Informasi aktual tentang pemasok tunggal yang berada dalam sebuah tabel disebut baris. Baris
biasanya disebut sebagai catatan, atau dalam istilah yang sangat teknis, sebagai tupel. Data untuk
PART entitas memiliki tabel tersendiri.
Bidang untuk Supplier_Number dalam tabel SUPPLIER secara unik mengidentifikasi setiap
catatan sehingga catatan dapat diambil, diperbarui, atau diurutkan. Ini disebut bidang kunci. Setiap
tabel dalam database relasional memiliki satu bidang yang ditetapkan sebagai kunci utamanya.
Bidang kunci ini adalah pengidentifikasi unik untuk semua informasi di setiap baris tabel dan kunci
utama ini tidak dapat diduplikasi. Supplier_Number adalah primary key untuk tabel SUPPLIER dan
Part_Number adalah primary key untuk tabel PART. Perhatikan bahwa Supplier_Number muncul di
tabel SUPPLIER dan PART. Dalam tabel SUPPLIER, Supplier_Number adalah primary key. Saat
bidang Supplier_Number muncul di tabel PART, itu disebut kunci asing dan pada dasarnya adalah
bidang pencarian untuk mencari data tentang pemasok bagian tertentu.
Database Non-Relasional dan Database di Cloud Selama lebih dari 30 tahun, teknologi
database relasional telah menjadi standar emas.
Komputasi awan, volume data yang belum pernah terjadi sebelumnya, beban kerja masif untuk
layanan Web, dan kebutuhan untuk menyimpan jenis data baru memerlukan alternatif basis data
untuk model relasional tradisional dalam mengatur data dalam bentuk tabel, kolom, dan baris.
Perusahaan beralih ke teknologi database non-relasional "NoSQL" untuk tujuan ini. Sistem
manajemen basis data non-relasional menggunakan model data yang lebih fleksibel dan dirancang
untuk mengelola kumpulan data besar di banyak mesin terdistribusi dan untuk meningkatkan atau
menurunkan skala dengan mudah. Mereka berguna untuk mempercepat permintaan sederhana
terhadap volume besar terstruktur dan
Operasi
pilih,
gabung,
dan
proyek
memungkinkan
data
dari
dua
tabel
berbeda
digabungkan
dan
hanya
atribut
terpilih
yang
ditampilkan.
GAMBAR
6.5
TIGA
OPERASI
DASAR
DBMS
RELASI
248 Bagian Kedua Infrastruktur Teknologi Informasi
Machine Translated by Google
Machine Translated by Google
Bab 6 Dasar Kecerdasan Bisnis: Basis Data dan Manajemen Informasi 249
data tidak terstruktur, termasuk Web, media sosial, grafik, dan bentuk data lain yang sulit dianalisis
dengan alat berbasis SQL tradisional.
Ada beberapa jenis database NoSQL, masing-masing dengan fitur dan perilaku teknisnya sendiri.
Oracle NoSQL Database adalah salah satu contohnya, seperti SimpleDB milik Amazon, salah satu
Amazon Web Services yang berjalan di cloud. SimpleDB menyediakan antarmuka layanan Web
sederhana untuk membuat dan menyimpan beberapa kumpulan data, meminta data dengan mudah,
dan mengembalikan hasilnya. Tidak perlu menentukan struktur database formal atau mengubah
definisi tersebut jika data baru ditambahkan nanti.
Amazon dan vendor komputasi awan lainnya juga menyediakan layanan basis data relasional.
Amazon Relational Database Service (Amazon RDS) menawarkan MySQL, SQL Server, atau Oracle
Database sebagai mesin database. Harga didasarkan pada penggunaan. Oracle memiliki Layanan
Cloud Database sendiri menggunakan Oracle Database 11g relasionalnya, dan Microsoft SQL Azure
Database adalah layanan database relasional berbasis cloud berdasarkan DBMS SQL Server
Microsoft. Layanan manajemen data berbasis cloud memiliki daya tarik khusus untuk start-up yang
berfokus pada Web atau usaha kecil hingga menengah yang mencari kemampuan database dengan
harga lebih rendah daripada produk database internal.
TicketDirect, yang menjual tiket konser, acara olahraga, pertunjukan teater, dan film di Australia
dan Selandia Baru, mengadopsi platform cloud SQL Azure Database untuk meningkatkan pengelolaan
beban sistem puncak selama penjualan tiket besar. Ini memigrasikan datanya ke database SQL
Azure. Dengan beralih ke solusi cloud, TicketDirect dapat menskalakan sumber daya komputasinya
sebagai respons terhadap permintaan waktu nyata sekaligus menjaga biaya tetap rendah.
Selain layanan pengelolaan data berbasis cloud publik, perusahaan kini memiliki opsi untuk
menggunakan database di cloud pribadi. Misalnya, Sabre Holdings, penyedia perangkat lunak sebagai
layanan (SaaS) terbesar di dunia untuk industri penerbangan, memiliki cloud database pribadi yang
mendukung lebih dari 100 proyek dan 700 pengguna. Basis data terkonsolidasi yang mencakup
kumpulan server standar yang menjalankan Oracle Database 11g menyediakan layanan basis data
untuk berbagai aplikasi. Alat manajemen beban kerja memastikan sumber daya yang cukup tersedia
untuk memenuhi kebutuhan aplikasi bahkan saat beban kerja berubah. Platform perangkat keras dan
perangkat lunak bersama mengurangi jumlah server, DBMS, dan perangkat penyimpanan yang
diperlukan untuk proyek ini, yang terdiri dari aplikasi perjalanan maskapai kustom bersama dengan
kereta api, hotel, dan aplikasi industri perjalanan lainnya (Baum, 2011).
Cloud pribadi menggabungkan server, penyimpanan, sistem operasi, basis data, dan beban kerja
campuran ke infrastruktur perangkat keras dan perangkat lunak bersama. Menyebarkan database
pada cloud pribadi yang terkonsolidasi memungkinkan departemen TI untuk meningkatkan kualitas
tingkat layanan dan mengurangi biaya modal dan operasional. Semakin tinggi kepadatan konsolidasi
yang dicapai, semakin besar pengembalian investasi.
DBMS memiliki kemampuan definisi data untuk menentukan struktur isi database. Ini akan
digunakan untuk membuat tabel database dan untuk
menentukan karakteristik bidang di setiap tabel. Informasi ini tentang
database akan didokumentasikan dalam kamus data. Kamus data adalah file otomatis atau manual
yang menyimpan definisi elemen data dan elemennya
karakteristik.
Machine Translated by Google
Microsoft Access memiliki kemampuan kamus data yang belum sempurna yang
menampilkan informasi tentang nama, deskripsi, ukuran, tipe, format, dan properti lain dari
setiap bidang dalam sebuah tabel (lihat Gambar 6.6). Kamus data untuk database perusahaan
besar dapat menangkap informasi tambahan, seperti penggunaan, kepemilikan (siapa dalam
organisasi yang bertanggung jawab untuk memelihara data), otorisasi, keamanan, dan
individu, fungsi bisnis, program, dan laporan yang menggunakan setiap elemen data.
Microsoft Access memiliki kemampuan kamus data dasar yang menampilkan informasi tentang
ukuran, format, dan karakteristik lain dari setiap bidang dalam database. Ditampilkan di sini
adalah informasi yang disimpan dalam tabel SUPPLIER. Ikon kunci kecil di sebelah kiri
Supplier_Number menunjukkan bahwa itu adalah bidang kunci.
Machine Translated by Google
Bab 6 Dasar Kecerdasan Bisnis: Basis Data dan Manajemen Informasi 251
Diilustrasikan di sini adalah pernyataan SQL untuk kueri untuk memilih pemasok untuk bagian 137 atau 150.
Mereka menghasilkan daftar dengan hasil yang sama seperti Gambar 6.5.
Microsoft Access dan DBMS lainnya menyertakan kemampuan untuk pembuatan laporan
sehingga data yang menarik dapat ditampilkan dalam format yang lebih terstruktur dan
terpoles daripada yang mungkin dilakukan hanya dengan kueri. Crystal Reports adalah
pembuat laporan populer untuk DBMS perusahaan besar, meskipun juga dapat digunakan
dengan Access. Access juga memiliki kemampuan untuk mengembangkan aplikasi sistem desktop.
Ini termasuk alat untuk membuat layar entri data, laporan, dan mengembangkan logika
untuk memproses transaksi.
MERANCANG DATABASE
Untuk membuat database, Anda harus memahami hubungan antar data, tipe data yang
akan dipertahankan dalam database, bagaimana data akan digunakan, dan bagaimana
organisasi perlu diubah untuk mengelola data dari perspektif seluruh perusahaan. . Basis
data membutuhkan desain konseptual dan desain fisik. Desain konseptual, atau logis, dari
database adalah model abstrak database dari perspektif bisnis, sedangkan desain fisik
menunjukkan bagaimana database sebenarnya diatur pada perangkat penyimpanan akses
langsung.
Diilustrasikan di sini adalah bagaimana kueri pada Gambar 6.7 akan dibuat menggunakan alat pembuat
kueri Microsoft Access. Ini memperlihatkan tabel, bidang, dan kriteria pemilihan yang digunakan untuk kueri.
Machine Translated by Google
252 Bagian Kedua Infrastruktur Teknologi Informasi
Relasi yang tidak dinormalisasi berisi grup berulang. Misalnya, ada banyak suku cadang dan pemasok untuk setiap pesanan. Hanya
ada korespondensi satu-ke-satu antara Nomor_Pesanan dan Tanggal_Pesanan.
Setelah normalisasi, relasi awal ORDER telah dipecah menjadi empat relasi yang lebih kecil. Relasi ORDER dibiarkan dengan hanya dua atribut
dan relasi LINE_ITEM memiliki kunci gabungan, atau gabungan, yang terdiri dari Order_Number dan Part_Number.
Machine Translated by Google
Bab 6 Dasar Kecerdasan Bisnis: Basis Data dan Manajemen Informasi 253
diagram entitas-hubungan, dan desain basis data di Jalur Pembelajaran untuk bab ini.
Diagram ini menunjukkan relasi antara entitas SUPPLIER, PART, LINE_ITEM, dan ORDER yang dapat digunakan untuk memodelkan
database pada Gambar 6.10.
Machine Translated by Google
Bisnis menggunakan database mereka untuk melacak transaksi dasar, seperti membayar pemasok,
memproses pesanan, melacak pelanggan, dan membayar karyawan.
Tetapi mereka juga memerlukan database untuk memberikan informasi yang akan membantu
perusahaan menjalankan bisnis secara lebih efisien, dan membantu manajer dan karyawan membuat
keputusan yang lebih baik. Jika sebuah perusahaan ingin mengetahui produk mana yang paling
populer atau siapa pelanggannya yang paling menguntungkan, jawabannya terletak pada data.
Data besar tidak mengacu pada jumlah tertentu, tetapi biasanya mengacu pada data dalam
rentang petabyte dan exabyte—dengan kata lain, miliaran hingga triliunan catatan, semuanya dari
sumber yang berbeda. Data besar diproduksi dalam jumlah yang jauh lebih besar dan jauh lebih
cepat daripada data tradisional. Misalnya, satu mesin jet mampu menghasilkan 10 terabyte data
hanya dalam 30 menit, dan terdapat lebih dari 25.000 penerbangan maskapai setiap hari. Meskipun
"tweet" masing-masing dibatasi hingga 140 karakter, Twitter menghasilkan lebih dari 8 terabyte data
setiap hari. Menurut firma riset teknologi Pusat Data Internasional (IDC), data meningkat lebih dari
dua kali lipat setiap dua tahun, sehingga jumlah data yang tersedia untuk organisasi meroket.
Bisnis tertarik pada big data karena dapat mengungkap lebih banyak pola dan anomali yang
menarik daripada kumpulan data yang lebih kecil, dengan potensi untuk memberikan wawasan baru
tentang perilaku pelanggan, pola cuaca, aktivitas pasar keuangan, atau fenomena lainnya. Namun,
untuk memperoleh nilai bisnis dari data ini, organisasi memerlukan teknologi dan alat baru yang
mampu mengelola dan menganalisis data non-tradisional bersama dengan data perusahaan
tradisional mereka.
Data ini digabungkan dengan data dari sumber eksternal dan diubah dengan mengoreksi
data yang tidak akurat dan tidak lengkap serta merestrukturisasi data untuk pelaporan dan
analisis manajemen sebelum dimuat ke gudang data.
Gudang data membuat data tersedia bagi siapa saja untuk diakses sesuai kebutuhan,
tetapi tidak dapat diubah. Sebuah sistem gudang data juga menyediakan berbagai alat
permintaan ad hoc dan standar, alat analitis, dan fasilitas pelaporan grafis.
DBMS
Relasional Hadoop dan produk gudang data tidak cocok untuk mengatur dan menganalisis
data besar atau data yang tidak mudah masuk ke dalam kolom dan baris yang digunakan
dalam model datanya. Untuk menangani data tidak terstruktur dan semi terstruktur dalam
jumlah besar, serta data terstruktur, organisasi menggunakan Hadoop.
Hadoop adalah kerangka kerja perangkat lunak open source yang dikelola oleh Apache
Software Foundation yang memungkinkan pemrosesan paralel terdistribusi data dalam
jumlah besar di seluruh komputer murah. Itu memecah masalah data besar menjadi sub-
masalah, mendistribusikannya di antara hingga ribuan node pemrosesan komputer yang
murah, dan kemudian menggabungkan hasilnya menjadi kumpulan data yang lebih kecil
yang lebih mudah dianalisis. Anda mungkin pernah menggunakan Hadoop untuk menemukan
tiket pesawat terbaik di Internet, mendapatkan petunjuk arah ke restoran, melakukan
pencarian di Google, atau terhubung dengan teman di Facebook.
Hadoop terdiri dari beberapa layanan utama: Hadoop Distributed File System (HDFS)
untuk penyimpanan data dan MapReduce untuk pemrosesan data paralel berperforma
tinggi. HDFS menghubungkan bersama sistem file pada banyak node di kluster Hadoop
untuk mengubahnya menjadi satu sistem file besar. MapReduce Hadoop terinspirasi oleh
sistem MapReduce Google untuk memecah pemrosesan kumpulan data besar dan
menugaskan pekerjaan ke berbagai node dalam sebuah kluster. HBase, database non-
relasional Hadoop, menyediakan akses cepat ke data yang disimpan di HDFS dan platform
transaksional untuk menjalankan aplikasi real-time berskala tinggi.
Hadoop dapat memproses segala jenis data dalam jumlah besar, termasuk data
transaksional terstruktur, data terstruktur longgar seperti feed Facebook dan Twitter, data
kompleks seperti file log server Web, dan data audio dan video yang tidak terstruktur.
Hadoop berjalan di sekelompok server murah, dan prosesor dapat ditambahkan atau dihapus
sesuai kebutuhan. Perusahaan menggunakan Hadoop untuk menganalisis sangat besar
Machine Translated by Google
volume data serta untuk area pementasan untuk data tidak terstruktur dan semi-terstruktur sebelum
dimuat ke gudang data. Facebook menyimpan sebagian besar datanya di kluster Hadoop yang
sangat besar, yang menampung sekitar 100 petabyte, sekitar 10.000 kali lebih banyak informasi
daripada Library of Congress. Yahoo menggunakan Hadoop untuk melacak perilaku pengguna
sehingga dapat mengubah halaman beranda agar sesuai dengan minat mereka.
Firma riset ilmu kehidupan NextBio menggunakan Hadoop dan HBase untuk memproses data bagi
perusahaan farmasi yang melakukan penelitian genomik. Vendor basis data teratas seperti IBM,
Hewlett-Packard, Oracle, dan Microsoft memiliki distribusi perangkat lunak Hadoop mereka sendiri.
Vendor lain menawarkan alat untuk memindahkan data masuk dan keluar dari Hadoop atau untuk
menganalisis data di dalam Hadoop.
Bab sebelumnya menjelaskan beberapa kemajuan dalam teknologi perangkat keras komputer
kontemporer yang memungkinkan pemrosesan dalam memori, seperti prosesor berkecepatan tinggi
yang kuat, pemrosesan multicore, dan turunnya harga memori komputer. Teknologi ini membantu
perusahaan mengoptimalkan penggunaan memori dan mempercepat kinerja pemrosesan sekaligus
menurunkan biaya.
Produk komersial terkemuka untuk in-memory computing termasuk SAP's High Performance
Analytics Appliance (HANA) dan Oracle Exalytics. Masing-masing menyediakan seperangkat
komponen perangkat lunak terintegrasi, termasuk perangkat lunak basis data dalam memori dan
perangkat lunak analitik khusus, yang dijalankan pada perangkat keras yang dioptimalkan untuk
pekerjaan komputasi dalam memori.
Centrica, utilitas gas dan listrik, menggunakan HANA untuk dengan cepat menangkap dan
menganalisis sejumlah besar data yang dihasilkan oleh smart meter. Perusahaan dapat menganalisis
penggunaan setiap 15 menit, memberikan gambaran penggunaan yang lebih jelas berdasarkan
lingkungan, ukuran rumah, jenis bisnis yang dilayani, atau jenis bangunan. HANA juga membantu
Centrica menunjukkan kepada pelanggannya pola penggunaan energi mereka secara real-time
menggunakan alat online dan seluler.
Infrastruktur intelijen bisnis kontemporer menampilkan kemampuan dan alat untuk mengelola dan
menganalisis sejumlah besar dan berbagai jenis data dari berbagai sumber. Alat kueri dan pelaporan
yang mudah digunakan untuk pengguna bisnis biasa dan kumpulan alat analitik yang lebih canggih untuk
pengguna mahir disertakan.
yang telah direstrukturisasi dan ditata ulang untuk pelaporan dan analisis. Hadoop cluster melakukan pra-proses
data besar untuk digunakan di gudang data, data mart, atau platform analitik, atau untuk kueri langsung oleh
pengguna yang mahir. Output mencakup laporan dan dasbor serta hasil kueri. Bab 12 membahas berbagai jenis
pengguna BI dan pelaporan BI secara lebih rinci.
data dengan cara yang berbeda menggunakan beberapa dimensi. Setiap aspek informasi—produk,
harga, biaya, wilayah, atau jangka waktu—mewakili dimensi yang berbeda.
Jadi, seorang manajer produk dapat menggunakan alat analisis data multidimensi untuk mempelajari
berapa banyak mesin cuci yang terjual di Timur pada bulan Juni, bagaimana perbandingannya
dengan bulan sebelumnya dan Juni sebelumnya, dan bagaimana perbandingannya dengan ramalan
penjualan. OLAP memungkinkan pengguna mendapatkan jawaban online untuk pertanyaan ad hoc
seperti ini dalam waktu yang cukup cepat, bahkan saat data disimpan dalam database yang sangat
besar, seperti angka penjualan selama beberapa tahun.
Gambar 6.13 menunjukkan model multidimensi yang dapat dibuat untuk mewakili produk, wilayah,
penjualan aktual, dan penjualan yang diproyeksikan. Matriks penjualan aktual dapat ditumpuk di atas
matriks proyeksi penjualan untuk membentuk kubus dengan enam sisi.
Jika Anda memutar kubus 90 derajat satu arah, tampilan wajah akan menjadi produk versus penjualan
aktual dan proyeksi. Jika Anda memutar kubus 90 derajat lagi, Anda akan melihat wilayah versus
penjualan aktual dan proyeksi. Jika Anda memutar 180 derajat dari tampilan asli, Anda akan melihat
proyeksi penjualan dan produk versus wilayah. Kubus dapat disarangkan di dalam kubus untuk
membangun tampilan data yang kompleks. Sebuah perusahaan akan menggunakan basis data
multidimensi khusus atau alat yang menciptakan tampilan data multidimensi dalam basis data
relasional.
Penambangan Data
Kueri basis data tradisional menjawab pertanyaan seperti, "Berapa banyak unit produk nomor 403
yang dikirim pada Februari 2013?" OLAP, atau analisis multidimensi, mendukung permintaan
informasi yang jauh lebih kompleks, seperti, "Bandingkan penjualan produk 403 relatif terhadap
rencana per kuartal dan wilayah penjualan selama dua tahun terakhir." Dengan OLAP dan analisis
data berorientasi kueri, pengguna harus memiliki gagasan bagus tentang informasi yang mereka cari.
Penambangan data lebih didorong oleh penemuan. Penambangan data memberikan wawasan
ke dalam data perusahaan yang tidak dapat diperoleh dengan OLAP dengan menemukan pola dan
hubungan tersembunyi dalam database besar dan menyimpulkan aturan darinya untuk memprediksi
perilaku masa depan. Pola dan aturan digunakan untuk memandu pengambilan keputusan dan peramalan
Tampilan ini menunjukkan produk versus wilayah. Jika Anda memutar kubus 90 derajat, permukaan yang akan
ditampilkan adalah produk versus penjualan aktual dan yang diproyeksikan. Jika Anda memutar kubus 90 derajat lagi, Anda
akan melihat wilayah versus penjualan aktual dan proyeksi. Tampilan lain dimungkinkan.
Machine Translated by Google
Bab 6 Dasar Kecerdasan Bisnis: Basis Data dan Manajemen Informasi 259
efek dari keputusan tersebut. Jenis informasi yang diperoleh dari data mining meliputi
asosiasi, urutan, klasifikasi, cluster, dan prakiraan.
• Asosiasi adalah kejadian yang terkait dengan satu peristiwa. Misalnya, studi tentang pola
pembelian supermarket mungkin mengungkapkan bahwa, ketika keripik jagung dibeli,
minuman cola dibeli 65 persen dari waktu, tetapi ketika ada promosi, cola dibeli 85
persen dari waktu. Informasi ini membantu manajer membuat keputusan yang lebih baik
karena mereka telah mempelajari profitabilitas promosi.
• Secara berurutan, peristiwa dihubungkan dari waktu ke waktu. Kita mungkin menemukan,
misalnya, jika sebuah rumah dibeli, kulkas baru akan dibeli dalam waktu dua minggu
sebanyak 65 persen dari waktu, dan sebuah oven akan dibeli dalam waktu satu bulan
setelah pembelian rumah sebanyak 45 persen dari waktu.
• Klasifikasi mengenali pola-pola yang menggambarkan kelompok tempat suatu
item milik dengan memeriksa item yang ada yang telah diklasifikasikan dan dengan
menyimpulkan seperangkat aturan. Misalnya, bisnis seperti perusahaan kartu kredit
atau telepon khawatir akan kehilangan pelanggan tetap. Klasifikasi membantu menemukan
karakteristik pelanggan yang cenderung pergi dan dapat memberikan model untuk
membantu manajer memprediksi siapa pelanggan tersebut sehingga manajer dapat
menyusun kampanye khusus untuk mempertahankan pelanggan tersebut. •
Pengelompokan bekerja dengan cara yang mirip dengan klasifikasi ketika tidak ada kelompok yang memilikinya
belum didefinisikan. Alat penambangan data dapat menemukan berbagai pengelompokan
dalam data, seperti menemukan grup afinitas untuk kartu bank atau mempartisi database
menjadi grup pelanggan berdasarkan demografi dan jenis investasi pribadi.
• Meskipun aplikasi ini melibatkan prediksi, peramalan menggunakan prediksi dengan cara
yang berbeda. Ini menggunakan serangkaian nilai yang ada untuk memperkirakan nilai
lain apa yang akan terjadi. Misalnya, peramalan mungkin menemukan pola dalam data
untuk membantu manajer memperkirakan nilai masa depan variabel kontinu, seperti
angka penjualan.
Sistem ini melakukan analisis pola atau tren tingkat tinggi, tetapi mereka juga dapat
menelusuri untuk memberikan lebih banyak detail bila diperlukan. Ada aplikasi penambangan
data untuk semua area fungsional bisnis, dan untuk pemerintah dan karya ilmiah. Salah satu
penggunaan populer untuk penambangan data adalah untuk memberikan analisis rinci
tentang pola dalam data pelanggan untuk kampanye pemasaran satu-ke-satu atau untuk
mengidentifikasi pelanggan yang menguntungkan.
Caesars Entertainment, sebelumnya dikenal sebagai Harrah's Entertainment, adalah
perusahaan game terbesar di dunia. Itu terus menganalisis data tentang pelanggannya yang
dikumpulkan ketika orang memainkan mesin slotnya atau menggunakan kasino dan hotelnya.
Departemen pemasaran korporat menggunakan informasi ini untuk membuat profil perjudian
terperinci, berdasarkan nilai berkelanjutan pelanggan tertentu bagi perusahaan. Misalnya,
penambangan data memungkinkan Caesars mengetahui pengalaman bermain game favorit
pelanggan reguler di salah satu kasino perahu sungainya, bersama dengan preferensi orang
tersebut untuk akomodasi kamar, restoran, dan hiburan. Informasi ini memandu keputusan
manajemen tentang cara memupuk pelanggan yang paling menguntungkan, mendorong
pelanggan tersebut untuk membelanjakan lebih banyak, dan menarik lebih banyak pelanggan
dengan potensi menghasilkan pendapatan yang tinggi. Intelijen bisnis meningkatkan
keuntungan Caesars sedemikian rupa sehingga menjadi inti dari strategi bisnis perusahaan.
sumber utama data besar yang ingin dianalisis perusahaan. E-mail, memo, transkrip pusat
panggilan, respons survei, kasus hukum, deskripsi paten, dan laporan layanan semuanya
berharga untuk menemukan pola dan tren yang akan membantu karyawan membuat
keputusan bisnis yang lebih baik. Alat penambangan teks sekarang tersedia untuk
membantu bisnis menganalisis data ini. Alat-alat ini dapat mengekstraksi elemen kunci
dari kumpulan data besar yang tidak terstruktur, menemukan pola dan hubungan, dan
meringkas informasi.
Bisnis mungkin beralih ke penambangan teks untuk menganalisis transkrip panggilan
ke pusat layanan pelanggan untuk mengidentifikasi masalah layanan dan perbaikan utama
atau untuk mengukur sentimen pelanggan tentang perusahaan mereka. Perangkat lunak
analisis sentimen dapat menambang komentar teks dalam pesan email, blog, percakapan
media sosial, atau formulir survei untuk mendeteksi pendapat yang disukai dan tidak
disukai tentang subjek tertentu.
Misalnya, broker diskon Charles Schwab menggunakan software Attensity Analyze
untuk menganalisis ratusan ribu interaksi pelanggannya setiap bulan. Perangkat lunak ini
menganalisis catatan layanan pelanggan Schwab, email, tanggapan survei, dan diskusi
online untuk menemukan tanda-tanda ketidakpuasan yang dapat menyebabkan pelanggan
berhenti menggunakan layanan perusahaan.
Perhatian dapat secara otomatis mengidentifikasi berbagai "suara" yang digunakan
pelanggan untuk mengekspresikan umpan balik mereka (seperti suara positif, negatif, atau
bersyarat) untuk menunjukkan dengan tepat niat seseorang untuk membeli, niat untuk
pergi, atau reaksi terhadap produk atau pesan pemasaran tertentu . Schwab menggunakan
informasi ini untuk mengambil tindakan korektif seperti meningkatkan komunikasi broker
langsung dengan pelanggan dan mencoba menyelesaikan masalah dengan cepat yang
membuat pelanggan tidak senang.
Web adalah sumber data besar tidak terstruktur lainnya yang kaya untuk mengungkapkan
pola, tren, dan wawasan tentang perilaku pelanggan. Penemuan dan analisis pola dan
informasi yang berguna dari World Wide Web disebut penambangan Web. Bisnis mungkin
beralih ke penambangan Web untuk membantu mereka memahami perilaku pelanggan,
mengevaluasi keefektifan situs Web tertentu, atau mengukur keberhasilan kampanye
pemasaran. Misalnya, pemasar menggunakan layanan Google Trends dan Google
Wawasan untuk Penelusuran, yang melacak popularitas berbagai kata dan frasa yang
digunakan dalam kueri penelusuran Google, untuk mempelajari apa yang diminati orang
dan apa yang ingin mereka beli.
Perusahaan sekarang dapat mengurangi resolusi jaringan Menyelidiki anomali ini, perusahaan dapat dengan cepat
data anginnya hingga hampir 90 persen, menjadi area 3 x 3 menyesuaikan tingkat kepegawaian di kantornya di Philadelphia
kilometer (sekitar 1,8 x 1,8 mil). Kemampuan ini memungkinkan selama masa puncak tersebut, memastikan seorang manajer
Vestas memperkirakan penempatan turbin yang optimal dalam hadir untuk menyelesaikan masalah apa pun. Ini meningkatkan
15 menit, bukan tiga minggu, menghemat waktu pengembangan kinerja Hertz dan meningkatkan kepuasan pelanggan.
selama sebulan untuk lokasi turbin dan memungkinkan Ada batasan untuk menggunakan data besar. Berenang di
pelanggan Vestas mencapai laba atas investasi angka tidak selalu berarti bahwa informasi yang tepat
jauh lebih cepat. sedang dikumpulkan atau bahwa orang akan membuat
Perusahaan juga menggunakan solusi big data untuk keputusan yang lebih cerdas. Tahun lalu, laporan
menganalisis sentimen konsumen. Misalnya, raksasa persewaan McKinsey Global Institute memperingatkan bahwa ada
mobil Hertz mengumpulkan data dari survei Web, email, pesan kekurangan spesialis yang dapat memahami semua
teks, pola lalu lintas situs Web, dan data yang dihasilkan di informasi yang dihasilkan. Namun demikian, tren menuju big data
semua 8.300 lokasi Hertz di 146 negara. Perusahaan tidak menunjukkan tanda-tanda melambat; faktanya,
sekarang menyimpan semua data itu secara terpusat alih-alih kemungkinan besar data besar hanya akan menjadi lebih besar.
di dalam setiap cabang, mengurangi waktu yang dihabiskan
untuk memproses data dan meningkatkan waktu respons Sumber: Samuel Greengard, “Big Data Membuka Nilai Bisnis,”
perusahaan terhadap umpan balik pelanggan dan perubahan Dasar, Januari 2012; Paul S. Barth, “Mengelola Data Besar: Yang Perlu
sentimen. Misalnya, dengan menganalisis data yang Diketahui Setiap CIO,” CIO Insight, 12 Januari 2012; IBM Corporation, “Vestas:
Mengubah Iklim menjadi Modal dengan Data Besar,”
dihasilkan dari berbagai sumber, Hertz dapat menentukan 2011; IBM Corporation, "Memperluas dan meningkatkan kemampuan
bahwa penundaan terjadi untuk pengembalian di Philadelphia penegakan hukum", "Bagaimana Data Besar Memberi Hertz Keuntungan
selama waktu tertentu dalam sehari. Setelah Besar", dan "Perpustakaan Inggris dan J Start Bekerja Sama untuk Mengarsipkan Web", 2010.
Karena banyak database back-end tidak dapat menginterpretasikan perintah yang ditulis dalam HTML,
server Web meneruskan permintaan data ini ke perangkat lunak yang menerjemahkan perintah HTML ke
dalam SQL sehingga perintah tersebut dapat diproses oleh DBMS yang bekerja dengan database. Dalam
lingkungan klien/server, file
Machine Translated by Google
Bab 6 Dasar Kecerdasan Bisnis: Basis Data dan Manajemen Informasi 263
Pengguna mengakses database internal organisasi melalui Web menggunakan PC desktop dan perangkat
lunak browser Web.
DBMS berada di komputer khusus yang disebut server basis data. DBMS menerima permintaan
SQL dan menyediakan data yang diperlukan. Middleware mentransfer informasi dari database
internal organisasi kembali ke server Web untuk pengiriman dalam bentuk halaman Web ke
pengguna.
Gambar 6.14 menunjukkan bahwa middleware yang bekerja antara server Web dan DBMS
adalah server aplikasi yang berjalan pada komputernya sendiri (lihat Bab 5). Perangkat lunak
server aplikasi menangani semua operasi aplikasi, termasuk pemrosesan transaksi dan akses
data, antara komputer berbasis browser dan aplikasi atau database bisnis back-end perusahaan.
Server aplikasi menerima permintaan dari server Web, menjalankan logika bisnis untuk
memproses transaksi berdasarkan permintaan tersebut, dan menyediakan konektivitas ke
sistem back-end atau database organisasi. Alternatifnya, perangkat lunak untuk menangani
operasi ini bisa berupa program khusus atau skrip CGI. Skrip CGI adalah program ringkas yang
menggunakan spesifikasi Common Gateway Interface (CGI) untuk memproses data di server
Web.
Perusahaan lain telah menciptakan bisnis yang sama sekali baru berdasarkan akses ke
database besar melalui Web. Salah satunya adalah layanan jejaring sosial Facebook, yang
membantu pengguna tetap terhubung satu sama lain dan bertemu orang baru. Facebook
menampilkan "profil" dengan informasi lebih dari 950 juta pengguna aktif dengan informasi
tentang diri mereka sendiri, termasuk minat, teman, foto, dan grup tempat mereka berafiliasi.
Facebook memelihara basis data besar-besaran untuk menampung dan mengelola semua
konten ini.
Ada juga banyak database berbasis web di sektor publik untuk membantu konsumen dan
warga negara mengakses informasi yang berguna. Sesi Interaktif tentang Organisasi
menjelaskan salah satu dari database ini, yang menimbulkan kontroversi atas metodenya dalam
menyediakan data keamanan produk konsumen.
Machine Translated by Google
264 Bagian Kedua Infrastruktur Teknologi Informasi
Bab 6 Dasar Kecerdasan Bisnis: Basis Data dan Manajemen Informasi 265
komentar yang ditakuti produsen. Meski begitu, menjaga agar isme dari komunitas bisnis. Waktu akan memberi tahu apakah
basis data bebas dari laporan yang tidak akurat kemungkinan akan lebih amanproduk.gov menjadi sangat diperlukan
membutuhkan lebih banyak waktu dan jam daripada yang dapat sumber daya konsumen.
disediakan oleh staf CPSC. Sumber: www.SaferProducts.gov, diakses 22 Mei 2012; Josh Cable,
Sejak database ditayangkan, ada ratusan ribu kunjungan ke situs "Demokrat Mempertahankan Database Keamanan Produk Konsumen,"
dan jutaan Pekan Industri, 7 Juli 2011; Don Mays, “Pengalaman Saya Dengan
Database CPSC,” blogs.consumerreports.com, 16 Maret 2011;
pencarian produk yang dilakukan oleh pengunjung, menurut komisi Andrew Martin, “Para Pembuat Produk Anak Berusaha Melunakkan
Keamanan Produk Konsumen. Terlepas dari popularitasnya yang Aturan Baru,” The New York Times, 21 Februari 2011; Lyndsey
semakin meningkat, itu mungkin tidak bertahan dari upaya kongres Layton, “Komisi Keamanan Produk Konsumen untuk Meluncurkan
Database Pengaduan Publik,” Washington Post, 10 Januari 2011;
untuk mengambil pendanaannya, sebagai tanggapan atas tekanan
Jayne O'Donnell, "Basis Data Keamanan Produk Di Bawah Berbagai
untuk mengurangi anggaran federal serta kritik. Serangan," USA Today, 12 April 2011.
2. Masalah apa yang diangkat oleh database ini? Mengapa begitu 4. Saat membeli buaian, atau produk konsumen lainnya
kontroversial? Mengapa kualitas data menjadi masalah? untuk keluarga Anda, apakah Anda akan menggunakan database ini? Mengapa
atau mengapa tidak?
Jika Anda berada dalam bisnis kecil, kebijakan informasi akan dibuat dan diterapkan
oleh pemilik atau manajer. Dalam sebuah organisasi besar, mengelola dan merencanakan
informasi sebagai sumber daya perusahaan seringkali memerlukan fungsi administrasi data
formal. Administrasi data bertanggung jawab untuk
Machine Translated by Google
kebijakan dan prosedur khusus di mana data dapat dikelola sebagai sumber daya
organisasi. Tanggung jawab ini termasuk mengembangkan kebijakan informasi,
merencanakan data, mengawasi desain basis data logis dan pengembangan kamus
data, dan memantau bagaimana spesialis sistem informasi dan kelompok pengguna
akhir menggunakan data.
Anda mungkin mendengar istilah tata kelola data yang digunakan untuk menjelaskan
banyak aktivitas ini. Dipromosikan oleh IBM, tata kelola data berkaitan dengan kebijakan
dan proses untuk mengelola ketersediaan, kegunaan, integritas, dan keamanan data
yang digunakan dalam perusahaan, dengan penekanan khusus pada peningkatan
privasi, keamanan, kualitas data, dan kepatuhan terhadap peraturan pemerintah.
Organisasi besar juga akan memiliki grup desain dan manajemen basis data di dalam
divisi sistem informasi perusahaan yang bertanggung jawab untuk menentukan dan
mengatur struktur dan konten basis data, dan memelihara basis data. Dalam kerja sama
yang erat dengan pengguna, kelompok desain menetapkan basis data fisik, hubungan
logis antar elemen, dan aturan akses serta prosedur keamanan. Fungsi yang
dilakukannya disebut administrasi basis data.
Bab 6 Dasar Kecerdasan Bisnis: Basis Data dan Manajemen Informasi 267
dipertahankan beberapa kali dalam database. Nama Anda mungkin salah eja atau Anda
menggunakan inisial tengah Anda pada satu kesempatan dan tidak pada kesempatan lain
atau informasi tersebut awalnya dimasukkan ke dalam formulir kertas dan tidak dipindai
dengan benar ke dalam sistem. Karena ketidakkonsistenan ini, database akan memperlakukan
Anda sebagai orang yang berbeda! Kami sering menerima surat berlebihan yang ditujukan ke
Laudon, Lavdon, Lauden, atau Landon.
Jika database dirancang dengan benar dan standar data seluruh perusahaan ditetapkan,
duplikat atau elemen data yang tidak konsisten harus diminimalkan. Namun, sebagian besar
masalah kualitas data, seperti nama yang salah eja, nomor yang dialihkan, atau kode yang
salah atau hilang, berasal dari kesalahan selama input data. Insiden kesalahan tersebut
meningkat karena perusahaan memindahkan bisnis mereka ke Web dan memungkinkan
pelanggan dan pemasok memasukkan data ke situs Web mereka yang secara langsung
memperbarui sistem internal.
Sebelum database baru ada, organisasi perlu mengidentifikasi dan memperbaiki data
mereka yang salah dan menetapkan rutinitas yang lebih baik untuk mengedit data setelah
database mereka beroperasi. Analisis kualitas data seringkali dimulai dengan audit kualitas
data, yang merupakan survei terstruktur terhadap keakuratan dan tingkat kelengkapan data
dalam suatu sistem informasi. Audit kualitas data dapat dilakukan dengan mensurvei seluruh
file data, mensurvei sampel dari file data, atau mensurvei pengguna akhir untuk mengetahui
persepsi mereka tentang kualitas data.
Pembersihan data, juga dikenal sebagai penggosokan data, terdiri dari aktivitas untuk
mendeteksi dan mengoreksi data dalam database yang tidak benar, tidak lengkap, tidak
diformat dengan benar, atau berlebihan. Pembersihan data tidak hanya memperbaiki
kesalahan tetapi juga menegakkan konsistensi di antara kumpulan data yang berbeda yang
berasal dari sistem informasi yang terpisah. Perangkat lunak pembersihan data khusus
tersedia untuk mensurvei file data secara otomatis, memperbaiki kesalahan dalam data, dan
mengintegrasikan data dalam format yang konsisten di seluruh perusahaan.
Masalah kualitas data bukan hanya masalah bisnis. Mereka juga menimbulkan masalah
serius bagi individu, mempengaruhi kondisi keuangan mereka dan bahkan pekerjaan mereka.
Misalnya, data yang tidak akurat atau usang tentang riwayat kredit konsumen yang dikelola
oleh biro kredit dapat mencegah individu yang layak mendapatkan pinjaman atau menurunkan
peluang mereka untuk mendapatkan atau mempertahankan pekerjaan.
rangkuman ulasan
1. Apa masalah pengelolaan sumber daya data dalam lingkungan file tradisional dan bagaimana penyelesaiannya
dengan sistem manajemen basis data?
Teknik manajemen file tradisional mempersulit organisasi untuk melacak semua potongan data yang mereka
gunakan secara sistematis dan mengatur data ini sehingga dapat diakses dengan mudah. Area dan grup
fungsional yang berbeda diizinkan untuk mengembangkan file mereka sendiri secara mandiri. Seiring waktu,
lingkungan manajemen file tradisional ini menimbulkan masalah seperti redundansi dan inkonsistensi data,
ketergantungan program-data, ketidakfleksibelan, keamanan yang buruk, dan kurangnya berbagi dan ketersediaan
data. Sistem manajemen basis data (DBMS) memecahkan masalah ini dengan perangkat lunak yang
memungkinkan pemusatan data dan manajemen data sehingga bisnis memiliki satu sumber yang konsisten untuk
semua kebutuhan data mereka. Menggunakan DBMS meminimalkan file yang berlebihan dan tidak konsisten.
2. Apa kemampuan utama DBMS dan mengapa DBMS relasional begitu kuat?
Kemampuan utama DBMS meliputi kemampuan definisi data, kemampuan kamus data, dan bahasa manipulasi
data. Kemampuan definisi data menentukan struktur dan isi database. Kamus data adalah file otomatis atau
manual yang menyimpan informasi tentang data dalam database, termasuk nama, definisi, format, dan deskripsi
elemen data.
Bahasa manipulasi data, seperti SQL, adalah bahasa khusus untuk mengakses dan memanipulasi data dalam
database.
Database relasional telah menjadi metode utama untuk mengatur dan memelihara data dalam sistem informasi
karena sangat fleksibel dan mudah diakses. Ini mengatur data dalam tabel dua dimensi yang disebut hubungan
dengan baris dan kolom. Setiap tabel berisi data tentang entitas dan atributnya.
Setiap baris mewakili catatan dan setiap kolom mewakili atribut atau bidang. Setiap tabel juga berisi bidang kunci
untuk secara unik mengidentifikasi setiap catatan untuk pengambilan atau manipulasi. Tabel basis data relasional
dapat digabungkan dengan mudah untuk mengirim data yang diperlukan oleh pengguna, asalkan ada dua tabel
yang memiliki elemen data yang sama. Database non-relasional menjadi populer untuk mengelola jenis data yang
tidak dapat ditangani dengan mudah oleh model data relasional. Produk basis data relasional dan non-relasional
tersedia sebagai layanan cloud computing.
4. Apa alat dan teknologi utama untuk mengakses informasi dari database untuk meningkatkan kinerja bisnis dan
pengambilan keputusan?
Teknologi manajemen data kontemporer memiliki serangkaian alat untuk mendapatkan informasi yang berguna
dari semua jenis data berbeda yang digunakan oleh bisnis saat ini, termasuk data besar semi terstruktur dan
tidak terstruktur dalam jumlah besar. Kemampuan ini mencakup gudang data dan data mart, Hadoop, komputasi
dalam memori, dan platform analitik. OLAP mewakili hubungan antar data sebagai struktur multidimensi, yang
dapat divisualisasikan sebagai kubus data dan kubus di dalam kubus data, memungkinkan analisis data yang
lebih canggih. Penambangan data menganalisis kumpulan data yang besar, termasuk isi gudang data, untuk
menemukan pola dan aturan yang dapat digunakan untuk memprediksi perilaku masa depan dan memandu
pengambilan keputusan. Alat penambangan teks membantu bisnis menganalisis kumpulan data besar yang tidak
terstruktur yang terdiri dari teks. Alat penambangan web fokus pada analisis pola dan informasi yang berguna
dari World Wide Web, memeriksa struktur situs Web dan aktivitas pengguna situs Web serta konten halaman
Web. Basis data konvensional dapat dihubungkan melalui middleware ke Web atau antarmuka Web untuk
memfasilitasi akses pengguna ke data internal organisasi.
Machine Translated by Google
Bab 6 Dasar Kecerdasan Bisnis: Basis Data dan Manajemen Informasi 269
5. Mengapa kebijakan informasi, administrasi data, dan jaminan kualitas data penting untuk mengelola
sumber daya data perusahaan?
Mengembangkan lingkungan basis data memerlukan kebijakan dan prosedur untuk mengelola data organisasi serta model data dan
teknologi basis data yang baik. Kebijakan informasi formal mengatur pemeliharaan, distribusi, dan penggunaan informasi dalam
organisasi. Di perusahaan besar, fungsi administrasi data formal bertanggung jawab atas kebijakan informasi, serta untuk perencanaan
data, pengembangan kamus data, dan pemantauan penggunaan data di perusahaan.
Data yang tidak akurat, tidak lengkap, atau tidak konsisten menimbulkan masalah operasional dan keuangan yang serius bagi bisnis
karena dapat menyebabkan ketidakakuratan dalam penetapan harga produk, akun pelanggan, dan data inventaris, serta menyebabkan
keputusan yang tidak akurat tentang tindakan yang harus diambil oleh perusahaan. Perusahaan harus mengambil langkah khusus untuk
memastikan mereka memiliki tingkat kualitas data yang tinggi. Ini termasuk menggunakan standar data seluruh perusahaan, database
yang dirancang untuk meminimalkan data yang tidak konsisten dan redundan, audit kualitas data, dan perangkat lunak pembersihan data
gudang
Istilah Kunci
Platform analitik, 256 Diagram entitas-hubungan, 253
Atribut, 241 Lapangan, 241
Data Besar, 254 Berkas, 241
Sedikit, 241
Kunci asing, 247
Byte, 241 Hadop, 255
Administrasi Data, 265 Komputasi dalam memori, 256
Pembersihan data, 267 Kebijakan informasi, 265
Definisi data, 249 Bidang kunci, 247
Kamus data, 249 Sistem manajemen basis data non-relasional, 247
Tata Kelola Data, 266 Normalisasi, 252
Inkonsistensi data, 243 Pemrosesan analitik online (OLAP), 257
Bahasa manipulasi data, 250 Kunci utama, 247
Datamart, 255 Ketergantungan program-data, 244
Penambangan Data, 258 Rekam, 241
Audit kualitas data, 267 Integritas referensial, 253
Redundansi data, 243 DBMS Relasional, 246
Gudang Data, 255 Analisis sentimen, 260
Pangkalan data, 244
Bahasa Permintaan Terstruktur (SQL), 250
administrasi basis data, 266 Penambangan teks, 260
Sistem manajemen basis data (DBMS), 244 Tupel, 247
Server basis data, 263 Penambangan web, 260
Entitas, 241
Tinjau Pertanyaan
1. Apa masalah pengelolaan sumber daya data dalam lingkungan • Mendefinisikan database dan sistem manajemen database
file tradisional dan bagaimana penyelesaiannya dengan dan menjelaskan bagaimana memecahkan masalah
sistem manajemen basis data? • Sebutkan dan lingkungan file tradisional.
jelaskan masing-masing komponen dalam hierarki data. • 2. Apa kemampuan utama DBMS dan mengapa
Mendefinisikan dan apakah DBMS relasional sangat kuat? •
menjelaskan pentingnya entitas; Sebutkan dan jelaskan secara singkat kemampuan a
atribut, dan bidang kunci. DBMS.
• Sebutkan dan jelaskan masalah lingkungan file tradisional. • Mendefinisikan DBMS relasional dan menjelaskan caranya
mengatur data.
Machine Translated by Google
• Buat daftar dan jelaskan tiga operasi DBMS relasional. • Jelaskan kemampuan pemrosesan analitik online
(OLAP). • Mendefinisikan
• Jelaskan mengapa database non-relasional penambangan data, menjelaskan perbedaannya dari
berguna. OLAP dan jenis informasi yang disediakannya. •
3. Apa saja prinsip desain database yang penting? Jelaskan
bagaimana penambangan teks dan penambangan Web
• Mendefinisikan dan menjelaskan normalisasi dan integritas berbeda dari penambangan data konvensional.
referensi dan menjelaskan bagaimana mereka berkontribusi • Jelaskan bagaimana pengguna dapat mengakses
pada database relasional yang dirancang informasi dari database internal perusahaan melalui
Web.
dengan baik. • Mendefinisikan dan menjelaskan diagram entitas-
hubungan dan menjelaskan perannya dalam desain database.
5. Mengapa kebijakan informasi, administrasi data, dan
4. Apa alat dan teknologi utama untuk mengakses informasi jaminan kualitas data penting untuk mengelola sumber
dari database untuk meningkatkan kinerja bisnis dan daya data perusahaan?
pengambilan keputusan? • Mendefinisikan data besar dan
• Menjelaskan peran kebijakan informasi dan administrasi
data dalam informasi
menjelaskan teknologi untuk mengelola dan pengelolaan.
menganalisisnya.
• Jelaskan mengapa audit kualitas data dan data
• Sebutkan dan jelaskan komponen infrastruktur intelijen pembersihan sangat penting.
bisnis kontemporer.
Pertanyaan Diskusi
1. Dikatakan tidak ada data yang buruk, hanya manajemen 3. Apa konsekuensi dari organisasi yang tidak memiliki
yang buruk. Diskusikan implikasi dari hal ini kebijakan informasi?
penyataan.
1. Manajemen Proses Emerson, pemasok instrumen pengukuran, analitik, dan pemantauan global
perusahaan dan layanan yang berbasis di Austin, Texas, memiliki gudang data baru yang dirancang untuk menganalisis aktivitas
pelanggan guna meningkatkan layanan dan pemasaran. Namun, gudang data penuh dengan data yang tidak akurat dan
berlebihan. Data di gudang berasal dari berbagai sistem pemrosesan transaksi di Eropa, Asia, dan lokasi lain di seluruh
dunia. Tim yang mendesain gudang berasumsi bahwa grup penjualan di semua area ini akan memasukkan nama dan
alamat pelanggan dengan cara yang sama.
Faktanya, perusahaan di berbagai negara menggunakan berbagai cara untuk memasukkan penawaran, penagihan, pengiriman,
Machine Translated by Google
Bab 6 Dasar Kecerdasan Bisnis: Basis Data dan Manajemen Informasi 271
dan data lainnya. Menilai potensi dampak bisnis dari masalah kualitas data ini. Keputusan apa yang harus dibuat dan langkah-
langkah yang diambil untuk mencapai solusi?
2. Perusahaan pemasok industri Anda ingin membuat gudang data tempat manajemen dapat memperoleh a
satu tampilan informasi penjualan penting di seluruh perusahaan untuk mengidentifikasi produk terlaris, pelanggan utama, dan
tren penjualan. Informasi penjualan dan produk Anda disimpan dalam beberapa sistem yang berbeda: sistem penjualan divisi yang
berjalan di server Unix dan sistem penjualan korporat yang berjalan di mainframe IBM. Anda ingin membuat satu format standar
yang menggabungkan data ini dari kedua sistem. Di MyMISLab, Anda dapat meninjau format yang diusulkan, beserta file
sampel dari dua sistem yang akan menyediakan data untuk gudang data. Kemudian jawab pertanyaan berikut:
• Masalah bisnis apa yang timbul karena tidak memiliki data ini dalam satu format standar? • Betapa mudahnya
membuat database dengan satu format standar yang dapat menyimpan data dari keduanya
sistem? Mengidentifikasi masalah yang harus ditangani.
• Haruskah masalah diselesaikan oleh spesialis basis data atau manajer bisnis umum? Menjelaskan. • Siapa yang
harus memiliki wewenang untuk menyelesaikan satu format di seluruh perusahaan untuk informasi ini dalam data
gudang?
Dalam latihan ini, Anda akan menggunakan perangkat lunak basis data untuk merancang basis data guna mengelola inventaris
untuk usaha kecil. Toko Sepeda Sylvester, berlokasi di San Francisco, California, menjual sepeda jalan raya, gunung, hibrida,
santai, dan anak-anak. Saat ini, Sylvester membeli sepeda dari tiga pemasok, namun berencana menambah pemasok baru
dalam waktu dekat. Dengan menggunakan informasi yang ditemukan dalam tabel di MyMISLab, buat database relasional
sederhana untuk mengelola informasi tentang pemasok dan produk Sylvester. Setelah Anda membangun database, lakukan
aktivitas berikut.
• Siapkan laporan yang mengidentifikasi lima sepeda termahal. Laporan tersebut harus mencantumkan sepeda di dalamnya
urutan menurun dari yang paling mahal ke yang paling murah, jumlah yang tersedia untuk masing-masing, dan persentase
markup untuk masing-masing.
• Siapkan laporan yang mencantumkan setiap pemasok, produknya, jumlah yang ada, dan tingkat pemesanan ulang terkait.
Laporan harus diurutkan berdasarkan abjad pemasok. Untuk setiap pemasok, produk harus disortir menurut abjad.
• Siapkan laporan yang mencantumkan hanya sepeda yang stoknya tinggal sedikit dan perlu dipesan ulang. Laporan tersebut harus
memberikan informasi pemasok untuk item yang diidentifikasi.
• Tulis deskripsi singkat tentang bagaimana database dapat ditingkatkan untuk lebih meningkatkan pengelolaan
bisnis. Tabel atau bidang apa yang harus ditambahkan? Laporan tambahan apa yang akan berguna?
Proyek ini mengembangkan keterampilan dalam mencari database yang mendukung Web dengan informasi tentang produk dan
layanan di lokasi yang jauh.
Perusahaan Anda berlokasi di Greensboro, Carolina Utara, dan memproduksi perabot kantor dengan berbagai jenis. Anda
sedang mempertimbangkan untuk membuka fasilitas untuk memproduksi dan menjual produk Anda di Australia. Anda ingin
menghubungi organisasi yang menawarkan banyak layanan yang diperlukan bagi Anda untuk membuka kantor Australia dan
fasilitas manufaktur, termasuk pengacara, akuntan, pakar ekspor-impor, dan peralatan telekomunikasi serta perusahaan
pendukung. Akses database online berikut untuk menemukan perusahaan yang ingin Anda temui selama perjalanan mendatang:
Australian Business Register (abr.gov.au), AustraliaTrade Now
Machine Translated by Google
272 Bagian Kedua Infrastruktur Teknologi Informasi
Kasus Video
Kasus Video dan Video Instruksional yang mengilustrasikan beberapa konsep dalam bab ini tersedia. Hubungi instruktur Anda untuk mengakses video ini.
mereka. Dimungkinkan juga untuk memasukkan ukuran kinerja 25 September 2007 (www.scdigest.com/assets/on_target/07-09-25-7.php?
dan mendapatkan wawasan waktu nyata tentang tren SDM. cid=1237, diakses 16 November 2010); GW Anderson, T.
Rhodes, J. Davis, dan J. Dobbins, SAMS Mengajari Diri Sendiri SAP
Menggunakan fitur canggih ini, bersama dengan alat dari
dalam 24 jam (Indianapolis, IN: SAMS, 2008).
vendor perangkat lunak lain, manajer Lego dapat melacak
potensi kepemimpinan karyawan, mengembangkan karier PERTANYAAN STUDI KASUS 1.
mereka, dan memperkirakan perekrutan karyawan baru dengan Jelaskan peran database dalam SAP tiga tingkat
keterampilan tertentu. N. sistem.
Sumber: ”Bisnis 2010: Merangkul Tantangan Perubahan,” 2. Jelaskan mengapa arsitektur terdistribusi fleksibel.
The Economist Intelligence Unit, Februari 2005 (http://graph ics.eiu.com/
3. Identifikasi beberapa fitur intelijen bisnis yang termasuk
files/ad_pdfs/Business%202010_Global_FINAL.pdf, diakses 16
dalam rangkaian perangkat lunak bisnis SAP.
November 2010); “Lego Creates Model Business Success with SAP and
IBM,” IBM Global Financing, 19 Mei 2010 (www-01.ibm.com/ 4. Apa keuntungan dan kerugian utama dari memiliki banyak
software/success/cssdb.nsf/CS/STRD 85KGS6?OpenDocument, 20 basis data dalam arsitektur terdistribusi? Menjelaskan.
Oktober 2010); “Human Resources as an Exponent of Good
Governance” (dalam bahasa Denmark) (www.sat.com, 20 Oktober
2010); “Lego, Mainan Abad Ini Harus Menemukan Kembali Rantai Kasus disumbangkan oleh Daniel Ortiz Arroyo,
Pasokan untuk Menyelamatkan Perusahaan,” Intisari Rantai Pasokan, Universitas Aalborg