Anda di halaman 1dari 43

Basis Data dan Gudang Data

Tujuan Pembelajaran
Sebagai seorang profesional, Anda akan menggunakan database dan kemungkinan besar
membantu mendesainnya. Memahami cara mengatur dan menggunakan data adalah cara untuk
mendapatkan tanggung jawab dan otoritas dalam lingkungan kerja. Data biasanya dikumpulkan
dengan cara yang tidak membuatnya segera berguna untuk para profesional. Bayangkan
membangun istana model dari tumpukan balok bangunan. Anda punya ide bagus tentang apa
yang ingin Anda bangun, tetapi pertama-tama Anda harus mengatur balok agar mudah
ditemukan dan pilih hanya blok yang Anda butuhkan. Kemudian Anda dapat
menggabungkannya menjadi substruktur yang akhirnya terintegrasi ke dalam model Anda.
Demikian pula, data yang dikumpulkan oleh organisasi harus diatur dan disimpan sehingga
informasi yang berguna dapat diekstraksi darinya dengan cara yang fleksibel.
Ketika Anda menyelesaikan bab ini, Anda akan dapat:

 Jelaskan perbedaan antara organisasi file tradisional dan pendekatan database untuk
mengelola data digital.
 Jelaskan bagaimana sistem manajemen basis data relasional dan berorientasi objek
digunakan untuk membangun basis data,
 mengisi mereka dengan data, dan memanipulasi data untuk menghasilkan informasi.
 Sebutkan fitur dan operasi terpenting dari database relasional, database paling populer
 model.
 Memahami bagaimana pemodelan dan desain data membuat cetak biru konseptual dari
database.
 Diskusikan bagaimana database digunakan di web.
 Buat daftar operasi yang terlibat dalam mentransfer data dari database transaksional ke
gudang data.
RESTORAN KIMBALL: SEBUAH KEINGINAN UNTUK DATA

Michael dan Tyler mengunjungi lokasi tidak tahu item menu mana yang dijual dan
baru untuk melihat kemajuan renovasi. pada level apa.
Michael cemas tentang grand opening yang Pembaruan baru ke sistem informasi tempat
tinggal empat minggu lagi. Sebagai mereka penjualan akan membantu melacak data ini.
berjalan di sekitar lokasi baru, mereka Memiliki data, Tyler dan
memeriksa pekerjaan kontraktor. Michael Michael dapat mengerjakan pelaporan dan
memeriksa setiap detail untuk melihat apakah analisis informasi yang dikelola oleh sistem.
itu memenuhi rencana dan persyaratannya. Sistemnya adalah beroperasi di lokasi saat ini
Beberapa kali Michael bertanya, “Apakah ini dan menghasilkan data.
akan diperbaiki?”…“Apakah ini akan selesai Tyler mengusulkan pembuatan prototipe
tepat waktu?”…“Ini tidak beres, tolong beberapa analisis arus data yang kemudian
perbaiki.” dapat mereka gunakan di lokasi baru.
Tyler merasakan kegugupan ayahnya,
jadi dia duduk bersamanya di meja yang Dengan Sisi Promosi
menghadap ke danau. “Ayah, itu semua akan Area kedua yang ingin difokuskan
baik-baik saja. Renovasi baru saja selesai. Tyler adalah mempromosikan lokasi bar. Saat
Semua yang harus kita lakukan adalah mereka duduk di meja yang menghadap ke
memantau perkembangannya. Tempatnya danau, Tyler berkata, “Ayah, lihat ke luar
terlihat Bagus! Sekarang kita perlu jendela itu! Promosi apa yang lebih baik yang
merencanakan hari ketika kita buka pintu- bisa kita miliki selain itu?” Dia menunjukkan
pintu." Michael beberapa foto pemandangan danau di
lokasi baru. “Saya tahu bahwa renovasinya
Data Adalah Hidangan Utama belum selesai sehingga kami tidak dapat
Tyler berbicara dengan ayahnya tentang dua menunjukkan interiornya, tetapi danaunya
bidang yang menurutnya harus fokus tidak direnovasi!” Dia kemudian
sekarang. Pertama, restoran membutuhkan menunjukkan kepada ayahnya iklan yang dia
data untuk membantu mengelola persediaan telah dirancang dengan perangkat lunak baru
makanan dan tenaga kerja mereka. Mereka yang telah dibelinya. Tyler memiliki daftar
setiap iklan, di mana dan kapan itu akan keuntungan mereka atau tidak mendapatkan
terjadi diterbitkan, serta biayanya. iklan "dari mulut ke mulut" yang dibutuhkan.
Michael terkesan dengan pemikiran Tyler mengatakan dia benar sekali. Harus ada
dan usaha yang telah dilakukan anaknya. keseimbangan yang masuk akal untuk
Tyler melanjutkan, mengatakan bahwa iklan menawarkan niat baik kepada yang stabil
hanyalah salah satu bagian dari strategi pelanggan yang juga akan membantu
promosi. Sama seperti Anda harus memiliki mempromosikan lokasi baru. Periklanan itu
beberapa item di piring untuk makan mahal, tetapi perlu memiliki pengembalian ke
seimbang, iklan cetak perlu dilengkapi dengan bisnis. Tyler menunjukkan kepada Michael
jenis lain promosi, sesuatu yang lebih aktif. beberapa cetakan undangan yang akan
Tyler tahu bahwa pelanggan restoran saat ini diberikan kepada pelanggan di lokasi saat ini.
akan menjadi penjualan yang “mudah” dan Undangan untuk “Makan bersama Kami di
harus dihargai atas perlindungan setia mereka Danau” akan diberikan dengan cek tamu
Tyler berkata, “Ayah, apa pendapatmu tentang untuk ditukarkan selama periode pembukaan
persembahan? pelanggan kami saat ini dua minggu. Menangkap data untuk
kesepakatan khusus untuk pembukaan? Inilah pemasaran dan operasi akan sangat penting.
yang menurut saya bisa kita lakukan.” Dia Tyler dan Michael sama-sama tahu bahwa
menunjukkan Michael kampanye promosi tantangannya adalah selalu dalam detail.
untuk mengundang pelanggan saat ini ke Namun, mereka berpikir bahwa inisiatif ini
lokasi baru dengan insentif dalam beberapa adalah langkah besar ke arah yang benar.
tahun ke depan minggu. Mereka bersemangat untuk menerapkan
Namun, Michael tidak mau beberapa pendekatan baru untuk mengelola
memberikan diskon itu akan sangat memotong restoran di lokasi baru.

Mengelola Data Digital


Anda menggunakan browser web Anda untuk semua jenis aktivitas mulai dari mencari
informasi, hingga berkomunikasi dengan orang lain, mengunjungi toko elektronik online favorit
Anda untuk mencari perangkat televisi definisi tinggi. Saat mengunjungi toko elektronik, Anda
memasukkan kisaran harga dan layar ukuran. Dalam beberapa detik, layar dipenuhi dengan detail
model yang tersedia lengkap dengan foto dan spesifikasi produk. Dari mana informasi yang kaya
dan terorganisir dengan baik ini berasal? Dia berasal dari database. Sistem manajemen basis data
merespons permintaan Anda hampir seketika.
Bisnis mengumpulkan dan membedah data untuk berbagai tujuan. Data digital dapat
disimpan dalam berbagai cara pada berbagai jenis media, seperti yang dibahas dalam Bab 4. Data
dapat disimpan dalam apa dapat disebut format file tradisional, di mana potongan informasi yang
berbeda tidak diberi label dan dikategorikan, tetapi disimpan sebagai string byte yang
berkelanjutan. Keuntungan utama dari iniformat adalah penggunaan ruang yang efisien, tetapi
data tetap sulit ditemukan dan dimanipulasi.
Sebaliknya, format database, di mana setiap bagian data diberi label atau dikategorikan,
menyediakan alat manajemen informasi yang jauh lebih kuat. Data dalam format ini dapat
diakses dengan mudah dan dimanipulasi dalam hampir semua cara yang diinginkan untuk
menciptakan informasi yang berguna untuk pengambilan keputusan. Dampak teknologi database
pada bisnis tidak dapat dilebih-lebihkan. Tidak hanya memilikinya mengubah cara hampir setiap
industri menjalankan bisnis, tetapi juga telah menciptakan informasi industri dengan efek luas
pada bisnis dan kehidupan pribadi kita. Database berada di belakang keberhasilan penggunaan
anjungan tunai mandiri, peningkatan efisiensi di toko ritel, hampir setiap upaya pemasaran, dan
berbagai mesin pencari online dan bisnis berbasis web. Gabungan dengan halaman web interaktif
di Internet, database telah memberikan kontribusi yang sangat besar untuk perdagangan. Tanpa
mereka, tidak akan ada perbankan online, katalog konsumen, pencarian mesin, pialang saham,
atau media sosial. Dampaknya terhadap bisnis telah memungkinkan lebih sedikit orang untuk
menyelesaikan tugas yang lebih besar, dan kekuatan mereka telah memungkinkan organisasi
untuk mempelajari lebih lanjut tentang kami, sepertikonsumen, daripada yang mungkin kita
sadari. Bayangkan: setiap kali Anda memasukkan alamat sebuah situs web, sebuah program
khusus melakukan pencarian di database besar dan mencocokkan permintaan Anda dengan salah
satu dari ratusan juta alamat. Setiap kali Anda mengisi formulir online dengan detail seperti
alamat, nomor telepon, atau nomor kartu kredit Anda, sebuah program memasukkan data ke
dalam database,di mana setiap item dicatat untuk digunakan lebih lanjut. Di hampir setiap jenis
bisnis saat ini, Anda harus memahami kekuatan database. Itu pendekatan untuk mengatur dan
memanipulasi data yang disajikan dalam bab ini akan membantu Anda memperoleh pengetahuan
penting ini.

TITIK MINAT Uang Pintar di Pilpres 2012


Manajemen data memainkan peran penting dalam pemilihan Presiden AS 2012. Presiden
Obama dan nya Tim strategi kampanye telah mengumpulkan dan menganalisis data untuk
pemilu 2012 sejak pemilu 2008. Salah satu keuntungan utama dari pengumpulan data mereka
adalah menyaring informasi tentang kebiasaan-kebiasaan tertentu kelompok demografis.
Meskipun dibiayai oleh saingannya Mitt Romney, data tersebut memungkinkan Obama dan tim
untuk menghabiskan uang kampanye mereka 'lebih pintar' dari Romney dan timnya. Obama
mampu menjalankan strategi kampanye yang lebih efisien dan menyampaikan informasi yang
tepat kepada orang yang tepat. Memiliki akses ke data penting dan terorganisir dengan baik
dapat menjadi alat strategis yang memisahkan kandidat atau bisnis darI pesaing mereka.

KENAPA KAMU HARUS Tahu Tentang Database

Jumlah data konsumen yang hanya jika mereka dapat bermanuver di


dikumpulkan oleh pemasar langsung telah dalamnya dan memperoleh keluaran yang
meningkat secara eksponensial, sampai- diinginkan darinya. Dari 500 miliar dolar
sampai sekarang dianggap sebagai “Big pemasaran yang dihabiskan setiap tahun di
Data.” Dengan begitu banyak data yang ada, seluruh dunia, $200 miliar diinvestasikan
itu bisa jadi sulit untuk menentukan apa yang secara suboptimal (Kuehner-Hebert, 2012).
berguna dan apa yang tidak. Sebagai Hanya menyimpan data penting
pengelola data, Anda harus tahu data apa yang memungkinkan Anda untuk lebih mudah
diperlukan dan apa yang tidak. Untuk melihat data apa sedang mencoba untuk
memiliki data yang menambah nilai bagi memberitahu Anda; siapa pelanggan utama
perusahaan Anda, Anda harus tahu pertanyaan Anda, apa trennya
apa yang Anda ingin data untuk menjawab- Anda ingin mendasarkan rencana pemasaran
apa tren yang Anda cari atau laporan apa yang Anda, atau pemasaran apa? rencana akan
perlu dibuat. Big Data berguna bagi pengguna menghasilkan ROI tertinggi. Anda juga akan
menjadi profesional yang lebih produktif jika dipanggil untuk menjelaskan kepada
Anda tahu bagaimana database dan gudang perancang basis data bagaimana elemen data
data dibangun dan ditanyakan, dan jenis berhubungan satu sama lain, bagaimana Anda
informasi apa yang dapat diambil darinya. Di ingin data diakses, dan laporan apa yang Anda
karir apa pun yang Anda pilih, Anda mungkin mungkin perlu.

Pendekatan File Tradisional

Data dapat dipertahankan dengan salah satu dari dua cara: pendekatan file tradisional—yang
tidak memiliki mekanisme untuk menandai, mengambil, dan memanipulasi data—dan
pendekatan database, yang memiliki mekanisme ini. Untuk menghargai manfaat dari pendekatan
database, Anda harus perlu diingat ketidaknyamanan yang terlibat dalam mengakses dan
memanipulasi data di tradisional pendekatan file: ketergantungan program-data, redundansi data
tinggi, dan integritas data rendah. Gambar 7.1 mengilustrasikan contoh file sumber daya manusia
yang terstruktur dalam file tradisional format.

Gambar 7.1 Struktur Dan Tata Letak Dari File Sumber Daya Manusia Menggunakan File Tradisional
Organisasi

Tantangan lain dengan penyimpanan file tradisional adalah redundansi data yang tinggi
dan data yang rendah integritas, karena dalam sistem file yang lebih lama, file dibuat, dan masih
dipertahankan, untuk penggunaan unit organisasi tertentu. Jika nama belakang dan depan Anda,
serta alamat dan detail lainnya, muncul di file departemen tempat Anda bekerja serta di file
penggajian Human Departemen sumber daya, data dapat digandakan. Redundansi data ini
menghabiskan ruang penyimpanan (dan, akibatnya, uang) dan tidak efisien. Kapan koreksi atau
modifikasi perlu dilakukan dilakukan, setiap perubahan harus dilakukan sebanyak jumlah lokasi
di mana data muncul, yang membutuhkan waktu dan mungkin menimbulkan kesalahan. Jika data
yang sama dimasukkan dengan benar di satu tempat tetapi salah di tempat lain, catatan Anda
tidak hanya tidak akurat, tetapi mungkin muncul untuk mewakili orang yang berbeda di setiap
tempat. Ketidakakuratan memengaruhi integritas data karakteristik bahwa data mewakili apa
yang seharusnya direpresentasikan dan lengkap dan benar. Bisnis membutuhkan data yang akurat
dan lengkap untuk membuat keputusan yang efektif, beroperasi secara efisien, dan memberikan
nilai kepada pelanggannya. Seringkali, pendekatan file tradisional untuk menyimpan data
menyebabkan integritas data yang rendah. Sulit untuk memastikan bahwa data benar di semua
lokasi ketika ada banyak sekali tempat untuk menyisipkan data ke dalam file, seperti dalam
pendekatan tradisional.

Pendekatan Basis Data


Dalam pendekatan database, potongan data diatur tentang entitas. Entitas adalah objek
apa pun tentang yang dipilih organisasi untuk mengumpulkan data. Entitas dapat berupa tipe
orang, seperti karyawan, pelajar, atau anggota klub penggemar; seperti transaksi penjualan, acara
olahraga, atau pertunjukan teater; atau benda mati, seperti produk yang diinventarisasi atau
dijual, bangunan, ataumineral. Dalam konteks manajemen data, "entitas" mengacu pada semua
kejadian yang berbagi jenis data yang sama. Oleh karena itu, tidak masalah jika Anda
menyimpan catatan satu siswa atau catatan banyak siswa; entitasnya adalah "siswa." Untuk
memahami bagaimana data diatur dalam database, Anda harus terlebih dahulu memahami
hierarki data, yang dijelaskan pada Gambar 7.2, yang menunjukkan a kompilasi informasi
tentang siswa: nama depan, nama belakang, tahun lahir, siswa KTP, jurusan (jurusan), dan
nomor telepon kampus. Bagian terkecil dari data adalah karakter (seperti huruf dalam nama
depan atau belakang, atau angka di alamat jalan). Beberapa karakter membuatsebuah lapangan.
Bidang adalah salah satu informasi tentang entitas, seperti nama belakang atau depan nama
siswa, atau alamat jalan siswa. Bidang yang terkait dengan entitas yang sama membuat sebuah
rekor. Kumpulan catatan terkait, seperti semua catatan mahasiswa perguruan tinggi, adalah
disebut file. Seringkali, beberapa file terkait harus disimpan bersama. Kumpulan file tersebut
adalah disebut sebagai basis data. Namun, fitur database dapat hadir bahkan ketika database
terdiri dari satu file.
Setelah bidang diberi nama, termasuk Nama Belakang, Nama Depan, ID, dan sejenisnya,
data di setiap bidang membawa tag nama bidang dan dapat dengan mudah diakses dengan nama
bidang, tidak peduli di mana data disimpan secara fisik. Salah satu kekuatan terbesar dari
database adalah mereka promosi kemandirian aplikasi-data. Dengan kata lain, jika aplikasi
ditulis ke mengolah data dalam database, perancang aplikasi hanya perlu mengetahui nama-nama
field, bukan organisasi fisik atau panjangnya. Bidang basis data tidak terbatas pada teks dan
angka. Mereka dapat menyimpan gambar, suara, klip video, dokumen, dan bahkan spreadsheet.
GAMBAR 7.2 Hirarki Data

Bidang dapat menampung konten apa pun yang dapat didigitalkan. Misalnya, saat Anda
berbelanja online, Anda dapat mencari produk berdasarkan nama atau kode produk, dan
kemudian mengambil gambar atau klip video tentang produk tersebut. Saat Anda memilih video
di YouTube, Anda mengambil klip video dari database. File media video itu sendiri adalah
bidang di rekaman disimpan dalam database YouTube. Contoh database menunjukkan catatan
properti real estat. Catatan mencakup beberapa bidang teks serta gambar rumah.
Sementara database itu sendiri adalah kumpulan dari beberapa file terkait, program yang
digunakan untuk membangun database, mengisinya dengan data, dan memanipulasi data disebut
manajemen database sistem (DBMS). File itu sendiri adalah database, tetapi DBMS melakukan
semua pekerjaan penstrukturan file, menyimpan data, dan menghubungkan catatan. Seperti yang
dijelaskan sebelumnya, jika Anda ingin mengakses data dari file yang disimpan dalam
pendekatan file tradisional, Anda harus tahu persis berapa banyak karakter yang ditunjuk untuk
setiap jenis data. Sebuah DBMS, bagaimanapun, melakukan banyak pekerjaan ini (dan banyak
pekerjaan lain) untuk Anda.
Jika Anda menggunakan database, Anda ingin dapat berpindah dengan cepat dari satu record ke
record lainnya, urutkan berdasarkan kriteria yang berbeda, pilih catatan atau bidang tertentu, buat
berbagai jenis laporan, dan menganalisis data dengan cara yang berbeda. Karena tuntutan ini,
database disimpan di dan diproses dari perangkat penyimpanan akses langsung, seperti disk
magnetik atau DVD. Mereka bisa menjadi dicadangkan ke perangkat penyimpanan berurutan
seperti pita magnetik atau optik, tetapi tidak dapat efisien diproses dari media tersebut karena
akan memakan waktu terlalu lama untuk mengakses catatan. Catatan yang menyimpan database
pada perangkat apa pun yang tidak dapat ditulis, seperti CD atau DVD yang tidak dapat ditulis
ulang, mungkin cocok untuk database statis, seperti daftar suku cadang yang digunakan oleh
bengkel mobil, tetapi tidak cocok untuk database yang harus diupdate.

Mengumpulkan Data Organisasi


Banyak profesional bisnis mempertimbangkan aset dalam konteks keuangan atau
akuntansi. Bangunan adalah aset yang memiliki nilai finansial tertentu. Namun, hingga saat ini,
banyak profesional bisnis tidak melihat data sebagai aset karena mereka tidak dapat menilai atau
memahami nilainya. Sementara data tidak tidak memiliki nilai finansial, penggunaannya dapat
memberikan nilai organisasi untuk keputusan, strategi, dan operasi suatu bisnis. Data tidak
“secara ajaib” muncul di database perusahaan. Ada beberapa sumber dan metode yang dapat
digunakan untuk mengisi database organisasi:
 Sebagaimana diuraikan dalam Bab 1, sistem pemrosesan transaksi mencatat aktivitas dasar
operasi bisnis seperti penjualan, penggajian, pengeluaran, dan inventaris. Data yang disimpan
dari ini transaksi memberikan konteks untuk keputusan operasional dan strategis bagi
organisasi.
 Perangkat input data sumber, yang dibahas dalam Bab 4, memberikan pendekatan yang
akurat, efisien, dan konsisten untuk mengumpulkan data untuk penyimpanan. Perangkat
keras seperti pemindaian dan RFID memberikan masukan untuk proses transaksi.
 Pada masa awal teknologi informasi, semua data dimasukkan dan dikumpulkan dalam
bangunan fisik usaha. Personil memasukkan data secara langsung melalui sistem internal
seperti penggajian atau entri pesanan. Namun, revolusi web dan seluler telah menciptakan
sumber dan metode tambahan untuk bertransaksi bisnis dengan pemangku kepentingan
organisasi (pemasok, pelanggan, dll.). Oleh karena itu, informasi diproses dan disimpan oleh
aktivitas dari sumber-sumber ini adalah komponen penting dari infrastruktur data organisasi.
 Data eksternal dapat dibeli dan disimpan oleh bisnis untuk digunakan dalam operasinya.
Beberapa contoh kategori ini adalah laporan kredit, data sensus, atau informasi pemasok.
Sebagai contoh, informasi laporan kredit yang dibeli dari agen kredit dapat disimpan dalam
catatan pinjaman bank untuk tujuan sejarah.
 Dalam beberapa tahun terakhir, data transaksi nonoperasional telah meningkat secara
signifikan dengan penggunaan media sosial oleh bisnis. Data ini, dari sumber seperti
Facebook dan Twitter, dapat dikumpulkan dan dianalisis untuk menentukan tren dan pola
perilaku konsumen. Sumber dan penyimpanan data untuk database perusahaan jelas
merupakan aset non-keuangan dari sebuah perusahaan bisnis. Ini adalah komponen penting
dalam mengelola operasi dan strategi untuk efisiensi dan entitas bisnis yang menguntungkan

Pertanyaan dan Laporan


Data diakses dalam database dengan mengirimkan pesan yang disebut query, yang
meminta data dari catatan dan/atau bidang tertentu dan mengarahkan komputer untuk
menampilkan hasilnya. Pertanyaan juga dimasukkan untuk memanipulasi data, termasuk
menambah, menghapus, dan memperbarui data. Pertanyaan juga bisa mendukung penyortiran
urutan catatan. Biasanya, perangkat lunak yang sama yang digunakan untuk membangun dan
mengisi database, yaitu DBMS, juga digunakan untuk menyajikan kueri. DBMS modern
menyediakan cara yang cukup user-friendly untuk query database.

Basis data dapat mencakup: banyak jenis yang berbeda data. Catatan properti ini tidak hanya menunjukkan
harganya, alamat, dan status penjualan tapi gambar juga
DBMS biasanya dibundel dengan bahasa pemrograman atau modul pembuatan laporan.
Pemrogram dapat menggunakan modul ini untuk mengembangkan aplikasi yang memfasilitasi
kueri dan menghasilkan laporan yang telah dirancang sebelumnya. Personil nonteknis dapat
menggunakan perangkat lunak pembuatan laporan untuk mengembangkan laporan ad-hoc
berdasarkan kebutuhan masing-masing. Laporan yang menyertakan data dari database organisasi
merupakan komponen integral untuk mengelola operasi bisnis. Bermacam-macam jenis laporan
dapat menyediakan data dalam format dan struktur untuk membantu manajemen. Sebagai
contoh, pelaporan ringkasan dapat memberikan informasi tingkat yang lebih tinggi yang
menunjukkan total penjualan oleh pelanggan atau perwakilan penjualan. Detail transaksi
penjualan dihilangkan untuk fokus pada aktivitas oleh kelompok tertentu (pelanggan, perwakilan
penjualan, atau produk). Sebagai alternatif, manajemen dapat menggunakan laporan
pengecualian untuk mengekstrak hanya transaksi dan aktivitas yang berada di luar yang
ditentukan batas atau norma. Misalnya, manajer anggaran mungkin ingin melihat semua akun
pengeluaran yang menghabiskan lebih dari alokasi anggaran.

Keamanan
Penggunaan database menimbulkan masalah keamanan dan privasi. Fakta bahwa data
disimpan hanya sekali dalam database untuk beberapa tujuan berbeda tidak berarti bahwa setiap
orang yang memiliki akses ke sana database harus memiliki akses ke semua data di dalamnya.
Membatasi akses dikelola dengan menyesuaikan menu untuk pengguna yang berbeda dan
mengharuskan pengguna memasukkan kode yang membatasi akses ke bidang tertentu atau
catatan. Akibatnya, pengguna memiliki pandangan yang berbeda dari database, seperti yang
diilustrasikan secara abstrak pada Gambar 7.3. Kemampuan untuk membatasi tampilan pengguna
hanya pada kolom atau catatan tertentu memberikan database administrator (DBA) keuntungan
lain: kemampuan untuk menerapkan langkah-langkah keamanan.
Langkah-langkah diimplementasikan sekali untuk database, bukan beberapa kali untuk
yang berbeda file. Misalnya, dalam database yang ditunjukkan pada Gambar 7.4, sementara
manajer sumber daya manusia memiliki akses ke semua bidang file karyawan (diwakili oleh
tabel atas), personel penggajian hanya memiliki akses ke empat bidang file karyawan (bagian
tengah gambar), dan sebuah proyek manajer hanya memiliki akses ke bidang Nama dan Jam
Kerja. Tampilan dapat dibatasi hingga tertentu bidang dalam database, atau catatan tertentu, atau
kombinasi keduanya. Kami membahas masalah keamanan di detail di Bab 14, “Risiko,
Keamanan, dan Pemulihan Bencana.”

Cadangan Dan Pemulihan


Bisnis harus berusaha untuk mempertahankan operasi yang berkelanjutan dan tidak
terputus untuk melayani pemangku kepentingan mereka (pelanggan dan pemasok) dan menjaga
kesejahteraan finansial mereka. Dengan peningkatan ketergantungan pada teknologi informasi
dalam bisnis, kelangsungan bisnis infrastruktur teknologi merupakan faktor penting untuk
kegiatan operasionalnya. Bayangkan sebuah maskapai penerbangan sistem reservasi gagal
beroperasi karena kerusakan perangkat keras yang mengakses database-nya. Itu seluruh operasi
akan terhenti tanpa kemampuan untuk memesan penerbangan, memeriksa penerbangan status,
atau melakukan kegiatan boarding di gerbang bandara. Pada skala yang berbeda, seorang
pegawai di perusahaan manufaktur mungkin secara tidak sengaja menghapus beberapa
pelanggan dalam database-nya. kebutuhan untuk membuat cadangan data dan penyimpanan
transaksi yang berlebihan jika terjadi gangguan pada teknologi diperlukan untuk melanjutkan
dan melanjutkan kegiatan bisnis. Beberapa topik yang terkait dengan perencanaan
kesinambungan teknologi dibahas dalam Bab 14, “Risiko, Keamanan, dan Bencana Pemulihan."
GAMBAR 7.3 Menggunakan Tampilan Database, Pengguna Mungkin Memiliki Perbedaan Gambar
Struktur Basis Data
GAMBAR 7.4 Pemandangan Yang Berbeda Dari Database Yang Sama

TITIK MINAT Pemerintah Di Bawah Serangan Cyber


Pada tahun 2012, dilaporkan bahwa situs web Departemen Pendapatan Carolina Selatan
diretas sebanyak lima kali antara bulan Agustus dan Oktober tahun itu. 3,6 juta nomor Jaminan
Sosial dan 387.000 kartu pembayaran catatan dicuri. Tak satu pun dari nomor Jaminan Sosial
dienkripsi, sementara sebagian besar pembayaran nomor itu. Ini hanya kasus terbaru dalam tren
peningkatan peretasan pemerintah. Sejak 2005, ada 603 kasus pelanggaran jaringan pemerintah
dan militer yang diungkapkan kepada publik. Dalam ini peretasan, setidaknya 141 juta catatan
diambil, menurut The Privacy Rights Clearinghouse Chronology of Data Breaches. Dari sudut
pandang bisnis, ketika data pribadi pelanggan dicuri, tidak hanya dapat mengarah pada pencurian
identitas untuk pelanggan Anda, tetapi itu menodai reputasi bisnis Anda dan dapat menghalangi
pelanggan di masa depan. Keamanan data terus berkembang. Ini adalah tugas yang
membutuhkan perhatian dan pembaruan terus-menerus untuk bertarung strategi peretas baru.

Model Basis Data


Model database adalah struktur logika umum di mana catatan disimpan dalam database
dan metode yang digunakan untuk membangun hubungan antar record. Beberapa model database
berbeda dalam cara di mana catatan dihubungkan satu sama lain, yang pada gilirannya
menentukan cara di dimana pengguna dapat menavigasi database, mengambil catatan yang
diinginkan, dan membuat laporan. Tertua model, model hierarkis dan jaringan, masih digunakan
di beberapa database yang dibangun 1970-an dan 1980-an, tetapi tidak lagi digunakan dalam
database yang baru dibangun. Hampir semuanya baru database dirancang mengikuti model
relasional dan berorientasi objek.

Model Relasional
Model database relasional terdiri dari tabel. Akarnya dalam aljabar relasional, tetapi
Anda tidak perlu mengetahui aljabar relasional untuk membangun dan menggunakan basis data
relasional. Namun, basis data para ahli masih menggunakan terminologi aljabar relasional: dalam
basis data relasional, catatan atau baris disebut tupel, bidang—sering disebut sebagai kolom—
disebut atribut, dan tabel catatan adalah disebut relasi. Teks ini menggunakan istilah yang lebih
sederhana, seperti halnya paket perangkat lunak populer: bidang, record, dan tabel. Untuk
mendesain database relasional, Anda memerlukan gagasan yang jelas tentang entitas yang
berbeda dan bagaimana mereka berhubungan. Misalnya, dalam database untuk bisnis persewaan
buku, entitasnya mungkin Pelanggan, Buku, Sewa, dan Penerbit. Sebuah tabel tunggal dibangun
untuk setiap entitas (meskipun setiap tabel dapat berisi dari hanya beberapa hingga berpotensi
jutaan catatan). Sewa adalah entitas asosiatif; kamu bisa lihat di Gambar 7.5 bahwa tabel Sewa
mengaitkan data dari tabel Pelanggan dan Tabel.
Pemeliharaan database relasional relatif mudah karena setiap tabel tidak bergantung pada
yang lain, meskipun beberapa tabel terkait dengan yang lain. Untuk menambahkan catatan
pelanggan, pengguna mengakses tabel Pelanggan. Untuk menghapus catatan Buku, pengguna
mengakses tabel Buku. Itu keuntungan dari model ini membuat sistem manajemen basis data
relasional yang paling populer di pasar perangkat lunak. Hampir semua DBMS yang ada di
pasaran saat ini mengakomodasi model relasional.
Model ini digunakan dalam sistem manajemen rantai pasokan (SCM) dan banyak
perusahaan lainnya aplikasi serta lokal, IS individu. Untuk mengambil record dari database
relasional, atau untuk mengurutkannya, Anda harus menggunakan kunci. Sebuah kunci adalah
bidang yang nilainya mengidentifikasi catatan baik untuk ditampilkan atau untuk diproses. Anda
dapat menggunakan bidang apa pun sebagai kunci. Misalnya, Anda dapat menanyakan database
untuk catatan Jim Marasco dari Tabel pelanggan dengan menggunakan bidang CustName
sebagai kunci. Artinya, Anda memasukkan kueri, suatu kondisi yang menginstruksikan DBMS
untuk mengambil record dengan nilai CustName sebagai “Jim Marasco.” Sebuah kunci unik jika
setiap nilai (konten) di bidang itu hanya muncul dalam satu catatan. Terkadang kuncinya adalah
terdiri dari beberapa bidang, sehingga kombinasinya memberikan kunci yang unik.
Seperti yang Anda lihat, desain database membutuhkan pemikiran yang matang. Perancang harus
menyertakan: bidang untuk kunci asing dari tabel lain sehingga tabel gabungan dapat dibuat di
masa mendatang. Bergabung tabel menggabungkan data dari dua atau lebih tabel. Sebuah tabel
mungkin menyertakan kunci asing dari beberapa tabel, menawarkan fleksibilitas dalam membuat
laporan dengan data terkait dari beberapa tabel. Inklusi kunci asing dapat menyebabkan
redundansi data yang cukup besar. Kompleksitas ini tidak berkurang popularitas database
relasional, namun. Jika database memiliki lebih dari satu record dengan “Jim Marasco” (karena
beberapa pelanggan terjadi untuk memiliki nama yang sama) di bidang CustName, Anda
mungkin tidak mengambil satu rekaman pun yang Anda menginginkan
GAMBAR 7.5 Sebuah Struktural Representasi Dari Database Relasional
Bergantung pada aplikasi yang Anda gunakan untuk kueri, Anda mungkin menerima
yang pertama yang memenuhi kondisi, yaitu, daftar semua rekaman dengan nilai tersebut di
bidang. Satu-satunya cara untuk pastikan Anda mengambil catatan yang diinginkan adalah
dengan menggunakan kunci unik, seperti Jaminan Sosial nomor, ID karyawan, atau, dalam
contoh kami, ID pelanggan (CustID). Kunci unik dapat berfungsi sebagai kunci utama. Kunci
utama adalah bidang di mana catatan dalam tabel diidentifikasi secara unik. Jika kueri Anda
menetapkan bahwa Anda menginginkan catatan yang nilai CustID-nya 36003, sistem
akanmengambil catatan Betsy McCarthy. Itu akan menjadi Betsy McCarthy yang Anda inginkan,
bahkan jika ada lebih banyak catatan orang dengan nama yang persis sama. Karena tujuan dari
kunci utama adalah untuk mengidentifikasi catatan secara unik, setiap catatan harus memiliki
nilai unik di bidang itu.
Biasanya, sebuah tabel dalam database relasional harus memiliki kunci utama, dan
sebagian besar DBMS relasional menegakkan aturan ini; jika perancang tidak menunjuk bidang
sebagai kunci, DBMS membuat sendiri bidang nomor seri sebagai bidang kunci utama untuk
tabel. Pernah menjadi perancang meja menentukan kunci utama saat membuat format catatan,
DBMS tidak mengizinkan pengguna untuk memasukkan dua catatan dengan nilai yang sama di
kolom itu. Perhatikan bahwa mungkin ada situasi di mana lebih dari satu bidang dapat digunakan
sebagai kunci utama. Demikian halnya dengan kendaraan bermotor, karena tiga bidang berbeda
dapat secara unik mengidentifikasi catatan kendaraan tertentu: kendaraan nomor identifikasi
(VIN), nomor judul, dan nomor plat negara. Jadi, basis data desainer mungkin menetapkan salah
satu bidang ini sebagai kunci utama untuk mengambil catatanUntuk beberapa kebutuhan bisnis
Anda harus menggunakan kunci komposit, kombinasi dari dua atau lebih bidang yang bersama-
sama berfungsi sebagai kunci utama, karena tidak praktis menggunakan satu bidang sebagai
kunci utama. Misalnya, pertimbangkan catatan penerbangan maskapai komersial. Penerbangan
tertentu rutenya sama setiap minggu atau setiap hari ditawarkan, jadi penerbangan harian
FlySousa Airlines dari Boston ke Honolulu—FS5025—misalnya, tidak dapat melayani kami
dengan baik untuk mengambil daftar semua penumpang yang mengambil penerbangan ini pada
tanggal 3 Mei 2013.
Namun, kita dapat menggunakan kombinasi dari nomor penerbangan dan tanggal sebagai
kunci utama komposit. Untuk memeriksa siapa yang duduk di kursi tertentu, kunci komposit
yang terdiri dari tiga bidang diperlukan: nomor penerbangan, tanggal, dan nomor kursi. Untuk
menghubungkan record dari satu tabel dengan record dari tabel lain, tabel harus memiliki
setidaknya satu bidang yang sama (yaitu, satu kolom di setiap tabel harus berisi jenis data yang
sama), dan itu bidang harus menjadi bidang kunci utama untuk salah satu tabel. Bidang berulang
ini adalah kunci utama dalam satu tabel, dan bidang kunci asing di tabel lainnya. Dalam contoh
Penyewaan Buku, jika Anda mau ingin membuat laporan yang menunjukkan nama setiap
distributor dan semua buku dari itu penerbit, kunci utama tabel Penerbit, PubID, juga harus
disertakan sebagai kunci asing di meja Buku. Tabel yang dihasilkan (Gambar 7.6) adalah tabel
gabungan. Perhatikan bahwa meskipun PubID digunakan untuk membuat tabel gabung tidak
harus ditampilkan di tabel gabung, meskipun bisa.
GAMBAR 7.6 Sebuah Representasi Dari Bergabung Tabel Dari Buku Dan Tabel Penerbit
Karena hubungan antar tabel dibuat sebagai bagian dari manipulasi tabel, model
relasional mendukung hubungan satu-ke-banyak dan banyak-ke-banyak antar record dari tabel
yang berbeda. Misalnya, hubungan satu-ke-banyak dibuat ketika sekelompok karyawan hanya
dimiliki oleh satu departemen. Semua akan memiliki nomor departemen yang sama dengan
kunci asing dalam catatan mereka, dan tidak ada yang akan memiliki lebih dari satu kunci
departemen. ada satu departemen, terkait dengan banyak karyawan. Hubungan banyak-ke-
banyak dapat dipertahankan, misalnya, untuk profesor dan mahasiswa dalam database perguruan
tinggi. Seorang profesor mungkin memiliki banyak siswa, dan seorang siswa mungkin memiliki
banyak profesor. Hal ini dapat dicapai dengan membuat kunci gabungan dari ID profesor dan ID
mahasiswa. Dalam contoh toko Penyewaan Buku kami, ada hubungan banyak ke banyak antara
pelanggan dan buku yang mereka sewa. Meja Sewa memungkinkan manajer toko buku membuat
laporan riwayat pelanggan dan persewaan mereka. Jelas bahwa lebih dari satu pelanggan telah
menyewa buku tertentu, dan pelanggan yang sama telah menyewa banyak buku yang berbeda.
Menurut Gartner Research, vendor utama DBMS relasional (RDBMS) adalah Oracle,
IBM, dan Microsoft, dengan pangsa pasar 2011 di seluruh dunia dalam pendapatan lisensi sekitar
setengahnya, seperlima, dan seperlima, masing-masing (Fontecchio, 2012). Lisensi IBM DB2,
lisensi Oracle DBMS dengan nama perusahaan, dan Microsoft melisensikan SQL Server dan
Access. MySQL adalah DBMS open source paling populer di dunia (Bridgwater, 2012). MySQL
digunakan oleh Facebook, Google, dan Adobe untuk mendukung situs web volume transaksi
tinggi mereka. DBMS ini merupakan bagian penting dari aplikasi perusahaan seperti sistem
SCM dan CRM.

Model Berorientasi Objek


Model database berorientasi objek menggunakan pendekatan berorientasi objek,
dijelaskan dalam Bab 5,"Perangkat Lunak Bisnis," untuk memelihara catatan. Dalam teknologi
berorientasi objek, sebuah objek terdiri dari: baik data maupun prosedur yang memanipulasi
data. Jadi, selain atribut entitas, suatu objek juga mengandung hubungan dengan entitas lain dan
prosedur untuk memanipulasi data. Penyimpanan gabungan dari kedua data dan prosedur yang
memanipulasinya disebut sebagai enkapsulasi. Melalui enkapsulasi, suatu objek dapat “ditanam”
dalam kumpulan data yang berbeda.
Kemampuan dalam struktur berorientasi objek untuk membuat objek baru secara
otomatis dengan mereplikasi semua atau beberapa karakteristik objek yang dikembangkan
sebelumnya (disebut objek induk) disebut warisan. Gambar 7.7 menunjukkan bagaimana data
yang sama dipelihara dalam database relasional di toko persewaan DVD akan disimpan dan
digunakan dalam database berorientasi objek. Itu hubungan antara data tentang entitas tidak
dikelola dengan kunci asing, tetapi melalui hubungan satu objek dengan objek lainnya. Salah
satu keuntungan dari pendekatan ini adalah pengurangan dari redundansi data.

GAMBAR 7.7 Basis Data Berorientasi Objek

Beberapa data dan informasi tidak dapat diatur sebagai bidang, tetapi dapat ditangani
sebagai objek, seperti gambar, peta, dan halaman web. Semua kemampuan ini membuat
berorientasi objek DBMS, juga disebut sistem manajemen basis data objek (ODBMS) yang
berguna dalam bantuan komputer design (CAD), sistem informasi geografis, dan aplikasi yang
digunakan untuk memperbarui ribuan halaman web setiap hari, karena mereka dapat menangani
berbagai macam data seperti grafik, suara, dan teks lebih mudah daripada model relasional.
Mirip dengan DBMS relasional, ODBMS menyediakan antarmuka pengguna grafis
(GUI) untuk mengelola DBMS. Pengguna dapat memilih objek dari "kelas", yang merupakan
grup objek yang memiliki kesamaan karakteristik. Elemen ODBMS sering dimasukkan ke dalam
database relasional, dan semacamnya: database kadang-kadang dikenal sebagai database objek-
relasional.
Database berorientasi objek (ODB) tidak menyimpan catatan, tetapi objek data, yang
merupakan keuntungan untuk pembaruan cepat kumpulan data dan hubungan di antara mereka.
Misalnya, di contoh toko DVD, di ODB hubungan antara DVD dan distributornya tidak
didirikan melalui kunci asing; itu ada karena kelas DVD berisi kelas Distributor. Namun,
database berorientasi objek juga memiliki beberapa kelemahan, dibandingkan dengan database
relasional database. Misalnya, ada ketergantungan antara aplikasi dan data; mereka sederhana
"dibungkus" bersama. Mengubah struktur tabel dalam database relasional tidak memerlukan
perubahan dalam aplikasi yang menggunakan data dalam tabel tersebut, sementara itu akan
membutuhkan perubahan dalam aplikasi dalam database berorientasi objek. Ketergantungan ini
juga membatasi kemampuan untuk memasukkan iklan hoc query dalam ODB, yaitu
memasukkan query sesuka hati. Meskipun tidak sepopuler atau juga dipahami sebagai database
relasional, ODB mendapatkan pengadopsi. Beberapa perusahaan perangkat lunak telah
mengembangkan ODBMS yang populer. Diantaranya adalah Objektivitas/ DB (Objectivity,
Inc.), ObjectStore (Versata), dan Versant Object Database (Versant Corporation).

Operasi Relasional
Seperti disebutkan sebelumnya, DBMS yang paling populer adalah yang mendukung
model relasional. Oleh karena itu, Anda akan mendapat manfaat dari menjadi akrab dengan
database relasional yang banyak digunakan, seperti Access, Oracle, atau SQL Server. Untuk
menggunakan database, Anda harus tahu bagaimana relasional operasi bekerja. Operasi
relasional membuat tabel sementara yang merupakan subset dari meja atau tabel asli. Hal ini
memungkinkan Anda untuk membuat laporan yang berisi catatan yang memenuhi kondisi, buat
daftar dengan hanya beberapa bidang tentang entitas, atau buat laporan dari gabungan tabel, yang
menggabungkan data yang relevan dari dua atau lebih tabel. Jika diinginkan, pengguna dapat
menyimpan tabel yang baru dibuat. Seringkali, tabel sementara diperlukan hanya untuk
pelaporan ad hoc dan segera dibuang.
Tiga operasi relasional yang paling penting adalah pilih, proyek, dan gabung. Pilih adalah
pemilihan record yang memenuhi kondisi tertentu. Misalnya, manajer sumber daya manusia
mungkin memerlukan laporan yang menunjukkan seluruh catatan setiap karyawan yang gajinya
melebihi $60.000. Proyek adalah pemilihan kolom tertentu dari tabel, seperti gaji semua
karyawan. Kueri mungkin menentukan kombinasi seleksi dan proyeksi. Dalam contoh
sebelumnya, manajer mungkin hanya memerlukan nomor ID, nama belakang (proyek), dan gaji
karyawan yang gaji lebih besar dari $60.000 (pilih).
Salah satu manipulasi yang paling berguna dari database relasional adalah pembuatan
tabel baru dari dua atau lebih tabel lainnya. Seperti yang mungkin Anda ingat dari diskusi kita
tentang model relasional, penggabungan data dari beberapa tabel disebut join. Kami telah
menggunakan contoh sederhana dari database persewaan buku (Gambar 7.6). Namun, kueri
bergabung bisa jauh lebih kompleks.
Misalnya, database bisnis relasional mungkin memiliki empat tabel: SalesRep, Catalog,
Order, dan Pelanggan. Manajer penjualan mungkin ingin membuat laporan yang menunjukkan,
untuk setiap perwakilan penjualan, daftar semua pelanggan yang membeli sesuatu bulan lalu,
item yang dibeli setiap pelanggan, dan jumlah total yang dikeluarkan oleh setiap pelanggan.
Tabel baru dibuat dari operasi relasional yang mengambil data dari keempat tabel. Operasi
gabungan adalah manipulasi kuat yang dapat membuat laporan yang sangat berguna untuk
pengambilan keputusan. Tabel gabungan dibuat "on the fly" sebagai hasil dari kueri dan hanya
ada untuk durasi yang diinginkan pengguna untuk melihatnya atau membuat laporan kertas
darinya. Fitur desain memungkinkan pengguna untuk mengubah judul bidang (meskipun nama
bidang tetap sama di internal tabel), tempatkan output dalam tata letak yang berbeda pada layar
atau kertas, dan tambahkan grafik dan teks ke laporan. Tabel baru mungkin disimpan sebagai
tabel tambahan dalam database.

TITIK MINAT Promosi yang Dipersonalisasi


Amazon diberikan paten pada tahun 2010 untuk proses memprediksi item apa yang
paling menarik bagi pembeli tertentu. Setiap kali pengguna mengklik suatu item, item tersebut
dicatat dan dikategorikan dalam database Amazon. Berdasarkan pembelian dan item yang dilihat
sebelumnya, Amazon mengembangkan tren dan pola tentang apa item tertentu yang
kemungkinan besar akan dibeli pengguna di masa mendatang. Mereka kemudian 'mendorong'
item dengan memberikan rekomendasi yang dipersonalisasi kepada pengguna. Amazon
menggunakan proses yang sekarang dipatenkan ini untuk menargetkan individu mikro pembeli
dan berikan mereka barang yang paling mereka minati berdasarkan barang apa yang mereka beli
sebelumnya diklik.

Bahasa Kueri Terstruktur


Structured Query Language (SQL) telah menjadi bahasa query pilihan bagi banyak orang
pengembang DBMS relasional. SQL adalah standar internasional dan disediakan dengan
sebagian besar program manajemen basis data relasional. Kekuatannya terletak pada intuitifnya
yang mudah diingat perintah. Misalnya, anggap nama seluruh database adalah DVD_Store.
Untuk membuat daftar dari semua judul DVD thriller yang harga sewanya kurang dari $5,00,
pertanyaannya adalah:

PILIH JUDUL, KATEGORI DARI DVD_STORE


MANA KATEGORI 'Thriller' dan HARGA SEWA < 5

Pernyataan seperti ini dapat digunakan untuk kueri ad hoc atau diintegrasikan dalam
program yang disimpan untuk penggunaan berulang. Perintah untuk memperbarui database juga
mudah diingat: INSERT, HAPUS, dan PERBARUI.
Mengintegrasikan SQL dalam DBMS menawarkan beberapa keuntungan:
 Dengan bahasa standar, pengguna tidak perlu mempelajari rangkaian perintah yang
berbeda untuk membuat dan memanipulasi database dalam DBMS yang berbeda.
 Pernyataan SQL dapat disematkan dalam bahasa pemrograman yang banyak digunakan
seperti COBOL atau C dan bahasa berorientasi objek seperti C++ atau Java, dalam hal ini
bahasa ini disebut "bahasa tuan rumah". Kombinasi pernyataan yang sangat disesuaikan
dan efisien dengan SQL pernyataan meningkatkan efisiensi dan efektivitas aplikasi
mengakses relasional database.
 Karena pernyataan SQL bersifat portabel dari satu sistem operasi ke sistem operasi
lainnya, programmer tidak dipaksa untuk menulis ulang pernyataan.

Beberapa DBMS relasional, seperti Microsoft Access, menyediakan GUI untuk membuat
kueri SQL; SQL kueri dapat ditempatkan dengan mengklik ikon dan memilih item menu, yang
dikonversi secara internal ke dalam kueri SQL dan dieksekusi. Kemampuan ini memungkinkan
perancang basis data yang relatif tidak berpengalaman untuk menggunakan SQL.

Skema dan Metadata


Saat membangun database baru, pengguna harus terlebih dahulu membangun skema (dari
kata Yunani untuk "rencana"). Skema menggambarkan struktur database yang sedang dirancang:
nama dan jenis bidang dalam setiap jenis record dan hubungan umum di antara kumpulan record
atau file yang berbeda. Dia termasuk deskripsi struktur database, nama dan ukuran bidang, dan
detail seperti bidang mana yang merupakan kunci utama. Jumlah record tidak pernah ditentukan
karena mungkin berubah, dan jumlah maksimum record ditentukan oleh kapasitas media
penyimpanan.
Bidang dapat menampung berbagai jenis data: numerik, alfanumerik, grafik, atau terkait
waktu. Bidang numerik menyimpan angka yang dapat dimanipulasi dengan penambahan,
perkalian, rata-rata, dan sejenisnya. Bidang alfanumerik menyimpan nilai tekstual: kata, angka,
dan simbol khusus, yang membentuk nama, alamat, dan nomor identifikasi. Angka yang
dimasukkan bidang alfanumerik, seperti nomor Jaminan Sosial atau kode pos, tidak dapat
dimanipulasi secara matematis. Pembangun database baru juga harus menunjukkan bidang mana
yang akan digunakan sebagai kunci utama. Banyak DBMS juga memungkinkan pembangun
untuk menunjukkan secara positif ketika suatu bidang tidak unik, artinya nilai dalam bidang itu
mungkin sama untuk lebih dari satu catatan.
Gambar 7.8 menyajikan skema tabel database yang dibuat dengan Microsoft Access
DBMS. Pengguna diminta untuk memasukkan nama dan jenis bidang. Access memungkinkan
pengguna memberi nama bidang dan menentukan tipe datanya. Bagian Deskripsi memungkinkan
desainer untuk menggambarkan alam dan fungsi bidang untuk orang yang memelihara database.
Di bagian bawah jendela pengguna ditawarkan banyak pilihan untuk setiap bidang, seperti
ukuran bidang, format, dan sebagainya. Di Akses bidang kunci utama ditunjukkan oleh ikon
kunci kecil di sebelah kirinya.

GAMBAR 7.8 Skema Karyawan Tabel Di Access 2010 Basis Data. Lapangan Area Properti Di Bagian Bawah
Menunjukkan Sifat-Sifat Atribut (Bidang) Employeeid

Deskripsi setiap struktur tabel dan tipe field menjadi bagian dari kamus data, yang
merupakan tempat penyimpanan informasi tentang data dan organisasinya. Desainer biasanya
menambahkan lebih banyak informasi tentang setiap bidang, seperti dari mana data berasal
(seperti sistem lain atau dimasukkan secara manual); siapa yang memiliki data asli; siapa yang
boleh menambah, menghapus, atau pemutakhiran data di lapangan; dan detail lainnya yang
membantu DBA memelihara database dan memahami arti dari bidang dan hubungan mereka.
(Beberapa orang lebih suka menyebutnya metadata, yang berarti “data tentang data.”) Metadata
meliputi:
 Sumber data, termasuk informasi kontak.
 Tabel yang berhubungan dengan data.
 Informasi bidang dan indeks, seperti ukuran dan jenis bidang (mis., apakah itu teks atau
numerik), dan cara data diurutkan.
 Program dan proses yang menggunakan data.
 Aturan populasi: apa yang dimasukkan, atau diperbarui, dan seberapa sering.

Pemodelan Data
Database harus hati-hati direncanakan dan dirancang untuk memenuhi tujuan bisnis.
Bagaimana mereka dirancang? memungkinkan atau membatasi fleksibilitas dalam penggunaan.
Menganalisis data organisasi dan mengidentifikasi hubungan antar data disebut pemodelan data.
Pemodelan data pertama-tama harus dilakukan untuk memutuskan data mana yang harus
dikumpulkan dan bagaimana data itu harus diatur. Jadi, pemodelan data harus proaktif. Membuat
model data secara berkala adalah praktik yang baik; itu memberikan keputusan membuat
gambaran yang jelas tentang data apa yang tersedia untuk laporan, dan data apa yang mungkin
dimiliki organisasi perlu mulai mengumpulkan untuk pengambilan keputusan yang lebih baik.
Manajer kemudian dapat meminta para ahli untuk mengubah hubungan dan desain laporan atau
aplikasi baru yang menghasilkan laporan yang diinginkan dengan beberapa penekanan tombol.
Banyak database bisnis terdiri dari beberapa tabel dengan hubungan di antara mereka.
Untuk contoh, rumah sakit mungkin menggunakan database yang memiliki tabel yang
menyimpan catatan semua dokter, satu lagi dengan semua perawatnya, satu lagi dengan semua
pasien saat ini, dan seterusnya. Itu staf administrasi harus dapat membuat laporan yang
menghubungkan data dari beberapa tabel. Untuk misalnya, satu laporan mungkin tentang
seorang dokter dan semua pasiennya selama periode tertentu. Lain mungkin berputar di sekitar
pasien, seperti rincian pasien, daftar semua pengasuh yang terlibat dalam rehabilitasinya, dan
daftar obat-obatan. Dengan demikian, database harus direncanakan dengan hati-hati untuk
memungkinkan manipulasi data dan pembuatan laporan yang berguna.
Pemodelan dan desain data yang efektif dari setiap database melibatkan pembuatan
konsep konseptual cetak biru database. Cetak biru semacam itu disebut diagram hubungan
entitas (ERD). ERD adalah representasi grafis dari semua hubungan entitas, contohnya
ditunjukkan pada: Gambar 7.9, dan mereka sering dikonsultasikan untuk menentukan masalah
dengan kueri atau untuk mengimplementasikannya perubahan. ERD adalah alat utama untuk
komunikasi tidak hanya di antara desainer DB profesional,tetapi juga antara pengguna dan antara
pengguna dan desainer. Oleh karena itu penting bahwa profesional di semua bidang ini tahu cara
membuat dan membacanya.

GAMBAR 7.9 Hubungan Entitas Diagram (ERD)

Dalam ERD, kotak digunakan untuk mengidentifikasi entitas. Garis digunakan untuk
menunjukkan hubungan antar entitas. Ketika garis berbentuk kaki gagak menunjuk ke suatu
objek, mungkin ada banyak contoh objek itu. Ketika tautan dengan kaki gagak juga termasuk
mistar gawang, maka semua contoh objek di sisi kaki gagak terkait dengan satu contoh dari
benda di sisi mistar gawang. Palang kedua akan menunjukkan "wajib," yang berarti bahwa
hubungan harus terjadi, seperti antara judul buku dan penulis: judul buku harus memiliki penulis
yang terkait dengannya. Lingkaran di dekat kotak menunjukkan "opsional."
 Pada Gambar 7.9, kaki gagak di ujung Departemen dari hubungan Departemen/Perguruan
Tinggi menunjukkan bahwa ada beberapa departemen dalam satu perguruan tinggi,
menunjukkan hubungan satu-ke-banyak antara Perguruan Tinggi dan Departemen. Selain itu,
mistar gawang di ujung College Tautan Perguruan Tinggi/Departemen menunjukkan bahwa
departemen hanya dimiliki oleh satu perguruan tinggi.
 Sebuah departemen memiliki banyak profesor, tetapi seorang profesor mungkin berada di
lebih dari satu departemen; dengan demikian, hubungan antara Profesor dan Departemen
adalah banyak-ke-banyak, terwakili oleh kaki gagak di kedua ujung tautan.
 Sebuah kursus ditawarkan oleh satu departemen, ditunjukkan oleh palang di ujung
Departemen link Jurusan/Kursus.
 seorang profesor mungkin mengajar lebih dari satu siswa, dan seorang siswa mungkin
memiliki lebih dari satu profesor, dengan demikian kaki gagak di Profesor dan Siswa
mengakhiri banyak-ke-banyak hubungan antara Profesor dan Mahasiswa.
 Namun, lingkaran di ujung Siswa menunjukkan bahwa seorang profesor tidak harus memiliki
siswa sama sekali. Lingkaran berarti "pilihan", dan ada untuk kasus di mana profesor tidak
mengajar.

Diagram seperti Gambar 7.9 memberikan ERD awal. Para desainer juga harus merinci
bidang setiap objek, yang menentukan bidang untuk setiap catatan objek itu. Atribut terdaftar di
setiap kotak objek, dan atribut kunci utama digarisbawahi. Biasanya yang utama bidang kunci
muncul di bagian atas daftar bidang di dalam kotak. Gambar 7.10 adalah contoh kemungkinan
atribut entitas Profesor. Perancang basis data dapat menggunakan notasi yang berbeda; oleh
karena itu, sebelum Anda meninjau diagram ER, pastikan Anda memahami apa arti setiap
simbol.

GAMBAR 7.10 Bidang Profesor Kesatuan

Contoh yang diberikan di sini cukup sederhana. Pada kenyataannya, laporan yang perlu
manajer menghasilkan bisa sangat kompleks dalam hal hubungan antara elemen data yang
berbeda dan jumlah tabel yang berbeda dari mana mereka dirakit. Bayangkan hubungan antara
data disimpan di perpustakaan: pelindung mungkin meminjam beberapa judul; perpustakaan
memelihara beberapa salinan dari setiap judul; judul mungkin buku, CD, DVD, atau file media;
beberapa penulis mungkin telah menerbitkan buku yang berbeda dengan judul yang sama;
pustakawan harus dapat melihat ketersediaan dan barang-barang yang dipinjam berdasarkan
judul, pengarang, dan pelindung; mereka juga harus bisa menghasilkan sejarah laporan semua
peminjaman setiap patron untuk jangka waktu tertentu; dan seterusnya. Semua ini hubungan dan
berbagai kebutuhan laporan harus diperhitungkan saat merancang basis data.

Database di Web
Internet dan web yang mudah digunakan praktis tidak berguna jika orang tidak dapat
mengakses database online. Premis web adalah bahwa orang tidak hanya dapat menelusuri yang
menarik halaman web tetapi juga mencari dan menemukan informasi. Paling sering, informasi
itu disimpan di database. Ketika seorang pembelanja mengakses sebuah toko online, ia dapat
mencari informasi tentang salah satu dari ribuan, atau ratusan ribu, barang yang ditawarkan
untuk dijual. Misalnya, ketika Anda mengakses situs web seperti Wal-Mart, Target, atau
Amazon, Anda dapat menerima informasi basis data (seperti gambar barang elektronik, video,
harga, waktu pengiriman, dan evaluasi konsumen) untuk ratusan item yang ditawarkan untuk
dijual. Memasukkan kata kunci di YouTube menghasilkan daftar semua video klip yang judul
atau teks deskriptifnya mengandung kata kunci. Banyak grosir membuat katalog mereka tersedia
secara online. Aplikasi di situs lelang menerima pertanyaan berdasarkan kategori, kisaran harga,
negara asal, warna, tanggal, dan atribut lainnya, dan mengidentifikasi catatan item yang cocok,
yang sering menyertakan gambar dan deskripsi rinci.
Di belakang masing-masing situs ini adalah database. Satu-satunya cara bagi organisasi
untuk melakukan ini bisnis berbasis web adalah untuk memberikan orang di luar organisasi akses
ke database mereka. Di dengan kata lain, organisasi harus menghubungkan database mereka ke
Internet. Basis data menyediakan kumpulan produk dan informasi yang dinamis dan terorganisir
untuk "dilaporkan" kembali ke pelanggan.
Halaman web Amazon.com yang ditampilkan di sini, misalnya, menampilkan beberapa
produk tablet berdasarkan: kriteria pencarian pelanggan. Bagian kiri halaman web menunjukkan
kriteria tambahan (ukuran tampilan, sistem operasi, dll.) yang dapat dipilih pelanggan untuk
lebih mempersempit pencarian mereka.
Situs web Amazon menerima informasi dari katalog produknya, yang disimpan dalam database

Dari sudut pandang teknis, database online yang digunakan dengan browser web tidak
berbeda dengan database lainnya. Namun, mereka membutuhkan antarmuka yang dirancang
untuk bekerja dengan web. Pengguna harus melihat formulir untuk memasukkan kueri atau kata
kunci untuk mendapatkan informasi dari database situs. Perancang antarmuka harus
menyediakan mekanisme untuk mengetahui data yang pengguna memasukkan formulir online
sehingga mereka dapat ditempatkan di bidang yang tepat dalam database. Sistem juga
membutuhkan mekanisme untuk melewatkan query dan kata kunci dari pengguna ke database.
Antarmuka dapat diprogram dalam salah satu dari beberapa bahasa pemrograman web, termasuk
Java servlet, halaman server aktif (ASP), ASP.NET (versi proses ASP dalam .NET framework)
dan PHP (Hypertext Preprocessor), serta dengan menggunakan web API (program aplikasi
antarmuka). Aspek teknis dari aplikasi ini berada di luar cakupan buku ini. Itu proses
digambarkan pada Gambar 7.11.

GAMBAR 7.11 Contoh Bagaimana Aktif Teknologi Halaman Server Memungkinkan Kueri Data Dan
Diproses Melalui Web
Untuk memastikan bahwa database produksi mereka tidak rentan terhadap serangan
melalui Internet, organisasi menghindari menghubungkan database transaksi mereka ke Internet
kecuali database didedikasikan untuk transaksi online, dalam hal ini organisasi harus
menerapkan keamanan yang tepat perangkat lunak melalui firewall dan aturan otentikasi. Banyak
database organisasi digunakan untuk online, transaksi berbasis web dan seluler untuk
memastikan semua transaksi diproses dan terpusat dalam satu sumber database. Misalnya, hotel
harus memperbarui reservasi yang sama database terlepas dari apakah itu diproses melalui web,
ponsel pintar, atau sebuah perwakilan layanan pelanggan. Mereka juga harus berhati-hati saat
menghubungkan gudang data (dibahas selanjutnya) ke Internet.

Pergudangan Data
Sebagian besar pengumpulan data dalam bisnis digunakan untuk transaksi dan operasi
sehari-hari: catatan pelanggan dan pembelian mereka serta informasi tentang karyawan, pasien,
dan lainnya pihak untuk pemantauan, penagihan, pembayaran, dan tujuan bisnis atau hukum
lainnya. Itu transaksi tidak bertahan lama di database ini; biasanya hanya beberapa hari atau
minggu. Namun, banyak organisasi telah menemukan bahwa jika mereka mengumpulkan data
transaksi, mereka dapat menggunakannya untuk keputusan manajemen penting, seperti meneliti
tren pasar atau melacak penipuan.
Pengorganisasian dan penyimpanan data untuk tujuan tersebut disebut data warehousing.
Gudang data adalah database besar, biasanya relasional, yang mendukung manajemen
pengambilan keputusan. Data warehouse besar karena berisi data, atau ringkasan data, dari
jutaan transaksi selama bertahun-tahun dan/atau lebih dari transaksi nasional atau global
daripada dari periode pendek atau satu wilayah. Mungkin menyimpan catatan transaksi individu
atau ringkasan transaksi untuk periode yang telah ditentukan, seperti per jam, harian, atau
mingguan. Itu tujuan gudang data adalah untuk memungkinkan manajer menghasilkan laporan
atau menganalisis sejumlah besar arsip data dan membuat keputusan. Pakar pergudangan data
harus terbiasa dengan jenis-jenis analisis bisnis yang akan dilakukan dengan data. Mereka juga
harus mendesain gudang data tabel agar cukup fleksibel untuk modifikasi di tahun-tahun
mendatang, ketika aktivitas bisnis berubah atau ketika informasi yang berbeda harus diekstraksi.
Gudang data tidak menggantikan basis data transaksional, yang diperbarui setiap hari
transaksi seperti penjualan, penagihan, penerimaan kas, dan pengembalian. Sebagai gantinya,
data transaksional disalin ke dalam gudang data, yang merupakan tempat penyimpanan data
terpisah. Arsip besar ini berisi yang berharga informasi untuk organisasi yang mungkin tidak
terlihat dalam jumlah data yang lebih kecil biasanya disimpan dalam database transaksional.
Misalnya, sebuah perusahaan asuransi mungkin menyimpan tabel penjualan polis bulanan;
kemudian dapat melihat tren dalam jenis kebijakan yang disukai pelanggan di umum atau
berdasarkan kelompok umur. Tren semacam itu hanya bermakna jika dikumpulkan dari data
yang dikumpulkan selama beberapa tahun. Data dari database transaksional ditambahkan ke
gudang data di akhir setiap hari kerja, minggu, atau bulan, atau mungkin ditambahkan secara
otomatis segera setelah transaksi dicatat dalam database transaksional. Sementara database
transaksional berisi: data saat ini, yang dibuang setelah beberapa waktu, data di gudang data
terakumulasi dan mungkin mencerminkan aktivitas bisnis selama bertahun-tahun.
Organisasi sering mengatur gudang data mereka sebagai kumpulan data mart, lebih kecil
kumpulan data yang fokus pada subjek atau departemen tertentu. Jika data mart perlu digunakan
sebagai satu gudang data besar, perangkat lunak khusus dapat menyatukan data mart dan
membuatnya muncul sebagai satu gudang data besar.
Dari Basis Data ke Gudang Data
Tidak seperti gudang data, database transaksional biasanya tidak cocok untuk analisis
bisnis karena hanya berisi data terkini, bukan data historis. Seringkali, data dalam database
transaksional adalah juga tersebar dalam sistem yang berbeda di seluruh organisasi. Data yang
sama dapat disimpan berbeda dan dengan nama lain. Misalnya, nama pelanggan mungkin dicatat
dalam kolom disebut Nama dalam satu tabel dan dalam dua kolom Nama Depan dan Nama
Belakang di tabel lain. Perbedaan ini biasanya terjadi ketika sebuah organisasi menggunakan
data dan datanya sendiri pembelian dari organisasi lain, atau jika telah mengembangkan lebih
dari satu database yang berisi data yang sama di bawah label yang berbeda. Ketika manajemen
memutuskan untuk membangun gudang data, Staf TI harus hati-hati mempertimbangkan
perangkat keras, perangkat lunak, dan data yang terlibat dalam upaya tersebut.

Masalah Etika Sosial Setiap Pergerakan Yang Kamu Buat


Meluasnya penggunaan sistem manajemen basis Anda memberikan informasi kepada seseorang.
data digabungkan dengan teknologi web memungkinkan Namun banyak konsumen memberikan informasi
organisasi untuk mengumpulkan, memelihara, dan secara rutin tanpa menyadarinya. Sejumlah besar
menjual sejumlah besar data pribadi pribadi dengan data pribadi dikumpulkan melalui web. Anda
cepat dan murah. Jutaan transaksi kartu kredit terjadi di mungkin bertanya-tanya mengapa halaman rumah
dunia, masing-masing terdiri dari informasi pribadi. begitu banyak situs web meminta Anda untuk
Jutaan pribadi item data dirutekan setiap hari ke database mendaftar dengan mereka. Saat mendaftar, Anda
perusahaan melalui panggilan penjualan dan sering memberikan nama, alamat, dan detail lainnya.
pemeriksaan kredit. Jutaan catatan konsumen Itu situs meminta Anda untuk membuat ID
dikumpulkan dan diperbarui setiap hari di web. Untuk pengguna dan kata sandi. Jika halaman Anda
bisnis, data tersebut merupakan sumber daya yang mengakses berisi data pribadi seperti portofolio
penting. Tetapi untuk individu, seperti kumpulan data investasi Anda, ID pengguna dan kata sandi
yang besar dan cara mereka digunakan mengancam hak melindungi Anda, tetapi jika Anda sedang
asasi manusia: privasi. mengakses berita atau halaman non-pribadi lainnya,
 Di Luar Tangan—Tidak Terkendali. Anda baru saja ID pengguna dan kata sandi benar-benar melayani
menerima surat dari John Doe Investasi. Dalam operator situs. Dari saat Anda masuk ke situs, server
surat itu, presiden memberi tahu Anda bahwa pada dapat mengumpulkan data tentang setiap gerakan
usia Anda, dengan penghasilan yang bagus seperti yang Anda lakukan: halaman mana yang Anda
milik Anda, perusahaan dapat memberi Anda kunjungi dan untuk berapa lama, ikon mana yang
layanan investasi yang inovatif. Bagaimana Anda klik dan dalam urutan apa, dan spanduk iklan
perusahaan tahu tentang keberadaan Anda? Tentang mana yang Anda klik. Dalam banyak kasus,
penghasilan tahunan Anda? Mungkinkah suatu saat organisasi yang mengumpulkan data bahkan tidak
lalu Anda mengajukan permohonan kartu kredit? memiliki situs tersebut. Pemilik situs menyewa
Perusahaan menerima informasi tersebut menjual bisnis seperti DoubleClick, FastClick, dan Avenue
sebagian, atau seluruhnya, kepada John Doe A untuk mengumpulkan data. Saat Anda mengklik
Investasi. Anda sekarang menikmati kartu kredit iklan, informasi itu disalurkan ke salah satu database
Anda, tetapi Anda membayar biaya tersembunyi besar organisasi ini. Apa yang dilakukan perusahaan
untuk itu. dengan basis data? Itu menjual sebagiannya ke
 Web: Sumber Pengumpulan Data. Dalam contoh perusahaan lain, atau dipotong-potong dan
sebelumnya, Anda setidaknya menyadari bahwa memotong informasi untuk membantu target
perusahaan lain pembeli potensial yang termasuk
dalam kelompok demografis tertentu. Dan, tidak, itu mereka menonton dengan teman teman mereka di
tidak repot untuk memberitahu Anda. Sedangkan situs media sosial seperti Facebook. Itu mengubah
perangkat lunak dari perusahaan seperti Undang-Undang Perlindungan Privasi Video
DoubleClick hanya dapat mengidentifikasi (VPPA), yang sebelumnya mencegah pelepasan
komputer atau nomor IP dari mana Anda masuk ke riwayat penayangan pengguna tanpa persetujuan
sebuah situs dan bukan Anda, secara pribadi, tertulis. Pengguna harus memilih untuk ini fitur
informasi tersebut dapat dicocokkan dengan Anda, berbagi, akan diminta untuk mengonfirmasi ulang
secara pribadi, jika Anda juga menggunakan ID dan status keikutsertaan mereka secara otomatis setiap
kata sandi pribadi Anda. Selain cookie web, dua tahun, dan dapat memilih keluar dari fitur
perusahaan juga menggunakan bug web untuk berbagi setiap saat.
melacak pergerakan web kami. Bug web, juga Gelombang baru konsumen muda lebih berteknologi
dikenal sebagai “web beacon” atau “clear GIF”, terlibat daripada orang tua mereka dan ingin dapat
adalah gambar grafis di situs web yang digunakan berbagi apa yang mereka tonton dengan teman-
untuk memantau aktivitas peselancar. Gambar teman. Meskipun tagihan membawa VPPA up to
biasanya tidak terdeteksi karena biasanya terdiri dari speed dengan kemajuan teknologi dari era modern,
satu piksel. Bug tersebut menautkan halaman web pendukung privasi konsumen tidak puas bahwa
ke server web pihak ketiga pesta, seperti RUU itu tidak memasukkan ketentuan untuk
DoubleClick. Sama seperti iklan lain yang muncul memperbarui Undang-Undang Privasi Komunikasi
di halaman yang Anda lihat dari server yang Elektronik tahun 1986 (ECPA). Itu pembaruan akan
berbeda dari situs Anda diakses, bug web berasal mencegah petugas penegak hukum dari mengakses
dari server yang berbeda, server pihak ketiga. Hal email pengguna dan dokumen online tanpa surat
ini terjadi karena aslinya halaman situs berisi kode perintah penggeledahan yang sah. Di bawah ECPA
yang memanggil bug (dengan cara yang sama saat ini, hukumpenegak hukum dapat mengakses file
seperti beberapa iklan) dari server lain. Teknik yang dan komunikasi warga disimpan oleh pihak ketiga
sama adalah digunakan dalam email. Server pihak selama lebih dari 180 hari hanya dengan panggilan.
ketiga memperoleh URL (web alamat) pengguna Terlepas dari kekhawatiran ini, RUU itu disahkan,
serta URL situs dari di mana pengguna melihat didorong oleh pemuda aktif media sosial yang
halaman. Selama bug "ditampilkan" oleh komputer keinginannya untuk berbagi lebih banyak dan lebih
pengguna, server pihak ketiga dapat meminta banyak tentang diri mereka sendiri secara online
informasi sesi dari browser web pengguna. digantikan masalah privasi (Couts, 2012). Tagihan
Informasi sesi termasuk aliran klik dan aktivitas seperti ini juga menerima dukungan dari bisnis yang
lainnya dilakukan oleh pengguna saat mengunjungi ingin memperoleh keuntungan dari informasi yang
situs. dihasilkan oleh konsumen.
 Berbagi Apa yang Kami Tonton. RUU 2012  Kesehatan Online Kami. Mengizinkan staf medis
disahkan oleh A.S. Dewan Perwakilan Rakyat dan apoteker untuk berbagi informasi medis pasien
memungkinkan pengguna situs web seperti Netflix dapat membantu mereka membant kita. Bayangkan
untuk berbagi informasi tentang film dan acara apa terluka dalam perjalanan ribuan mil dari rumahmu.
Kalau dokter yang mengobati bisa langsung sementara banyak dari kita mengeluh bahwa
menerima informasi tentang alergi Anda terhadap database besar ini menambah banyak email sampah
obat-obatan tertentu, itu mungkin menyelamatkan dan spam, informasi yang lebih baik di tangan
hidup Anda. Namun, elektronik apa pun catatan pemasar mungkin benar-benar menyelamatkan
yang berada di database yang terhubung ke publik konsumen dari gangguan seperti itu. Lagi pula,
jaringan berpotensi terkena akses tidak sah oleh komunikasi yang mengganggu itu adalah untuk
orang yang tidak memiliki kebutuhan yang sah produk dan layanan yang tidak Anda butuhkan.
untuk tahu. Undang-Undang Portabilitas dan Dengan informasi yang lebih spesifik, pemasar
Akuntabilitas Asuransi Kesehatan dari 1996 hanya dapat menargetkan individu yang mungkin
(HIPAA) adalah undang-undang federal AS yang tertarik dengan penawaran mereka. Ketika Anda
diberlakukan untuk— di antara tujuan lain— berbelanja, perangkat lunak pelacakan khusus dapat
mengatur bagaimana penyedia layanan kesehatan memberi tahu secara online. Bisnis, setidaknya
dan perusahaan asuransi harus memelihara catatan secara tidak langsung, apa yang tidak Anda sukai
dan mengungkapkan informasi sehingga privasi situs. Hal ini memungkinkan bisnis untuk
pasien tidak dilanggar. Hukum membatasi siapa meningkatkan layanan mereka. Misalnya, banyak
yang mengakses catatan medis Anda. Namun, pengecer online menemukan bahwa proporsi
bahkan ini hukum mengakui ketidakmampuan pembeli meninggalkan belanja virtual mereka
organisasi untuk memastikan pasien pribadi. gerobak sebelum pembelian terakhir. Analisis
Misalnya, Anda dapat meminta dokter Anda untuk dikumpulkan informasi menemukan bahwa
tidak membagikan rekam medis Anda dengan beberapa orang ingin tahu biaya penanganan dan
dokter atau perawat lain di klinik, tetapi mereka pengiriman sebelum dikenakan biaya
tidak harus setuju untuk melakukan apa yang Anda kartu kredit mereka. Sekarang, sebagian besar
minta. pengecer online memberikan kejelasan informasi
 Terbalik. Terlepas dari kelemahan pengumpulan pengiriman dan biaya di muka.
data pribadi, ada juga sisi positifnya. Teknologi  Kelemahannya. Potensi manfaat dari medis online
database memungkinkan perusahaan untuk catatan juga bisa menciptakan beberapa tantangan.
menyediakan kami dengan lebih baik dan lebih Privasi, keamanan, dan akses informasi rekam
cepat jasa. Ini juga membuat pasar lebih kompetitif. medis merupakan perhatian utama bagi konsumen
Kecil perusahaan sering tidak mampu membayar dan penyedia layanan kesehatan. Namun, beberapa
biaya pengumpulan data yang besar. Dengan lebih tantangan tambahan perlu dipertimbangkan dan
sedikit uang, mereka dapat membeli data yang ditangani seperti kegunaan data, fragmentasi dan
diurutkan data yang sama yang tersedia untuk kepemilikan (Anonim, 2013a). Sementara beberapa
pemimpin industri. Jadi, ketersediaan data yang luas industri telah mencapai kemajuan yang signifikan
berkontribusi pada lingkungan bisnis yang lebih dengan adopsi teknologi, perawatan kesehatan
egaliter dan demokratis. Penerima manfaat tidak terutama berbasis kertas
hanya vendor tetapi juga konsumen, yang dapat sistem. Selain itu, fragmentasi sumber data dapat
membeli produk baru dan lebih murah. Dan menyebabkan pembagian data terhambat,
mengganggu manfaat berbagi informasi untuk Pada saat buku teks ini dicetak, diskusi, publik
diagnosis. Terakhir, penggunaan tablet dapat pengawasan, dan penyelidikan legislatif ke dalam
memberikan pengiriman informasi medis portabel di transfer data dari perusahaan telekomunikasi dan
rumah sakit dan perkantoran. Namun, popularitas penyimpanan oleh federal AS instansi pemerintah
"membawa” perangkat Anda sendiri” oleh telah menjadi topik yang signifikan perdebatan.
profesional perawata kesehatan dapat berpose risiko Akan menarik untuk melihat perubahannya, jika
keamanan dan pelanggaran privasi (Yudkin, 2012). ada, itu terjadi di masa depan.

Semakin besar gudang data, semakin besar kapasitas penyimpanan, semakin besar memori,
dan semakin besar daya pemrosesan komputer yang dibutuhkan. Karena kebutuhan kapasitas,
organisasi sering memilih komputer mainframe dengan banyak CPU untuk menyimpan dan
mengelola data gudang. Memori komputer harus cukup besar untuk memungkinkan pemrosesan
dalam jumlah besar dari data sekaligus. Jumlah ruang penyimpanan dan kecepatan akses disk
juga penting. Memproses jutaan catatan mungkin memakan waktu lama, dan variasi dalam
kecepatan disk mungkin berarti perbedaan antara jam atau menit dalam waktu pemrosesan. Dan
karena gudang data adalah dianggap sebagai aset yang sangat berharga, semua data harus
dicadangkan secara otomatis. Ingatlah bahwa gudang data tumbuh terus menerus, karena
tujuannya adalah untuk mengumpulkan catatan sejarah.
Jaringan ritel seperti Wal-Mart dan Costco mencatat jutaan transaksi penjualan setiap hari,
semuanya yang disalurkan ke gudang data. Beberapa memiliki gudang data yang menampung
puluhan atau ratusan terabyte data. Selain pengecer, bank, penerbit kartu kredit, layanan
kesehatan organisasi, dan industri lain telah menambah perangkat keras mereka untuk gudang
data besar. Banyak organisasi mengumpulkan tidak hanya transaksi penjualan tetapi juga catatan
pembelian, sehingga mereka dapat menghasilkan informasi untuk membuat keputusan pembelian
yang lebih baik, seperti pemasok cenderung menawarkan harga yang lebih rendah untuk barang-
barang tertentu pada waktu-waktu tertentu dalam setahun. Gudang data mendapatkan perhatian
dan popularitas yang luar biasa di kalangan bisnis. Itu kehausan untuk menyimpan dan
menganalisis data telah menjadi hampir tak terpadamkan, sebagai gudang data menjadi penting
untuk kegiatan strategis dan operasional dari banyak kegiatan organisasi dan fungsi. Sebuah
survei terhadap 421 manajer data yang berafiliasi dengan Oracle Users Group menentukan
bahwa 66 persen perusahaan menggunakan gudang data sebagai dasar untuk intelijen bisnis dan
analitik. Namun, sebagian besar sistem dikembangkan sendiri dan hanya digunakan oleh analis
dan top pembuat keputusan. Misalnya, hanya 33 persen perusahaan responden yang
mengaktifkan akses untuk personel pemasaran dan penjualan, yang tidak sepenuhnya
memanfaatkan gudang data untuk fungsi bisnis. Meskipun sebagian besar konten gudang data
adalah data transaksional, keragaman data berkembang menjadi data tidak terstruktur pada
tingkat yang meningkat. Gambar 7.12 mengilustrasikan proporsi perwakilan tipe data yang
disimpan di gudang data (McKendrick, 2011). Ketika data transaksional masih merupakan
persentase terbesar dari gudang data, data non-tradisional jenis seperti video dan gambar
semakin berkembang.
GAMBAR 7.12 Tipe Data Dalam Sebuah Data Gudang

TITIK MINAT Lebih Murah Lebih Cepat Lebih Baik


Banyak organisasi bisnis telah memutuskan untuk menerapkan strategi analitik,
terkadang dimulai dengan menurunkan kemampuan awal. Untuk menerapkan kemampuan
analitis ini, beberapa bisnis memilih untuk: pendekatan baru Cloud. Sementara beberapa orang
berpikir bahwa teknologi ini baru, seringkali teknologi itu sebuah "remake" dari sesuatu dari
inisiatif teknologi sebelumnya. Akses jarak jauh ke perangkat lunak aplikasi, platform, data, dan
infrastruktur teknologi telah ada sejak tahun 1970-an. Dengan mengoperasikan analitik data di
Cloud, bisnis dapat mengelola dan memperbarui aplikasi ini oleh pihak ketiga. Awan juga bisa
digunakan untuk mengimplementasikan proyek percontohan dengan biaya yang efektif sambil
menguji manfaat dan tantangannya. Amazon Web Services (AWS) memperluas penawaran
layanan mereka pada akhir 2012 dengan merilis Amazon Redshift, layanan pergudangan berbasis
cloud. Pergeseran merah mengurangi biaya penyimpanan data dari antara $19.000 dan $25.000
hingga hanya $1.000 per terabyte per tahun dan menjanjikan kinerja kueri hingga sepuluh kali
lipat lebih cepat daripada pergudangan data on-premise konvensional. Amazon menjanjikan
layanan terkelolanya akan tetap aktif atas pembaruan, penyetelan, dan tambalan. Redshift
berbeda dari layanan penyimpanan berbasis cloud AWS lainnya, Amazon Relational Database
Service (RDS), karena Redshift secara eksklusif untuk pergudangan dan analitik, bukan
penggunaan database transaksional. Selain itu, Redshift juga mampu menangani Big Data. Sifat
layanan yang mengganggu dikombinasikan dengan peningkatan besar dalam biaya dan kinerja
dibandingkan dengan layanan sebelumnya banyak menarik perhatian dari sektor bisnis/teknologi.
Jika bisnis dapat mengalihdayakan pergudangan data dan menghemat waktu dan uang, mereka
dapat mengalokasikan kembali sumber daya tersebut untuk menambah nilai lini bisnis utama
mereka.
Data dari mana gudang data dibangun biasanya berasal dari dalam suatu organisasi,
terutama dari transaksi, tetapi juga dapat berasal dari luar organisasi. Yang terakhir mungkin
termasuk data demografi nasional atau regional, data dari pasar keuangan, dan data cuaca. Mirip
dengan metadata di database apa pun, perancang gudang data membuat metadata untuk ukuran
besar mereka kumpulan data. Untuk mengungkap informasi berharga yang terkandung dalam
data mereka, organisasi harus menggunakan perangkat lunak yang secara efektif dapat
"menambang" gudang data. Data mining tercakup dalam Bab 11, “Kecerdasan Bisnis dan
Manajemen Pengetahuan.” Desainer harus mengingat skalabilitas: kemampuan gudang data
untuk tumbuh sebaga jumlah data dan kebutuhan pemrosesan bertambah. Kebutuhan
pertumbuhan di masa depan membutuhkan pemikiran yang matang perencanaan baik dari segi
perangkat keras maupun perangkat lunak.

Fase dalam Data Warehousing


Tiga fase yang terlibat dalam mentransfer data dari database transaksional ke gudang
data: ekstraksi, transformasi, dan pemuatan (ETL). Gambar 7.13 menjelaskan prosesnya.
Pada fase ekstraksi, pembuat membuat file dari database transaksional dan
menyimpannya mereka di server yang menyimpan data warehouse. Pada fase transformasi,
spesialis "membersihkan" data dan memodifikasinya menjadi bentuk yang memungkinkan
penyisipan ke dalam gudang data. Untuk misalnya, mereka memastikan apakah data
mengandung kesalahan ejaan dan memperbaikinya. Mereka membuat yakin bahwa semua data
konsisten. Misalnya, Pennsylvania mungkin dilambangkan sebagai Pa., PA, Penna, atau
Pensylvania. Hanya satu formulir yang akan digunakan di gudang data. Pembangun memastikan
bahwa semua alamat mengikuti bentuk yang sama, menggunakan huruf besar atau kecil secara
konsisten dan mendefinisikan bidang secara seragam (seperti satu bidang untuk seluruh alamat
jalan dan bidang terpisah untuk kode pos).
Semua data yang menyatakan jenis besaran yang sama "dibersihkan" untuk menggunakan
yang sama unit pengukuran. Pada fase pemuatan, spesialis mentransfer file yang diubah ke
gudang data. Mereka kemudian membandingkan data di gudang data dengan data asli untuk
mengonfirmasi kelengkapan. Seperti halnya basis data apa pun, metadata membantu pengguna
mengetahui apa yang dapat mereka temukan dan menganalisis di gudang data.
Gudang data yang dibangun dengan benar adalah sumber tunggal untuk semua data yang
diperlukan untuk analisis. Dia dapat diakses oleh lebih banyak pengguna daripada basis data
transaksional (yang aksesnya hanya terbatas pada mereka) yang mencatat transaksi dan beberapa
manajer) dan menyediakan tempat “one-stop shopping” untuk data. Faktanya, bukan hal yang
aneh jika gudang data memiliki tabel besar dengan lima puluh atau lebih bidang (atribut).
Sebagian besar aktivitas ETL dapat diotomatisasi. Tergantung pada kebutuhan
penggunanya, struktur dan isi dari data warehouse dapat berubah sewaktu-waktu. Teknik seperti
penambangan data dan pemrosesan analitik online (OLAP) dapat digunakan untuk
mengeksploitasinya. Manajer bisa kemudian ekstrak intelijen bisnis untuk pengambilan
keputusan yang lebih baik

GAMBAR 7.13 Tahapan Dalam Mempersiapkan Dan Menggunakan Gudang Data


Data Warehousing dan Big Data
Data warehousing telah menjadi unsur penting dalam tren menuju Big Data, khususnya
data dikumpulkan tentang dan dari individu. Meskipun ada banyak definisi Big Data, benang
merahnya adalah bahwa Big Data adalah pembesaran atau perluasan dari jumlah, jenis, dan
tingkat detail data yang dikumpulkan dan disimpan. Big Data melibatkan volume data yang
tinggi dikompilasi dari tradisional, kegiatan bisnis biasa, serta sumber-sumber nontradisional
yang lebih baru.
Dengan Big Data, alih-alih mengandalkan data agregat untuk mengisi gudang data,
datanya disimpan pada tingkat yang jauh lebih terperinci: dari transaksi terperinci yang diterima
dari titik penjualan (POS) terminal, anjungan tunai mandiri (ATM), halaman web, dan telepon
seluler. Sebagai contoh, setiap kali Anda membeli bahan makanan, Big Data akan mewakili
informasi tentang item yang Anda dibeli: apa yang Anda beli (sup kalengan, apel, keju, susu,
dll.), merek apa, berapa harganya harga, dan dalam jumlah berapa. Jadi, daripada satu ringkasan
transaksi yang mencatat total membayar belanjaan Anda, Big Data mungkin akan merekam
ratusan titik data yang lebih detail.
Sangat mudah untuk melihat bagaimana ini akan menciptakan "ledakan informasi" dan
perlu diperluas kemampuan gudang data. Big Data juga mencakup data yang dikumpulkan dari
sumber nontradisional seperti media sosial. Sebagai dibahas sebelumnya, pengumpulan data
tidak terstruktur di gudang data telah meledak beberapa tahun terakhir. Namun, kurangnya
struktur dan format data tradisional dapat membuat data menjadi tantangan untuk dianalisis.
Misalnya, data tekstual dari umpan Twitter akan hampir tidak mungkin untuk menganalisis pola
dan tren menggunakan statistik tradisional dan kueri basis data peralatan. Analisis sentimen
adalah metode penambangan data yang menggunakan kombinasi bahasa alami pemrosesan,
linguistik komputasi, dan analitik teks untuk mengidentifikasi dan mengekstrak subyektif
informasi dalam bahan sumber (Anonim, 2013b). Hal ini terutama digunakan untuk
mengekstraksi sikap, opini, dan emosi yang terkandung dalam data berbasis teks, khususnya dari
web. Sentimen analisis dapat digunakan untuk menganalisis data dari akun bisnis Twitter untuk
memahami caranya perasaan konsumen tentang produk, layanan pelanggan, atau merek mereka.
Agregat, atau ringkasan, data dapat memberikan wawasan tentang banyak pertanyaan
yang diajukan oleh bisnis manajemen dan profesional. Namun, perspektif yang intens dan
terperinci hanya dapat diperoleh dengan informasi transaksi granular yang disusun dari sumber
aktivitas bisnis. Sementara volume data yang tipis mungkin menakutkan, ini memungkinkan
kedalaman yang jauh lebih besar analisis. Perusahaan produk konsumen akan dapat memahami
tautan, jika ada, untuk pelanggan yang membeli dua atau lebih lini produk dan informasi profil
(pendapatan, jenis kelamin, ukuran rumah tangga, dll). Tanpa data terperinci tentang pembelian
mereka, tidak mungkin untuk mengumpulkan informasi yang diperlukan untuk menyelesaikan
analisis dan menentukan hubungan ini. Untuk contoh, dengan menggunakan analisis sentimen,
perusahaan produk konsumen dapat menentukan jumlah tweet yang dikategorikan sebagai positif
atau negatif tentang produk atau layanan tertentu. Itu Ringkasan nilai dari analisis ini dapat
memberikan wawasan tentang sikap konsumen dari waktu ke waktu untuk produk. Data mining,
OLAP, dan intelijen bisnis dibahas di Bab 11, “Bisnis Manajemen Intelijen dan Pengetahuan.”

Ringkasan
 Dalam operasi sehari-hari mereka, informasi itu. Fungsi-fungsi ini adalah
organisasi dapat mengumpulkan sejumlah kekuatannya database: kumpulan data yang
besar data. Data ini adalah bahan baku saling terkait yang, dalam suatu organisasi
untuk informasi yang sangat berharga, dan kadang-kadang antara organisasi,
tetapi data tidak berguna tanpa alat untuk digunakan bersama oleh banyak unit dan
mengaturnya, simpan di tempat yang berkontribusi pada produktivitas dan
mudah cara yang dapat diakses, dan efisiensi.
memanipulasinya untuk menghasilkan
 Pendekatan database memiliki beberapa relasional model, yang digunakan untuk
keuntungan melalui pendekatan file yang membangun sebagian besar database baru,
lebih tradisional: lebih sedikit data meskipun database berorientasi objek
redundansi, independensi aplikasi-data, dan semakin meningkat kepopuleran. Beberapa
kemungkinan integritas data yang lebih vendor menawarkan DBMS yang
besar. mengakomodasi kombinasi model
 Bagian terkecil dari data yang dikumpulkan relasional dan berorientasi objek, yang
tentang suatu entitas adalah karakter. disebut objek-relasional.
Beberapa karakter membentuk bidang.  Tautan antar entitas dalam database
Beberapa bidang membuat rekor. Sebuah relasional dipertahankan dengan
koleksi dari catatan terkait adalah file, atau menggunakan bidang kunci. Utama kunci
dalam model relasional, a meja. Basis data adalah pengidentifikasi unik. Kunci
biasanya berisi beberapa file, tetapi komposit adalah kombinasi dari dua atau
pendekatan database dapat diterapkan pada lebih bidang yang digunakan sebagai kunci
satu file. utama. Kunci asing menghubungkan satu
 Sistem manajemen basis data (DBMS) tabel ke lain di dalam database.
adalah perangkat lunak yang  Dalam database berorientasi objek,
memungkinkan kita membangun basis data, kumpulan data, bersama dengan prosedur
mengisi mereka dengan data, dan yang memprosesnya, adalah
memanipulasi data. Kebanyakan DBMS objek.Hubungan antara satu set data dan
datang dengan bahasa pemrograman yang lain didirikan oleh satu objek yang
dapat digunakan untuk mengembangkan mengandung yang lain, bukan dengan
aplikasi yang memfasilitasi query dan kunci asing. SQL telah diadopsi sebagai
menghasilkan laporan. DBMS juga standar internasional bahasa untuk query
merupakan bagian utama dari aplikasi database relasional. SQL pernyataan juga
perusahaan. dapat disematkan dalam kode yaitu
 Model database adalah struktur logika diproduksi menggunakan banyak bahasa
umum dari catatan dalam database. pemrograman.
Berbagai model database adalah: hierarkis,  Untuk membangun database, seorang
jaringan, relasional, dan berorientasi objek. desainer pertama-tama membangun skema
Model yang paling populer adalah model dan menyiapkan metadata, yaitu informasi
tentang data yang akan disimpan dalam  Dalam setiap penambahan data dari
database. database transaksional ke gudang data, data
 Untuk merencanakan database, desainer diekstraksi, diubah, dan dimuat, suatu
melakukan pemodelan data. Sebelum proses yang dikenal dengan singkatan,
mereka mendesain database, mereka ETL.
membuat diagram hubungan entitas, yang  Harga rendah dari database yang efisien
menunjukkan tabel diperlukan untuk setiap dan efektif perangkat lunak memperburuk
entitas data dan atribut (bidang) yang harus masalah sosial dari Era Informasi:
dipegangnya, serta hubungannya antar pelanggaran privasi. Karena setiap
tabel. Kemudian mereka dapat melanjutkan transaksi individu dapat dengan mudah
untuk membangun skema, yang merupakan direkam dan kemudian digabungkan
struktur dari semua merekam struktur dengan pribadi lainnya data, tidak mahal
entitas, dan hubungan di antara mereka. untuk menghasilkan berkas besar pada
 Banyak database yang terhubung ke web. konsumen individu. Ini menimbulkan
Ini pengaturan membutuhkan perangkat ancaman terhadap privasi. Namun,
lunak server web, seperti: sebagai Halaman organisasi komersial bersikeras bahwa
Server Aktif dan servlet Java, yang mereka membutuhkan informasi pribadi
memungkinkan pengguna untuk untuk ditingkatkan produk dan layanan
memasukkan kueri atau memperbarui basis mereka dan untuk menargetkan pemasaran
data Melalui internet. mereka hanya untuk konsumen yang
 Gudang data adalah koleksi besar sejarah tertarik.
transaksi disalin dari database  Big Data, pengumpulan dan penyimpanan
transaksional, sering bersama dengan data lebih banyak lagi jumlah data yang rinci,
lain dari sumber luar. Manajer telah mengubah teknik pengumpulan dan
menggunakan perangkat lunak untuk analisis data. Big Data juga menciptakan
mengumpulkan informasi yang berguna pola pikir baru dengan menggunakan data
dari gudang data untuk mendukung nontradisional sumber, seperti media sosial,
pengambilan keputusan mereka. Beberapa untuk melihat tren, sikap, dan pola
gudang data dibuat dari beberapa data mart, konsumen dan umumnya publik
masing-masing berfokus pada unit
organisasi atau subjek.

Anda mungkin juga menyukai