Anda di halaman 1dari 34

Diterjemahkan dari bahasa Inggris ke bahasa Indonesia - www.onlinedoctranslator.

com

BAB 13

Data dan Basis Data

Kebutuhan Pengumpulan
TUJUAN BELAJAR
Bab ini akan membantu Anda
dan Penyimpanan Data
memperoleh pemahaman tentang (Tujuan Studi 1)
konsep-konsep berikut:
1. Kebutuhan akan pengumpulan dan Contoh Dunia Nyata pada halaman berikutnya akan membantu Anda
penyimpanan data memahami konteks dari banyak konsep yang dibahas dalam bab ini.
Silakan baca contoh Dunia Nyata untuk memulai membaca dan
2. Metode penyimpanan data dan
mempelajari bab ini secara efektif.
hubungan timbal balik antara
Setiap hari bisnis beroperasi, mungkin ada ratusan atau ribuan
penyimpanan dan pemrosesan
transaksi dengan pelanggan dan vendor. Setiap transaksi ini menghasilkan
3. Perbedaan antara pemrosesan data yang harus diproses untuk memenuhi pesanan pelanggan dan
batch dan waktu nyata membeli inventaris dan persediaan.Data adalah kumpulan fakta yang
pengolahan dikumpulkan dari transaksi, sedangkan informasi adalah interpretasi dari
4. Pentingnya database dan data yang telah diproses. Misalnya, untuk memproses penjualan ke
perkembangan historis dari pelanggan, bisnis harus mengumpulkan banyak item data dari pelanggan
database flat-file ke seperti nama, alamat, nomor kartu kredit, barang yang dipesan, dan
database relasional alamat pengiriman. Pengumpulan data dari seluruh transaksi yang terjadi

5. Kebutuhan akan normalisasi merepresentasikan data dalam jumlah besar. Ini mungkin lebih jelas ketika

data dalam database relasional Anda memikirkan volume penjualan yang terjadi di perusahaan besar
seperti Amazon, LL Bean, Lands' End, J.Crew, dan Walmart, seperti yang
6. Gudang data dan penggunaan
disajikan dalam contoh Dunia Nyata di halaman berikutnya. Demikian pula,
gudang data untuk
setiap pembelian inventaris atau persediaan melibatkan pengumpulan dan
menganalisis data
pemrosesan sejumlah besar data. Hal ini diperlukan untuk mengumpulkan
7. Penggunaan OLAP dan data dan mengolah data ini sehingga dapat diterjemahkan menjadi informasi
mining sebagai alat analisis yang berguna bagi bisnis. Beberapa menggambarkan data yang luas ini
8. Database terdistribusi dan sebagai Big Data dan proses menjadikan Big Data bermakna sebagai
keuntungan penggunaan Analisis Data atau Analisis Data. Bab-bab sebelumnya menjelaskan sistem
data terdistribusi informasi akuntansi yang menangkap dan memproses data dalam jumlah

9. Database berbasis cloud besar ini. Namun, bab-bab tersebut tidak menjelaskan secara rinci
mengenai penyimpanan, pengambilan, dan penggunaan data ini.
10. Data Besar dan analitik data
11. Kontrol untuk data dan database
12. Masalah etika yang terkait dengan Data yang dikumpulkan dalam transaksi apa pun harus disimpan karena
pengumpulan dan penyimpanan data, dan berbagai alasan, seperti yang tercantum di bawah ini:
penggunaannya dalam sistem TI
1. Untuk menyelesaikan transaksi dari awal hingga akhir, data
rinci harus tersedia mengenai setiap langkah transaksi.
468
Kebutuhan Pengumpulan dan Penyimpanan Data (Tujuan Studi 1) 469

Dunia nyata
Yang lebih luar biasa adalah volume transaksi
penjualan yang diproses oleh Walmart pada hari
tertentu. Selain penjualan berbasis Web,
pertimbangkan ribuan pusat ritel Walmart dengan
beberapa jalur check-out di setiap lokasi dan jam
operasional yang panjang. Pertimbangkan jumlah
akuntan dan komputer yang mungkin diperlukan
untuk mengelola semua catatan terkait. Tidak heran
jika Walmart memiliki salah satu database terbesar
dari organisasi bisnis mana pun di dunia.
©Suprijono Suharjoto/iStockphoto
Basis data Walmart terus berkembang dengan transaksi baru.
Pikirkan tentang volume transaksi penjualan yang Beberapa memperkirakan bahwa Walmart menambahkan 1
terjadi di situs web pengecer Internet besar seperti miliar baris data per hari. Perusahaan menempelkan chip RFID ke
Amazon, LL Bean, Lands' End, dan J.Crew. barang dagangan sehingga pembelian inventaris, perpindahan
Diperkirakan bahwa setiap perusahaan ini memproses ke toko, dan penjualan dilacak secara real time. Karena data
lebih dari 120.000 transaksi setiap hari di situs web untuk peristiwa ini ditambahkan ke database dengan sangat
mereka. Untuk setiap cepat, database tumbuh dan menjadi lebih berguna untuk
transaksi, data penting harus dikumpulkan tentang analisis segera. Hal ini memungkinkan Walmart untuk
pelanggan, lokasi, pembayaran, dan barang yang menganalisis dan memperkirakan kebutuhan inventaris dengan
dijual. lebih cepat.

Untuk penjualan, ini mungkin melibatkan menerima pesanan, menarik barang dari
gudang, mengirim barang, menagih pelanggan, menerima uang tunai, dan
memperbarui akun pelanggan untuk penjualan dan penagihan. Misalnya, karyawan
gudang tidak akan tahu barang mana yang harus ditarik dari rak gudang untuk dikirim
ke pelanggan jika mereka tidak dapat melihat catatan barang yang dipesan.
2. Untuk menindaklanjuti dengan pelanggan atau vendor dan untuk mempercepat
transaksi di masa depan. Misalnya, jika perusahaan menyimpan nama, alamat,
dan detail lainnya tentang pelanggannya, detail tersebut tidak perlu
dimasukkan kembali saat pelanggan melakukan pemesanan di masa
mendatang. Banyak perusahaan telah menambahkan fungsionalitas
Manajemen Hubungan Pelanggan (CRM) untuk melacak informasi pelanggan,
tren pembelian, dan perilaku konsumen. Sistem CRM juga dapat menargetkan
pelanggan potensial untuk mempromosikan spesial atau produk yang dapat
memenuhi minat pelanggan tertentu. Misalnya, jika Amazon memiliki sistem
CRM dan Anda membeli persediaan kolam renang dari Amazon, Amazon akan
mengidentifikasi Anda sebagai pemilik kolam renang atau seseorang yang
tertarik untuk membeli persediaan kolam renang di masa mendatang.

3. Untuk membuat laporan akuntansi dan laporan keuangan. Tanpa data yang
mendasari untuk setiap transaksi, tidak mungkin bagi sistem untuk menyediakan
informasi tentang aset, kewajiban, pendapatan, dan pengeluaran untuk setiap
periode akuntansi.
4. Memberikan umpan balik kepada manajemen agar perusahaan dapat beroperasi
seefektif dan seefisien mungkin.
470 Bab 13 Data dan Basis Data

Data yang dikumpulkan dari transaksi berupa data terstruktur. Data terstrukturmudah masuk
ke dalam baris dan kolom. Kolom-kolom ini biasanya merupakan bidang dengan panjang tetap.
Contohnya adalah 10 digit untuk nomor telepon. Nama pelanggan, nomor kartu kredit, dan
jumlah penjualan total dolar adalah contoh lain dari data yang mudah dimasukkan ke dalam
baris dan kolom. Perusahaan juga mengumpulkan data tidak terstruktur.Data tidak
terstruktur tidak mudah masuk ke dalam baris dan kolom dengan panjang tetap. Contoh data
tidak terstruktur adalah teks bentuk bebas dari ulasan online pelanggan tentang suatu produk.
Karena data akuntansi terutama adalah data terstruktur, sisa bab ini menjelaskan teknik
penyimpanan dan pemrosesan yang umum digunakan dalam organisasi untuk mengelola
kumpulan data terstruktur yang dihasilkan dari transaksi mereka. Topik yang dijelaskan dalam
bab ini meliputi:

1. Jenis media penyimpanan untuk data: akses sekuensial dan acak


2. Metode pengolahan data: batch dan real time
3. Database dan database relasional
4. Gudang data, penambangan data, dan OLAP
5. Pemrosesan data terdistribusi dan database terdistribusi

Setelah mempelajari bab ini, Anda harus memiliki pemahaman tentang bagaimana data diproses dan
disimpan, bagaimana data tersebut digunakan untuk pemrosesan dan pertanyaan, dan pertimbangan apa
yang berkaitan dengan lokasi fisik pemrosesan dan penyimpanan data. Ada banyak detail dan konsep di
masing-masing bidang ini, dan bab ini hanya memberikan gambaran umum dari masing-masing bidang ini.
Namun, ini akan memberi Anda, seorang akuntan, pemahaman umum yang Anda butuhkan untuk
menggunakan, mengaudit, dan membantu dalam desain sistem TI. Selain itu, masalah etika yang terkait
dengan data dan kontrol atas data dibahas dalam bab ini.

Menyimpan dan Mengakses


Data (Tujuan Studi 2)
Penyimpanan data dan cara data digunakan sangat terkait satu sama lain. Untuk memahami konsep ini,
mungkin berguna untuk memikirkan bagaimana Anda menyimpan dan menggunakan barang-barang dalam
kehidupan pribadi Anda. Hal-hal yang perlu Anda temukan dan gunakan sering ditempatkan di tempat yang
dapat Anda ambil dan pergi dengan mudah. Misalnya, Anda sering membutuhkan kunci mobil, dan biasanya
Anda tidak punya waktu untuk mencarinya. Jadi, Anda mungkin memiliki kebiasaan menyimpan kunci di
tempat yang praktis di rumah agar mudah didapat dan digunakan. Dengan kata lain, kebutuhan untuk
mengakses dan menggunakan kunci dengan cepat telah membuat Anda menyimpannya dengan cara yang
memudahkan untuk menemukan dan menggunakannya. Di sisi lain, Anda memiliki barang yang lebih jarang
Anda butuhkan. Misalnya, Anda mungkin telah menyimpan buku akuntansi dari kelas sebelumnya jika Anda
membutuhkannya untuk referensi. Karena Anda mungkin tidak akan sering merujuknya, buku Anda dapat
diletakkan di tempat yang kurang terjangkau, seperti di rak lemari. Seperti yang Anda ketahui, ada batasan
berapa banyak yang dapat Anda simpan di lokasi yang mudah diakses. Oleh karena itu, beberapa barang,
seperti buku akuntansi lama Anda, harus diletakkan di tempat yang kurang terjangkau.

Contoh kehidupan pribadi ini membawa kita pada konsep penting tentang penyimpanan dan
penggunaan data. Data yang akan dibutuhkan dengan cepat dan sering harus disimpan dengan cara
yang memungkinkan akses yang sering dan cepat. Kebalikannya juga benar: Data yang disimpan
dengan cara yang memungkinkan akses yang sering dan cepat mudah diakses dan digunakan.
Sebaliknya, data yang dibutuhkan lebih jarang atau kurang cepat dapat disimpan dengan cara yang
tidak memungkinkan akses yang sering atau cepat. Prinsip umum dari hubungan antara penggunaan
data yang dimaksudkan dan metode penyimpanan adalah kunci untuk konsep yang mendasari dalam
bab ini.
Menyimpan dan Mengakses Data (Tujuan Studi 2) 471

Terminologi Penyimpanan Data

Terminologi yang digunakan dalam penyimpanan data harus dikuasai terlebih dahulu agar Anda
dapat memahami penyimpanan dan penggunaan data dalam sistem TI dengan benar. Hirarki khas
data adalah karakter, bidang, catatan, file, dan database. Akarakter, atau byte, adalah satu huruf,
angka, atau simbol. Abidang adalah sekumpulan karakter yang mengisi ruang yang disediakan untuk
jenis data tertentu. Misalnya, nama belakang, alamat, dan tanggal perekrutan adalah semua bidang
dalam kumpulan data penggajian. Bidang dapat dianggap sebagai kolom data dalam tabel. Satu set
bidang terkait membuat catatan. Acatatan adalah seluruh rangkaian bidang untuk entitas tertentu.
Misalnya, setiap karyawan harus memiliki catatan dalam sistem penggajian. Setiap catatan karyawan
mencakup bidang-bidang seperti nama belakang, alamat, dan tanggal perekrutan. Seluruh rangkaian
catatan terkait adalahmengajukan. Tampilan 13‑1 menunjukkan konsep lapangan, catatan, dan file.

Seluruh kumpulan file adalah basis data. Misalnya, file penggajian, file piutang,
file inventaris, dan semua file lain dalam sistem TI membentuk database.

Media Penyimpanan Data

Media tempat data disimpan telah berkembang dan meningkat selama bertahun-tahun, dengan cara
yang sama seperti kecepatan dan kekuatan komputer yang telah berkembang dan meningkat. Pada
hari-hari awal komputer mainframe, data disimpan pada pita magnetik.Pita magnetik adalah media
penyimpanan yang memungkinkan hanya jenis penyimpanan akses sekuensial.Akses berurutan
artinya data disimpan secara berurutan atau kronologis. Penyimpanan berurutan ini dapat dianggap
dengan cara yang sama seperti musik yang dulu disimpan pada kaset. Jika musik ada di kaset, itu
harus diputar sesuai urutan rekamannya. Menggunakan kaset membuat lebih sulit untuk
mendengarkan lagu dalam urutan apa pun selain urutan pada kaset. Demikian juga, pita magnetik
menyimpan data dalam urutan berurutan, dan data harus dibaca dalam urutan itu. Untuk membaca
record 10, sistem harus membaca record 1–9 terlebih dahulu. Ini adalah jenis penyimpanan yang
sangat terbatas karena sulit dan memakan waktu untuk mengakses, membaca, atau memodifikasi
catatan tertentu. Seluruh rekaman harus dibaca secara berurutan untuk menemukan rekaman
tunggal itu.
Pita magnetik media penyimpanan data tidak akan bekerja dengan baik di sistem TI modern.
Seperti yang dijelaskan di bagian sebelumnya dari bab ini, pemrosesan data dan metode
penyimpanan saling terkait. Menyimpan catatan dalam urutan berurutan mencegah akses
cepat dan mudah dari satu catatan. Dalam organisasi saat ini, sebagian besar data harus
disimpan dengan cara yang memungkinkan satu record dapat diakses dengan cepat. Untuk

Bidang Nama Belakang EmpID Nama Depan Judul Tanggal perekrutan Alamat Kota Negara Kode Pos

101 Labbe John Perwakilan Penjualan 28/02/99 9065 Jalan Arlington Cincinnati OH 45238
102 mengerikan Andrew Akuntan 03/05/98 312 Produksi Dr Dayton OH 45239
Catatan 103 bejana Mitchell Manajer keuangan 04/08/01 1062 Whirlway Dr aurora DI DALAM 45226
104 lebih baik Margaret Staf Akuntan 1 21/02/97 919 New Haven Road Cincinnati OH 45248
105 Buckhalter Nancy Spesialis Pemeliharaan 09/07/98 8595 Stonebridge Dr Florence KY 41042–3563
106 Singh Ravi Staf Akuntan 2 27/10/01 677 Ridge Ave Cincinnati OH 45241
107 Klinger Robert Staf Akuntan 2 09/30/01 1605 Deercroft Court Harrison OH 45030–2009
108 Courdell Anne koordinator HR 21/07/02 8425 North Bend Rd Cincinnati OH 45242–3706
109 sampson jessica Perwakilan Penjualan 09/06/99 617 Gembala Dr Villa Hills KY 41017

Mengajukan

PAMERAN 13-1 Hirarki Data


472 Bab 13 Data dan Basis Data

Misalnya, untuk memproses pesanan pelanggan, penting untuk mengakses catatan pelanggan
tertentu tanpa harus mengakses semua catatan pelanggan. Ketika satu record harus dengan
mudah dan cepat diakses dari sebuah file, akses acak (bukan akses berurutan) diperlukan.Akses
acak artinya setiap item data pada media penyimpanan dapat langsung diakses tanpa
membaca secara berurutan. Oleh karena itu, akses acak sering disebut sebagai akses langsung.
Akses acak, atau langsung, mirip dengan cara musik disimpan di pemutar MP3. Meskipun
tampaknya ada beberapa urutan penyimpanan lagu, mereka sebenarnya dapat dimainkan
dalam urutan apa pun. Jika Anda memilih untuk memutar hanya satu lagu dari pemutar MP3,
pemutar MP3 Anda dapat dengan cepat menemukan, mengakses, dan memutar lagu tersebut.
Demikian juga, media akses acak akan memungkinkan satu item data untuk diakses atau
dimodifikasi tanpa membaca data secara berurutan.Penyimpanan diskadalah contoh media
akses acak. Sejumlah besar sistem TI menggunakan penyimpanan disk. Inipenyimpanan akses
langsung jauh lebih fleksibel karena data dapat diakses secara berurutan atau langsung. Sama
seperti Anda dapat memilih untuk memutar lagu pada pemutar MP3 dalam urutan apa pun
yang Anda pilih, data pada disk dapat diakses secara berurutan atau dalam urutan lain.

Teknik Pengolahan Data


(Tujuan Penelitian 3)
Dalam sistem pemrosesan transaksi, transaksi diproses baik dalam batch atau satu
per satu. Pemrosesan batch terjadi ketika transaksi serupa dikelompokkan bersama,
dan kelompok tersebut diproses sebagai batch. Contoh umum dari pemrosesan
batch adalah memproses cek penggajian. Semua kartu waktu untuk periode
pembayaran dikumpulkan, dan cek pembayaran yang dihasilkan diproses dan
dicetak dalam kelompok, atau batch. Transaksi hutang dan piutang usaha sering
diproses dalam batch. Misalnya, pembayaran ke vendor sering diproses dalam batch.
Alternatif untuk pemrosesan batch adalah pemrosesan waktu nyata.Pemrosesan
waktu nyata terjadi ketika transaksi diproses segera. Pemrosesan ini bersifat
interaktif karena transaksi diproses saat masuk.
Saat menentukan apakah pemrosesan batch atau real-time sesuai, profesional
sistem harus mempertimbangkan karakteristik berikut:
1. Waktu Respon. Sistem batch memiliki waktu respon yang lambat, karena
transaksi tidak diproses sampai seluruh kelompok siap untuk diproses. Sistem
waktu nyata memiliki waktu respons yang cepat, karena transaksi diproses
saat dimasukkan.
2. Efisiensi. Pemrosesan batch lebih efisien untuk volume besar transaksi serupa. Hal
ini benar karena dua alasan: Pertama, orang yang berfokus pada pengumpulan
dan pemrosesan jenis transaksi yang serupa menjadi efisien dalam menangani
transaksi tersebut. Artinya, mereka menjadi lebih terspesialisasi. Kedua, ada skala
ekonomi. Sama seperti jalur perakitan yang efisien, memindahkan banyak transaksi
serupa melalui sistem pada saat yang sama juga efisien dalam hal mengoptimalkan
penggunaan sumber daya personel dan komputer. Di sisi lain, pemrosesan real-
time kurang efisien untuk volume transaksi yang besar, karena ada duplikasi upaya
yang terlibat dalam memproses semua transaksi secara individual.
3. Kompleksitas. Sistem batch jauh lebih sederhana daripada sistem waktu nyata karena
perangkat keras, proses, dan jejak auditnya tidak terlalu rumit. Sistem batch memiliki jejak
audit yang sangat berbeda dan jelas, karena ada tanggal mulai dan tanggal akhir yang jelas
dan serangkaian transaksi yang ditentukan di antara tanggal tersebut. Penggajian, sekali lagi,
adalah contoh bagus untuk ini. Jika penggajian diproses setiap dua minggu, maka
Database (Tujuan Studi 4) 473

Ciri Pemrosesan Batch Pemrosesan Waktu Nyata

Waktu merespon Lambat Cepat


Efisiensi Sangat efisien untuk volume transaksi besar Kurang efisien untuk volume transaksi yang besar

Kompleksitas Sederhana Kompleks

Kontrol Lebih mudah untuk mengontrol dan memelihara jejak audit Lebih sulit untuk mengontrol dan memelihara jejak audit
Penyimpanan Data dapat disimpan secara berurutan Data harus disimpan pada media akses acak

PAMERAN 13-2 Perbandingan Pemrosesan Batch dan Real-Time

ada tanggal awal yang jelas, tanggal akhir, dan grup transaksi yang termasuk dalam batch ini.
Sebaliknya, sistem waktu nyata membutuhkan sistem perangkat keras dan perangkat lunak
yang lebih kompleks untuk mengelola aliran data yang sedang berlangsung dan interaktif
dengan benar.
4. Kontrol. Dalam sistem batch, kontrol lebih mudah dipertahankan. Karena ada
tanggal dan set transaksi yang terdefinisi dengan baik, total kontrol dapat
digunakan untuk memastikan akurasi dan kelengkapan. Misalnya, jumlah total jam
pada semua kartu waktu dapat ditambahkan secara manual, dan total ini dapat
dibandingkan dengan total jam kerja yang dihasilkan komputer. Ini akan
memastikan bahwa batch dimasukkan dan diproses secara akurat dan lengkap.
Dalam sistem real-time, total kontrol sulit digunakan karena tidak ada kelompok
transaksi yang totalnya dapat diturunkan. Selain itu, sifat interaktif dari
pemrosesan real-time menciptakan kompleksitas dalam hal memelihara jejak audit
dari perubahan file.
5. Media Penyimpanan. Sistem pemrosesan batch dapat menggunakan media
penyimpanan akses sekuensial atau acak. Di sisi lain, jika pemrosesan waktu nyata akan
terjadi, catatan harus disimpan pada media akses acak. Untuk memproses satu catatan
pada satu waktu, perlu untuk mengakses catatan tunggal itu.

Tampilan 13‑2 merangkum karakteristik pemrosesan batch dan real-time. Karena Exhibit 13‑2
menunjukkan bahwa pemrosesan batch dan real-time berlawanan di setiap karakteristik, perancang
sistem harus mempertimbangkan trade-off dalam memutuskan mana yang lebih tepat. Misalnya, jika
waktu respons yang cepat sangat penting, perancang sistem akan memilih pemrosesan waktu nyata,
meskipun itu mungkin berarti efisiensi pemrosesan yang lebih sedikit, lebih banyak kompleksitas, dan
kontrol yang lebih sulit. Sistem pesanan penjualan sering dirancang sebagai sistem pemrosesan
waktu nyata untuk memberikan layanan pelanggan yang lebih baik karena pelanggan mungkin
memerlukan respons yang cepat. Sebaliknya, tidak ada kebutuhan untuk respon cepat dalam sistem
penggajian, karena pekerja berharap untuk menunggu sampai akhir periode pembayaran untuk
menerima cek gaji. Oleh karena itu, pemrosesan batch sering digunakan dalam penggajian.

Database (Tujuan Studi 4)


A basis data adalah kumpulan data yang disimpan di komputer dalam bentuk yang
memungkinkan data tersebut dengan mudah diakses, diambil, dimanipulasi, dan disimpan.
Istilah "database" biasanya menyiratkan database bersama dalam suatu organisasi. Daripada
setiap aplikasi komputer memiliki file sendiri, database menyiratkan satu set data yang dibagi
oleh setiap aplikasi yang menggunakan data. Tampilan 13‑3 mengilustrasikan konsep berbagi
data ini.
Bagian atas pameran menunjukkan pendekatan berorientasi file tradisional untuk penyimpanan
data. Setiap aplikasi memiliki file data yang digunakannya, dan tidak ada pembagian data meskipun
aplikasi ini sebenarnya menggunakan beberapa jenis data yang sama
474 Bab 13 Data dan Basis Data

Pendekatan File Datar Tradisional

Pembelian
Pembelian
File Induk

Akun hutang
Akun hutang
File Induk

Inventaris
Inventaris
File Induk

Pendekatan Basis Data

Pembelian

Akun hutang DBMS Basis Data Daring

PAMERAN 13-3 Tradisional


Pendekatan Berorientasi File
Inventaris
dan Pendekatan Database

(seperti nomor bagian inventaris dan deskripsi). Kurangnya berbagi ini menyebabkan
redundansi data.Redundansi data terjadi ketika data yang sama disimpan di lebih dari
satu file. Dalam hal ini, nomor bagian inventaris dan deskripsi mungkin ada di ketiga file.
Redundansi data menyebabkan masalah konkurensi.Konkurensi berarti bahwa semua
beberapa contoh dari data yang sama persis sama. Jika catatan yang sama disimpan di
banyak lokasi berbeda, sulit untuk memastikan bahwa semuanya diperbarui pada waktu
yang sama (bersamaan). Misalnya, mengubah alamat pelanggan dapat berarti
mengubahnya di tiga tempat berbeda. Dalam kasus redundansi data seperti itu,
kesalahan dalam memperbarui data lebih mungkin terjadi. Dengan demikian, data lebih
cenderung memiliki kesalahan. Karena redundansi data ini, kesalahan dalam data
kemungkinan disebabkan oleh penambahan catatan, penghapusan catatan, dan
pengeditan atau perubahan catatan.
Bagian bawah dari Exhibit 13‑3 menggambarkan pendekatan database bersama. Semua
data disimpan sekali dalam database bersama, dan data tersedia untuk semua aplikasi yang
menggunakan data tersebut. Perhatikan bahwa ini menghilangkan masalah redundansi data
dan konkurensi. Karena data disimpan hanya sekali, setiap dan semua perubahan pada catatan
segera tersedia bagi mereka yang berbagi data. Menambahkan catatan, menghapus catatan,
dan mengedit catatan cenderung menyebabkan data yang salah ketika data disimpan hanya
sekali.
Simbol DBMS pada Tampilan 13‑3 mewakili sistem manajemen basis data. NSsistem
manajemen basis data (DBMS) adalah perangkat lunak yang mengelola basis data dan
mengontrol akses dan penggunaan data oleh pengguna individu dan aplikasi. DBMS
menentukan bagian mana dari database yang dapat dibaca atau dimodifikasi oleh
individu atau proses. Sebelum memulai pembahasan teknis database, akan sangat
berguna untuk mendefinisikan istilah database dan untuk memeriksa sejarah singkat
database. Sejarah ini berguna dalam memahami lingkungan saat ini dan penggunaan
database dalam organisasi.
Database (Tujuan Studi 4) 475

Data mengungkapkan hubungan antara catatan. Hubungan ini dapat dianggap sebagai
hubungan orang tua-anak. Satu orang tua dapat berhubungan dengan satu atau lebih anak.
Jenis hubungan dalam data adalah satu-ke-satu, satu-ke-banyak, dan banyak-ke-banyak.
Hubungan satu lawan satu adalah mereka di mana satu entitas dalam data terkait dengan
hanya satu entitas lain. Contoh one-to-one adalah karyawan dan nomor Jaminan Sosial. Setiap
karyawan hanya memiliki satu nomor Jaminan Sosial, dan setiap nomor Jaminan Sosial hanya
dimiliki oleh satu orang.Hubungan satu ke banyak adalah mereka di mana satu entitas dalam
data terkait dengan lebih dari satu entitas lain. Setiap karyawan individu dapat memiliki
beberapa kartu waktu pada tahun tertentu. Perhatikan, bagaimanapun, bahwa hubungan satu-
ke-banyak ini hanya dalam satu arah. Artinya, sementara seorang karyawan terkait dengan
beberapa kartu waktu, setiap kartu waktu hanya dimiliki oleh satu karyawan. Sebagian besar
data dalam transaksi akuntansi menunjukkan hubungan satu-ke-banyak. Contohnya adalah
vendor ke banyak faktur, pelanggan ke banyak pesanan, pelanggan ke banyak pembayaran,
dan pesanan ke banyak item dalam pesanan.Hubungan banyak ke banyak adalah mereka di
mana satu entitas terkait dengan banyak entitas lain, dan kebalikannya juga benar. Contoh
hubungan banyak ke banyak adalah vendor ke item dan item ke vendor. Artinya, satu vendor
dapat memasok beberapa item, dan setiap item dapat dipasok oleh banyak vendor.

Sejarah Database
Model Database File Datar Basis data paling awal, dari periode 1950-an dan 1960-an,
disebut database file datar. Istilah file datar berasal dari gagasan bahwa data disimpan
dalam tabel dua dimensi dengan baris dan kolom. Dalam tabel file datar, setiap baris
adalah catatan dan setiap kolom adalah karakteristik yang terkait dengan catatan.
Misalnya, setiap karyawan memiliki karakteristik tanggal perekrutan tertentu. Dalam
terminologi database, kolom disebut atribut. Karena itu,atribut adalah karakteristik dari
catatan terkait. Tampilan 13‑4 mengilustrasikan tabel seperti itu.
Catatan file datar disimpan dalam format teks secara berurutan, dan semua pemrosesan
harus terjadi secara berurutan. Tidak ada hubungan yang ditentukan antar record. Sistem ini
harus menggunakan pemrosesan batch saja, dan batch harus diproses secara berurutan.
Sistem ini membuat pemrosesan volume besar transaksi serupa menjadi sangat efisien.
Namun, itu tidak memungkinkan satu catatan pun dengan cepat dan mudah diambil atau
disimpan. Oleh karena itu, pemrosesan real-time interaktif tidak mungkin dilakukan dengan
database file datar berurutan.
Setiap tabel dalam database harus memenuhi ketentuan berikut:

1. Item dalam kolom harus memiliki tipe data yang sama. Kolom pada Tampilan 13‑4
berjudul “Nama Belakang” hanya boleh memiliki nama belakang dari setiap catatan.
2. Setiap kolom harus diberi nama unik.
3. Setiap baris harus unik dalam setidaknya satu atribut (satu kolom). Jika tidak ada
perbedaan di kolom mana pun, baris akan identik dan satu baris dapat dihapus
karena merupakan duplikat dari baris lain.
4. Setiap sel di persimpangan baris dan kolom harus berisi hanya satu item data. Dalam
contoh ini, setiap karyawan hanya dapat memiliki satu tanggal perekrutan.

Basis data file datar dan setiap model basis data yang dijelaskan selanjutnya didasarkan pada tabel
dengan empat karakteristik yang baru saja dicantumkan.

Model Basis Data Hirarkis Sebagai kekuatan pemrosesan komputer meningkat,


database berkembang menjadi model hirarkis. Basis data hierarkis mendefinisikan
hubungan antara catatan dengan struktur pohon terbalik. Hubungan ini disebut
476 Bab 13 Data dan Basis Data

Nama Belakang EmpID Nama Depan Judul Tanggal perekrutan Alamat Kota Negara Kode Pos

101 Labbe John Perwakilan Penjualan 28/02/99 9065 Jalan Arlington Cincinnati OH 45238
102 mengerikan Andrew Akuntan 03/05/98 312 Produksi Dr Dayton OH 45239
103 bejana Mitchell Manajer keuangan 04/08/01 1062 Whirlway Dr aurora DI DALAM 45226
104 lebih baik Margaret Staf Akuntan 1 21/02/97 919 New Haven Road Cincinnati OH 45248
105 Buckhalter Nancy Spesialis Pemeliharaan 09/07/98 8595 Stonebridge Dr Florence KY 41042-3563
106 Singh Ravi Staf Akuntan 2 27/10/01 677 Ridge Ave Cincinnati OH 45241
107 Klinger Robert Staf Akuntan 2 09/30/01 1605 Deercroft Court Harrison OH 45030-2009
108 Courdell Anne koordinator HR 21/07/02 8425 North Bend Rd Cincinnati OH 45242-3706
109 sampson jessica Perwakilan Penjualan 09/06/99 617 Gembala Dr Villa Hills KY 41017

PAMERAN 13-4 Tabel Basis Data

orang tua-anak, dan mereka mewakili hubungan satu-ke-banyak. Oleh karena itu, model
hierarki database dapat menggabungkan hubungan satu-ke-satu dan satu-ke-banyak dalam
data. Hubungan ini secara permanen dan eksplisit didefinisikan dalam database oleh hubungan
data. Data ditautkan oleh hubungan eksplisit ini dalam struktur hubungan rekaman seperti
penunjuk rekaman. Apenunjuk catatan adalah nilai kolom dalam tabel yang menunjuk ke
alamat berikutnya dengan atribut yang ditautkan. Keterkaitan ini memungkinkan pengambilan
cepat catatan dalam rantai keterkaitan itu. Misalnya, basis data penggajian dapat memiliki
hubungan dari lokasi pabrik ke departemen hingga karyawan. Tampilan 13‑5 mengilustrasikan
hubungan hubungan hierarkis.
Jika keinginan adalah untuk mengambil catatan dengan cepat untuk karyawan di Pabrik 1,
akses catatan dapat dilakukan dengan cepat karena adanya hubungan bawaan. Namun, jika
kita ingin mengambil hanya catatan dari semua karyawan yang bekerja di Departemen 1, tidak
ada satu set tautan yang memudahkan pengambilan. Setiap catatan akan dibaca secara
berurutan untuk melihat apakah karyawan tersebut bekerja di Departemen 1. Basis data
hierarkis efisien dalam memproses transaksi dalam jumlah besar, tetapi mereka tidak
memungkinkan pengambilan catatan dengan mudah kecuali yang berada dalam hubungan
eksplisit. Ini berarti bahwa basis data hierarkis tidak cukup fleksibel untuk memungkinkan
berbagai jenis pertanyaan data.

tanaman 1

departemen 1 departemen 2 departemen 3

Kosong #5 Kosong #13 Kosong #8 Kosong #10 Kosong #2 Kosong #6 Emply #3 Kosong #7

Tanaman 2

departemen 1 departemen 2 departemen 3

Kosong #9 Kosongkan #4 Kosong # 12 Kosong #11 Emply #1 Kosong #14

PAMERAN 13-5 Keterkaitan dalam Basis Data Hirarki


Kebutuhan Data yang Dinormalisasi (Tujuan Studi 5) 477

Model Basis Data Jaringan Untuk sedikit meningkatkan pengenalan hubungan dalam
database, model jaringan database dikembangkan berikutnya. Basis data jaringan juga
dibangun di atas struktur pohon terbalik, tetapi mereka memungkinkan hubungan
hubungan yang lebih kompleks dengan menggunakan cabang bersama. Ini pada
dasarnya berarti bahwa ada lebih dari satu set cabang pohon terbalik ke dalam data.
Namun, model jaringan belum terlalu populer, dan jarang digunakan saat ini. Baik model
hierarkis dan jaringan memiliki banyak kelemahan. Dalam kedua model tidak mungkin
untuk menambahkan data baru kecuali semua informasi terkait diketahui. Vendor baru
tidak dapat ditambahkan ke database sampai diketahui item mana yang akan dibeli dari
vendor tersebut. Selain itu, menghapus semua catatan induk juga akan menghapus
semua catatan anak.

Model Basis Data Relasional Pada tahun 1969, seorang matematikawan bernama EF Codd
mengembangkan model database yang memungkinkan dimasukkannya hubungan data yang
lebih kompleks. Dia menyebut model ini database relasional. Adatabase relasional menyimpan
data dalam tabel dua dimensi yang digabungkan dalam banyak cara untuk mewakili berbagai
jenis hubungan dalam data. Meskipun membutuhkan waktu bertahun-tahun agar teknologi
komputasi tersedia untuk mengimplementasikan ide-idenya secara luas, struktur database
relasional adalah struktur database yang paling banyak digunakan saat ini. IBM DB2, Oracle
Database, dan Microsoft Access® semua contoh database relasional.

Kebutuhan Data yang


Dinormalisasi (Tujuan Studi 5)
Database relasional terdiri dari beberapa tabel kecil, bukan satu tabel besar seperti pada
database file datar. Tabel kecil dalam database relasional dapat digabungkan bersama
dengan cara yang mewakili hubungan di antara data.
Misalnya, periksa tabel dan hubungan database Microsoft Access di Tampilan 13-6. Setiap
kotak adalah tabel, dan nama bidang tercantum di setiap kotak. Bidang yang dicetak tebal
adalah kunci utama. NSkunci utama, pengidentifikasi unik untuk setiap record di setiap tabel,
digunakan untuk mengurutkan, mengindeks, dan mengakses record dari tabel tersebut. Garis
antar kotak menunjukkan hubungan antar tabel. Hubungan yang ditunjukkan dalam tabel ini
adalah satu ke banyak. Misalnya, satu pelanggan (CustomerID), dapat memiliki banyak pesanan
yang tercantum dalam tabel Pesanan. Perhatikan bahwa tabel Pelanggan dan tabel Pesanan
ditautkan oleh ID Pelanggan. Di tabel Pesanan, bidang ID Pelanggan adalah bidang kunci asing.
Dengan kata lain, CustomerID berada di tempat yang berbeda (asing)

PAMERAN 13-6 Sebuah relasional


Basis data di Microsoft Access
478 Bab 13 Data dan Basis Data

tabel, tetapi diperlukan dalam tabel Pesanan untuk membuat hubungan antara Pelanggan dan
Pesanan.
Tabel-tabel terpisah ini dan hubungan antara tabel-tabel inilah yang membangun
keuntungan dari database relasional. Keuntungannya adalah database relasional memiliki
fleksibilitas dalam mengambil data dari kueri. Pengembang database relasional
membayangkan bahasa permintaan seperti bahasa Inggris yang dapat digunakan untuk
mengakses data secara langsung dari database relasional. Bahasa query yang telah menjadi
standar industri adalahbahasa kueri terstruktur, atau SQL. Dengan menggunakan SQL dan
menggabungkan tabel-tabel ini bersama-sama dengan cara tertentu, hampir semua pertanyaan
tentang pesanan pelanggan dapat dijawab. Jika seorang manajer ingin mengetahui pelanggan
mana yang telah menempatkan pesanan yang telah dikirim, tabel Pelanggan dan Pesanan
dapat digabungkan untuk mengekstrak kolom (bidang) untuk ID Pelanggan, Nama Perusahaan,
ID Pesanan, dan TanggalPengiriman. Tampilan kueri ini dan SQL untuk mengekstrak data
ditunjukkan pada Tampilan 13-7.
Perhatikan bahwa bahasa kueri SQL adalah bahasa Inggris yang relatif sederhana. Ini
mengidentifikasi bidang mana yang dipilih dari tabel mana dan bagaimana tabel akan digabungkan.
Tabel digabungkan dengan OrderID. Hubungan itu adalah hubungan satu-ke-banyak. Setiap
pelanggan mungkin memiliki lebih dari satu pesanan.
Contoh yang lebih kompleks melibatkan manajer yang perlu mengetahui karyawan mana
yang telah menjual produk 52371. Dengan menggunakan SQL, manajer dapat bergabung
dengan tabel Pesanan, Karyawan, Detail Pesanan, dan Produk untuk mengambil data ini.
Tampilan 13‑8 memperlihatkan tampilan desain Access dari kueri ini. Perhatikan bahwa kueri ini
memiliki kondisi "WHERE". Data yang diekstrak disaring dalam arti bahwa ProductID harus
sama dengan 52371. Kueri ini menunjukkan fleksibilitas database relasional yang dibangun
dengan banyak tabel. Basis data relasional fleksibel karena sejumlah kueri yang berbeda dapat
dijawab dengan menggabungkan tabel dengan berbagai cara. Beberapa contoh pertanyaan
yang dapat dijawab dari tabel pada Tampilan 13‑6 adalah sebagai berikut:

1. Kuantitas dan harga pesanan oleh pelanggan


2. Pelanggan yang membeli dari karyawan tertentu
3. Pesanan dikirim dengan metode pengiriman tertentu
4. Jumlah produk yang terjual antara tanggal tertentu

PILIH Customers.CustomerID, Customers.CompanyName, Orders.OrderID,


Orders.ShippedDate FROM Customers INNER JOIN Orders ON
PAMERAN 13-7 Tampilan Desain
Customers.CustomerID Orders.CustomerID;
dan SQL dari Query Sederhana
Kebutuhan Data yang Dinormalisasi (Tujuan Studi 5) 479

PILIH Produk.ProdukID, Produk.NamaProduk, Pesanan. ID Pesanan, [Rincian Pesanan].Harga Satuan,


[Rincian Pesanan]. Quantity, Employee.EmployeeID, Employee.LastName, Employee.FirstName FROM
Products INNER JOIN ((Employeees INNER JOIN Orders ON Employee.EmployeeID Orders. EmployeeID)
INNER JOIN [Rincian Pesanan] PADA Pesanan.OrderID [Rincian Pesanan].OrderID) PADA
Produk .ProductID [Rincian Pesanan].ProductID WHERE

(((Products.ProductID) 52371));

PAMERAN 13-8 Tampilan Desain dan SQL dari Kueri Kompleks

Ada sangat sedikit pertanyaan yang tidak dapat dijawab dengan menggabungkan tabel-tabel ini
dengan berbagai cara. Tabel cukup fleksibel untuk menjawab pertanyaan dalam jumlah tak
terbatas. Untuk mendapatkan fleksibilitas ini, tabel dalam database relasional harus dirancang
menurut aturan tertentu. Proses mengubah data menjadi tabel yang memenuhi definisi
database relasional disebutnormalisasi data. Ada tujuh aturan normalisasi data, dan aturan ini
bersifat aditif. Karakteristik aditif berarti bahwa jika sebuah tabel memenuhi aturan ketiga, itu
juga memenuhi aturan satu dan dua. Sebagian besar database relasional berada dalam bentuk
normal ketiga, yang berarti mereka memenuhi tiga aturan normalisasi data pertama. Tiga
aturan normalisasi data pertama adalah sebagai berikut:

1. Hilangkan grup berulang. Aturan ini mensyaratkan bahwa setiap atribut (kolom)
terkait yang akan diulang dalam beberapa baris harus diletakkan dalam tabel
terpisah. Tampilan 13‑6 menyajikan contoh penerapan aturan ini. Ada tabel
pesanan dan tabel detail pesanan. Jika ini bukan tabel terpisah, informasi dasar
tentang pesanan, seperti ID pelanggan dan tanggal pengiriman, harus diulang
untuk setiap item yang dipesan.
2. Hilangkan data yang berlebihan.
3. Hilangkan kolom yang tidak bergantung pada kunci utama.

Permintaan fleksibel dalam database relasional hanya mungkin jika tabel


dibuat untuk mencapai bentuk normal ketiga.

Trade-Off dalam Penyimpanan Basis Data

Seperti yang dibahas di awal bab ini, metode penyimpanan memengaruhi penggunaan data.
Meskipun database relasional sangat fleksibel untuk kueri, ini bukanlah cara yang paling efisien
untuk menyimpan data yang akan digunakan dengan cara lain. Cara tercepat untuk mengakses
dan memproses catatan dari database ketika tujuan penggunaannya adalah pemrosesan
volume besar transaksi adalah model hierarkis. Namun, model hirarkis tidak fleksibel untuk
query. Dengan demikian, ada trade-off efisiensi pemrosesan transaksi untuk fleksibilitas. Jika
penggunaan utama data adalah untuk pemrosesan
480 Bab 13 Data dan Basis Data

transaksi dan bukan untuk menjawab pertanyaan, model hierarkis adalah pilihan penyimpanan
yang lebih efisien. Jika penggunaan utama data adalah untuk menjawab pertanyaan, model
relasional lebih unggul.
Jelas, banyak data dari transaksi memerlukan kedua operasi: memproses transaksi dan
query. Dalam lingkungan TI saat ini, sebagian besar organisasi bersedia menerima efisiensi
pemrosesan transaksi yang lebih sedikit untuk peluang kueri yang lebih baik. Oleh karena itu,
sebagian besar organisasi menggunakan database relasional. Kehilangan efisiensi pemrosesan
transaksi tidak menjadi masalah karena daya komputasi telah meningkat pesat sementara
biayanya menurun.
Database relasional telah menjadi sangat banyak digunakan dalam organisasi karena
fleksibilitas ini. Menggunakan database relasional dan SQL, manajer dapat melakukan kueri dan
mengekstrak data dari database sendiri. Mereka tidak perlu membuat permintaan ke
departemen TI untuk merancang laporan tertentu. Ini memberi manajer informasi umpan balik
yang lebih tepat waktu dan fleksibel tentang operasi. Peningkatan akses ke informasi ini dapat
membantu manajer mengelola dengan lebih baik.

Penggunaan Data Warehouse untuk Menganalisis


Data (Tujuan Studi 6)
Dalam banyak kasus, data yang dibutuhkan manajer jauh lebih luas daripada kumpulan
data yang saat ini digunakan dalam operasi sehari-hari. Manajemen sering membutuhkan
data dari beberapa periode fiskal dari seluruh organisasi. Sebuah gudang data dapat
berfungsi sebagai sumber informasi yang lebih luas untuk manajemen. Agudang data
adalah kumpulan terintegrasi data seluruh perusahaan yang mencakup beberapa tahun
data nonvolatile yang digunakan untuk mendukung manajemen dalam pengambilan
keputusan dan perencanaan. Gudang data dapat lebih dipahami jika kita
membandingkannya dengan database operasional. NSbasis data operasional adalah
data yang terus diperbarui saat transaksi diproses. Biasanya, database operasional
mencakup data untuk tahun fiskal saat ini dan mendukung operasi sehari-hari dan
pencatatan untuk sistem pemrosesan transaksi. Setiap kali transaksi baru selesai, bagian
dari data operasional harus diperbarui. Misalnya, mencatat penjualan berarti saldo
penjualan, persediaan, dan piutang harus diperbarui. Jenis pembaruan ini tidak terjadi di
gudang data. Tampilan 13‑9 menunjukkan gudang data dan tata letak data operasional.
Data bersifat enterprise-wide karena diambil dari masing-masing database
operasional, dan data ini disimpan di gudang data untuk banyak periode fiskal.
Idealnya, gudang data harus berisi data lima sampai sepuluh tahun. Data dalam data
warehouse diambil dari pemrosesan pesanan penjualan, sistem persediaan, piutang,

Perusahaan Kelompok kerja


Server Database Operasional Server

Data
Gudang

PAMERAN 13-9 Data


Gudang dan
Database Operasional
Penggunaan Data Warehouse untuk Menganalisis Data (Tujuan Studi 6) 481

dan banyak sistem pemrosesan transaksi lainnya dalam organisasi. Data dalam
data warehouse disebut nonvolatile karena tidak berubah dengan cepat seperti
halnya perubahan data operasional. Secara berkala, data baru diunggah ke
gudang data dari data operasional, tetapi selain melalui proses pembaruan ini,
data di gudang data tidak berubah.

Bangun Gudang Data


Untuk memastikan kegunaan dari gudang data, itu harus dibangun dengan benar. Data di gudang
data harus mendukung kebutuhan pengguna dan harus distandarisasi di seluruh perusahaan.
Daripada mengumpulkan dan menggabungkan semua data yang tersedia ke dalam gudang data,
penting untuk memasukkan hanya data yang memenuhi kebutuhan pengguna. Fungsi manajemen,
akuntansi, keuangan, produksi, dan distribusi akan menggunakan gudang data ini untuk
menganggarkan, merencanakan, memperkirakan, dan menganalisis profitabilitas.

Identifikasi Data
Data di gudang data harus menyediakan jenis informasi yang tepat untuk berbagai
kelompok pengguna. Untuk menentukan data yang harus ada di gudang data, penting
untuk memeriksa kebutuhan pengguna danproses berdampak tinggi (HIP). HIP adalah
proses yang sangat penting yang harus dijalankan dengan benar jika organisasi ingin
bertahan dan berkembang. Identifikasi HIP harus mempertimbangkan tujuan strategis
jangka panjang organisasi.
Organisasi harus membentuk tim lintas fungsi untuk mengidentifikasi HIP dan data yang mengalir
masuk dan keluar dari proses tersebut. Setiap tim harus mempertimbangkan proses kritis mana yang
membantu perusahaan mencapai tujuan strategis jangka panjangnya. Tim lintas fungsi juga harus
menanyakan kepada pengguna data apa yang mereka butuhkan dan jenis masalah bisnis apa yang
mereka hadapi. Dengan mengidentifikasi dan memeriksa HIP dan kebutuhan data pengguna,
kumpulan data yang dibutuhkan di gudang data dapat ditentukan.

Standarisasi Data
Data di gudang data akan berasal dari banyak proses dan subunit yang berbeda di seluruh
perusahaan. Aplikasi yang berbeda dalam perusahaan mungkin menggunakan informasi yang
sama, tetapi dengan cara yang berbeda. Misalnya, kedua pesanan penjualan

Dunia nyata
Anheuser-Busch Companies, Inc. harus bekerja untuk menjaga Sebaliknya, perbaikan garansi sama sekali tidak penting bagi
toko serba ada dan toko minuman keras tetap penuh dengan Anheuser-Busch. Namun, proses perbaikan garansi
jumlah dan jenis bir yang tepat. Jika terlalu sedikit yang kemungkinan besar merupakan proses berdampak tinggi
ditebar, Anheuser-Busch akan kehilangan penjualan; jika bagi perusahaan seperti Hewlett-Packard (HP) Co. HP
terlalu banyak ditebar, biaya penyimpanan yang berlebihan menjual produk komputer yang biasanya memberikan
dapat terjadi dan kekhawatiran akan kesegaran muncul. Oleh garansi 90 hari hingga 1 tahun. Tanpa sistem perbaikan
karena itu, sistem distribusi perusahaan merupakan proses garansi yang responsif pelanggan, HP akan sangat mungkin
yang berdampak tinggi. kehilangan penjualan.
482 Bab 13 Data dan Basis Data

fungsi pemrosesan dan pemasaran dapat menggunakan bidang yang disebut "nomor pelanggan." Sistem
pemasaran mungkin memiliki nomor rekening pelanggan yang terdiri dari lima digit dengan tiga angka nol di
depan. Jadi, nomor rekening pelanggan mungkin 00053425. Sistem pemrosesan pesanan penjualan dapat
menggunakan bidang pelanggan dengan lima digit dan dua nol di depan. Oleh karena itu, pelanggan yang
sama dalam aplikasi pesanan penjualan adalah 0053425. Untuk menggabungkan semua informasi tentang
pelanggan ini baik dari sistem pesanan pemasaran maupun penjualan, nomor rekening harus distandarisasi
dalam gudang data. Seseorang bisa dengan adil bertanya,Mengapa tidak mengubah sistem pemasaran atau
pesanan penjualan yang mendasarinya sehingga mereka setuju? Sebagian besar perusahaan tidak merasa
bahwa mereka mampu meluangkan waktu atau upaya untuk menulis ulang kode sumber di sistem lama
mereka yang lama. Daripada mengubah sistem yang ada, lebih mudah untuk menstandarisasi data di
gudang data.

Bersihkan, atau Gosok, Data

Karena data dalam gudang data kemungkinan besar berasal dari berbagai sumber dalam
perusahaan, mungkin akan ada kesalahan dan inkonsistensi dalam data. Sedapat
mungkin, data harus dibersihkan, atau "digosok", untuk menghapus atau memperbaiki
kesalahan dan masalah dalam data.

Dunia nyata
Sebuah perusahaan jasa besar dengan pelacakan dolar lebih banyak untuk proyek gudang data ini. Yang
proyek, berbagai lini bisnis dan layanan di seluruh membuat perusahaan kecewa, perusahaan konsultan
Amerika Serikat memutuskan untuk mengganti sistem tidak dapat menghasilkan laporan dan data yang berarti
ERP warisannya. Alih-alih mengambil kesempatan untuk dengan menggunakan strategi gudang data. Pada saat
memperbarui dan meningkatkan proses bisnisnya, itu, perusahaan menyadari bahwa mereka perlu
perusahaan mengharuskan vendor perangkat lunak menerapkan solusi ERP yang terintegrasi penuh.
untuk menyesuaikan perangkat lunak ERP yang baru Setelah menyelesaikan proyek ERP akhir, perusahaan
sehingga cocok dengan proses bisnis sebelumnya dari menyadari bahwa sebagian besar laporan yang dijanjikan
sistem lama. Jutaan dolar kemudian, proyek tersebut dari proyek gudang data dihasilkan secara otomatis dari
gagal diimplementasikan sepenuhnya dan perusahaan solusi ERP baru. Dari sini, disimpulkan bahwa proyek data
berakhir dengan banyak fungsi bisnis yang berbeda dan warehouse adalah kompleks dan memerlukan sumber
tidak terintegrasi alih-alih solusi ERP yang efisien dan daya TI internal atau eksternal yang memiliki keahlian
terintegrasi sepenuhnya. Pelajaran pertama: selalu luas dalam menciptakan gudang data, analisis data, dan
luangkan waktu untuk melakukan tinjauan proses bisnis pelaporan yang bermakna. Solusi ERP yang kuat harus
dan berinvestasi dalam rekayasa ulang proses bisnis saat dapat menghasilkan banyak laporan standar tanpa
menerapkan sistem ERP baru. Pelajaran kedua: penyesuaian atau penambahan gudang data. Terakhir,
minimalkan penyesuaian jika memungkinkan. jika data yang dimasukkan ke dalam sistem ERP tidak
disederhanakan, dimasukkan sekali, dan diproses secara
Dengan beberapa sistem yang berbeda di mana data efisien, data yang keluar dari sistem akan bermasalah,
yang sama harus dimasukkan beberapa kali, ada banyak disebut sebagaisampah masuk sampah keluar (GIGO).
kesalahan dalam data dan laporan. Sebuah perusahaan Untuk profesional akuntansi, ini adalah pelajaran yang
konsultan kemudian mengusulkan bahwa solusi untuk baik, karena banyak CFO pada akhirnya bertanggung
masalah tersebut adalah mengembangkan gudang data jawab atas proyek TI untuk perusahaan mereka, atau
untuk menarik data dari modul ERP yang berbeda dan setidaknya untuk proyek yang berdampak pada ERP dan
membuatnya bermakna. Putus asa mencari solusi, sistem keuangan.
perusahaan mengontrak perusahaan konsultan dan
menginvestasikan beberapa juta
Alat Analisis Data (Tujuan Studi 7) 483

Unggah Data
Data dari masing-masing sistem HIP harus diunggah ke gudang data. Juga,
secara teratur, data baru harus diunggah ke gudang data. Di antara tanggal saat
data diunggah, gudang data bersifat statis—tidak berubah. Sebagai contoh, jika
data diunggah setiap akhir bulan, tidak ada perubahan di gudang data hingga
hari terakhir bulan tersebut.

Alat Analisis Data (Tujuan Studi 7)


Tujuan dari gudang data adalah untuk memberi manajer sumber data yang kaya yang dapat mereka
kueri dan periksa untuk tren dan pola. Gudang data memungkinkan manajer untuk memeriksa pola
atau tren penting sehingga mereka dapat merencanakan dan mengendalikan bisnis dengan lebih
baik. Gudang data dapat membantu manajer memeriksa tren seperti penjualan berdasarkan produk,
wilayah, atau model dalam jangka waktu yang lama. Data dalam data warehouse dianalisis dengan
data mining dan pemrosesan analitik.
Berbagai teknik dan alat telah dikembangkan untuk menganalisis data di gudang
data, dan analisis ini meningkatkan kemampuan bisnis untuk memenuhi kebutuhan
pelanggan, meningkatkan perencanaan strategis, dan meningkatkan kinerja.
Meskipun ada banyak alat dan teknik analisis data, bagian ini akan menjelaskan satu
teknik penting: penambangan data. Alat yang digunakan dalam data mining
umumnya disebut pemrosesan analitik online (OLAP). Ada variasi khusus OLAP yang
disebut pemrosesan analitik online relasional (ROLAP), dan pemrosesan analitik
multidimensi (MOLAP; juga disebut kubus data). Tetapi jenis OLAP khusus ini lebih
merupakan topik teknis yang berada di luar cakupan bab ini. Deskripsi di sini akan
fokus pada karakteristik umum dari data mining dan OLAP.

Penambangan Data

Penambangan data adalah proses mencari pola yang dapat diidentifikasi atau hubungan sistematis
dalam data yang dapat digunakan untuk memprediksi perilaku masa depan. Ini sering disebut analitik
prediktif. Meskipun ada banyak alasan untuk memprediksi perilaku masa depan, penggunaan data
mining yang paling populer adalah untuk memprediksi perilaku pembelian pelanggan di masa depan.
Jika bisnis dapat lebih akurat memprediksi perilaku pembelian pelanggan, mereka dapat
merencanakan dengan tepat untuk memproduksi, mendistribusikan, dan menjual produk yang tepat
kepada pelanggan pada waktu yang tepat. Teknik data mining memiliki potensi yang cukup besar di
berbagai bidang. Dalam buku 1998Menemukan Penambangan Data,1 berikut ini ditawarkan sebagai
contoh pertanyaan yang dapat dijawab oleh data mining:

• Pola perilaku seperti apa yang ditiru oleh pelanggan Anda?


• Bagaimana organisasi dapat menghasilkan lebih banyak penjualan kepada pelanggan yang sudah ada?

• Dalam database penjualan, apakah ada pola pembelian yang tersembunyi?


• Siapa pelanggan yang lebih baik, dan siapa pelanggan berisiko tinggi?
• Bagaimana Anda bisa mempertahankan loyalitas dari pelanggan saat ini?
• Bagaimana Anda dapat mengidentifikasi kebiasaan membeli yang tidak diketahui dan secara khusus memasarkan kebiasaan

tersebut?

• Apa persepsi pelanggan terhadap produk perusahaan?


• Bagaimana Anda meningkatkan rencana bisnis operasional dan strategis berdasarkan hasil
penambangan data?

1Peter Cabena dkk., Menemukan Data Mining: Dari Konsep hingga Implementasi, Upper Saddle River, NJ,
Prentice Hall PTR, 1998.
484 Bab 13 Data dan Basis Data

Dunia nyata
Anheuser-Busch menggunakan penambangan data untuk dan kampanye promosi baru kepada distributor.
melacak dan memprediksi perilaku pembelian bir. Menggunakan Anheuser-Busch menggunakan data dan teknologi
kombinasi datanya sendiri, data pasar, dan data dari pihak ketiga, komputer ini untuk memodelkan dan memprediksi pola
Anheuser-Busch dapat melacak penjualannya sendiri dan pembelian gerai ritel untuk 14-28 hari ke depan. Model ini
penjualan pesaing, merevisi strategi pemasaran, dan merancang menggunakan informasi seperti riwayat penjualan, harga-
promosi yang ditargetkan untuk kelompok etnis. Anheuser-Busch ke-konsumen, hari libur, acara khusus, suhu harian, dan
memiliki nama untuk databasenya dan proses penggunaannya: perkiraan data seperti suhu yang diantisipasi, untuk
BudNet. Perusahaan menghubungkan pertumbuhan pangsa membuat perkiraan penjualan berdasarkan toko dan
pasarnya dengan BudNet. Anheuser-Busch bahkan mengelola produk. Data digunakan oleh tenaga penjualan dan
situs web untuk digunakan perwakilan penjualan dan distributor distributor untuk mengatur ulang tampilan, merotasi stok,
dalam mengakses dan menganalisis data. Situs web, dan menginformasikan toko tentang kampanye promosi.
www.budnet.com, dilindungi untuk memungkinkan penggunaan
hanya oleh pihak yang berwenang. Selain menggunakan data internal, kontrak
Anheuser-Busch dengan Information Resources,
Anheuser-Busch mengumpulkan data penjualannya Inc. (IRI), untuk mengumpulkan data penjualan
sendiri dengan menyediakan komputer genggam bagi para pasar. IRI melacak setiap pembelian bir berkode
penjualnya untuk digunakan ketika mereka mengunjungi batang di toko serba ada dan toko minuman keras.
toko-toko yang menyediakan merek bir Anheuser-Busch. IRI juga melakukan survei konsumen terhadap
Tenaga penjualan memasukkan data seperti pesanan baru, pembeli bir. Dengan menggunakan tren pembelian
ruang rak yang dikhususkan untuk Anheuser-Busch dan ini, Anheuser-Busch menciptakan kampanye
merek pesaing, dan promosi pemasaran yang digunakan promosi, produk baru, dan penargetan pasar lokal
oleh pesaing. Data dikirimkan setiap hari ke distributor atau etnis. Misalnya, lebih banyak bir dijual dengan
Anheuser-Busch regional dan kemudian ke kantor pusat kaleng di lingkungan kerah biru, sedangkan lebih
perusahaan. Manajer merek memeriksa data dan banyak botol dijual di lingkungan kerah putih.2
memberikan informasi penjualan dan permintaan

Meskipun sulit untuk menggambarkan ukuran yang tepat dari gudang data seperti
yang digunakan oleh Anheuser-Busch, tentu saja harus sangat besar karena
menggabungkan penjualan historis, informasi ruang rak, dan informasi pesaing di toko
demi toko. . Sebuah gudang data yang besar akan membutuhkan perangkat lunak khusus
untuk memeriksa dan menganalisis tren atau pola dalam data. Hal ini juga berlaku untuk
setiap organisasi yang memelihara gudang data yang besar. Perangkat lunak harus
digunakan untuk mencari tren dan pola dalam data. Istilah umum untuk perangkat lunak
ini adalahpemrosesan analitik online, atau OLAP, dijelaskan di bagian berikut.

OLAP
OLAP adalah seperangkat alat perangkat lunak yang memungkinkan analisis data secara
online di dalam gudang data. Metode analisis dalam OLAP biasanya meliputi:

1. Telusuri adalah perluasan data secara berurutan menjadi lebih detail, dari data tingkat
tinggi ke tingkat data yang lebih rendah. Misalnya, dalam menganalisis penjualan, bor

2 www.cnn.com/2004/TECH/ptech/02/25/bus2.feat.beer.network
Pengolahan Data Terdistribusi (Tujuan Studi 8) 485

turun akan melibatkan pemeriksaan penjualan untuk tahun itu, lalu per
bulan, lalu per minggu atau hari. Pemeriksaan tingkat detail yang
berurutan ini adalah menelusuri. Kemampuan menelusuri dapat
memberikan pembaca laporan keuangan dengan visibilitas yang sangat
baik ke dalam rincian data keuangan. Microsoft Dynamics GP dibundel
dengan produk pelaporan keuangan yang disebut FRx yang
memungkinkan pembaca menelusuri nomor Pendapatan dan melihat
pendapatan untuk setiap subunit perusahaan yang dikonsolidasikan.
Kemudian mereka dapat menelusuri subunit dan melihat pendapatan
untuk setiap lokasi atau departemen di subunit. Penelusuran lebih lanjut
dapat memungkinkan pengguna untuk melihat total di semua akun yang
digabungkan ke item baris pendapatan lokasi.
2. Konsolidasi, atau roll-up, adalah agregasi atau kumpulan data serupa. Kebalikan dari drill down
dimana konsolidasi mengambil data yang detail dan meringkasnya menjadi kelompok yang
lebih besar, sedangkan drill down mengambil data tingkat tinggi dan memecahnya menjadi
lebih detail.
3. Memutar, atau memutar, data memeriksa data dari perspektif yang berbeda. Sebagai
contoh, penjualan bir dapat diperiksa berdasarkan waktu (bulan), menurut jenis toko
(toko serba ada atau toko minuman keras), menurut jenis wadah (kaleng atau botol), dll.

4. Analisis deret waktu digunakan untuk mengidentifikasi tren dengan membandingkan angka (seperti
penjualan) selama beberapa periode waktu berturut-turut.
5. Laporan pengecualian menyajikan varians dari harapan.
6. Simulasi bagaimana-jika menyajikan variasi potensial dalam kondisi yang
digunakan untuk memahami interaksi antara berbagai bagian bisnis.

OLAP adalah perangkat lunak yang memungkinkan manajer untuk mengakses dan menganalisis data
di gudang data. OLAP menemukan dan menyoroti tren atau pola dalam data.

Pengolahan Data Terdistribusi


(Tujuan Studi 8)
Banyak perusahaan kecil menampung semua operasi mereka di satu gedung. Untuk
perusahaan-perusahaan ini biasanya tidak perlu mempertimbangkan lokasi fisik basis
data mereka. Sebuah perusahaan kecil dengan hanya satu gedung jelas akan menyimpan
datanya di komputer di dalam gedung itu. Namun, sebagian besar organisasi menengah
atau besar memiliki banyak lokasi, terkadang berlokasi di seluruh dunia. Organisasi besar
dan menengah harus memutuskan di mana data mereka harus disimpan secara fisik dan
di lokasi mana itu harus diproses. Untuk waralaba makanan cepat saji seperti McDonald's
Corp, misalnya, manajemen dapat memutuskan untuk mempertahankan satu database
harga untuk produk makanan yang dijualnya. Jika data harga tersebut berada di satu
lokasi dan semua sistem komputer restoran mengakses satu database tersebut, atau
haruskah harga disimpan di wilayah atau lokalitas sehingga setiap lokasi dapat
mengenakan harga yang berbeda? Ini hanya contoh masalah penyimpanan data fisik yang
dihadapi organisasi besar. Lokasi penyimpanan data dan lokasi pemrosesan data dapat
memiliki dampak yang luar biasa terhadap efisiensi dan efektivitas perusahaan.
Seperti contoh McDonald's berikut, semua organisasi besar harus membuat keputusan tentang
data yang mereka pertahankan—keputusan yang melibatkan di mana data disimpan secara fisik dan
lokasi mana yang memproses berbagai data.
486 Bab 13 Data dan Basis Data

Dunia nyata
McDonald's memiliki restoran, gudang, dan kantor memenuhi pesanan pelanggan di seluruh dunia.
yang berlokasi di seluruh dunia; namun kantor pusat Setiap restoran McDonald's perlu terhubung ke
perusahaannya berada di Oakbrook, Illinois. Jika jaringan data di Illinois dan harus dapat mengakses
manajemen McDonald's memutuskan bahwa semua data harga dengan cepat untuk memproses
data, termasuk harga, harus disimpan dalam penjualan. Ini akan menghasilkan begitu banyak lalu
database di kantor pusat perusahaan, apa yang akan lintas jaringan sehingga kemungkinan besar akan
terjadi ketika Anda memesan burger keju di membanjiri jaringan dan sistem komputer. Selain itu,
McDonald's di Los Angeles? Sistem kasir harus jika harga hanya disimpan di kantor pusat
membaca data harga dari database di Oakbrook, perusahaan, akan lebih sulit bagi setiap lokasi untuk
Illinois. Ini tidak efisien karena beberapa alasan. menetapkan harganya sendiri. Tentu saja, akan jauh
Pertama, setiap restoran McDonald's akan mencoba lebih efisien bagi McDonald's untuk menyimpan data
membaca database yang sama secara bersamaan harga di restoran lokal atau di pusat regional.
untuk:

Pertanyaan tentang lokasi penyimpanan dan pemrosesan data ini biasanya


dipertimbangkan dalam konteks memilih dari dua pendekatan umum: terpusat atau
terdistribusi. Data dapat disimpan di lokasi pusat, atau dapat didistribusikan ke berbagai
lokasi. Demikian pula, pemrosesan data dan transaksi hanya dapat terjadi di satu lokasi
pusat, atau didistribusikan di berbagai lokasi. Pada hari-hari awal komputasi, pemrosesan
data dan basis data disimpan dan dipelihara di lokasi pusat. Ini disebutpemrosesan
terpusat dan database terpusat. Namun, di lingkungan TI saat ini, sebagian besar
pemrosesan dan basis data didistribusikan. Di dalampemrosesan data terdistribusi (DDP
) dan database terdistribusi (DDB), pemrosesan dan basis data tersebar ke berbagai
lokasi organisasi. Basis data terdistribusi sebenarnya adalah kumpulan basis data yang
lebih kecil yang tersebar di beberapa komputer di jaringan komputer. Data disimpan di
komputer yang berbeda dalam jaringan, dan program aplikasi mengakses data dari situs
yang berbeda ini.

DDP dan DDB


Sistem TI saat ini menggunakan jaringan seperti LAN dan WAN secara ekstensif, memungkinkan
distribusi pemrosesan dan basis data yang mudah. Mendistribusikan pemrosesan dan data
menawarkan keuntungan sebagai berikut:

1. Mengurangi biaya perangkat keras. Sistem terdistribusi menggunakan jaringan


komputer yang lebih kecil daripada komputer mainframe tunggal. Konfigurasi ini jauh
lebih murah untuk dibeli dan dirawat.
2. Peningkatan daya tanggap. Akses lebih cepat, karena data dapat ditemukan di lokasi
permintaan terbesar untuk data tersebut. Kecepatan pemrosesan ditingkatkan, karena
beban kerja pemrosesan tersebar di beberapa komputer.
3. Pertumbuhan inkremental yang lebih mudah. Seiring pertumbuhan organisasi atau membutuhkan sumber
daya komputasi tambahan, situs baru dapat ditambahkan dengan cepat dan mudah. Menambahkan
komputer jaringan yang lebih kecil lebih mudah dan lebih murah daripada menambahkan komputer
mainframe baru.
4. Peningkatan kontrol pengguna dan keterlibatan pengguna. Jika data dan pemrosesan
didistribusikan secara lokal, pengguna lokal memiliki kontrol lebih besar atas data tersebut.
Kontrol ini juga memungkinkan pengguna untuk lebih terlibat dalam pemeliharaan data, dan
oleh karena itu pengguna lebih puas.
Database Berbasis Cloud (Tujuan Studi 9) 487

5. Pencadangan terintegrasi otomatis. Ketika data dan pemrosesan didistribusikan di


beberapa komputer, kegagalan situs tunggal tidak begitu berbahaya. Komputer
lain dalam jaringan dapat melakukan pemrosesan ekstra atau penyimpanan data
untuk menebus hilangnya satu situs.

Namun, penting untuk diketahui bahwa ada juga kelemahan penggunaan DDP dan DDB,
yaitu meningkatnya kesulitan dalam mengelola, mengendalikan, dan memelihara
integritas data. Basis data besar yang disimpan, dipelihara, dan diakses di lokasi pusat
jauh lebih mudah untuk dikelola dan dikendalikan. Untuk mempertimbangkan mengapa
hal ini benar, pikirkan sebuah bangunan besar dengan hanya satu pintu. Mengontrol
akses terhadap barang-barang yang disimpan di dalam gedung dapat dikontrol dengan
memiliki keamanan pada satu pintu tersebut. Namun, setiap pintu yang ditambahkan ke
gedung memberi kesempatan lain bagi seseorang untuk mendapatkan akses yang tidak
sah. Oleh karena itu, setiap pintu merupakan titik di mana keamanan harus ditingkatkan.
Hal yang sama berlaku untuk sistem terdistribusi, di mana beberapa situs dalam
organisasi dapat mengakses database.
Selain itu, ketika data terletak di beberapa lokasi, kontrol konkurensi menjadi
masalah. Pikirkan tentang situasi penetapan harga McDonald's yang disajikan
sebelumnya di bagian ini. Jika McDonald's memutuskan untuk menaikkan harga
burger keju sebesar 10 persen, perubahan harga itu harus dilakukan di setiap
lokasi yang menyimpan data harga. Perhatikan bahwa perubahan harga ini akan
lebih mudah diterapkan jika hanya ada satu database harga terpusat. Harga
dapat diubah dalam satu database terpusat ini, dan perubahan harga akan
segera terlihat oleh semua orang yang menggunakan database tersebut.
Kerugian ini tidak menyebabkan organisasi menghindari penggunaan DDP dan
DDB, tetapi menyebabkan perhatian yang lebih besar untuk diberikan pada
masalah keamanan dan kontrol.
Ada juga masalah manajemen yang lebih sulit dikendalikan di DDP dan DDB. Jika pengguna lokal
memiliki kontrol lebih besar atas sistem, ada kemungkinan lebih besar bahwa situs lokal akan
memiliki perangkat keras, sistem, atau data yang tidak kompatibel. Misalnya, situs lokal mungkin
membeli perangkat keras yang tidak kompatibel dengan sistem jaringan organisasi yang lebih besar.
Manajemen dapat mengurangi masalah ini dengan menegakkan kebijakan mengenai pembelian dan
penggunaan perangkat keras dan perangkat lunak, dan melalui pengelolaan database yang lebih
ketat.
Untuk pengguna database, pertanyaan tentang bagaimana atau di mana data disimpan terus
menjadi kurang penting; sedangkan, lebih penting untuk menentukan apakah data mudah diakses
dan apakah dapat dengan mudah dianalisis. Seperti yang dijelaskan dalam Bab 2, banyak perusahaan
memindahkan beberapa atau semua database ke penyimpanan cloud. Nama lain untuk ini adalah
Database as a Service, atau DaaS. Bagian selanjutnya menjelaskan database cloud.

Database Berbasis Cloud (Tujuan Studi 9)


Basis data berbasis cloud layanan adalah area TI yang berkembang pesat. Banyak perusahaan
terbesar yang berhubungan dengan komputer adalah penyedia layanan database berbasis cloud.
Perusahaan-perusahaan ini termasuk Amazon (Amazon Elastic Compute Cloud), Google (Google Cloud
Storage), Microsoft (Windows Azure), dan IBM (IBM Smart-Cloud). Sebuah perusahaan dapat membeli
penyimpanan data dari salah satu penyedia ini atau banyak vendor cloud lainnya. Pengaturan
tersebut adalah Database as a Service (DaaS). Penyedia cloud umumnya tidak hanya menyediakan
ruang penyimpanan data tetapi juga perangkat lunak untuk mengelola dan mengontrol database.
Perusahaan pelanggan harus memiliki beberapa struktur TI untuk mengakses dan menggunakan data
yang disimpan di cloud. Namun, jumlah struktur TI yang dipertahankan akan lebih sedikit jika
database disimpan di tempat daripada di penyedia cloud.
488 Bab 13 Data dan Basis Data

Dunia nyata
Procter & Gamble (P&G) adalah produsen produk dikontrak dengan perusahaan analitik data berbasis
konsumen multinasional produk populer seperti Tide, cloud Teradata. Solusi cloud ini memungkinkan P&G
Pampers, Swiffer, dan banyak lainnya. Lebih dari 4,8 untuk menyimpan semua data konsumen global di satu
miliar pelanggan di seluruh dunia menggunakan produk lokasi dan menggunakan alat analitik data yang kuat
P&G. Menginginkan cara yang disempurnakan untuk untuk mencari pola dan hubungan dalam data. Sistem ini
menganalisis pola pembelian, keinginan pelanggan, disebut “1, Tempat Konsumen ” dan digunakan untuk
atau umpan balik pelanggan, P&G optimasi pemasaran digital.3

Bab 2 termasuk bagian yang menjelaskan konsep umum komputasi berbasis cloud dan
keuntungannya. Keuntungan yang sama berlaku untuk database berbasis cloud, atau DaaS,
tetapi mereka sedikit ditulis ulang di bawah ini untuk fokus pada database cloud:

1. Skalabilitas. Seiring pertumbuhan perusahaan, perusahaan dapat dengan mudah membeli kapasitas
baru dari penyedia cloud; tidak perlu membeli server atau penyimpanan data baru, karena penyedia
cloud sudah memiliki kapasitas. Skalabilitas ini juga merupakan keuntungan luar biasa untuk
lonjakan aktivitas bisnis. Jika perusahaan mengalami peningkatan volume bisnis yang besar selama
musim tertentu, perusahaan dapat dengan mudah meningkatkan kapasitas yang dibeli dari penyedia
cloud. Ketika volume musiman menurun, ia kemudian dapat mengurangi layanan yang dibelinya.

2. Akses yang diperluas. Setelah disimpan di cloud, data dapat diakses oleh banyak
perangkat dari berbagai lokasi. Ini memberi perusahaan lebih banyak fleksibilitas bagi
mereka yang menggunakan atau menganalisis data. Ini juga memudahkan pengguna
untuk memulai kemampuan komputasi baru.
3. Mengurangi infrastruktur. Perusahaan memiliki lebih sedikit kebutuhan akan server dan
penyimpanan data, karena sebagian besar sumber daya ini disediakan oleh penyedia cloud. Ini
juga berarti bahwa keamanan data dan pencadangan disediakan oleh penyedia cloud.
4. Penghematan biaya. Bagi banyak perusahaan, keuntungan dari komputasi awan diterjemahkan ke
dalam penghematan biaya. Hal ini tidak selalu terjadi, namun. Analisis biaya-manfaat umumnya
diperlukan saat mempertimbangkan untuk mengadopsi solusi cloud. Komputasi awan biasanya
merupakan model bayar-untuk-layanan, di mana perusahaan membayar penyedia awan hanya untuk
tingkat layanan yang benar-benar digunakan. Skalabilitas cloud berarti bahwa perusahaan tidak
perlu lagi memelihara sistem TI yang cukup besar untuk periode permintaan puncak. Komputasi
awan juga memungkinkan perusahaan untuk mengurangi investasinya dalam perangkat keras TI dan
personel pendukung TI. Ini menghilangkan risiko keuangan karena perusahaan pengguna
menghindari membuat investasi keuangan awal yang signifikan dalam sumber daya terkait teknologi
yang mungkin memiliki pengembalian yang tidak pasti.

Perusahaan yang menyimpan semua atau sebagian databasenya di cloud tidak hanya mendapatkan
semua keuntungan ini, tetapi juga mengenali risiko tertentu. Seperti yang dibahas dalam Bab 4,
pengguna layanan berbasis cloud bergantung pada keamanan, ketersediaan, integritas pemrosesan,
dan kontrol kerahasiaan penyedia. Perusahaan yang menggunakan DaaS dari vendor harus
menyelidiki dan memantau kontrol TI yang digunakan penyedia cloud untuk melindungi data.
Perusahaan kecil dan menengah (UKM) dapat lebih mudah menggunakan database cloud sebagai
satu-satunya database. Perusahaan besar, seperti perusahaan Fortune 1000, mungkin akan
menyimpan beberapa database di tempat dan bagian lain di lingkungan DaaS. Contoh Procter &
Gamble menggambarkan bagaimana sebuah perusahaan besar dapat menggunakan database cloud
untuk tujuan tertentu.

3 http://www.teradatamagazine.com/v14n02/Features/Procter-Gamble-Journey-of-a-Lifetime/.
Big Data dan Analisis Data (Tujuan Studi 10) 489

Big Data dan Analisis Data


(Tujuan Studi 10)
Data besar sulit untuk didefinisikan, tetapi umumnya dianggap sebagai data yang sangat besar dan
kompleks sehingga perangkat lunak dan perangkat database biasa tidak memadai untuk
menanganinya. Big Data memiliki volume, variasi, dan kecepatan yang sangat besar. Istilah-istilah ini
terus disempurnakan sehubungan dengan Big Data, tetapi untuk tujuan kami, kami akan
mendefinisikannya sebagai berikut:

• Volume. Kuantitas data sangat besar sehingga melampaui batas kapasitas


database tradisional dan perangkat lunak DBMS. Data ini kemungkinan
berukuran ratusan atau ribuan terabyte, atau petabyte. Seluruh Library of
Congress berukuran sekitar 235 terabyte.
• Variasi. Data yang tersimpan di komputer dulunya merupakan data terstruktur dengan
panjang file tetap, seperti 5 spasi untuk kode pos. Semakin hari, data semakin bervariasi
dan sekarang mencakup hal-hal seperti foto, komentar tidak terstruktur di Facebook atau
Twitter, ulasan produk, dan data tekstual lainnya. Big Data juga dapat menyertakan aliran
video dan audio. Selain itu, data ini berasal dari berbagai sumber. Oleh karena itu, ada
banyak variasi dalam jenis data dan sumber data.
• Kecepatan. Istilah ini mengacu pada seberapa cepat data dihasilkan atau diubah. Misalnya,
kecepatan data Twitter akan berubah dalam hitungan detik atau bahkan lebih cepat.

Perusahaan saat ini mengumpulkan, menyimpan, dan menggunakan Big Data untuk membantu meningkatkan
penjualan atau prioritas strategis lainnya.

Dunia nyata
Pada 2015, Walmart mengumpulkan dan menyimpan 2,5 semua Pop-Tart stroberi di kasir sebelum badai.
petabyte data tidak terstruktur dari 1 juta pelanggan setiap
jam. Perusahaan menggunakan alat analisis Big Data untuk Walmart melacak dan menargetkan setiap konsumen
melakukan penambangan data dan menemukan pola dalam secara individual. Walmart memiliki data pelanggan
data titik penjualan. lengkap untuk hampir 145 juta orang Amerika yang 60%
datanya adalah orang dewasa AS. Walmart
“Penambangan data membantu Walmart menemukan mengumpulkan informasi tentang apa yang dibeli
pola yang dapat digunakan untuk memberikan pelanggan, di mana mereka tinggal, dan produk apa yang
rekomendasi produk kepada pengguna berdasarkan mereka sukai di ‐menyimpan Wi‐Fi. Tim Big Data di
produk mana yang dibeli bersama atau produk mana Walmart Labs menganalisis setiap tindakan yang dapat
yang dibeli sebelum membeli produk tertentu. diklik di Walmart.com—apa yang dibeli konsumen di
Penambangan data yang efektif di Walmart telah dalam toko dan online, apa yang sedang tren di Twitter,
meningkatkan tingkat konversi pelanggannya. Contoh acara lokal seperti San Francisco Giants yang
umum dari penambangan data yang efektif melalui memenangkan Seri Dunia, bagaimana penyimpangan
teknik pembelajaran aturan asosiasi di Walmart adalah— cuaca lokal memengaruhi pola pembelian, dll. Semua
menemukan bahwa penjualan Pop-Tart stroberi peristiwa ditangkap dan dianalisis secara cerdas oleh
meningkat 7 kali lipat sebelum Badai. Setelah aktivitas algoritme Big Data untuk membedakan wawasan yang
penambangan data Walmart mengidentifikasi asosiasi ini, berarti bagi jutaan pelanggan untuk menikmati
ia menempatkan pengalaman belanja yang dipersonalisasi.”4

4 https://www.dezyre.com/article/how-big-data-analysis-helped-increase-walmarts-sales-turnover/109
490 Bab 13 Data dan Basis Data

Menyimpan, menganalisis, dan memahami Big Data membutuhkan alat database dan alat analisis data di
atas dan di luar apa yang telah dijelaskan sebelumnya dalam bab ini. Sebagian besar perusahaan
menggunakan sistem penyimpanan dan analisis Big Data yang disebut Hadoop. Organisasi yang menyimpan
dan menggunakan Big Data menemukan bahwa penyortiran dan analisis data memungkinkan mereka untuk
meramalkan atau memprediksi hal-hal yang sebelumnya sulit untuk diprediksi dengan lebih baik. Seringkali,
sekitar 80–90 persen Big Data adalah data tidak terstruktur yang tidak dapat dianalisis dengan mudah oleh
alat analisis data tradisional. Hadoop adalah alat yang digunakan banyak perusahaan untuk menyimpan dan
menganalisis Big Data dan campurannya antara data terstruktur dan tidak terstruktur.

Secara tradisional, praktik akuntansi selalu menggunakan data terstruktur. Data terstruktur
dengan mudah masuk ke dalam tabel dua dimensi dengan panjang tetap. Misalnya, data
penjualan memiliki data terstruktur yang telah ditentukan dan diharapkan seperti nama
pelanggan, alamat, jumlah yang dibeli, harga per item, dan persyaratan penjualan (seperti net
30). Semakin banyak perusahaan mengumpulkan dan menyimpan data tidak terstruktur seperti
dalam contoh Walmart yang dibahas sebelumnya. Salah satu contohnya adalah komentar
Facebook atau Twitter tentang produk dan layanan mereka. Akuntan sedang dalam proses
menemukan cara untuk menggunakan data tidak terstruktur, dan terutama data tidak
terstruktur dalam basis data yang disebut Big Data.
Akuntan sedang mengeksplorasi cara untuk menggunakan Big Data dan contoh berikut menggambarkan
beberapa cara Big Data digunakan atau mungkin akan digunakan dalam waktu dekat.

• Akuntan dalam perusahaan biasanya menjadi sumber banyak data untuk sistem
pengendalian manajemen. Contohnya adalah akuntansi biaya dan varians
terkait. Big Data dapat meningkatkan jenis analisis data yang dapat diselesaikan
oleh akuntan dan meningkatkan umpan balik dalam sistem pengendalian
manajemen.
• Kantor BPA Empat Besar menemukan bahwa penggunaan alat analisis Big Data memungkinkan
mereka untuk menganalisis semua transaksi (bukan hanya sampel transaksi seperti praktik
audit pada umumnya).
• Auditor internal di perusahaan seperti BlueCross menggunakan analisis ini untuk
menemukan klaim asuransi duplikat dalam jutaan klaim yang mereka proses.
• Komisi Sekuritas dan Bursa (SEC) menggunakan analitik Big Data untuk menemukan penipuan
laporan keuangan atau kegagalan audit. Dengan menganalisis sejumlah besar data keuangan
yang diterimanya dari semua perusahaan publik, ia dapat menemukan perusahaan dengan pola
data yang tidak biasa yang mungkin mengindikasikan penipuan.
• Big Data seperti video dan audio dapat menjadi pelengkap pelaporan
keuangan. Misalnya, daripada hanya melaporkan jumlah biaya historis aset
tetap, perusahaan mungkin dapat menyediakan video yang memberikan
pemahaman yang lebih baik tentang sifat dan nilai aset tetap.
Sementara rincian yang tepat tentang bagaimana akuntan akan menggunakan analitik Big
Data belum sepenuhnya disempurnakan, cukup pasti bahwa akuntan dan auditor perlu
memasukkan Big Data dalam analisis dan laporan mereka. Ini mungkin menjadi lebih penting
bagi Anda saat Anda maju dalam karir akuntansi atau audit Anda. Namun, masih terlalu dini
untuk memahami sepenuhnya dampak Big Data pada praktik akuntansi dan audit.

Kontrol TI untuk Data dan Basis Data


(Tujuan Studi 11)
Database perusahaan adalah komponen yang sangat penting dari organisasi. Data merupakan
sumber daya berharga yang harus dilindungi dengan pengendalian internal yang baik. Bab 4
menjelaskan banyak pengendalian internal TI yang harus digunakan untuk melindungi
Isu Etika Terkait Pengumpulan dan Penyimpanan Data (Tujuan Studi 12) 491

keamanan dan integritas basis data. Ringkasan singkat dari beberapa kontrol TI
ditawarkan di sini. Tiga dari masalah kontrol utama yang terkait dengan database adalah
akses yang tidak sah, cadangan data yang memadai, dan integritas data.
Kontrol umum TI membantu mencegah akses yang tidak sah dan memastikan pencadangan
yang memadai. Untuk membantu mencegah pengguna yang tidak sah mengakses, mengubah,
atau menghancurkan data dalam database, penting untuk menggunakan kontrol otentikasi dan
peretasan seperti prosedur masuk, kata sandi, token keamanan, kontrol biometrik, firewall,
enkripsi, deteksi intrusi, dan kerentanan penilaian. Selain prosedur pengendalian ini, sistem
manajemen basis data (DBMS) harus diatur untuk memungkinkan setiap pengguna yang
berwenang melihat (skema) basis data. Artinya, seorang karyawan yang masuk sebagai
pemroses piutang tidak boleh memiliki akses ke data penggajian. Skema data setiap pengguna
membatasi tampilan pengguna hanya pada sebagian data. Kontrol seperti ini dimaksudkan
untuk mencegah pengguna yang tidak berwenang mengakses atau menggunakan data dalam
database. Perencanaan kelangsungan bisnis, prosedur pencadangan data, dan perencanaan
pemulihan bencana dapat membantu memastikan pencadangan basis data yang memadai.
Untuk memastikan integritas (kelengkapan dan akurasi) data dalam database,
kontrol aplikasi TI harus digunakan. Kontrol ini adalah kontrol input, pemrosesan,
dan output seperti validasi data, total kontrol dan rekonsiliasi, dan laporan yang
dianalisis oleh manajer.

Isu Etika Terkait Pengumpulan dan


Penyimpanan Data (Tujuan Studi 12)
Ada banyak masalah etika yang terkait dengan pengumpulan, penyimpanan, dan perlindungan data
dalam database. Perusahaan mengumpulkan dan menyimpan banyak informasi tentang pelanggan
dalam database mereka. Isu-isu etika yang terkait dengan data tersebut dalam database dapat
diperiksa dari tiga perspektif:

1. Tanggung jawab etis perusahaan kepada pelanggannya


2. Tanggung jawab etis karyawan terhadap perusahaan dan pelanggannya
3. Tanggung jawab etis pelanggan kepada perusahaan
Tanggung jawab etis yang dimiliki perusahaan kepada pelanggan berkisar pada
pengumpulan hanya data yang diperlukan dari pelanggan, melindungi data
pelanggan dengan benar, membatasi pembagian data pelanggan, dan mengoreksi
kesalahan dalam data pelanggan. Tanggung jawab etis karyawan adalah
menghindari penelusuran data atau catatan pelanggan kecuali jika diperlukan, tidak
menjual data pelanggan kepada pesaing, dan tidak mengungkapkan data pelanggan
kepada pihak terkait. Pelanggan juga memiliki tanggung jawab etis terkait dengan
penyediaan data mereka kepada perusahaan yang mereka tangani. Ini termasuk
menyediakan data yang akurat dan lengkap ketika data tersebut diperlukan, dan
menjunjung tinggi kewajiban untuk tidak mengungkapkan atau menggunakan data
perusahaan yang mungkin mereka akses. Masing-masing jenis tanggung jawab ini
dibahas secara rinci di bagian berikut.

Tanggung Jawab Etis Perusahaan


Data yang dikumpulkan dan disimpan dalam database dalam banyak kasus terdiri dari
informasi yang bersifat pribadi antara perusahaan dan pelanggannya. Misalnya, bank
Anda memiliki nomor Jaminan Sosial Anda dalam catatan pelanggan, serta nomor Jaminan
Sosial dari semua pelanggannya. Ini adalah contoh data non-publik yang bank Anda
492 Bab 13 Data dan Basis Data

tidak boleh berbagi dengan orang lain. Bank memiliki kewajiban etis untuk menjaga
privasi data Anda, seperti nomor Jaminan Sosial, saldo rekening, dan nomor telepon Anda.
Semua perusahaan mengumpulkan setidaknya beberapa data pribadi dari pelanggan.
Sensitivitas dan privasi data tersebut bergantung pada sifat bisnis dan jenis layanan atau
produk yang dijual. Misalnya, kantor medis memiliki file yang sangat pribadi dan rahasia
pada setiap pasien. Kantor medis memiliki tanggung jawab yang sangat tinggi untuk
melindungi privasi informasi klien. Di sisi lain, toko buku memiliki sangat sedikit informasi
pribadi atau rahasia dari pelanggan. Namun, toko buku mungkin memiliki beberapa data
yang bersifat pribadi, seperti nomor kartu kredit dan data tentang kebiasaan membeli dan
jenis buku yang dibeli. Bahkan perusahaan yang tidak menjual ke konsumen akhir
mengumpulkan dan menyimpan data pribadi. Misalnya, Anheuser-Busch menjual bir ke
jaringan toko serba ada dan toko kelontong. Setiap rantai yang dijual memiliki data yang
ingin disimpan dari pesaing, seperti data batas kredit, harga yang dibayarkan, dan jumlah
yang dibeli.
Perusahaan online yang menjual melalui situs web memiliki kewajiban yang lebih tinggi
untuk menjaga privasi dan kerahasiaan pelanggan. Faktanya, Prinsip Layanan Kepercayaan
AICPA (dijelaskan dalam Bab 4) memiliki seluruh bagian yang dikhususkan untuk privasi online.
Dalam Prinsip Layanan Kepercayaan, kerangka kerja privasi mencantumkan 10 praktik privasi
yang harus dipatuhi oleh perusahaan online:

1. Manajemen. Tanggung jawab untuk praktik privasi organisasi harus diberikan kepada
orang atau beberapa orang tertentu. Orang yang bertanggung jawab tersebut harus
memastikan bahwa organisasi telah menetapkan dan mendokumentasikan praktik
privasinya, dan bahwa praktik tersebut telah dikomunikasikan kepada karyawan dan
pelanggan. Manajemen juga akan memasukkan tanggung jawab untuk memastikan
bahwa praktik privasi diikuti oleh karyawan.
2. Pemberitahuan. Organisasi harus memiliki kebijakan dan praktik untuk menjaga privasi data
pelanggan. Pemberitahuan menyiratkan bahwa perusahaan memberikan praktik privasi
kepada pelanggan dalam beberapa bentuk. Pada saat data akan dikumpulkan, pemberitahuan
harus diberikan kepada pelanggan yang menjelaskan kebijakan dan praktik privasi. Banyak
organisasi e-commerce mencapai ini dengan menyediakan tautan di situs web mereka ke
kebijakan privasi. Pemberitahuan harus mencakup informasi mengenai tujuan pengumpulan
informasi, dan bagaimana informasi itu akan digunakan.
3. Pilihan dan persetujuan. Organisasi harus memberikan pilihan kepada pelanggannya
mengenai pengumpulan data, dan juga harus meminta persetujuan untuk mengumpulkan,
menyimpan, dan menggunakan data. Pelanggan harus diberi tahu tentang pilihan apa pun
yang mungkin harus dipilih pelanggan untuk tidak memberikan informasi. Pelanggan harus
memiliki akses ke deskripsi tentang pilihan yang tersedia. Pelanggan juga harus dapat
membaca kebijakan tentang bagaimana data akan digunakan.
Seperti pada “Pemberitahuan” di atas, deskripsi ini biasanya berupa tautan ke
kebijakan privasi.
4. Koleksi. Organisasi harus mengumpulkan hanya data yang diperlukan untuk tujuan
melakukan transaksi. Selain itu, pelanggan harus memberikan persetujuan implisit atau
eksplisit sebelum data dikumpulkan. Persetujuan eksplisit dapat berupa pemberian
tanda centang pada kotak yang menunjukkan persetujuan. Persetujuan implisit terjadi
ketika pelanggan memberikan data yang ditandai dengan jelas sebagai sukarela, atau
ketika pelanggan telah memberikan data dan tidak secara jelas menyatakan bahwa data
tersebut tidak dapat digunakan.
5. Penggunaan dan retensi. Organisasi menggunakan data pribadi pelanggan hanya dengan cara yang
dijelaskan dalam “Pemberitahuan” sebagaimana dirinci dalam Poin 2. Penggunaan data ini hanya
terjadi setelah pelanggan memberikan persetujuan implisit atau eksplisit untuk menggunakan data
tersebut. Data pribadi tersebut disimpan hanya selama diperlukan.
Isu Etika Terkait Pengumpulan dan Penyimpanan Data (Tujuan Studi 12) 493

6. Akses. Setiap pelanggan harus memiliki akses ke data yang diberikan sehingga pelanggan dapat
melihat, mengubah, menghapus, atau memblokir penggunaan lebih lanjut dari data yang diberikan.
7. Pengungkapan kepada pihak ketiga. Dalam beberapa kasus, organisasi e-commerce
meneruskan informasi pelanggan ke pihak ketiga. Sebelum penerusan data ini terjadi,
organisasi harus menerima persetujuan eksplisit atau implisit dari pelanggan. Data
pribadi hanya boleh diteruskan ke pihak ketiga yang memiliki perlindungan privasi yang
setara.
8. Keamanan untuk privasi. Organisasi memiliki perlindungan yang diperlukan untuk
mencoba memastikan bahwa data pelanggan tidak hilang, dihancurkan, diubah, atau
tunduk pada akses yang tidak sah. Organisasi harus menerapkan kontrol internal yang
mencegah peretas dan karyawan yang tidak berwenang mengakses data pelanggan.
9. Kualitas. Organisasi harus melembagakan prosedur untuk memastikan bahwa semua
data pelanggan yang dikumpulkan tetap berkualitas. Kualitas data berarti bahwa data
tetap “akurat, lengkap, terkini, relevan, dan andal”.
10. Pemantauan dan penegakan. Organisasi harus terus memantau untuk
memastikan bahwa praktik privasinya diikuti. Organisasi harus memiliki prosedur
untuk menangani pertanyaan atau perselisihan terkait privasi.

Selain kewajiban etis kepada pelanggan ini, perusahaan memiliki kewajiban etis kepada
pemegang saham untuk memastikan bahwa data perusahaan dilindungi dengan benar.
Misalnya, pesaing mungkin mencoba untuk mendapatkan akses ke data perusahaan
melalui apa yang umumnya disebutspionase industri. Data adalah komoditas yang
berharga, dan nilai perusahaan bagi pemegang saham dapat dirugikan jika data sensitif
jatuh ke tangan pesaing.
Untuk melindungi data dengan benar, perusahaan harus memiliki kontrol internal yang
sesuai seperti yang dijelaskan dalam Bab 4. Kontrol ini membantu mencegah akses dan
penelusuran data yang tidak sah. Kontrol, termasuk prosedur masuk, kata sandi, kartu
pintar, kontrol biometrik, enkripsi data, dan firewall, dapat memberikan perlindungan dari
akses tidak sah ke data.

Tanggung Jawab Etis Karyawan


Di dalam organisasi, banyak karyawan harus memiliki akses ke data pribadi tentang klien dan
pelanggan. Karyawan ini memiliki kewajiban etis untuk menghindari penyalahgunaan data pribadi
atau pribadi apa pun tentang pelanggan. Tiga contoh dapat membantu menggambarkan tanggung
jawab etis ini. Karyawan Internal Revenue Service (IRS) secara teratur harus

Dunia nyata
Tidak peduli seberapa luas kontrol yang ada, tidak pernah “pemantauan dan penegakan” yang disebutkan sebelumnya
mungkin untuk sepenuhnya menghilangkan akses yang tidak dimaksudkan untuk membantu menemukan masalah seperti ini
sah. Pada April 2011, Netflix mengungkapkan bahwa mereka dan memperbaikinya dengan cepat. Dalam hal ini, juru bicara
telah memecat seorang karyawan call center yang tidak Netfix mengatakan, "Kami melakukan segala yang kami bisa
disebutkan namanya karena mencuri informasi kartu kredit untuk melindungi data pribadi dan privasi anggota kami, dan
dari pelanggan yang dia ajak bicara di telepon. Perusahaan ketika ada masalah seperti ini, kami menanganinya dengan cepat
menolak untuk mengungkapkan jumlah pelanggan yang dan tegas."5
terpengaruh.

5 http://www.networkworld.com/news/2011/050411-netflix-fires-call-center-worker.html.
494 Bab 13 Data dan Basis Data

melihat dan bekerja dengan pengembalian pajak. Namun, mereka tidak boleh menelusuri, mengungkapkan,
atau menggunakan data pengembalian pajak dengan tidak semestinya. Ini adalah kewajiban hukum, serta
kewajiban etis, dalam kasus IRS. Kantor medis juga menyimpan data yang sangat pribadi tentang riwayat
medis pribadi. Perlindungan data tersebut dari penggunaan yang tidak semestinya merupakan tanggung
jawab etis dan hukum. Dalam kasus ketiga, kewajiban untuk menghindari penyalahgunaan data pelanggan
adalah kewajiban etis, tetapi tidak harus kewajiban hukum. Misalnya, petugas penggajian di sebuah
perusahaan mungkin memiliki akses ke tarif gaji karyawan. Meskipun mungkin tidak ilegal bagi petugas
untuk mengungkapkan tingkat pembayaran ini kepada orang lain, tentu saja tidak etis untuk melakukannya.
Selain itu, beberapa karyawan memiliki akses ke data kepemilikan yang akan berbahaya bagi
perusahaan jika diungkapkan. Contohnya adalah informasi penjualan berdasarkan produk. Pesaing
seperti PepsiCo, Inc., dan Coca-Cola Co. dapat memperoleh keunggulan kompetitif jika salah satu dari
mereka memperoleh pengetahuan terperinci tentang data penjualan yang lain. Karyawan tidak boleh
mengungkapkan data kepemilikan atau rahasia tentang perusahaan mereka kepada pihak luar. Satu
studi baru-baru ini melaporkan bahwa 60 persen karyawan yang berhenti atau diminta untuk
meninggalkan perusahaan akan mencuri data dari majikan mereka setelah keluar. Seringkali
tujuannya adalah untuk mencuri data perusahaan milik sendiri dan memberikannya kepada pesaing.
Tidak ada kontrol TI khusus yang akan selalu mencegah karyawan yang berwenang
untuk mengungkapkan informasi pribadi, tetapi memiliki dan menegakkan kode etik
dalam organisasi dapat mengurangi kemungkinan pengungkapan tersebut. Kontrol TI
yang tepat, seperti prosedur log-in, kata sandi, kartu pintar, kontrol biometrik, enkripsi
data, dan firewall, dapat membantu mengurangi akses tidak sah oleh karyawan.

Tanggung Jawab Etis Pelanggan


Tentu saja, pelanggan memiliki kewajiban untuk memberikan informasi yang akurat dan lengkap
kepada perusahaan yang mereka tangani ketika permintaan data tersebut merupakan kebutuhan
bisnis yang sah. Misalnya, ketika Anda mengajukan permohonan kartu kredit baru, perusahaan
penerbit berhak mendapatkan pengungkapan lengkap dan lengkap tentang riwayat kredit Anda.
Selain kewajiban ini, pelanggan dalam beberapa kasus mungkin memiliki akses ke data perusahaan
yang harus dirahasiakan. Pelanggan memiliki kewajiban etis untuk menghindari penyalahgunaan data
yang mereka peroleh dari mengakses database sebagai pelanggan.

Dunia nyata
Di dekat Lexington, Kentucky, pengembangbiakan dan Pada tahun 1997, seseorang mulai membuat dan
pacuan kuda ras asli adalah industri yang signifikan. Melacak menggunakan rekening nasabah fiktif untuk mengakses
garis keturunan kuda ras asli yang digunakan sebagai database BRISNET. Selama beberapa bulan, orang ini
pejantan dalam pembiakan adalah informasi penting bagi mengakses dan mengunduh data BRISNET. Dia kemudian
mereka yang membiakkan dan membalap kuda ini. Selama memposting data ini ke database dan situs webnya sendiri
tahun 1970-an, sebuah perusahaan bernama Bloodstock dan mulai menjual data dengan harga di bawah harga yang
mulai memelihara database garis keturunan kuda pejantan dibebankan oleh Bloodstock. Setelah ditemukannya
dan kuda betina dan data cacat ras. Peternak dan lainnya tindakan tidak etis ini, Jaksa Distrik Amerika Serikat secara
dapat membuat akun dengan Bloodstock dan mengakses mengejutkan menolak untuk mendakwa pelanggar dengan
database komputer ini dalam memilih kuda pejantan yang kejahatan federal. Namun, Bloodstock diselesaikan di luar
akan digunakan untuk berkembang biak atau untuk balapan pengadilan dengan pelanggar untuk jumlah dolar yang
cacat. Akhirnya, database ini menjadi sumber daya berbasis tidak diungkapkan.6
web yang disebut BRISNET.

6 "Konspirasi Bluegrass," Jurnal Triwulanan AIPLA, Musim Panas 2001, vol. 29, tidak. 3, hlm. 319–322.
Ringkasan Tujuan Studi 495

Ringkasan Tujuan Studi


Kebutuhan akan pengumpulan dan penyimpanan data. Bisnis perlu mengumpulkan dan menyimpan data
sehingga mereka dapat mencatat dan menyelesaikan transaksi dengan benar dalam operasi sehari-hari
mereka. Hal ini memungkinkan perusahaan untuk melakukan transaksi dengan cara yang akan memuaskan
pelanggan dan pemasok. Hal ini juga memungkinkan perusahaan untuk memelihara catatan rinci yang
memfasilitasi tindak lanjut, umpan balik untuk pengambilan keputusan di masa depan, dan penyusunan
laporan keuangan.

Metode penyimpanan data dan hubungan timbal balik antara penyimpanan dan
pemrosesan. Data dapat disimpan dalam karakter, bidang, catatan, file, dan database. Media
tempat data disimpan dapat berupa akses sekuensial atau akses acak. Pilihan media
penyimpanan data mungkin tergantung pada penggunaan data. Data yang diakses secara
berurutan dapat disimpan pada pita magnetik, sedangkan penyimpanan disk digunakan untuk
data yang perlu diakses secara acak atau langsung.

Perbedaan antara pemrosesan batch dan pemrosesan waktu nyata. Pemrosesan batch
melibatkan pengelompokan transaksi serupa ke dalam batch dan memproses semua item ini
bersama-sama. Di sisi lain, pemrosesan real-time melibatkan pemrosesan berkelanjutan, di
mana transaksi diproses segera setelah terjadi atau segera setelah dimasukkan ke dalam
sistem. Meskipun pemrosesan waktu nyata lebih disukai karena respons yang tepat waktu,
sistem batch masih digunakan untuk memproses data dalam jumlah besar karena biayanya
yang lebih rendah dan kemudahan kontrol.

Pentingnya database dan perkembangan historis dari database flat-file ke database


relasional. Sebuah database memungkinkan sebuah organisasi untuk berbagi data, seringkali
di seluruh pengguna yang tersebar luas. Database file datar menyimpan data dalam tabel dua
dimensi dalam format teks. Basis data hierarkis menggunakan struktur pohon terbalik untuk
mendefinisikan hubungan antar data. Basis data jaringan adalah versi lanjutan dari basis data
hierarkis karena menggunakan struktur pohon terbalik; Namun, jaringan berbagi cabang. Basis
data relasional digunakan dalam praktik saat ini lebih dari jenis basis data lainnya. Database
relasional menyimpan data dalam tabel dua dimensi yang digabungkan dalam banyak cara
untuk mewakili berbagai jenis hubungan dalam data.

Perlunya normalisasi data dalam database relasional. Tabel dua dimensi yang
digunakan dalam database relasional harus cukup fleksibel untuk menangani jumlah kueri
yang tidak terbatas. Untuk mendapatkan fleksibilitas ini, tabel database harus dirancang
sesuai dengan spesifikasi yang tepat. Data harus diterjemahkan, atau dinormalisasi, untuk
memenuhi spesifikasi ini.

Data warehouse dan penggunaan data warehouse untuk menganalisis data. Gudang data
adalah kumpulan data terintegrasi yang mencakup periode yang lama (hingga 10 tahun). Data
tidak mudah menguap; namun, digunakan untuk mendukung perencanaan strategis
perusahaan dan pengambilan keputusan berkelanjutan dari para manajernya. Untuk
membangun gudang data, data harus diidentifikasi, distandarisasi, dan dibersihkan sebelum
diunggah. Database operasional, di sisi lain, berisi data periode saat ini yang terus diperbarui
untuk mendukung operasi dan pelaporan saat ini.

Penggunaan OLAP dan data mining sebagai alat analisis. Data mining melibatkan analisis data
untuk pola yang dapat digunakan untuk memprediksi perilaku masa depan. Teknik data mining
digunakan dalam organisasi bisnis untuk memprediksi perilaku pembelian pelanggan. OLAP juga
digunakan untuk mencari trend atau pola dalam data. OLAP adalah perangkat lunak yang
memungkinkan manajer untuk mengakses dan menganalisis data di gudang data.
496 Bab 13 Data dan Basis Data

Database terdistribusi dan keuntungan penggunaan data terdistribusi.


Pemrosesan data terdistribusi sangat penting di perusahaan di mana operasi
tersebar di beberapa lokasi. Basis data terdistribusi adalah sistem basis data
jaringan yang tersebar. Pemrosesan data terpusat, di sisi lain, mengharuskan
database dipelihara di satu lokasi terpusat, biasanya kantor pusat perusahaan.

Database berbasis cloud. Tren yang berkembang adalah penggunaan database cloud. Perusahaan
yang menyimpan datanya dalam database cloud memiliki keunggulan skalabilitas, akses yang
diperluas, pengurangan infrastruktur TI, dan penghematan biaya. Namun, itu harus bergantung pada
kontrol penyedia cloud yang berkaitan dengan keamanan, ketersediaan, integritas pemrosesan, dan
kerahasiaan.

Big Data dan analitik data. Jumlah dan variasi data yang dikumpulkan dan disimpan oleh
perusahaan terus berkembang secara dramatis. Big Data adalah data yang sangat besar dan
kompleks sehingga perangkat lunak dan alat database yang khas tidak memadai untuk
menanganinya. Akuntan mencoba menentukan bagaimana menggunakan analitik data pada basis
data besar ini untuk meningkatkan informasi akuntansi, pelaporan, dan audit.

Kontrol untuk data dan database. Organisasi bisnis harus berhati-hati dalam
memastikan perlindungan dan keamanan datanya. Kontrol yang paling penting untuk
perlindungan data termasuk akses tidak sah, cadangan data yang memadai, dan
integritas data. Topik-topik ini dibahas secara rinci dalam Bab 4.

Masalah etika terkait pengumpulan dan penyimpanan data. Perusahaan memiliki kewajiban
etis kepada pelanggan dan karyawan mereka, sementara pelanggan dan karyawan memiliki
kewajiban etis satu sama lain dan kepada perusahaan dengan siapa mereka berbisnis. Masing-
masing pihak ini harus berhati-hati dalam urusan bisnis mereka sehingga informasi rahasia
tidak dibocorkan kepada pihak luar. Karyawan juga memiliki kewajiban etis untuk melindungi
informasi yang diperoleh selama pekerjaan mereka; informasi tersebut tidak boleh dibagikan
kepada orang lain. Terakhir, pelanggan memiliki kewajiban untuk memberikan informasi yang
lengkap dan akurat kepada perusahaan yang berbisnis dengan mereka.

Istilah Utama

Atribut Gudang data Basis data hierarkis Akses acak


Pemrosesan batch Basis data Proses berdampak tinggi Pemrosesan waktu nyata

Data besar Basis data Spionase industri Catatan


Pemrosesan terpusat Sistem Menejemen Informasi Penunjuk rekaman

Karakter Akses penyimpanan langsung Pita magnetik Basis data relasional


Basis data berbasis cloud Penyimpanan disk Banyak-ke-banyak hubungan Akses berurutan
Konkurensi Pemrosesan terdistribusi Basis data jaringan Data terstruktur
Konsolidasi Telusuri OLAP Kueri terstruktur
Data Laporan pengecualian Hubungan satu-ke-banyak bahasa
Penambangan data Bidang Hubungan satu-ke-satu Analisis deret waktu
Normalisasi data Mengajukan Berputar Data tidak terstruktur

Redundansi data Basis data file datar Kunci utama Simulasi bagaimana-jika
Materi Akhir Bab 497

Materi Akhir Bab


Cek Konsep A. Jaringan
1 Manakah dari berikut ini yang paling menggambarkan B. Hirarki
hubungan antara data dan informasi? C. relasional
A. Data diartikan informasi. D. Sekuensial
B. Informasi diartikan data. 8 Basis data perusahaan berisi tiga jenis catatan: vendor,
C. Data lebih berguna daripada informasi dalam suku cadang, dan pembelian. Catatan vendor mencakup
pengambilan keputusan. nomor vendor, nama, alamat, dan persyaratan. Catatan
D. Data dan informasi tidak berhubungan. A
bagian termasuk nomor bagian, nama, deskripsi, dan
lokasi gudang. Catatan pembelian mencakup nomor
2 karakter adalah ke lapangan sebagai
pembelian, nomor vendor (yang merujuk pada catatan
A. air untuk kolam vendor), nomor suku cadang (yang merujuk pada
B. kolam adalah untuk perenang catatan suku cadang), dan kuantitas. Apa struktur
database yang digunakan?
C. kolam adalah untuk air

D. gelas adalah air Pita


A. Jaringan
3 magnetik adalah bentuk
B. Hirarki
A. media akses langsung
C. relasional
B. media akses acak
D. Sekuensial
C. media akses berurutan
9 Manakah dari pernyataan berikut ini yang tidak benar
D. media akses abjad sehubungan dengan database relasional?
4 Manakah dari berikut ini yang bukan keuntungan menggunakan A. Ini fleksibel dan berguna untuk kueri ad hoc yang tidak
pemrosesan data waktu nyata? direncanakan.
A. Waktu respons yang cepat untuk mendukung pencatatan B. Ini menyimpan data dalam tabel.
yang tepat waktu dan kepuasan pelanggan
C. Ini menyimpan data dalam formasi pohon.
B. Efisiensi untuk digunakan dengan volume data yang besar
D. Itu dipertahankan pada perangkat akses langsung.
C. Menyediakan akses acak data
10 Kumpulan data nonvolatil beberapa tahun yang digunakan untuk
D. Peningkatan akurasi karena pencatatan transaksi mendukung pengambilan keputusan strategis adalah a(n)
secara langsung
A. basis data operasional
5 Jika sebuah perusahaan menyimpan data dalam file terpisah di lokasi
B. gudang data
departemen yang berbeda dan dapat memperbarui semua file secara
bersamaan, itu tidak akan memiliki masalah dengan C. tambang data

A. atribut D. simulasi bagaimana jika

B. redundansi data 11 Penambangan data akan berguna dalam semua situasi


berikut kecuali:
C. spionase industri
A. mengidentifikasi pola tersembunyi dalam kebiasaan
D. konkurensi
membeli pelanggan
6 Ketika data yang terkandung dalam database disimpan
B. menilai reaksi pelanggan terhadap produk baru
dalam tabel dua dimensi yang besar, database disebut
sebagai C. menentukan pola perilaku pelanggan
A. database file datar D. mengakses riwayat pembayaran pelanggan

B. basis data hierarkis 12 Sekumpulan database kecil tempat data dikumpulkan,


diproses, dan disimpan di banyak komputer dalam jaringan
C. basis data jaringan
adalah
D. database relasional
A. database terpusat
7 Sistem manajemen basis data dikategorikan berdasarkan
B. database terdistribusi
struktur data yang didukungnya. Dalam sistem manajemen
basis data jenis apa data disusun dalam serangkaian tabel? C. database file datar

D. proses berdampak tinggi


498 Bab 13 Data dan Basis Data

13 Masing-masing dari berikut ini adalah praktik privasi online 28 (SO 5) Tipe model database mana yang paling fleksibel
yang direkomendasikan oleh AICPA Trust Services Principles untuk query? Bagaimana fleksibilitas ini membantu
Privacy Framework kecuali: manajemen?
A. Data yang berlebihan harus dihilangkan dari 29 (SO 5) Apa tiga aturan normalisasi pertama? Apa yang
database. dimaksud dengan pernyataan bahwa aturan
B. Pemberitahuan kebijakan privasi harus diberikan kepada normalisasi bersifat aditif?
pelanggan. 30 (SO 6) Bedakan antara gudang data dan database
C. Informasi pribadi tidak boleh diberikan kepada pihak operasional.
ketiga tanpa persetujuan pelanggan. 31 (SO 7) Bagaimana data mining berbeda dari data
D. Semua yang di atas. warehousing?
32 (SO 7) Bagaimana Anheuser-Busch menggunakan data
Pertanyaan Diskusi warehousing dan data mining dengan sukses?
14 (SO 1) Bagaimana data berbeda dari informasi? 33 (SO 7) Identifikasi dan jelaskan alat
15 (SO 1) Mengapa penting bagi perusahaan untuk analisis di OLAP.
menyimpan data transaksi? 34 (SO 8) Bedakan antara pemrosesan data
16 (SO 2) Jenis media penyimpanan data apa yang terpusat dan pemrosesan data terdistribusi.
paling tepat ketika satu record data harus sering 35 (SO 9) Mengapa perusahaan kecil dengan
diakses dan cepat? 400 karyawan merasa menguntungkan menggunakan
17 (SO 3) Identifikasi satu jenis bisnis yang kemungkinan akan database cloud (DaaS)?
menggunakan pemrosesan data waktu nyata daripada 36 (SO 10) Jelaskan istilah Big Data dan data
pemrosesan batch. Jelaskan keuntungan dari pemrosesan real- analytics.
time untuk jenis bisnis ini.
37 (SO 11) Mengapa kontrol atas akses yang tidak sah
18 (SO 4) Bedakan antara redundansi data dan begitu penting dalam lingkungan database?
konkurensi. 38 (SO 11) Apa saja tindakan pengendalian internal
19 (SO 4) Apa istilah untuk program perangkat lunak yang yang dapat mencegah peretas mengubah data di
memantau dan mengatur database dan mengontrol akses dan database perusahaan Anda?
penggunaan data? Jelaskan bagaimana perangkat lunak ini
39 (SO 11) Mengapa data dianggap sebagai sumber daya berharga
mengontrol akses bersama.
yang layak dilindungi secara ekstensif?
20 (SO 4) Jelaskan trade-off menggunakan model
hirarkis penyimpanan database.
Latihan Singkat
21 (SO 4) Jelaskan organisasi database file
datar. 40 (SO 2) Susunlah konsep penyimpanan data berikut
ini dari yang terkecil sampai yang terbesar,
22 (SO 4) Apa empat kondisi yang diperlukan untuk
berdasarkan ukurannya: file, record, database,
semua jenis database?
character, dan field.
23 (SO 4) Dalam database hierarki, apa nama untuk
41 (SO 2) Pikirkan database yang akan dibutuhkan di sebuah
hubungan bawaan dalam tabel data? Hubungan
perusahaan jasa profesional untuk memelihara daftar kontak
data mana yang dapat dimuat dalam database
klien/pasien di kantor CPA, pengacara, atau dokter medis.
hierarkis?
Identifikasi bidang yang mungkin digunakan dalam database
24 (SO 4) Model database mana yang dibangun di atas ini. Jika Anda sedang membangun database ini, berapa banyak
struktur pohon terbalik? Apa kerugian menggunakan ruang yang akan Anda izinkan untuk setiap bidang?
struktur pohon terbalik untuk database?
25 (SO 4) Model database mana yang paling sering digunakan 42 (SO 3) Misalkan sebuah perusahaan besar menggunakan
dalam dunia bisnis modern? Mengapa Anda yakin itu sering pemrosesan batch untuk mencatat pembelian
digunakan? persediaannya. Selain waktu responsnya yang lambat,
26 (SO 5) Bagaimana kunci utama digunakan dalam apa masalah paling signifikan dengan menggunakan
database relasional? sistem pemrosesan batch untuk mencatat pembelian

27 (SO 5) Bahasa apa yang digunakan untuk mengakses inventaris?

data dari database relasional? Mengapa bahasanya lebih 43 (SO 4) Atur model database berikut dalam urutan dari
baik saat mengakses data? pengembangan paling awal hingga yang terbaru:
Masalah 499

database jaringan, database hierarkis, database file 45 (SO 6) Bagaimana sebuah perusahaan dapat menggunakan
datar, dan database relasional. database operasional dan gudang data dalam penyusunan

44 (SO 4) Kategorikan masing-masing berikut sebagai satu-ke-satu, laporan tahunannya?

satu-ke-banyak, atau banyak-ke-banyak: 46 (SO 7) Dengan menggunakan contoh BudNet Anheuser-Busch yang

• Buku besar pembantu dan buku besar umum disajikan dalam bab ini, pikirkan pertanyaan yang mungkin berharga

• Transaksi dan jurnal khusus jika perusahaan seperti Gap, Inc., menggunakan penambangan data

• Buku besar dan neraca saldo untuk memantau perilaku pembelian pelanggannya.

Masalah
47 (SO 3) Bedakan antara pemrosesan batch dan pemrosesan 54 (SO 10) Jelaskan bagaimana firma CPA menggunakan
waktu nyata. Apa kelebihan dan kekurangan masing- Big Data dan analitik data dalam audit klien mereka.
masing bentuk pengolahan data? Formulir mana yang lebih 55 (SO 10) Pertimbangkan bagaimana audit telah berubah dengan
mungkin digunakan oleh kantor dokter dalam menyiapkan membandingkan teknik audit sebelum tahun 1980-an ketika
tagihan bulanan pasien? banyak perusahaan menyiapkan catatan akuntansi manual dan
48 (SO 4) Arminello, Inc. tidak menggunakan sistem database; ada audit manual, versus audit hari ini yang menggunakan
alih-alih, ia memelihara file data terpisah di setiap teknik komputerisasi untuk menganalisis data.
departemennya. Dengan demikian, ketika penjualan
terjadi, transaksi tersebut pada awalnya dicatat di 56 (SO 10) Apa saja manfaat dan hasil yang dapat dihasilkan
departemen penjualan. Selanjutnya, dokumentasi dari pemeriksaan Big Data sehubungan dengan
diteruskan dari departemen penjualan ke departemen pemrosesan inventaris perusahaan?
akuntansi sehingga transaksi dapat dicatat di sana.
57 (SO 10) Apa saja manfaat dan hasil yang dapat dihasilkan
Terakhir, grup layanan pelanggan diberi tahu agar
dari pemeriksaan Big Data sehubungan dengan
catatannya dapat diperbarui. Jelaskan masalah redundansi
pemrosesan transaksi pembelian perusahaan?
data dan konkurensi yang mungkin muncul di bawah
skenario ini di Arminello. 58 (SO 10) Apa saja manfaat dan hasil yang dapat dihasilkan
dari pemeriksaan Big Data sehubungan dengan
49 (SO 6) Sebutkan dan jelaskan langkah-langkah yang terlibat
pemrosesan transaksi pendapatan perusahaan?
dalam membangun gudang data.
59 (SO 12) Jelaskan kewajiban etis perusahaan
50 (SO 8) Jelaskan keuntungan dan kerugian
kepada pelanggan online mereka.
menggunakan database terdistribusi dan pengolahan
data terdistribusi. Apakah menurut Anda kelebihannya 60 (SO 9) Baca artikelnya di http://www.eweek . com/c/a/
layak? Jelaskan jawabanmu. Enterprise-Networking/IBM-memindahkan pelanggan-ke-
SmartCloud-untuk-Kolaborasi-147563. Jelaskan bagaimana
51 (SO 6) Baca artikel online di http://www.
pelanggan IBM yang disebutkan dalam artikel menggunakan
xconomy.com/boston/2010/09/20/netezza-sold-to-
Cloud Cerdas IBM.
ibm-for-1-7b-will-help-big-blue-tackle-big-data/.
Jelaskan layanan yang ditawarkan Netezza dan 61 (SO 8) Menggunakan mesin pencari Internet, cari
mengapa IBM ingin membeli perusahaan ini. menggunakan istilah Spanner dan “database terdistribusi.”
Jelaskan bagaimana dan mengapa Google menggunakan
52 (SO 10) Big Data semakin penting bagi perusahaan dan
database terdistribusi. Masalah apa yang dihadapi Google
akuntan. Menggunakan pencarian web di Google atau situs
terkait dengan basis data terdistribusinya?
pencarian lainnya, temukan artikel dalam 12 bulan terakhir
tentang "Big Data" dan akuntansi. Ringkaslah bagaimana 62 (SO 11) Sebutkan dan jelaskan sepuluh praktik privasi yang
artikel tersebut menjelaskan penggunaan Big Data dalam direkomendasikan oleh AICPA Trust Services Principles Privacy
konteks akuntansi. Framework. Jika Anda pernah melakukan pembelian secara
online, Anda mungkin pernah melihat praktik ini digunakan.
53 (SO 10) Jelaskan bagaimana organisasi perawatan kesehatan,
Berikan contoh apa pun dari pengalaman pribadi Anda.
seperti rumah sakit atau klinik medis, dapat menggunakan Big Data
dan analitik data dibandingkan dengan perusahaan manufaktur.
500 Bab 13 Data dan Basis Data

kasus
63 Zip Shuttle Service mengoperasikan van antar-jemput bandara Kartu “Kroger Plus”. Pelanggan yang mendaftar di sistem ini
di 12 kota besar: Los Angeles, San Diego, San Francisco, berhak mendapatkan diskon produk di toko Kroger dan bensin.
Phoenix, Las Vegas, Houston, Dallas, Chicago, Kota New York, Untuk mendapatkan diskon dan hadiah lainnya, pembeli harus
Washington DC, Miami, dan Orlando. Zip mengoperasikan van menggunakan kartu “Kroger Plus” pada saat checkout. Kartu
penumpang untuk mengantar wisatawan ke dan dari bandara tersebut memiliki kode batang yang mengidentifikasi
dengan biaya $25 per orang. pelanggan. Sistem ini memungkinkan Kroger untuk
menentukan pola pembelian pelanggan dan menggunakan
Yg dibutuhkan:
data untuk penambangan data.
A. Rancang tabel yang akan dibutuhkan perusahaan dalam databasenya
Yg dibutuhkan:
untuk mengoperasikan angkutan ini. Ingatlah bahwa mereka harus
mengumpulkan, mencatat, dan melacak informasi tentang Menggunakan mesin pencari Web, cari “data mining” dan “grocery.”
pelanggan, pembayaran, penerbangan, gerbang, van, pengemudi, Jelaskan jenis informasi yang dikumpulkan toko kelontong yang
dan alamat penjemputan dan pengantaran. dapat mereka gunakan untuk tujuan penambangan data. Juga,
Anda mungkin ingin menambahkan jenis data lainnya. jelaskan bagaimana rantai toko kelontong menggunakan
Tabel yang Anda desain harus memiliki atribut (kolom) penambangan data untuk meningkatkan kinerja.
untuk setiap bagian data yang penting. Lihat Tampilan 65 Tangkapan layar berikut menunjukkan hubungan yang
13‑4 untuk konsep tata letak tabel. Tabel Anda harus dikirimkan dalam database Microsoft Access. Untuk setiap
memenuhi tiga aturan normalisasi data pertama. hubungan, jelaskan berikut ini:

A. Jenis hubungan orang tua-anak yang


B. Jelaskan keuntungan dan kerugian Zip diwakilinya.
menggunakan database terpusat dibandingkan
B. Atribut mana dalam tabel yang digunakan untuk
dengan database terpisah untuk setiap lokasi.
menghubungkan hubungan?
64 Kroger Co., sebuah rantai grosir nasional yang besar,
C. Tujuan dari hubungan.
memelihara sistem penghargaan pelanggan berjudul
Solusi untuk Pemeriksaan Konsep 501

Solusi untuk Pemeriksaan Konsep


1 (SO 1) Pernyataan berikut paling tepat menggambarkan termasuk nomor bagian, nama, deskripsi, dan lokasi
hubungan antara data dan informasi: gudang. Catatan pembelian mencakup nomor
B. Informasi adalah data yang ditafsirkan. Informasi berguna pembelian, nomor vendor (yang merujuk pada catatan
untuk pengambilan keputusan, sedangkan data biasanya vendor), nomor suku cadang (yang merujuk pada
memerlukan pemrosesan sebelum menjadi praktis untuk catatan suku cadang), dan kuantitas. Struktur
digunakan dalam proses pengambilan keputusan. database yang digunakan adalahC. relasional, karena
2 (SO 2) A karakter adalah untuk bidang sebagai A. air untuk kolam. tautan tersebut terkandung dalam catatan data itu
Dalam terminologi penyimpanan data, karakter terkandung dalam sendiri. Jawaban a. dan B. tidak benar karena struktur
suatu bidang. ini akan memiliki penunjuk arah atau pohon, masing-
masing, daripada nilai data eksplisit. Jawaban d. tidak
3 (SO 2) Pita magnetik adalah bentuk C. media akses
benar karena merupakan metode akses daripada
berurutan. Pita magnetik harus diakses sesuai urutan
struktur database.
rekamannya.
9 (CIA Diadaptasi) (SO 4, SO 5) Pernyataan berikut tidak
4 (SO 3) Berikut ini bukan keuntungan menggunakan
benar berkaitan dengan database relasional:
pemrosesan data waktu nyata: B. efisiensi untuk digunakan
C. Ini menyimpan data dalam formasi pohon. Respons ini
dengan volume data yang besar. Ini adalah karakteristik
adalah karakteristik dari database hierarkis.
pemrosesan batch daripada pemrosesan waktu nyata.
10 (SO 6) Kumpulan data nonvolatile beberapa tahun yang
5 (SO 4) Jika sebuah perusahaan menyimpan data dalam file terpisah
digunakan untuk mendukung pengambilan keputusan
di lokasi departemen yang berbeda dan dapat memperbarui semua
strategis adalah a B. gudang data. Data di gudang data
file secara bersamaan, itu tidak akan memiliki masalah dengan D.
tidak berubah kecuali sesekali mengunggah data baru.
konkurensi. Masalah konkurensi muncul ketika perusahaan
mengalami kesulitan memperbarui data di berbagai lokasi pada 11 (SO 7) Data mining akan berguna dalam semua situasi
waktu yang sama. berikut kecuali: C. menilai riwayat pembayaran
pelanggan. Menilai riwayat pembayaran pelanggan
6 (SO 4) Ketika data yang terkandung dalam database
kemungkinan akan membutuhkan gudang data,
disimpan dalam tabel dua dimensi yang besar, database
sedangkan penambangan data difokuskan pada pola
disebut sebagai A. database file datar. Dua dimensi
perilaku.
untuk database file datar adalah baris dan kolom.
12 (SO 8) Satu set database kecil di mana data dikumpulkan,
diproses, dan disimpan di beberapa komputer dalam
7 (CIA Adapted) (SO 4) Sistem manajemen basis data
jaringan adalah B. database terdistribusi.
dikategorikan berdasarkan struktur data yang didukungnya.
Di sebuah C. relasionalsistem manajemen database, 13 (SO 11) Setiap pernyataan yang diberikan adalah praktik
data disusun dalam serangkaian tabel. privasi online yang direkomendasikan oleh AICPA Trust
Services Principles Privacy Framework kecuali yang
8 (CIA Adapted) (SO 4) Basis data perusahaan berisi tiga
berikut: A. Data yang berlebihan harus dihilangkan
jenis catatan: vendor, suku cadang, dan pembelian.
dari database. Redundansi dibahas dalam aturan
Catatan vendor mencakup nomor vendor, nama,
normalisasi data, tetapi tidak dalam Kerangka Privasi
alamat, dan persyaratan. Catatan bagian
AICPA.

Anda mungkin juga menyukai