PENDAHULUAN
Penyimpanan data dianggap oleh beberapa orang untuk menjadi jantung tem suatu
informasi sistematis. Pertama, data harus tersedia ketika pengguna ingin
menggunakannya. Kedua, data harus akurat dan konsisten (mereka harus memiliki
integritas). Di luar persyaratan ini, tujuan dari desain database mencakup penyimpanan
data yang efisien serta memperbarui efisien dan pengambilan. Akhirnya, perlu bahwa
pencarian informasi menjadi tujuan. Informasi yang diperoleh dari data yang disimpan harus
dalam bentuk yang berguna untuk mengelola, perencanaan, pengendalian, atau pengambilan
keputusan.
Ada dua pendekatan untuk penyimpanan data dalam sistem berbasis komputer. Yang pertama adalah untuk
menyimpan data dalam file individual, masing-masing yang unik untuk aplikasi tertentu. Pendekatan kedua
melibatkan membangun database. Database adalah toko resmi didefinisikan dan dikendalikan secara terpusat data
dimaksudkan untuk digunakan dalam aplikasi yang berbeda.
file individual sering dirancang hanya dengan kebutuhan mendesak dalam pikiran, sehingga
menjadi im- portant untuk query sistem untuk kombinasi dari beberapa atribut, atribut ini
mungkin terkandung dalam file terpisah atau mungkin bahkan tidak ada. Database
direncanakan, sehingga data yang diselenggarakan untuk penyimpanan yang efisien dan
pengambilan efektif. gudang data basis data- sangat besar yang menyimpan data diringkas
berkaitan dengan subjek tertentu sehingga pertanyaan dijawab sangat efisien.
BAB II
PEMBAHASAN
1
2.1 DATABASES
Database tidak hanya kumpulan file. Database adalah sumber utama data berarti
untuk digunakan bersama oleh banyak pengguna untuk berbagai aplikasi. Jantung
database adalah database sistem manajemen (DBMS), yang memungkinkan penciptaan,
modifikasi, dan mengupdate database; pengambilan data; dan generasi laporan dan
menampilkan. Orang yang memastikan bahwa database memenuhi tujuannya disebut
administrator database.
Tujuan efektivitas database meliputi :
1. Memastikan bahwa data dapat dibagi di antara pengguna untuk berbagai aplikasi.
2. Menjaga data yang akurat dan konsisten.
3. Memastikan bahwa semua data yang diperlukan untuk aplikasi saat ini dan masa
mendatang akan tersedia.
4. Membiarkan database untuk berkembang sebagai kebutuhan pengguna.
5. Membiarkan pengguna untuk membangun pandangan pribadi mereka dari data
tanpa memperhatikan cara data secara fisik disimpan.
2
a. Entitas
Setiap objek atau peristiwa yang dipilih seseorang untuk mengumpulkan data
adalah suatu entitas. Entitas mungkin orang, tempat, atau sesuatu (misalnya,
seorang tenaga penjualan, kota, atau produk). Setiap entitas dapat juga menjadi
peristiwa atau satuan waktu seperti gangguan mesin, penjualan, atau bulan atau
tahun. Entitas kecil tambahan yang disebut entitas subtipe. simbol adalah persegi
panjang kecil dalam entitas persegi panjang.
Suatu entitas subtipe adalah hubungan khusus satu-ke-satu digunakan untuk
mewakili atribut tambahan (bidang) dari entitas lain yang mungkin tidak hadir
pada setiap catatan dari entitas pertama. Contohnya adalah entitas utama
pelanggan. pelanggan mungkin menyukai bidang khusus yang berisi informasi
diskon, dan informasi ini akan berada dalam suatu entitas subtipe.
b. Hubungan (Relationship)
Hubungan adalah asosiasi antara entitas (kadang-kadang mereka disebut asosiasi
data). Gambar 13.2 adalah entitas-hubungan (E-R) diagram yang menunjukkan
berbagai jenis hubungan.
Jenis pertama dari hubungan adalah hubungan satu-ke-satu (ditunjuk sebagai 1:
1) :
3
Tipe lain dari hubungan adalah satu-ke-banyak (1: M) atau banyak-ke-satu
asosiasi.
4
c. Contoh Entitas – Hubungan :
Diagram relasi entitas yang mengandung banyak entitas, berbagai jenis
hubungan, dan berbagai atribut ditampilkan dalam Gambar 13.4. Dalam E-R
diagram, kita prihatin tentang sistem penagihan, dan khususnya dengan bagian
resep sistem. (Untuk mempermudah, kita mengasumsikan bahwa kunjungan
kantor ditangani secara berbeda dan berada di luar ruang lingkup sistem ini.)
Entitas adalah RESEP, DOKTER, PASIEN, dan ASURANSI CARRIER. Entitas
PENGOBATAN tidak penting untuk sistem penagihan, tetapi itu adalah bagian
dari diagram E-R karena digunakan untuk menjembatani kesenjangan antara
RESEP dan PASIEN. Oleh karena itu kita menarik sebagai entitas asosiatif pada
gambar.
Di sini, seorang DOKTER merawat banyak PASIEN (s) (1: M), yang masing-
masing berlangganan individu KARIR ASURANSI. Tentu saja, PASIEN hanya
satu dari banyak pasien yang berlangganan
untuk ASURANSI CARRIER tertentu (M: 1).
Untuk melengkapi catatan DOKTER ini, dokter perlu menyimpan informasi
tentang perawatan PASIEN. Banyak PASIEN (s) memiliki pengalaman
PENGOBATAN (s), sehingga banyak-ke-banyak (M: N) hubungan.
PENGOBATAN diwakili sebagai entitas asosiatif karena itu tidak penting dalam
5
sistem penagihan. PENGOBATAN (s) dapat mencakup pengambilan RESEP (s),
dan dengan demikian juga hubungan M: N, karena banyak perawatan mungkin
panggilan untuk kombinasi dari obat-obatan dan banyak obat dapat bekerja untuk
banyak perawatan.
Beberapa detail kemudian diisi untuk atribut. Atribut tercantum di samping
masing-masing entitas, dan kuncinya digarisbawahi. Misalnya, entitas RESEP
memiliki NAMA PRODUK, DOSIS, PRODUSEN, dan JUMLAH. Idealnya, itu
akan bermanfaat untuk merancang database dalam mode ini, menggunakan
diagram relasi entitas dan kemudian mengisi rincian tentang atribut. pendekatan
top-down ini diinginkan, tapi kadang-kadang sangat sulit untuk dicapai.
d. Atribut
Atribut adalah beberapa karakteristik dari suatu entitas. Ada banyak atribut untuk
setiap entitas. Misalnya, seorang pasien (entitas) dapat memiliki banyak atribut,
seperti nama belakang, nama depan, alamat jalan, kota, negara, dan sebagainya.
Tanggal kunjungan terakhir pasien serta rincian resep juga atribut. Ketika kamus
data dibahas dalam Bab 8, yang terkecil khususnya dijelaskan disebut elemen
data. Ketika file dan database yang dibahas, elemen data ini umumnya disebut
6
sebagai item data. item data tersebut sebenarnya unit terkecil dalam sebuah file
atau database. Istilah Item data juga digunakan bergantian dengan atribut kata.
Item data dapat memiliki nilai. Nilai-nilai ini dapat menjadi tetap atau memiliki
panjang variabel; dapat berupa abjad, numerik, karakter khusus, atau
alfanumerik. Contoh item data dan nilai-nilainya dapat ditemukan pada Gambar
13.5.
Kadang-kadang item data juga disebut sebagai field. Sebuah field,
bagaimanapun, merupakan sesuatu yang fisik, tidak logis. Oleh karena itu,
banyak item data dapat dikemas ke field; field dapat dibaca dan dikonversi ke
sejumlah item data. Sebuah contoh umum ini adalah untuk menyimpan tanggal
dalam satu bidang seperti MM / DD / YYYY. Untuk mengurutkan file dalam
rangka berdasarkan tanggal, tiga item data terpisah yang diambil dari field dan
diurutkan pertama dengan YYYY, maka dengan MM, dan akhirnya oleh DD.
e. Pencatatan (Records)
Sebuah catatan adalah kumpulan item data yang memiliki sesuatu yang sama
dengan entitas yang dijelaskan. Gambar 13.6 adalah sebuah ilustrasi dari
pencatatan dengan banyak item data terkait. Pencatatan yang ditampilkan adalah
untuk pesanan ditempatkan dengan perusahaan mail-order. ORDER-#, LAST
7
NAME, INITIAL, STREET ADDRESS, CITY, STATE, and CREDIT CARD
semua atribut. Kebanyakan catatan memiliki panjang yang tetap, sehingga tidak
perlu untuk menentukan panjang dari catatan setiap kali.
f. Kunci (Keys)
Kunci adalah salah satu item data dalam catatan yang digunakan untuk
mengidentifikasi catatan. Ketika kunci yang unik mengidentifikasi catatan, hal
itu disebut primary key. Misalnya, order-# dapat menjadi primary kunci karena
hanya satu nomor yang ditugaskan untuk setiap pesanan pelanggan. Dengan cara
ini, kunci utama mengidentifikasi entitas dunia nyata (pesanan pelanggan).
Perhatian khusus harus diambil saat merancang kunci utama. Seringkali itu
adalah nomor urut atau nomor urut dengan sejumlah pengecekan sendiri (disebut
cek digit) pada akhir angka. Pada saat ada beberapa makna yang dibangun ke
dalam kunci utama, tetapi mendefinisikan kunci primer berdasarkan atribut
dianggap risiko. Jika atribut berubah, kunci utama juga akan berubah,
menciptakan ketergantungan antara kunci primer dan data.
Contoh kunci utama berdasarkan data yang menggunakan singkatan negara
untuk nama negara
atau bagasi kode maskapai untuk nama bandara. Sebuah atribut atau kumpulan
atribut yang dapat berfungsi sebagai kunci utama disebut kunci kandidat. Kunci
utama juga harus minimal dan tidak mengandung atribut tambahan dari yang
diperlukan untuk mengidentifikasi rekor.
Kunci disebut kunci sekunder jika tidak dapat secara unik mengidentifikasi
catatan. kunci sekunder baik mungkin unik atau mungkin mengidentifikasi
beberapa catatan dalam database. kunci sekunder dapat digunakan untuk memilih
8
sekelompok record yang dimiliki set (misalnya, perintah dari negara bagian
Virginia).
Ketika itu tidak mungkin untuk mengidentifikasi record unik dengan
menggunakan salah satu item data yang ditemukan di catatan, kunci dapat
dibangun dengan memilih dua atau lebih item data dan menggabungkan mereka.
Kunci ini disebut bersambung, atau kunci komposit. Ketika item data yang
digunakan sebagai kunci dalam catatan, yang deskripsi digarisbawahi. Oleh
karena itu, dalam catatan PESANAN (pesanan-#, NAMA TERAKHIR, AWAL,
STREET ADDRESS, KOTA, NEGARA, KARTU KREDIT), kuncinya adalah
pesanan-#. Jika atribut adalah kunci dalam file lain, perlu digarisbawahi dengan
garis putus-putus.
Beberapa database memungkinkan pengembang untuk menggunakan identifier
objek (OID), yang merupakan kunci unik untuk setiap record dalam database,
tidak hanya di tabel. Mengingat identifier objek, satu record akan diperoleh
terlepas dari tabel yang ada. Ini mungkin disertakan dengan pesanan atau
pembayaran yang dikonfirmasi, bersama dengan pesan seperti, "Ini adalah nomor
konfirmasi Anda."
g. Metadata
Metadata adalah data tentang data dalam file atau database. Metadata
menggambarkan nama yang diberikan dan panjang yang ditugaskan untuk setiap
item data. Metadata juga menjelaskan panjang dan komposisi dari masing-
masing catatan.
Gambar 13.7 adalah contoh metadata untuk database untuk beberapa perangkat
lunak generik. Panjang setiap item data diindikasikan menurut konvensi, di mana
7,2 berarti bahwa tujuh ruang dicadangkan untuk jumlah, dua di antaranya adalah
ke kanan titik desimal. huruf N menandakan "numerik," dan A singkatan dari
"alfanumerik." D singkatan dari "date" dan otomatis dalam bentuk MM / DD /
YYYY. Beberapa program, seperti Microsoft Access, menggunakan bahasa
Inggris untuk metadata, sehingga kata-kata seperti teks, mata uang, dan nomor
yang digunakan. Microsoft Access menyediakan default 50 karakter sebagai
panjang field untuk nama, yang baik-baik saja ketika bekerja dengan sistem yang
9
kecil. Namun, jika Anda bekerja dengan database yang besar untuk bank atau
perusahaan utilitas, misalnya, Anda tidak ingin mengabdikan banyak ruang untuk
bidang itu. Jika tidak, database akan menjadi cukup besar dan diisi dengan ruang
terbuang. Itu adalah ketika Anda dapat menggunakan metadata untuk
merencanakan ke depan dan desain database lebih efisien.
2. File
Sebuah file berisi kelompok catatan yang digunakan untuk memberikan informasi
untuk operasi, perencanaan, manajemen, dan pengambilan keputusan. File dapat
digunakan untuk menyimpan data untuk jangka waktu yang tidak terbatas, atau
mereka dapat digunakan untuk menyimpan data sementara untuk tujuan tertentu.
file induk dan file tabel digunakan untuk menyimpan data untuk jangka waktu lama.
File-file sementara biasanya disebut file transaksi, file pekerjaan, atau file laporan.
File-file yang digunakan adalah :
1. File induk.
File induk berisi catatan untuk sekelompok entitas. Atribut dapat sering
diperbarui, tapi catatan sendiri relatif permanen. File-file ini cenderung memiliki
catatan besar berisi semua informasi tentang entitas data. Setiap record biasanya
10
berisi kunci primer dan beberapa kunci sekunder. Meskipun analis bebas untuk
mengatur elemen data dalam file induk dalam urutan apapun, pengaturan standar
untuk menempatkan field kunci primer pertama, diikuti oleh unsur-unsur
deskriptif, dan akhirnya oleh unsur-unsur yang sering berubah dengan kegiatan
usaha. Contoh file induk termasuk catatan pasien, catatan pelanggan, file
personil, dan file bagian persediaan.
2. Table Files.
File tabel berisi data yang digunakan untuk menghitung lebih banyak data atau
mengukur kinerja. Salah satu contoh adalah tabel tarif pos yang digunakan
untuk menentukan biaya pengiriman paket. Contoh lain adalah tabel pajak. File
tabel biasanya dibaca hanya oleh sebuah program.
3. Transaction Files.
File transaksi digunakan untuk memasukkan perubahan yang memperbarui file
induk dan menghasilkan laporan. Misalkan sebuah file induk pelanggan koran
perlu diperbarui; file transaksi akan berisi jumlah pelanggan, dan kode transaksi
seperti E untuk memperpanjang langganan, C untuk membatalkan langganan,
atau A untuk perubahan alamat. Maka hanya informasi yang relevan untuk
memperbarui yang perlu dimasukkan; yaitu, memperpanjang langganan jika E,
dan alamat jika A. Tidak ada informasi tambahan akan diperlukan jika
berlangganan dibatalkan. Sisa informasi yang sudah ada dalam master file. file
transaksi mungkin berisi beberapa jenis catatan, seperti tiga digunakan untuk
memperbarui master langganan koran, dengan kode pada file transaksi yang
menunjukkan jenis transaksi.
4. Laporan File
Bila diperlukan untuk mencetak laporan jika ada printer yang tersedia (misalnya,
ketika printer sedang sibuk mencetak pekerjaan lain), file laporan digunakan.
Mengirim output ke file daripada printer disebut spooling. Kemudian, ketika
perangkat siap, dokumen dapat dicetak. file laporan yang sangat berguna, karena
pengguna dapat mengambil file ke sistem komputer lain dan output ke perangkat
khusus.
3. Relational Databases
11
Database dapat diatur dalam beberapa cara dan jenis yang paling umum dari
database adalah database relasional. Database relasional diatur dalam bentuk table, yang
meminimalkan pengulangan data, yang dapat juga meminimalkan kesalahan dan
kapasitas penyimpanan.
2.3 Logical and Physical views of Data ( Logika dan Fisik dari Data)
Sebuah database tidak sama dengan file,dimaksudkan untuk digunakan bersama
oleh banyak pengguna. Pengguna dapat melihat semua data dalam berbagai cara.
Pengguna yang berbeda,memiliki Pandangan yang berbeda. Pandangan ini perlu
diperiksa oleh analis sistem, dan secara keseluruhan model logis dari database
dikembangkan. Akhirnya, model logis (logical) dari database harus diubah menjadi
desain database fisik (physical) yang sesuai. desain fisik yang terlibat dengan cara data
disimpan dan terkait, serta bagaimana mereka diakses.
Ada tiga jenis utama dari database logis terstruktur:
Struktur database hirarkis
Struktur Database Hierarkis (Hierarchical Database Structure), yaitu struktur
kelompok data, subkelompok data dan subkelompok yang lebih kecil lagi
menyerupai cabang-cabang pohon. Seperti cabang-cabang pohon, untuk pindah
dari suatu catatan di suatu cabang kesuatu catatan di cabang lain, system
manajemen database harus kembali ketempat asal percabangan itu. Struktur
hierarkis memanfaatkan sumber daya computer secara efisien saat sebagian besar
catatan dalam database akan digunakan dalam aplikasi.
Struktur database Jaringan
Struktur database jaringan (network database structure) memungkinkan satu
Catatan tertentu menunjuk pada catatan lain dalam database . Subkomite
Database
Task Group CODASYL mengeluarkan spesifikasi struktur database jaringan
pada tahun 1971
Jaringan memecahkan masalah keharusan untuk kembali ke tempat asal
percabangan database. Secara konseptual, tiap catatan dalam database dapat
memiliki penunjuk ke tiap catatan lain di dalam database.
12
Struktur database relasional
Struktur system manajemen relational merupakan system yang menyerupai
Table-tabel, dan merupakan format yang dapat dipahami secara cepat oleh
Manajer dan/atau staf professional.
Dua jenis pertama dapat ditemukan dalam sistem yang tradisional. Seorang
analis hari ini biasanya merancang sebuah database relasional.
13
2.5 Struktur Data Relasional
Sebuah struktur data relasional terdiri dari satu atau lebih dua dimensitabel, yang
disebut sebagai hubungan/relasi. Baris tabel mewakili catatan,dan kolom berisi
atribut.Pada model database relasional, seluruh data diwakili dalam bentuk tuple,
digabungkan dalam relasi-relasi. Database yang diorganisasikan dalam hal model relasi
merupakan database relasi.
Pada tabel diatas terdapat tiga tabel. Tabel pertama adalah tabel yang berisi item-
item dan harga dari per item tersebut (item harga). Tabel kedua menjelaskan rincian dari
pesanan (Order). Dan tabel ketiga mengidentifikasi status pesanan (Item status).
Untuk menentukan harga suatu barang, kita perlu mengetahui nomor item dan
melihatnya di tabel item harga. Untuk memperbaharui nomor kartu kredit G.MacRae
kita dapat mencarinya di tabel Order. Untuk melihat status dari pesanan kita dapat
14
melihat tabel Item Status. Tabel ini meiliki hubungan dengan tabel item harga dan
orderan oleh karena itu data diatas dinamakan data relasional ( ada hubungan antar
data/tabel).
Mempertahankan tabel dalam struktur relasional biasanya cukup sederhana jika
dibandingkan dengan mempertahankan struktur hirarkis atau jaringan. Salah satu
keuntungan utama dari struktur relasional adalah bahwa ad hoc query ditangani secara
efisien.
2.6 Normalization ( Normalisasi )
Normalisasi adalah transformasi kompleks pandangan pengguna dan penyimpanan
data untuk satu set yang lebih kecil dan stuktur data yang stabil. Selain menjadi lebih
sederhana dan lebih stabil, struktur data dinormalisasi lebih mudah dipelihara dari
struktur data lainnya.
The Three Steps of Normalization ( Tiga Tingkatan dari Normalisasi )
Analisis normalisasi struktur data ada dalam tiga langkah yang melibatkan
prosedur penting, salah satunya yaitu menyederhanakan struktur data.
Tahap pertama dari proses memasukan atau memindahkan semua kelompok
pengulang dan mengidentifikasi kunci utama (primary key). Untuk melakukannya, relasi
15
perlu dipecah menjadi dua atau lebih relasi. Pada titik ini, hubungan mungkin sudah
menjadi bentuk normal ketiga, tetapi kemungkinan langkah-langkah lebih akan
diperlukan untuk mengubah relasi ke bentuk normal ketiga.
Langkah kedua memastikan bahwa semua atribut nonkey sepenuhnya tergantung
pada primary key. Semua dependensi parsial dikeluarkan dan ditempatkan dalam relasi
lain.
Langkah ketiga menghapus semua dependensi transitif. Dependasi Transitif adalah
salah satu di mana atribut nonkey bergantung pada atribut nonkey lainnya.
Contoh Normalisasi
Figur 13.11 Dalam laporan menunjukkan Baris (satu untuk setiap pelanggan) pada
pengguna tampilan dan menunjukkan bahwa item customer number,customer
name,warehouse number,warehouse location dan sales merupakan bentuk kelompok
berulang.
16
Jika analis menggunakan pendekatan kamus data flow / data, informasi yang sama
dalam tampilan pengguna akan muncul dalam struktur data.
Figur 13.12 menunjukkan bagaimana struktur data akan muncul pada tahap kamus
data analisis. Kelompok berulang juga ditunjukkan dalam struktur data dengan tanda
bintang (*) dan lekukan.
Perhatikan asosiasi data pada elemen data pada Gambar 13.13. Jenis ilustrasi
disebut diagram bubble atau diagram model data. Setiap entitas tertutup dalam elips, dan
panah digunakan untuk menunjukkan hubungan. Meskipun mungkin untuk
mengambarkan hubungan ini dengan diagram E-R, kadang-kadang lebih mudah untuk
menggunakan diagram bubble sederhana untuk model data.
17
Dalam contoh ini, hanya ada satu SALESPERSON-NUMBER ditugaskan untuk
setiap SALESPERSON-NAME, dan orang itu akan mencakup hanya satu SALES-
AREA, tetapi masing-masing SALES-AREA dapat ditugaskan untuk banyak tenaga
penjualan: sebab, notasinya terdapatpanah ganda dari SALES-AREA ke
SALESPERSON-NUMBER. Untuk setiap SALESPERSON-NUMBER, mungkin
memiliki banyak CUSTOMER-NUMBER (s).
Selain itu, akan ada korespondensi satu ke satu antara CUSTOMER-NUMBER
dan CUSTOMER-NAME; dan berlaku sama untuk WAREHOUSE-NUMBER dan
WAREHOUSE-LOCATION. CUSTOMER-NUMBER akan hanya memiliki satu
WAREHOUSE-NUMBER dan WAREHOUSE- LOCATION, tetapi masing-masing
WAREHOUSE-NUMBER atau WAREHOUSE-LOCATION dapat melayani banyak
PELANGGAN-NUMBER (s). Akhirnya, untuk menentukan SALES-AMOUNT untuk
memberikan tanda satu penjual untuk perusahaan tertentu, perlu untuk mengetahui
kedua SALESPERSON-NUMBER dan PELANGGAN-NUMBER.
Tujuan utama dari proses normalisasi adalah untuk menyederhanakan semua item
data yang kompleks yang sering ditemukan dalam pandangan pengguna. Sebagai
contoh, jika analis mengambil pandangan pengguna yang dibahas sebelumnya dan
mencoba untuk membuat tabel relasional dari itu, table yang akan terlihat seperti
Figur13.14.
Karena relasi ini didasarkan pada pandangan pengguna awal ,dan menyebutnya
sebagai SALES-REPORT. SALES-REPORT adalah hubungan unnormalisasi,karena
18
memiliki kelompok berulang. Hal ini juga penting untuk mengamati bahwa atribut
tunggal seperti SALESPERSON-NUMBER tidak dapat berrfungsi sebagai kunci.
Alasannya jelas ketika seseorang meneliti hubungan antara SALESPERSON-
NUMBER dan atribut lainnya pada Figur 13.15.
19
FIRST
20
Dalam relasi ini, seseorang harus menggunakan kunci bersambung(baik
SALESPERSON-NUMBER &CUSTOMER-NUMBER)) untuk mengakses seluruh
informasi. Hal ini memungkinkan untuk menulis relasi di notasi singkat sebagai berikut:
21
atribut parsial dependent dan menempatkan mereka dalam relasi lainnya. Figur 13.18
menunjukkan bagaimana relasi SALESPERSON-CUSTOMER dibagi menjadi dua
relasi baru: SALES dan CUSTOMER-WAREHOUSE.
22
WAREHOUSE-LOCATION, bagaimanapun, akan jelas tergantung pada
WAREHOUSE-NUMBER juga. Untuk mempermudah hubungan ini, langkah lain yang
diperlukan.
Gambar 13.19 menunjukkan dependensi dalam kaitannya CUSTOMER-
WAREHOUSE.
23
Dua relasi baru disebut CUSTOMER dan WAREHOUSE, dan dapat ditulis
sebagai berikut:
kita dapat melihat bahwa relasi SALES-REPORT tunggal berubah menjadi empat
relasi berikut:
24
Bentuk normal ketiga memadai untuk sebagian besar masalah desain database.
Penyederhanaan diperoleh dari mengubah sebuah relasi unnormalisasi menjadi satu set
relasi 3NF merupakan manfaat yang luar biasa ketika tiba saatnya untuk memasukkan,
menghapus, dan memperbarui informasi dalam database.
Many to Many
Sebuah hubungan banyak-ke-banyak harus dibagi menjadi dua hubungan
satu-ke-banyak dengan entitas asosiatif di tengah. Pada many to many relation
25
dibutuhkan 3 tabel, satu untuk entitas data , dan satu untuk hubungan . Kunci
utama dari setiap entitas data disimpan sebagai kunci asing dari tabel
relasional.
26
Kendala integritas aturan yang memerintah dengan mengubah dan menghapus
catatan, dan yang membantu menjaga data dalam database yang akurat. Tiga jenis
batasan integritas berlaku untuk database:
1. Integritas entitas
Yaitu aturan yang mengatur komposisi kunci primer. Primer key tidak dapat
memiliki nilai nol, dan jika kunci utama adalah kunci komposit, tidak ada
komponen di kunci yg dapat berisi nilai null.
2. Integritas referensial
Yaitu memastikan bahwa seluruh nilai dari foreign key cocok dengan nilai primary
key yang dihubungkan.
3. Integritas domain
Domain Integritas merupakan validasi dari masukan untuk sebuah kolom. Anda
dapat memaksa domain integritas dengan membatasi tipe (melalui data types),
format (melalui check constraints dan rules), atau range nilai-nilai yang mungkin
(melalui Foreign Key Constraints, Check Constraints, Default Definitions dan
rules).
2.10 Anomalies
Empat anomali dapat terjadi saat membuat tabel database:
1. Data redundancy
Redundansi data terjadi ketika data yang sama disimpan di lebih dari satu tempat
dalam database (kecuali primer key disimpan sebagai foreign key).
2. Insert anomaly
Insert anomali terjadi ketika seluruh kunci primer tidak diketahui dan database
tidak bisa menyisipkan catatan baru, yang akan melanggar integritas entitas.
3. Deletion anomaly
Sebuah penghapusan anomali yang terjadi ketika sebuah record dihapus,
mengakibatkan hilangnya data terkait lainnya.
4. Update anomaly
27
Update anomali terjadi ketika perubahan satu nilai atribut menyebabkan database
mengandung data yang tidak konsisten atau menyebabkan beberapa catatan perlu
berubah.
Ada beberapa langkah yang harus dilakukan agar database bermanfaat untuk
mempresentasikan data:
1. Memilih hubungan dari database
2. Gabungkan hubungan-hubungan tersebut menjai satu
3. Membangun kolom dari hubungan yang telah disatukan
4. Memilih baris dari hubungan
5. Memperoleh atribut baru
6. Indeks atau menyusun baris
7. Menghitung total dan pengukuran hasil
8. Mempresentasikan data
28
Langkah 1 dan 8 harus dilakukan, tetapi 6 langkah lainnya adalah pilihan sesuai
dengan bagaimana data akan digunakan Untuk langkah 8, data dapat dipresentasikan
dalam berbagai bentuk. Contohnya dalam bentuk tabel, grafik, dan lain sebagainya.
Berikut ini merupakan gambar yang menunujukkan lagkah-langkah diatas
2.12 Denormalisasi
Alasan normalisasi adalah untuk mengatur data sehingga data sisa juga bekurang.
Jika kita tidak diminta untuk menyimpan data yang sama lagi dan lagi, kita bisa
menghemat banyak ruang penyimpanan. Hal ini kadang dilakukan oleh analis
perusahaan, apalagi jika harga ruang penyimpanan mahal.
Denormalisasi adalah proses pengambilan model data logis dan mengubahnya
menjadi model fisik yang lebih efisien untuk kebanyakan kebutuhan pekerjaan.
Denormalisasi dapat dicapai dalam beberapa cara yang berbeda.Salah satunya
dapat dilihat pada gambar berikut.
29
Disini kita mabil contoh hubungan many-to-many, pelayan toko dan pelanggan
30
Alasan lain denormalisasi adalah untuk menghindari pengulangan referensi untuk
pencarian tabel. Akan lebih efisien jika informasi yang sama diulang, contohnya kota,
negara, dan kode zip. Di dalam contoh ini, atribut pelanggan dan atribut gudang dapat
dikombinasikan.
Terakhir, kita lihat hubungan one-to-one. Dari gambar bisa dilihat beberapa detail
bisa muncul pada detail pesanan dan detail pengiriman ketika melakukan
denormalisasi.
31
5. Data warehouse biasanya dioptimalkan untuk menjawab pertanyaan kompleks,
yang dikenal sebagai OLAP, dari manajer dan analis, bukan sederhana dan
pertanyaan berulang
6. Data warehouse memungkinkan akses mudah melalui software data mining
(disebut siftware) yang akan mencari pola dan mampu mengidentifikasi
hubungan yang tidak dibayangkan oleh pengambil keputusan manusia.
7. Data warehouse meliputi tidak hanya satu tapi beberapa database yang telah
diolah sehingga data warehouse ini didefinisikan seragam. database ini disebut
data bersih.
8. Data warehouse biasanya mencakup data dari sumber-sumber luar (seperti
laporan industri, perusahaan OJK, atau bahkan informasi tentang produk
pesaing), serta data yang dihasilkan untuk penggunaan internal.
Membangun data warehouse adalah tugas yang monumental. analis perlu untuk
mengumpulkan data dari berbagai sumber dan menerjemahkan data ke dalam bentuk
umum. Misalnya, satu database dapat menyimpan informasi tentang gender sebagai
"Pria" dan "Wanita, yang lain mungkin menyimpannya sebagai" M "dan" F, dan ketiga
mungkin menyimpannya sebagai "1" dan 0. analis perlu menetapkan standar dan
mengkonversi semua data ke format yang sama.
Setelah data bersih, analis harus memutuskan bagaimana meringkas data. Setelah
dirangkum, detail data akan hilang, sehingga analis harus memprediksi jenis pertanyaan
yang mungkin ditanyakan.
Biasanya ukuran gudang data adalah 50 gigabyte atau dalam puluhan gigabyte.
Karena ukurannya besar, harganya juga maha. Biasanya harga gudang data mencapai
jutaan dolar.
32
data dari semua sisi yang berbeda, dan juga dapat memanipulasi data dengan memutar
atau memutar itu sehingga masuk akal.
Pendekatan OLAP ini divalidasi konsep gudang data. Kemudian masuk akal untuk
data yang akan diorganisir dengan cara-cara yang memungkinkan efisien query. Tentu
saja, OLAP melibatkan pengolahan data melalui manipulasi, rangkuman, dan
perhitungan, sehingga lebih dari sebuah gudang data yang terlibat.
33
Data mining dikenal dengan nama lain, pengetahuan penemuan data (KDD).
Beberapa berpikir bahwa KDD berbeda dari data mining karena KDD dimaksudkan
untuk membantu para pengambil keputusan dalam menemukan pola daripada beralih
kontrol atas untuk sebuah algoritma untuk menemukan mereka. Alat bantu keputusan
yang tersedia disebut siftware; mereka termasuk analisis statistik, pohon keputusan,
jaringan saraf, agen cerdas, logika fuzzy, dan visualisasi data.
Konsep data mining berasal dari keinginan untuk menggunakan database untuk
penargetan lebih selektif para pelanggan. Awal pendekatan mengarahkan email termasuk
menggunakan informasi kode pos sebagai cara untuk menentukan apa pendapatan
keluarga mungkin (dengan asumsi keluarga harus menghasilkan pendapatan yang cukup
untuk mampu hidup dalam kode pos Beverly Hills bergengsi 90210 atau beberapa
kawasan makmur lainnya). Ini adalah cara (tidak sempurna, tentu saja) untuk membatasi
jumlah katalog dikirim.
Pendekatan data mining bukan tanpa masalah, namun. Pertama, biaya mungkin
terlalu tinggi untuk menjustifikasi data mining, sesuatu yang hanya dapat ditemukan
setelah biaya setup besar telah diperoleh. Kedua, data mining harus dikoordinasikan
sehingga berbagai departemen atau anak tidak semua mencoba untuk mencapai
pelanggan pada saat yang sama. Selain itu, pelanggan mungkin berpikir privasi mereka
telah diserang dan membenci penawaran yang datang dengan cara mereka. Akhirnya,
pelanggan mungkin berpikir profil dibuat semata-mata atas dasar pembelian kartu kredit
mereka menyajikan gambar yang sangat menyimpang dari siapa mereka.
34
BAB III
PENUTUP
3.1 Kesimpulan
Pemahaman tentang penyimpanan data membutuhkan pemahaman dari tiga alam:
kenyataan, data, dan metadata. Sebuah entitas adalah setiap objek atau kejadian yang
kami bersedia untuk mengumpulkan dan menyimpan data. Atribut adalah karakteristik
sebenarnya entitas ini. item data dapat memiliki nilai dan dapat diatur ke dalam catatan
yang dapat diakses oleh kunci. Metadata menggambarkan data dan dapat berisi
pembatasan tentang nilai dari item data (seperti numerik saja).
Contoh file konvensional termasuk file induk, file tabel, file transaksi, file
pekerjaan, dan file laporan. Database biasanya dibangun dengan struktur relasional.
sistem warisan dapat memiliki hirarki atau jaringan struktur.
Normalisasi adalah proses yang membutuhkan pandangan pengguna dan
mengubahnya ke dalam struktur kurang kompleks disebut normalisasi hubungan. Ada
tiga langkah dalam proses normalisasi. Pertama, semua kelompok mengulangi dihapus.
Kedua, semua dependensi parsial dihapus. Akhirnya, dependensi transitif dibawa
keluar. Setelah tiga langkah ini selesai, hasilnya adalah penciptaan banyak hubungan
yang dari bentuk normal ketiga (3NF).
35
Diagram relasi entitas dapat digunakan untuk menentukan kunci yang diperlukan
untuk catatan atau hubungan basis data. Tiga pedoman untuk mengikuti ketika
merancang tabel induk atau relasi database yang (1) masing-masing entitas data terpisah
harus membuat tabel master (tidak menggabungkan dua entitas yang berbeda dalam
satu meja); (2) bidang data tertentu harus ada hanya pada satu tabel master; dan (3)
masing-masing tabel master atau hubungan database harus memiliki program untuk
Buat, Baca, Update, dan Delete.
Proses mengambil data mungkin melibatkan sebanyak delapan langkah: (1) memilih
relasi, (2) bergabung dua relasi bersama-sama, (3) memproyeksikan (memilih) kolom,
(4) memilih baris yang relevan, (5) berasal baru di - upeti, (6) menyortir atau baris
pengindeksan, (7) menghitung jumlah dan ukuran kinerja, dan akhirnya (8) pra senting
hasil kepada pengguna.
Denormalization adalah proses yang mengambil model data logis dan mengubahnya
menjadi model fisik yang efisien untuk tugas-tugas yang paling dibutuhkan. gudang
data yang berbeda dari database tradisional dalam banyak hal; satu adalah bahwa
mereka menyimpan data denormalized, yang diselenggarakan di sekitar mata pelajaran.
Data warehouse memungkinkan akses mudah melalui software data mining, yang
disebut siftware, yang mencari pola dan mengidentifikasi kapal hubungan-tidak
dibayangkan oleh pengambil keputusan manusia.
36