Anda di halaman 1dari 36

BAB I

PENDAHULUAN

1.1 Latar Belakang

Penyimpanan data dianggap oleh beberapa orang untuk menjadi jantung tem suatu
informasi sistematis. Pertama, data harus tersedia ketika pengguna ingin
menggunakannya. Kedua, data harus akurat dan konsisten (mereka harus memiliki
integritas). Di luar persyaratan ini, tujuan dari desain database mencakup penyimpanan
data yang efisien serta memperbarui efisien dan pengambilan. Akhirnya, perlu bahwa
pencarian informasi menjadi tujuan. Informasi yang diperoleh dari data yang disimpan harus
dalam bentuk yang berguna untuk mengelola, perencanaan, pengendalian, atau pengambilan
keputusan.

Ada dua pendekatan untuk penyimpanan data dalam sistem berbasis komputer. Yang pertama adalah untuk
menyimpan data dalam file individual, masing-masing yang unik untuk aplikasi tertentu. Pendekatan kedua
melibatkan membangun database. Database adalah toko resmi didefinisikan dan dikendalikan secara terpusat data
dimaksudkan untuk digunakan dalam aplikasi yang berbeda.

file individual sering dirancang hanya dengan kebutuhan mendesak dalam pikiran, sehingga
menjadi im- portant untuk query sistem untuk kombinasi dari beberapa atribut, atribut ini
mungkin terkandung dalam file terpisah atau mungkin bahkan tidak ada. Database
direncanakan, sehingga data yang diselenggarakan untuk penyimpanan yang efisien dan
pengambilan efektif. gudang data basis data- sangat besar yang menyimpan data diringkas
berkaitan dengan subjek tertentu sehingga pertanyaan dijawab sangat efisien.

1.2 Tujuan Pembelajaran


1. Memahami Konsep Database
2. Gunakan normalisasi untuk secara efisien menyimpan data dalam database
3. Gunakan database untuk menyajikan data
4. Memahami konsep data warehouse
5. Memahami kegunaan database penerbitan ke Web

BAB II
PEMBAHASAN

1
2.1 DATABASES
Database tidak hanya kumpulan file. Database adalah sumber utama data berarti
untuk digunakan bersama oleh banyak pengguna untuk berbagai aplikasi. Jantung
database adalah database sistem manajemen (DBMS), yang memungkinkan penciptaan,
modifikasi, dan mengupdate database; pengambilan data; dan generasi laporan dan
menampilkan. Orang yang memastikan bahwa database memenuhi tujuannya disebut
administrator database.
Tujuan efektivitas database meliputi :
1. Memastikan bahwa data dapat dibagi di antara pengguna untuk berbagai aplikasi.
2. Menjaga data yang akurat dan konsisten.
3. Memastikan bahwa semua data yang diperlukan untuk aplikasi saat ini dan masa
mendatang akan tersedia.
4. Membiarkan database untuk berkembang sebagai kebutuhan pengguna.
5. Membiarkan pengguna untuk membangun pandangan pribadi mereka dari data
tanpa memperhatikan cara data secara fisik disimpan.

2.2 KONSEP DATA


1. Reality, Data, dan Metadata
Dunia nyata akan disebut sebagai realitas. Data yang dikumpulkan tentang orang,
tempat, atau peristiwa dalam realitas akhirnya akan disimpan dalam file atau database.
Untuk memahami bentuk dan struktur data, informasi tentang data itu sendiri diperlukan.
Informasi yang menggambarkan data yang disebut sebagai metadata.
Hubungan antara realitas, data, dan metadata digambarkan pada Gambar 13.1.
Dalam alam realitas adalah entitas dan atribut; dalam bidang data aktual adalah
merekam kejadian dan item data kejadian; dan dalam bidang metadata adalah definisi
record dan item data definisi.

2
a. Entitas
Setiap objek atau peristiwa yang dipilih seseorang untuk mengumpulkan data
adalah suatu entitas. Entitas mungkin orang, tempat, atau sesuatu (misalnya,
seorang tenaga penjualan, kota, atau produk). Setiap entitas dapat juga menjadi
peristiwa atau satuan waktu seperti gangguan mesin, penjualan, atau bulan atau
tahun. Entitas kecil tambahan yang disebut entitas subtipe. simbol adalah persegi
panjang kecil dalam entitas persegi panjang.
Suatu entitas subtipe adalah hubungan khusus satu-ke-satu digunakan untuk
mewakili atribut tambahan (bidang) dari entitas lain yang mungkin tidak hadir
pada setiap catatan dari entitas pertama. Contohnya adalah entitas utama
pelanggan. pelanggan mungkin menyukai bidang khusus yang berisi informasi
diskon, dan informasi ini akan berada dalam suatu entitas subtipe.
b. Hubungan (Relationship)
Hubungan adalah asosiasi antara entitas (kadang-kadang mereka disebut asosiasi
data). Gambar 13.2 adalah entitas-hubungan (E-R) diagram yang menunjukkan
berbagai jenis hubungan.
Jenis pertama dari hubungan adalah hubungan satu-ke-satu (ditunjuk sebagai 1:
1) :

3
Tipe lain dari hubungan adalah satu-ke-banyak (1: M) atau banyak-ke-satu
asosiasi.

Banyak-ke-banyak hubungan (yang ditunjuk sebagai M: N) menjelaskan


kemungkinan bahwa entitas mungkin memiliki banyak asosiasi di kedua arah.

Simbol entitas – hubungan dan artinya.

4
c. Contoh Entitas – Hubungan :
Diagram relasi entitas yang mengandung banyak entitas, berbagai jenis
hubungan, dan berbagai atribut ditampilkan dalam Gambar 13.4. Dalam E-R
diagram, kita prihatin tentang sistem penagihan, dan khususnya dengan bagian
resep sistem. (Untuk mempermudah, kita mengasumsikan bahwa kunjungan
kantor ditangani secara berbeda dan berada di luar ruang lingkup sistem ini.)
Entitas adalah RESEP, DOKTER, PASIEN, dan ASURANSI CARRIER. Entitas
PENGOBATAN tidak penting untuk sistem penagihan, tetapi itu adalah bagian
dari diagram E-R karena digunakan untuk menjembatani kesenjangan antara
RESEP dan PASIEN. Oleh karena itu kita menarik sebagai entitas asosiatif pada
gambar.
Di sini, seorang DOKTER merawat banyak PASIEN (s) (1: M), yang masing-
masing berlangganan individu KARIR ASURANSI. Tentu saja, PASIEN hanya
satu dari banyak pasien yang berlangganan
untuk ASURANSI CARRIER tertentu (M: 1).
Untuk melengkapi catatan DOKTER ini, dokter perlu menyimpan informasi
tentang perawatan PASIEN. Banyak PASIEN (s) memiliki pengalaman
PENGOBATAN (s), sehingga banyak-ke-banyak (M: N) hubungan.
PENGOBATAN diwakili sebagai entitas asosiatif karena itu tidak penting dalam

5
sistem penagihan. PENGOBATAN (s) dapat mencakup pengambilan RESEP (s),
dan dengan demikian juga hubungan M: N, karena banyak perawatan mungkin
panggilan untuk kombinasi dari obat-obatan dan banyak obat dapat bekerja untuk
banyak perawatan.
Beberapa detail kemudian diisi untuk atribut. Atribut tercantum di samping
masing-masing entitas, dan kuncinya digarisbawahi. Misalnya, entitas RESEP
memiliki NAMA PRODUK, DOSIS, PRODUSEN, dan JUMLAH. Idealnya, itu
akan bermanfaat untuk merancang database dalam mode ini, menggunakan
diagram relasi entitas dan kemudian mengisi rincian tentang atribut. pendekatan
top-down ini diinginkan, tapi kadang-kadang sangat sulit untuk dicapai.

d. Atribut
Atribut adalah beberapa karakteristik dari suatu entitas. Ada banyak atribut untuk
setiap entitas. Misalnya, seorang pasien (entitas) dapat memiliki banyak atribut,
seperti nama belakang, nama depan, alamat jalan, kota, negara, dan sebagainya.
Tanggal kunjungan terakhir pasien serta rincian resep juga atribut. Ketika kamus
data dibahas dalam Bab 8, yang terkecil khususnya dijelaskan disebut elemen
data. Ketika file dan database yang dibahas, elemen data ini umumnya disebut

6
sebagai item data. item data tersebut sebenarnya unit terkecil dalam sebuah file
atau database. Istilah Item data juga digunakan bergantian dengan atribut kata.
Item data dapat memiliki nilai. Nilai-nilai ini dapat menjadi tetap atau memiliki
panjang variabel; dapat berupa abjad, numerik, karakter khusus, atau
alfanumerik. Contoh item data dan nilai-nilainya dapat ditemukan pada Gambar
13.5.
Kadang-kadang item data juga disebut sebagai field. Sebuah field,
bagaimanapun, merupakan sesuatu yang fisik, tidak logis. Oleh karena itu,
banyak item data dapat dikemas ke field; field dapat dibaca dan dikonversi ke
sejumlah item data. Sebuah contoh umum ini adalah untuk menyimpan tanggal
dalam satu bidang seperti MM / DD / YYYY. Untuk mengurutkan file dalam
rangka berdasarkan tanggal, tiga item data terpisah yang diambil dari field dan
diurutkan pertama dengan YYYY, maka dengan MM, dan akhirnya oleh DD.

e. Pencatatan (Records)
Sebuah catatan adalah kumpulan item data yang memiliki sesuatu yang sama
dengan entitas yang dijelaskan. Gambar 13.6 adalah sebuah ilustrasi dari
pencatatan dengan banyak item data terkait. Pencatatan yang ditampilkan adalah
untuk pesanan ditempatkan dengan perusahaan mail-order. ORDER-#, LAST

7
NAME, INITIAL, STREET ADDRESS, CITY, STATE, and CREDIT CARD
semua atribut. Kebanyakan catatan memiliki panjang yang tetap, sehingga tidak
perlu untuk menentukan panjang dari catatan setiap kali.

f. Kunci (Keys)
Kunci adalah salah satu item data dalam catatan yang digunakan untuk
mengidentifikasi catatan. Ketika kunci yang unik mengidentifikasi catatan, hal
itu disebut primary key. Misalnya, order-# dapat menjadi primary kunci karena
hanya satu nomor yang ditugaskan untuk setiap pesanan pelanggan. Dengan cara
ini, kunci utama mengidentifikasi entitas dunia nyata (pesanan pelanggan).
Perhatian khusus harus diambil saat merancang kunci utama. Seringkali itu
adalah nomor urut atau nomor urut dengan sejumlah pengecekan sendiri (disebut
cek digit) pada akhir angka. Pada saat ada beberapa makna yang dibangun ke
dalam kunci utama, tetapi mendefinisikan kunci primer berdasarkan atribut
dianggap risiko. Jika atribut berubah, kunci utama juga akan berubah,
menciptakan ketergantungan antara kunci primer dan data.
Contoh kunci utama berdasarkan data yang menggunakan singkatan negara
untuk nama negara
atau bagasi kode maskapai untuk nama bandara. Sebuah atribut atau kumpulan
atribut yang dapat berfungsi sebagai kunci utama disebut kunci kandidat. Kunci
utama juga harus minimal dan tidak mengandung atribut tambahan dari yang
diperlukan untuk mengidentifikasi rekor.
Kunci disebut kunci sekunder jika tidak dapat secara unik mengidentifikasi
catatan. kunci sekunder baik mungkin unik atau mungkin mengidentifikasi
beberapa catatan dalam database. kunci sekunder dapat digunakan untuk memilih

8
sekelompok record yang dimiliki set (misalnya, perintah dari negara bagian
Virginia).
Ketika itu tidak mungkin untuk mengidentifikasi record unik dengan
menggunakan salah satu item data yang ditemukan di catatan, kunci dapat
dibangun dengan memilih dua atau lebih item data dan menggabungkan mereka.
Kunci ini disebut bersambung, atau kunci komposit. Ketika item data yang
digunakan sebagai kunci dalam catatan, yang deskripsi digarisbawahi. Oleh
karena itu, dalam catatan PESANAN (pesanan-#, NAMA TERAKHIR, AWAL,
STREET ADDRESS, KOTA, NEGARA, KARTU KREDIT), kuncinya adalah
pesanan-#. Jika atribut adalah kunci dalam file lain, perlu digarisbawahi dengan
garis putus-putus.
Beberapa database memungkinkan pengembang untuk menggunakan identifier
objek (OID), yang merupakan kunci unik untuk setiap record dalam database,
tidak hanya di tabel. Mengingat identifier objek, satu record akan diperoleh
terlepas dari tabel yang ada. Ini mungkin disertakan dengan pesanan atau
pembayaran yang dikonfirmasi, bersama dengan pesan seperti, "Ini adalah nomor
konfirmasi Anda."

g. Metadata
Metadata adalah data tentang data dalam file atau database. Metadata
menggambarkan nama yang diberikan dan panjang yang ditugaskan untuk setiap
item data. Metadata juga menjelaskan panjang dan komposisi dari masing-
masing catatan.
Gambar 13.7 adalah contoh metadata untuk database untuk beberapa perangkat
lunak generik. Panjang setiap item data diindikasikan menurut konvensi, di mana
7,2 berarti bahwa tujuh ruang dicadangkan untuk jumlah, dua di antaranya adalah
ke kanan titik desimal. huruf N menandakan "numerik," dan A singkatan dari
"alfanumerik." D singkatan dari "date" dan otomatis dalam bentuk MM / DD /
YYYY. Beberapa program, seperti Microsoft Access, menggunakan bahasa
Inggris untuk metadata, sehingga kata-kata seperti teks, mata uang, dan nomor
yang digunakan. Microsoft Access menyediakan default 50 karakter sebagai
panjang field untuk nama, yang baik-baik saja ketika bekerja dengan sistem yang

9
kecil. Namun, jika Anda bekerja dengan database yang besar untuk bank atau
perusahaan utilitas, misalnya, Anda tidak ingin mengabdikan banyak ruang untuk
bidang itu. Jika tidak, database akan menjadi cukup besar dan diisi dengan ruang
terbuang. Itu adalah ketika Anda dapat menggunakan metadata untuk
merencanakan ke depan dan desain database lebih efisien.

2. File
Sebuah file berisi kelompok catatan yang digunakan untuk memberikan informasi
untuk operasi, perencanaan, manajemen, dan pengambilan keputusan. File dapat
digunakan untuk menyimpan data untuk jangka waktu yang tidak terbatas, atau
mereka dapat digunakan untuk menyimpan data sementara untuk tujuan tertentu.
file induk dan file tabel digunakan untuk menyimpan data untuk jangka waktu lama.
File-file sementara biasanya disebut file transaksi, file pekerjaan, atau file laporan.
File-file yang digunakan adalah :
1. File induk.
File induk berisi catatan untuk sekelompok entitas. Atribut dapat sering
diperbarui, tapi catatan sendiri relatif permanen. File-file ini cenderung memiliki
catatan besar berisi semua informasi tentang entitas data. Setiap record biasanya

10
berisi kunci primer dan beberapa kunci sekunder. Meskipun analis bebas untuk
mengatur elemen data dalam file induk dalam urutan apapun, pengaturan standar
untuk menempatkan field kunci primer pertama, diikuti oleh unsur-unsur
deskriptif, dan akhirnya oleh unsur-unsur yang sering berubah dengan kegiatan
usaha. Contoh file induk termasuk catatan pasien, catatan pelanggan, file
personil, dan file bagian persediaan.
2. Table Files.
File tabel berisi data yang digunakan untuk menghitung lebih banyak data atau
mengukur kinerja. Salah satu contoh adalah tabel tarif pos yang digunakan
untuk menentukan biaya pengiriman paket. Contoh lain adalah tabel pajak. File
tabel biasanya dibaca hanya oleh sebuah program.
3. Transaction Files.
File transaksi digunakan untuk memasukkan perubahan yang memperbarui file
induk dan menghasilkan laporan. Misalkan sebuah file induk pelanggan koran
perlu diperbarui; file transaksi akan berisi jumlah pelanggan, dan kode transaksi
seperti E untuk memperpanjang langganan, C untuk membatalkan langganan,
atau A untuk perubahan alamat. Maka hanya informasi yang relevan untuk
memperbarui yang perlu dimasukkan; yaitu, memperpanjang langganan jika E,
dan alamat jika A. Tidak ada informasi tambahan akan diperlukan jika
berlangganan dibatalkan. Sisa informasi yang sudah ada dalam master file. file
transaksi mungkin berisi beberapa jenis catatan, seperti tiga digunakan untuk
memperbarui master langganan koran, dengan kode pada file transaksi yang
menunjukkan jenis transaksi.
4. Laporan File
Bila diperlukan untuk mencetak laporan jika ada printer yang tersedia (misalnya,
ketika printer sedang sibuk mencetak pekerjaan lain), file laporan digunakan.
Mengirim output ke file daripada printer disebut spooling. Kemudian, ketika
perangkat siap, dokumen dapat dicetak. file laporan yang sangat berguna, karena
pengguna dapat mengambil file ke sistem komputer lain dan output ke perangkat
khusus.

3. Relational Databases

11
Database dapat diatur dalam beberapa cara dan jenis yang paling umum dari
database adalah database relasional. Database relasional diatur dalam bentuk table, yang
meminimalkan pengulangan data, yang dapat juga meminimalkan kesalahan dan
kapasitas penyimpanan.
2.3 Logical and Physical views of Data ( Logika dan Fisik dari Data)
Sebuah database tidak sama dengan file,dimaksudkan untuk digunakan bersama
oleh banyak pengguna. Pengguna dapat melihat semua data dalam berbagai cara.
Pengguna yang berbeda,memiliki Pandangan yang berbeda. Pandangan ini perlu
diperiksa oleh analis sistem, dan secara keseluruhan model logis dari database
dikembangkan. Akhirnya, model logis (logical) dari database harus diubah menjadi
desain database fisik (physical) yang sesuai. desain fisik yang terlibat dengan cara data
disimpan dan terkait, serta bagaimana mereka diakses.
Ada tiga jenis utama dari database logis terstruktur:
 Struktur database hirarkis
Struktur Database Hierarkis (Hierarchical Database Structure), yaitu struktur
kelompok data, subkelompok data dan subkelompok yang lebih kecil lagi
menyerupai cabang-cabang pohon. Seperti cabang-cabang pohon, untuk pindah
dari suatu catatan di suatu cabang kesuatu catatan di cabang lain, system
manajemen database harus kembali ketempat asal percabangan itu. Struktur
hierarkis memanfaatkan sumber daya computer secara efisien saat sebagian besar
catatan dalam database akan digunakan dalam aplikasi.
 Struktur database Jaringan
Struktur database jaringan (network database structure) memungkinkan satu
Catatan tertentu menunjuk pada catatan lain dalam database . Subkomite
Database
Task Group CODASYL mengeluarkan spesifikasi struktur database jaringan
pada tahun 1971
Jaringan memecahkan masalah keharusan untuk kembali ke tempat asal
percabangan database. Secara konseptual, tiap catatan dalam database dapat
memiliki penunjuk ke tiap catatan lain di dalam database.

12
 Struktur database relasional
Struktur system manajemen relational merupakan system yang menyerupai
Table-tabel, dan merupakan format yang dapat dipahami secara cepat oleh
Manajer dan/atau staf professional.
Dua jenis pertama dapat ditemukan dalam sistem yang tradisional. Seorang
analis hari ini biasanya merancang sebuah database relasional.

2.4 Desain Data Base


Desain database termasuk laporan sintesis pengguna, pandangan pengguna, dan
desain logis dan fisik.

13
2.5 Struktur Data Relasional
Sebuah struktur data relasional terdiri dari satu atau lebih dua dimensitabel, yang
disebut sebagai hubungan/relasi. Baris tabel mewakili catatan,dan kolom berisi
atribut.Pada model database relasional, seluruh data diwakili dalam bentuk tuple,
digabungkan dalam relasi-relasi. Database yang diorganisasikan dalam hal model relasi
merupakan database relasi.

Pada tabel diatas terdapat tiga tabel. Tabel pertama adalah tabel yang berisi item-
item dan harga dari per item tersebut (item harga). Tabel kedua menjelaskan rincian dari
pesanan (Order). Dan tabel ketiga mengidentifikasi status pesanan (Item status).
Untuk menentukan harga suatu barang, kita perlu mengetahui nomor item dan
melihatnya di tabel item harga. Untuk memperbaharui nomor kartu kredit G.MacRae
kita dapat mencarinya di tabel Order. Untuk melihat status dari pesanan kita dapat

14
melihat tabel Item Status. Tabel ini meiliki hubungan dengan tabel item harga dan
orderan oleh karena itu data diatas dinamakan data relasional ( ada hubungan antar
data/tabel).
Mempertahankan tabel dalam struktur relasional biasanya cukup sederhana jika
dibandingkan dengan mempertahankan struktur hirarkis atau jaringan. Salah satu
keuntungan utama dari struktur relasional adalah bahwa ad hoc query ditangani secara
efisien.
2.6 Normalization ( Normalisasi )
Normalisasi adalah transformasi kompleks pandangan pengguna dan penyimpanan
data untuk satu set yang lebih kecil dan stuktur data yang stabil. Selain menjadi lebih
sederhana dan lebih stabil, struktur data dinormalisasi lebih mudah dipelihara dari
struktur data lainnya.
The Three Steps of Normalization ( Tiga Tingkatan dari Normalisasi )

Analisis normalisasi struktur data ada dalam tiga langkah yang melibatkan
prosedur penting, salah satunya yaitu menyederhanakan struktur data.
Tahap pertama dari proses memasukan atau memindahkan semua kelompok
pengulang dan mengidentifikasi kunci utama (primary key). Untuk melakukannya, relasi

15
perlu dipecah menjadi dua atau lebih relasi. Pada titik ini, hubungan mungkin sudah
menjadi bentuk normal ketiga, tetapi kemungkinan langkah-langkah lebih akan
diperlukan untuk mengubah relasi ke bentuk normal ketiga.
Langkah kedua memastikan bahwa semua atribut nonkey sepenuhnya tergantung
pada primary key. Semua dependensi parsial dikeluarkan dan ditempatkan dalam relasi
lain.
Langkah ketiga menghapus semua dependensi transitif. Dependasi Transitif adalah
salah satu di mana atribut nonkey bergantung pada atribut nonkey lainnya.
Contoh Normalisasi

Figur 13.11 Dalam laporan menunjukkan Baris (satu untuk setiap pelanggan) pada
pengguna tampilan dan menunjukkan bahwa item customer number,customer
name,warehouse number,warehouse location dan sales merupakan bentuk kelompok
berulang.

16
Jika analis menggunakan pendekatan kamus data flow / data, informasi yang sama
dalam tampilan pengguna akan muncul dalam struktur data.
Figur 13.12 menunjukkan bagaimana struktur data akan muncul pada tahap kamus
data analisis. Kelompok berulang juga ditunjukkan dalam struktur data dengan tanda
bintang (*) dan lekukan.

Perhatikan asosiasi data pada elemen data pada Gambar 13.13. Jenis ilustrasi
disebut diagram bubble atau diagram model data. Setiap entitas tertutup dalam elips, dan
panah digunakan untuk menunjukkan hubungan. Meskipun mungkin untuk
mengambarkan hubungan ini dengan diagram E-R, kadang-kadang lebih mudah untuk
menggunakan diagram bubble sederhana untuk model data.

17
Dalam contoh ini, hanya ada satu SALESPERSON-NUMBER ditugaskan untuk
setiap SALESPERSON-NAME, dan orang itu akan mencakup hanya satu SALES-
AREA, tetapi masing-masing SALES-AREA dapat ditugaskan untuk banyak tenaga
penjualan: sebab, notasinya terdapatpanah ganda dari SALES-AREA ke
SALESPERSON-NUMBER. Untuk setiap SALESPERSON-NUMBER, mungkin
memiliki banyak CUSTOMER-NUMBER (s).
Selain itu, akan ada korespondensi satu ke satu antara CUSTOMER-NUMBER
dan CUSTOMER-NAME; dan berlaku sama untuk WAREHOUSE-NUMBER dan
WAREHOUSE-LOCATION. CUSTOMER-NUMBER akan hanya memiliki satu
WAREHOUSE-NUMBER dan WAREHOUSE- LOCATION, tetapi masing-masing
WAREHOUSE-NUMBER atau WAREHOUSE-LOCATION dapat melayani banyak
PELANGGAN-NUMBER (s). Akhirnya, untuk menentukan SALES-AMOUNT untuk
memberikan tanda satu penjual untuk perusahaan tertentu, perlu untuk mengetahui
kedua SALESPERSON-NUMBER dan PELANGGAN-NUMBER.
Tujuan utama dari proses normalisasi adalah untuk menyederhanakan semua item
data yang kompleks yang sering ditemukan dalam pandangan pengguna. Sebagai
contoh, jika analis mengambil pandangan pengguna yang dibahas sebelumnya dan
mencoba untuk membuat tabel relasional dari itu, table yang akan terlihat seperti
Figur13.14.

Karena relasi ini didasarkan pada pandangan pengguna awal ,dan menyebutnya
sebagai SALES-REPORT. SALES-REPORT adalah hubungan unnormalisasi,karena

18
memiliki kelompok berulang. Hal ini juga penting untuk mengamati bahwa atribut
tunggal seperti SALESPERSON-NUMBER tidak dapat berrfungsi sebagai kunci.
Alasannya jelas ketika seseorang meneliti hubungan antara SALESPERSON-
NUMBER dan atribut lainnya pada Figur 13.15.

Meskipun ada korespondensi satu ke satu antara SALESPERSON-NUMBER dan


dua atribut (SALESPERSON-NAME dan (SALES-AREA), ada hubungan satu ke
banyak antara SALESPERSON-NUMBER dan lima atribut lainnya (CUSTOMER-
NUMBER, CUSTOMER-NAME,WAREHOUSE-NUMBER,WAREHOUSE-
LOCATION,dan(SALES-AMOUNT).
SALES-REPORT dapat dinyatakan dalam notasi singkat berikut:
SALES REPORT: (SALESPERSON-NUMBER,
SALESPERSON-NAME, SALES-AREA,
(CUSTOMER-NUMBER,CUSTOMER-NAME,
WAREHOUSE-NUMBER,WAREHOUSE-LOCATION,
SALES-AMOUNT))
di mana set dalam kurung merupakan kelompok berulang.

19
FIRST

NORMAL FORM (1NF)


Langkah pertama dalam normalisasi sebuah relasi adalah untuk menghilangkan
kelompok berulang. Dalam contoh kita,relasi unnormalisasi SALES-REPORT akan
dipecah menjadi dua relasi yang terpisah. Hubungan-hubungan baru akan diberi nama
SALESPERSON dan SALESPERSON-CUSTOMER.
Figur 13.16 menunjukkan bagaimana asli, unnormalisasi SALES-REPORT relasi
dinormalisasikan dengan memisahkan hubungan menjadi dua relasi baru. Perhatikan
bahwa relasi SALESPERSON berisi primary key SALESPERSON-NUMBER dan
semua atribut yang tidak mengulangi(SALESPERSON-NAME&SALES-AREA).
Relasi kedua, SALESPERSON-CUSTOMER, berisi primary key dari relasi
SALESPERSON (primary key SALESPERSON adalah SALESPERSON-NUMBER),
serta semua atribut yang merupakan bagian dari kelompok berulang (CUSTOMER-
NUMBER, CUSTOMER-NAME, WAREHOUSE-NUMBER,WAREHOUSE-
LOCATION,&SALES-AMOUNT).Bagaimanapun SALESPERSON-
NUMBERmengetahui tidak secara otomatis bahwa Anda akan
mengetahui,CUSTOMER-NAME,SALES-AMOUNT,WAREHOUSE-LOCATION dan
sebagainya.

20
Dalam relasi ini, seseorang harus menggunakan kunci bersambung(baik
SALESPERSON-NUMBER &CUSTOMER-NUMBER)) untuk mengakses seluruh
informasi. Hal ini memungkinkan untuk menulis relasi di notasi singkat sebagai berikut:

Relasi SALESPERSON-CUSTOMER adalah relasi normal pertama, tetapi tidak


dalam bentuk yang ideal. Masalah timbul karena beberapa atribut yang tidak fungsional
tergantung pada primary key (yaitu, SALESPERSON-NUMBER, CUSTOMER-
NUMBER). Dengan kata lain, beberapa atribut nonkey tergantung hanya pada
CUSTOMER-NUMBER dan bukan pada menggabungkan kunci. Diagram model data
pada figur13.17 menunjukkan bahwa SALES-AMOUNT tergantung pada kedua
SALESPERSON-NUMBER dan CUSTOMER-NUMBER, tetapi tiga atribut lainnya
bergantung hanya pada CUSTOMER-NUMBER.

SECONDNORMAL FORM (2NF)


Dalam bentuk normal kedua, semua atribut akan fungsional yang tergantung pada
primary key. Oleh karena itu, langkah berikutnya adalah untuk menghilangkan semua

21
atribut parsial dependent dan menempatkan mereka dalam relasi lainnya. Figur 13.18
menunjukkan bagaimana relasi SALESPERSON-CUSTOMER dibagi menjadi dua
relasi baru: SALES dan CUSTOMER-WAREHOUSE.

hubungan ini juga dapat dinyatakan sebagai berikut:

Relasi CUSTOMER-WAREHOUSE adalah bentuk normal kedua. Masih bisa


disederhanakan lebih lanjut karena ada dependensi tambahan dalam relasi. Beberapa
atribut nonkey tergantung tidak hanya pada primary key, tetapi juga pada atribut nonkey.
Ketergantungan ini disebut sebagai ketergantungan transitif.
Untuk relasi menjadi bentuk normal kedua, semua atribut harus bergantung pada
primay key CUSTOMER-NUMBER , seperti yang ditunjukkan dalam diagram.

22
WAREHOUSE-LOCATION, bagaimanapun, akan jelas tergantung pada
WAREHOUSE-NUMBER juga. Untuk mempermudah hubungan ini, langkah lain yang
diperlukan.
Gambar 13.19 menunjukkan dependensi dalam kaitannya CUSTOMER-
WAREHOUSE.

THIRD NORMAL FORM (3NF)


Suatu relasi dinormalisasi adalah dalam bentuk normal ketiga jika semua atribut
nonkey sepenuhnya fungsional tergantung pada primary key dan tidak ada transitif
(nonkey) dependensi. Dalam cara yang sama dengan langkah-langkah sebelumnya, itu
akanmungkin untuk memecahkan hubungan CUSTOMER-WAREHOUSE menjadi dua
hubungan, seperti yang ditunjukkan pada Figur 13.20

23
Dua relasi baru disebut CUSTOMER dan WAREHOUSE, dan dapat ditulis
sebagai berikut:

Primary key untuk relasi CUSTOMER adalah CUSTOMER-NUMBER, dan


primary key untuk relasi WAREHOUSE adalah WAREHOUSE-NUMBER.
Disamping primary key,kita dapat mengidentifikasi WAREHOUSE-NUMBER
untuk menjadi kunci asing(foreign key) dalam relasi CUSTOMER. Foreign key adalah
atribut nonkey dalam satu relasi tetapi Primary key dalam relasi lain. Dan ditunjukkan
WAREHOUSE-NUMBER sebagai kunci asing(foreign key) dalam notasi sebelumnya
dan menggaris bawahi dengan garis putus-putus: ______ di dalam gambar.
Akhirnya, bentuk asli, relasi unnormalisasi SALES-REPORT telah berubah
menjadi empat 3NF relasi. Dapar dilihat pada relasi yang ditunjukkan pada Gambar
13.21,

kita dapat melihat bahwa relasi SALES-REPORT tunggal berubah menjadi empat
relasi berikut:

24
Bentuk normal ketiga memadai untuk sebagian besar masalah desain database.
Penyederhanaan diperoleh dari mengubah sebuah relasi unnormalisasi menjadi satu set
relasi 3NF merupakan manfaat yang luar biasa ketika tiba saatnya untuk memasukkan,
menghapus, dan memperbarui informasi dalam database.

2.7 Using the Entity-Relationship Diagram to Determine Record Keys


ERD adalah merupakan salah satu model yang digunakan untuk mendesain
database dengan tujuan menggambarkan data yang berelasi pada sebuah database.
Terdapat 2 jenis relation, yaitu :
 One to Many
Merupakan jenis paling umum digunakan. Dalam one to many relationship,
kunci utama dari file di salah satu ujung hubungan harus terkandung sebagai
kunci asing pada file di ujung dari hubungan banyak.

 Many to Many
Sebuah hubungan banyak-ke-banyak harus dibagi menjadi dua hubungan
satu-ke-banyak dengan entitas asosiatif di tengah. Pada many to many relation

25
dibutuhkan 3 tabel, satu untuk entitas data , dan satu untuk hubungan . Kunci
utama dari setiap entitas data disimpan sebagai kunci asing dari tabel
relasional.

2.8 Guidelines For Master File/Database Relation Design


Pedoman berikut harus diperhitungkan saat merancang file induk atau database
hubungan:
1. Setiap entitas data terpisah harus membuat tabel database master. Jangan
menggabungkan dua entitas yang berbeda pada satu file.
2. Bidang data tertentu harus ada hanya pada satu tabel master. Pengecualian untuk
pedoman ini adalah kunci atau indeks bidang, yang mungkin pada tabel sebanyak
yang diperlukan. Jika laporan atau layar membutuhkan informasi dari banyak tabel,
indeks harus menyediakan linkage untuk memperoleh data yang diperlukan.
3. Setiap tabel master atau hubungan database harus memiliki program untuk Buat,
Baca, Update, dan Hapus (disingkat CRUD) catatan. Idealnya, hanya satu program
harus menambahkan catatan baru dan hanya satu program harus menghapus catatan
tertentu. Banyak program, bagaimanapun, mungkin bertanggung jawab untuk
mengubah bidang data dalam perjalanan kegiatan usaha normal.

2.9 Integrity Constraints

26
Kendala integritas aturan yang memerintah dengan mengubah dan menghapus
catatan, dan yang membantu menjaga data dalam database yang akurat. Tiga jenis
batasan integritas berlaku untuk database:
1. Integritas entitas
Yaitu aturan yang mengatur komposisi kunci primer. Primer key tidak dapat
memiliki nilai nol, dan jika kunci utama adalah kunci komposit, tidak ada
komponen di kunci yg dapat berisi nilai null.
2. Integritas referensial
Yaitu memastikan bahwa seluruh nilai dari foreign key cocok dengan nilai primary
key yang dihubungkan.
3. Integritas domain
Domain Integritas merupakan validasi dari masukan untuk sebuah kolom. Anda
dapat memaksa domain integritas dengan membatasi tipe (melalui data types),
format (melalui check constraints dan rules), atau range nilai-nilai yang mungkin
(melalui Foreign Key Constraints, Check Constraints, Default Definitions dan
rules).

2.10 Anomalies
Empat anomali dapat terjadi saat membuat tabel database:
1. Data redundancy
Redundansi data terjadi ketika data yang sama disimpan di lebih dari satu tempat
dalam database (kecuali primer key disimpan sebagai foreign key).
2. Insert anomaly
Insert anomali terjadi ketika seluruh kunci primer tidak diketahui dan database
tidak bisa menyisipkan catatan baru, yang akan melanggar integritas entitas.
3. Deletion anomaly
Sebuah penghapusan anomali yang terjadi ketika sebuah record dihapus,
mengakibatkan hilangnya data terkait lainnya.

4. Update anomaly

27
Update anomali terjadi ketika perubahan satu nilai atribut menyebabkan database
mengandung data yang tidak konsisten atau menyebabkan beberapa catatan perlu
berubah.

2.11 Making Use Of The Database


Ada delapan langkah dalam pengambilan dan penyajian data :
1. Memilih sebuah relasi dari database
2. Bergabung dua hubungan bersama-sama
3. Kolom proyek dari relasi
4. Pilih baris dari relasi
5. Turunkan atribut baru
6. Indeks atau semacam bari
7. Hitung total dan ukuran kinerja
8. Data saat ini
Pemanfaatan Database

Ada beberapa langkah yang harus dilakukan agar database bermanfaat untuk
mempresentasikan data:
1. Memilih hubungan dari database
2. Gabungkan hubungan-hubungan tersebut menjai satu
3. Membangun kolom dari hubungan yang telah disatukan
4. Memilih baris dari hubungan
5. Memperoleh atribut baru
6. Indeks atau menyusun baris
7. Menghitung total dan pengukuran hasil
8. Mempresentasikan data

28
Langkah 1 dan 8 harus dilakukan, tetapi 6 langkah lainnya adalah pilihan sesuai
dengan bagaimana data akan digunakan Untuk langkah 8, data dapat dipresentasikan
dalam berbagai bentuk. Contohnya dalam bentuk tabel, grafik, dan lain sebagainya.
Berikut ini merupakan gambar yang menunujukkan lagkah-langkah diatas

2.12 Denormalisasi
Alasan normalisasi adalah untuk mengatur data sehingga data sisa juga bekurang.
Jika kita tidak diminta untuk menyimpan data yang sama lagi dan lagi, kita bisa
menghemat banyak ruang penyimpanan. Hal ini kadang dilakukan oleh analis
perusahaan, apalagi jika harga ruang penyimpanan mahal.
Denormalisasi adalah proses pengambilan model data logis dan mengubahnya
menjadi model fisik yang lebih efisien untuk kebanyakan kebutuhan pekerjaan.
Denormalisasi dapat dicapai dalam beberapa cara yang berbeda.Salah satunya
dapat dilihat pada gambar berikut.

29
Disini kita mabil contoh hubungan many-to-many, pelayan toko dan pelanggan

yang dihubungkan dengan entitas penjualan. Dengan mengkombinasikan atribut


dari pelayan toko dan penjualan kita dapat menghindari satu proses bersama. Hal ini
dapat menimbulkan beberapa data yang terduplikasi, tetapi membuat queries tentanf
penjualan lebih efisien.

30
Alasan lain denormalisasi adalah untuk menghindari pengulangan referensi untuk
pencarian tabel. Akan lebih efisien jika informasi yang sama diulang, contohnya kota,
negara, dan kode zip. Di dalam contoh ini, atribut pelanggan dan atribut gudang dapat
dikombinasikan.
Terakhir, kita lihat hubungan one-to-one. Dari gambar bisa dilihat beberapa detail
bisa muncul pada detail pesanan dan detail pengiriman ketika melakukan
denormalisasi.

2.13 Data warehouses


Data warehouses (gudang data) berbeda dengan database tradisional. Tujuan dari
gudang data adalah mengatur informasi untuk queri yang cepat dan efektif. Akibatnya,
mereka menyimpan data denormalized, tetapi mereka pergi satu langkah lebih jauh.
Mereka mengatur data di sekitar subyek. Biasanya gudang data berasal dari lebih dari
satu database yang diolah sehingga data direpresentasikan dengan cara yang seragam.
Oleh karena itu, data yang disimpan dalam gudang data berasal dari sumber yang
berbeda, biasanya database dibuat untuk tujuan yang berbeda.
Perbedaan gudang data dengan database tradisional :
1. Dalam sebuah gudang data, data yang diorganisir adalah data disekitar subyek
utama daripada transaksi individual
2. Data dalam gudang data biasanya disimpan sebagai data dirangkum daripada
data yang rinci dan data mentah yang ditemukan dalam database berorientasi
transaksi.
3. Data dalam data warehouse mencakup kerangka waktu lebih lama dari data
dalam database transaksi yang berorientasi tradisional karena permintaan
biasanya menyangkut keputusan jangka panjang membuat daripada rincian
transaksi harian.
4. Sebagian besar data gudang diatur untuk query cepat, sedangkan database yang
lebih tradisional dinormalisasi dan terstruktur sedemikian rupa untuk
menyediakan penyimpanan informasi yang efisien

31
5. Data warehouse biasanya dioptimalkan untuk menjawab pertanyaan kompleks,
yang dikenal sebagai OLAP, dari manajer dan analis, bukan sederhana dan
pertanyaan berulang
6. Data warehouse memungkinkan akses mudah melalui software data mining
(disebut siftware) yang akan mencari pola dan mampu mengidentifikasi
hubungan yang tidak dibayangkan oleh pengambil keputusan manusia.
7. Data warehouse meliputi tidak hanya satu tapi beberapa database yang telah
diolah sehingga data warehouse ini didefinisikan seragam. database ini disebut
data bersih.
8. Data warehouse biasanya mencakup data dari sumber-sumber luar (seperti
laporan industri, perusahaan OJK, atau bahkan informasi tentang produk
pesaing), serta data yang dihasilkan untuk penggunaan internal.
Membangun data warehouse adalah tugas yang monumental. analis perlu untuk
mengumpulkan data dari berbagai sumber dan menerjemahkan data ke dalam bentuk
umum. Misalnya, satu database dapat menyimpan informasi tentang gender sebagai
"Pria" dan "Wanita, yang lain mungkin menyimpannya sebagai" M "dan" F, dan ketiga
mungkin menyimpannya sebagai "1" dan 0. analis perlu menetapkan standar dan
mengkonversi semua data ke format yang sama.
Setelah data bersih, analis harus memutuskan bagaimana meringkas data. Setelah
dirangkum, detail data akan hilang, sehingga analis harus memprediksi jenis pertanyaan
yang mungkin ditanyakan.
Biasanya ukuran gudang data adalah 50 gigabyte atau dalam puluhan gigabyte.
Karena ukurannya besar, harganya juga maha. Biasanya harga gudang data mencapai
jutaan dolar.

2.14 Online Analytic Processing ( OLAP )


Pertama kali diperkenalkan pada tahun 1993 oleh E. F. Codd, online analytical
processing (OLAP) dimaksudkan untuk menjawab pertanyaan para pengambil
keputusan 'kompleks. Codd menyimpulkan bahwa pembuat keputusan harus melihat
data dalam berbagai cara. Oleh karena itu, database itu sendiri harus multidimensi.
Banyak orang menggambarkan OLAP sebagai Rubik Kubus data. Anda dapat melihat

32
data dari semua sisi yang berbeda, dan juga dapat memanipulasi data dengan memutar
atau memutar itu sehingga masuk akal.
Pendekatan OLAP ini divalidasi konsep gudang data. Kemudian masuk akal untuk
data yang akan diorganisir dengan cara-cara yang memungkinkan efisien query. Tentu
saja, OLAP melibatkan pengolahan data melalui manipulasi, rangkuman, dan
perhitungan, sehingga lebih dari sebuah gudang data yang terlibat.

2.15 Data Mining


Data mining (penggalian data) dapat mengidentifikasi pola-pola yang manusia
tidak mampu mendeteksi. Baik pembuat keputusan tidak bisa melihat pola, atau
mungkin pembuat keputusan tidak dapat berpikir tentang mempertanyakan
apakahterdapat pola. Algoritma data mining mencari data gudang untuk pola
menggunakan algoritma.

Gambar berikut menggambarkan konsep data mining.

33
Data mining dikenal dengan nama lain, pengetahuan penemuan data (KDD).
Beberapa berpikir bahwa KDD berbeda dari data mining karena KDD dimaksudkan
untuk membantu para pengambil keputusan dalam menemukan pola daripada beralih
kontrol atas untuk sebuah algoritma untuk menemukan mereka. Alat bantu keputusan
yang tersedia disebut siftware; mereka termasuk analisis statistik, pohon keputusan,
jaringan saraf, agen cerdas, logika fuzzy, dan visualisasi data.
Konsep data mining berasal dari keinginan untuk menggunakan database untuk
penargetan lebih selektif para pelanggan. Awal pendekatan mengarahkan email termasuk
menggunakan informasi kode pos sebagai cara untuk menentukan apa pendapatan
keluarga mungkin (dengan asumsi keluarga harus menghasilkan pendapatan yang cukup
untuk mampu hidup dalam kode pos Beverly Hills bergengsi 90210 atau beberapa
kawasan makmur lainnya). Ini adalah cara (tidak sempurna, tentu saja) untuk membatasi
jumlah katalog dikirim.
Pendekatan data mining bukan tanpa masalah, namun. Pertama, biaya mungkin
terlalu tinggi untuk menjustifikasi data mining, sesuatu yang hanya dapat ditemukan
setelah biaya setup besar telah diperoleh. Kedua, data mining harus dikoordinasikan
sehingga berbagai departemen atau anak tidak semua mencoba untuk mencapai
pelanggan pada saat yang sama. Selain itu, pelanggan mungkin berpikir privasi mereka
telah diserang dan membenci penawaran yang datang dengan cara mereka. Akhirnya,
pelanggan mungkin berpikir profil dibuat semata-mata atas dasar pembelian kartu kredit
mereka menyajikan gambar yang sangat menyimpang dari siapa mereka.

34
BAB III
PENUTUP
3.1 Kesimpulan
Pemahaman tentang penyimpanan data membutuhkan pemahaman dari tiga alam:
kenyataan, data, dan metadata. Sebuah entitas adalah setiap objek atau kejadian yang
kami bersedia untuk mengumpulkan dan menyimpan data. Atribut adalah karakteristik
sebenarnya entitas ini. item data dapat memiliki nilai dan dapat diatur ke dalam catatan
yang dapat diakses oleh kunci. Metadata menggambarkan data dan dapat berisi
pembatasan tentang nilai dari item data (seperti numerik saja).
Contoh file konvensional termasuk file induk, file tabel, file transaksi, file
pekerjaan, dan file laporan. Database biasanya dibangun dengan struktur relasional.
sistem warisan dapat memiliki hirarki atau jaringan struktur.
Normalisasi adalah proses yang membutuhkan pandangan pengguna dan
mengubahnya ke dalam struktur kurang kompleks disebut normalisasi hubungan. Ada
tiga langkah dalam proses normalisasi. Pertama, semua kelompok mengulangi dihapus.
Kedua, semua dependensi parsial dihapus. Akhirnya, dependensi transitif dibawa
keluar. Setelah tiga langkah ini selesai, hasilnya adalah penciptaan banyak hubungan
yang dari bentuk normal ketiga (3NF).

35
Diagram relasi entitas dapat digunakan untuk menentukan kunci yang diperlukan
untuk catatan atau hubungan basis data. Tiga pedoman untuk mengikuti ketika
merancang tabel induk atau relasi database yang (1) masing-masing entitas data terpisah
harus membuat tabel master (tidak menggabungkan dua entitas yang berbeda dalam
satu meja); (2) bidang data tertentu harus ada hanya pada satu tabel master; dan (3)
masing-masing tabel master atau hubungan database harus memiliki program untuk
Buat, Baca, Update, dan Delete.
Proses mengambil data mungkin melibatkan sebanyak delapan langkah: (1) memilih
relasi, (2) bergabung dua relasi bersama-sama, (3) memproyeksikan (memilih) kolom,
(4) memilih baris yang relevan, (5) berasal baru di - upeti, (6) menyortir atau baris
pengindeksan, (7) menghitung jumlah dan ukuran kinerja, dan akhirnya (8) pra senting
hasil kepada pengguna.
Denormalization adalah proses yang mengambil model data logis dan mengubahnya
menjadi model fisik yang efisien untuk tugas-tugas yang paling dibutuhkan. gudang
data yang berbeda dari database tradisional dalam banyak hal; satu adalah bahwa
mereka menyimpan data denormalized, yang diselenggarakan di sekitar mata pelajaran.
Data warehouse memungkinkan akses mudah melalui software data mining, yang
disebut siftware, yang mencari pola dan mengidentifikasi kapal hubungan-tidak
dibayangkan oleh pengambil keputusan manusia.

36

Anda mungkin juga menyukai