Data Warehouse
02
Ilmu Komputer Sistem Informasi W181720001 Ardiansyah, ST.,MTI
Abstract Kompetensi
Konsep Model Relasi Obyek
Entity Relationship Diagram (ERD) untuk mendokumentasikan data perusahaan dengan
mengidentifikasi jenis entitas (entity) dan hubungannya.
ERD merupakan suatu model jaringan yang menggunakan susunan data yang disimpan pada
sistem secara abstrak.
ERD juga menggambarkan hubungan antara satu entitas yang memiliki sejumlah atribut
dengan entitas yang lain dalam suatu sistem yang terintegrasi.
ERD digunakan oleh perancang sistem untuk memodelkan data yang nantinya akan
dikembangkan menjadi database.
Model data ini juga akan membantu pada saat melakukan analisis dan perancangan
database, karena model data ini akan menunjukkan bermacam-macam data yang dibutuhkan
dan hubungan antar data.
ERD ini juga merupakan model konseptual yang dapat mendeskripsikan hubungan antara file
yang digunakan untuk memodelkan struktur data serta hubungan antar data.
Simbol Keterangan
Selain dari simbol diatas, sebenarnya ada simbol lain lagi yaitu entitas asosiatif, atribut
derivat, dan lainnya.
Akan tetapi secara garis besar ERD terdiri dari atas tiga komponen, yaitu entitas
(entity), atribut (attribute), dan relasi atau hubungan (relation).
Entitas merupakan dasar yang terlibat dalam sistem. Atribut atau field berperan
sebagai penjelas dari entitas, dan relasi atau hubungan yang terjadi antara dua
entitas.
Entitas menunjukkan objek-objek dasar yang terkait di dalam sistem. Objek dasar
dapat berupa orang, benda, atau hal lain yang keterangannya perlu disimpan dalam
database.
Untuk menggambarkan entitas dilakukan dengan cara mengikuti aturan berikut:
1. Entitas dinyatakan dengan simbol persegi panjang.
2. Nama entitas berupa kata benda tinggal
3. Nama entitas sebisa mungkin menggunakan nama yang mudah dipahami dan
menyatakan maknanya dengan jelas.
Atribut (Attribute)
Atribut sering juga disebut sebagai properti, merupakan keterangan-keterangan yang terkait
pada sebuah entitas yang perlu dsimpan sebagai database.
Atribut berfungsi sebagai penjelas sebuah entitas untuk mengambarkan atribut yang
dilakukan dengan mengikuti aturan sebagai berikut:
1. Atribut dinyatakan dengan simbol ellipse.
2. Nama atribut ditulis dalam simbol ellipse.
3. Nama atribut berupa kata benda tunggal.
4. Nama atribut sebisa mungkin menggunakan nama yang mudah dipahami dan padat
menyatakan maknanya dengan jelas.
5. Atribut dihubungkan dengan entitas yang sesuai dengan menggunakan garis.
Relasi (Relation)
Relasi atau hubungan adalah kejadian atau transaksi yang terjadi di antara dua entitas yang
keterangannya perlu disimpan dalam database.
Aturan penggambaran relasi antar entitas adalah:
1. Relasi dinyatakan dengan simbol belah ketupat.
2. Nama relasi dituliskan di dalam simbol belah ketupat.
3. Relasi menghubungkan dua entitas.
4. Nama relasi menggunakan kata kerja aktif (diawali awalan me) tunggal.
5. Nama relasi sebisa mungkin menggunakan nama yang mudah dipahami dan dapat
menyatakan maknanya dengan jelas.
b. Relasi Unary
Relasi Unary merupakan variasi relasi yang terjadi dari sebuah himpunan
entitas ke himpunan entitas yang sama dan unary sering disebut dengan relasi
tunggal.
Relasi antara dosen dan mendampingi yang menunjukkan unary relation.
c. Relasi N-ary
Relasi N-ary merupakan relasi dari 3 entitas atau lebih. Relasi ini untuk
menghubungkan dari tiga entitas yang dimasukan ke relasi multi entitas.
N-ary relation menunjukkan secara lebih jelas bahwa bahwa beberapa entitas
berpartisipasi dalam sebuah relasi tunggal.
Pada gambar diatas dapat dilihat bahwa satu himpunan ibu memiliki banyak hubungan
ke himpunan entitas anak.
Dalam arti kata satu ibu bisa memiliki banyak anak dan satu anak hanya dimiliki oleh
satu ibu.
Model untuk menjelaskan hubungan antar data dalam basis data berdasarkan
suatu persepsi bahwa real word terdiri dari objek-objek dasar yang mempunyai
hubungan atau relasi antara object-object tersebut.
E-R MODEL berisi ketentuan/aturan khusus yang harus dipenuhi oleh isi
database. Aturan terpenting adalah MAPPING CARDINSLITIES, yang
menentukan jumlah entity yang dapat dikaitkan dengan entity lainnya melalui
relationship-set.
Gambar di bawah ini merupakan contoh dari relasi berderajat dua dan relasi
berderajat tiga.
o Binary model
Relasi memiliki tiga tipe biner yaitu:
a. One-to-one (1:1). Hubungan terjadi bila setiap instansi entitas hanya memiliki
satu hubungan dengan instansi entitas lain.
c. Many-to-many (M:N). Hubungan saling memiliki lebih dari satu dari setiap
instansi entitas terhadap instansi entitas lainnya.
Selain relasi antara dua entitas, terdapat juga hubungan terhadap entitasnya
sendiri yang disebut dengan recursive relationship (self relation). Hubungan ini
dapat mempunyai tipe biner, seperti yang sudah dibahas sebelumnya.
Pada mode data hirarki, hubungan antar entitas dinyatakan dalam satu-banyak
(one to many) atau satu-satu (one to one). Dalam satu Universitas terdapat banyak
Fakultas dan setiap Fakultas terdapat banyak Dosen atau banyak Mahasiswa, dan
seterusnya. Tanda panah menunjukkan derajat keterhubungan “banyak”.
Untuk menampilkan semua mata kuliah pada Fakultas tertentu harus dilakukan
dalam dua tahap. Yang pertama adalah menampilkan rekaman semua Dosen
yang mengajar di Fakultas tersebut, kemudian baru mata kuliah yang dipegang
oleh para Dosen. Dalam hal ini penampilan data terlihat kurang efisien, sebab
menggunakan entitas perantara (dosen) yang harus ditampilkan juga.
Dikarenakan kunci data yang digunakan untuk menghubungkan antar entitas diberi
kode dalam struktur data, maka untuk jumlah entitas perantara yang sedikit masih
dapat dikatakan efisien.
Kelemahan lain pada model data hirarki adalah tidak dapat melakukan pencarian
data pada field. Misalnya dalam entitas mata kuliah tidak dapat ditampilkan hanya
mata kuliah dengan jumlah SKS tertentu, sebab field “Jumlah SKS” bukan sebagai
kunci data. Hal ini masih dapat dilakukan dengan mengubah struktur data dengan
memberi hubungan khusus yang digunakan untuk mengubah struktur database.
Kelebihan model ini adalah sangat mudah dipahami dan mudah dalam
pembaharuan data [Waliyanto2000].
Dalam model ini lebih sedikit terdapat data rangkap, namun lebih banyak terdapat
hubungan antar entitas, sehingga akan menambah informasi hubungan yang
harus disimpan dalam database. Hal ini akan menambah volume dan kerumitan
dalam penyimpanan berkas data.
Dengan menggunakan model ini, pencarian field dari suatu tabel atau banyak tabel
dapat dilakukan dengan cepat. Pencarian atribut yang berhubungan pada tabel
Keuntungan yang didapat dengan menggunakan model ini adalah sebagai berikut
[Waliyanto2000]:
Model ini lebih luwes karena nilai data dalam tabel tidak ada pembatasan
dalam berbagai proses pencarian data.
Model ini mempunyai latar belakang teori matematika.
Pengorganisasian model relasional sangat sederhana, sehingga mudah
dipahami.
Basis data yang sama biasanya dapat disajikan dengan lebih sedikit terjadi
data rangkap (redudancy data).
b. Klasifkasi berdasarkan lokasi penyimpanan data, yaitu DBMS terpusat dan DBMS
terdistribusi. Dalam DBMS terpusat basis data disimpan dalam satu komputer media
penyimpan sehingga pengguna sistem mengakses data dari pusat. DBMS
terdistribusi, basis data tersebar pada penyimpanan tiap terminal pengguna (client).
Antar pengguna dapat mengakses data secara langsung tanpa perlu melalui pusat
penyimpanan. DBMS ini memerlukan sistem kontrol yang rumit.
c. Klasifikasi berdasarkan tujuan DBMS digunakan yaitu tujuan umum (general purpose)
dan tujuan khusus (special purpose). Untuk tujuan umum dapat digunakan untuk
berbagai tujuan dengan memperlakukan data sama menurut penggunaannya contoh
aplikasinya adalah DBASE, ORACLE, FOXBASE dan sebagainya. DBMS tujuan
khusus dirancang dan digunakan untuk keperluan tertentu, sebagai contoh
pengelolaan data karyawan pada perusahaan Asuransi.
Proses normalisasi pertama kali diperkenalkan oleh E.F. Codd pada tahun 1972. Normalisasi
sering dilakukan sebagai serangkaian tes pada relasi untuk menentukan apakah suatu relasi
sudah memenuhi atau masih melanggar persyaratan bentuk normal tertentu. Pada awalnya
terdapat 3 jenis bentuk normal yang diusulkan, yaitu bentuk normal ke satu (1NF), bentuk
normal kedua (2NF), dan bentuk normal ketiga (3NF). Setelah itu R. Boyce dan E.F. Codd
memperkenalkan Boyce Codd Normal Form (BCNF), bentuk normal yang lebih tinggi dari
bentuk normal ketiga pada tahun 1974. Pada perkembangan selanjutnya muncul pula bentuk
normal ke-4 dan ke-5.
“Anomali adalah proses pada basis data yang memberikan efek samping yang tidak
diharapkan (misalnya menyebabkan ketidakonsistenan data atau membuat suatu data
menjadi hilang ketika data dihapus)”
Dalam pendekatan normalisasi, perancangan basis data bertitik tolak dari situasi nyata. Ia
telah memiliki item–item data yang siap ditempatkan dalam baris dan kolom pada tabel–tabel
relasional. Demikian juga dengan sejumlah aturan tentang keterhubungan antara item–item
data tersebut. Sementara pendekatan model data ER lebih tepat dilakukan jika yang diketahui
baru prinsip sistem secara keseluruhan.
Cukup sering pendekatan ini dilakukan bersama–sama, berganti–ganti. Dari fakta yang telah
kita miliki, kita lakukan normalisasi. Untuk kepentingan evaluasi dan dokumentasi, hasil
normalisasi itu kita wujudkan dalam sebuah model data. Model data yang sudah jadi tersebut
bisa saja dimodifikasi dengan pertimbangan tertentu. Hasil modifikasinya kemudian kita
implementasikan dalam bentuk sejumlah struktur tabel dalam sebuah basis data. Struktur ini
dapat kita uji kembali dengan menerapkan aturan–aturan normalisasi, hingga akhirnya kita
peroleh sebuah struktur basis data yang benar–benar efektif dan efisien.
Tujuan Normalisasi
Tujuan normalisasi adalah untuk menghilangkan dan mengurangi redudansi data dan tujuan
yang kedua adalah memastikan dependensi data (Data berada pada tabel yang tepat).
1. Untuk menghilangkan kerangkapan data
Jika data dalam database tersebut belum di normalisasi maka akan terjadi 3 kemungkinan
yang akan merugikan sistem secara keseluruhan.
1. INSERT Anomali: Situasi dimana tidak memungkinkan memasukkan beberapa jenis data
secara langsung di database.
2. DELETE Anomali: Penghapusan data yang tidak sesuai dengan yang diharapkan, artinya
data yang harusnya tidak terhapus mungkin ikut terhapus.
3. UPDATE Anomali: Situasi dimana nilai yang diubah menyebabkan inkonsistensi
database, dalam artian data yang diubah tidak sesuai dengan yang diperintahkan atau
yang diinginkan.
Tahapan Normalisasi
Bentuk Normal adalah sekumpulan kriteria yang harus dipenuhi oleh sebuah desain tabel
untuk mencapai tingkat/level bentuk normal tertentu. Parameter yang biasanya digunakan
dalam menentukan kriteria bentuk normal adalah Functional dependency & The Three Keys.
Masing-masing bentuk normal memiliki kriteria dan level tertentu yang tidak mungkin dicapai
tanpa memenuhi kriteria bentuk nomal level yang berada di bawahnya. Makin tinggi level
bentuk normal yang dicapai maka kualitas desain tabel tersebut dinyatakan makin baik dan
semakin kecil peluang terjadinya anomali dan redundansi data.
Normalisasi dilakukan dengan cara menerapkan Bentuk-Bentuk Normal secara bertahap dari
level terendah sampai level yang dikehendaki. Walaupun ada beberapa bentuk normal namun
jika desain tabel tertentu sudah memenuhi kriteria 3rd NF atau BCNF maka desain tabel itu
biasanya dianggap sudah ‘cukup normal’.
“Normalisasi database terdiri dari banyak bentuk, dalam ilmu basis data ada setidaknya 9
bentuk normalisasi yang ada yaitu 1NF, 2NF, 3NF, EKNF, BCNF, 4NF, 5NF, DKNF, dan 6NF.
Namun dalam prakteknya dalam dunia industri bentuk normalisasi ini yang paling sering
digunakan ada sekitar 5 bentuk”.