Anda di halaman 1dari 10

MAKALAH BASIS DATA

DATA BASE TERSEBAR

Oleh :
EGIT WIDIYANTO
NIM : 312012115

PROGRAM STUDI TEKNIK KOMPUTER


POLITEKNIK SUKABUMI
2015

PENGERTIAN BASIS DATA TERSEBAR


Basis Data Tersebar (DDBS: Distributed Database System) adalah Kumpulan sejumlah
database yang saling berhubungan secara logis (logically interrelated) diatas suatu jaringan
komputer (distributed over a computer network). Distributed DBMS adalah sistem software yang
memberikan fasilitas untuk manajemen DDBS.
DDBS bukan koleksi file yang secara individual disimpan di setiap node pada suatu jaringan
komputer. File tidak hanya saling berhubungan secara logis, tapi file-file tersebut harus terstruktur
dan pengaksesannya harus melalui interface yang sama. Distribusi data yang terpisah secara fisik
akan menimbulkan masalah yang tidak dijumpai ketika database ada di komputer yang sama.
Inilah yang membedakan antara DDBS dengan Multiprocessor.DDBS bukan merupakan sistem
dimana meskipun ada jaringan komputer, tapi databasenya hanya terletak disatu node dari jaringan
tsb.
Site
1

Site
1

Communication
Network

Site
1

Site
1
Jelas bahwa Jaringan Komputer atau Kolesi File, tidak cukup untuk membentuk DDBS.
Site
1

Site
1

Communication
Network

Site
1

Site
1

BASIS DATA TERSEBAR


Paradigma pengolahan data Database System (administrasi data secara sentral dan
terintegrasi) merupakan perpindahan dari paradigma File System (data diolah oleh masing-masing
aplikasi). Data Independence: Program Aplikasi sama sekali tidak terpengaruh oleh perubahan yang
terjadi pada data, begitu juga sebaliknya. Teknologi DDBS (Distributed Database System)
merupakan gabungan dari dua pendekatan pengolahan data yang sama sekali berlawanan, yaitu:
Database System dan Teknologi Jaringan Komputer. Tujuan utama Database System:
Mengintegrasikan data dan sentralisasi, sehingga akses (deskripsi, manipulasi dan kontrol) terhadap
data sangat terkontrol Integration, not Centralization
Tujuan utama Jaringan Komputer: Membuat mode kerja yang benar-benar menghindari
terjadinya sentralisasi beban kerja. Teknologi DDBS mengintegrasikan sistem database yang
tersebar, untuk menghasilkan suatu teknologi yang powerful dan menjanjikan Integration
without Centralization.
DISTRIBUTED DATA PROCESSING
Apa itu Distributed Processing (Distributed Computing)?
Beberapa sinonim dari Distributed Processing:
Distributed Function: Distribusi fungsi (CPU atau I/O) meskipun dalam sistem singleprocessor komputer.
Distributed Computing System: Interkoneksi sejumlah elemen-elemen pengolahan
(computing device yang dapat mengeksekusi program di masing-masing) dalam suatu
jaringan komputer dan bekerjasama dalam menjalankan suatu tugas.
Network
Multiprocessors
Timeshared systems
Apa yang didistribusikan?
Processing logic, seperti definisi dari Distributed Computing System diatas.
Functions, pendelegasian ke bermacam-macam hardware/software (tergantung fungsi
komputer)
Data, pendistribusian data ke sejumlah site pengolahan.
Control, kontrol eksekusi sejumlah task secara terdistribusi.
Klasifikasi Distributed Computing Systems (by Bochmann):
Berdasarkan degree of coupling
Berdasarkan struktur interkoneksi
Berdasarkan ketergantungan komponen
Berdasarkan sinkronisasi antar komponen

Saling Tergantung

Berdasarkan degree of coupling (derajat konektivitas antar elemen pengolahan), yakni rasio jumlah
pertukaran data per jumlah pengolahan lokal suatu task:
Weak Coupling: Computer Network
Strong Coupling: A Computer
Berdasarkan struktur interkoneksi:
Point-to-point interconnection

Common interconnection channel

Berdasarkan ketergantungan komponen:


Saling tergantung saat eksekusi suatu task
Komunikasi diawal sebelum eksekusi dan setelah eksekusi
Apa perlunya Distribusi?
Respon terhadap struktur organasi yang mengarah ke distributed enterprise
Lebih ekonomis, praktis dan terpercaya (reliable)
Disain Sistem Komputer Terdistribusi meliputi bagaimana letak data dan program dalam
suatu jaringan. Dalam kasus Sistem Database Tersebar, distribusi aplikasi meliputi 2 hal, yaitu
distribusi dari Distributed DBMS software dan distribusi program aplikasi yang memerlukan
DDBMS tersebut. Pembahasan disini menekankan pada bagaimana pendistribusian data saja.
Organisasi dari Sistem Tersebar dapat ditinjau dari 3 sisi:
Level Sharing
Pola Akses
Level pengetahuan ttg pola akses

Gambar 1. Framework dari Sistem Database Tersebar

Tinjauan dari sisi level sharing, ada 3 kemungkinan:


No Sharing: Setiap aplikasi dan datanya dieksekusi di satu site dan tidak ada komunikasi
dengan program lain atau akses data dari site lain.
Data Sharing: Semua program ada di seluruh site, sementara data tidak. Permintaan user
akan dieksekusi di site dimana user mengakses awal, dan data yang diperlukan akan
dikirimkan ke site tersebut melalui jaringan.

Data Plus Program Sharing: Program dan Data, keduanya disharing. Artinya, program
yang dieksekusi disatu tempat dapat meminta layanan dari program lain di site berbeda
dan ada kemungkinan akses data dari site yang berbeda lagi.

Tinjauan dari pola akses, ada 2 kemungkinan, yaitu static dan dynamic. Akan lebih mudah
dalam perencanaan dana manajemennya kalau pola aksesnya adala static. Tapi kenyataannya, susah
untuk menemukan pola akses yang static ini dalam aplikasi terdistribusi. Semua dinamic, tapi
pertanyaannya sedinamic apa?, ini berkaitan dengan hubungan antara query processing dengan
disain database terdistribusi.

Gambar 2: Topik Utama dalam Sistem Basis Data Tersebar

Tinjauan dari sisi level pengetahuan tentang pola akses. Yang jelas, pertama adalah perancang sama
sekali tidak mempunyai pengetahuan tentang bagaimana pola user mengakses database. Ini
kemungkinan yang teoritis sekali, tapi sangat susah untuk mendisain sistem tanpa tahu pola akses
user terhadap suatu database. Selain itu, ada 2 kemungkinan dimana perancang menggunakan
pengetahuan tentang pola akses user, yaitu:
Complete Information: Pola akses user dapat diprediksi dengan benar.
Partial Information: Sebagian pola akses user saja yang dapat diprediksi.

STRATEGI PERANCANGAN SISTEM DATABASE TERSEBAR


Ada 2 pendekatan dalam perancangan Sistem Basisdata Tersebar:
Proses perancangan secara Top-Down .

Proses perancangan secara Bottom-Up:


Berawal dari adanya beberapa database, tugas perancang adalah mengintegrasikan
beberapa database itu dalam satu database. Bottom-Up approach sangat cocok untuk
kondisi seperti ini. Jadi, titik awal dari perancangan secara Bottom-Up adalah Individual
Local Conceptual Schema. Proses perancangannya berupa proses integrasi local schema
menjadi global conceptual schema.

PERANCANGAN SISTEM BASIS DATA TERSEBAR


Ada beberapa hal yang menjadi topik utama, khususnya berkaitan dengan proses fragmentasi dan
alokasi:
Kenapa perlu fragmentasi?
Teknik fragmentasi.
Teknik Alokasi.
Ada beberapa alasan kenapa harus mendekomposisi relation/table menjadi unit kecil yang disebut
fragmen:
Tempat akses suatu aplikasi bukan pada seluruh relation/table tapi, hanya pada sebagian
atau subset dari suatu relation/table.
Akan memerlukan akses remote data bervolume tinggi.
Memungkinkan eksekusi suatu transaksi/query secara kongkuren.

Tapi ingat ada kelemahan juga pada fragmentasi, yaitu:


Cost untuk union atau join saat kita menginginkan data dari dua fragment.
Cost untuk integrity checking fragmen yang tersebar dalam beberapa site.
Teknik Fragmentasi ada dua, yaitu:
Horizontally Fragmentation:

Vertically Fragmentation:

Derajat Fragmentasi:
Performansi eksekusi suatu query sangat tergantung dari database yang mana dan seberapa
besar dari database tersebut didekomposisi dan dialokasikan ke beberapa site. Derajat
fragmentasi bisa noll (tidak terfragmentasi sama sekali), fragmentasi horisontal dan fragmentasi
vertikal.

Aturan dalam Fragmentasi (sama dengan prinsip normalisasi):


Komplit:
Dekomposisi relation/table R menjadi beberapa fragmen R 1 , R 2 , ..., R n
dikatakan komplit kalau setiap item data pada R dapat juga ditemukan di
beberapa R i.
Rekonstruksi:
Kalau ada suatu relation/table R
didekomposisi menjadi
beberapa
fragment R 1 , R 2 , ..., R n , maka harus ada operator yang dapat
mengembalikan fragmen-fragmen tersebut ke R. (R= Ri , Ri FR )
Disjointness:
Kalau ada suatu relation/table R
didekomposisi menjadi
beberapa
fragment R 1 , R 2 , ..., R n , dan item data d i ada di R j , maka d i harus tidak
boleh ada di fragment R k ( k j )
Teknik Alokasi fragmen ke beberapa site (Reliability & Efisiensi Query):
Non-replicated (Partitioned Database): Setiap fragmen hanya diletakkan di satu site.
Replicated:
Fully Replicated: setiap fragmen ada di setiap site.
Partially Replicated: setiap fragmen ada di beberapa site.
Replikasi memberikan keuntungan-keuntungan, tapi ada beberapa permasalahan yang
muncul akibat adanya replikasi tersebut kalau frekuensi query untuk update lebih besar
dari frekuensi query read-only.
PERBANDINGAN TEKNIK ALOKASI/REPLIKASI

KELEBIHAN DAN KELEMAHAN BASIS DATA TERSEBAR


KELEBIHAN:

Otonomi Lokal: Karena data terdistribusi, kelompok user yang bisa menggunakan data
tersebut dapat menyimpannya di site dimana dia bekerja, sehingga masing-masing site
mempunyai kontrol lokal.
Performansi Tinggi: Karena data yang digunakan umumnya lebih dekat dengan user,
maka performansi akses ke database dapat ditingkatkan.
Kepercayaan: Karena ada replikasi data di lebih dari satu tempat, maka kemungkinan
crashnya satu node/site, atau hilangnya aksessibilitas karena kegagalan link komunikasi,
tidak membuat data untuk tidak dapat diakses.
Ekonomis:
Dari sisi communication cost: Lebih ekonomis dengan membagi aplikasi dan
menjalankannya di beberapa situs lokal, dari pada satu aplikasi dipaksa untuk
akses ke database yang tersebar.
Dari sisi biaya normal: Lebih ekonomis membeli komputer kecil-kecil yang
kemampuannya sama dengan satu komputer besar.
Ekspansinya Mudah: Dapat disesuaikan dengan mudah seiring dengan berkembangnya
ukuran database. Paling sekitar penambahan pengolahan dan kemampuan penyimpanan
di jaringan. Jelas, bahwa kemampuannya tidak akan bertambah secara linier, tapi paling
tidak improvisasi dapat dimungkinkan.
Shareability: Untuk merespon trend organisasi ke arah distributed fashion
KELEMAHAN:
Kurangnya Pengalaman: Minimnya percobaan di lingkup kerja nyata.
Kompleksitas: Menambah masalah baru dari masalah yang ada pada DBS.
Biaya: Menambah biaya hardware (hardware u/ mekanisme komunikasi). Memang H/W
sekarang murah shg biaya tdk terlalu signifikan, tapi biaya pengembangan
teknologi/software dalam masalah teknis (distributed debuggers dll) sangat diperlukan.
Selain itu adalah biaya untuk replikasi usaha/tenaga (manpower), yang dibutuhkan di
beberapa site Analisa trade-off antara keuntungan dari efisiensi/efektivitas
penggunaan informasi dengan biaya penambahan personel.
Kontrol yang Terdistribusi: Ini kelebihan yang sudah disebut, tapi sayangnya ini dapat
menimbulkan masalah sinkronisasi dan koordinasi
Keamanan: Sekuriti jaringan lebih kompleks dari sekuriti akses database yang
tersentralisasi.
Migrasi yang susah: Belum ada tool atau metodologi yang dapat membantu untuk
konversi dari DBS ke DDBS.
FAKTOR PENGHAMBAT
Kompleksitas tambahan dengan adanya lingkup kerja yang terdistribusi
Replikasi data (semua atau sebagian) di jaringan, tapi tidak perlu di semua site. Yang
esensial hanya database harus ada di tempat lebih dari satu. Duplikasi ini karena
pertimbangan reliability dan efisiensi..

DDBS harus:

DDBS harus:
Memilih satu diantara site yang menyimpan data yang
dibutuhkan.
Mengupdate setiap site yang menyimpan data yang sudah
diupdate

Apabila ada suatu kegagalan (site crash atau link komunikasi putus) selama masa
update, sistem harus segera dapat mengupdate site yang tidak tergapai tadi sesegera
mungkin (saat sistem tsb kembali normal)
Sinkronisasi transaksi lebih dipertimbangkan lagi dibandingkan sistem yang
tersentraliasi (DBS).

Anda mungkin juga menyukai