D-134
Seminar Nasional dan ExpoTeknik Elektro 2012 ISSN : 2088-9984
Gambar 1. Clustering enam situs melalui jaringan Biaya rata-rata lokal pengambilan lokal di cluster
Cj kali jumlah rata-rata frekuensi pengambilan
Tabel 1 menunjukkan pengelompokan situs dalam dihasilkan oleh transaksi Tk ke fragmen Fi di
cluster, untuk situs Si dan Sj yang berada di cluster cluster Cj.
yang sama diberikan angka 1 dan untuk situs Si dan Sj pengambilan jarak jauh dari cluster lain Cx, rasio
yang dikelompokkan di cluster yang berbeda diberikan pengambilan (unit pengambilan / unit komunikasi)
angka 0. Tabel 2 menunjukkan dua situs (Si,Sj) kali jumlah rata-rata frekuensi pengambilan yang
dikelompokkan dalam satu kelompok jika biaya dihasilkan dari transaksi Tk ke fragmen Fi di
komunikasi antar situs tersebut kurang dari atau sama cluster Cj untuk setiap cluster kali biaya rata-rata
dengan range biaya komunikasi (Communication Cost komunikasi antara cluster.
Range/CCR). Jumlah unit komunikasi yang
diperbolehkan untuk perbedaan maksimum biaya Nilai keputusan mengalokasikan fragmen Fi ke
komunikasi antara situs yang akan dikelompokkan cluster Cj merupakan sebuah nilai yang logis dan
dalam satu cluster ditentukan oleh jaringan DDBs. dihitung sebagai berikut :
Pada gambar 1 memperlihatkan distribusi dari 6 situs
melalui jaringan setelah situs dikempokkan D(Tk , Fi , C j ) (CN (Tk , Fi , C j ) CA(Tk , Fi , C j ).............(1)
berdasarkan biaya komunikasi [1].
Berdasarkan alokasi data dan biaya komunikasi Tabel 3. Fragmen dan frekuensi pengambilan dan pembaruan
dapat diketahui secara tepat apakah sebuah fragmen dalam cluster dari masing-masing situs
akan dialokasikan atau dihilangkan dari cluster. Fragmen Cluster Situs Frekuensi Frekuensi
Fragmen yang dialokasikan untuk semua cluster # # # pengambilan pembaruan
memiliki aplikasi yang menggunakan fragmen, dan F1 C1 S1 80 10
nilai keputusan (D) alokasi fragmen untuk cluster S2 60 26
dihitung sebagai nilai logis perbedaan antara biaya C2 S3 60 16
yang tidak mengalokasikan fragmen ke cluster dan F2 S4 0 0
biaya alokasi fragmen ke cluster. Jika biaya yang tidak C3 S5 35 5
S6 25 5
mengalokasikan fragmen ke cluster (fragmen ditangani
C2 S3 20 4
secara jarak jauh) lebih besar dari atau sama dengan S4 20 6
biaya alokasi fragmen ke cluster maka nilai keputusan C3 S5 5 30
adalah benar dan fragmen dialokasikan ke cluster, dan S6 10 20
jika biaya yang tidak mengalokasikan fragmen ke F3 C1 S1 0 20
cluster kurang dari biaya alokasi fragmen ke cluster S2 0 10
maka nilai keputusan adalah salah dan fragmen C2 S3 30 0
dibatalkan dari cluster. S4 0 0
C3 S5 40 30
Biaya alokasi fragmen Fi ke cluster Cj dihitung S6 30 10
sebagai berikut : F4 C1 S1 10 20
S2 10 20
Biaya rata-rata pengambilan lokal di cluster Cj kali C2 S3 65 12
jumlah rata-rata frekuensi pengambilan dihasilkan S4 5 12
dari transaksi Tk ke fragmen Fi di cluster Cj. F5 C1 S1 70 20
Biaya rata-rata pembaruan lokal di cluster Cj kali S2 6 10
jumlah rata-rata frekuensi pembaruan dihasilkan C2 S3 20 10
dari transaksi Tk ke fragmen Fi di cluster Cj. S4 20 10
Biaya ruang yang ditempati oleh fragmen Fi di C3 S5 35 10
cluster Cj kali ukuran fragmen Fi (dalam byte). S6 45 20
F6 C1 S1 0 10
Remote pembaruan dikirim dari cluster lain Cx, S2 0 0
biaya rata-rata lokal pembaruan di cluster Cj kali C3 S5 25 5
jumlah rata-rata frekuensi pembaruan dihasilkan S6 5 5
transaksi Tk ke fragmen Fi untuk setiap cluster lain F7 C2 S3 25 5
yang ada. S4 35 10
Remote komunikasi dari cluster lain Cx, rasio C3 S5 10 0
pembaruan (Unit Pembaruan /Unit Komunikasi) S6 30 0
kali jumlah rata-rata frekuensi pembaruan F8 C1 S1 10 20
dihasilkan transaksi Tk ke fragmen Fi di cluster Cj S2 80 20
C2 S3 20 0
kali biaya rata-rata komunikasi antara cluster lain S4 60 10
dari yang ada . C4 S5 0 20
S6 20 0
Biaya tidak mengalokasikan fragmen Fi ke Cluster
Cj dihitung sebagai berikut: Tabel 4. Biaya ruang, pengambilan, dan pembaruan
Cluster situs Biaya Biaya Biaya
D-135
Seminar Nasional dan ExpoTeknik Elektro 2012 ISSN : 2088-9984
D-136
Seminar Nasional dan ExpoTeknik Elektro 2012 ISSN : 2088-9984
Fase kedua :
Nilai-nilai dari matriks V yang akan diambil
dalam urutan menurun. A tupel t = (Fi , Fj, vi, j) yang
berhubungan dengan nilai Vi, j dari matriks V
merupakan keuntungan yang diperoleh untuk total
transfer ukuran / dimensi jika fragmen Fi dan Fj
disimpan di node yang sama. Untuk ini tupel t
Gambar 3. Node grafik mewakili simpul jaringan menentukan node menawarkan keuntungan terbaik
dalam kasus ini bahwa hal tersebut fragmen akan
Dalam node dari grafik pada gambar 3 (sebuah ditambahkan di sana. Untuk menemukan node ini,
node dari grafik mewakili simpul jaringan) disajikan algoritma akan menghitung k keuntungan ck diperoleh
operator (unary dan biner) yang dievaluasi dan pada jika fragmen yang melekat pada node Sk, dan akan
link yang ditunjukkan transfer data yang dibutuhkan terus melacak dari indikator. Nilai dari indicator
dalam proses evaluasi. Total biaya transfer akan adalah kepada bagian fragmen (Fi , Fj) relatif Lk, untuk
menjadi 2 (d1 + d2 + d3) + d4. 0 < = k < m.
Fase keempat :
Gambar 4. Rencana distribusi dua fragmen yang sesuai Ri mengatur node mana yang berisi fragmen Fi
disimpan dihitung untuk setiap fragmen Fi. (Ri adalah
himpunan dari replika Fi ) Pada akhir algoritma adalah
menentukan nilai untuk setiap node Lk for each Sk, 0 <
= k < n. Virtual node dapat dialokasikan node yang
menggunakan informasi yang diperoleh dari
sekumpulan permintaan Q. Node virtual dapat
D-137
Seminar Nasional dan ExpoTeknik Elektro 2012 ISSN : 2088-9984
P2(op) {( plan ( p1 ), plan ( p2 ), (result ( p2 ), op, result ( p1 )); dim( p1 ) dim( p2 ) 1)
dialokasikan ke node yang sesuai dengan node evaluasi
where p1 P(op1 ), p2 P(op2 ), result ( p1 ) result ( p2 )}.........................................(10)
yang diperlukan.
Algoritma untuk menghasilkan rencana P3(op) {( plan ( p1 ), plan ( p2 ), (result ( p1 ), op, result ( p1 ); dim( p1 ) dim( p2 ))
P(op)transfer fragmen ketika mengevaluasi query : where p1 P(op1 ), p2 P(op2 ), result ( p1 ) result ( p2 )}..................................(11)
a. Jika "op" adalah operator unary, setelah form op(x)
maka: Setelah rencana itu dihasilkan dalam kasus a2, b2,
Jika x adalah fragmen disimpan dalam basis b3, b4 ada kesempatan operator dua rencana yang
data terdistribusi lalu P (op) = f {(S, op, s); o) berbeda p1 ≠ p2 namun dengan node evaluasi akhir
|S ϵ R (X)}, dimana R(X) merupakan yang sama final (p1) = final (p2). Menggunakan
sekumpulan node dimana fragmen x disimpan. transformasi ini operator akan memiliki maksimum
Jika x adalah fragmen diperoleh dari evaluasi satu rencana untuk node terakhir.
sebelumnya operator op’ maka: Dalam hal ini dipilih rencana dengan dimensi yang
lebih kecil. Menggunakan transformasi ini operator
P(op) {( plan( p), (result ( p), op, result ( p)); dim( p)) | p P(op)}.....(4) akan memiliki maksimum satu rencana untuk node
terakhir.
b. Jika "op" sebuah operator binary memiliki bentuk
op(x,y) maka:
Jika x dan y adalah fragmen disimpan dalam 3. Hasil Analisis
basis data terdistribusi lalu:
Pada metode cluster yang dilakukan oleh Ismail O.
P(op) {((S1 , op, S 2 );1) where S1 R( X ) R(Y ), S 2 R(Y )}
Hababeh dkk, pengelompokan situs ke dalam cluster
{(S1 , op, S 2 );1) where S1 R(Y ) R( X ), S 2 R( X )}
meminimalkan biaya komunikasi antara situs dan
{((S1 , op, S1 );0) where S1 R( X ) R(Y )}.........................(5)
meningkatkan kinerja sistem. Biaya rata-rata
komunikasi antar cluster dan situs, dan rata-rata jumlah
pengambilan dan pembaruan dipertimbangkan dalam
Evaluasi dari operator “op” dapat dibuat
perhitungan alokasi fragmen, karena waktu yang
dalam node dimana fragmen x disimpan dan
diperlukan untuk proses perhitungan rata-rata kurang
fragment y dialihkan, atau dalam suatu node
dari waktu pemrosesan. Peningkatan kinerja sistem
dimana fragmen y disimpan dan fragmen S
dapat ditingkatkan dengan menghilangkan fragmen
dialihkan.
berlebihan pada cluster basis data dan meningkatkan
Jika x adalah fragmen yang disimpan didalam
ketersediaan dan kehandalan data. Tabel 6
basis data terdistribusi dan y adalah fragmen
menunjukkan kinerja yang mengalokasikan fragmen ke
yang berisi evaluasi sebelumnya dari operator
DDBs cluster sebelum dan setelah menggunakan
“op” maka :
metode yang diusulkan.
P(op) P1 (op) P2 (op) P3 (op) where :
P1 (op) {( plan ( p), (result ( p), op, S ); dim( p) 1)
Tabel 6. Kinerja evaluasi fragmen alokasi
where p P(op' ), S R( X ) {result ( p)}}..............(6) Cluster# Inisial alokasi Final alokasi Perbaikan
fragmen fragmen %
P2 (op) {( plan ( p), ( S , op, result ( p)); dim( p) 1 C1 6 3 50 %
where p P(op' ), S R( X ) {result ( p)}}.............(7) C2 7 3 57.14 %
C3 7 3 28.57 %
P2 (op) {( plan ( p), (result ( p), op, result ( p)); dim( p))
where p P(op' ), ifresult ( p)inR ( X )}........................(8) Sebelum menerapkan metode cluster,
mengalokasikan fragmen untuk semua kelompok
Evaluasi operator "op '" dapat dibuat dalam memiliki aplikasi yang meminta fragmen dan
sebuah node dimana fragmen x disimpan menghasilkan 20 alokasi, setelah menerapkan metode
dengan mengalihkan hasil dari node, dimana cluster diperoleh 11 alokasi, sehingga metode cluster
“op'” dapat dievaluasi. di node dimana op' memperbaiki kinerja sistem sebesar 45,00%.
dievaluasi dengan mentransfer fragmen x.
node dimana op' dapat dievaluasi dan dimana Gambar 6 menunjukkan peningkatan kinerja sistem
fragmen x disimpan. yang dicapai oleh pengalokasian dan pengelompokan
Jika x adalah fragmen yang diperoleh dari pada metode cluster.
evaluasi sebelumnya dari operator op' dan y
adalah fragmen yang disimpan dalam basis
data terdistribusi, rencananya adalah
membangun seperti pada b2.
Jika x dan y adalah hasil evaluasi operator op1
dan op2 maka:
P(op) P1(op) P2 (op) P3 (op) where :
P1 (op) {( plan ( p1 ), plan ( p2 ), (result ( p1 ), op, result ( p2 )); dim( p1 ) dim( p2 ) 1)
where p1 P(op1 ), p2 P(op2 ), result ( p1 ) result ( p 2)}....................................(9)
D-138
Seminar Nasional dan ExpoTeknik Elektro 2012 ISSN : 2088-9984
Gambar 6. Fragment alokasi ke cluster adalah biaya komunikasi antara situs, alokasi fragmen
yang optimal dan meminimalkan ukuran data yang
Evaluasi dalam algoritma NNA oleh Reza Basseda ditransfer antara node jaringan saat query dievaluasi
mempertimbangkan dua faktor yaitu: delay rata-rata pada sistem basis data terdistribusi. Untuk lingkungan
untuk menerima respon (waktu respon) untuk fragmen jaringan yang kecil, biaya komunikasi di Metode
dan rata-rata waktu yang dihabiskan untuk cluster dan metode heuristik lebih besar dari NNA,
memindahkan data dari satu node ke fragmen data. tetapi untuk lingkungan jaringan yang lebih besar
Algoritma ini akan menyelidiki efek dari parameter Metode cluster dan heuristik bertindak lebih baik dari
yang berbeda pada kedua faktor tersebut. Temuan dari NNA. Alasannya adalah bahwa untuk lingkungan
eksperimen menunjukkan bahwa algoritma NNA jaringan kecil biaya memindahkan data ke node tujuan
melakukan yang lebih baik untuk ukuran fragmen rendah dan biaya gerakan tidak melebihi biaya akses.
query dan tingkat produksi yang lebih besar. Ambang Dalam kasus lingkungan jaringan besar gerakan
batas untuk ukuran fragmen hampir 8.000 byte. Untuk fragmen membutuhkan lebih banyak waktu dan juga
jaringan yang lebih besar, dengan menggunakan meningkatkan lalu lintas jaringan. Tetapi untuk
algoritma NNA dapat mengurangi keterlambatan jaringan yang heterogen dan bahkan dengan parameter
tanggapan atas fragmen. input yang sangat besar maka metode cluster lebih baik
Algoritma heuristik yang dilakukan oleh Leon, dari NNA dan heuristik. Alasannya adalah untuk
dkk menggunakan rencana permintaan eksekusi dan perhitungan yang lebih kompleks dan untuk
beberapa informasi yang dapat dihasilkan saat evaluasi menangkap lebih banyak data jaringan yang heterogen
relasi operator dari rencana eksekusi. Algoritma dan parameter input yang sangat besar membutuhkan
heuristik meminimalkan ukuran pengalihan data antar evaluasi determinan operator relasional dari eksekusi
node jaringan saat query dievaluasi. query yang lebih kompleks. Aspek lain dari algoritma
Untuk mengevaluasi permintaan beberapa fragmen NNA adalah bahwa fragmen yang digunakan oleh
yang diperlukan, fragmen disimpan di node dari sebuah node atau simpul tetangga dapat
distribusi basis data. Beberapa perluasan hasil dikelompokkan menggunakan pendekatan cluster,
percobaan menunjukan bahwa dalam transfer data sehingga dapat menanggapi permintaan data yang lebih
bukanlah mempertimbangkan ukuran transfer data efektif. Dengan demikian dapat disimpulkan bahwa
melainkan biaya transfer. Pada algoritma redistribusi metode cluster lebih baik dari metode NNA dan
digunakan ukuran maksimum/dimensi untuk setiap heuristik dalam meminimalkan biaya transaksi
node yang unik, bukan maksimum ukuran untuk semua komunikasi dengan mendistribusikan fragmen basis
node. Dalam algoritma menemukan rencana transfer data ke DDBs situs, meningkatkan ketersediaan dan
antara node (algoritma digunakan untuk mengevaluasi integritas data dengan mengalokasikan beberapa
permintaan) biaya transfer, bukan jumlah pengalihan salinan basis data fragmen sama pada situs, dan
fragmen. meminimalkan total waktu respon transaksi.
4. Kesimpulan Referensi
Algoritma NNA merupakan variasi yang sederhana [1] Ismail O. Hababeh, UGRU, Nicholas Bowring,
dari algoritma optimal yang dapat digunakan dalam Muthu Ramachandran, 2005, A Method for
desain sederhana sistem basis data terdistribusi. Fragment Allocation Design in the Distributed
Metode heuristik menggunakan evaluasi determinan Database Systems, Faculty of Information and
operator relasional dari eksekusi query yang Engineering Systems - School of Computing
meminimalkan ukuran data yang ditransfer antara node Leeds Metropolitan University Leeds - LS6 3QS,
jaringan saat query dievaluasi tetapi membutuhkan U.K
perhitungan yang lebih kompleks untuk menangkap [2] Reza Basseda, 2006, Fragment Allocation in
lebih banyak data. Oleh karena itu, dapat digunakan Distributed Database Systems, ,Faculty of
dalam sistem jaringan yang tidak kompleks. Metode Electrical and Computer Eng., School of
cluster dirancang untuk memenuhi persyaratan dari Engineering, University of Tehran, Database
situs cluster dan menentukan alokasi fragmen sistem Research Group
basis data terdistribusi, meminimalkan komunikasi [3] Leon ¸Tâmbulea, Manuela Horvat-Petrescu, 2008,
biaya antara situs, dan meningkatkan kinerja dalam Redistributing Fragments into a Distributed
lingkungan sistem jaringan yang heterogen. Metode Database, International Journal of Computers,
cluster dikembangkan untuk pengelompokan situs ke Communications & Control, ISSN 1841-9836, E-
cluster, yang membantu dalam mengurangi biaya ISSN 1841-9844 Vol. III, No. 4, pp. 384-394
komunikasi antara situs selama proses alokasi fragmen
dan meningkatkan ketersediaan dan kehandalan alokasi
beberapa salinan fragmen yang sama pada situs.
Metode cluster ini dapat diimplementasikan dalam
lingkungan jaringan yang heterogen dan bahkan
dengan parameter input yang sangat besar. Dalam
melakukan analisa , yang menjadi bahan pertimbangan
D-139