DatabaseTerdistribusi (Transaksi & Replikasi) DATA BASE TERDISTRIBUSI • Basis data terdistribusi adalah kumpulan database yang disimpan di banyak komputer pada lokasi yang berbeda-beda dan menampilkan ke user sebagai single database • Komputer-komputer tersebut terhubung dengan jaringan dan user dapat mengakses, mengupdate dan memodifikasi data pada database melalui jaringan DDBMS DDBMS (Distributed DBMS) merupakan suatu peranti lunak yang memungkinkan manajemen database terdistribusi dan membuat proses distribusi itu sendiri menjadi transparan bagi user. https://en.wikipedia.org/wiki/Distributed_database Beberapa alasan data harus didistribusikan • Data didistribusikan untuk meminimalisasikan biaya komunikasi ataupun waktu respon • Data dapat tersimpan dalam suatu tempat dimana data tersebut diciptakan sehingga pencipta data dapat melakukan kontrol keamanan data • Data dapat direplikasikan untuk meningkatkan ketersediaan pada suatu event kesalahan ataupun untuk mengurangi waktu respon Alasan tabel-tabel pada database harus didistribusikan pada beberapa komputer yang terhubung ke jaringan • Secara signifikan meningkatkan performansi, performansi meningkat disebabkan karena penempatan data yang frekuensi aksesnya paling tinggi dekat dengan sisi client
• Karena peningkatan suatu sistem, dalam artian
bahwa suatu bisnis akan semakin berkembang melebihi kapasitas aslinya sehingga diperlukan multisistem untuk mengolah database tersebut Bentuk-Bentuk topologi distribusi data
• Fully Connected Network
• Partialy Conneted Network • Tree Strutured Network • Ring Network • Star Network Fully Connected Network Partialy Conneted Network Tree Strutured Network Ring Network Star Network Teknologi sistem database terdistribusi adalah integrasi, bukan sentralisasi MERANCANG DATABASE TERDISTRIBUSI
• FRAGMENTASI DATA : Fragmentasi
memecah tabel menjadi beberapa bagian yang lebih kecil • REPLIKASI : sistem memelihara beberapa salinan (copy) dari relasi. Setiap salinan disimpan pada beberapa lokasi yang berbeda • ALOKASI DATA Jenis fragmentasi • Horisontal, dimana tabel dipecah menurun secara horizontal dan setiap fragmen mengandung beberapa jumlah baris yang lengkap.
• Vertikal, dimana tabel dipecah menurun secara
vertical dan setiap fragmen mengandung beberapa jumlah kolom yang lengkap.
• Nested (tersarang), dimana fragmentasi
horizontal (vertical) selanjutnya difragmentasi secara horizontal (vertical).
• Hibrid (campuran),dimana tabel pertama-tama
difragmen secara horizontal (vertical), kemudian difragmen lebih lanjut secara vertical(horizontal Contoh fragmentasi Hasil Fragmetasi • Hasil Fragmentasi Horisontal
• Hasil Fragmentasi Vertikal
Replikasi dan Alokasi Data • Berguna untuk meningkatkan ketersediaan data • Kasus paling ekstrim: replikasi keseluruhan basis data pada setiap site dalam sistem terdistribusi fully replicated distributed database • Keuntungan: sistem terus beroperasi selama paling tidak satu site tetap berjalan • Kelemahan: operasi update menjadi lambat • Kasus paling ekstrim lainnya: tidak ada replikasi Replikasi dan Alokasi Data (2)
• Kasus khusus replikasi partial untuk pekerja yang mobile –
seperti sales rep, financial planners dan claim adjustors- mereka membawa basis data replikasi dalam laptop atau PDA dan melakukan sinkronisasi secara periodik dengan server basis data
• Masing-masing fragmen–atau salinan dari sebuah fragmen-
harus diassign ke site tertentu dalam sistem terdistribusi. Proses ini disebut distribusi data (atau alokasi data) KONSEP DISTRIBUTED DATABASE Arsitektur Distributed Database • Sistem database terdistribusi pada Oracle mengijinkan aplikasi-aplikasi untuk mengakses data dari database yang lokal maupun jauh. • Dalam sebuah sistem database terdistribusi homogen setiap database merupakan Oracle Database, sedangkan pada sistem database terdistribusi heterogeneous paling sedikit satu diantara sekumpulan database bukan merupakan Oracle Database. • Distribusi basis data menggunakan arsitektur client/server untuk memproses permintaan informasi. Homogenous Distributed Database Homogenous Distributed Database (2)
• Menggambarkan sistem terdistribusi yang
mengkoneksikan 3 database hq, mfg, dan sales • User dapat mengakses atau memodifikasi data pada beberapa database pada suatu lingkungan terdistribusi • Misalnya manufacturing melakukan join antara tabel yang ada di local database mfg dengan tabel yang berada di database hq (remote access) Sistem Database Terdistribusi Heterogenous • Heterogeneous Service: komponen yang terintegrasi di dalam server Oracle Database dan menggunakan teknologi produk- produk Oracle Transparent Gateway.
• Transparent Gateway Agent : memfasilitasi komunikasi
antara sistem database Oracle dan yang non-Oracle dan menggunakan komponen Heterogeneous Services dalam server Oracle Database.
• Generic Connectivity : memungkinkan kita terhubung kepada
penyimpanan data pada non-Oracle Database dengan menggunakan Heterogeneous Services ODBC agent atau Heterogeneous Services OLE DB agent. Data Warehouse • Data warehouse adalah relasional database yang didesain untuk proses query dan analisa • Meliputi: extraction, transportation, transformation, loading solution, online analytical processing (OLAP),client analysis tool, dan aplikasi lain yang mengatur proses pengumpulan data dan mengirimkan ke business user Arsitektur data warehouse
End user secara langsung mengakses data dari beberapa sistem
melalui data warehouse Data Mining
• Suatu metode yang digunakan untuk
mengekstrak pola dari suatu data • Nama lain: Knowledge Discovery in Database (KDD) • Proses KDD: Identifikasi masalah Menyiapkan data Membangun model data (data mining) Menggunakan dan memonitoring model Data Mining Task’s • Association, menemukan hubungan dan korelasi antara berbagai data item • Classification, menganalisa data percobaan dan membangun model berdasarkan fitur dari data • Prediction, memprediksi nilai-nilai yang mungkin terjadi dari data yang hilang atau distribusi nilai dari atribut tertentu dalam kumpulan obyek • Clustering, mengidentifikasi cluster yang tersimpan dalam data, dimana cluster tersebut merupakan kumpulan data yang memiliki kesamaan dengan yang lain • Time-series analysis, mencari urutan kesamaan, pola (pattern), periode dan deviasi Keunggulan