Anda di halaman 1dari 5

Nama : Sendi Algifari Rismawan

Kelas : SI-W41/19
NPM : 19402038

1. Apa Keuntungan DBMS terdistribusi dibandingkan dengan DBMS tersentralisasi?

a. Merefleksikan pada bentuk dari struktur organisasinya


Ada suatu organisasi yang memiliki sub organisasi di lokasi yang tersebar di
beberapa tempat,.sehingga basis data yang digunakan pun tersebar sesuai lokasi
dari sub organisasi berada.
b. Penggunaan bersama dan lokal otonomi
Distribusi secara geografis dari sebuah organisasi dapat terlihat dari data
terdistribusinya, pengguna pada masing-masing site dapat mengakses data yang
disimpan pada site yang lain. Data dapat dialokasikan dekat dengan pengguna yang
biasa menggunakannya pada sebuah site, sehingga pengguna mempunyai kontrol
terhadap data dan mereka dapat secara konsekuen memperbaharui dan memiliki
kebijakkan untuk data tersebut. DBA global mempunyai tanggung jawab untuk
semua sistem. Umumnya sebagian dari tanggung jawab tersebut di serahkan kepada
tingkat lokal, sehingga DBA lokal dapat mengatur lokal DBMS secara otonomi.
c. Keberadaan data yang ditingkatkan
Pada DBMS yang tersentralisasi kegagalan pada suatu site akan mematikan seluruh
operasional DBMS. Namun pada DDBMS kegagalan pada salah satu site, atau
kegagalan pada hubungan komunikasi dapat membuat beberapa site tidak dapat di
akses, tetapi tidak membuat operasional DBMS tidak dapat dijalankan.
d. Keandalan yang ditingkatkan
Sebuah basis data dapat di replikasi ke dalam beberapa fragmen sehingga
keberadaanya dapat di simpan di beberapa lokasi juga. Jika terjadi kegagalan dalam
pengaksesan data pada suatu site di karenakan jaringan komunikasi terputus maka
site yang ingin mengakses data tersebut dapat mengakses pada site yang tidak
mengalami kerusakan.
e. Kinerja yang ditingkatkan
Sebuah data ditempatkan pada suatu site dimana data tersebut banyak di akses oleh
pengguna, dan hal ini mempunyai dampak yang baik untuk paralel DBMS yaitu
memiliki kecepatan dalam pengkasesan data yang lebih baik dibandingkan dengan
basis data tersentralisasi Selanjutnya, sejak masing-masing site hanya menangani
sebagian dari seluruh basis data , mengakibakan perbedaan pada pelayanan CPU
dan I/O seperti yang di karakteristikan pada DBMS tersentralisasi.
f. Ekonomi
Grosch’s Law menyatakan daya listrik dari sebuah
komputer di hitung menurut biaya yang dihabiskan dari penggunaan
peralatannya, tiga kali biaya peralatan, 9 kali nya dari daya listrik . Sehingga lebih
murah jika membuat sebuah sistem yang terdiri dari beberapa mini komputer yang
mempunyai daya yang sama jika dibandingkan dengan memiliki satu buah super
komputer. Oleh karena itu lebih efektif untuk menambah beberapa workstation
untuk sebuah jaringan dibandingkan dengan memperbaharui sistem mainframe.
Potensi yang juga menekan biaya yaitu menginstall aplikasi dan menyimpan basis
data yang diperlukan secara geografi sehingga mempermudah operasional pada
setiap situs.
g. Perkembangan modular
Di dalam lingkungan terdistribusi, lebih mudah untuk menangani ekspansi . Site yang
baru dapat di tambahkan ke suatu jaringan tanpa mempengaruhi operational dari
site – site yang ada. Penambahan ukuran basis data dapat di tangani dengan
menambahkan pemrosesan dan daya tampung penyimpanan pada suatu jaringan.
Pada DBMS yang tersentralisasi perkembangan akan di ikuti dengan mengubah
perangkat keras dan perangkat lunak.

2. Jelaskan dan berikan contoh Fragmentasi dan Replikasi, bagaimana data disimpan

- Fragmentasi terdiri dari relasi yang dibagi ke relasi atau fragmen yang lebih kecil dan
mengirim fragmen, pada beberapa tempat. Terdapat dua macam fragmentasi,
fragmentasi horizontal dan fragmentasi vertikal. Pada fragmentasi horisontal, setiap
fragmen terdiri dari sebuah subset baris dari relasi asal. Pada fragmentasi vertikal, setiap
fragment terdiri dari sebuah subset kolom dari relasi asal. Fragmentasi vertikal : koleksi
fragmen vertikal seharusnya dekomposisi lossless-join. Untuk menjamin fragmentasi
vertikal lossless-join, sistem harus menyediakan id tupel yang unik untuk setiap tupel
dalam relasi asli. Jika kita berpilir bahwa relasi asal sebagai field yang berisi tambahan
tupel-id sebagai kunci, field ini ditambahkan ke setiap fragmen vertikal. Sehingga
dekomposisi dijamin lossless-join.
- Replikasi berarti bahwa kita menyimpan beberapa copy sebuah relasi atau fragmen
relasi. Keseluruan relasi dapat direplikasi pada satu atau lebih tempat. Sebagai contoh,
jika relasi R difragmentasi ke R1, R2 dan R3, kemungkinan terdapat hanya satu copy R1,
dimana R2 adalah replikasi pada dua tempat lainnya dan R3 replikasi pada semua
tempat

3. Sebutkan Karakteristik Data Warehouse?


- Berorientasi pada Subjek
Data warehouse akan digunakan dalam banyak subyek seperti penjualan perusahaan,
produk dan pelanggan. Konsentrasinya tidak pada kegiatan operasi dan transaksi
perusahaan sehari-hari, tetapi fokus pada modeling data dan analisisnya untuk
mengambil keputusan penting. Data yang tidak relevan untuk bahan pembuatan
keputusan akan diabaikan. Data dari tiap subyek sudah tersaji secara ringkas dan
sederhana, sehingga akan memudahkan dalam proses pembuatan keputusan ataupun
penyusunan strategi perusahaan.

- Terintegrasi
Bagi perusahaan berskala besar yang memiliki banyak data, pasti akan kesulitan jika
semua datanya tidak terintegrasi. Dari sumber data yang berbeda seperti flat
files, relational database dan online transactional, semuanya dapat terintegrasi hanya
dalam satu sistem penyimpanan sehingga dapat lebih efisien dalam pekerjaan dan
hemat waktu. Data integration dan data cleaning akan membantu dalam konvesi
penamaan data, struktur coding, data attribute dan lain-lain.

- Non-Volatile (Koleksi Tetap)


Secara fisik, data warehouse adalah sistem yang memisahkan data dari aplikasi dalam
kegiatan operasi. Proses pemisahan data tidak memerlukan proses seperti
transaksi, recovery dan mekanisme concurrency control. Yang dibutuhkan ketika
mengakses data adalah initial loading dan access of data.

- Memiliki Dimensi Waktu


Data tiap subjek di warehouse memiliki dimensi waktu secara implisit maupun eksplisit.
Data yang tersimpan memiliki informasi secara historis misalnya 5 tahun atau 10 tahun
terakhir.

4. Jelaskan tahapan data mining berdasarkan gambar Arsitektur Data mining dibawahini
!
1. Data selection
Pemilihan (seleksi) data dari sekumpulan data operasional perlu dilakukan sebelum
tahap penggalian informasi dalam KDD dimulai. Data hasil seleksi yang digunakan untuk
proses data mining, disimpan dalam suatu berkas, terpisah dari basis data operasional.
2. Pre-processing / cleaning
Sebelum proses data mining dapat dilaksanakan, perlu dilakukan proses cleaning pada
data yang menjadi fokus KDD. Proses cleaning mencakup antara lain membuang
duplikasi data, memeriksa data yang inkonsisten, dan memperbaiki kesalahan pada
data.
3. Transformation
Coding adalah proses transformasi pada data yang telah dipilih, sehingga data tersebut
sesuai untuk proses data mining. Proses coding dalam KDD merupakan proses kreatif
dan sangat tergantung pada jenis atau pola informasi yang akan dicari dalam basis data.
4. Data mining
Data mining adalah proses mencari pola atau informasi menarik dalam data terpilih
dengan menggunakan teknik atau metode tertentu. Teknik, metode, atau algoritma
dalam data mining sangat bervariasi. Pemilihan metode atau algoritma yang tepat
sangat bergantung pada tujuan dan proses KDD secara keseluruhan.
5. Interpretation / evalution
Pola informasi yang dihasilkan dari proses data mining perlu ditampilkan dalam bentuk
yang mudah dimengerti oleh pihak yang berkepentingan. Tahap ini merupakan bagian
dari proses KDD yang disebut interpretation. Tahap ini mencakup pemeriksaan apakah
pola atau informasi yang ditemukan bertentangan dengan fakta atau hipotesis yang ada
sebelumnya.
5. Data Warehouse memiliki salah satu karakteristik Time Variant, jelaskan apa yang
dimaksud dengan time variant?

Seluruh data pada data warehouse dapat dikatakan akurat atau valid pada rentang
waktu tertentu. Data warehouse selalu menyerap apa pun yang telah di-load oleh data
warehouse dari awal terbentuknya data warehouse hingga yang paling terbaru. Semua
data akan dijadikan bahan analisis dan pengambil keputusan yang valid pada rentan
waktu tertentu, misalnya harian, mingguan, bulanan, tahunan, dan nilai waktu lainnya.

Elemen waktu pada data warehouse harus jelas untuk menjaga kevalidan data pada
rentang waktu tertentu karena record data pada data warehouse rentang waktunya
lebih besar daripada database operasional demi kepentingan analisis data secara
periodik.

Anda mungkin juga menyukai