Anda di halaman 1dari 11

Ringkasan Buku Database

Management System (Third Edition)

PENGELOLAAN
DATA SPASIAL

Nama : Fatihah Salsabila


Nim : 19136063
Prodi : Geografi NK
1. Jenis Spasial dan Query

 Objek data spasial menempati  Query yang muncul pada data spasial
wilayah ruang tertentu, yang disebut terdiri dari tiga jenis : spasial range
jangkauan spasialnya, yang dicirikan queries, queri tetangga terdekat dan
oleh letak dan batasnya. Dari sudut spasial ikuti queries.
pandang DBMS, kita dapat
mengklasifikasikan data spasial
menjadi baik point data (data titik)
atau region data (data wilayah).

04/01/2023 Annual Review 2


2. Aplikasi Yang Melibatkan Data Spasial

 Banyak aplikasi melibatkan data  Basis data multimedia, yang berisi

spasial. Computer - aided design and objek multimedia seperti gambar,

manufacturing (CAD/CAM) teks, dan berbagai jenis data

SystCIllS and medical imaging rangkaian tirne (misalnya audio),

systcrIls menyimpan objek spasial, juga memerlukan data spasial 1na11-

seperti permukaan objek desain agent. Vektor fitur yang mewakili

(contohnya : badan pesawat terbang) objek multimedia biasanya berupa


titik dalam ruang berdimensi tinggi.

04/01/2023 Annual Review 3


3. Pengantar Indeks Spasial
• Indeks multidimensi atau spasial, berbeda dengan B+ pohon, manfaat beberapa sejenis spasial hubungan untuk mengatur data, entri, dengan
setiap nilai kunci terlihat sebagai titik (atau wilayah, untuk wilayah dalam ruang k-dimensi, dimana k adalah jumlah bidang dalam kunci
pencarian untuk indeks. Dalam indeks pohon B+, ruang dua-dimensi dari nilai (usia, sal) dilinearisasi--·--yaitu, titik-titik dalam doruain dua
dimensi diurutkan secara total····..···dengan mengurutkan usia pertama dan kemudian pada sal. Mari kita koreksi indeks pohon B+ pada
kunci (usia, sal) dengan indeks spasial pada ruang usia dan nilai sal, menggunakan beberapa contoh kueri:

1. Umur < 12: Indeks pohon B·+ berkinerja sangat baik. 1\8 kita akan melihat, indeks spasial menangani kueri seperti itu dengan cukup baik,
meskipun tidak dapat menghasilkan indeks pohon B+- dalam casc ini.

2. Sal < 20: Indeks pohon B-+- tidak berguna, karena tidak cocok dengan pilihan ini. Sebaliknya, indeks spasial menangani kueri ini sama
baiknya dengan usia minyak pilihan sebelumnya.

3. Umur < 12 1\ sal < 20: Indeks pohon B+ secara efektif hanya menggunakan seleksi berdasarkan umur. Jika tupel 1110 memenuhi
pemilihan usia, kinerjanya buruk. Indeks spasial sepenuhnya menggunakan pilihan dan hanya mengembalikan tupel yang memenuhi
kondisi umur dan sal. Untuk mencapai ini dengan indeks pohon B+, kita harus membuat dua indeks terpisah pada usia dan sal, mengambil
tupel yang memenuhi pemilihan usia dengan menggunakan indeks pada usia dan mengambil tupel yang memenuhi kondisi sal dengan
menggunakan indeks pada sal, potong garis-garis ini, lalu ambil tupel dengan garis-garis ini.

04/01/2023 Annual Review 4


3.1 Tinjauan Struktur Indeks yang Diusulkan

Banyak struktur indeks spasial telah diusulkan. Beberapa dirancang terutama


untuk mengindeks kumpulan poin meskipun dapat diadaptasi untuk menangani
wilayah. Contoh struktur indeks untuk data titik termasuk file Grid, pohon hE,
KDtrees, Pohon Point Quad, dan Pohon SR. Contoh struktur indeks yang
menangani daerah serta data titik termasuk Pohon Quad Wilayah, Pohon R, dan
Pohon SKD.

04/01/2023 Annual Review 5


4. Pengindeksan Berdasarkan Kurva Pengisian Ruang

Kurva pengisian ruang didasarkan pada asumsi bahwa nilai atribut apa pun dapat
direpresentasikan dengan SaIne fixed nUlnher of bits, katakanlah k bit. Oleh
karena itu, nilai-nilai luaximulu di sepanjang setiap dimensi adalah 2k.
Keuntungan dari pendekatan ini dibandingkan dengan menggunakan indeks
pohon B+ pada penggabungan S0111e dari X dan bidang Y adalah bahwa titik-
titik tersebut dikelompokkan bersama berdasarkan kedekatan spasial di ruang
angkasa. Terdapat pengindeksan yang dapat dipergunakan seperti : Region Quad
Tree dan Z.. Ordering pada data wilayah & query spasial menggunakan Z-
Ordering.
04/01/2023 Annual Review 6
5. File Grid
Berlawanan dengan tergantung dari dataset File grid bergantung pada direktori grid untuk
siapa pun, Grid yang mencerminkan distribusi mengidentifikasi data, halaman yang berisi titik
data dalam kumpulan data tertentu. untuk yang diinginkan. Untuk memahami struktur file
menjamin bahwa apapun dihubungkan dengan Grid, kita perlu memahami cara menemukan
query point) Pendekatan Z-ordering, yang entri direktori grid untuk titik tertentu. Kami
mempartisi ruang data di dalamnya mempartisi menjelaskan struktur file Grid untuk data dua
ruang data dengan cara tertentu. rhe Inethocl dimensi.
dirancang (permintaan yang mengambil
illfonnation juga di, paling awal, dua disk
mengakses.

04/01/2023 Annual Review 7


5.1 Mengadaptasi File Grid untuk Menangani Daerah

Ada dua pendekatan dasar untuk menangani data wilayah dalam file Grid, tidak ada yang
memuaskan. Pertama, kita dapat merepresentasikan suatu wilayah dengan titik di ruang
berdimensi lebih tinggi.

Pendekatan kedua adalah menyimpan record yang mewakili objek wilayah di setiap
partisi grid yang tumpang tindih dengan objek wilayah. Ini tidak memuaskan karena
menyebabkan banyak catatan tambahan dan biaya penyisipan dan penghapusan 111a
mahal.

04/01/2023 Annual Review 8


6. R POHON:DATA TITIK DAN WILAYAH
Pohon R adalah adaptasi dari pohon B+ untuk menangani data spasial, dan merupakan struktur data yang seimbang,
seperti pohon B+. Kunci pencarian pohon adalah kumpulan interval, dengan satu interval per dimensi. Kita dapat
menganggap nilai kunci pencarian sebagai sebuah kotak dibatasi oleh interval; setiap sisi kotak sejajar dengan
sumbu. Kami mengacu pada nilai kunci pencarian dalam kotak pembatas pohon R. Entri data terdiri dari pasangan
(kotak n-dimensi, rid), di mana rid mengidentifikasi objek dan kotak adalah kotak terkecil yang berisi objek
tersebut. Sebagai kasus khusus, kotak adalah titik jika objek data adalah titik, bukan wilayah. Entri data disimpan
dalam node daun. Node non-daun berisi entri indeks dari forIll (kotak n-dimensi, penunjuk ke node anak). Kotak
pada simpul non-daun N adalah kotak terkecil yang berisi semua kotak yang terkait dengan simpul anak; secara
intuitif, itu membatasi wilayah yang berisi semua objek data yang disimpan dalam subpohon yang berakar pada
simpul N.

04/01/2023 Annual Review 9


7. MASALAH DALAM PENGINDEKSAN DIMENSI TINGGI
Pengindeksan data dimensi tinggi seperti itu menghadirkan tantangan unik, dan diperlukan teknik baru.
Misalnya, pemindaian berurutan menjadi lebih unggul dari R, pohon bahkan ketika mencari satu titik untuk
kumpulan data dengan lebih dari selusin dimensi.

Kumpulan data jarak jauh biasanya merupakan kumpulan titik, bukan wilayah, dan kueri tetangga terdekat
adalah jenis kueri yang paling umum. Mencari tetangga terdekat dari suatu titik kueri menjadi berguna
ketika jarak dari titik kueri ke tetangga terdekatnya lebih kecil daripada jarak ke titik lain. Paling tidak,
kami ingin tetangga terdekat jauh lebih dekat daripada titik data terjauh dari titik kueri. Data berdimensi
tinggi menimbulkan masalah potensial: Untuk berbagai distribusi data, sebagai dimensid meningkat, jarak
(dari setiap titik kueri tertentu) ke tetangga terdekat semakin dekat dan semakin dekat ke jarak ke titik data
terjauh! Mencari tetangga terdekat tidaklah sia-sia dalam situasi seperti itu.

Dalam banyak aplikasi, data berdimensi tinggi mungkin tidak mengalami masalah ini dan mungkin dapat
menerima pengindeksan. Namun, disarankan untuk memeriksa kumpulan data dimensi tinggi untuk
memastikan bahwa kueri tetangga terdekat bermakna.
04/01/2023 Annual Review 10
THANK YOU
<3

Anda mungkin juga menyukai