Anda di halaman 1dari 5

BSTRAK

Lore (untuk Ringan Object Repository) adalah DBMS de-


menandatangani Cally Speci untuk mengelola informasi semiterstruktur.
Menerapkan Lore telah diperlukan memikirkan semua aspek dari
DBMS, termasuk manajemen penyimpanan, pengindeksan, permintaan pro-
cessing dan optimasi, dan user interface. makalah ini
memberikan gambaran tentang aspek-aspek dari sistem Lore, sebagai
serta fitur baru lainnya seperti dinamika struktur sum-
maries dan akses tanpa batas ke data dari sumber eksternal.

INTRODUCTION
Sistem database tradisional memaksa semua data untuk mematuhi suatu
ed Speci eksplisit, skema kaku. Bagi banyak database baru
aplikasi bisa ada dua kelemahan tidak bisa signi ini
pendekatan:
Data mungkin tidak teratur dan dengan demikian tidak sesuai dengan
skema kaku. Dalam sistem relasional, nilai null typ-
ically digunakan ketika data tidak teratur, yang terkenal
sakit kepala. Sedangkan jenis kompleks dan warisan
database berorientasi objek dengan jelas memungkinkan lebih
exibil-
ity, masih bisa di? kultus untuk merancang sesuai
skema berorientasi objek untuk mengakomodasi data yang tidak teratur.

? Mungkin di? Kultus untuk memutuskan di muka pada satu,
skema yang benar. Struktur data dapat berkembang
cepat, elemen data dapat mengubah jenis, atau data tidak
sesuai dengan struktur sebelumnya dapat ditambahkan.
Karakteristik ini mengakibatkan sering skema modi-
kation, lain sakit kepala terkenal di tradisional
sistem database.

Data mungkin tidak teratur dan dengan demikian tidak sesuai dengan
skema kaku . Dalam sistem relasional , nilai null typ -
ically digunakan ketika data tidak teratur , yang terkenal
sakit kepala . Sedangkan jenis kompleks dan warisan
database berorientasi objek dengan jelas memungkinkan lebih
exibil -
ity , masih bisa di ? kultus untuk merancang sesuai
skema berorientasi objek untuk mengakomodasi data yang tidak teratur .
? Mungkin di ? Kultus untuk memutuskan di muka pada satu ,
skema yang benar . Struktur data dapat berkembang
cepat , elemen data dapat mengubah jenis, atau data tidak
sesuai dengan struktur sebelumnya dapat ditambahkan .
Karakteristik ini mengakibatkan sering skema modi -
kation , lain sakit kepala terkenal di tradisional
sistem database .
Karena keterbatasan ini , banyak aplikasi yang melibatkan
Data semistructured [ Abi97 ] forgoing penggunaan data -
sistem manajemen basis , meskipun fakta bahwa banyak
kekuatan dari DBMS ( query ad-hoc , e ? akses efisien, con -
kontrol mata uang , pemulihan kecelakaan , keamanan, dll ) akan
sangat berguna untuk aplikasi tersebut .
Sebagai contoh rst populer, mempertimbangkan data yang tersimpan pada
World- Wide Web . Pada sebuah situs Web yang khas , data yang bervariasi
dan tidak teratur , dan struktur keseluruhan dari perubahan situs
sering . Hari ini , sangat sedikit situs Web menyimpan semua mereka berhasil -
dapat informasi dalam sistem database . Hal ini jelas , bagaimanapun ,
bahwa pengguna Web bisa mengambil keuntungan dari dukungan database ,
misalnya , dengan memiliki kemampuan untuk menimbulkan pertanyaan yang melibatkan data
hubungan ( yang biasanya dikenal dengan situs CRE -
ators tetapi tidak dibuat eksplisit ) . Sebagai contoh kedua , con -
informasi Sider terintegrasi dari beberapa , heterogen
sumber data [ Com91 , LMR90 , SL90 ] . Cukup e ? Ort adalah
biasanya dihabiskan untuk memastikan bahwa data yang terintegrasi dengan baik
terstruktur dan sesuai dengan tunggal , skema seragam . ad-
ditional e ? ort diperlukan jika satu atau lebih informasi sumber perubahan, atau ketika sumber-
sumber baru ditambahkan. jelas,
sistem database yang mudah mengakomodasi data yang tidak teratur
dan perubahan struktur akan sangat memudahkan cepat
integrasi database heterogen.
Makalah ini menjelaskan pelaksanaan Lore sys -
tem di Stanford University, dirancang Cally Speci untuk manag -
ing Data semi terstruktur . Data dikelola oleh Lore tidak
con ned untuk skema , dan mungkin tidak teratur atau tidak lengkap .
Secara umum, Lore mencoba untuk mengambil keuntungan dari struktur
di mana itu ada , tetapi juga menangani data yang tidak teratur seanggun
mungkin. Lore (untuk Ringan Object Repository1 ) sepenuhnya
fungsional dan tersedia untuk umum .
Model data Lore adalah sangat sederhana , self-describing , bersarang
model objek yang disebut OEM ( untuk Pertukaran Objek Model ) , di -
troduced awalnya dalam proyek Tsimmis di Stanford
[ PGMW95 ] . Salah satu tantangan rst kami adalah untuk merancang sebuah
bahasa query untuk Lore yang memungkinkan pengguna untuk dengan mudah mengambil
dan update data tanpa tetap, struktur yang dikenal . Lorel , untuk
Lore Language, merupakan perpanjangan dari OQL [ Cat94 , BDK92 ] yang
memperkenalkan jenis luas paksaan dan kuat jalur ex -
pressions untuk e ? ectively query data semi terstruktur . OEM
dan Lorel ditinjau brie
y dalam makalah ini ; untuk rincian
lihat [ AQM 96 ] .
Membangun sistem database yang mengakomodasi semi-
data terstruktur telah mewajibkan kita untuk memikirkan kembali hampir setiap as-
pect manajemen database . Sementara keseluruhan arsitektur -
mendatang dari sistem ini relatif tradisional , makalah ini tinggi -
lampu sejumlah komponen yang kita rasakan sangat
menarik dan unik .
Pertama , pemrosesan query memperkenalkan sejumlah tantangan .
Satu jelas di ? Culty adalah tidak adanya skema untuk membimbing
query processor . Selain itu, Lorel termasuk kuat
bentuk navigasi berdasarkan ekspresi jalan , yang mengharuskan
penggunaan automata dan grafik teknik traversal di dalam
mesin database . Pengindeksan data semistructured
dan penggunaannya dalam optimasi query adalah masalah yang menarik ,
khususnya dalam konteks jenis paksaan otomatis
disediakan oleh Lorel . Seperti yang akan terlihat , meskipun tantangan ini
kita mampu untuk mengeksekusi query menggunakan rencana query berbasis pri -
marily pada operator database yang familiar . untuk mengakomodasi
Data semi terstruktur pada tingkat fisik ( serta dukungan
untuk data multimedia seperti video , postscript , gif , dll ) kita
memaksakan tidak ada kendala pada ukuran atau struktur atom atau
obyek yang kompleks . Sementara itu, bagaimanapun , tata letak benda
pada disk disesuaikan untuk memudahkan browsing dan pengolahan
ekspresi jalan .
Mungkin aspek yang paling novel Lore adalah penggunaan
DataGuides di tempat skema standar , dan Lore eksternalitas
pengelola data nal . Sebuah DataGuide adalah ringkasan struktural \ "
dari database saat ini yang dipelihara secara dinamis dan
melayani beberapa fungsi yang biasanya dilayani oleh skema . untuk
Misalnya , DataGuides sangat penting bagi pengguna untuk menjelajahi
struktur database dan merumuskan pertanyaan . mereka juga
penting untuk sistem, misalnya , untuk menyimpan statistik dan panduan optimasi query .
Akhirnya , karena salah satu motivator -
vations untuk menggunakan DBMS yang dirancang untuk data semistructured
adalah untuk mudah mengintegrasikan data dari informasi yang heterogen
sumber ( termasuk World - Wide Web ) , Lore mencakup
Manajer data eksternal . Komponen ini memungkinkan Lore ke
membawa data dari sumber eksternal secara dinamis sesuai kebutuhan
selama eksekusi query, tanpa pengguna yang sadar akan
perbedaan antara data lokal dan eksternal .
Kami telah memilih untuk menerapkan Lore dari awal , bukan
daripada membangun perpanjangan ke DBMS yang ada untuk menangani
Data semi terstruktur . Membangun lengkap kami sendiri DBMS al-
terendah kita kontrol penuh atas semua komponen dari sistem , sehingga
bahwa kita dapat melakukan percobaan dengan mudah dengan aspek internal sistem
seperti optimasi query dan tata letak objek . Dalam Paral -
lel , namun, kami menerapkan Data semistructured kami
Model dan permintaan bahasa di atas berorientasi objek O2
sistem [ BDK92 ] , untuk membandingkan pelaksanaan
e ? ort dan kinerja terhadap Lore . Makalah ini berfokus pada
Lore, meskipun pelaksanaan O2 dibahas briefly .

Bagian 2 meninjau model data dan permintaan bahasa yang digunakan
oleh Lore. Bagian 3 memperkenalkan arsitektur keseluruhan dan
masing-masing komponen sistem Lore. Pertanyaan dan
pengolahan pembaruan, optimasi, dan pengindeksan yang dipertimbangkan oleh-
Ered dalam Pasal 4. Bagian 5 meliputi data eksternal Lore
Manajer dan DataGuides. Bagian 6 menjelaskan berbagai
interface untuk Lore untuk pengembang, pengguna, dan aplikasi pro-
gram. Akhirnya, Bagian 7 meliputi status sistem, menjelaskan
bagaimana mendapatkan sistem Lore, dan membahas saat ini dan
pekerjaan di masa depan.



HYBYNGAN KERJA
Sebuah versi awal dari bahasa Lorel diperkenalkan
di [ QRS 95 ] . Rincian sintaks dan semantik dari
Versi saat ini dari Lorel dapat ditemukan di [ AQM 96 ] . Sebuah com -
perbandingan dari Lorel terhadap bahasa yang lebih konvensional seperti
sebagai OQL [ Cat94 ] , xSQL [ KKS92 ] , dan SQL [ MS93 ] muncul
di [ QRS 95 ] . Meskipun sistem Lore telah demon -
didemonstrasikan [ QWG 96 ] , ini adalah kertas terlebih dulu untuk menggambarkan
implementasi
pemikiran aspek Lore .
Sistem saat ini paling dekat dengan Lore adalah UnQL [ BDS95 ,
BDHS96 ] , yang juga dirancang untuk mengelola semistruc -
tured data dan menggunakan model data yang mirip dengan OEM . sementara
bahasa query UnQL lebih ekspresif daripada Lorel , kita
percaya itu kurang user-friendly . Selanjutnya , UnQL kerja memiliki
berfokus terutama pada aspek bahasa query dan yang
optimasi dan , sejauh ini, kurang pada implementasi sistem . A
sistem jauh lebih awal , Model 204 [ O'N87 ] , didasarkan pada self-
menggambarkan struktur record . Seperti yang akan terlihat , model data
digunakan di Lore lebih kuat dalam hal itu termasuk sewenang-wenang
objek bersarang , dan bahasa query Lore adalah lebih kaya dari
bahasa Model 204 . Dengan demikian , pemrosesan query di Lore adalah
signi cantly di erent ? daripada di Model 204 , yang terkonsentrasi
pada pintar struktur pengindeksan bit - dipetakan . Selain itu, untuk
yang terbaik dari pengetahuan kami , Model 204 tidak termasuk con -
cepts analog dengan DataGuides kami atau data eksternal .
Ada sejumlah proposal lain yang di -
curhat atau memperpanjang bahasa query kira-kira sepanjang baris
Lorel , atau yang mengintegrasikan database tradisional dengan semistruc -
tured data teks . Sebagian besar dari pekerjaan ini beroperasi pada kuat -
Data diketik , atau dalam beberapa kasus dirancang Cally Speci untuk
World - Wide Web . Contohnya termasuk [ BK94 , BCK +94 ,
CACS94 , CCM96 , CM89 , KS95 , LSS96 , MMM96 , MW95 ,
MW93 , YA94 ] . Untuk lebih perbandingan mendalam ini
bahasa dan sistem terhadap Lore , lihat [ AQM 96 ] .

Anda mungkin juga menyukai