Lore (untuk Ringan Object Repository) adalah DBMS de-
menandatangani Cally Speci untuk mengelola informasi semiterstruktur. Menerapkan Lore telah diperlukan memikirkan semua aspek dari DBMS, termasuk manajemen penyimpanan, pengindeksan, permintaan pro- cessing dan optimasi, dan user interface. makalah ini memberikan gambaran tentang aspek-aspek dari sistem Lore, sebagai serta fitur baru lainnya seperti dinamika struktur sum- maries dan akses tanpa batas ke data dari sumber eksternal.
INTRODUCTION Sistem database tradisional memaksa semua data untuk mematuhi suatu ed Speci eksplisit, skema kaku. Bagi banyak database baru aplikasi bisa ada dua kelemahan tidak bisa signi ini pendekatan: Data mungkin tidak teratur dan dengan demikian tidak sesuai dengan skema kaku. Dalam sistem relasional, nilai null typ- ically digunakan ketika data tidak teratur, yang terkenal sakit kepala. Sedangkan jenis kompleks dan warisan database berorientasi objek dengan jelas memungkinkan lebih exibil- ity, masih bisa di? kultus untuk merancang sesuai skema berorientasi objek untuk mengakomodasi data yang tidak teratur.
? Mungkin di? Kultus untuk memutuskan di muka pada satu, skema yang benar. Struktur data dapat berkembang cepat, elemen data dapat mengubah jenis, atau data tidak sesuai dengan struktur sebelumnya dapat ditambahkan. Karakteristik ini mengakibatkan sering skema modi- kation, lain sakit kepala terkenal di tradisional sistem database.
Data mungkin tidak teratur dan dengan demikian tidak sesuai dengan skema kaku . Dalam sistem relasional , nilai null typ - ically digunakan ketika data tidak teratur , yang terkenal sakit kepala . Sedangkan jenis kompleks dan warisan database berorientasi objek dengan jelas memungkinkan lebih exibil - ity , masih bisa di ? kultus untuk merancang sesuai skema berorientasi objek untuk mengakomodasi data yang tidak teratur . ? Mungkin di ? Kultus untuk memutuskan di muka pada satu , skema yang benar . Struktur data dapat berkembang cepat , elemen data dapat mengubah jenis, atau data tidak sesuai dengan struktur sebelumnya dapat ditambahkan . Karakteristik ini mengakibatkan sering skema modi - kation , lain sakit kepala terkenal di tradisional sistem database . Karena keterbatasan ini , banyak aplikasi yang melibatkan Data semistructured [ Abi97 ] forgoing penggunaan data - sistem manajemen basis , meskipun fakta bahwa banyak kekuatan dari DBMS ( query ad-hoc , e ? akses efisien, con - kontrol mata uang , pemulihan kecelakaan , keamanan, dll ) akan sangat berguna untuk aplikasi tersebut . Sebagai contoh rst populer, mempertimbangkan data yang tersimpan pada World- Wide Web . Pada sebuah situs Web yang khas , data yang bervariasi dan tidak teratur , dan struktur keseluruhan dari perubahan situs sering . Hari ini , sangat sedikit situs Web menyimpan semua mereka berhasil - dapat informasi dalam sistem database . Hal ini jelas , bagaimanapun , bahwa pengguna Web bisa mengambil keuntungan dari dukungan database , misalnya , dengan memiliki kemampuan untuk menimbulkan pertanyaan yang melibatkan data hubungan ( yang biasanya dikenal dengan situs CRE - ators tetapi tidak dibuat eksplisit ) . Sebagai contoh kedua , con - informasi Sider terintegrasi dari beberapa , heterogen sumber data [ Com91 , LMR90 , SL90 ] . Cukup e ? Ort adalah biasanya dihabiskan untuk memastikan bahwa data yang terintegrasi dengan baik terstruktur dan sesuai dengan tunggal , skema seragam . ad- ditional e ? ort diperlukan jika satu atau lebih informasi sumber perubahan, atau ketika sumber- sumber baru ditambahkan. jelas, sistem database yang mudah mengakomodasi data yang tidak teratur dan perubahan struktur akan sangat memudahkan cepat integrasi database heterogen. Makalah ini menjelaskan pelaksanaan Lore sys - tem di Stanford University, dirancang Cally Speci untuk manag - ing Data semi terstruktur . Data dikelola oleh Lore tidak con ned untuk skema , dan mungkin tidak teratur atau tidak lengkap . Secara umum, Lore mencoba untuk mengambil keuntungan dari struktur di mana itu ada , tetapi juga menangani data yang tidak teratur seanggun mungkin. Lore (untuk Ringan Object Repository1 ) sepenuhnya fungsional dan tersedia untuk umum . Model data Lore adalah sangat sederhana , self-describing , bersarang model objek yang disebut OEM ( untuk Pertukaran Objek Model ) , di - troduced awalnya dalam proyek Tsimmis di Stanford [ PGMW95 ] . Salah satu tantangan rst kami adalah untuk merancang sebuah bahasa query untuk Lore yang memungkinkan pengguna untuk dengan mudah mengambil dan update data tanpa tetap, struktur yang dikenal . Lorel , untuk Lore Language, merupakan perpanjangan dari OQL [ Cat94 , BDK92 ] yang memperkenalkan jenis luas paksaan dan kuat jalur ex - pressions untuk e ? ectively query data semi terstruktur . OEM dan Lorel ditinjau brie y dalam makalah ini ; untuk rincian lihat [ AQM 96 ] . Membangun sistem database yang mengakomodasi semi- data terstruktur telah mewajibkan kita untuk memikirkan kembali hampir setiap as- pect manajemen database . Sementara keseluruhan arsitektur - mendatang dari sistem ini relatif tradisional , makalah ini tinggi - lampu sejumlah komponen yang kita rasakan sangat menarik dan unik . Pertama , pemrosesan query memperkenalkan sejumlah tantangan . Satu jelas di ? Culty adalah tidak adanya skema untuk membimbing query processor . Selain itu, Lorel termasuk kuat bentuk navigasi berdasarkan ekspresi jalan , yang mengharuskan penggunaan automata dan grafik teknik traversal di dalam mesin database . Pengindeksan data semistructured dan penggunaannya dalam optimasi query adalah masalah yang menarik , khususnya dalam konteks jenis paksaan otomatis disediakan oleh Lorel . Seperti yang akan terlihat , meskipun tantangan ini kita mampu untuk mengeksekusi query menggunakan rencana query berbasis pri - marily pada operator database yang familiar . untuk mengakomodasi Data semi terstruktur pada tingkat fisik ( serta dukungan untuk data multimedia seperti video , postscript , gif , dll ) kita memaksakan tidak ada kendala pada ukuran atau struktur atom atau obyek yang kompleks . Sementara itu, bagaimanapun , tata letak benda pada disk disesuaikan untuk memudahkan browsing dan pengolahan ekspresi jalan . Mungkin aspek yang paling novel Lore adalah penggunaan DataGuides di tempat skema standar , dan Lore eksternalitas pengelola data nal . Sebuah DataGuide adalah ringkasan struktural \ " dari database saat ini yang dipelihara secara dinamis dan melayani beberapa fungsi yang biasanya dilayani oleh skema . untuk Misalnya , DataGuides sangat penting bagi pengguna untuk menjelajahi struktur database dan merumuskan pertanyaan . mereka juga penting untuk sistem, misalnya , untuk menyimpan statistik dan panduan optimasi query . Akhirnya , karena salah satu motivator - vations untuk menggunakan DBMS yang dirancang untuk data semistructured adalah untuk mudah mengintegrasikan data dari informasi yang heterogen sumber ( termasuk World - Wide Web ) , Lore mencakup Manajer data eksternal . Komponen ini memungkinkan Lore ke membawa data dari sumber eksternal secara dinamis sesuai kebutuhan selama eksekusi query, tanpa pengguna yang sadar akan perbedaan antara data lokal dan eksternal . Kami telah memilih untuk menerapkan Lore dari awal , bukan daripada membangun perpanjangan ke DBMS yang ada untuk menangani Data semi terstruktur . Membangun lengkap kami sendiri DBMS al- terendah kita kontrol penuh atas semua komponen dari sistem , sehingga bahwa kita dapat melakukan percobaan dengan mudah dengan aspek internal sistem seperti optimasi query dan tata letak objek . Dalam Paral - lel , namun, kami menerapkan Data semistructured kami Model dan permintaan bahasa di atas berorientasi objek O2 sistem [ BDK92 ] , untuk membandingkan pelaksanaan e ? ort dan kinerja terhadap Lore . Makalah ini berfokus pada Lore, meskipun pelaksanaan O2 dibahas briefly .
Bagian 2 meninjau model data dan permintaan bahasa yang digunakan oleh Lore. Bagian 3 memperkenalkan arsitektur keseluruhan dan masing-masing komponen sistem Lore. Pertanyaan dan pengolahan pembaruan, optimasi, dan pengindeksan yang dipertimbangkan oleh- Ered dalam Pasal 4. Bagian 5 meliputi data eksternal Lore Manajer dan DataGuides. Bagian 6 menjelaskan berbagai interface untuk Lore untuk pengembang, pengguna, dan aplikasi pro- gram. Akhirnya, Bagian 7 meliputi status sistem, menjelaskan bagaimana mendapatkan sistem Lore, dan membahas saat ini dan pekerjaan di masa depan.
HYBYNGAN KERJA Sebuah versi awal dari bahasa Lorel diperkenalkan di [ QRS 95 ] . Rincian sintaks dan semantik dari Versi saat ini dari Lorel dapat ditemukan di [ AQM 96 ] . Sebuah com - perbandingan dari Lorel terhadap bahasa yang lebih konvensional seperti sebagai OQL [ Cat94 ] , xSQL [ KKS92 ] , dan SQL [ MS93 ] muncul di [ QRS 95 ] . Meskipun sistem Lore telah demon - didemonstrasikan [ QWG 96 ] , ini adalah kertas terlebih dulu untuk menggambarkan implementasi pemikiran aspek Lore . Sistem saat ini paling dekat dengan Lore adalah UnQL [ BDS95 , BDHS96 ] , yang juga dirancang untuk mengelola semistruc - tured data dan menggunakan model data yang mirip dengan OEM . sementara bahasa query UnQL lebih ekspresif daripada Lorel , kita percaya itu kurang user-friendly . Selanjutnya , UnQL kerja memiliki berfokus terutama pada aspek bahasa query dan yang optimasi dan , sejauh ini, kurang pada implementasi sistem . A sistem jauh lebih awal , Model 204 [ O'N87 ] , didasarkan pada self- menggambarkan struktur record . Seperti yang akan terlihat , model data digunakan di Lore lebih kuat dalam hal itu termasuk sewenang-wenang objek bersarang , dan bahasa query Lore adalah lebih kaya dari bahasa Model 204 . Dengan demikian , pemrosesan query di Lore adalah signi cantly di erent ? daripada di Model 204 , yang terkonsentrasi pada pintar struktur pengindeksan bit - dipetakan . Selain itu, untuk yang terbaik dari pengetahuan kami , Model 204 tidak termasuk con - cepts analog dengan DataGuides kami atau data eksternal . Ada sejumlah proposal lain yang di - curhat atau memperpanjang bahasa query kira-kira sepanjang baris Lorel , atau yang mengintegrasikan database tradisional dengan semistruc - tured data teks . Sebagian besar dari pekerjaan ini beroperasi pada kuat - Data diketik , atau dalam beberapa kasus dirancang Cally Speci untuk World - Wide Web . Contohnya termasuk [ BK94 , BCK +94 , CACS94 , CCM96 , CM89 , KS95 , LSS96 , MMM96 , MW95 , MW93 , YA94 ] . Untuk lebih perbandingan mendalam ini bahasa dan sistem terhadap Lore , lihat [ AQM 96 ] .