Monolingual Terkendali
1 Pendahuluan
Kebutuhan untuk kontrol kosakata muncul dari dua fitur dasar bahasa alami, yaitu:
• Dua atau lebih kata-kata atau istilah dapat digunakan untuk mewakili konsep tunggal
• Dua atau lebih kata-kata yang memiliki ejaan yang sama dapat mewakili konsep yang berbeda
Contoh: Mercury (planet) Mercury (logam) Mercury (mobil) Mercury (makhluk mitos)
• Menggunakan hubungan kesetaraan untuk menghubungkan istilah sinonim dan hampir identik; dan
2 Ruang Lingkup
Standar ini menyajikan pedoman dan konvensi untuk isi, tampilan, konstruksi, pengujian,
pemeliharaan, dan pengelolaan kosakata terkontrol. Ini mencakup semua aspek membangun
kosakata terkontrol termasuk aturan yang luas dan pedoman untuk pemilihan jangka dan Format,
penggunaan istilah majemuk, dan membangun dan menampilkan berbagai jenis hubungan antar
istilah.
Standar ini berfokus pada kosakata terkontrol yang digunakan untuk representasi obyek konten.
Kosakata terkontrol tercakup dalam Standar ini mencakup daftar istilah dikendalikan, cincin
sinonim, taksonomi, dan tesaurus. Pedoman ini berlaku untuk semua empat jenis kecuali
dinyatakan sebaliknya.
Standar ini harus dianggap sebagai satu set rekomendasi berdasarkan teknik dan prosedur
disukai. Prosedur Opsional, namun kadang-kadang dijelaskan, misalnya, untuk menampilkan
istilah dalam kosa kata terkontrol.
Konvensi yang digunakan dalam Standar ini untuk menunjukkan kekuatan rekomendasi adalah: harus
(diperlukan untuk memenuhi standar), sebaiknya (dianjurkan), dan dapat (opsional). The Standard juga
menggunakan konvensi tidak boleh (tidak diperbolehkan agar sesuai dengan Standard) dan tidak (tidak
disarankan).
Standar ini terutama ditujukan untuk diterapkan pada kosakata terkontrol untuk digunakan dengan
sistem organisasi pengetahuan. "Sistem organisasi pengetahuan istilah ini dimaksudkan untuk
mencakup semua jenis skema untuk mengorganisir informasi dan mempromosikan manajemen
pengetahuan. Sistem organisasi pengetahuan mencakup skema klasifikasi yang mengatur bahan-bahan
pada tingkat umum (seperti buku di rak), judul subjek yang menyediakan akses yang lebih rinci, dan file
otoritas yang mengontrol versi varian informasi penting (seperti nama geografis dan nama pribadi).
Mereka juga termasuk skema kurang-tradisional, seperti jaringan semantik dan ontologi. Karena sistem
organisasi pengetahuan mekanisme untuk mengorganisir informasi, mereka berada di jantung dari
setiap perpustakaan, museum, dan arsip. "[29]
Standar ini tidak mencakup skema klasifikasi numerik (kecuali karena mereka berkorelasi dengan topik-
topik seperti Dewey, misalnya), ontologi atau jaringan semantik.
Pedoman untuk pengembangan kosakata terkontrol dimaksudkan untuk digunakan dalam sistem
pengambilan postcoordinated penting bagi Standard tapi panduan juga berlaku untuk pengembangan
kosakata terkontrol untuk sistem precoordinated pengambilan (misalnya sistem navigasi Web, skema
browsing, taksonomi, dan sejenisnya).
The Standard tidak memberikan pedoman bagi manusia atau deskripsi konten dibantu komputer
(indexing) berdasarkan kosakata terkontrol. Untuk prosedur pengindeksan dan praktek, lihat NISO TR02
1997 [22].
2.2 Kosakata Monolingual Terkendali
Rekomendasi yang terkandung dalam Standar ini berhubungan khusus untuk kosakata terkontrol
monolingual, dengan referensi khusus untuk bahasa Inggris. Bagian tentang Interoperabilitas
mempertimbangkan beberapa isu seputar multi-bahasa kosakata terkontrol, seperti persyaratan khusus
bahasa dan isu seputar tampilan urutan paralel menunjukkan ekuivalensi konseptual dalam lebih dari
satu bahasa lainnya. Untuk lebih lanjut tentang kosakata multibahasa, lihat ISO 5964 [30].
Standar ini memberikan panduan untuk pemilihan, perumusan, organisasi, dan menampilkan
istilah yang bersama-sama membentuk sebuah kosa kata terkontrol. Istilah-istilah ini membentuk
subset terkendali bahasa alami bagian untuk tujuan atau komunitas yang ditunjuk.
The Standard tidak menyarankan prosedur untuk mengatur dan menampilkan judul yang terdiri
dari rumus-rumus matematika dan kimia, atau untuk menetapkan nama yang tepat. (Untuk
informasi tentang ini, mengacu pada standar yang sesuai, seperti Anglo-Amerika Cataloguing
Rules, 2nd ed. [20]) pos tersebut dapat dimasukkan dalam kosakata terkontrol, bagaimanapun,
dan hubungan di antara mereka dapat diindikasikan melalui perangkat yang disajikan dalam
Standard.
Ini bukan standar untuk penciptaan file otoritas atau daftar otoritas seperti yang didefinisikan
oleh Perpustakaan Kongres AS atau orang lain.
2.4 Interoperabilitas
Dalam dekade sejak Standar ini pertama kali diterbitkan telah ada pertumbuhan luar biasa dalam
jumlah database, sistem pencarian informasi, dan situs web yang menggunakan kosakata
terkontrol pada tahap tertentu dalam proses. Pengguna sering perlu untuk mencari informasi di
lebih dari satu sistem atau database. Oleh karena itu, penting untuk memfasilitasi
interoperabilitas sedapat mungkin. Standar ini menjelaskan masalah, terutama yang timbul dari
terjadinya kosakata terkontrol dalam beberapa bahasa, dan menyarankan beberapa panduan
untuk membantu mengatasi masalah.
2.5 Pemeliharaan
Sebuah kosa kata terkontrol dapat sesederhana daftar pendek istilah atau serumit thesaurus
mengandung puluhan ribu istilah dengan struktur hirarki yang kompleks dan berbagai jenis
hubungan antar istilah. Selain itu, karena perubahan bahasa dari waktu ke waktu, yang
dikendalikan
kosakata tidak membeku dalam waktu konsep-konsep baru muncul, terminologi dan perubahan
penggunaan, dan beberapa istilah keluar dari mode atau menjadi usang. Jadi, ada kebutuhan
terus-menerus untuk mempertahankan kosa kata terkontrol setelah telah dibangun. Standar ini
merekomendasikan fitur dan prosedur yang membuat tugas lebih mudah.
2.6 Pengujian dan Evaluasi
Akhirnya, karena kosa kata terkontrol ada untuk melayani penggunanya, baik mereka yang
menggunakannya untuk menggambarkan isi dan mereka yang menggunakannya untuk mencari
informasi yang dibutuhkan, sangat penting untuk melakukan tes periodik dengan tindak evaluasi untuk
memastikan bahwa kosa kata terkontrol adalah sebagai berguna mungkin. Standar ini
merekomendasikan beberapa prosedur pengujian dan evaluasi.
3 Standar Referensi
Istilah-istilah berikut, seperti yang digunakan dalam Pernyataan ini, memiliki arti yang
ditunjukkan. Sebuah Istilah yang lebih luas dari istilah kosa kata terkontrol dapat ditemukan pada
Appendix.
Term Definition
Hubungan asosiatif Hubungan antara atau di antara istilah dalam kosa kata terkontrol
yang mengarah dari satu istilah untuk istilah lain yang terkait dengan atau
terkait dengan itu; dimulai dengan kata-kata LIHAT JUGA atau terkait jangka
(RT).
kewenangan mengajukan Satu set judul ditetapkan dan referensi silang yang akan dibuat
istilah istilah yang lebih luas yang istilah lain atau beberapa istilah yang bawahan dalam
adalah BT.
menjelajah Proses scanning secara visual melalui koleksi terorganisir
struktur pohon.
Sebuah metode skema klasifikasi organisasi sesuai dengan satu set yang ditetapkan sebelumnya
prinsip, biasanya ditandai dengan sistem notasi dan
struktur hirarkis hubungan antar entitas.
Sebuah istilah istilah majemuk yang terdiri dari lebih dari satu kata yang mewakili satu
Contoh:
lakban
New Jersey
kubah bawang
Konsep Sebuah unit pemikiran, dibentuk oleh mental menggabungkan beberapa atau semua
konten objek Suatu entitas yang berisi data / informasi. Sebuah benda konten bisa sendiri
terdiri dari obyek konten. Sebagai contoh, jurnal adalah isi suatu
objek terdiri dari artikel jurnal individu, yang masing-masing dapat menjadi
dikontrol kosakata Sebuah daftar istilah yang telah disebutkan secara eksplisit. Daftar ini
dikendalikan oleh dan tersedia dari kosa kata terkontrol
CATATAN: Ini adalah tujuan desain yang mungkin tidak benar dalam praktek; itu tergantung pada
bagaimana ketat otoritas pendaftaran kosa kata terkontrol adalah mengenai
1. Jika istilah yang sama umumnya digunakan untuk mengartikan konsep yang berbeda,
maka namanya secara eksplisit memenuhi syarat untuk menyelesaikan ambiguitas ini.
2. Jika beberapa istilah yang digunakan untuk berarti hal yang sama, salah satu
istilah diidentifikasi sebagai istilah yang lebih disukai di terkontrol
referensi silang 1. Sebuah arah dari satu istilah ke yang lain. Lihat asosiatif
mendokumentasikan Setiap item, dicetak atau sebaliknya, yang setuju untuk katalogisasi dan
pengindeksan. Istilah ini berlaku tidak hanya untuk bahan-bahan tertulis dan dicetak
entri Istilah Istilah non-pilihan dalam referensi silang yang mengarah ke istilah dalam
kosakata yang terkontrol. Juga dikenal sebagai "lead-in panjang." Dalam tesaurus,
indikator hubungan untuk jenis istilah U (USE); -nya
entri kosakata Himpunan istilah non-pilihan (USE referensi) yang mengarah pada
CATATAN: Istilah ini digunakan oleh beberapa desainer kosakata dikendalikan untuk
hubungan kesetaraan Hubungan antara atau di antara istilah dalam kosa kata terkontrol
yang mengarah ke satu atau beberapa istilah yang akan digunakan sebagai pengganti
istilah dari mana referensi silang dibuat; dimulai dengan kata
MELIHAT atau GUNAKAN.
Format datar Sebuah format tampilan abjad dari kosakata terkontrol di mana
hanya satu tingkat pengertian yang lebih luas dan satu tingkat dari istilah sempit adalah
setara, misalnya, furniture tempat tidur UF; UF sofa. Lihat juga up-
Struktur generik Format kosa kata terkontrol yang menunjukkan semua tingkat hirarki
hubungan hirarkis Hubungan antara atau di antara istilah dalam kosa kata terkontrol
yang menggambarkan lebih luas (generik) ke sempit (khusus) atau seluruh bagian
hubungan; dimulai dengan kata-kata istilah yang lebih luas (BT), atau lebih sempit
Istilah (NT).
hirarki yang lebih luas (generik) ke sempit (khusus) atau hubungan keseluruhan-bagian,
homograf Satu dari dua kata atau lebih yang memiliki ejaan yang sama, tetapi berbeda
mengindeks Sebuah metode dimana istilah atau judul subjek dari terkontrol
bahasa pengindeksan A dikendalikan kosakata atau sistem klasifikasi dan aturan untuk perusahaan
pengindeksan istilah Representasi dari sebuah konsep dalam bahasa pengindeksan, umumnya
dalam bentuk kata benda atau kata benda frase. Syarat, judul subjek, dan
kombinasi pos-subpos adalah contoh istilah pengindeksan.
penyimpanan informasi dan Satu set operasi dan peralatan yang terkait, perangkat lunak, dan
sistem.
kata kunci Sebuah kata yang terjadi dalam bahasa alami dari sebuah dokumen yang
pengubah Dalam istilah majemuk, satu atau lebih komponen yang berfungsi untuk mempersempit
Sebuah istilah istilah sempit yang adalah bawahan istilah lain atau ke beberapa istilah dalam
bahasa alami Sebuah bahasa yang digunakan oleh manusia untuk komunikasi verbal.
Kata-kata yang diambil dari teks bahasa alami untuk tujuan mengindeks
ruang informasi melalui beberapa link yang ditetapkan sebelumnya atau hubungan.
Misalnya, navigasi dalam kosa kata terkontrol bisa berarti
bergerak dari istilah yang lebih luas ke satu atau lebih istilah sempit menggunakan
dekat sinonim Sebuah istilah yang maknanya tidak persis identik dengan yang dari
istilah lain, namun yang mungkin tetap harus diperlakukan sebagai yang
setara dalam kosa kata terkontrol. Contoh: salinitas, rasa asin
simpul label A "bodoh" istilah, sering frase, yang tidak ditugaskan untuk dokumen
ketika mengindeks, tetapi yang dimasukkan ke bagian hirarkis
beberapa kosakata terkontrol untuk menunjukkan dasar logis yang
kelas telah dibagi. Label Node juga dapat digunakan untuk mengelompokkan
surat perintah organisasi Pembenaran untuk representasi dari konsep dalam pengindeksan
permuted menampilkan Sebuah jenis indeks di mana kata-kata individu istilah diputar ke
membawa setiap kata dari istilah dalam urutan abjad dalam daftar istilah.
memilih daftar Seorang pengguna perangkat antarmuka grafis yang memungkinkan pengguna untuk
memilih dari
pengguna mengklik pada panah bawah di sebelah kotak entri untuk istilah ini.
polyseme Sebuah kata dengan banyak arti. Dalam bahasa lisan, adalah polysemes
Hanya yang terakhir relevan dengan kosakata terkontrol yang dirancang untuk
informasi tekstual.
postcoordination The menggabungkan istilah pada tahap pencarian dan bukan pada
subjek daftar judul tahap konstruksi atau tahap pengindeksan. Lihat juga
precoordination.
presisi Sebuah ukuran kemampuan sistem pencarian untuk mengambil hanya relevan
Sebuah pencarian presisi tinggi memastikan bahwa, untuk sebagian besar, konten
benda diambil akan relevan. Namun, pencarian presisi tinggi
mungkin tidak mengambil semua benda konten yang relevan. Lihat juga ingat. Penarikan
dan presisi cenderung rasio terbalik. Ketika salah satu naik, yang
lain biasanya turun.
disukai jangka Satu dari dua atau lebih sinonim atau varian leksikal dipilih sebagai
Istilah untuk dimasukkan ke dalam kosa kata terkontrol. Lihat juga non-
petenis kualifikasi Sebuah istilah yang mendefinisikan, digunakan dalam kosa kata terkontrol untuk
membedakan
(Logam)
ingat Sebuah ukuran kemampuan sistem pencarian untuk mengambil semua yang relevan
timbal balik, yaitu setiap hubungan dari satu istilah ke yang lain harus
juga diwakili oleh hubungan timbal balik yang lain
Sebuah istilah istilah yang terkait yang associatively tapi tidak hierarkis terkait lain
istilah dalam kosa kata terkontrol. Dalam tesaurus, hubungan
Indikator untuk jenis istilah RT.
Indikator Suatu hubungan kata, frase, singkatan, atau simbol yang digunakan dalam thesaurus untuk
mengidentifikasi
lingkup perhatikan Sebuah catatan setelah jangka menjelaskan cakupan, penggunaan khusus,
saudara Sebuah istilah yang berbagi istilah yang lebih luas yang sama (satu tingkat lebih tinggi) sebagai
istilah lainnya.
subpos Sebuah istilah ditambahkan ke pos dalam rangka untuk mengubah atau membatasi
subjek menuju Sebuah kata atau frase, atau kombinasi dari kata-kata, frase, dan
precoordination.
simetris Memiliki simetri. Dalam konteks kosakata terkontrol
Sebuah kata sinonim atau memiliki persis atau sangat hampir arti yang sama istilah sebagai
pengambilan.
struktur hirarkis. Setiap istilah dalam taksonomi adalah dalam satu atau lebih
orang tua / anak (lebih luas / sempit) hubungan ke istilah lain dalam
taksonomi.
Istilah Satu atau lebih kata-kata menunjuk konsep. Lihat juga senyawa
kosa kata thesaurus A dikendalikan diatur dalam urutan yang dikenal dan terstruktur
(Plural: thesauruses, sehingga berbagai hubungan di antara istilah yang ditampilkan dengan jelas
tesaurus) dan diidentifikasi dengan indikator hubungan standar. Hubungan
Istilah top Istilah luas dalam hirarki kosa kata terkontrol, kadang-kadang
kosakata mengontrol Proses pengorganisasian daftar istilah (a) untuk menunjukkan yang mana
dari dua
atau istilah yang lebih identik berwenang untuk digunakan; (b) untuk membedakan
antara homographs; dan (c) untuk menunjukkan hirarki dan
singkatan Definisi
/ Akronim
HN Sejarah Note
NT sempit Term
RT Term Terkait
SN Lingkup Note
TT Top Term
U USE
UF DIGUNAKAN UNTUK
Tujuan dari kosakata terkontrol adalah untuk menyediakan sarana untuk mengorganisir informasi.
Melalui proses untuk menempatkan istilah yang dipilih dari kosakata terkontrol untuk menggambarkan
dokumen dan jenis lain objek konten, bahan diatur sesuai dengan berbagai elemen yang telah dipilih
untuk menggambarkan mereka.
. 1 Terjemahan: Menyediakan sarana untuk mengubah bahasa alami penulis, pengindeks, dan pengguna
menjadi kosa kata yang dapat digunakan untuk mengindeks dan pengambilan.
. 2 Konsistensi: Mempromosikan keseragaman dalam format jangka panjang dan dalam penugasan
istilah.
. 4 Label dan browsing: Memberikan hirarki konsisten dan jelas dalam sistem navigasi untuk membantu
pengguna menemukan konten yang diinginkan objek.
5 Retrieval:. Sajikan sebagai alat bantu pencarian dalam menemukan benda konten.
5.2 Konsep
5.2.1 Ketentuan
Untuk tujuan Standar ini, istilah didefinisikan sebagai satu atau beberapa kata yang digunakan
untuk mewakili konsep. Syarat dipilih dari bahasa alami untuk dimasukkan ke dalam kosa kata
terkontrol. Bagian 6 memberikan aturan rinci dan pedoman untuk pemilihan dan format istilah.
Dalam Pernyataan ini, kata "istilah" digunakan untuk merujuk secara umum baik "istilah
disukai" dan "istilah masuk" (juga disebut istilah non-disukai).
Sebuah benda konten adalah item yang harus dijelaskan untuk dimasukkan dalam sistem
informasi pengambilan, website, atau sumber informasi lain. Benda konten yang tipikal adalah
artikel jurnal, laporan teknis, dan jenis-jenis dokumen. Benda konten mungkin ada semata-mata
dalam bentuk elektronik dan mungkin juga entitas seperti lukisan, patung, dan realia seperti topi
Dr Seuss.
Ada dua kelas objek konten, primer dan sekunder, meskipun perbedaan ini jarang dibuat.
• Sebuah benda konten utama adalah item itu sendiri, apakah itu ada dalam bentuk fisik
(misalnya cetak, rekaman audio, DVD, film) atau ada hanya dalam bentuk elektronik.
• Sebuah objek isi sekunder adalah metadata yang menggambarkan objek konten utama. Banyak
menyimpan data menggabungkan objek konten primer dan metadata ke dalam, benda konten
hybrid tunggal.
5.2.3 Indexing
Indexing adalah proses untuk menempatkan hal yang disukai atau judul untuk menggambarkan konsep
dan metadata lain yang terkait dengan objek konten. Pengindeksan mencakup sistem atau prosedur
dimana seleksi dan organisasi istilah membutuhkan keputusan intelektual manusia di beberapa titik
dalam proses. Pemrosesan komputer juga dapat menjadi bagian dari proses untuk menyimpan dan
memanipulasi istilah dalam kosa kata terkontrol atau untuk mengidentifikasi objek konten yang istilah
tertentu atau kombinasi dari istilah telah ditetapkan atau harus diserahkan.
Proses pengindeksan, oleh karena itu, melibatkan memilih istilah yang lebih disukai dari satu atau kosa
kata yang lebih terkontrol atau sumber lain untuk menggambarkan objek konten.
Efektivitas pengindeksan sebagai sarana untuk mengidentifikasi dan mengambil benda konten
tergantung pada bahasa pengindeksan dibangun dengan baik. Penelitian di bidang ilmu informasi telah
menunjukkan bahwa kosakata terkontrol meningkatkan baik presisi dan recall dalam mencari. Sebagai
contoh, mereka meningkatkan presisi dengan mendefinisikan ruang lingkup istilah dan mereka
meningkatkan recall dengan mengambil dokumen yang mempekerjakan istilah yang berbeda untuk
konsep yang sama.
5.3 Prinsip
Ada empat prinsip penting kontrol kosakata yang memandu desain dan pengembangan mereka. Ini
adalah:
• menghilangkan ambiguitas
• sinonim mengendalikan
Tujuan utama dari kontrol kosakata adalah untuk memastikan bahwa setiap konsep yang berbeda
digambarkan oleh bentuk bahasa tunggal. Jika berbagai bentuk ada, ini harus dikendalikan atau
regularized sehingga informasi atau konten yang disediakan untuk pengguna tidak tersebar di seluruh
sistem di bawah beberapa jalur akses, tetapi berkumpul di satu tempat. Menghilangkan ambiguitas dan
kompensasi untuk sinonim melalui kontrol kosakata menjamin bahwa setiap istilah hanya memiliki satu
makna dan bahwa hanya satu istilah yang dapat digunakan untuk mewakili konsep atau entitas tertentu.
Perhatikan bahwa sebuah organisasi yang sangat besar mungkin menggunakan istilah yang sama dalam
konteks yang berbeda. Dalam kasus tersebut, perawatan harus dilakukan untuk memastikan bahwa
pengguna-baik pengindeks dan pencari-dapat membuat perbedaan yang diperlukan antara istilah.
5.3.1 Ambiguitas
Ambiguitas terjadi pada bahasa alami ketika sebuah kata atau frase (a homograf atau polyseme)
memiliki lebih dari satu arti. Gambar 2 memberikan contoh dan menunjukkan bagaimana satu kata
dapat digunakan untuk mewakili beberapa, konsep yang sangat berbeda.
Sebuah kosa kata terkontrol harus mengkompensasi masalah yang disebabkan oleh ambiguitas dengan
memastikan bahwa setiap istilah memiliki satu dan hanya satu pengertian.
5.3.2 Sinonim
Sinonim terjadi ketika konsep dapat diwakili oleh beberapa istilah yang memiliki arti yang sama atau
mirip. Konten yang diinginkan mungkin sulit untuk mengambil karena dapat dijelaskan oleh yang
berbeda namun setara terminologi. Gambar 3 menggambarkan hal ini
Did you mean: A controlled vocabulary must compensate for the problems caused by synonyms
by ensuring that each concept is represented by a single preferred term. The vocabulary should
list the other synonyms and variants as non-preferred terms with USE references to the preferred
term. Note: A synonym ring is an exception to the above rule. See section 5.4.2 for more
information on this type of vocabulary. There are other types of “equivalent” terms besides
synonyms which require vocabulary control. Section 8.2 includes a full discussion of
equivalence control. 5.3.3 Semantic Relationships Various types of semantic relationships may
be identified among the terms in a controlled vocabulary. These include equality relationships,
hierarchical relationships, and associative relationships, which may be defined as required for a
particular application. Section 8 includes a full discussion of the various types of relationships
that may be included in controlled vocabularies. 5.3.4 Facet Analysis Controlled vocabularies
especially large ones consisting of thousands of terms may be easier to use if they are organized
in some way other than hierarchically. Faceted analysis, based on the work of Ranganathan and
refinements by the Classification Research Group, is another way of organizing knowledge. It
takes a bottom-up approach, forming areas of knowledge after first having pieced together their
parts and determining the areas of knowledge they form, rather then the discipline-directed, top-
down approach of hierarchies. Facet analysis is particularly useful for: • new and emerging fields
where there is incomplete domain knowledge or where relationships between the content objects
are unknown or poorly defined; • interdisciplinary areas where there is more than one
perspective on how to look at a content object or where combinations of concepts are needed; •
vocabularies where multiple hierarchies are required but can be inadequate due to difficulty in
defining their clear boundaries; or • classifying electronic documents and content objects where
location and collocation of materials is not an important issue. Facet analysis is sometimes used
to indicate the attributes of content objects as shown in Figure 4.
Sebuah kosa kata terkontrol harus mengkompensasi masalah yang disebabkan oleh sinonim
dengan memastikan bahwa setiap konsep diwakili oleh istilah yang dipilih tunggal. Kosakata
harus daftar sinonim lain dan varian sebagai istilah non-pilihan dengan referensi USE untuk
istilah yang lebih disukai.
Catatan: Sebuah cincin sinonim merupakan pengecualian terhadap aturan di atas. Lihat bagian
5.4.2 untuk informasi lebih lanjut tentang jenis kosakata.
Ada jenis lain dari "setara" istilah selain sinonim yang memerlukan kontrol kosa kata. Bagian 8.2
termasuk diskusi penuh kontrol kesetaraan.
Berbagai jenis hubungan semantik dapat diidentifikasi antara istilah dalam kosa kata terkontrol.
Ini termasuk hubungan kesetaraan, hubungan hirarkis, dan hubungan asosiatif, yang dapat
didefinisikan sebagai diperlukan untuk aplikasi tertentu. Pasal 8 meliputi diskusi lengkap dari
berbagai jenis hubungan yang dapat dimasukkan dalam kosakata terkontrol.
Kosakata terkontrol terutama yang besar yang terdiri dari ribuan istilah mungkin lebih mudah
untuk digunakan jika mereka terorganisir dalam beberapa cara lain selain hierarkis. Analisis segi,
berdasarkan karya Ranganathan dan perbaikan oleh Klasifikasi Research Group, adalah cara lain
untuk mengatur pengetahuan. Dibutuhkan pendekatan bottom-up, membentuk bidang
pengetahuan setelah pertama setelah disatukan bagian mereka dan menentukan bidang
pengetahuan mereka membentuk, ketimbang disiplin-diarahkan, pendekatan top-down dari
hierarki. Analisis Facet ini sangat berguna untuk:
• baru dan bidang muncul di mana ada domain pengetahuan lengkap atau di mana hubungan
antara objek konten tidak diketahui atau buruk didefinisikan;
• daerah interdisipliner di mana ada lebih dari satu perspektif tentang bagaimana untuk melihat
objek konten atau di mana kombinasi dari konsep-konsep yang diperlukan;
• kosakata di mana beberapa hierarki diperlukan tetapi dapat tidak memadai karena kesulitan
dalam menentukan batas-batas yang jelas mereka; atau
• mengklasifikasikan dokumen elektronik dan benda-benda konten di mana lokasi dan kolokasi
bahan bukan merupakan masalah penting.
Analisis Facet kadang-kadang digunakan untuk menunjukkan atribut objek konten seperti yang
ditunjukkan pada Gambar 4.
Seperti ditunjukkan dalam Gambar 4, aspek ditugaskan untuk benda konten merupakan satu atau lebih
atribut yang dapat digunakan untuk mencari item dengan mencari atau browsing. Misalnya, Format
muncul dalam diagram sebagai aspek dari sebuah objek konten. Syarat milik segi ini mungkin berbagai
indikator Format; misalnya:
Aspek adalah jenis metadata struktural. Mereka dapat diterapkan (seperti yang ditunjukkan dalam
diagram di atas) baik konten objek sendiri atau metadata yang mewakili mereka.
Atribut yang mungkin terpilih sebagai aspek untuk benda konten adalah:
Sistem temu kembali informasi dapat menggunakan aspek untuk mewakili setidaknya sebagian dari
struktur database. Artinya, aspek dapat didefinisikan bahwa sesuai dengan beberapa atribut dari objek
konten. Dalam alat cetak atau online, seperti katalog, misalnya, aspek mungkin muncul sebagai istilah
generik yang digunakan untuk mengatur informasi yang lebih spesifik.
Apakah untuk menentukan aspek untuk objek konten adalah tanggung jawab perancang database atau
arsitek informasi. Standar ini tidak membahas pedoman untuk menentukan aspek atau atribut untuk
membuat sebagai aspek untuk objek konten.
Apakah akan menggunakan analisis aspek untuk kosa kata terkontrol itu sendiri tergantung untuk
sebagian besar pada ukuran kosa kata. Dalam beberapa kasus, kosakata terkontrol akan terdiri dari
hanya satu set kecil istilah seperti yang akan diperlukan untuk menggambarkan Konten jenis atau
Intelektual Tingkat. Jika jumlah istilah kecil (kurang dari seratus istilah, misalnya), daftar sederhana akan
cukup dan tidak perlu untuk mengatur mereka lebih lanjut.
Dalam kasus di mana kosa kata terkontrol berisi ratusan atau ribuan istilah, mungkin akan membantu
untuk mengatur mereka sesuai dengan aspek. Jenis analisis segi hasil dalam mengidentifikasi kategori
dasar kosa kata dan pengelompokan ketentuan di bawah mereka. Dalam taksonomi, misalnya, aspek
dapat digunakan untuk menentukan hirarki terpisah untuk skema navigasi Web.
The Art and Architecture Thesaurus ® (AAT) adalah contoh dari kosa kata terkontrol menggunakan
aspek. Berikut ini tujuh aspek yang digunakan untuk mengkategorikan seluruh kosakata:
• Agen Facet
• Kegiatan Facet
• Bahan Facet
• Objects Facet
Proses pemilihan istilah untuk dimasukkan dalam kosakata terkontrol melibatkan konsultasi berbagai
sumber kata-kata dan frase serta kriteria berdasarkan:
• bahasa alami yang digunakan untuk menggambarkan benda-benda konten (surat perintah sastra),
Menilai waran sastra melibatkan meninjau benda konten primer atau sekunder yang kosakata akan
digunakan untuk indeks serta sumber referensi konsultasi seperti kamus atau buku pelajaran dan
kosakata yang ada untuk domain konten. Kata atau frase yang dipilih harus sesuai sedekat mungkin
penggunaan yang berlaku dalam literatur domain.
Menentukan surat perintah organisasi membutuhkan mengidentifikasi bentuk atau bentuk istilah yang
disukai oleh organisasi atau organisasi yang akan menggunakan kosa kata terkontrol.
5.3.5.3 Pengguna Waran
Surat perintah Pengguna umumnya tercermin dari penggunaan istilah dalam permintaan informasi
konsep atau dari pencarian pada istilah oleh pengguna penyimpanan informasi dan sistem pencarian.
Efektivitas pengambilan informasi secara tradisional diukur dengan dua parameter: recall dan presisi.
(Lihat Definisi untuk penjelasan langkah-langkah ini.) Desain kosakata terkendali dapat memiliki dampak
positif pada kedua tindakan ini.
• istilah yang dipilih dan hubungan kesetaraan untuk kontrol sinonim (lihat bagian 5.3.2)
Presisi dapat ditingkatkan melalui metode seperti kosa kata terkontrol sebagai:
Hubungan hirarkis jangka • lebih luas dan sempit (lihat bagian 8.3)
5.4 Struktur
• Daftar
• cincin Sinonim
• Taksonomi
• Thesaurus
Angka ini menunjukkan struktur yang semakin kompleks kosakata terkontrol didikte oleh
persyaratan jenis hubungan masing-masing harus mengakomodasi. Hal ini juga menunjukkan
bahwa kosakata yang lebih kompleks (taksonomi, tesaurus) meliputi struktur sederhana (daftar,
cincin sinonim). Misalnya, Thesaurus termasuk perangkat eksplisit untuk mengendalikan
sinonim, mengatur hirarki, dan menciptakan hubungan asosiatif sementara Daftar adalah
seperangkat sederhana istilah yang tidak mengandung hubungan apapun.
Bagian 5.4.1 melalui 5.4.4 menjelaskan dan memberikan contoh-contoh dari masing-masing
jenis kosakata. Lihat Lampiran B untuk perbandingan dari empat jenis.
5.4.1 Daftar
Sebuah daftar (juga kadang-kadang disebut daftar pick) adalah seperangkat terbatas istilah diatur
sebagai daftar abjad sederhana atau dalam beberapa cara logis jelas lainnya. Daftar yang
digunakan untuk menggambarkan aspek benda konten atau badan yang memiliki sejumlah
kemungkinan. Contohnya termasuk geografi (misalnya, negara, negara bagian, kota), bahasa
(misalnya, Inggris, Perancis, Swedia), atau format (misalnya, teks, gambar, suara).
Alabama
Air raksa
Venus
Bumi
Mars
Jupiter
Saturnus
Uranus
Neptune
Pluto
Sementara cincin sinonim dianggap jenis kosa kata terkontrol, memainkan peran yang agak berbeda
dibandingkan dengan jenis lain yang dicakup oleh Standar ini. Cincin sinonim tidak dapat digunakan
selama proses pengindeksan. Sebaliknya, mereka digunakan hanya selama pengambilan. Penggunaan
cincin sinonim memastikan bahwa konsep yang dapat dijelaskan oleh beberapa istilah sinonim atau
setara akan diambil jika ada salah satu istilah yang digunakan dalam pencarian.
Sebuah cincin sinonim, oleh karena itu, adalah satu set istilah yang dianggap setara untuk tujuan
pengambilan. Cincin sinonim biasanya terjadi sebagai set daftar datar. Sebuah cincin sinonim
memungkinkan pengguna untuk mengakses semua benda konten atau entri database yang berisi salah
satu dari persyaratan. Cincin sinonim umumnya digunakan dalam antarmuka dalam suatu sistem
informasi elektronik, dan menyediakan akses ke konten yang direpresentasikan dalam alam, bahasa
yang tidak terkendali.
5.4.3 Taksonomi
Sebuah taksonomi adalah kosa kata terkontrol yang terdiri dari istilah yang disukai, yang semuanya
terhubung dalam hirarki atau polyhierarchy.
kimia
magnetohydrodyamics
5.4.4 Thesaurus
Sebuah tesaurus adalah kosa kata terkontrol diatur dalam urutan yang dikenal dan terstruktur sehingga
berbagai hubungan di antara istilah yang ditampilkan dengan jelas dan diidentifikasi oleh indikator
hubungan standar. Indikator Hubungan harus digunakan secara timbal balik.
Retensi dan konversi menjadi bentuk lain dari energi sinar, gelombang, atau partikel oleh suatu zat.
NT Biological PENYERAPAN
RESONANSI PENYERAPAN
Metadata, data tentang data, telah menjadi semakin penting untuk penemuan dan pengambilan
informasi elektronik, khususnya melalui Internet. Berbagai set elemen metadata (koleksi sifat yang telah
ditetapkan untuk menggambarkan sumber daya) telah diciptakan untuk mendukung masyarakat
tertentu atau domain informasi. Elemen set ini menetapkan aturan semantik untuk setiap elemen, yang
dapat mencakup penggunaan direkomendasikan atau diperlukan dari kosa kata terkontrol untuk nilai-
nilai ditugaskan untuk elemen. The Dublin Core Element Set [24], adalah himpunan elemen umum yang
paling terkenal dan.
Skema Metadata memperpanjang metadata elemen set dengan menambahkan aturan untuk bentuk
sintaks dan
struktur dan dalam banyak kasus pengkodean aturan. Penggunaan skema metadata dapat memfasilitasi
interoperabilitas antara sistem, termasuk interoperabilitas kosakata terkontrol.
Metadata dapat digunakan dengan kosa kata terkontrol dalam beberapa cara:
1. Menggunakan kosa kata terkontrol sebagai sumber untuk istilah diperbolehkan untuk elemen
metadata tertentu.
Sebagian ada elemen metadata set dukungan metadata-subjek yang berhubungan melalui "Kata Kunci"
atau "Subject" lapangan. Seringkali elemen set, atau pelaksanaan suatu komunitas tertentu dari
himpunan elemen, akan menunjukkan kosa kata terkontrol yang harus atau harus digunakan untuk
elemen metadata tertentu. Dalam hal ini, kosakata terkontrol sedang digunakan untuk memilih
metadata deskriptif tentang sumber daya konten.
2. Menggunakan metadata untuk menggambarkan kosa kata terkontrol secara keseluruhan untuk
penemuan sumber daya.
Ini penggunaan metadata tidak berbeda daripada menjelaskan jenis lain dari sumber daya. Banyak yang
ada metadata elemen set dan skema dapat dimanfaatkan untuk menggambarkan sumber daya kosa
kata terkontrol.
3. Menggunakan metadata dan skema metadata untuk mewakili seluruh isi dari kosa kata terkontrol.
Ini menggunakan metadata yang umumnya dirancang untuk memudahkan pencarian atau pertukaran
kosakata terkontrol. Hal ini membutuhkan minimal: elemen metadata yang ditetapkan untuk
menggambarkan konsep, istilah, dan hubungan; satu set definisi relasi; dan skema metadata untuk
mewakili hubungan antar istilah.
Ada sejumlah inisiatif dilakukan untuk mengatasi jenis ketiga metadata. Daftar ini disediakan dalam
Daftar Pustaka. Pada saat ini, tidak ada inisiatif telah maju ke tahap di mana rekomendasi standar
praktek terbaik dapat dibuat.
Pengembang kosa kata terkontrol harus mengevaluasi inisiatif metadata ini untuk relevansi dengan
masyarakat dan informasi mereka domain sebelum mengembangkan setiap set elemen metadata baru
atau skema.