Nur Afiatu Niza-21026060-PP TUGAS PERTEMUAN 15

NAMA : NUR AFIATU NIZA
NIM : 21026060
PRODI : INFORMASI PERPUSTAKAAN DAN KEARSIPAN
MATA KULIAH : PENGINDEKSAAN DAN PENGABSTRAKAN
SESI : 202210260020
KELAS B
Tugas Pertemuan 15
Pemanfaatan Komputer dalam Pengindeksan dan Pengabstrakan
Berikut Peta Konsepnya:
Berikut Resumenya:
Pada jaman buku dan bahan tercetak non-elektronik, kegiatan pembuatan indeks
dilakukan oleh manusia tanpa bantuan alat-alat otomatis (mesin ketik dianggap bukan alat
otomatis). Ketika dokumen terbuat dari teks digital, maka muncul kemungkinan untuk
membuat indeks yang serupa dengan cara ‘tradisional’ pertama di atas (membuat indeks dari
isi dokumen) tetapi dengan bantuan mesin. Manusia tinggal memerintahkan komputer
mengambil istilah dari tempat-tempat tertentu dalam sebuah dokumen. Perintah ini hanya
dilakukan sekali, tetapi lalu dikerjakan secara konsisten oleh komputer berkali-kali, maka ini
disebut otomatisasi. Lebih jauh lagi, muncul juga kemungkinan untuk menjadikan semua isi
dokumen sebagai wakilnya, sehingga disebut full-text. pengindeksan dapat dilakukan dengan
dua cara: intelektual atau mekanikal:
✓ Kegiatan menganalisis dan penerjemahan (translasi) dokumen yang akan diindeks
merupakan kegiatan intelektual karena mencakup kegiatan mengidentifikasi dan
memilih konsep-konsep penting yang tercakup dalam sebuah dokumen, sementara
fase translasi sesungguhnya merupakan pekerjaan menjadikan konsep-konsep yang
sudah dipilih itu menjadi indeks berdasarkan sebuah cara yang sudah ditetapkan
sebelumnya.
✓ Kegiatan mekanikal merupakan kegiatan yang mencakup pengurutan menurut abjad
dan pembuatan format entri indeks. Kalau komputer digunakan baik untuk kegiatan
intelektual maupun mekanikal, maka itu artinya automatic indexing (pengindeksan
secara otomatis). Kalau komputer hanya digunakan untuk mekanikal sementara
manusia untuk yang intelektual, maka namanya automated indexing (pengindeksan
yang diotomatiskan).
Penggunaan komputer dalam pengindeksan kini telah menjadi bagian yang tak
terpisahkan dari semua sistem information retrieval. Di dalam sistem ini ada dua berkas (file)
besar; yang pertama untuk tempat semua dokumen digital, dan yang kedua berisi indeks
untuk dokumen itu. Berkas kedua ini bisa kita anggap halaman belakang sebuah buku.
Seperti halnya buku tercetak, maka ‘halaman digital’ ini juga berisi istilah-istilah yang datang
dari dokumen yang tersimpan di berkas pertama. Istilah-istilah ini diambil sesuai dengan
teknik pengindeksan. Untuk setiap istilah, terdapat rujukan ke lokasi di mana istilah itu
terdapat di dokumennya. Kelemahan cara penelusuran secara berurutan ini kemudian
diperbaiki dengan berbagai cara yang akan dijelaskan secara ringkas berikut ini.
Alphabetical chain
Cara pertama mengatasi problem pencarian sequential adalah dengan pencarian yang
memakai prinsip alphabetical chain, atau matarantai-alfabet. Prinsipnya sama dengan cara
kita menggunakan kamus. Cara pencarian ini lumayan lebih cepat daripada cara sebelumnya,
tetapi tetap menyisakan masalah. Jika daftar indeks memiliki banyak kata yang serupa
(misalnya programme, programmable, programming), maka terjadilah apa yang disebut
densely populated area (wilayah dalam daftar indeks yang padat berisi istilah serupa). Jika
komputer harus mencari di wilayah ini, maka programnya juga harus dibuat agar bisa bolak-
balik di wilayah ini sampai semua kemungkinan telah dicoba
Binary search Untuk mempercepat pencarian di daftar indeks, komputer perlu
mengurangi langkah penelusuran. Salah satu cara yang dipakai untuk mengurangi langkah itu
adalah dengan binary search yang membagi dua daftar setiap kali melakukan pencarian (itu
sebabnya disebut binary yang artinya kira-kira adalah ‘belah dua’ atau ‘bagi dua’). Jika dalam
proses sequential komputer menelusur dari awal sampai akhir dan dalam proses alphabetical
chain komputer menelusur mulai dari kata yang alfabetnya dipakai di awal, maka binary
search langsung membagi dua seluruh daftar dan mencari di setengah daftar. Proses
pembagian ini dapat dilakukan berkali-kali. Untuk jelasnya, mari kita lihat contoh sederhana,
jika sebuah indeks berisi 10 istilah (tentu saja, ini jumlah yang sangat kecil, karena hanya
sebagai contoh) sebagai berikut:
Salah satu problem utama dari cara pencarian binary di atas adalah pada keharusan
pembuatan program yang dapat melakukan penghitungan matematis untuk menentukan
titiktengah dari sebuah daftar. Penghitungan ini dilakukan setiap kali komputer diperintahkan
oleh pemakai untuk mencari sebuah istilah di dalam daftar indeks. Tentu saja, dari segi
pemrograman dan pemrosesan komputer, kegiatan penghitungan ini akan sangat dipengaruhi
oleh kompleksitas pertanyaan, ukuran indeks, dan kecepatan perangkat keras.
Semakin rumit pertanyaannya, dan semakin besar jumlah indeks yang terkandung dalam
sebuah berkas-sungsang, maka semakin banyaklah kegiatan penghitungan yang harus
dilakukan. Artinya, semakin lambatlah proses kerja komputernya. Untuk menambah
kecepatan pencarian, maka diciptakan cara yang meniru tabiat sebuah pohon (maka
disebutlah cara ini binary search tree). Sebuah pohon memiliki cabang, dan setiap cabang
bercabang lagi, demikian seterusnya sampai ke puncak pohon.
Dengan perhitungan matematis, maka dapatlah dibuat sebuah berkas-sungsang yang
setiap istilah indeksnya mengandung nilai, sedemikian rupa sehingga selalu ada dua cabang
untuk setiap istilah. Pencabangan menjadi dua ini sebenarnya sama dengan membagi dua
berkas seperti di cara binary search, tetapi kali ini komputer tidak perlu melakukan
pembagian dan penghitungan titiktengah setiap kali melakukan pencarian. Komputer cukup
memulai pencarian di awal indeks, yang dalam hal ini dianggap sebagai pangkal sebuah
pohon, lalu tinggal mengikuti percabangan ‘pohon’ itu sampai bertemu dengan istilah yang
dicari.
Balanced tree (B-tree) Jika cara binary search tree mengandalkan metode pencabangan-
dua (setiap istilah indeks mempunyai dua ‘anak’ istilah yang berdekatan), maka cara lain lagi
yang dianggap lebih mempercepat proses pencarian adalah balanced tree alias B-tree. Dengan
cara ini, setiap istilah indeks diberi nilai sedemikian rupa sehingga cabangnya tidak hanya
dua, tetapi bisa berapa saja.
TRIES diambil dari kata ‘retrieval’ dan diperkenalkan sebagai sebuah model struktur
data di tahun 1960an. Pada dasarnya, tries adalah sebuah cara untuk mengelola istilah
pengindeksan, bukan cara menelusur. Namun, cara pengelolaan ini tentu saja memengaruhi
kinerja penelusuran berkas-sungsang dalam sebuah sistem IR.
Komputer kemudian juga dapat melakukan dua hal yang pada dasarnya dilakukan juga
sebelum ada komputer, yaitu derivative indexing dan assignment indexing, dengan penjelasan
ringkas sebagai berikut:
• Derivative indexing – istilah untuk indeks diambil langsung dari teks dokumen,
disebut juga synonym for keyword indexing karena indeks diambil langsung dari
kata kunci dan tidak ada daftar kosakata sebagai acuannya (atau di kalangan teknisi
biasa disebut ‘tidak ada controlled vocabulary-nya’). Pengindeksan tanpa controlled
vocabulary ini disebut juga free indexing.
• Assignment indexing – istilah untuk indeks diberikan dari luar. Kalau istilah ini
datang dari controlled vocabulary disebut descriptor, walaupun controlled
vocabulary-nya bukan thesaurus. Kalau istilah datang dari luar controlled vocabulary
(mungkin istilahnya baru muncul) maka disebut identifier.

Nur Afiatu Niza-21026060-PP TUGAS PERTEMUAN 15

Diunggah oleh

Informasi Dokumen

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Nur Afiatu Niza-21026060-PP TUGAS PERTEMUAN 15

Diunggah oleh

Hak Cipta:

Format Tersedia

NAMA : NUR AFIATU NIZA

Berikut Peta Konsepnya:

Anda mungkin juga menyukai