Search Engine
MENERAPKAN TEKNIK PENELUSURAN SEARCH ENGINE
1. Query Interface
Query interface adalah komponen penting pertama yang merupakan bentuk tampilan atau
format situs yang menyediakan fasilitas searching engine. Bentuk yang paling sederhana
adalah tersedianya sebuah kotak kosong di situs dimana user dapat menuliskan data atau
informasi yang ingin dicari (lihat situs Yahoo.com atau Altavista.com). Yang harus
diketahui oleh user adalah bahwa tidak semua situs memiliki kemampuan yang sama
dalam membantu user untuk mengekspresikan jenis data atau informasi yang ingin dicari.
Dalam bahasa komputer cara mengekspresikan ini disebut sebagai query. Contohnya
adalah seseorang yang ingin mencari data atau informasi mengenai hal-hal yang
berkaitan dengan kesehatan ibu dan anak, dapat menggunakan query semacam:
“kesehatan” and “ibu” and “anak”.
2. Query Engine
Komponen kedua adalah Query Engine, merupakan sebuah program yang bertugas untuk
menterjemahkan keinginan user ke dalam bahasa yang dimengerti oleh mesin komputer.
Secara teknis, perusahaan-perusahaan penyedia searching engine berlomba-lomba
membuat query engine yang baik sehingga selain tepat dalam mengekspresikan keinginan
user, dapat pula melakukan tugas pencarian secara cepat.
3. Database
Database pada dasarnya merupakan kumpulan atau daftar dari dokumen maupun arsip
dari seluruh situs yang ada di internet. Semakin besar skala internet, akan semakin besar
pula kapasitas penyimpan yang dibutuhkan.
4. Spider
Spider merupakan komponen terpenting dalam sebuah searching engine. Secara berkala
dan kontinyu, spider akan mendata setiap situs yang ada di internet, baik yang baru
maupun yang lama. Terhadap masing-masing situs, selain alamatnya, akan diambil kata-
kata kunci dari arsip maupun dokumen yang ditemukan. Katakanlah dari situs
Bidanku.com akan diambil setiap kata pada kalimat judul artikel, disinilah sebenarnya
persaingan antara situs terjadi, yaitu strategi dan teknik apa yang dipergunakan dalam
melakukan sampling terhadap kata-kata yang akan menjadi kunci dalam pencarian arsip
dan dokumen.
5. Indexer
Indexer merupakan sebuah program untuk mempercepat proses pencarian. Filosofi yang
dipergunakan mirip dengan prinsip penggunaan indeks pada kamus atau buku-buku.
Perang antar situs pun terjadi di sini, karena teknik melakukan indeks akan sangat
berpengaruh terhadap kecepatan pencarian data atau informasi. Biasanya yang terjadi di
sini adalah adu algoritma (alur logika sebuah program) antar para programmer yang
direkrut oleh masing-masing perusahaan.
Mesin pencari yang dikelola sepenuhnya oleh tangan manusia. Mesin pencari ini
menggunakan metode dengan memilah-milih informasi yang relevan dan dikelompokan
sedemikian rupa sehingga lebih bermakna dan bermanfaaat bagi penggunannya. Situs ini
dalam prakteknya memperkerjakan para pakar dalam bidang-bidang tertentu, kemudian
para pakar tersebut dapat mengkelompokan situs-situs tertentu sesuai dengan bidangnnya
atau kategori situs itu sendiri.
Search engine kategori ini banyak memiliki kelebihan karena banyak menyajikan
inforrmasi walaupun kadang-kadang ada beberapa informasi yang tidak relevan tidak
seperti yang kita inginkan. Search engine ini telah menggunakan software laba-laba atau
spider software yang berfungsi menyusup pada situs-situs tertentu, kemudian
mengumpulkan data serta mengelompokan dengan sedikit bantuan tangan manusia.
4. MetaCrawler/Metasearch
Merupakan perantara dari mesin pencari yang sebenarnya. Mesin ini hanya akan
mengirimkan permintaan pencarian ke berbagai mesin pencari serta menampilkan
hasilnya satu di layer browser sehingga akan menampilkan banyak sekali hasil dari ber
bagai mesin pencari yang ada.
Sederhananya, proses yang berlangsung adalah: saat user membuka Browser, dan
memerintahkan pencarian, maka browser minta tolong Search Engine untuk mencarikan.
Jika sudah didapat, hasilnya dikembalikan ke Browser dan Browser menampilkannya
untuk user. Semuanya berlangsung sangat cepat sehingga kita tidak mengetahui proses
sesungguhnya yang terjadi.
Mesin pencari web bekerja dengan cara menyimpan informasi tentang banyak halaman
web, yang diambil secara langsung dari www. Halaman ini di ambil dengan web crawler-
browser web yang otomatis mengikuti setiap pranala yang dilihatnya. Isi setiap halaman
lalu dianalisis untuk menentukan cara mengindeksnya (misalnya kata-kata di ambil dari
judul, subjudul, atau field khusus yang di sebut meta tag). Data tentang halaman web
disimpan dalam sebuah database indeks untuk digunakan dalam pencarian selanjutnya.
Sebagian mesin pencari seperti Google, menyimpan seluruh atau sebagian halaman
sumber (yang disebut cache) maupun informasi tentang halaman web itu sendiri. Ketika
seorang pengguna menggunakan mesin pencari dan memasukan query, biasanya dengan
memasukan kata kunci, mesin mencari akan mengindeks dan memberikan daftar halaman
web yang paling sesuai dengan kriterianya. Daftar ini biasanya disertai ringkasan singkat
menggenai judul dokumen dan terkadang sebagian teks dari hasil pencarian yang kita
cari.
Kelebihan:
Google merupakan satu-satunya mesin pencari yang memilki cach. Dengan adanya cache
ini, si pencari dapat menghemat waktu pencarian, karena hasil pencarian yang akan
ditampilkan.
Kekurangan:
Dengan kelebihan yang dimilikinya, ternyata mesin pencari ini jadi bidikan para spamer
untuk menampilkan iklan-iklan yang tidak diperlukan. Mereka memanfaatkan setiap
celah yang ada pada sistem algoritma Google untuk memaksa iklan mereka tampil pada
halaman terdepan. Maka, pencarian pun terasa tergangggu.
Boolean Logic
Boolean logic adalah suatu pencarian pelacakan yang menyatakan tentang hubungan
antara variabel yang dicari dengan variabel terkait. Boolean logic juga merupakan
identifikasi spesifik tentang artikel yang akan dicari. Boolean logic dikembangkan oleh
George Boole (1815-1864), adalah suatu metode pencarian informasi, yang
memfokuskan hasil penelusuran dimana pencarian datanya menggunakan kata kunci.
Boolean logic terdiri dari operasi logika AND, OR dan NOT. Pada fitur pencarian
Google, operasi ini merupakan bagian dari fitur pencarian dasar. Penggunaan operasi
logika ini dapat memudahkan user dalam mendapatkan informasi yang diinginkan.
Boolean logic merupakan operasi logika yang digunakan untuk mendapatkan informasi di
PubMed (NCBI).