Mesin pencari yang akan dibahas adalah mesin pencari khusus yang digunakan untuk
mencari informasi dan berbagai file di Internet, sehingga mesin pencari sangat berguna bagi
para penggunanya untuk mencari berbagai bahan referensi atau lainnya.
Untuk memudahkan pencarian di database yang begitu besar, mesin pencari menggunakan
indeks untuk memilah-milah informasi yang ada di database. Sedangkan untuk memudahkan
dan mempercepat pencarian, mesin pencari mempunyai metode pencarian tertentu yang
SIMDIG PERTEMUAN 5 #TOI2021#
sering di sebut algoritma pencarian, kecepatan dan ketepatan pencarian sebuah mesin
pencarian tergantung kepada cara pengindeksan dan algoritma pencarian yang digunakan.
B. Komponen Search Engine
1. Query Interface
Query interface adalah komponen penting pertama yang merupakan bentuk tampilan atau
format situs yang menyediakan fasilitas searching engine. Bentuk yang paling sederhana
adalah tersedianya sebuah kotak kosong di situs dimana user dapat menuliskan data atau
informasi yang ingin dicari (lihat situs Yahoo.com atau Altavista.com). Yang harus diketahui
oleh user adalah bahwa tidak semua situs memiliki kemampuan yang sama dalam
membantu user untuk mengekspresikan jenis data atau informasi yang ingin dicari. Dalam
bahasa komputer cara mengekspresikan ini disebut sebagai query. Contohnya adalah
seseorang yang ingin mencari data atau informasi mengenai hal-hal yang berkaitan dengan
kesehatan ibu dan anak, dapat menggunakan query semacam: “kesehatan” and “ibu” and
“anak”.
Walaupun secara internasional telah diusulkan dan ditentukan standar baku dalam
menuliskan sebuah query, namun terlihat bahwa masing-masing situs menawarkan beragam
cara yang berbeda. Yang utama bagi user adalah bahwa Query Interface yang ditawarkan
mudah dipergunakan dan efektif.
2. Query Engine
Komponen kedua adalah Query Engine, merupakan sebuah program yang bertugas untuk
menterjemahkan keinginan user ke dalam bahasa yang dimengerti oleh mesin komputer.
Secara teknis, perusahaan-perusahaan penyedia searching engine berlomba-lomba membuat
SIMDIG PERTEMUAN 5 #TOI2021#
query engine yang baik sehingga selain tepat dalam mengekspresikan keinginan user, dapat
pula melakukan tugas pencarian secara cepat. Query Engine ini pulalah yang segera
melakukan pencarian arsip dan dokumen yang tepat di dalam sistem basis data (database)
yang bersangkutan.
3. Database
Database pada dasarnya merupakan kumpulan atau daftar dari dokumen maupun arsip dari
seluruh situs yang ada di internet. Semakin besar skala internet, akan semakin besar pula
kapasitas penyimpan yang dibutuhkan.
4. Spider
Spider merupakan komponen terpenting dalam sebuah searching engine. Secara berkala dan
kontinyu, spider akan mendata setiap situs yang ada di internet, baik yang baru maupun yang
lama. Terhadap masing-masing situs, selain alamatnya, akan diambil kata-kata kunci dari
arsip maupun dokumen yang ditemukan. Katakanlah dari situs Bidanku.com akan diambil
setiap kata pada kalimat judul artikel, disinilah sebenarnya persaingan antara situs terjadi,
yaitu strategi dan teknik apa yang dipergunakan dalam melakukan sampling terhadap kata-
kata yang akan menjadi kunci dalam pencarian arsip dan dokumen. Harap diingat bahwa
tidak semua situs melakukan proses updating dan sampling ini secara kontinyu (24 jam
sehari), yang dapat menyebabkan telah hilangnya beberapa arsip dan dokumen dari internet
saat user mencarinya.
5. Indexer
Indexer merupakan sebuah program untuk mempercepat proses pencarian. Filosofi yang
dipergunakan mirip dengan prinsip penggunaan indeks pada kamus atau buku-buku. Perang
antar situs pun terjadi di sini, karena teknik melakukan indeks akan sangat berpengaruh
terhadap kecepatan pencarian data atau informasi. Biasanya yang terjadi di sini adalah adu
algoritma (alur logika sebuah program) antar para programmer yang direkrut oleh masing-
masing perusahaan.
Berikut disajikan gambar yang memperlihatkan 5 (lima) komponen utama dari arsitektur
sebuah program searching engine (Indrajit, 2000).
SIMDIG PERTEMUAN 5 #TOI2021#
Mesin pencari yang dikelola sepenuhnya oleh tangan manusia. Mesin pencari ini
menggunakan metode dengan memilah-milih informasi yang relevan dan dikelompokan
sedemikian rupa sehingga lebih bermakna dan bermanfaaat bagi penggunannya. Situs ini
dalam prakteknya memperkerjakan para pakar dalam bidang-bidang tertentu, kemudian para
pakar tersebut dapat mengkelompokan situs-situs tertentu sesuai dengan bidangnnya atau
kategori situs itu sendiri.
Search engine kategori ini banyak memiliki kelebihan karena banyak menyajikan inforrmasi
walaupun kadang-kadang ada beberapa informasi yang tidak relevan tidak seperti yang kita
inginkan. Search engine ini telah menggunakan software laba-laba atau spider software yang
berfungsi menyusup pada situs-situs tertentu, kemudian mengumpulkan data serta
mengelompokan dengan sedikit bantuan tangan manusia.
Merupakan gabungan antara tangan manusia dengan computer, sehingga menghasilkan hasil
pencarian yang relative akurat. Peran manusia dalam hal ini adalah sebagai penelaah dalam
proses pengkoleksian database halaman web. Sebenarnya tipe ini lah yang paling mudah
pembuatannya karena dapat didesain sesuai dengan keinginan kita.
4. MetaCrawler/Metasearch
Merupakan perantara dari mesin pencari yang sebenarnya. Mesin ini hanya akan
mengirimkan permintaan pencarian ke berbagai mesin pencari serta menampilkan hasilnya
satu di layer browser sehingga akan menampilkan banyak sekali hasil dari ber bagai mesin
pencari yang ada.
Mesin pencari yang cukup populer, yaitu: Google, Yahoo!, Alltheweb, MSN, AskJeeves,
AltaVista, dan Lycos. Mesin pencari orang: Infospace, Spock, Yellowpages.com,
Zabasearch.com, Zoominfo. Mesin pencari visual: Grokker, Kartoo, Avintura. Mesin pencari
multimedia: Blinkx, Find sounds, Pic search, Podscope, Youtube.
SIMDIG PERTEMUAN 5 #TOI2021#
Program Search Engine dalam menjalankan fungsinya sebenarnya bekerja bersamaan dengan
Browser. Ketika kita mengetikkan sesuatu lalu Enter, Search Engine-lah yang bekerja
melakukan pencarian di database. Hasil yang didapat diberikan kembali ke Browser, lalu
Browser menampilkannya untuk kita dalam format yang mudah kita mengerti. Sebenarnya
Search Engine tidak tampak, ia bekerja di balik layar. Search Engine juga sebenarnya bekerja
dengan teman-temannya yaitu crawler atau indexer atau robot atau bot.
Sederhananya, proses yang berlangsung adalah: saat user membuka Browser, dan
memerintahkan pencarian, maka browser minta tolong Search Engine untuk mencarikan. Jika
sudah didapat, hasilnya dikembalikan ke Browser dan Browser menampilkannya untuk user.
Semuanya berlangsung sangat cepat sehingga kita tidak mengetahui proses sesungguhnya
yang terjadi.
Mesin pencari web bekerja dengan cara menyimpan informasi tentang banyak halaman web,
yang diambil secara langsung dari www. Halaman ini di ambil dengan web crawler-browser
web yang otomatis mengikuti setiap pranala yang dilihatnya. Isi setiap halaman lalu dianalisis
untuk menentukan cara mengindeksnya (misalnya kata-kata di ambil dari judul, subjudul,
atau field khusus yang di sebut meta tag). Data tentang halaman web disimpan dalam sebuah
database indeks untuk digunakan dalam pencarian selanjutnya.
Sebagian mesin pencari seperti Google, menyimpan seluruh atau sebagian halaman sumber
(yang disebut cache) maupun informasi tentang halaman web itu sendiri. Ketika seorang
pengguna menggunakan mesin pencari dan memasukan query, biasanya dengan memasukan
kata kunci, mesin mencari akan mengindeks dan memberikan daftar halaman web yang
paling sesuai dengan kriterianya. Daftar ini biasanya disertai ringkasan singkat menggenai
judul dokumen dan terkadang sebagian teks dari hasil pencarian yang kita cari.
Sangat banyak hasil data yang akan di munculkan oleh mesin pencari ketika pengguna
mengetikan sebuah kata kunci, urutan yang ada di paling atas atau halaman pertamalah yang
mempunyai isi paling akurat. Keakuratan sebuah mesin pencari dalam menyajikan data dan
informasi yang dicari oleh pengguna dapat menjadi tolak ukur kualitas sebuah mesin pencari.
Semakin tinggi keakuratan data yang disajikan maka semakin baik mesin pencarian tersebut.
SIMDIG PERTEMUAN 5 #TOI2021#
Untuk mencari sebuah informasi pada sebuah laman web, juga bisa dituliskan pada query
web yang telah kita buka.
Secara umum, cara kerja mesin pencarian dimulai saat user menulis alamat website (URL).
Saat alamat web terisi, maka spider dari search engine akan menerima dan menganalisa URL.
Secara otomatis spider memutuskan web yang didaftar layak diterima atau tidak. Jika layak,
maka spider langsung menambahkan alamat URL tersebut ke sistem database. Rangking
segera ditetapkan dengan algoritma dan caranya masing-masing. Jika tidak layak maka users
terpaksa bersabar dan mengulangi pendaftaran diwaktu yang lain.
Selain pencarian web, Google juga menyediakan jasa pencarian gambar, pencarian berita
serta pencarian pada arsip USENET (newsgroup), serta direktori, seperti Yahoo!
Kelemahannya terletak pada tidak tersedianya pencarian file, video, dan audio. Keunggulan
Google terutama adalah pada pencarian teks, terutama dari algoritma PageRank, database-nya
yang besar serta banyaknya jenis file yang diindeksnya.
Kelebihan:
Kekurangan:
Dengan kelebihan yang dimilikinya, ternyata mesin pencari ini jadi bidikan para spamer
untuk menampilkan iklan-iklan yang tidak diperlukan. Mereka memanfaatkan setiap celah
SIMDIG PERTEMUAN 5 #TOI2021#
yang ada pada sistem algoritma Google untuk memaksa iklan mereka tampil pada halaman
terdepan. Maka, pencarian pun terasa tergangggu.
Secara umum, jenis pencarian pada mesin pencarian/website ada dua yaitu: Basic
Search dan Advanced Search. Basic Search adalah fitur pencarian yang sudah biasa kita
gunakan yaitu ketika mengakses langsung, missal pada google.com. Sedangkan Advanced
Search menyediakan berbagai pilihan fitur pencarian baik untuk operator dasar, file format
yang ingin kita cari, bahasa, region, dsb.
Sebenarnya masih sangat banyak fitur pencarian yang bisa kita gunakan, tapi tidak terdapat di
menu pilihan Advanced Search. Dengan kata lain kita harus memasukannya query di form
pencarian di Basic Search langsung. Di bawah ini akan disajikan permainan query dan
operator pencarian.
G. Boolean Logic
Boolean logic adalah suatu pencarian pelacakan yang menyatakan tentang hubungan antara
variabel yang dicari dengan variabel terkait. Boolean logic juga merupakan identifikasi
spesifik tentang artikel yang akan dicari. Boolean logic dikembangkan oleh George Boole
(1815-1864), adalah suatu metode pencarian informasi, yang memfokuskan hasil penelusuran
dimana pencarian datanya menggunakan kata kunci.
Boolean logic terdiri dari operasi logika AND, OR dan NOT. Pada fitur pencarian Google,
operasi ini merupakan bagian dari fitur pencarian dasar. Penggunaan operasi logika ini dapat
memudahkan user dalam mendapatkan informasi yang diinginkan. Boolean logic merupakan
operasi logika yang digunakan untuk mendapatkan informasi di PubMed (NCBI).
1. AND: Mencari informasi yang mengandung kedua kata yang dicari. Bisa
menggunakan salah satu dari tiga alternatif berikut. Contoh: kehamilan gemelli ,
kehamilan AND gemeli, kehamilan+gemelli
2. OR: Mencari informasi yang mengandung salah satu dari kedua kata. Bisa
menggunakan salah satu dari dua alternatif berikut. Contoh: kembar OR gemelli,
kembar | gemelli
3. NOT: Hasil pencarian mengandung kata yang di depan, tapi tidak yang dibelakang
minus (-). Contoh di bawah akan mencari informasi yang mengandung
kata kontrasepsi tapi bukan suntik. Contoh: kontrasepsi –suntik.
SIMDIG PERTEMUAN 5 #TOI2021#