Anda di halaman 1dari 11

Menerapkan Teknik Penelusuran

Search Engine

A. Pengertian Aplikasi Search Engine


Search engine (mesin pencari/pelacak/penelusur) adalah salah satu program
komputer yang dirancang khusus untuk membantu seseorang menemukan file-
file yang disimpan dalam komputer, misalnya dalam sebuah web server umum
di web (www) atau komputer sendiri. Mesin pencari memungkinkan kita untuk
meminta content media dengan kriteria yang spesifik (biasanya berisikan frase
atau kata yang kita inginkan) dan memperoleh daftar file yang memenuhi
kriteria tersebut. Mesin pencari biasanya menggunakan indeks (yang sudah
dibuat sebelumnya dan dimutakhirkan secara teratur) untuk mencari file setelah
pengguna memasukan kriteria pencarian.
Mesin pencari yang akan dibahas adalah mesin pencari khusus yang digunakan
untuk mencari informasi dan berbagai file di Internet, sehingga mesin pencari
sangat berguna bagi para penggunanya untuk mencari berbagai bahan referensi
atau lainnya.

Untuk memudahkan pencarian di database yang begitu besar, mesin pencari


menggunakan indeks untuk memilah-milah informasi yang ada di database.
Sedangkan untuk memudahkan dan mempercepat pencarian, mesin pencari
mempunyai metode pencarian tertentu yang sering di sebut algoritma
pencarian, kecepatan dan ketepatan pencarian sebuah mesin pencarian
tergantung kepada cara pengindeksan dan algoritma pencarian yang digunakan.
Secara prinsip, tujuan dari sebuah program searching engine adalah menemukan
dokumen atau arsip elektronis di internet yang sesuai dengan kebutuhan atau
permintaan pengguna dalam waktu yang sesingkat-singkatnya. Kedua hal inilah,
yaitu kualitas hasil temuan dan waktu pencarian, yang kemudian menjadi
pengukur baik tidaknya kinerja sebuah searching engine.
B. Komponen Search Engine
Search engine terdiri atas lima komponen, yaitu:
1. Query Interface

Query interface adalah komponen penting pertama yang merupakan bentuk


tampilan atau format situs yang menyediakan fasilitas searching engine. Bentuk
yang paling sederhana adalah tersedianya sebuah kotak kosong di situs dimana
user dapat menuliskan data atau informasi yang ingin dicari (lihat
situs Yahoo.com atau Altavista.com). Yang harus diketahui oleh user adalah
bahwa tidak semua situs memiliki kemampuan yang sama dalam
membantu user untuk mengekspresikan jenis data atau informasi yang ingin
dicari. Dalam bahasa komputer cara mengekspresikan ini disebut sebagai query.
Contohnya adalah seseorang yang ingin mencari data atau informasi mengenai
hal-hal yang berkaitan dengan kesehatan ibu dan anak, dapat menggunakan
query semacam: “kesehatan” and “ibu” and “anak”.
Walaupun secara internasional telah diusulkan dan ditentukan standar baku
dalam menuliskan sebuah query, namun terlihat bahwa masing-masing situs
menawarkan beragam cara yang berbeda. Yang utama bagi user adalah bahwa
Query Interface yang ditawarkan mudah dipergunakan dan efektif.

2. Query Engine

Komponen kedua adalah Query Engine, merupakan sebuah program yang


bertugas untuk menterjemahkan keinginan user ke dalam bahasa yang
dimengerti oleh mesin komputer. Secara teknis, perusahaan-perusahaan
penyedia searching engine berlomba-lomba membuat query engine yang baik
sehingga selain tepat dalam mengekspresikan keinginan user, dapat pula
melakukan tugas pencarian secara cepat. Query Engine ini pulalah yang segera
melakukan pencarian arsip dan dokumen yang tepat di dalam sistem basis data
(database) yang bersangkutan.
3. Database

Database pada dasarnya merupakan kumpulan atau daftar dari dokumen


maupun arsip dari seluruh situs yang ada di internet. Semakin besar skala
internet, akan semakin besar pula kapasitas penyimpan yang dibutuhkan.

4. Spider

Spider merupakan komponen terpenting dalam sebuah searching engine. Secara


berkala dan kontinyu, spider akan mendata setiap situs yang ada di internet,
baik yang baru maupun yang lama. Terhadap masing-masing situs, selain
alamatnya, akan diambil kata-kata kunci dari arsip maupun dokumen yang
ditemukan. Katakanlah dari situs Bidanku.com akan diambil setiap kata pada
kalimat judul artikel, disinilah sebenarnya persaingan antara situs terjadi, yaitu
strategi dan teknik apa yang dipergunakan dalam melakukan sampling terhadap
kata-kata yang akan menjadi kunci dalam pencarian arsip dan dokumen. Harap
diingat bahwa tidak semua situs melakukan proses updating dan sampling ini
secara kontinyu (24 jam sehari), yang dapat menyebabkan telah hilangnya
beberapa arsip dan dokumen dari internet saat user mencarinya.
5. Indexer

Indexer merupakan sebuah program untuk mempercepat proses pencarian.


Filosofi yang dipergunakan mirip dengan prinsip penggunaan indeks pada
kamus atau buku-buku. Perang antar situs pun terjadi di sini, karena teknik
melakukan indeks akan sangat berpengaruh terhadap kecepatan pencarian data
atau informasi. Biasanya yang terjadi di sini adalah adu algoritma (alur logika
sebuah program) antar para programmer yang direkrut oleh masing-masing
perusahaan.

Berikut disajikan gambar yang memperlihatkan 5 (lima) komponen utama dari


arsitektur sebuah program searching engine (Indrajit, 2000).
Gambar: Komponen Utama Program Search Engine
Sedangkan struktur umum sebuah mesin pencari adalah sebagai berikut :

1. Kotak teks pencari, kotak ini digunakan sebagai tempat memasukan


kata kunci yang akan dijadikan acuan dilakukan pencarian.

2. Tombol pencari, tombol ini yang akan menjalankan perintah


pencarian.
C. Jenis Search Engine
Berdasarkan cara mengumpulkan data halaman-halaman web, mesin pencari
dapat di kelompokkan menjadi 4 kategori :
1. Human Organized Search Engine
Mesin pencari yang dikelola sepenuhnya oleh tangan manusia. Mesin pencari ini
menggunakan metode dengan memilah-milih informasi yang relevan dan
dikelompokan sedemikian rupa sehingga lebih bermakna dan bermanfaaat bagi
penggunannya. Situs ini dalam prakteknya memperkerjakan para pakar dalam
bidang-bidang tertentu, kemudian para pakar tersebut dapat mengkelompokan
situs-situs tertentu sesuai dengan bidangnnya atau kategori situs itu sendiri.

Contoh: Yahoo!(www.yahoo.com), LooKSmart (www.looksmart.com), About


(www.about.com) , Open Directory (Dmoz.org).
2. Computer Created Search Engine
Search engine kategori ini banyak memiliki kelebihan karena banyak
menyajikan inforrmasi walaupun kadang-kadang ada beberapa informasi yang
tidak relevan tidak seperti yang kita inginkan. Search engine ini telah
menggunakan software laba-laba atau spider software yang berfungsi menyusup
pada situs-situs tertentu, kemudian mengumpulkan data serta mengelompokan
dengan sedikit bantuan tangan manusia.

Contoh: WebCrawler (www.webcrawler.com), Excite (www.excite.com), Inktomi


(www.inktomi.com), Northen Light (www.northenlight.com), Fast Search
(www.altheweb.com).
3. Hybrid Seacrh Engine
Merupakan gabungan antara tangan manusia dengan computer, sehingga
menghasilkan hasil pencarian yang relative akurat. Peran manusia dalam hal ini
adalah sebagai penelaah dalam proses pengkoleksian database halaman web.
Sebenarnya tipe ini lah yang paling mudah pembuatannya karena dapat didesain
sesuai dengan keinginan kita.

Contoh: Google (www.google.com), Lycos (www.lycos.com), AltaVista


(www.altavista.com), HotBot (www.hotbot.com), Go To (www.goto.com), Snap
(www.snap.com), Direct Hit (www.directhit.com), Go (go.com).
4. MetaCrawler/Metasearch
Merupakan perantara dari mesin pencari yang sebenarnya. Mesin ini hanya akan
mengirimkan permintaan pencarian ke berbagai mesin pencari serta
menampilkan hasilnya satu di layer browser sehingga akan menampilkan
banyak sekali hasil dari ber bagai mesin pencari yang ada.

Contoh: SavvySearch (savvysearch.com), Dogpile (www.dogpile.com), The Big


Hub (www.infind.com), C4 Total Search (www.snap.com).
Mesin pencari yang cukup populer, yaitu: Google, Yahoo!, Alltheweb, MSN,
AskJeeves, AltaVista, dan Lycos. Mesin pencari orang: Infospace,
Spock, Yellowpages.com, Zabasearch.com, Zoominfo. Mesin pencari visual:
Grokker, Kartoo, Avintura. Mesin pencari multimedia: Blinkx, Find sounds, Pic
search, Podscope, Youtube.
D. Cara Kerja Search Engine
Program Search Engine dalam menjalankan fungsinya sebenarnya bekerja
bersamaan dengan Browser. Ketika kita mengetikkan sesuatu lalu Enter, Search
Engine-lah yang bekerja melakukan pencarian di database. Hasil yang didapat
diberikan kembali ke Browser, lalu Browser menampilkannya untuk kita dalam
format yang mudah kita mengerti. Sebenarnya Search Engine tidak tampak, ia
bekerja di balik layar. Search Engine juga sebenarnya bekerja dengan teman-
temannya yaitu crawler atau indexer atau robot atau bot.
Sederhananya, proses yang berlangsung adalah: saat user membuka Browser,
dan memerintahkan pencarian, maka browser minta tolong Search Engine untuk
mencarikan. Jika sudah didapat, hasilnya dikembalikan ke Browser dan Browser
menampilkannya untuk user. Semuanya berlangsung sangat cepat sehingga kita
tidak mengetahui proses sesungguhnya yang terjadi.

Mesin pencari web bekerja dengan cara menyimpan informasi tentang banyak
halaman web, yang diambil secara langsung dari www. Halaman ini di ambil
dengan web crawler-browser web yang otomatis mengikuti setiap pranala yang
dilihatnya. Isi setiap halaman lalu dianalisis untuk menentukan cara
mengindeksnya (misalnya kata-kata di ambil dari judul, subjudul, atau field
khusus yang di sebut meta tag). Data tentang halaman web disimpan dalam
sebuah database indeks untuk digunakan dalam pencarian selanjutnya.

Sebagian mesin pencari seperti Google, menyimpan seluruh atau sebagian


halaman sumber (yang disebut cache) maupun informasi tentang halaman web
itu sendiri. Ketika seorang pengguna menggunakan mesin pencari dan
memasukan query, biasanya dengan memasukan kata kunci, mesin mencari
akan mengindeks dan memberikan daftar halaman web yang paling sesuai
dengan kriterianya. Daftar ini biasanya disertai ringkasan singkat menggenai
judul dokumen dan terkadang sebagian teks dari hasil pencarian yang kita cari.
Sangat banyak hasil data yang akan di munculkan oleh mesin pencari ketika
pengguna mengetikan sebuah kata kunci, urutan yang ada di paling atas atau
halaman pertamalah yang mempunyai isi paling akurat. Keakuratan sebuah
mesin pencari dalam menyajikan data dan informasi yang dicari oleh pengguna
dapat menjadi tolak ukur kualitas sebuah mesin pencari. Semakin tinggi
keakuratan data yang disajikan maka semakin baik mesin pencarian tersebut.
Untuk mencari sebuah informasi pada sebuah laman web, juga bisa dituliskan
pada query web yang telah kita buka.
Secara umum, cara kerja mesin pencarian dimulai saat user menulis alamat
website (URL). Saat alamat web terisi, maka spider dari search engine akan
menerima dan menganalisa URL. Secara otomatis spider memutuskan web yang
didaftar layak diterima atau tidak. Jika layak, maka spider langsung
menambahkan alamat URL tersebut ke sistem database. Rangking segera
ditetapkan dengan algoritma dan caranya masing-masing. Jika tidak layak maka
users terpaksa bersabar dan mengulangi pendaftaran diwaktu yang lain.
E. Mesin Pencarian Google
Google merupakan sebuah perusahaan publik Amerika Serikat, berperan dalam
pencarian Internet, Cloud Computing, serta teknologi iklan online & perangkat
lunak (mesin pencari terbesar di dunia). Alamat web (http://www.google.com).
Selain pencarian web, Google juga menyediakan jasa pencarian gambar,
pencarian berita serta pencarian pada arsip USENET (newsgroup), serta
direktori, seperti Yahoo! Kelemahannya terletak pada tidak tersedianya
pencarian file, video, dan audio. Keunggulan Google terutama adalah pada
pencarian teks, terutama dari algoritma PageRank, database-nya yang besar
serta banyaknya jenis file yang diindeksnya.

Kelebihan:

1. Kecepatan dan kemudahan dalam mencari

2. lebih canggih dengan fitur yang dimilikinya

3. Tampilan yang sederhana

4. Google merupakan satu-satunya mesin pencari yang memilki cach.


Dengan adanya cache ini, si pencari dapat menghemat waktu
pencarian, karena hasil pencarian yang akan ditampilkan

5. Dapat mencari segala informasi seperti gambar, berita artikel, hiburan


dll.
Kekurangan:

Dengan kelebihan yang dimilikinya, ternyata mesin pencari ini jadi bidikan para
spamer untuk menampilkan iklan-iklan yang tidak diperlukan. Mereka
memanfaatkan setiap celah yang ada pada sistem algoritma Google untuk
memaksa iklan mereka tampil pada halaman terdepan. Maka, pencarian pun
terasa tergangggu.

F. Fitur Pencarian Google


Secara umum, jenis pencarian pada mesin pencarian/website ada dua
yaitu: Basic Search dan Advanced Search. Basic Search adalah fitur pencarian
yang sudah biasa kita gunakan yaitu ketika mengakses langsung, missal
pada google.com. Sedangkan Advanced Search menyediakan berbagai pilihan
fitur pencarian baik untuk operator dasar, file format yang ingin kita cari,
bahasa, region, dsb.
Sebenarnya masih sangat banyak fitur pencarian yang bisa kita gunakan, tapi
tidak terdapat di menu pilihan Advanced Search. Dengan kata lain kita harus
memasukannya query di form pencarian di Basic Search langsung. Di bawah ini
akan disajikan permainan query dan operator pencarian.

1. Fitur Pencarian Dasar

a. FRASE: Mencari informasi yang mengandung frase yang


dicari dengan menggunakan tanda “”. Contoh: “kesehatan
reproduksi”

b. SINONIM (~): Mencari kata beserta sinonim-sinonimnya.


Contoh di bawah akan membawa hasil pencarian: bayi baru
lahir (infant) dan sinonimnya. Contoh: ~infant

c. ASTERIK (*): Karakter pengganti kata. Dari contoh di bawah,


hasil yang didapat bisa: ikan bakar pedas, ikan goreng pedas,
ikan masak pedas, dsb. Contoh: ikan * pedas

d. TANDA TITIK (.): Karakter pengganti huruf, angka dan


karakter tunggal. Dari contoh di bawah, hasil yang didapat
bisa: kopi, koki, kodi, dsb. Contoh: ko.i

e. CASE INSENSITIVE: Pencarian di Google menganggap kapital


dan bukan kapital sebagai sesuatu yang sama. Jadi, kehamilan
aterm, Kehamilan Aterm, KEHAMILAN aterm, akan membawa
hasil pencarian yang sama
f. PENGABAIAN KATA: Google mengabaikan keyword berupa
karakter tunggal dan kata-kata berikut: a, about, an, and, are,
as, at, b, by, from, how, i , in, is, it, of, on, or, that, the, this, to, we,
what, when, where, which, with. Apabila kita masih tetap
menginginkan pencarian kata tersebut, bisa dengan
menggunakan karakter + di depan kata yang dicari
(contoh: Love Rain Episode +I), atau bisa juga dengan
menganggapnya sebagai frase (contoh: “Love Rain Episode I”)

g. I’M FEELING LUCKY: Akan membawa kita langsung menuju


ke hasil pencarian pertama dari query kita.

2. Fitur Pencarian Lanjut

a. DEFINE: Mencari definisi dari sebuah terminologi. Dari


contoh di bawah, hasil yang didapat adalah berbagai definisi
tentang e-learning dari berbagai sumber. Contoh: define:e-
learning

b. CACHE: Menampilkan situs web yang telah diindeks oleh


Google meskipun sudah tidak aktif lagi. Contoh di bawah akan
menghasilkan pencarian kata php pada
situs bidanku.com yang ada di indeks
Google. Contoh: cache:bidanku.com php

c. LINK: Menampilkan daftar link yang mengarah ke sebuah


situs. Contoh di bawah akan menampilkan daftar link yang
mengarah ke situs bidanku.com. Contoh: link:bidanku.com

d. RELATED: Menampilkan daftar situs yang serupa, mirip atau


memiliki hubungan dengan suatu
situs. Contoh: related:oshigita.wordpress.com

e. INFO: Menampilkan informasi yang Google ketahui tentang


sebuah situs. Contoh: info:oshigita.wordpress.com

f. SITE: Menampilkan pencarian khusus di suatu situs yang


ditunjuk. Contoh: java site:bidanku.com

g. FILETYPE: Menampilkan hasil pencarian berupa suatu jenis


(ekstensi) file tertentu. Jenis file yang bisa dicari adalah: doc,
xls, rtf, swf, ps, lwp, wri, ppt, pdf, mdb, txt, dsb. Contoh di bawah
akan menampilkan hasil pencarian berupafile PDF yang
mengandung keyword preeklamsi berat. Contoh: preeklamsi
berat filetype:pdf

h. ALLINTITLE: Menampilkan seluruh kata yang dicari dalam


TITLE halaman. Contoh di bawah akan menghasilkan
halaman yang memiliki title mola hidatidosa. Allintitle ini
tidak dapat digabungkan dengan operator (sintaks) lain.
Gunakan intitle untuk keperluan itu. Contoh: allintitle:mola
hidatidosa

i. INTITLE: Menampilkan satu kata yang dicari dalam TITLE


halaman. Contoh di bawah akan menghasilkan halaman yang
memiliki title kehamilan dan isi halaman yang mengandung
kata perdarahan. Contoh: intitle:kehamilan perdarahan

j. ALLINURL: Menampilkan seluruh kata yang dicari di dalam


URL. Contoh di bawah akan menghasilkan daftar URL yang
mengandung kata imunisasi dan bayi. Allinurl ini tidak dapat
digabungkan dengan operator (sintaks) lain. Gunakan inurl
untuk keperluan itu. Contoh: allinurl:imunisasi bayi

k. INURL: Menampilkan satu kata yang dicari di dalam URL.


Contoh di bawah akan menghasilkan daftar URL yang
mengandung kata kontrasepsi dan isi halaman yang
mengandung kata hormonal. Contoh: inurl:kontrasepsi
hormonal
G. Boolean Logic
Boolean logic adalah suatu pencarian pelacakan yang menyatakan tentang
hubungan antara variabel yang dicari dengan variabel terkait. Boolean logic juga
merupakan identifikasi spesifik tentang artikel yang akan dicari. Boolean logic
dikembangkan oleh George Boole (1815-1864), adalah suatu metode pencarian
informasi, yang memfokuskan hasil penelusuran dimana pencarian datanya
menggunakan kata kunci.
Boolean logic terdiri dari operasi logika AND, OR dan NOT. Pada fitur pencarian
Google, operasi ini merupakan bagian dari fitur pencarian dasar. Penggunaan
operasi logika ini dapat memudahkan user dalam mendapatkan informasi yang
diinginkan. Boolean logic merupakan operasi logika yang digunakan untuk
mendapatkan informasi di PubMed (NCBI).

1. AND: Mencari informasi yang mengandung kedua kata yang dicari. Bisa
menggunakan salah satu dari tiga alternatif berikut. Contoh: kehamilan
gemelli , kehamilan AND gemeli, kehamilan+gemelli

2. OR: Mencari informasi yang mengandung salah satu dari kedua kata.
Bisa menggunakan salah satu dari dua alternatif berikut.
Contoh: kembar OR gemelli, kembar | gemelli

3. NOT: Hasil pencarian mengandung kata yang di depan, tapi tidak yang
dibelakang minus (-). Contoh di bawah akan mencari informasi yang
mengandung kata kontrasepsi tapi bukan suntik. Contoh: kontrasepsi –
suntik.

Anda mungkin juga menyukai