Menerapkan teknik
penelusuran Search Engine
Pada pertemuan kali ini kita akan membahas Menerapkan teknik penelusuran Search Engine yu..
Mesin Pencari Web Mesin pencari web atau mesin telusur web (bahasa Inggris: websearch engine)
adalah program komputer yang dirancang untuk melakukan pencarian atas berkas-berkas yang
tersimpan dalam layanan www, ftp, publikasi milis, ataupunnews group dalam sebuah ataupun
Mesin pencari merupakan perangkat penelusur informasi dari dokumen-dokumen yang tersedia.
Hasil pencarian umumnya ditampilkan dalam bentuk daftar yang seringkalidiurutkan menurut tingkat
kurasi ataupun rasio pengunjung atas suatu berkas yang disebut sebagai hits. Informasi yang
menjadi target pencarian bisa terdapat dalam berbagai macam jenis berkas seperti halaman situs
Beberapa mesin pencari juga diketahui melakukan pengumpulan informasi atas data yang
tersimpan dalam suatu basis data ataupun direktori web. Sebagian besar mesin
pencari dijalankan oleh perusahaan swasta yang menggunakan algoritma kepemilikandan basis
data tertutup, di antaranya yang paling populer adalah safari Google (MSN Search dan Yahoo!).
Telah ada beberapa upaya menciptakan mesin pencari dengan sumber terbuka (open source),
Sejarah Saat awal perkembangan internet, Tim Berners-Lee membuat sebuah situs web yang
berisikan daftar situs web yang ada di internet melalui peladen web CERN. Sejarah yang mencatat
sejak tahun 1992 masih ada hingga kini. Dengan semakin banyaknya situs web yang aktif membuat
daftar ini tidak lagi memungkinkan untuk dikelola oleh manusia. Utilitas pencari yang pertama kali
digunakan untuk melakukan pencarian di internet adalah Archie yang berasal dari kata "archive"
tanpa menggunakan huruf "v". Archie dibuat tahun 1990 oleh Alan Emtage, Bill Heelan dan J. Peter
Deutsch, saat itu adalah mahasiswa ilmu komputer Universitas McGill,Amerika Serikat. Cara kerja
program tersebut adalah mengunduh daftar direktori serta berkas yang terdapat pada layanan ftp
Mesin pencari lainnya seperti Aliweb, muncul di 1993 dan masih berjalan hingga saat ini. Salah satu
mesin pencari pertama yang sekarang berkembang menjadi usaha komersial yang cukup besar
adalah Lycos, yang dimulai di Carnegie Mellon University sebagai proyek riset pada tahun 1994.
Segera setelah itu, banyak mesin pencari yang bermunculan dan bersaing memperebutkan
layakan-layanan tambahan seperti yang dilakukan oleh Yahoo. Tahun 2002 Yahoo! mengakuisisi
Inktomi, setahun kemudian mengakuisisi AlltheWeb dan Altavista kemudian meluncurkan mesin
pencari sendiri yang didasarkan pada teknologi gabungan dari mesin-mesin pencari yang telah
diakuisisinya serta memberikan layanan yang mengutamakan pencarian Web daripada layanan-
layanan lainnya. Di bulan desember 2003, Orase menerbitkan versi pertama dari teknologi
pencari waktu-riilnya. Mesin ini memiliki banyak fungsi baru dan tingkat unjuk kerja yang jauh lebih
baik. Mesin pencari juga dikenal sebagai target investasi internet yang terjadi pada akhir tahun
1990-an. Beberapa perusahaan mesin pencari yang masuk kedalam pasar saham diketahui
mencatat keuntungan besar. Sebagian lagi sama sekalimenonaktifkan layanan mesin pencari, dan
hanya memasarkannya pada edisi-edisi enterprise saja, contoh Northern Light sebelumnya
Buku Osmar R. Zaïane From Resource Discovery to Knowledge Discovery on the Internet
menjelaskan secara rinci sejarah teknologi mesin pencari sebelum munculnya Google. Mesin-mesin
pencari lainnya mencakup a9.com, AlltheWeb, Ask Jeeves, Clusty, Gigablast, Teoma, Wisenut,
Google muncul pada akhir tahun 1997, di mana Google memasuki pasar yang telah diisi oleh para
pesaing lain dalam penyediaan layanan mesin pencari, seperti Yahoo,Altavista, HotBot, Excite,
yang bergerak dalam bidang layanan pencarian di internet. Hingga akhirnya Google mampu menjadi
sebagai penyedia mesin pencari yang cukup diperhitungkan di dunia. Saat tingginya persaingan
antar mesin pencari yang ada, namun mesin pencari lain tidak mampu menghentikan kesuksesan
Google. Setelah Yahoo mampu pada posisi puncak di sekitar tahun 2000, Google mampu
menerobos liga besar tersebut. sehingga Google dipandang sebagai mesin pencari yang utama
Yahoo!
Yahoo! raja direktori di internet, di samping para pengguna internet melihat DMOZ serta LookSmart
berusaha menurunkan nya dari posisi puncak tersebut. Akhir-akhir ini, telah tumbuh secara cepat
dalam ukurannya, mereka pun sudah memiliki harga sehingga mudah untuk memasukinya, dengan
demikian, mendapatkan sebuah daftar pada direktori Yahoo memang memiliki nilai yang tinggi.
pada tahun 2001, mesin pencari Google berkembang besar. Keberhasilan ini didasarkan pada
bagian konsep dasar dari link popularity dan PageRank. Setiap halaman diurutkan berdasarkan
seberapa banyak situs yang terkait, dari sebuah premis bahwa situs yang diinginkan pasti lebih
Rangking situs (The PageRank)dari sebuah link halaman dan jumlah link dari halaman-halaman
tersebut merupakan masukan bagi Rangking situs yang bersangkutan. Hal ini memungkinkan bagi
Google untuk mengurutkan hasilnya berdasarkan seberapa banyak halaman situs yang menuju ke
halaman yang ditemukannya. User interface Google sangat disukai oleh pengguna, dan hal ini
Manfaat
Mesin pencari merupakan tempat kebanyakan orang mencari sesuatu via internet.Menurut survei
hampir 90% pengguna internet memakai mesin pencari untuk mencari lokasi tertentu di internet. dan
di antara mesin pencari yang ada, google merupakan mesin pencari yang paling banyak digunakan
Cara kerja mesin pencari
Mesin pencari web bekerja dengan cara menyimpan informasi tentang banyak halamanweb, yang
diambil langsung dari WWW. Halaman-halaman ini diambil dengan web crawler — browser web
Saat ini, tiga bentuk dari alat bantu pencarian ini. Menggunakan strategi yang berbeda untuk
Karakteristik:
Menyimpan data dalam bentuk teks penuh pada halaman yang terpilih,Pencarian berdasarkan kata
kunci, mereka mencoba mencocokkan dengan tepat kata kunci tersebut dengan teks yang ada
dalam dokumen, Tidak perlu dilakukan browsing, dan tidak ada subjek dari kategori,Database
dijaring dan dikumpulkan oleh spidr, yaitu komputer yang memiliki program robot, dengan
kemampuan seminimal mungkin dari pandangan atau sentuhan manusia, Ukuran search engine:dari
skala kecil hingga mampu menyimpan sangat banyak (sekitar hingga 20 miliar halaman web).
Contoh : Search engine : Google, Yahoo Search, Ask.com. Meta-Search : Dogpile, Copernic, dan
lainnya.
2.Subject Directories
Karakteristik :
Seleksi dari situs yang ada merupakan seleksi langsung yang dilakukan oleh manusia, kadang kala
para ahli untuk subjek tertentu, Sering dengan hati-hati dievaluasi dan menjaga keterbaruan
informasi yang mereka miliki, namun tidak selalu, kadang-kadang tidak, terutama untuk mereka
yang telah memiliki data yang banyak dan bersifat general, Biasanya dikelola dalam bentuk subjek
dan direktori yang tersusun secara hierarki, Sering dilengkapi dengan catatan mengenai
deskripsinya ( tidak untuk Yahoo),Subjek dapat di-browse subjek dan kategorinya atau melakukan
pencarian berdasarkan kata-kata tertentu, Dokumen yang tidak penuh teks. pencarian diminta lebih
spesifik dibandingkan dengan pencarian melalui mesin pencari, karena kata kunci tidak bisa
dibandingkan dengan isi dari halaman suatu situs, melainkan hanya pada subjek, kategori- kategori,
dan deskripsi.
3.Specialized Databade
Karakteristik :
Merupakan web yang menyediakan akses melalui suatu kotak pencarian ke dalam isi database
pada sebuah komputer di suatu tempat, Dapat saja berubah berbagai topik, dapat pula juga hal
yang komersial, pekerjaan yang spesifik, pemerintahan, dll Juga terdiri dari banyak halaman yang
menghasilkan hasil pencarian dari katalog direktori online. Prinsip Umum Dari mesin pencari Sistem
kinerja mesin ini ada beberapa hal yang perlu di perhatikan terutama keterkaitannya dengan
1. Spider
Merupakan program yang men-download halaman-halaman yang mereka temukan, mirip dengan
browser. Perbedannya adalah bahwa browser menapilkan secara langsung informasi yang ada
(baik tekas, gambar, dll). Untuk kepentingan manusia yang menggunakannya pada saat itu,
sedangkan spider tidak melakukan untuk menampilkan dalam bentuk yang terlihat seperti itu,
karena kepentingannya adalah untuk mesin, bukan untuk manusia, spider pun dijalankan oleh mesin
Merupakan program yang dimiliki search engine untuk melacak dan menemukan link yang terdapat
dari setiap halaman yang ditemuinya. Tugasnya adalah untuk menentukan spoder harus pergi
kemana dan mengevaluasi link berdasarkan alamat yang ditentukan dari awal. Crawler mengikuti
link dan mencoba menemukan dokumen yang belum dikenal oleh search engine.
3. Indexer
Komponen ini melakukan aktivitas untuk menguraikan masing-masing halaman dan meneliti
berbagai unsur, seperti teks, headers, struktur atau fitur dari gaya penulisan, tag HTML khusus, dll.
4. Database
Merupakan tempat standar untuk menyimpan data-data dari halaman yang telah dikunjungi, di-
download dan sudah dianalisis. kadang kala disebut juga dengan index dari suatu search engine.
Mesin yang melakukan penggolongan dan penentuan peringkat dari hasil pencarian pada search
engine. Mesin ini menentukan halaman mana yang menemui kriteria terbaik dari hasil pencarian
berdasarkan permintaan penggunanya, dan bagaimana bentuk penampulan yang akan ditampilkan
Merupakan komponen yang melayani permintaan dan memberikan respon balik dari permintaan
tersebut. Web Server ini biasanya menghasilkan informasi atau dokumen dalam format HTML. Pada
halaman tersebut tersedia layanan untuk mengisikan kata kunci pencarian yang diinginkan oleh
usernya. Web Server ini juga bertanggung jawab dalam menyampaikan hasil pencarian yang
Wiki letter w.svg Bagian ini memerlukan pengembangan dengan : Informasi tentang mesin pencari
nasional seperti StatCounter, Yandex, Naver dan pangsa pasar di negara bersangkutan. Hasil
Perbandingan mesin pencarian di internet Berikut ini adalah beberapa mesin pencari:
Google ( http://www.google.com/ )
Microsoft ( http://www.bing.com/ )
Yahoo ( http://www.yahoo.com/ )
MSN ( http://www.msn.com/ )
Live ( http://www.live.com )
Altavista ( http://www.altavista.com )
AOL ( http://www.aol.com )
Altheweb ( http://www.althweb.com )
Baidu ( http://www.baidu.com )
Looksmart ( http://www.looksmart.com )
Solusee ( http://www.solusee.com )
Secara umum, jenis pencarian pada mesin pencarian/website ada dua yaitu: Basic Search dan
Advanced Search. Basic Search adalah fitur pencarian yang sudah biasa kita gunakan yaitu ketika
berbagai pilihan fitur pencarian baik untuk operator dasar, file format yang ingin kita cari, bahasa,
region, dsb.
Boolean logic adalah suatu pencarian pelacakan yang menyatakan tentang hubungan antara
variabel yang dicari dengan variabel terkait. Boolean logic juga merupakan identifikasi spesifik
tentang artikel yang akan dicari. Boolean logic dikembangkan oleh George Boole (1815-1864),
adalah suatu metode pencarian informasi, yang memfokuskan hasil penelusuran dimana pencarian
FRASE: Mencari informasi yang mengandung frase yang dicari dengan menggunakan tanda “”.
Contoh: “kesehatan reproduksi” SINONIM (~): Mencari kata beserta sinonim-sinonimnya. Contoh di
bawah akan membawa hasil pencarian: bayi baru lahir (infant) dan sinonimnya. Contoh: ~infant
ASTERIK (*): Karakter pengganti kata. Dari contoh di bawah, hasil yang didapat bisa:
ikan bakar pedas, ikan goreng pedas, ikan masak pedas, dsb. Contoh: ikan * pedas TANDA TITIK
(.): Karakter pengganti huruf, angka dan karakter tunggal. Dari contoh di bawah, hasil yang didapat
CASE INSENSITIVE: Pencarian di Google menganggap kapital dan bukan kapital sebagai sesuatu
yang sama. Jadi, kehamilan aterm, Kehamilan Aterm, KEHAMILAN aterm, akan membawa hasil
PENGABAIAN KATA: Google mengabaikan keyword berupa karakter tunggal dan kata-kata
berikut: a, about, an, and, are, as, at, b, by, from, how, i , in, is, it, of, on, or, that, the, this, to, we,
what, when, where, which, with. Apabila kita masih tetap menginginkan pencarian kata tersebut,
bisa dengan menggunakan karakter + di depan kata yang dicari (contoh: Love Rain Episode +I),
atau bisa juga dengan menganggapnya sebagai frase (contoh: “Love Rain Episode I”) I’M FEELING
LUCKY: Akan membawa kita langsung menuju ke hasil pencarian pertama dari query kita.
DEFINE: Mencari definisi dari sebuah terminologi. Dari contoh di bawah, hasil yang didapat adalah
CACHE: Menampilkan situs web yang telah diindeks oleh Google meskipun sudah tidak aktif lagi.
Contoh di bawah akan menghasilkan pencarian kata php pada situs bidanku.com yang ada di
LINK: Menampilkan daftar link yang mengarah ke sebuah situs. Contoh di bawah akan
link:bidanku.com
RELATED: Menampilkan daftar situs yang serupa, mirip atau memiliki hubungan dengan suatu
info:oshigita.wordpress.com
SITE: Menampilkan pencarian khusus di suatu situs yang ditunjuk. Contoh: java site:bidanku.com
FILETYPE: Menampilkan hasil pencarian berupa suatu jenis (ekstensi) file tertentu.Jenis file yang
bisa dicari adalah: doc, xls, rtf, swf, ps, lwp, wri, ppt, pdf, mdb, txt, dsb. Contoh di bawah akan
menampilkan hasil pencarian berupafile PDF yang mengandung keyword preeklamsi berat. Contoh:
preeklamsi berat filetype:pdf
ALLINTITLE: Menampilkan seluruh kata yang dicari dalam TITLE halaman. Contoh di bawah akan
menghasilkan halaman yang memiliki title mola hidatidosa. Allintitle ini tidak dapat digabungkan
menghasilkan halaman yang memiliki title kehamilan dan isi halaman yang mengandung kata
ALLINURL: Menampilkan seluruh kata yang dicari di dalam URL. Contoh di bawah akan
menghasilkan daftar URL yang mengandung kata imunisasi dan bayi. Allinurl ini tidak dapat
digabungkan dengan operator (sintaks) lain. Gunakan inurl untuk keperluan itu. Contoh:
allinurl:imunisasi bayi
INURL: Menampilkan satu kata yang dicari di dalam URL. Contoh di bawah akan menghasilkan
daftar URL yang mengandung kata kontrasepsi dan isi halaman yang mengandung kata hormonal.
Contoh: inurl:kontrasepsi hormonal Boolean logic terdiri dari operasi logika AND, OR dan NOT.
AND : Mencari informasi yang mengandung kedua kata yang dicari. Bisa menggunakan salah satu
dari tiga alternatif berikut. Contoh: kehamilan gemelli , kehamilan AND gemeli, kehamilan+gemelli
OR : Mencari informasi yang mengandung salah satu dari kedua kata. Bisa menggunakan salah
NOT : Hasil pencarian mengandung kata yang di depan, tapi tidak yang dibelakang minus (-).
Contoh di bawah akan mencari informasi yang mengandung kata kontrasepsi tapi bukan suntik.
Search engine Google mempunyai fasilitas Penelusuran Lanjutan, dengan menggunakan fasilitas
google penelusuran lanjutan, maka memudahkan kita untuk memperoleh informasi yang diinginkan.
Misalnya, saya hanya ingin google menampilkan link website yang ada file pdfnya, atau file word
saja, dan lain lain. Ingin yang berbahasa indonesia atau inggris saja, dan masih ada beberapa