Makalah Tilda Kel 4
Makalah Tilda Kel 4
BROWSING
KELOMPOK IV
ANGGOTA:
MUHAMMAD FADHIL NASUTION (4193111012)
NURMALINDA (4191111032)
LOISMA DAELI (4192411031)
Search engine (mesin pencari/pelacak/penelusur) adalah salah satu program komputer yang
dirancang khusus untuk membantu seseorang menemukan file-file yang disimpan dalam
komputer, misalnya dalam sebuah web server umum di web (www) atau komputer sendiri.
Mesin pencari memungkinkan kita untuk meminta content media dengan kriteria yang spesifik
(biasanya berisikan frase atau kata yang kita inginkan) dan memperoleh daftar file yang
memenuhi kriteria tersebut. Mesin pencari biasanya menggunakan indeks (yang sudah dibuat
sebelumnya dan dimutakhirkan secara teratur) untuk mencari file setelah pengguna memasukan
kriteria pencarian.
Mesin pencari yang akan dibahas adalah mesin pencari khusus yang digunakan untuk mencari
informasi dan berbagai file di Internet, sehingga mesin pencari sangat berguna bagi para
penggunanya untuk mencari berbagai bahan referensi atau lainnya.
Untuk memudahkan pencarian di database yang begitu besar, mesin pencari menggunakan
indeks untuk memilah-milah informasi yang ada di database. Sedangkan untuk memudahkan dan
mempercepat pencarian, mesin pencari mempunyai metode pencarian tertentu yang sering di
sebut algoritma pencarian, kecepatan dan ketepatan pencarian sebuah mesin pencarian
tergantung kepada cara pengindeksan dan algoritma pencarian yang digunakan.
Secara prinsip, tujuan dari sebuah program searching engine adalah menemukan dokumen atau
arsip elektronis di internet yang sesuai dengan kebutuhan atau permintaan pengguna dalam
waktu yang sesingkat-singkatnya. Kedua hal inilah, yaitu kualitas hasil temuan dan waktu
pencarian, yang kemudian menjadi pengukur baik tidaknya kinerja sebuah searching engine.
B. Komponen Search Engine
1. Query Interface
Query interface adalah komponen penting pertama yang merupakan bentuk tampilan atau format
situs yang menyediakan fasilitas searching engine. Bentuk yang paling sederhana adalah
tersedianya sebuah kotak kosong di situs dimana user dapat menuliskan data atau informasi yang
ingin dicari (lihat situs Yahoo.com atau Altavista.com). Yang harus diketahui oleh user adalah
bahwa tidak semua situs memiliki kemampuan yang sama dalam membantu user untuk
mengekspresikan jenis data atau informasi yang ingin dicari. Dalam bahasa komputer cara
mengekspresikan ini disebut sebagai query. Contohnya adalah seseorang yang ingin mencari data
atau informasi mengenai hal-hal yang berkaitan dengan kesehatan ibu dan anak, dapat
menggunakan query semacam: “kesehatan” and “ibu” and “anak”.
Walaupun secara internasional telah diusulkan dan ditentukan standar baku dalam menuliskan
sebuah query, namun terlihat bahwa masing-masing situs menawarkan beragam cara yang
berbeda. Yang utama bagi user adalah bahwa Query Interface yang ditawarkan mudah
dipergunakan dan efektif.
2. Query Engine
Komponen kedua adalah Query Engine, merupakan sebuah program yang bertugas untuk
menterjemahkan keinginan user ke dalam bahasa yang dimengerti oleh mesin komputer. Secara
teknis, perusahaan-perusahaan penyedia searching engine berlomba-lomba membuat query
engine yang baik sehingga selain tepat dalam mengekspresikan keinginan user, dapat pula
melakukan tugas pencarian secara cepat. Query Engine ini pulalah yang segera melakukan
pencarian arsip dan dokumen yang tepat di dalam sistem basis data (database) yang
bersangkutan.
3. Database
Database pada dasarnya merupakan kumpulan atau daftar dari dokumen maupun arsip dari
seluruh situs yang ada di internet. Semakin besar skala internet, akan semakin besar pula
kapasitas penyimpan yang dibutuhkan.
4. Spider
Spider merupakan komponen terpenting dalam sebuah searching engine. Secara berkala dan
kontinyu, spider akan mendata setiap situs yang ada di internet, baik yang baru maupun yang
lama. Terhadap masing-masing situs, selain alamatnya, akan diambil kata-kata kunci dari arsip
maupun dokumen yang ditemukan. Katakanlah dari situs Bidanku.com akan diambil setiap kata
pada kalimat judul artikel, disinilah sebenarnya persaingan antara situs terjadi, yaitu strategi dan
teknik apa yang dipergunakan dalam melakukan sampling terhadap kata-kata yang akan menjadi
kunci dalam pencarian arsip dan dokumen. Harap diingat bahwa tidak semua situs melakukan
proses updating dan sampling ini secara kontinyu (24 jam sehari), yang dapat menyebabkan telah
hilangnya beberapa arsip dan dokumen dari internet saat user mencarinya.
5. Indexer
Indexer merupakan sebuah program untuk mempercepat proses pencarian. Filosofi yang
dipergunakan mirip dengan prinsip penggunaan indeks pada kamus atau buku-buku. Perang antar
situs pun terjadi di sini, karena teknik melakukan indeks akan sangat berpengaruh terhadap
kecepatan pencarian data atau informasi. Biasanya yang terjadi di sini adalah adu algoritma (alur
logika sebuah program) antar para programmer yang direkrut oleh masing-masing perusahaan.
1. Kotak teks pencari, kotak ini digunakan sebagai tempat memasukan kata kunci yang
akan dijadikan acuan dilakukan pencarian.
2. Tombol pencari, tombol ini yang akan menjalankan perintah pencarian.
Mesin pencari yang dikelola sepenuhnya oleh tangan manusia. Mesin pencari ini menggunakan
metode dengan memilah-milih informasi yang relevan dan dikelompokan sedemikian rupa
sehingga lebih bermakna dan bermanfaaat bagi penggunannya. Situs ini dalam prakteknya
memperkerjakan para pakar dalam bidang-bidang tertentu, kemudian para pakar tersebut dapat
mengkelompokan situs-situs tertentu sesuai dengan bidangnnya atau kategori situs itu sendiri.
Search engine kategori ini banyak memiliki kelebihan karena banyak menyajikan inforrmasi
walaupun kadang-kadang ada beberapa informasi yang tidak relevan tidak seperti yang kita
inginkan. Search engine ini telah menggunakan software laba-laba atau spider software yang
berfungsi menyusup pada situs-situs tertentu, kemudian mengumpulkan data serta
mengelompokan dengan sedikit bantuan tangan manusia.
Merupakan gabungan antara tangan manusia dengan computer, sehingga menghasilkan hasil
pencarian yang relative akurat. Peran manusia dalam hal ini adalah sebagai penelaah dalam
proses pengkoleksian database halaman web. Sebenarnya tipe ini lah yang paling mudah
pembuatannya karena dapat didesain sesuai dengan keinginan kita.
Contoh: Google (www.google.com), Lycos (www.lycos.com), AltaVista (www.altavista.com),
HotBot (www.hotbot.com), Go To (www.goto.com), Snap (www.snap.com), Direct Hit
(www.directhit.com), Go (go.com).
4. MetaCrawler/Metasearch
Merupakan perantara dari mesin pencari yang sebenarnya. Mesin ini hanya akan mengirimkan
permintaan pencarian ke berbagai mesin pencari serta menampilkan hasilnya satu di layer
browser sehingga akan menampilkan banyak sekali hasil dari ber bagai mesin pencari yang ada.
Mesin pencari yang cukup populer, yaitu: Google, Yahoo!, Alltheweb, MSN, AskJeeves,
AltaVista, dan Lycos. Mesin pencari orang: Infospace, Spock, Yellowpages.com,
Zabasearch.com, Zoominfo. Mesin pencari visual: Grokker, Kartoo, Avintura. Mesin pencari
multimedia: Blinkx, Find sounds, Pic search, Podscope, Youtube.
Program Search Engine dalam menjalankan fungsinya sebenarnya bekerja bersamaan dengan
Browser. Ketika kita mengetikkan sesuatu lalu Enter, Search Engine-lah yang bekerja
melakukan pencarian di database. Hasil yang didapat diberikan kembali ke Browser, lalu
Browser menampilkannya untuk kita dalam format yang mudah kita mengerti. Sebenarnya
Search Engine tidak tampak, ia bekerja di balik layar. Search Engine juga sebenarnya bekerja
dengan teman-temannya yaitu crawler atau indexer atau robot atau bot.
Sederhananya, proses yang berlangsung adalah: saat user membuka Browser, dan
memerintahkan pencarian, maka browser minta tolong Search Engine untuk mencarikan. Jika
sudah didapat, hasilnya dikembalikan ke Browser dan Browser menampilkannya untuk user.
Semuanya berlangsung sangat cepat sehingga kita tidak mengetahui proses sesungguhnya yang
terjadi.
Mesin pencari web bekerja dengan cara menyimpan informasi tentang banyak halaman web,
yang diambil secara langsung dari www. Halaman ini di ambil dengan web crawler-browser web
yang otomatis mengikuti setiap pranala yang dilihatnya. Isi setiap halaman lalu dianalisis untuk
menentukan cara mengindeksnya (misalnya kata-kata di ambil dari judul, subjudul, atau field
khusus yang di sebut meta tag). Data tentang halaman web disimpan dalam sebuah database
indeks untuk digunakan dalam pencarian selanjutnya.
Sebagian mesin pencari seperti Google, menyimpan seluruh atau sebagian halaman sumber
(yang disebut cache) maupun informasi tentang halaman web itu sendiri. Ketika seorang
pengguna menggunakan mesin pencari dan memasukan query, biasanya dengan memasukan kata
kunci, mesin mencari akan mengindeks dan memberikan daftar halaman web yang paling sesuai
dengan kriterianya. Daftar ini biasanya disertai ringkasan singkat menggenai judul dokumen dan
terkadang sebagian teks dari hasil pencarian yang kita cari.
Sangat banyak hasil data yang akan di munculkan oleh mesin pencari ketika pengguna
mengetikan sebuah kata kunci, urutan yang ada di paling atas atau halaman pertamalah yang
mempunyai isi paling akurat. Keakuratan sebuah mesin pencari dalam menyajikan data dan
informasi yang dicari oleh pengguna dapat menjadi tolak ukur kualitas sebuah mesin pencari.
Semakin tinggi keakuratan data yang disajikan maka semakin baik mesin pencarian tersebut.
Untuk mencari sebuah informasi pada sebuah laman web, juga bisa dituliskan pada query web
yang telah kita buka.
Secara umum, cara kerja mesin pencarian dimulai saat user menulis alamat website (URL). Saat
alamat web terisi, maka spider dari search engine akan menerima dan menganalisa URL. Secara
otomatis spider memutuskan web yang didaftar layak diterima atau tidak. Jika layak, maka
spider langsung menambahkan alamat URL tersebut ke sistem database. Rangking segera
ditetapkan dengan algoritma dan caranya masing-masing. Jika tidak layak maka users terpaksa
bersabar dan mengulangi pendaftaran diwaktu yang lain.
E. Mesin Pencarian Google
Selain pencarian web, Google juga menyediakan jasa pencarian gambar, pencarian berita serta
pencarian pada arsip USENET (newsgroup), serta direktori, seperti Yahoo! Kelemahannya
terletak pada tidak tersedianya pencarian file, video, dan audio. Keunggulan Google terutama
adalah pada pencarian teks, terutama dari algoritma PageRank, database-nya yang besar serta
banyaknya jenis file yang diindeksnya.
Kelebihan:
Kekurangan:
Dengan kelebihan yang dimilikinya, ternyata mesin pencari ini jadi bidikan para spamer untuk
menampilkan iklan-iklan yang tidak diperlukan. Mereka memanfaatkan setiap celah yang ada
pada sistem algoritma Google untuk memaksa iklan mereka tampil pada halaman terdepan.
Maka, pencarian pun terasa tergangggu.
Secara umum, jenis pencarian pada mesin pencarian/website ada dua yaitu: Basic
Search dan Advanced Search. Basic Search adalah fitur pencarian yang sudah biasa kita gunakan
yaitu ketika mengakses langsung, missal pada google.com. Sedangkan Advanced
Search menyediakan berbagai pilihan fitur pencarian baik untuk operator dasar, file format yang
ingin kita cari, bahasa, region, dsb.
Sebenarnya masih sangat banyak fitur pencarian yang bisa kita gunakan, tapi tidak terdapat di
menu pilihan Advanced Search. Dengan kata lain kita harus memasukannya query di form
pencarian di Basic Search langsung. Di bawah ini akan disajikan permainan query dan operator
pencarian.
G. Boolean Logic
Boolean logic adalah suatu pencarian pelacakan yang menyatakan tentang hubungan antara
variabel yang dicari dengan variabel terkait. Boolean logic juga merupakan identifikasi spesifik
tentang artikel yang akan dicari. Boolean logic dikembangkan oleh George Boole (1815-1864),
adalah suatu metode pencarian informasi, yang memfokuskan hasil penelusuran dimana
pencarian datanya menggunakan kata kunci.
Boolean logic terdiri dari operasi logika AND, OR dan NOT. Pada fitur pencarian Google,
operasi ini merupakan bagian dari fitur pencarian dasar. Penggunaan operasi logika ini dapat
memudahkan user dalam mendapatkan informasi yang diinginkan. Boolean logic merupakan
operasi logika yang digunakan untuk mendapatkan informasi di PubMed (NCBI).
1. AND: Mencari informasi yang mengandung kedua kata yang dicari. Bisa menggunakan
salah satu dari tiga alternatif berikut. Contoh: kehamilan gemelli , kehamilan AND gemeli,
kehamilan+gemelli
2. OR: Mencari informasi yang mengandung salah satu dari kedua kata. Bisa menggunakan
salah satu dari dua alternatif berikut. Contoh: kembar OR gemelli, kembar | gemelli
3. NOT: Hasil pencarian mengandung kata yang di depan, tapi tidak yang dibelakang minus
(-). Contoh di bawah akan mencari informasi yang mengandung kata kontrasepsi tapi bukan
suntik. Contoh: kontrasepsi –suntik.
Pencarian yang kita lakukan akan semakin efektif apabila kita mencoba menggabungkan
beberapa operator baik yang ada di fitur pencarian dasar, pencarian lanjut, maupun Boolean
logic. Misalnya, kita ingin mencari file PDF tentang kehamilan ektopik (ectopic pregnancy)
yang ada di situs www.ncbi.nlm.nih.gov. Maka kita gabungkan tiga operator menjadi; Contoh:
ectopic AND pregnancy filetype:pdf site:www.ncbi.nlm.nih.gov.