Secara umum cara kerja setiap mesin pencari dibagi ke dalam 3 tahapan:
1. Crawling (Penelusuran/Penjelajahan).
Pada tahap ini search engine menjelajahi trilliunan halaman dan dokumen yang ada pada
world wide web (www). Search engine selalu memulai penelusuran data-data dari website
yang paling terpercaya dan berkualitas tinggi. Dari website-website yang terpercaya, Google
akan menemukan link-link ke website lain. Dari website-website ini ke beberapa yang lain
lagi. Sehingga itu disebut world wide web. Yang menelusuri website-website untuk mencari
bentuknya menjadi seperti jaring laba-laba yang bercabang kemana-mana. Oleh karena
dokumen dinamakan spider atau crawler. Crawler menjelajahi world wide web dengan
menelusuri semua link dalam satu website ke page lain atau ke website lain dan datanya
dimasukkan ke dalam index.
2. Indexing (pengindeksan)
Setelah melakukan proses crawler dalam melakukan penjelajahan pada jutaan halaman
yang ada di web, mesin pencarian akan mengubahnya menjadi sebuah struktur data yang
biasa disebut dengan index. Indeks ini adalah daftar raksasa semua halaman web dan konten
yang ditemukan oleh bot. Index atau indexing dapat dipahami sebagai proses untuk
menemukan URL secara bersamaan dengan sebuah angka yang relevan sesuai bentuk sinyal
yang diberikan.
Sinyal yang digunakan pada proses index terdiri dari empat jenis yaitu, jenis pertama
adalah kata kunci atau biasa disebut dengan keywords. Kata kunci yang ditemukan di dalam
sebuah halaman konten web dapat ditemukan berdasarkan pembahasan dari topik pada
halaman tersebut.
Selanjutnya, jenis yang kedua adalah tipe konten yang pernah dilakukan penjelajahan
dengan menggunakan Schema microdata dan informasi yang masuk ke dalam halaman
tersebut. Sementara, jenis yang ketiga merupakan kebaruan dari halaman tersebut atau waktu
terakhir dilakukan update. Dokumen dan halaman yang telah ditelusuri pada proses crawling
akan dimasukkan ke dalam list database milik search engine. Mesin pencari menggunakan
indeks ini sebagai sumber informasi yang ditampilkan pada laman hasil penelusuran.
Terakhir, pada jenis keempat yakni kapan terakhir kali halaman tersebut dikunjungi oleh
pengguna atau bagaimana proses interaksi pengguna lain dengan menggunakan halaman web.
Pengguna dapat memilih hasil manakah yang paling relevan dari web yang di index untuk
kemudian nantinya mempengaruhi pencarian berikutnya.Tapi, tidak semuanya bot
menemukan membuatnya ke dalam indeks mesin pencari. Dokumen yang relevan akan
dipilih dari database tersebut. Setiap ada orang mencari sesuatu di search engine, hanya data
dari website yang ada di index search engine tersebutlah yang akan ditampilkan sebagai
search result nanti.
Berikut ini adalah alasan dari beberapa kasus yang dapat membuat sebuah URL tidak
masuk index dari search engine, di antaranya adalah:
Adanya robots.txt yang menginformasikan kepada mesin pencari agar tidak melakukan
kunjungan pada laman tersebut.
Tidak adanya tag index dapat membuat search engine supaya tidak melakukan indexing
pada web tersebut atau halaman yang mirip.
Mesin pencarian memberikan pengkategorian pada laman tersebut dikarenakan memiliki
kualitas yang rendah atau memiliki konten yang kurang atau bahkan konten duplikasi.
Munculnya error pada URL.
Tapi ternyata ada ratusan ribu, bahkan hingga jutaan dokumen & data yang dapat dibilang
relevan dalam index ini. Caranya adalah dengan melakukan ranking.
3. Ranking (peringkat)
Cara mesin pencari dalam melakukan peringkat halaman adalah rahasia, dan mempunyai
cara tersendiri. “Ada ratusan cara mesin pencari menentukan peringkat, termasuk hal-hal
seperti kata-kata di halaman, jumlah situs-situs lain yang menghubungkan ke sana, dan
konten terbaru. Tujuannya adalah untuk mencoba untuk menghubungkan pencari dengan apa
yang mereka cari. Ketika menggunakan search engine, laman yang menjadi peringkat teratas
merupakan hasil pencarian yang paling relevan. Hal itu sama halnya bahwa search engine
percaya bahwa web atau laman tersebut berkaitan dengan kata kunci. Dalam melakukan
pengaturan relevansi, mesin pencarian mengandalkan sebuah sistem algoritma.
Dalam perkembangannya, hampir setiap tahun sebuah algoritma mengalami banyak
perubahan yang disesuaikan dan didasarkan pada apa yang didapatkan selama ini. Sebagai
contoh, saat ini, setiap hari Google melakukan pembaharuan pada sistem algoritmanya.
Pada setiap algoritma yang diatur dan digunakan dilakukan guna memperkecil potensi
masalah. Contoh yang paling mudah dilihat adalah penciptaan Penguin untuk mengatasi
spam. Algoritma telah berkembang dan akan selalu diikuti oleh para pengguna mesin pencari
untuk memaksimalkan dan mengoptimalkan tujuan bisnis mereka.
Langkah-langkah untuk mengaktifkan dan menggunakan search engine dicontohkan pada
google sebagai berikut:
1. Buka browser dan ketikkan www.google.com
2. Pada kolom isian yang ada ketikan kata kunci informasi yang ingin dicari
3. Tekan Enter atau klik tombol Google Search
4. Search engine akan menampilkan maksimal 10 link situs web yang berkaitan dengan kata
kunci per halaman
5. Pilih link yang tepat dengan menggerakkan pointer mouse pada halaman web
6. Apabila pointer mouse berubah menjadi gambar tangan pada teks atau gambar tertentu,
menandakan bahwa teks atau gambar tersebut merupakan link, dan jika di-klik link
tersebut maka halaman akan berganti dengan link yang terpilih
7. Apakah halaman web yang terbuka menyajikan informasi yang dicari, maka halaman
tersebut dapat disimpan. Tetapi apabila halaman web yang terbuka tidak menyajikan
informasi yang dicari maka dapat dicari kembali kehalaman sebelumnya dengan meng-
klik tombol Back.
A
A : Kata Kunci Pencarian. Bagian ini menampilkan kata kunci pencarian yang kita
masukkan.
B : Statistik pencarian. Bagian ini menampilkan data-data pencarian yang kita lakukan.
Data-data tersebut mencakup jumlah dokumen yang ditemukan, kata kunci pencarian dan
lamanya waktu pencarian dilakukan.
C : Teks Link Pencarian Canggih. Bagian ini merupakan teks link ke halaman pencarian
canggih.
D : Judul Halaman. Bagian ini menampilkan judul halaman dokumen yang kita temukan.
Kadang-kadang yang muncul hanya alamat URL dari sebuah dokumen bukan judulnya.
Ini berarti dokumen tersebut tidak mempunyai judul.
E : Teks di Bawah Judul. Menampilkan ringkasan isi halaman. Bagian yang ditebalkan
merupakan bagian yang dokumen yang sama dengan kata kunci pencarian yang kita
masukkan.
F : Teks Link Tersimpan. Bagian ini menampilkan teks link ke salinan halaman web yang
diperoleh pada saat mesin pencarian melakukan indeks. Jika kita gagal membuka halaman
web yang ditemukan karena satu dan dua hal, kita dapat mengklik bagian ini untuk
menampilkan halaman web versi saliannya yang disimpan di server Google.
G : Halaman Serupa. Bagian yang menampilkan halaman yang serupa atau mirip dengan
dokumen yang ditemukan. Jika bagian ini kita klik, kita akan langsung dipandu ke
dokumen-dokumen yang bersesuaian dengan halaman web yang ditemukan dari hasil
pencarian.
H : Alamat URL. Bagian ini menampilkan alamat URL dari dokumen hasil pencarian.
Soal PG
1. Aktivitas yang kita lakukan untuk mengunjungi alamat – alamat website yang ada di internet
dengan memanfaatkan layanan WWW disebut Browsing atau istilah lainnya...
a. Browning c. Chatting
b. Surfing d. Web Browser
2. Suatu bahasa yang menggunakan tanda – tanda tertentu untuk menyatakan kode – kode
yang harus ditafsirkan oleh browser agar halaman tersebut dapat ditampilkan secara
benar adalah...
a. URL c. WWW
b. HTTP d. HTML
3. Berikut merupakan alamat website yang ada di internet :
1. google.com 3. msn.com 5. search.com
2. facebook.com 4. lycos.com 6. ziddu.com
Dari contoh alamat website diatas manakah yang termasuk alamat website mesin
pencari ...
a. 1, 2, 3, 4, dan 5 c. 1, 3, 4, dan 5
b. 1, 2, 4, 5, dan 6 d. semua benar
4. Alamat suatu file di internet yang disebut URL merupakan singkatan dari ....
a. Uniform Resource Location c. Uniform Resource Locator
b. Universal Resource Location d. Universal Resource Locator
5. Nama domain yang bereksitensi local di negara Indonesia yang dipakai untuk lembaga
pendidikan, yaitu...
a. .go.id c. .co.id
b. .ac.id d. .or.id
DAFTAR PUSTAKA
https://idcloudhost.com/mengenal-cara-kerja-mesin-pencari-google/
https://www.gramedia.com/literasi/pengertian-search-engine/
https://webdev-id.com/berita/pengertian-search-engine-dan-cara-kerjanya/
https://www.smpn1payakumbuh.sch.id/artikel/detail/119601/5-macam-macam-search-
engine/
http://eprints.ubhara.ac.id/911/5/bab_3_1514321016.pdf
https://idcloudhost.com/unsur-unsur-penting-dalam-membuat-website/