Anda di halaman 1dari 3

Nama : M.

Diky Alhafizh

NIM : 19082025

Matkul : IR

1. Information Retrieval Systems adalah Suatu sistem yang mampu menyimpan, menemukan
kembali sebuah informasi, informasi tersebut terdiri atas teks, yang mencangkup angka-angka
dan data tanggal, gambaran, audio, video, dan objek multimedia lainnya
Cara Kerja :
1. Proses Crawling
Crawling adalah suatu pekerjaan yang dilakukan oleh googlebot (biasa dikenal juga dengan
istilah robot, atau spider bisa di sebut juga crawler) dalam menjelajahi halaman-halaman
website untuk di indeks pada google server.
Googlebot terdiri dari set komputer yang berjumlah besar yang memang difungsikan untuk
meng-crawling website-website. Dalam melakukan tugasnya, googlebot menggunakan suatu
algoritma komputer dalam menentukan situs apa saja yang akan di crawling, seberapa
sering, dan berapa banyak halaman yang akan di indeks.
Proses crawling dalam suatu website dimulai dari mendata seluruh url dari website,
menelusurinya satu-persatu, kemudian memasukkannya dalam daftar halaman pada google
indeks, sehingga setiap kali ada perubahan pada website, akan terupdate secara otomatis.
2. Proses indexing
Indexing adalah proses pengumpulan kata-kata atau kalimat pada suatu halaman web oleh
googlebot yang telah ter-crawling sebelumnya. Dalam prosesnya, konten inilah yang
digunakan oleh google sebagai sumber pencarian untuk selanjutnya ditampilkan sebagai
hasil pencarian berdasarkan kata kunci (keywords) yang kita cari.
Namun perlu diingat bahwa tidak semua konten dapat diproses oleh googlebot ini.
Umumnya konten tersebut adalah link url, judul, tag, nama file, tipe file, isi halaman (tidak
semua) dan beberapa informasi halaman lainnya.
3. Proses surving
Surving adalah suatu proses dalam menampilkan suatu halaman tertentu merujuk kepada
kata kunci yang dimasukkan oleh pengguna. Keterhubungan antara bagaimana hasil akan
ditampilkan dengan kata kunci ditentukan oleh kurang lebih 200 faktor.
Salah satu faktor penentu yang terkenal yang digunakan untuk menampilkan hasil pencarian
adalah page rank. Dengan page rank, suatu halaman ditampilkan sesuai dengan urutan
dengan cara “halaman yang terbanyak di akses ditampilkan pertama“.
Ketiga proses tersebut di atas dilakukan dalam waktu yang sangat cepat dan disajikan
kepada pengguna ditambah dengan penjelasan jumlah penemuan dll.
2. Membentuk kelas-kelas dokumen sehingga mempermudah penjelajahan dan pemberian
interpretasi terhadap hasil penelusuran.
Meningkatkan efektivitas dan efisiensi temu kembali informasi dan memberikan alternatif
metode penelusuran.
Membantu melokalisir dokumen yang relevan.
Perusahaan bisa mendapatkan informasi manajerial seputar bidang perusahaan guna
menunjang kinerja karyawan untuk lebih profesional dan untuk pengembangan perusahaan.
Mempercepat pemrosesan query dengan menelusuri hanya pada sejumlah kecil anggota atau
wakil gugus, sehingga dapat mempercepat proses temu kembali informasi.
IR merupakan sumber informasi yang mungkin bisa bermanfaat untuk perusahaan sebagai
bahan untuk pengembangan dan bahan untuk merancang strategi perusahaan.
3. Incidentce matrix

terms Doc-1 Doc-2 Doc-3 Doc-4 Doc-5


Tutorial 1 0 0 0 0
Pemrograman 1 0 0 0 0
Web 1 0 0 0 0
Dan 1 0 0 0 0
Basis 1 1 1 0 0
Data 1 1 1 0 0
Mata 0 1 0 0 1
Kuliah 0 1 0 1 1
Mysql 0 1 1 0 0
Adalah 0 0 1 0 0
Sistem 0 0 0 1 0
Temu 0 0 0 1 0
Kembali 0 0 0 1 0
Informasi 0 0 0 1 0
Di 0 0 0 0 1
Teknik 0 0 0 0 1
Informatika 0 0 0 0 1

Cari hasil Boolean query retrieval berikut :


Mata and Kuliah and Not mysql
Tf biner mata 01001
Tf biner kuliah 01011
Tf biner mysql 01100
Mata and Kuliah and Not mysql
01001 and 01011 and not 01100
01001 and 01011 and 10011
01001
01011
10011
00001
0 0 0 0 1
Doc-1 Doc-2 Doc-3 Doc-4 Doc-5
jawaban hasil Boolean Query Retrieval : (mata and kuliah)and (not mysql) adalah dokumen ke-5
4. Doc-1: Tutorial pemrograman web dan basis data
Doc-2: Mata Kuliah basis data mysql
Doc-3: Mysql adalah basis data
Doc-4: Kuliah sistem temu kembali informasi
Doc-5: Mata Kuliah di Teknik informatika
Query = Matakuliah Basis Data ada di Teknik Informatika

Anda mungkin juga menyukai