Term D1 d2 d3 d4 d5
dari 20 100 10 22 10
database 15 0 0 0 12
Dengan 8 30 0 0 28
Komputer 10 35 0 22 1
Informasi 10 20 10 11 20
Document Frequency (df)
Banyaknya dokumen di dalam koleksi yang
mengandung kata tertentu
Inverse Document Frequency (idf)
Banyaknya dokumen dimana suatu term t muncul :
Bobot tf.idf
Boolean
Contoh Kasus N = 1000
hitung bobot tf.idf normal
Pemodelan IR
Boolean Model
Exact match, pencocokan secara tepat sama
Query berbentuk ekspresi boolean
Dokumen bisa cocok atau tidak cocok dengan
query yang diberikan
Hasilnya berupa sekumpulan dokumen yang cocok
Tidak ada peringkat dokumen sesuai dengan query
yang diberikan
Boolean Model
Query q terdiri dari kata, frase, atau konsep yang
dihubungkan dengan operator Boolean AND, OR,
atau NOT
Contoh
d1 And the angels, all pallid and wan,
d2 Uprising, unveiling, affirm
d3 That the play is the tragedy, “Man,”
d4 Angel and its hero the Conqueror Worm