Anda di halaman 1dari 1

Fase I (pembangunan indeks sementara)

Baca seluruh teks dari dokumen Untuk setiap dokumen yang dibaca: Lakukan tokenisasi atau ekstraksi term dari teks dokumen Hitung frekuensi setiap term dalam dokumen Untuk setiap term yang didapat, masukkan ke tabel indeks sementara (term, ID dokumen, frekuensi term) Selesai, indeks sementara terbentuk Fase II (pembangunan indeks)

Baca seluruh term unik dari tabel indeks sementara Untuk setiap term: Baca daftar ID dokumen yang mengandung term tersebut (dari tabel indeks sementara) Selain ID, baca frekuensi term dalam dokumen dan jumlah dokumen yang mengandung term Gabungkan daftar ID dokumen dengan koma, inilah posting_list Gabungkan daftar frekuensi term dengan koma, inilah freq_list Masukkan dalam tabel indeks yang sesungguhnya (term, jumlah dokumen, ID dokumen, frekuensi term) Selesai, indeks terbentuk Hapus tabel indeks sementara

Anda mungkin juga menyukai