Semantic Indexing”
Kelompok 4
Model TBI “Latent Semantic Indexing”
Penyusun :
Ana Rofiqoh
Ahmad Yahya Asy-Syidqie
Dodi Taruna Baskara
Fadhel Widya Rakhman
Rizky Arif Fauzi
Rezha
Apa itu model Latent Semantic Indexing
Latent Semantic Indexing (LSI) adalah salah satu model temu balik informasi
yang mampu memecahkan macalah sinomim dengan menggunakan Singular
Value Decomposition (SVD) pada sebuah term dengan menggunakan matrik
frekuensi term dari dokumen. Dimensi transformasi ruang direduce dengan
cara memilih nilai singular (singular value). Di dalam IR system, model ini
bekerja dengan mencari dan menemukan informasi berdasarkan makna
keseluruhan (conceptual topic atau meaning) dari sebuah dokumen bukan
hanya makna kata per kata.
CONTOH BENTUK IMPLEMENTASI
Pada umumnya, dokumen dikatakan relevan dengan query apabila dokumen:
a. Memuat kata atau kalimat yang sama dengan query atau
b. Memuat kata atau kalimat yang bermakna sama dengan query
Sebagai contoh, terdapat query satu kata yaitu “sulit”. Pada point 1,
informasi yang memuat kata “susah” atau “sukar” dinilai tidak relevan karena
informasi yang relevan adalah informasi yang memuat kata “sulit”. Sedangkan
pada point 2, informasi yang memuat kata “susah” atau “sukar” dinilai
relevan karena “susah” atau “sukar” bermakna sama dengan “sulit”.
CONTOH BENTUK IMPLEMENTASI
Makna kata dapat ditinjau dari dua istilah, yaitu sinonim dan polisemi.
Sinonim adalah istilah untuk kata yang bermakna sama. Contoh, kata “sulit”
merupakan sinonim untuk “sukar” karena “sulit” dan “sukar” bermakna sama.
Sedangkan polisemi adalah istilah untuk kata yang sama namun maknanya
berbeda. Contoh, kata “membajak” dalam “membajak sawah” dan
“membajak VCD” merupakan polisemi karena kata “membajak” di kedua
frase sama namun mempunyai arti yang berbeda
ALUR METODE LATENT SEMANTIC
INDEXING SECARA UMUM
Alur proses dari metode Latent Semantic Indexing dibagi 2
(dua) kolom, yaitu kolom sebelah kanan kanan yaitu, koleksi
dokumen dan kolom sebelah kiri yaitu query.
Query : apple
KELEBIHAN DARI PENGINDEKSAN
SEMANTIK LATENT
Biasanya pada sejumlah besar kata memiliki beberapa arti atau makna. Jadi,
jika pencari menggunakan banyak kata-kata atau kalimatnya panjang, mereka
dapat mengurangi kemungkinan mendapatkan informasi yang tepat dengan
kebutuhan. Tetapi dengan LSI membantu dalam penyaringan kata-kata yang
tidak perlu dari data dan mencoba untuk sampai pada makna rata-rata
(sesuai), mendekati arti sesungguhnya dari permintaan pencarian.
TUJUAN LATENT SEMANTIC INDEXING
Tujuan dari LSI adalah mendapatkan suatu pemodelan yang efektif untuk
merepresentasikan hubungan antara kata kunci dan dokumen yang dicari. Dari
sekumpulan kata kunci, yang tadinya tidak lengkap dan tidak sesuai, menjadi
sekumpulan objek yang berhubungan.
SELESAI
Terimakasih