Levenshtein
Distance
Natural Language Processing
Pertemuan 6
1
Pengertian Levenshtein
Distance
Natural Language Processing
2
Definisi
3
Definisi
5
Definisi
7
1. Operasi Penyisipan Karakter (Insertion)
8
2. Operasi Penghapusan Karakter (Deletion)
9
3. Operasi Penukaran Karakter (Subtitution)
10
3
Langkah-Langkah Algoritma
Levenshtein Distance
Natural Language Processing
11
Langkah-Langkah Algoritma Levenshtein
Distance
Rumus operasi
penghapusan,
penyisipan, dan
penukaran karakter yang
digunakan untuk
mengisi nilai matriks
pada Levenshtein
Distance dapat dilihat
pada gambar di bawah:
12
Langkah-Langkah Algoritma Levenshtein
Distance
13
Langkah-Langkah Algoritma Levenshtein
Distance
Langkah 1: Inisialisasi
a) Hitung panjang S dan T, misalkan m dan n
b) Buat matriks berukuran 0...m baris dan 0...n kolom
14
Langkah-Langkah Algoritma Levenshtein
Distance
Langkah 2: Proses
a) Periksa S[i] untuk 1 < i < n
b) Periksa T[j] untuk 1 < j < m
c) Jika S[i] = T[j], maka entrinya adalah nilai yang terletak pada tepat
didiagonal atas sebelah kiri, yaitu d[i,j] = d[i-1,j-1]
d) Jika S[i] ≠ T[j], maka entrinya adalah d[i,j] minimum dari:
15
Langkah-Langkah Algoritma Levenshtein
Distance
16
Langkah-Langkah Algoritma Levenshtein
Distance
Langkah 3: Hasil entri matriks pada baris ke-i dan kolom ke j, yaitu
d[i,j]
Langkah 2 diulang hingga entri d[m,n] ditemukan.
17
Contoh 1
18
Contoh 2
19
Contoh 2
21