Anda di halaman 1dari 4

MENDETEKSI KEMIRIPAN TEKS DOKUMEN (.

TXT)

DENGAN METODE LEVENSHTEIN DISTANCE

MENGGUNAKAN BAHASA PEMROGRAMAN PHP

OLEH :

DANU SASMITA

(1617051133)

JURUSAN ILMU KOMPUTER

FAKULTAS MATEMATIKA & ILMU PENGETAHUAN ALAM

UNIVERSITAS LAMPUNG
A. PENDAHULUAN
Proses input data pada saat ini sudah memanfaatkan alat
digital, sehingga lebih cepat dan efesien. Tetapi terkadang teknologi
ini dimanfaatkan oleh sebagian oknum untuk melakukan kecurangan.
Salah satu contohnya copy paste data atau plagiat untuk
mempercepat suatu pekerjaan, tentunya ini tidak dapat dibenarkan.
Maka dari itu dibutuhkan solusi untuk mendeteksi kecurangan
tersebut, dengan menggunakan Algoritma Levenshtein Distance.

B. TUJUAN
Tujuan dari laporan ini untuk mencari tingkat kemiripan dua
dokumen menggunakan metode Levenshtein Distance menggunakan
bahasa pemrograman php. Dua dokumen yang digunakan yakni
dokumen sumber dan dokumen tujuan, dokumen sumber digunakan
sebagai sumber data sedangkan dokumen tujuan digunakan sebagai
data pembanding.

C. PEMBAHASAN
Algoritma Levenshtein Distance adalah algoritma yang
digunakan untuk mengukur kesamaan antara 2 string. Dalam kasus
ini saya akan mengimplementasikan algoritma Levenshtein Distance
menggunakan bahasa pemrograman php untuk mengetahui
presentase kesamaan teks dalam dokumen dengan format .txt.
a) Kode program
Gambar 1.1
 Variabel $data1 digunakan sebagai string sumber,
sedangkan variabel $data2 digunakan sebagai string
tujuan.
 Variabel $bagian digunakan untuk menampung hasil
dari perhitungan algoritma levenshtein distance.
 Jika hasil dari perhitungan algoritma levenshtein
distance = 0, maka tingkat kemiripan mencapai 100%.
 Jika tidak, maka dilakukan perhitungan presentase dari
hasil perhitungan algoritma levenshtein distance.

b) Percobaan
 Siapkan 2 data, yakni sumber dan tujuan.
 Dokumen pertama berisi puisi asli berjudul anak
mayang :

Gambar 1.2
 Dokumen kedua berisi puisi hasil duplikat berjudul
anak miwang :

Gambar 1.3
Dari Gambar 1.3 hanya mengganti kata
"mayang"menjadi "miwang".
 Hasil dari presentase dan perhitungan algoritma
levenshtein distance :

Gambar 1.4

D. KESIMPULAN
Dari perobaan diatas, membuktikan bahwa algoritma
levenshtein distance dapat menemukan tingkat kemiripan teks
didalam dokumen berdasarkan perbedaan data per-string. Sehingga
dapat mencari seberapa besar tingkat presentase duplikasi dari
sebuah dokumen.

E. DAFTAR PUSTAKA
B. P. Pratama & S. A. Pamungkas (2016). ANALISIS KINERJA
ALGORITMA LEVENSHTEIN DISTANCE DALAM
MENDETEKSI KEMIRIPAN DOKUMEN TEKS. Jurnal
"LOGIK@", Jilid 6, No. 2, 2016, Hal. 131 - 143.

Anda mungkin juga menyukai