Anda di halaman 1dari 2

Comparison Rabin Karp and Suffix Tree for

Plagiarism Detection

Authors Name/s per 1st Affiliation (Author) Authors Name/s per 2nd Affiliation (Author)
line 1 (of Affiliation): dept. name of organization line 1 (of Affiliation): dept. name of organization
line 2-name of organization, acronyms acceptable line 2-name of organization, acronyms acceptable
line 3-City, Country line 3-City, Country
line 4-e-mail address if desired line 4-e-mail address if desired

Abstract— Plagiarisme penelitian sebelumnya. Anna dan I wayan melakukan


perbandingan pendekatan deteksi plagiarism dokumen dalam
Keywords—component; formatting; style; styling; insert (key bahasa inggris mengggunakan algoritma Winnowing dan
words) Manber, yang hasilnya algoritma winnowing lebih baik karena
memberikan jaminan terdeteksinya kesamaan dokumen tetapi
I. PENDAHULUAN
algoritma ini memerlukan waktu proses yang lama [8].
Semakin berkembangnya teknologi, kegiatanz akses hasil Penelitian lain dilakukan Brinaldi dan Seng Hansun, tentang
karya orang lain secara bebas melalui internet sangatlah pendeteksian dokumen plagiarism menggunakan algoritma
mudah. Hal ini merupakan dampak positif dimana seseorang Rabin karp dan Jaro-Winkler, yang hasilnya algoritma Rabin-
dapat menyimpan dan menyebarkan karyanya ke dunia maya Karp jauh lebih efektif dan lebih cepat dalam proses
sebagai referensi ilmu pengetahuan, namun tak sedikit individu mendeteksi dokumen dengan ukuran lebih dari 1000 KB [3].
melakukan proses plagiarism. Praktik plagiarism dalam Rabin Karp Algorithm is a string searching algorithm that
penulisan penelitian sering terjadi pada dunia akademisi, uses hashing to find any one of a set of pattern strings in a text
bahkan plagiarism pada siswa menjadi salah satu masalah [9]. For text of length n and p patterns of combined length m,
terbesar yang dihadapi oleh universitas di seluruh dunia [1]. its average and best case running time is O (n+m) in space O
Plagiaisme adalah tindakan mengambil ide atau tulisan orang (p), but its worst-case time is O (nm).A practical application of
lain tanpa rujukan dan mengklaim bahwa ide dan tulisan Rabin Karp is detecting plagiarism. Rabin Karp can rapidly
tersebut adalah miliknya [2].Sedangkan menurut Leonardo dan search through a paper for instances of sentences from the
Hansun, plagiarisme adalah tindakan yang dianggap oleh given source material, ignoring details such as case and
universitas sebagai penipuan dengan mengambil ide atau punctuation.
gagasan seseorang tanpa menyebutkan rujukan dan diklaim
sebagai miliknya [3]. Menurut Shivaji dan Prabhudeva, proses AKU BELOM NEMUIN PAPER YANG BAHAS
menjiplak sesuatu dari sumber tertentu dan mengakui itu SUFFIX TREEEE. MAAV NANTI AKU CARI E LAGI,
sebagai miliknya merupakan sebuah kejahatan [4]. Berdasarkan pernyataan tersebut, pada penelitian ini akan
Berdasarkan pernyaataan tersebut dapat disimpulkan bahwa membandingkan algoritma Rabin Karp dan Suffix Tree untuk
kegiatan plagiarisme merupakan hal yang perlu dicegah karena proses pendeteksian plagiarism.
hanya akan mematikan kreativitas individu.
Untuk meminimalisir plagirisme perlu adanya suatu
mekanisme untuk mengukur kemiripan dokumen [5]. Proses II. METHODOLOGY
pendeteksian secara manual sulit untuk dilakukan karena
jumlah penulisan yang banyak, sehingga diperlukan sistem A. Plagiarism
untuk mendeteksi plagiarisme. Konsep yang diterapkan dalam According to Berne Convention, plagiarism of literature
proses deteksi plagiarism dokumen salah satunya and arts work is considered as violating government rule [13].
menggunakan string matching. String matching algorithms, are Plagiarism detection process can be classified as follows: (1)
an important class of string algorithms that try to find a place intrinsic and external[11]. While based on research [12] divide
where one or several strings are found within a larger string or plagiarism into seven based on its use, namely:
text [6]. Parameterized pattern matching is a variant of 1. Copy & paste, copy every word without any changes.
traditional pattern matching in which some symbols are
allowed to be consistently renamed into different symbols 2. Disguised plagiarism, covering part copied, divided
within a match [7]. into 4 techniques, shake & paste, expansive
plagiarism, contractive plagiarism, and mosaic
Penelitian tentang duplikasi dokumen, deteksi plagiat, dan plagiarism.
string matching telah banyak dibahas pada penelitian-
3. Technical disguise, summarizes to hide plagiarism [2] M. Pendeteksian, K. Ilmiah, D. A. Putra, H. Sujaini, and H. S.
content by exploiting the weakness of text-based Pratiwi, “Implementasi Algoritma Rabin-Karp untuk,” vol. 1, no. 1,
analysis methods today such as replacing characters 2015.
with symbols.
[3] B. Leonardo and S. Hansun, “Text Documents Plagiarism Detection
4. Undue paraphrasing, deliberately rewrote with the using Rabin-Karp and Jaro-Winkler Distance Algorithms,” vol. 5,
word and plagiarist language style no. 2, pp. 462–471, 2017.
5. Translated plagiarism, converting content from one [4] S. K. Shivaji, “Plagiarism Detection by using Karp-Rabin and String
language to another. Matching Algorithm Together,” vol. 116, no. 23, pp. 37–41, 2015.

6. Idea plagiarism, without showing the source using the [5] S. Suhada, S. Bahri, and W. J. Barat, “IMPLEMENTASI
ideas of others. ALGORITMA RABIN KARP DAN STEMMING NAJIEF
ANDRIANI UNTUK DETEKSI,” vol. 5, pp. 84–89, 2017.
7. Self plagiarism, re-use of some or all of the writings
of others before so not scientifically justified. [6] V. Saikrishna, “String Matching and its Applications in
Diversified,” vol. 9, no. 1, pp. 219–226, 2012.
[7] T. Lee, J. Chae, and K. Park, “On-line construction of parameterized
--- Ekstraksi Dokumen suffix trees for large alphabets ✩ , ✩✩,” Inf. Process. Lett., vol.
111, no. 5, pp. 201–207, 2011.
B. Text Mining
[8] D. B. Inggris and A. Kurniawati, “copy and paste ),” no. Kommit,
Text mining
pp. 20–21, 2008.
analyzing [9].
[9] N. Singla and D. Garg, “String Matching Algorithms and their
C. Rabin Karp Applicability in various Applications,” no. 6, pp. 218–222, 2012.
Rabin-Karp [10] Kemdikbud, “KBBI Daring - Plagiarism,” Kemdikbud, 2016.
[Online]. Available: https://kbbi.kemdikbud.go.id/entri/plagiarisme.
III. HASIL PENELITIAN
[11] Salmuasih and A. Sunyoto, “Implementasi Algoritma Rabin Karp
untuk Pendeteksian Plagiat Dokumen Teks Menggunakan Konsep
IV. KESIMPULAN Similarity,” Semin. Nas. Apl. Teknol. Inf. 2013, pp. 23–28, 2013.

Xcvbnm,.cvbnm [12] B. Gipp and N. Meuschke, “Citation Pattern Matching Algorithms


for Citation-based Plagiarism Detection: Greedy Citation Tiling,
REFERENCES Citation Chunking and Longest Common Citation Sequence,” Proc.
11th ACM Symp. Doc. Eng. - DocEng ’11, pp. 249–258, 2011.
[1] M. Cebrián, M. Alfonseca, and A. Ortega, “Towards the Validation [13] https://en.wikipedia.org/wiki/Berne_Convention
of Plagiarism Detection Tools by Means of Grammar Evolution,”
vol. 13, no. 3, pp. 477–485, 2009.

Anda mungkin juga menyukai