Anda di halaman 1dari 10

Tugas Aljabar Linear

MODEL VEKTOR UNTUK MENDUGA DINI PLAGIARISME SUATU


KALIMAT

Oleh :

Ratih Roesdiana : 121810101004


Ade Irma Octavia : 121810101020
Adita Cahya I : 121810101022
Muhammad Basofi : 121810101032
Anggun Annisa : 121810101037
Muhammad Asrur Bahari : 121810101059
Anjung Fiqri : 121810101065
Lambang Dwi Cahyo : 121810101067
Masrifan Dwi Yansyah : 121810101076
Annash Zaenun Muhendra : 121810101085
Ratna Safitri : 121810101086
MODEL VEKTOR DAN MATRIKS DARI SUATU KALIMAT SERTA

SUDUT ANTARA DUA VEKTOR DAN DUA SUBRUANG

UNTUK MENDUGA DINI PLAGIARISME SUATU KALIMAT


PRINSIP KERJA

Prinsip kerja mesin pencari memanfaatkan konsep dasar aljabar linear


yaitu ruang vektor dan dekomposisi matriks. Berdasarkan konsep dasar
aljabar linear yang digunakan tersebut, dikembangkan pemodelan kaimat
untuk mendeteksi dini terjadinya tindak plagiarisme. Representasi vektor
kolom dimanfaatkan dalam pengonversian suatu input kalimat. Konsep lain
yang digunakan ialah besar sudut antara dua vektor. Dengan cara
menghitung besarnya sudut yang dibentuk oleh dua vektor menjadi
pertimbangan untuk menentukan indikasi tindak plagiarisme.
Penerapan konsep dasar aljabar linear untuk menduga terjadinya plagiarisme
dengan pendekatan teoritik yang mengadopsi konsep representasi vektor,
dalam hal ini dokumen yang akan diperiksa, dikonversi terlebih dahulu oleh
suatu program menjadi vektor berukuran 1 x k, dimana k adalah banyaknya
kata yang berbeda pada seluruh dokumen yang akan diperiksa tersebut.
Berikut adalah contoh representasi dokumen yang berisi kalimat judul
sebagai vektor.
Misal terdapat kalimat seperti di bawah ini:
KALIMAT 1 : MODEL VEKTOR DAN MATRIKS DARI SUATU KALIMAT SERTA SUDUT ANTARA
DUA VEKTOR DAN DUA SUBRUANG UNTUK MENDUGA DINI PLAGIARISME SUATU KALIMAT
Dibandingkan dengan kalimat berikut :
KALIMAT 2 : MODEL VEKTOR DAN MODEL MATRIKS DARI SUATU DOKUMEN SERTA SUDUT
ANTARA DUA VEKTOR DAN DUA SUBRUANG UNTUK MENDUGA DINI PLAGIARISME SUATU
DOKUMEN
KALIMAT 1 : KALIMAT 2 :
Kata Frekuensi Jumlah Kata Frekuensi Jumlah
Model 2
Model 1
Vektor 2
Vektor 2
Dan 2
Dan 2
Matriks 1 Matriks 1
Dari 1 Dari 1
Suatu 2 Suatu 2
Dokumen 2
Kalimat 2
Serta 1
Serta 1
Sudut 1
Sudut 1
Antara 1
Antara 1
Dua 2
Dua 2
Subruang 1
Subruang 1
Untuk 1
Untuk 1
Menduga 1 Menduga 1
Dini 1 Dini 1
Plagiarisme 1 Plagiarisme 1
Dokumen 0 Kalimat 0

Bentuk vector 1 x k dimana k=17 karena penggabungan 2 ruang, dimana kalimat 1 terdapat 16
kata dan kalimat 2 juga terdapat 16 kata namun ada 1 kata di tiap kalimat yang berbeda
sehingga kalimat 1 berjumlah 17 kata berbeda dengan 1 kata yang sebenarnya tidak ada atau
nol.
i =
j=

Banyaknya kata berbeda yaitu 16, artinya representasi kalimat judul sebagai vektor misal i
dan j dengan ukuran
(1x16) merupakan subruang di R16 . Untuk menduga bahwa sebuah dokumen telah meniru
dokumen yang lain yaitu dengan mengukur sudut antara dua dokumen tersebut. Dalam hal
ini, ukuran kedua vektor haruslah sama. Pengukuran sudut antara dua buah dokumen
diidentikkan dengan pengukuran sudut antara dua buah vektor yaitu dengan rumus sebagai
berikut :

Dimana :
= xT y ialah hasil perkalian dalam vektor, xT y = x1y1 + x2y2 + ... + xnyn
masing-masing adalah panjang euclidean (norm) dari vektor x dan vektor y panjang
euclidean (norm) suatu vektor diperoleh dari akar penjumlahan kuadrat elemen vektor
tersebut (notasi : =
ialah besar sudut yang diapit oleh kedua vektor x dan y.
Kemudian dugaan menyontek atau plagiarisme dapat diamati dari besar sudut
yang dibentuk oleh kedua vektor tersebut. Jika sudut yang dibentuk kecil maka
diduga telah terjadi plagiarisme (tetapi dibutuhkan pemeriksaan secara manual
setelah pendugaan ini). Tetapi kekurangan pendekatan teoritik semacam ini yaitu
terletak pada kalimat input yang dipandang sebagai satu vektor secara
keseluruhan juga, sehingga 2 kata dengan makna berbeda dapat dianggap sama .
Dugaan terjadinya plagiarisme diamati dari besar sudut yang dibentuk oleh dua
kalimat yang dijadikan input. Jika sudut yang dibentuk antara Vektor i dan
vektor j memiliki nilai yang kecil, maka dapat diduga telah terjadi plagiarisme.
Jika = 0 atau cos = 1 , maka dua dokumen diduga serupa/identik, jika =
/2 atau cos = 0 , maka dua dokumen dikatakan sama sekali berbeda, dan jika
/6 atau cos 0.8660 , maka diduga bahwa terjadi plagiarisme antara dua
dokumen tersebut. Hasil berupa besar sudut yang diperoleh masih berstatus
dugaan, untuk memastikan telah terjadi atau tidaknya plagiarisme perlu
dilakukan lagi uji empiris berupa pemeriksaan manual. Kriteria sudut digunakan
sebagai indikator untuk mempermudah pemeriksaan.
Kemiripan dua dokumen dapat diukur dengan sudut
Untuk mendapat himpunan ortonormal maka dilakukan faktorisasi QR.

Secara matematis :
Qa1={p1(1), p2(1), ... , ps1(1)}: = [p1(1), p2(1), ... , ps1(1)]
Qb2={p1(2), p2(2), ... , ps2(2)}: = [p1(2), p2(2), ... , ps2(2)]
U=span {p1(1), p2(1), p3(1), ... , ps1(1)} Rk berdimensi s1
V=span {p1(2), p2(2), p3(2), ... , ps2(2)} Rk berdimensi s2
Karena Qa1 dan Qb2 adalah matriks ortogonal yang diperoleh di faktorisasi QR dengan serangkaian
transformasi Householder, maka himpunan U=span {p1(1), p2(1), p3(1), ... , ps1(1)} dan V=span {p1(2), p2(2),
p3(2), ... , ps2(2)} merupakan basis ortonormal, maka dapat dihitung besar sudut antara dua subruang U
dan V dengan rumus

Dimana M:=[<pi(2), pj(2)>]T adalahmatriks berukuran s2 x s1, MT adalah transpose dari matriks M dan
<,> melambangkan perkalian dalam di Rk yaitu :
Note : namun metode ini belum diajarkan, jadi kami belum bisa menjelaskan metode ini
Dalam kelompok kami tidak membahas Plagiat antar
dokumen karena menggunakan prinsip FAKTORISASI
QR sedangkan kita belum pernah menerima materi
FAKTORISASI QR
TERIMA KASIH

Anda mungkin juga menyukai