Anda di halaman 1dari 3

Nama: M.

Qutbudin Annauvali
NRP: 02411740000100

Berikut adalah data yang digunakan untuk Analisa jarak (similarity dan dissimilarity) pada keempat
dokumen
Dokumen Partai Ketua Golkar PPP PKS PDI-P Gerindra Hanura Nasdem PKB
Dokumen 1 5 0 3 0 2 0 0 2 0 0
Dokumen 2 3 0 2 0 1 1 0 1 0 1
Dokumen 3 0 7 0 2 1 0 0 3 0 0
Dokumen 4 0 1 0 0 1 2 2 0 3 0

1. EUCLIDEAN
Pada Euclidean, perhitungan jarak dihitung dengan konsep phytagoras sehingga didapatkan jarak
antar dimensi/atribut pada setiap variabelnya.
function[d]=euclidean(~)
data = [5 0 3 0 2 0 0 2 0 0; 3
0 2 0 1 1 0 1 0 1;0 7 0 2 1
0 0 3 0 0;0 1 0 0 1 2 2 0 3
0]
for i=1:4
for j=1:4
d(i,j)=sqrt(sum((data(i,:)-data(j,:)).^2));
end
end
dan hasilnya adalah:
ans =
0 3.0000 9.4340 7.5498
3.0000 0 8.4853 5.4772
9.4340 8.4853 0 8.1240
7.5498 5.4772 8.1240 0
Analisa: jika dilihat dari hasil jaraknya antar dokumen, yang memiliki ketidakmiripan paling tinggi
adalah dokumen 1 dengan dokumen 3, dikarenakan hasilnya paling besar yang menandakan
perbedaannya yang paling banyak. Dan dokumen 1 dengan dokumen 2 memiliki kesamaan paling
dekat dengan jarak paling pendek.
Kesimpulan menurut Euclidean: Dokumen 1 & 3 paling tidak mirip; dokumen 1 & 2 paling mirip.

2. Manhattan
Manhattan adalah pengukuran jarak yang biasa dikenal cityblock, berikut adalah hasil koding dan
Analisa dengan metode manhattan.
function[d]=manhattan(data)
data = [5 0 3 0 2 0 0 2 0 0; 3
0 2 0 1 1 0 1 0 1;0 7 0 2 1
0 0 3 0 0;0 1 0 0 1 2 2 0 3
0]
for i=1:4
for j=1:4
d(i,j)=sum(abs((data(i,:)-data(j,:))));
Nama: M. Qutbudin Annauvali
NRP: 02411740000100

end
end
dan hasilnya adalah:
ans =
0 7 19 19
7 0 18 14
19 18 0 18
19 14 18 0
Analisa: jika dilihat dari hasil jaraknya antar dokumen, yang memiliki ketidakmiripan paling tinggi
adalah dokumen 1 dengan dokumen 3 juga dokumen 1 dengan 4, dikarenakan hasilnya paling besar
yaitu 19 yang menandakan perbedaannya yang paling banyak. Dan dokumen 1 dengan dokumen 2
memiliki kesamaan paling dekat dengan jarak paling pendek.
Kesimpulan menurut manhattan: Dokumen 1 & 3 juga 1 & 4 paling tidak mirip; dokumen 1 & 2
paling mirip.

3. SUPREMUM
Supremum atau dikenal dengan L-infinite norm adalah metode yang mudah digunakan, berikut
adalah hasil koding pada matlab menggunakan supemum.
function[d]=supremum(data)
data=[5 0 3 0 2 0 0 2 0 0; 3 0
2 0 1 1 0 1 0 1;0 7 0 2 1 0
0 3 0 0;0 1 0 0 1 2 2 0 3 0]
for i=1:4
for j=1:4
d(i,j)=max(abs((data(i,:)-data(j,:))));
end
end
dan hasilnya adalah:
ans =
0 2 7 5
2 0 7 3
7 7 0 6
5 3 6 0
Analisa: jika dilihat dari hasil jaraknya antar dokumen, yang memiliki ketidakmiripan paling tinggi
adalah dokumen 1 dengan dokumen 3 juga dokumen 2 dengan 3, dikarenakan hasilnya paling besar
yaitu 7 yang menandakan perbedaannya yang paling banyak. Dan dokumen 1 dengan dokumen 2
memiliki kesamaan paling dekat dengan jarak paling pendek dengan nilai 2
Kesimpulan menurut supremum: Dokumen 1 & 3 juga 2 & 3 paling tidak mirip; dokumen 1 & 2 paling
mirip.

4. COSINE
Menghitung kemiripan menggunakan cosine dengan menghitung beberapa kata kunci yang muncul
berulang kali dan dihitung frekuensinya dalam setiap dokumen
function[d]=cosine(data)
Nama: M. Qutbudin Annauvali
NRP: 02411740000100

data=[5 0 3 0 2 0 0 2 0 0; 3 0
2 0 1 1 0 1 0 1;0 7 0 2 1 0
0 3 0 0;0 1 0 0 1 2 2 0 3 0]
for i=1:4
for j=1:4
d(i,j)=(data(i,:)*data(j,:)')/(norm(data(i,:)*norm
(data(j,:))));
end
end
dan hasilnya adalah:
ans =
1.0000 0.9356 0.1555 0.0708
0.9356 1.0000 0.1222 0.1669
0.1555 0.1222 1.0000 0.2312
0.0708 0.1669 0.2312 1.0000
Analisa: kemiripan dokumen melalui munculnya kata kunci yang telah disortir dapat diketahui
dengan cosinus, semakin mendekati 1 maka semakin mirip 2 variabel tersebut. Dokumen paling
mirip adalah dokumen 1&2 dengan kemiripan 0,9356 dan paling tidak mirip adalah dokumen 1&4
dengan kemiripan 0,0708
Kesimpulan: dokumen paling mirip adalah dokumen 1&2, lalu dokumen 1&4 adalah yang paling
tidak mirip.

5. KORELASI

data=[5 0 3 0 2 0 0 2 0 0; 3 0
2 0 1 1 0 1 0 1;0 7 0 2 1 0
0 3 0 0;0 1 0 0 1 2 2 0 3 0]
R = corrcoef(data')
Dengan menggunakan korelasi, hasilnya adalah
R=
1.0000 0.9060 -0.2131 -0.5074
0.9060 1.0000 -0.3801 -0.5178
-0.2131 -0.3801 1.0000 -0.1651
-0.5074 -0.5178 -0.1651 1.0000
Analisa: kemiripan dokumen melalui korelasi didapat dengan nilai R yang mendekati 1 atau -1, jika
positif maka berbanding lurus, jika negatif maka berbanding terbalik. Dokumen paling mirip adalah
dokumen 1&2 dengan nilai koefisien korelasi 0,9060 dan paling kecil kemiripannya adalah dokumen
4&3
Kesimpulan: dokumen paling mirip adalah dokumen 1&2, lalu dokumen 4&3

Anda mungkin juga menyukai