MODUL PERKULIAHAN
P152110005
(1D6151BC) -
MACHINE
LEARNING
Klasifikasi
Abstrak Sub-CPMK
04
Saruni Dwiasnati, ST.,MM.,M.Kom
Ilmu Komputer Teknik Informatika
Standardisasi Modul
1.1 Definisi Klasifikasi
C. K-Nearest Neighbor (KNN), Sebuah algoritma yang mencari jarak terdekat antara
data yang akan dievaluasi dengan K tetangga (neighbor) terdekatnya dalam
pelatihan. Metode KNN banyak digunakan karena mempunyai beberapa
kelebihan, diantaranya yaitu dapat menghasilkan data yang lebih akurat dan efektif
apabila training data cukup besar.
K-nearest neighbors melakukan klasifikasi dengan proyeksi data pembelajaran
pada ruang berdimensi banyak. Ruang ini dibagi menjadi bagian-bagian yang
merepresentasikan kriteria data pembelajaran. Setiap data pembelajaran
direpresentasikan menjadi titik-titik c pada ruang dimensi banyak.
Cara Kerja algoritma K-Nearest Neighbor, yaitu:
A1. Klasifikasi Terdekat (Nearest Neighbor Classification)
Data baru yang diklasifikasi selanjutnya diproyeksikan pada ruang dimensi banyak
yang telah memuat titik-titik c data pembelajaran. Proses klasifikasi dilakukan
dengan mencari titik c terdekat dari c-baru (nearest neighbor). Teknik pencarian
tetangga terdekat yang umum dilakukan dengan menggunakan formula jarak
euclidean. Berikut beberapa formula yang digunakan dalam algoritma KNN.
Euclidean Distance
Jarak Euclidean adalah formula untuk mencari jarak antara 2 titik dalam ruang dua
dimensi.