Anda di halaman 1dari 16

KELOMP

OK 3
ZHAFIRA KHAIRUNNISA
AZRA
AIDIL TIQLAL
MUHAMMAD AIDIL ADHAM
DWINDA NUR FADILLAH
RHIMA DIANA
RAMADHAN ABELIO NUSA
PUTRA
K-Nearest Neighbors
(KNN)
PENGERTIAN
KNN

K-Nearest Neighbor adalah suatu metode


yang menggunakan algoritma supervised
learning dimana hasil dari instance yang baru
diklasifikasikan berdasarkan mayoritas dari
kategori k-tetangga terdekat.

Algoritma k-Nearest Neighbor menggunakan


Neighborhood Classification sebagai nilai
prediksi dari nilai instance yang baru.
Prinsip kerja K-Nearest Neighbor (KNN) adalah
mencari jarak terdekat antara data yang akan
dievaluasi dengan k tetangga (neighbor)
terdekatnya dalam data pelatihan (training).
PRINSIP KERJA Dengan k merupakan banyaknya tetangga
KNN terdekat.

Data training diproyeksikan ke ruang berdimensi


banyak, yang mana masing-masing dimensi
menjelaskan fitur dari data. Ruang ini dibagi
menjadi bagian-bagian berdasarkan klasifikasi
data training. Sebuah titik pada ruang ini ditandai
kelas k (titik hitam), kelas k merupakan
klasifikasi yang paling banyak ditemui pada k
buah tetangga terdekat titik tersebut.
KLASIFIKASI TERDEKAT
(NEAREST NEIGHBOR
CLASSIFICATION)

Data baru yang diklasifikasi selanjutnya


diproyeksikan pada ruang dimensi banyak
yang telah memuat titik-titik c data
training. Proses klasifikasi dilakukan
dengan mencari titik c terdekat dari c-
baru (nearest neighbor). Teknik pencarian
tetangga terdekat yang umum dilakukan
dengan menggunakan formula jarak
euclidean. Berikut beberapa formula yang
digunakan dalam algoritma knn.
Euclidean Distance
Manhattan Distance
Jarak Euclidean adalah formula
Manhattan Distance atau Taxicab
untuk mencari jarak antara 2
Geometri adalah formula untuk
titik dalam ruang dua dimensi.
mencari jarak d antar 2 vektor p,q
pada ruang dimensi n.

Minkowski distance
Hamming Distance
Minkowski distance adalah formula
Jarak Hamming adalah cara
pengukuran antar 2 titik pada ruang
mencari jarak antar 2 titik yang
vektor normal yang merupakan
dihitung dengan panjang vektor
hibridisasi yang menjeneralisasi
biner yang dibentuk oleh dua titik
euclidean distance dan mahattan
tersebut dalam block kode biner.
distance.
MENCARI DEKAT ATAU JAUHNYA
JARAK ANTAR TITIK PADA KELAS
K
Untuk mencari dekat atau jauhnya jarak antar titik
pada kelas k biasanya dihitung menggunakan jarak
Euclidean. Jarak Euclidean adalah formula untuk
mencari jarak antara 2 titik dalam ruang dua
dimensi.

Formula untuk mencari jarak 2 dimensi


CARA KERJA KNN

Tentukan parameter Sesuaikan klasifikasi dari kategori


01 K = jumlah dari persekitaran 04 Y dengan persekitaran yang telah
(nearest neighbors) ditetapkan

Gunakan class dengan jumlah


Hitung jarak antara data baru
terbanyak sebagai dasar
02 yang ditanyakan dengan 05 menentukan class dari data baru
seluruh sampel data pelatihan
yang ditanyakan.
Urutkan seluruh jarak
berdasarkan jarak minimum
03 dan tetapkan persekitaran
sesuai dengan nilai K.
MENENTUKAN NILAI ATAU KELAS K

Dalam menentukan nilai atau kelas k, sebaiknya kita


gunakan nilai ganjil, karena jika tidak, ada kemungkinan
kita tidak akan mendapatkan jawaban. Penentuan nilai k
dipertimbangkan berdasarkan banyaknya data yang ada
dan ukuran dimensi yang dibentuk oleh data. Semakin
banyak data yang ada, angka k yang dipilih sebaiknya
semakin rendah. Namun, semakin besar ukuran dimensi
data, angka k yang dipilih sebaiknya semakin tinggi.
CONTOH APLIKASI K NEAREST
NEIGHBORS

Contoh berikut diambil dari buku "Data Temperatur Kecepatan Klasifikasi atau
Science Algorithms in a Week" yang Udara (ºC) Angin (km/jam) Persepsi Marry
ditulis oleh Dávid Natingga. 10 0 Dingin
25 0 Panas
15 5 Dingin
Pada contoh ini, dilakukan klasifikasi 20 3 Panas
suhu udara berdasarkan persepsi 18 7 Dingin
seseorang yang bernama Marry. 20 10 Dingin
Adapun klasifikasi suhu udara terdiri 22 5 Panas
dari 2 persepsi yaitu Panas dan Dingin. 24 6 Panas
Persepsi ini dapat diukur berdasarkan 2
variabel yaitu temperatur dalam derajat Untuk contoh ini terbentuk ruang dimensi 2,
yang berisi 2 kriteria yaitu temperatur
celcius dan kecepatan angin dalam
udara dan kecepatan angin.
km/h. Diperoleh data berikut,
Pada proyeksi di atas sumbu vertikal adalah kecepatan angin,
sumbu horizontal adalah temperatur suhu, warna biru adalah
dingin, dan warna merah adalah panas.
Dari proyeksi di atas, dapat dilakukan klasifikasi data baru.
Misalnya, Bagaimana persepsi Marry saat temperatur udara
16°C dan kecepatan angin 3 km/jam.

Proses pencarian tetangga


terdekat
Dapat diketahui tetangga terdekatnya adalah titik c dingin dengan
temperatur 15°C dan kecepatan angin 5 km/jam. Jadi berdasarkan
pemilihan k = 1, klasifikasinya adalah dingin.
Dengan melakukan proses di atas terhadap semua titik,
diperoleh proyeksi klasifikasi berikut.
Catatan:
Untuk pemilihan k lainnya, hasil klasifikasi
ditentukan dengan frekuensi terbanyak.
Misalnya k = 3, dengan titik terdekat dingin,
panas, dingin. Hasil klasifikasi data baru
tersebut adalah dingin.
THAN
K YOU
CREDITS: This presentation template was created by Slidesgo,
including icons by Flaticon, infographics & images by Freepik

!
and illustrations by Stories

Anda mungkin juga menyukai