Anda di halaman 1dari 13

KASUS

K-NEAREST NEIGHBOUR

ALLPPT.com _ Free PowerPoint Templates, Diagrams and Charts


APA ITU ALGORITMA K-NN ?
K-Nearest adalah augoritma super viset learning hasil dari instance yang ba
ru diklasifikasikan berdasarkan mayoritas dari kategori K-Tetangga terdeka
t.

Tujuan dari augoritma ini adalah untuk mengklasifikasikan obyrk baru berd
asarkan atribut dan sampel-sampel dari data training.
Rumus
Rumus KNN menggunakan Euclidean Distance :
Contoh soal Perhitungan KNN

Diberikan data Training berua dua atribut Bad dan Good untuk
mengklasiikasikan sebuah data apakah tergolong Bad atau Good , berikut ini
adalah contoh datanya :
Jika kita diberikan data baru yang akan kita klasifikasikan, yaitu X = 3 dan Y =
5. Jadi termasuk klasifikasi apa data baru ini ? Bad atau Good ?

X Y Kategori

7 6 Bad

6 6 Bad

6 5 Bad

1 3 Good

2 4 Good

2 2 Good
Langkah penyelesaian

1. Kita tentukan parameter K. Misalnya kita buat jumlah terta


ngga terdekat K = 3.
2. kita hitung jarak antara data baru dengan semua data train
ing. Kita menggunakan Euclidean Distance. Kita hitung se
perti pada table berikut :
Kita urutkan jarak dari data baru dengan data training dan menentukan
tetangga terdekat berdasarkan jarak minimum K.
Dari kolom 4 (urutan jarak) kita mengurutkan dari yang terdekat ke terj
auh antara jarak data baru dengan data training. ada 2 jarak yang sam
a (yaitu 4) pada data baris 2 dan baris 6, sehingga memiliki urutan yan
g sama. Pada kolom 5 (Apakah termasuk 3-NN?) maksudnya adalah K
-NN menjadi 3-NN , karena nilai K ditentukan sama dengan 3.
3. Tentukan kategori dari tetangga terdekat. Kita per
hatikan baris 3, 4, dan 5 pada gambar sebelumnya
(diatas). Kategori Ya diambil jika nilai K<=3. Jadi bar
is 3, 4, dan 5 termasuk kategori Ya dan sisanya Tida
k.
Kategori ya untuk K-NN pada kolom 6, mencakup baris 3,4, dan 5. Kita
berikan kategori berdasarkan tabel awal. baris 3 memiliki kategori Bad,
dan 4,5 memiliki kategori Good.
4. Gunakan kategori mayoritas yang sederhana da
ri tetangga yang terdekat tersebut sebagai nilai pre
diksi data yang baru.
KESIMPULAN

Data yang kita miliki pada baris 3, 4 dan 5 kita pun


ya 2 kategori Good dan 1 kategori Bad. Dari jumla
h mayoritas (Good > Bad) tersebut kita simpulkan
bahwa data baru (X=3 dan Y=5) termasuk dalam k
ategori Good.
TERIMA KASIH

Anda mungkin juga menyukai