Anda di halaman 1dari 6

See discussions, stats, and author profiles for this publication at: https://www.researchgate.

net/publication/330840826

Cara Kerja Algoritma k-Nearest Neighbor (k-NN)

Article · August 2018

CITATIONS READS

0 1,893

1 author:

Asep Maulana Ismail


Universitas Widyatama
3 PUBLICATIONS   0 CITATIONS   

SEE PROFILE

Some of the authors of this publication are also working on these related projects:

My Individual Research View project

All content following this page was uploaded by Asep Maulana Ismail on 03 February 2019.

The user has requested enhancement of the downloaded file.


2/3/2019 Cara Kerja Algoritma k-Nearest Neighbor (k-NN) – Bee Solution Partners – Medium

Cara Kerja Algoritma k-Nearest


Neighbor (k-NN)
Asep Maulana Ismail
Aug 17, 2018 · 4 min read

Sebelum membahas tentang bagaimana cara kerjanya, kita bahas


terlebih dahulu apa itu Alogritma k-NN.

. . .

Apa itu Algoritma k-Nearest Neighbor?


Algoritma k-Nearest Neighbor adalah algoritma supervised 
learning dimana hasil dari instance yang baru diklasi kasikan
berdasarkan mayoritas dari kategori k-tetangga terdekat.

Tujuan dari algoritma ini adalah untuk mengklasi kasikan obyek baru
berdasarkan atribut dan sample-sample dari training data.

Algoritma k-Nearest Neighbor menggunakan Neighborhood


Classi cation sebagai nilai prediksi dari nilai instance yang baru.

. . .

https://medium.com/bee-solution-partners/cara-kerja-algoritma-k-nearest-neighbor-k-nn-389297de543e 1/7
2/3/2019 Cara Kerja Algoritma k-Nearest Neighbor (k-NN) – Bee Solution Partners – Medium

Contoh Kasus
Misalnya ada sebuah rumah yang berada tepat di tengah perbatasan
antara Kota Bandung dan Kabupaten Bandung, sehingga pemerintah
kesulitan untuk menentukan apakah rumah tersebut termasuk
kedalam wilayah Kota Bandung atau Kabupaten Bandung.

Kita bisa menentukannya dengan menggunakan Algoritma k-NN,


yaitu dengan melibatkan jarak antara rumah tersebut dengan rumah-
rumah yang ada disekitarnya (tetangganya).

Pertama, kita harus menentukan jumlah tetangga yg akan kita


perhitungkan (k), misalnya kita tentukan 3 tetangga terdekat (k = 3).

Kedua, hitung jarak setiap tetangga terhadap rumah tersebut, lalu


urutkan hasilnya berdasarkan jarak, mulai dari yang terkecil ke yang
terbesar.

Ketiga, ambil 3 (k) tetangga yg paling dekat, lalu kita lihat masing-
masing dari tetangga tersebut apakah termasuk kedalam wilayah Kota
atau Kabupaten. Ada 2 kemungkinan:

• Bila dari 3 tetangga tersebut terdapat ada 2 rumah yg termasuk


kedalam wilayah Kota Bandung, maka rumah tersebut termasuk
kedalam wilayah Kota Bandung.

• Sebaliknya, bila dari 3 tetangga tersebut terdapat 2 rumah yg


termasuk kedalam wilayah Kabupaten Bandung, maka rumah
tersebut termasuk kedalam wilayah Kabupaten Bandung.

Dalam menentukan nilai k, sebaiknya kita gunakan nilai ganjil,


karena jika tidak, ada kemungkinan kita tidak akan mendapatkan
jawaban.

. . .

Pembahasan Lebih Detil


Pada kasus diatas, kita menghitung jarak suatu rumah terhadap
tetangga-tetangganya, itu berarti kita harus mengetahui posisi dari
setiap rumah. Kita bisa menggunakan latitude dan longitude (atau garis
lintang dan garis bujur) sebagai posisi.

https://medium.com/bee-solution-partners/cara-kerja-algoritma-k-nearest-neighbor-k-nn-389297de543e 2/7
2/3/2019 Cara Kerja Algoritma k-Nearest Neighbor (k-NN) – Bee Solution Partners – Medium

Untuk mempermudah pemahaman, saya akan coba menggunakan data


yang nilainya sederhana. Data yang akan digunakan adalah sebagai
berikut:

Dari data diatas, kita mendapatkan beberapa informasi, diantaranya:

• Independent Variables, yaitu variable yang nilainya tidak


dipengaruhi oleh variable lain. Pada contoh data diatas, yang
termasuk independent variable adalah Lat, dan Long.

• Dependent Variables, yaitu variable yang nilainya dipengaruhi


oleh variable lain. Pada contoh data diatas, yang termasuk
dependent variable adalah Lokasi.

• Rumah A-E adalah rumah yang masuk ke dalam wilayah Kota.

• Rumah F-G adalah rumah yang masuk ke dalam wilayah


Kabupaten.

• Rumah X adalah rumah yang akan kita prediksi menggunakan


algoritma kNN apakah termasuk ke dalam wilayah Kota atau
Kabupaten.

Didalam dunia Machine Learning, Independent Variables sering


disebut juga sebagai Features.

Selanjutnya kita hitung jarak antara rumah X terhadap rumah A-G


dengan menggunakan rumus pythagoras:

https://medium.com/bee-solution-partners/cara-kerja-algoritma-k-nearest-neighbor-k-nn-389297de543e 3/7
2/3/2019 Cara Kerja Algoritma k-Nearest Neighbor (k-NN) – Bee Solution Partners – Medium

Pythagoras Formula. Source: Devon Maths Tuition

Diketahui, dimana x adalah Lat, y adalah Long, sedangkan (x1, y1)


adalah lat dan long dari rumah X, dan (x2, y2) adalah lat dan long dari
masing-masing tetangganya.

Setelah dihitung, selanjutnya adalah urutkan jarak tersebut dari


yang paling kecil ke yang paling besar, hasilnya adalah sebagai
berikut:

Dapat dilihat dari hasil perhitungan diatas, bahwa ternyata 3 tetangga


terdekat dari rumah X adalah:

• Rumah H (Kabupaten) yang memiliki jarak 2.24,

• Rumah C (Kota) yang memiliki jarak 3, dan

• Rumah E (Kota) yang memiliki jarak 3.16.

Dari ke-3 tetangga terdekat, terdapat 2 rumah yang termasuk kedalam


wilayah Kota dan 1 rumah yang masuk ke dalam wilayah Kabupaten.
Sehingga dapat disimpulkan, bahwa Rumah X adalah rumah yang
termasuk kedalam wilayah Kota Bandung.

. . .

https://medium.com/bee-solution-partners/cara-kerja-algoritma-k-nearest-neighbor-k-nn-389297de543e 4/7
View publication stats

2/3/2019 Cara Kerja Algoritma k-Nearest Neighbor (k-NN) – Bee Solution Partners – Medium

Catatan Tambahan
Dalam kasus ini, Independent Variables nya sudah berbentuk angka,
sehingga tidak perlu dilakukan konversi. Namun, bila dalam kasus lain
terdapat Independent Varibales yang nilainya bukan berbentuk angka,
maka kita harus mengkonversinya terlebih dahulu.

. . .

Kesimpulan
Algoritma kNN (k-Nearest Neighbor) ini adalah algoritma klasi kasi
berdasarkan tetangga terdekat. Contoh diatas hanyalah contoh yang
sangat sederhana dalam menerapkan algoritma ini.

Bila dalam kasus lain terdapat lebih dari 2 independent variables,


untuk menghitung jaraknya kita bisa gunakan rumus Euclidean
Distance. Mirip dengan Pythagoras, hanya saja Euclidean Distance
memiliki dimensi lebih dari 2.

Euclidean Distance Formula. Source: Stack Over ow

Semoga bermanfaat.

Artikel lain yg mungkin ingin anda baca:

• Penjelasan Sederhana Tentang Time Complexity dan Big-O


Notation

https://medium.com/bee-solution-partners/cara-kerja-algoritma-k-nearest-neighbor-k-nn-389297de543e 5/7

Anda mungkin juga menyukai