Tugas2 Kelompok8
Tugas2 Kelompok8
K-NN
Analisis Kuantitatif (Kelompok B-8)
01
Al Izza Nugraza Wijaya Putra
NIM
10201008
ANGGOTA
02
Aliet Firdaus Marsyah
KELOMPOK
NIM
10201010
03
Arif Fadhillah
NIM
10201016
METODE ALGORITMA K-NEAREST NEIGHBOUR
Algoritma K-Nearest Neighbor (K-NN) adalah sebuah
metode klasifikasi terhadap sekumpulan data berdasarkan
pembelajaran data yang sudah terklasifikasikan sebelumya.
Termasuk dalam supervised learning, dimana hasil query
instance yang baru diklasifikasikan berdasarkan mayoritas
kedekatan jarak dari kategori yang ada dalam K-NN.
KELEBIHAN DAN
KEKURANGAN
METODE K-NN
KELEBIHAN
● Sangat Nonlinear
● Mudah Diimplementasikan
KEKURANGAN
● Harus Menunjukan Parameter K
● Tidak Menangani Missing Value Secara Implisit
● Sensitif Terhadap Data Outlier
● Rentan Terhadap Variabel Non-informatif
● Rentan Terhadap Dimensionalitas yang Tinggi
● Nilai Komputasi yang Tinggi
● Rentan Terhadap Perbedaan Rentang variabel
Cara Kerja Algoritma K-NN
● Menentukan Parameter K (variabel jumlah
tetangga terdekat yang akan diambil untuk
proses klasifikasi)
● Menghitung Kuadrat Jarak Euclidean Objek
Terhadap Data Training yang Diberikan
● Mengurutkan Hasil Dari Kuadrat Jarak
Euclidean Tadi Secara berurutan Dari Nilai
Tinggi ke Rendah
● Mengumpulkan Kategori Y (klasifikasi
nearest neighbour berdasarkan nilai k)
● Memprediksikan Kategori Objek Dengan
Menggunakan Kategori Nearest Neighbour
Mayoritas
Contoh Kasus
2 2 GOOD
3 5 ?
PENYELESAIAN
Langkah 1 Kita tentukan parameter K nya. Disini kita gunakan K = 3
Langkah 2
Hitung jarak antara data baru dengan semua data training. Kita menggunakan
Euclidean Distance. Kita hitung seperti pada table berikut
X Y Euclidean Distance Urutan Jarak Apakah Termasuk Dari kolom 4 (urutan jarak)
(3.5) 3-NN kita mengurutkan dari yang
terdekat ke terjauh antara
7 6 4.13 5 Tidak (K>3) jarak data baru dengan data
training. ada 2 jarak yang
sama (yaitu 4) pada data
6 6 3.16 4 Tidak (K>3)
baris 2 dan baris 6, sehingga
memiliki urutan yang sama.
6 5 3 3 Ya (K<3) Pada kolom 5 (Apakah
termasuk 3-NN?)
1 3 2.82 2 Ya (K<3) maksudnya adalah K-NN
menjadi 3-NN , karena nilai
2 4 1.41 1 Ya (K<3) K ditentukan sama dengan 3.
6 5 3 3 Ya (K=3) BAD
7 6 BAD
6 6 BAD
6 5 BAD
1 3 GOOD
2 4 GOOD
2 2 GOOD
3 5 GOOD
Data yang kita miliki pada baris 3, 4 dan 5 kita punya 2 kategori Good dan 1 kategori Bad. Dari jumlah
mayoritas (Good > Bad) tersebut kita simpulkan bahwa data baru (X=3 dan Y=5) termasuk dalam
kategori Good.
TERIMA
KASIH
Atas Perhatiannya