Anda di halaman 1dari 5

TUGAS KELOMPOK

DATA MINING
Diajukan Sebagai Salah Satu Syarat Dalam Menyelesaikan Mata Kuliah Data Mining Di
Jurusan Sistem Informasi Fakultas Sains dan Teknologi UIN SUSKA RIAU

Tugas Poster
K-Nearest Neighbors for Classification
Disusun Oleh:

BAMBANG SETIAWAN
AULIA RAHMAN
ARIE BIOLA GUNTI MASUKO

(11353100155)
(11353100664)
(11353105771)

UIN SUSKA RIAU

PROGRAM STRATA 1
SISTEM INFORMASI FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS ISLAM NEGERI SULTAN
SYARIF KASIM RIAU
2015

K-Nearest Neighbors for Classification


A. Klasifikasi K-Nearest Neighbor
1. Pengertian
Algoritma k-nearest neighbor (KNN) adalah sebuah metode untuk
melakukan klasifikasi terhadap objek yang berdasarkan dari data
pembelajaran yang jaraknya paling dekat dengan objek tersebut. KNN
meupakan algoritma supervised learning dimana hasil dari query
instance yang baru diklasifikan berdasarkan mayoritas dari kategori
pada algoritma KNN. Dimana kelas yang paling banyak muncul yang
nantinya akan menjadi kelas hasil dari klasifikasi.
2. Tujuan
Tujuan algoritma ini adalah mengklasifikasikan obyek baru
berdasarkan atribut dan training sample. Didalam classifier tidak
menggunakan model apapun untuk dicocokkan dan hanya berdasarkan
pada suatu memori. Titik query, akan ditemukan sejumlah K obyek atau
(titik training) yang paling dekat dengan titik query. Algoritma knearest neighbor

(KNN) menggunakan klasifikasi ketetanggaan

sebagai nilai prediksi dari query instance yang baru.


Algoritma metode k-nearest neighbor (KNN) sangatlah sederhana,
bekerja berdasarkan jarak terpendek dari query instance ke training
sample untuk menentukan KNN-nya. Training sample diproyeksikan ke
ruang

berdimensi

banyak,

dimana

masing-masing

dimensi

merepresentasikan fitur dari data. Ruangini dibagi menjadi bagianbagian berdasarkan klasifikasi training sample. Sebuah titik pada ruang
ini ditandai oleh kelas jika kelas (c) merupakan klasifikasi yang paling
banyak ditemui pada K (tetangga terdekat dari titik tersebut). Dekat atau
jauhnya tetangga biasanya dihitung berdasarkan Euclidean Distance.
Jarak Euclidean paling sering digunakan menghitung suatu jarak.

Dimana jarak euclidean memiliki fungsi untuk menguji ukuran yang


bisa digunakan sebagai interpretasikedekatan jarak antara dua obyek.
3. Algoritma
Langkah yang digunakan dalam metode K-Nearest Neighbor :
1. Tentukan parameter K (jumlah tetangga paling dekat).
2. Hitung kuadrat jarak euclid masing masing objek terhadap data
sample yang diberikan.
3. Urutkan objek objek kedalam kelompok yang memiliki jarak
terkecil.
4. Kumpulkan kategori Y (Klasifikasi nearest neighbor).
5. Dengan kategori nearest neighbor yang paling banyak, maka dapat
diprediksikan nilai query instance yang telah dihitung.

4. Keuntungan dan Kelemahan


Kelebihan dari metode KNN :
1. Lebih efektif di data yang besar.
2. Dapat menghasilkan data yang lebih akurat.
Kekurangan dari metode KKN :
1. Perlu untuk menentukan nilai k yang optimal sehingga untuk
menyatakan jumlah tatangga terdekatnya lebih mudah.
2. Biaya komputasi yang cukup tinggi karena perhitungan jarak harus
dilakukan pada setiap querry instance.

5. Study Kasus

Rumus :

Contoh soal

Penyelesaian :

Referensi :

sri kusumadani.2012.SISTEM PENDUKUNG KEPUTUSAN BERBASIS SMS


UNTUK MENENTUKAN STATUS GIZI DENGAN METODE K-NEAREST
NEIGHBOR.Yogyakarta: Universitas islam indonesia
http://id.scribd.com/doc/57208138/Metode-Algoritma-KNN
https://id.wikipedia.org/wiki/KNN

Anda mungkin juga menyukai