Rizka Rahmadini Salim-1957301011 (Resume MetodeKNN Prak - KecerdasanBuatan)

RESUME
KECERDASAN BUATAN
Oleh :
Nama : Rizka Rahmadini Salim

Nim : 1957301011
Kelas : TI - 2A
Prodi : Teknik Informatika
Dosen Pengajar : Musta’inul Abdi, SST.,M.Kom.
KEMENTERIAN RISET, TEKNOLOGI DAN PERGURUAN

TINGGI POLITEKNIK NEGERI LHOKSEUMAWE
TAHUN AJARAN 2021
A. Pengertian Metode Classifications KNN (K Nearest Neighbours)
Algoritma K-Nearest Neighbor (K-NN) adalah sebuah metode klasifikasi
terhadap sekumpulan data berdasarkan pembelajaran data yang sudah
terklasifikasikan sebelumya. Termasuk dalam supervised learning, dimana
hasil query instance yang baru diklasifikasikan berdasarkan mayoritas kedekatan
jarak dari kategori yang ada dalam K-NN. Tujuan dari algoritma ini adalah untuk
mengklasifikasikan obyek baru berdasarkan atribut dan sample-
sample dari training data. Algoritma k-Nearest
Neighbor menggunakan Neighborhood Classification sebagai nilai prediksi dari
nilai instance yang baru.
Algoritma Perhitungan KNN

1. Menentukan parameter K sebagai banyaknya jumlah tetangga terdekat
dengan objek baru.
2. Menghitung jarak antar objek/data baru terhadap semua objek/data yan
gtelah di training.
3. Urutkan hasil perhitungan tersebut.
4. Tentukan tetangga terdekat berdasarkan jarak minimum ke K.
5. Tentukan kategori dari tetangga terdekat dengan objek/data.
6. Gunakan kategori mayoritas sebagai klasifikasi objek/data baru.
B. Klasifikasi Terdekat (Nearest Neighbor Classification)

Data baru yang diklasifikasi selanjutnya diproyeksikan pada ruang dimensi
banyak yang telah memuat titik-titik c data pembelajaran. Proses klasifikasi
dilakukan dengan mencari titik c terdekat dari c-baru (nearest neighbor). Teknik
pencarian tetangga terdekat yang umum dilakukan dengan menggunakan formula
jarak euclidean. Berikut beberapa formula yang digunakan dalam algoritma knn.
 Euclidean Distance
Jarak Euclidean adalah formula untuk mencari jarak antara 2 titik dalam ruang
dua dimensi.
 Hamming Distance
Jarak Hamming adalah cara mencari jarak antar 2 titik yang dihitung dengan
panjang vektor biner yang dibentuk oleh dua titik tersebut dalam block kode
biner.
 Manhattan Distance
Manhattan Distance atau Taxicab Geometri adalah formula untuk mencari
jarak d antar 2 vektor p,q pada ruang dimensi n.
 Minkowski Distance
Minkowski distance adalah formula pengukuran antar 2 titik pada ruang vektor
normal yang merupakan hibridisasi yang menjeneralisasi euclidean distance dan
mahattan distance.
Teknik pencarian tetangga terdekat disesuaikan dengan dimensi data, proyeksi,
dan kemudahan implementasi oleh pengguna.
C. Banyaknya k Tetangga Terdekat

Untuk menggunakan algoritma k nearest neighbors, perlu ditentukan banyaknya k
tetangga terdekat yang digunakan untuk melakukan klasifikasi data baru.
Banyaknya k, sebaiknya merupakan angka ganjil, misalnya k = 1, 2, 3, dan
seterusnya. Penentuan nilai k dipertimbangkan berdasarkan banyaknya data yang
ada dan ukuran dimensi yang dibentuk oleh data. Semakin banyak data yang ada,
angka k yang dipilih sebaiknya semakin rendah. Namun, semakin besar ukuran
dimensi data, angka k yang dipilih sebaiknya semakin tinggi.
D. Kelebihan dan Kekurangan dari Algoritma K-NN
Kelebihan
 Sangat nonlinear
kNN merupakan salah satu algoritma (model) pembelajaran mesin yang
bersifat nonparametrik. Pembahasan mengenai model parametrik dan
model nonparametrik bisa menjadi artikel sendiri, namun secara singkat,
definisi model nonparametrik adalah model yang tidak mengasumsikan
apa-apa mengenai distribusi instance di dalam dataset. Model
nonparametrik biasanya lebih sulit diinterpretasikan, namun salah satu
kelebihannya adalah garis keputusan kelas yang dihasilkan model tersebut
bisa jadi sangat fleksibel dan nonlinear.
 Mudah dipahami dan diimplementasikan
Kekurangan
 Perlu menunjukkan parameter K (jumlah tetangga terdekat)
 Tidak menangani nilai hilang (missing value) secara implisit
 Sensitif terhadap data pencilan (outlier)
 Rentan terhadap variabel yang non-informatif
 Rentan terhadap dimensionalitas yang tinggi
E. Contoh Soal Perhitungan KKN

Diberikan data Training berua dua atribut Bad dan Good untuk
mengklasiikasikan sebuah data apakah tergolong Bad atau Good , berikut ini
adalah contoh datanya :
contoh data training
Kita diberikan data baru yang akan kita klasifikasikan, yaitu X = 3 dan Y = 5. Jadi
termasuk klasifikasi apa data baru ini ? Bad atau Good ?
Langkah penyelesaian
 Pertama, Kita tentukan parameter K. Misalnya kita buat jumlah tertangga
terdekat K = 3.
 Ke-dua, kita hitung jarak antara data baru dengan semua data training. Kita
menggunakan Euclidean Distance. Kita hitung seperti pada table berikut :
perhitungan jarak dengan euclidean distance
 Ke-tiga, kita urutkan jarak dari data baru dengan data training dan menentukan
tetangga terdekat berdasarkan jarak minimum K.
pengurutan jarak terdekat data baru dengan data training
Dari kolom 4 (urutan jarak) kita mengurutkan dari yang terdekat ke terjauh
antara jarak data baru dengan data training. ada 2 jarak yang sama (yaitu 4)
pada data baris 2 dan baris 6, sehingga memiliki urutan yang sama. Pada kolom
5 (Apakah termasuk 3-NN?) maksudnya adalah K-NN menjadi 3-NN , karena
nilai K ditentukan sama dengan 3.
 Ke-empat, tentukan kategori dari tetangga terdekat. Kita perhatikan baris 3, 4,
dan 5 pada gambar sebelumnya (diatas). Kategori Ya diambil jika nilai K<=3.
Jadi baris 3, 4, dan 5 termasuk kategori Ya dan sisanya Tidak.
penentuan kategori yang termasuk K=3

Kategori ya untuk K-NN pada kolom 6, mencakup baris 3,4, dan 5. Kita
berikan kategori berdasarkan tabel awal. baris 3 memiliki kategori Bad, dan 4,5
memiliki kategori Good.
 Ke-lima, gunakan kategori mayoritas yang sederhana dari tetangga yang
terdekat tersebut sebagai nilai prediksi data yang baru.
hasil klasifikasi berdasarkan kategori mayoritas
Data yang kita miliki pada baris 3, 4 dan 5 kita punya 2 kategori Good dan 1
kategori Bad. Dari jumlah mayoritas (Good > Bad) tersebut kita simpulkan
bahwa data baru (X=3 dan Y=5) termasuk dalam kategori Good.
Referensi
https://www.ketutrare.com/2018/11/algoritma-k-nearest-neighbor-dan-contoh-
soal.html
https://informatikalogi.com/algoritma-k-nn-k-nearest-neighbor/
https://www.advernesia.com/blog/data-science/pengertian-dan-cara-kerja-algoritma-
k-nearest-neighbours-knn/
https://ilmudatapy.com/algoritma-k-nearest-neighbor-knn-untuk-klasifikasi/
https://medium.com/bee-solution-partners/cara-kerja-algoritma-k-nearest-neighbor-k-
nn-389297de543e

Rizka Rahmadini Salim-1957301011 (Resume MetodeKNN Prak - KecerdasanBuatan)

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Rizka Rahmadini Salim-1957301011 (Resume MetodeKNN Prak - KecerdasanBuatan)

Diunggah oleh

Hak Cipta:

Format Tersedia

RESUME

Nama : Rizka Rahmadini Salim

KEMENTERIAN RISET, TEKNOLOGI DAN PERGURUAN

Algoritma Perhitungan KNN

B. Klasifikasi Terdekat (Nearest Neighbor Classification)

C. Banyaknya k Tetangga Terdekat

E. Contoh Soal Perhitungan KKN

perhitungan jarak dengan euclidean distance

penentuan kategori yang termasuk K=3

Anda mungkin juga menyukai