Oleh:
Muhamad Nur Azmi Wahyudi
K3519053
1.1 Ringkasan
Menurut Santosa (2007), data mining merupakan kegiatan
pengumpulan dan pemakaian data historis yang bertujuan untuk
menemukan keteraturan, pola, atau hubungan dalam suatu set
data yang berukuran besar. Pendapat lainnya, Suntoro (2019)
menjelaskan bahwa data mining merupakan proses untuk
mendapatkan informasi berguna yang diekstraksi dari suatu
basis data yang besar sehingga didapatkan informasi baru yang
dapat membantu dalam pengambilan keputusan.
Salah satu metode atau algoritma dalam data mining
adalah K-Nearest Neighbor (KNN). Laporan ini bertujuan
menjelaskan terkait KNN beserta review contoh penerapannya
dalam penelitian.
1.2 KNN
Menurut Liantoni (2015) algoritma KNearest Neighbor
(KNN) adalah metode untuk mengklasifikasikan objek
berdasarkan data latih yang paling dekat dengannya. Data latih
diproyeksikan ke dalam ruang multidimensi di mana setiap
dimensi mewakili karakteristik data. Algoritma KNN berisi
metode yang menggunakan algoritma yang supervised
(diawasi). Perbedaan antara supervised learning dan
unsupervised learning adalah supervised learning bertujuan
untuk menemukan pola baru dalam data dengan
mengasosiasikan pola data yang ada dengan data baru. Dalam
unsupervised learning, data belum memiliki pola. Tujuan dari
unsupervised learning adalah untuk menemukan pola dalam
data.
√∑
n
2
d xy = ( xi + y i )
i=1
Keterangan :
d xy = Jarak kedekatan
x = Data Testing
y = Data Training
n = Jumlah atribut, 1 sampai n
Kelemahan:
1. Perlu menentukan nilai K (jumlah tetangga
terdekat).
2. Training berdasarkan jarak tidak jelas mengenai
jenis jarak apa yang harus digunakan.
3. Atribut mana yang harus digunakan untuk
mendapatkan hasil terbaik.
4. Biaya komputasi cukup tinggi karena diperlukan
perhitungan jarak dari tiap query instance pada
keseluruhan training sample.
Berbeda halnya dengan hasil uji untuk k=3, untuk k=5 dari
114 data yang diujihanya terdapat 101 data dengan hasil
klasifikasi yang benar, dan 14 data yang salah dalam klasifikasi.
Melalui perhitungan persamaan (2) dan (3) juga nilai akurasi
yang dihasilkanuntuk k=5 adalah 76,2% dengan error rate 0,193.
Table 5. Hasil klasifikasi untuk k = 7
Daftar Pustaka
Bachri, O. S., & Bhakti, R. M. H. (2021). Penentuan Status Stunting
pada Anak dengan Menggunakan Algoritma KNN. Jurnal
Ilmiah Intech: Information Technology Journal of UMUS,
3(02), 130-137.
Lestari, M. E. I. (2015). Penerapan algoritma klasifikasi Nearest
Neighbor (K-NN) untuk mendeteksi penyakit jantung.
12