Algoritma K-Nearest
Neighbor Classification
Mustakim & Oktafiani, 2016 Akurasi 82%
Sebagai Sistem Prediksi
Predikat Prestasi Mahasiswa
• Merupakan metode yang sederhana, metode ini cukup mumpuni untuk menangani data
yang banyak dengan memanfaatkan kedekatan antar data .
Langkah-langkah Klasifikasi dengan KNN
■ Tentukan Nilai K
■ Hitung jarak antara data set dan data latih menggunakan persamaan.
Keterangan :
Xi = nilai dari data latih
Yi = nilai dari uji
i = variabel data
k= dimensi data
■ Urutkan tetangga berdasarkan nilai terkecil ke nilai terbesar
■ Pilih tetangga sebanyak K dari daftar yang sudah diurutkan
Preprocessing
Dengan menggunakan Teknik SMOTE (Synthetic Minority Over-Sampling
Technique).
DATASET
PREPROCESSING
(SMOTE)
MODEL(KNN)
EVALUASI (AKURASI,
PRECISION, RECALL DAN
ERROR RATE)
Sumber data & Pengolahan Data
Didapatkan dataset yang
Didapatkan dari SMKN 1 telah diberi SMOTE
Nglegok dengan data dengan 1877 instance
sebanyak 1460 instance Pemberian label Naik dan ( dengan Jumlah data
dan memiliki 68 atribut Turun Kelas Naik 977 dan Kelas
Turun 900)
Turun
E
MODEL EVALUASI
90
80
74.48
70 71.87 71.87
70.37 69.23 69.73
68.04 67.69
65.87
60 62.92
Persentase (%)
50
40
30
20
10
0
K=1 K=3 K=5 K=7 K=9
Nilai K
90
80 80.21
77.08 77.61
75.45
73.14 73.2 73.53 73.8
70 72.35 72.71
60
Persentase (%)
50
40
30
20
10
0
K=1 K=3 K=5 K=7 K=9
Nilai K
90
88.12
85.46
80 83.31
79.11
70 72.46
67.65
65.4 64.58 64.89
63.86
60
Persentase (%)
50
40
30
20
10
0
K=1 K=3 K=5 K=7 K=9
Nilai K
90
80
70
60
Persentase (%)
50
40
37.07
34.12
30 31.95 32.3
30.76 30.26
29.62
28.12 28.12
25.51
20
10
0
K=1 K=3 K=5 K=7 K=9
Nilai K
■ KNN + SMOTE memiliki akurasi yang lebih baik dibandingkan KNN, karena kelas
datanya seimbang.
■ Hasil klasifikasi menggunakan algoritma KNN memiliki akurasi terbesar dalam nilai k
= 9 yaitu sebesar 69,23% dan nilai error rate sebesar 30,76%. Sedangkan dalam KNN
menggunakan SMOTE memiliki akurasi terbesar dalam nilai k = 1 yaitu sebesar
74,48% dan nilai error rate sebesar 25,51%.
Terima Kasih