Gambar 5.2: Ilustrasi klastering antara data pelanggan yang memilik atribute
umur (age) dan pendapatan(income).
Klasifikasi memiliki dua jenis model yaitu ;
1. Pemodelan deskriptif (descriptive modelling) yakni model klasifikasi
yang berfungsi alat penjelas guna membedakan objek-objek dari klas
yang berbeda. Contoh dari pemodelan deskriptif adalah : struktur
organisasi, tabel pengelompokan tanaman.
2. Pemodelan prediktif (predivtive modelling) yaitu model klasifikasi
yang digunakan untuk memprediksi label klas untuk record yang tidak
Bab 5 Klasifikasi Citra dengan K-NN 105
Gambar 5.3: Algoritma K-NN, Kelas yang baru dari suatu data akan dipilih
berdasarkan group klasnya yang paling dekat jarak vectornya (Informatikalogi,
2017)
Algoritma K-Nearst Neighbor (K-NN) menggunakan klasifikasi dengan nilai
ketetanggan sebagai nilai prediksi dari query instance yang baru. Dalam hal ini
jumlah data terdekat ditentukan oleh user yang dinyatakan dengan k, misal user
menentukan k=6, maka setiap data testing atau data latih dihitung jaraknya
terhadap data training dan dipilih 6 data training yang jaraknya paling dekat ke
data testing. Kemudian akan periksa outputnya atau labelnya masing-masing,
dan kemudian ditentukan output mana yang frekuensinya paling banyak. Tujuan
algoritma K-NN adalah untuk mengklasifikasikan objek baru berdasarkan data
training sebelumnya.
Untuk menghitung nilai jarak antar dua titik yaitu titik pada data latih dan titik
pada data testing maka dapat dipergunakan rumus Euclidien Distance seperti
berikut:
Di mana :
d adalah jarak antara titik pada data training x dan titik data testing y yang
akan diklasifikasi.
i =nilai atribut
xi = citra query.
Yi=citra database dengan k vektor.
n = dimensi atribut
3. Kemudian mengurutkan objek-objek termasuk kedalam kelompok
yang mempunyai jarak terkecil.
4. Mengumpulkan kategori Y (klasifikasi nearest neighbor berdasarkan
nilai k)
5. Mencari label Mayoritas untuk menentukan hasil klasifikasi.
Start
End
Gambar 5.5: Contoh Motif batik, (a) Batik Parang, (b) Batik Ceplok
Contoh klasifikasi citra batik yang akan dibahas yakni pada citra batik Parang
yakni mengklasifikasikan citra batik tersebut tergolong batik parang atau bukan.
Berikut adalah gambaran secara umum algoritma K-NN dalam klasifikasi citra
batik.
Gambar 5.7: (a) data citra asli, (b) perubahan orientasi citra, (c) cropping
ukuran citra 256x256 pixel
Untuk proses ekstraksi ciri dapat dipergunakan metode ekstraksi ciri yang ada
pada proses pengolahan citra (image processing) seperti: Geometric Moment
Invariant, paket Wavelet, GLCM dan lainnya. Pada studi kasus ini akan
dipergunakan Geometric moment Invariant dalam proses ekstraksi ciri bentuk
pada pola batiknya. Tahapan pada proses ekstraksi ciri bentuk yakni pertama
dengan mensegmentasi background untuk memisahkan objek dengan
background citra, kemudian menthreshod sehingga menjadi gambar biner
dengan menggunakan tolak ukur pengubah nilai pixel apakah menjadi nilai 0
(hitam) atau 255 (putih).
Bab 5 Klasifikasi Citra dengan K-NN 111
klasifikasi K-NN digunakan untuk menentukan kelas dari citra batik yang baru.
Klasifikasi K-NN dilakukan dengan mencari k buah tetangga terdekat dari data
uji dan memilih kelas dengan anggota terbanyak.
Setelah proses klasifikasi maka dilakukan evaluasi terhadap kinerja klasifikasi.
Penerapan algoritma K-NN pada suatu pengklasifikasian yang dilakukan
melalui beberapa kali pengujian (testing) dan perlu dievaluasi atau diukur
keakuratan klasifikasi dengan model tersebut. Keakuratan (accuracy) dari
pengklasifikasian merupakan presentase dari banyaknya data uji yang
diklasifikasikan dengan tepat oleh sebuah model klasifikasi. Confusion matrix
atau yang dikenal dengan matrik klasifikasi sering digunakan untuk
memprediksi keakuratan model klasifikasi tersebut. Confusion matrix
memberikan informasi perbandingan klasifikasi actual dengan klasifikasi yang
dihasilkan melalui sistem klasifikasi (Kohavi.Provost, 1998). Table confusion
matrix menggunakan dua kategori yakni positif dan negatif.
Prediksi
Positif Negatif
Positif TP FN
Aktual
Negatif FP TN
True Positif (TP) dan True Negatif (TN) adalah berisikan informasi jumlah
klasifikasi kelas kategori positif dan negatif yang diprediksi dengan benar oleh
sistem klasifikasi sesuai dengan kelas positif dan negatif pada keadaan actual.
Sedangkan False Positif (FP) dan False negatif (FN) adalah jumlah klasifikasi
kelas kategori yang salah diprediksi oleh sistem klasifikasi. Akurasi dapat
dihitung dengan membandingkan hasil menjumlahkan banyaknya klasifikasi
yang benar pada kelas positif dan negatif dengan keseluruhan data. Persamaan
untuk menghitung akurasi yang menunjukan komposisi jumlah dari prediksi
yang benar adalah (Kohavi.Provost, 1998):
TP TN
Akurasi =
TP FP TN FN
Klasifikasi hasil perhitungan nilai keakuratan dapat didiagnosa dalam rentang
sebagai berikut yang kemudian untuk presentasenya dikalikan 100%:
1. Akurasi bernilai 0.90-1.00 = excellent classification. Nilai 90%-100%
dapat disimpulkan hasil klasifikasi mendekati sempurna (luar biasa).
Bab 5 Klasifikasi Citra dengan K-NN 113
Dari hasil percobaan yang dilakukan pada studi kasus ini menggunakan 120 data
citra dan metode klasifikasi K-NN, evaluasi klasifikasi menunjukkan rata-rata
nilai presentase 83%. Dengan nilai tertinggi yaitu 88% pada nilai k=1. Sehingga
dikategorikan klasifikasi citra dengan algoritma K-NN memiliki hasil nilai
kategori klasifikasi yang baik (good clasification).