Anda di halaman 1dari 3

Uji Akurasi Data Kategori

Pramaditya Wicaksono, M.Sc.


Kartografi dan Penginderaan Jauh
Fakultas Geografi UGM
Data kategori terdiri dari data nominal dan ordinal dimana data ini sifatnya kualitatif
maupun semi kuantitatif. Data nominal merupakan data yang nilainya sejajar. Artinya,
antara data satu dengan data yang lain tidak memiliki tingkatan. Sebagai contoh adalah
informasi penggunaan lahan hasil klasifikasi digital. Pada hasil klasifikasi digital,
ladang/tegalan mempunyai kepentingan yang sama dengan sawah ataupun tambak dan
permukiman. Data ordinal merupakan data hasil kategorisasi yang nilainya memiliki
tingkatan dan tidak sejajar. Contohnya adalah informasi tematik kesesuaian lahan yang
memiliki kelas S1 (sangat sesuai), S2 (cukup sesuai), dan N (tidak sesuai). Pada jenis
data ini, S1 lebih baik daripada S2 dan S2 lebih baik daripada N yang berarti ada
tingkatan pada suatu data kategori.
Uji akurasi yang dilakukan pada data kategori ini pada umumnya adalah pengujian hasil
interpretasi visual, klasifikasi digital, dan pengelompokan nilai-nilai hasil transformasi
spektral. Teknik yang digunakan adalah tabel kontingensi yang pada ilmu penginderaan
jauh lebih dikenal dengan nama confusion matrix table. Table confusion matrix
merupakan tabel matriks yang menghubungkan antara piksel hasil klasifikasi dan
ground truth data yang informasinya dapat diambil dari data lapangan maupun peta
yang sudah diverifikasi. Informasi yang bisa diambil dari confusion matrix ini sangat
banyak antara lain overall accuracy, producer accuracy, user accuracy, kappa coefficient,
dan tau coefficient. Penjelasan untuk tiap-tiap unsur uji akurasi diatas diterangkan pada
bab-bab dibawah ini.
Table Confusion matrix
Contoh aplikasi penggunaan confusion matrix yang paling umum adalah untuk uji
akurasi hasil pemetaan penutup lahan. Aplikasi lain adalah untuk menguji akurasi hasil
pemetaan spesies vegetasi pada hutan, pemetaan habitat laut dangkal, pemetaan
kerapatan hutan, dan pemetaan lainnya. Pada bab ini, contoh yang digunakan adalah
penggunaan confusion matrix untuk menguji akurasi pemetaan habitat laut dangkal
yang berisi terumbu karang, pasir, makro alga, dan lamun (Wicaksono, 2010).
Pada bab sebelumnya telah diungkapkan bahwa ketika kita mengambil sampel
dilapangan, sebaiknya kita mengambil dua jenis sampel yaitu sampel untuk melakukan
proses re-interpretasi dan atau re-klasifikasi dan sampel untuk uji akurasi. Sampel ini
sebaiknya benar-benar terpisah dan independen untuk menghindari bias dari hasil
akurasi yang diperoleh. Terkadang kita sengaja memilih sampel untuk melakukan uji
akurasi demi mendapatkan akurasi pemetaan yang tinggi. Hanya saja, akurasi yang
tinggi ini nantinya hanya mencerminkan akurasi pada tiap titik yang tersampel saja,
tidak mampu merepresentasikan akurasi populasi piksel secara keseluruhan. Oleh
karena itu, sebaiknya sampel untuk uji akurasi diambil secara independen dan
lokasinya terdistibusi spasial secara merata.
Tabel 1. Uji akurasi pemetaan habitat bentik menggunakan model integrasi penghilangan kolom
air yang dikembangkan oleh Wicaksono (2010)
Kelas Pasir
Terumbu
Karang
Makro
Alga
Lamun Laut Total
User
Accuracy
Error
Comission
Pasir 14 2 0 0 0 16 87,5% 12,5%
Terumbu
Karang
1 36 3 4 0 44 81,82% 18,18%
Makro
Alga
5 5 3 1 0 14 21,42% 78,58%
Lamun 0 2 0 14 0 16 87,5% 12,5%
Laut 0 3 0 0 5 8 62,5% 37,5%
Total 20 48 6 19 5 98
Producer
Accuracy
70% 75% 50% 73,68% 100% Overall accuracy 73,46%
Error
Omission
30% 25% 50% 26,32% 0% Kappa 0,6222
Sumber: Wicaksono (2010)
Berikut ini adalah rumus untuk mendapatkan tiap nilai akurasi yang muncul pada tabel
diatas.
Overall accuracy (%) =
jumlah piksel yang terklasifikasi secara benar
jumlah sampel uji akurasi
100
Nilai overall accuracy (akurasi keseluruhan) menunjukan banyaknya jumlah piksel yang
terklasifikasi secara benar pada tiap kelas dibanding jumlah sampel yang digunakan
untuk uji akurasi pada semua kelas. Pada contoh Tabel 3.2, akurasi keseluruhan
menunjukkan nilai 73,46% yang berarti 73,46% piksel yang ada pada hasil klasifikasi
terklasifikasi dengan benar. Nilai dari uji akurasi ini yang paling banyak digunakan
untuk menguji akurasi suatu hasil interpretasi dan atau klasifikasi. Kelemahan metode
ini adalah tidak mempertimbangkan aspek kesalahan dari tiap kelas yang ada, untuk itu
biasanya overall accuracy selalu disertai user dan producer accuracy untuk tiap kelas.
Producer accuracy (%) =
jumlah sampel uji akurasi suatu kelas yang terklasifikasi benar
jumlah sampel uji akurasi pada suatu kelas
100
Error omission (%) = 100% - Producer accuracy
User accuracy (%) =
jumlah sampel uji akurasi suatu kelas yang terklasifikasi benar
jumlah sampel uji akurasi yang terklasifikasi sebagai kelas tersebut
100
Error comission (%) = 100% - User accuracy
Nilai dari user dan producer accuracy dihitung untuk tiap kelas yang ada dalam
klasifikasi. Begitu halnya juga dengan nilai error omisi dan komisi yang merupakan
residual dari producer dan user accuracy. Berikut ini adalah penjelasan untuk
menginterpretasi nilai-nilai tersebut beserta contohnya menggunakan kelas habitat
lamun pada Tabel 3.2.
Nilai user accuracy pada kelas lamun adalah sebesar 87,5% yang berarti 87,5% peluang
bahwa piksel yang terklasifikasi pada citra sebagai lamun adalah benar-benar lamun
pada kenyataan di lapangan. Dengan kata lain hanya ada 12,5% (error comission)
kemungkinan bahwa piksel yang dicitra terklasifikasi sebagai lamun adalah bukan
lamun di lapangan. Nilai user accuracy ini lebih banyak digemari oleh para pengambil
keputusan karena hasil klasifikasi mampu memberikan estimasi dan gambaran dari
kondisi sebenarnya dilapangan.
Nilai producer accuracy pada kelas lamun adalah 73,68% yang berarti ada 73,68%
lamun di lapangan pada area riset diklasifikasikan secara benar. Artinya 26,32% (error
omission) lamun di lapangan tidak terklasifikasi sebagai lamun. Nilai producer accuracy
ini umumnya lebih digemari oleh para thematician karena akurasi ini mampu
menunjukkan banyaknya objek dipermukaan bumi yang direpresentasikan dengan
benar pada peta atau hasil klasifikasi.
Kappa coefficient =
( x ) )
2

Keterangan:
N : total sampel untuk uji akurasi
X
kk
: jumlah piksel yang terklasifikasi secara benar
X
k
X
k
: jumlah sampel untuk uji akurasi untuk tiap tiap kelas dikalikan jumlah piksel
yang terklasifikasikan pada kelas tersebut dan ditambahkan untuk semua kelas.
Nilai kappa menunjukan perbandingan antara hasil klasifikasi yang diuji dengan hasil
klasifikasi acak. Dengan kata lain nilai kappa menunjukkan konsistensi akurasi hasil
klasifikasi. Nilai kappa ini akan selalu lebih rendah dibanding nilai overall accuracy
kecuali klasifikasinya mempunyai akurasi yang amat sangat tinggi. Nilai kappa pada
Tabel 3.2 adalah 0,6222 yang berarti hasil klasifikasi tersebut mampu menghindari
62,22% kesalahan yang akan muncul pada klasifikasi acak.

Gambar 1. Hasil klasifikasi pemetaan habitat bentik yang diuji pada Tabel 1.