Anda di halaman 1dari 5

PENGENALAN ANGKA JAWA DENGAN MENGGUNAKAN METODE K-NEAREST NEIGHBOUR

Kuntadi Widiyoko (612007009)


Program Studi Teknik Elektro Universitas Kristen Satya Wacana, Salatiga e-mail:widie_kunt@ymail.com

Abstrak Manusia dengan mudah dapat mengelompokan suatu deretan angka menjadi beberapa kelas berdasarkan kemiripannya. Kemampuan manusia ini bila ditanamkan pada sebuah sistem akan memiliki banyak manfaatnya salah satunya sebagai alat alih bahasa. Dalam penelitian ini kemampuan manusia dalam memilah-milah angka di aplikasikan pada sebuah system. Dengan menggunakan tools yang ada pada MATLAB 7.8(R2009b) proses pengenalan angka jawa dilakukan dan kemudian diterjemahkan menjadi angka desimal dari 0-9 seperti yg telah kita kenal. Data tulisan jawa yang diperoleh berupa tulisan tangan dari 21 orang. Setiap orang pasti memiliki jenis tulisan yang berbeda-beda. Sehingga akan didapat sebanyak 21 variasi. Data tulisan tangan tersebut kemudian di ubah menjadi citra digital melalui proses akuisisi menggunakan scanner. Setelah melewati proses preprocessing kita melakukan pengelompokan data-data yang diperoleh dengan menggunakan algoritma k-nearest neighbor. Dalam algoritma tersebut juga di aplikasikan correlation distance untuk pengukuran jarak terdekat antar data. Keakuratan program yang dibuat di uji dengan 20 data testing. 20 data uji tersebut akan digunakan untuk menilai performa sistem dengan k=1,3 dan 7. Untuk k=1 akan diperoleh akurasi sebesar 45%, untuk k=3 diperoleh akurasi sebesar 40% sedangkan untuk k=7 diperoleh akurasi sebesar 15% Katakunci : nearest neighbour, angka jawa, edge detection, correlation distance

I.Pendahuluan Banyak peninggalan-peninggalan bersejarah di Indonesia tertulis menggunakan aksara jawa. Sayangnya tidak semua orang bisa membaca dan mengerti apa yang tertulis pada prasasti-prasasti tersebut. Sebenarnya kalau kita cermati tulisan-tulisan tersebut merupakan sebuah gambaran atau rentetan peristiwa yang terjadi pada saat itu yang memiliki nilai sejarah yang sangat tinggi. Aksara jawa yang lebih kita kenal dengan Aksara Hanacaraka merupakan aksara jenis abugida atau campuran antara aksara silabik dan aksara alphabet. Aksara Hanacaraka yang sekarang kita kenal sekarang merupakan pengembangan dari Aksara Brahmi dari Hindustan yang mengalami perubahan [1]. Aksara jawa didalamnya juga menerapkan sistem angka decimal. Hanya saja bentuknya berbeda dengan angka decimal yang kita kenal saat ini. Pada sistem pengenalan angka ini angka jawa akan diolah sehingga nantinya dapat diterjemahkan menjadi bentuk angka decimal yang biasa kita gunakan sehari hari.

1 1

2 2

3 3

4 4

5 5

6 6

7 7

8 8

9 9

0 0

Gambar 1. Angka Jawa dan Terjemahannya II.Prepocessing Preprocessing adalah suatu tahap dimana citra direkayasa sedemikian rupa guna mendukung proses pengenalan. Pada tahap preprocessing ini, citra digital akan mengalami beberapa perlakuan seperti : A. Penskalaan Penskalaan ini dilakukan dengan menggunakan tools pada MATLAB. Penskalaan digunakan untuk mengubah ukuran citra masukan yang memiliki besar 185x31 pixel menjadi 80x40 pixel. Pengubahan ukuran ini bertujuan untuk mempercepat proses komputasi. B. Edge Detection Dengan menggunakan edge detection kita bisa melakukan proses segmentasi citra. Segmentasi yang dilakukan ini berdasarkan keberadaan perubahan tingkat intensitas yang mendadak (abrupt) [ 2]. Pada perancangan kali ini digunakan metode Canny. Metode Canny dipilih karena hasil proses edge detection dengan metode ini lebih bagus daripada menggunakan operator lain seperti Sobel, Prewitt, dan Roberts. Metode Canny merupakan sebuah algoritma yang bertingkat yang digunkan untuk mendeteksi rentang dari tepian citra [3]. Metode ini akan mendeteksi tepi dengan mencari gradien maksimal dari suatu citra. Gradien tersebut dihitung dengan menggunakan turunan dari Gaussian filter. Metode ini menggunakan dua thresholds untuk mencari tepian yang terlihat kurang jelas yang terhubung dengan tepian yang jelas [4]. Pada MATLAB threshold untuk mendeteksi tepian yang kurang jelas besarnya 0.4* threshold tepian yang terlihat jelas.

Gambar 2.Proses Edge Detection Citra RGB

III.K-NN Classify

Metode pengklasifikasian objek dengan algoritma ini merupakan pengklasifikasian objek berdasarkan suara terbanyak dari tetangga-tetangganya, dengan objek tersebut diklasifikasikan pada kelas yang paling umum diantara k-tetangga terdekat, dengan k bilangan bulat positif [5]. Pemilihan nilai k yang besar akan memiliki banyak keuntungan seperti menambah akurasi klasifikasi, tetapi bila nilai k terlalu besar justru akan merusak lokasi estimasi data [6]. Pada algoritma klasifikasi nearest neighbor ini juga diterapkan correlation yang digunakan dalam pengukuran kesamaan antara data dengan tester. Rumus mencari correlation :

..(3.1)

Dimana

.(3.2)

..(3.3)

Metode correlation adalah sebuah metode yang mengukur nilai kesamaan dibanding ketidak samaan antara database dengan data uji kita.Secara sederhana bisa dikatakan semakin besar nilai perbandingan yang didapat maka kedua data merupakan angka yang sama.

Gambar 3. Bagan Proses Sistem

IV. Implementasi dan Hasil

Data yang diambil merupakan tulisan tangan yang selanjutnya diproses menggunakan scanner yang terdapa pada printer HP DESKJET F2410. Citra yang dihasilkan selanjutnya di-crop secara manual sehingga menghasilkan citra berukuran 185x31 pixel. Selanjutnya citra di resize oleh sistem menjadi 80x40 pixel. Database berasal dari 21 orang yang diminta menuliskan aksara jawa dari 0-9, sehingga total jumlah database sejumlah 210 buah citra. 210 citra databse ini akan diubah menjadi vector kolom yang berdimensi 3200. Citra uji berasal dari 2 orang (bukan responden yang tulisannya dijadikan database) yang diminta menuliskan angka jawa dari 0 sampai 9 sehingga didapat 20 citra uji. Pengolahan citra terdiri dari preprocessing yang mengubah citra masukan yang berupa RGB menjadi citra biner. Yang kemudian disegmentasi menggunakan edge detection . Selanjunya citra yang sudah disegmentasi ini akan di klasifikasi dengan menggunakan k nearest neighbor dengan nilai k yang diubah-ubah. Tiap perubahan k akan dihitung tingkat akurasi sistemnya dengan menggunkan rumus akurasi = Di bawah ini merupakan table hasil uji sistem menggunakan data tester. Nama file 0 0_1 1 1_1 2 2_1 3 3_1 4 4_1 5 5_1 6 6_1 7 7_1 8 8_1 9 9_1 akurasi k=1 0 7 1 1 2 7 1 5 6 1 4 0 6 6 7 1 7 8 9 7 45% k-nn k=3 0 7 2 1 3 1 3 7 6 5 8 4 6 6 7 1 8 9 9 8 40% X 100%.

k=7 0 4 2 6 3 5 1 7 7 5 1 1 4 6 7 5 8 7 1 7 15%

Dari table diatas bisa diketahui angka 9 sering dikenali menjadi angka 7. Angka 5 sering dikenali menjadi angka 4 atau 0 begitu juga sebaliknya angka 4 dikenali menjadi angka 0 atau 5 bahkan juga dikenali menjadi angka 6. Faktor seperti kemiripan bentuk angka mempengaruhi kesalahan pada sistem. Seperti yang terlihat pada kemiripan angka 4,5 dan 0. Kemiripan serupa juga terjadi pada angka 9 dan 7.

Tabel dibawah menunjukan beberapa tipe kemiripan yang mengakibatkan seringnya terjadi kesalahan pengenalan oleh sistem

5 2 3

7 9 1

Kemiripan tipe 1. Yang termasuk tipe ini adalah angka 4,5 dan 0. Kemiripan tipe 2. Yang termasuk tipe ini adalah angka 2 dan 3. Kemiripan tipe 3. Yang termasuk tipe ini adalah angka 7,9 dan 1.

V. Simpulan Nilai k yang berbeda- beda membuat sistem memiliki tingkat akurasi yang berbeda- beda pula. Nilai k=1 memiliki akurasi 45%, nilai k=3 memiliki akurasi sebesar 40% sedangkan nilai k=7 memiliki akurasi sebesar 15%. Hasil terbaik diperoleh dengan menggunakan k=1. Penelitian ini bisa dikembangkan sebagai alat alih bahasa. Tidak hanya mampu menerjemahkan objek angka saja tetapi juga mampu menerjemahkan objek huruf dari berbagai macam jenis huruf yang ada di dunia. Selain itu peningkatan akurasi ketelitian sistem guna menunjang kinerja sistem akan menjadi hal yang perlu diperbaiki dalam penelitian selajutnya.

DAFTAR PUSTAKA

[1] Angka Jawa, http://jv.wikipedia.org/wiki/Hanacaraka

[2] Setyawan, Iwan, Dasar-dasar Machine Vision, Widya Sari, 2012.


[3] Canny Edge Detection, http://en.wikipedia.org/wiki/Canny_edge_detector
[4] Indira Merli,Yuliana Eva, Suprihatin Wahyu, Bertalya, Perbandingan Metode Pendeteksi Tepi Studi Kasus : Citra USG Janin. Timotius K, Ivanna, Pengenalan Pola,Widya Sari,2012.

[5]

[6] Santoso Imam, Christyono Yuli, Indriani Mita,Kinerja Pengenalan Citra Tekstur Menggunakan Analisis Tekstur Metode Run Length, 2007 [7] Putra, Darma, Pengolahan Citra Digital, ANDI Jogjakarta, 2010