Abstrak— Indonesia, khususnya wilayah Aceh mempunyai kerusakan, untuk itu perlu dilakukan proses digitalisasi agar
banyak peninggalan manuskrip kuno salah satunya adalah kitab dapat terjaga dengan baik. Proses digitalisasi merupakan
bahasa Arab Jawi. Tulisan Jawi atau dokumen jawi kuno sudah salah satu perkembangan dari teknologi citra digital. Citra
banyak disimpan dalam bentuk digital akan tetapi untuk mengenali digital adalah citra kontinu yang diubah dalam bentuk
tulisan Jawi atau dokumen kuno tersebut dibutuhkan metode diskrit, baik koordinat ruang maupun intensitas cahayanya.
ekstraksi fitur. Metode ekstraksi yang digunakan dalam penelitian Dokumen-dokumen kuno yang telah rusak dan
ini adalah metode momen zernike sebagai fitur untuk mengenali
susah dikenali karakternya perlu dilakukan proses
karakter Jawi cetak. Metode menghitung keenam nilai momen
digitalisasi, proses digitalisai dapat dilakukan dengan
zernike yang nantinya setiap nilai momen yang didapatkan akan
dikombinasikan, hasil dari kombinasi dapat digunakan sebagai menggunakan apikasi OCR (Optical Character
fitur. Dengan melakukan kombinasi karakter yang berbeda pada Recognition). Untuk membangun OCR dibutuhkan metode
keenam nilai momen zernike dapat menghasilkan sebuah ekstraksi fitur, metode ekstraksi fitur yang akan digunakan
kombinasi yang unik dan dapat digunakan untuk melakukan proses dalam penelitian ini yaitu metode momen zernike.
pengenalan karakter Arab Jawi. Penggunaan momen zernike
sebagai ektraksi fitur mempunyai tingkat keberhasilan 95.27 %.
II. TINJAUAN PUSTAKA
Kata Kunci—momen zernike, ekstraksi fitur, karakter arab A. Citra
jawi. Suatu citra merupakan subuah fungsi intesitas
I. PENDAHULUAN yang memiliki dimensi f(x, y), dimana x dan y adalah
koordinat spasial dan f pada titik (x, y) merupakan tingkat
Islam masuk ke Indonesia sejak abad ke-7 Masehi dan kecerahan (brightness) suatu citra pada suatu titik (x, y).
berlangsung dalam waktu yang lama yaitu sampai abad 13 Citra diperoleh dengan cara penangkapan kekuatan sinar
Masehi. Perkembangan Islam pertama kali diawali di Aceh yang dipantulkan oleh suatu objek. Pengolahan citra
yaitu daerah Pasai di Aceh Utara dan pantai barat Sumatera. merupakan suatu proses pengolahan sinyal yang inputnya
Pada abad ke-17 tulisan Jawi mulai diperkenalkan di Aceh. adalah suatu citra [3].
Tulisan Jawi berasal dari huruf Arab dan disebarkan oleh Salah satu bagian dari pengolahan citra adalah
pedangan yang membangun Indonesia [1]. analisis citra. Pada analisis citra bagian-bagian citra
Seiring dengan perkembangan zaman penggunaan citra diproses untuk mengenali atau mengelompokkan objek.
digital tidak asing lagi dan merupakan suatu hal yang Untuk pengenalan objek langkah-langkah yang digunakan
menarik untuk dikaji lebih lanjut. Dengan kemajuan teknik adalah :
pengolahan citra digital dapat memudahkan dalam a. Denoising
mendapatkan gambar. Salah satu yang keuntungan dari b. Segmentasi
kemajuan teknik digital yaitu metode penyimpanan c. Ekstraksi fitur
pengenalan huruf-huruf yang ada didalam dokumen kuno. d. Pengenalan pola
Indonesia, khususnya Aceh banyak memiliki
peninggalan dokumen-dokumen kuno salah satunya B. OCR (Optical Character Recognition)
dokumen Arab Jawi. Dokumen-dokumen tersebut banyak OCR (Optical Character Recognition) merupakan
yang luput dari perhatian sehingga banyak yang mengalami sebuah software simulasi yang dapat digunakan untuk
15
Vol.1 No.3 2016 @2016 kitektro
KITEKTRO: Jurnal Online Teknik Elektro e-ISSN: 2252-7036
Vol.1 No.3 2016: 15-20
Berikut ini merupakan tahapan-tahapan proses OCR Gambar 2 Huruf dasar Arab Jawi
secara umum.
F. Momen zernike
Momen zernike dipilih karena merupakan invarian
untuk rotasi dan tidak sensitif noise. Keuntungan lain dari
momen zernike adalah kemudahan rekonstruksi citra karena
orthogonal nya.
Momen zernike adalah proyeksi fungsi gambar ke
fungsi berbasis orthogonal. Momen zernike juga memiliki
fungsi rotasi invarian dimana nilai momen zernike tidak
akan berubah terhadap gambar yang diputar. Kelebihan lain
dari momen zernike adalah kemudahan rekonstruksi citra
karena fungsi orthogonalitas. Kelemahan utama dari
momen zernike adalah kompleksitas komputasi.
Gambar 1 Proses OCR secara umum Perhitungan ini didasarkan pada hubungan antara geometris
C. Ekstraksi Fitur invarian dan momen zernike untuk memperoleh zernike
Ekstraksi fitur dapat digunakan untuk mengenali atau invarian. Sifat momen zernike adalah sebagai berikut [12].
mengklasifikasikan objek dalam gambar, fitur ini digunakan Momen dua dimensi dengan orde (p+q) dari suatu citra
dalam pola untuk memperoleh classifier final kelas. dengan ukuran MxN didefinisikan sebagai :
Ekstraksi fitur bertujuan untuk mendeteksi atau mencari
𝑀−1 𝑁−1
daerah yang signifikan pada gambar dan tergantung pada
karakteristik intrinsik dan aplikasi. Wilayah yang akan 𝑚𝑝𝑞 = ∑ ∑ 𝑥 𝑝 𝑦 𝑞 𝑓(𝑥, 𝑦) (1)
𝑋=0 𝑌=0
diekstraksi tersebut dapat didefinisikan dalam lingkungan
global atau lokal. Ekstraksi fitur bisa berdasarkan bentuk dengan
dan warna, metode ekstaksi fitur berdasarkan bentuk yaitu
momen invarian hu dan momen zernike [6]. mpq = momen citra digital
p, q = orde momen
D. Pengenalan Pola f = nilai intensitas citra
Pengenalan pola merupakan suatu sistem yang x, y = koodinat piksel
digunakan untuk mengidentifikasikan atau mengenali objek Dimana p = 0,1,2,… dan q = 0,1,2,…adalah nilai bilangan
didalam citra. Dapat dipakai untuk mengenali pola huruf, bulat. Kemudian momen pusat (central moment) orde (p+q)
angka, suara, tanda tangan, kualitas benda yang sudah di definisikan sebagai :
sedikit berubah. dapat diidentifikasi serta diberi nama 𝑀−1 𝑁−1
melalui ciri-cirinya (feature). Ciri-ciri pola dapat digunakan 𝜇𝑝𝑞 = ∑ ∑(𝑥 − 𝑥̅ )𝑝 (𝑦 − 𝑦̅)𝑞 𝑓(𝑥, 𝑦) (2)
untuk membedakan suatu pola dengan pola lainnya, pola 𝑋=0 𝑌=0
yang memiliki ciri yang baik yaitu terdapat daya pembeda
yang tinggi dan dikelompokkan menurut ciri yang dimiliki 𝜇 = momen pusat
[7]. 𝑥̅ ,̅𝑦 : pusat citra
𝜇10
𝜂𝑝𝑞 = 𝑝+𝑞+2 (4) karakter dengan ukuran 100x100 pixel. Tipe huruf yang
𝜇00 2
digunakan adalah Times New Roman. Times New Roman
adalah salah satu tipe font yang bisa digunakan untuk Jawi.
Ada 6 momen zernike yang dapat ditentukan, pada
Setelah semuanya selesai dan citra karakter Arab Jawi
persamaan (5), sebagai berikut:
terkumpul kemudian tiap karakter tersebut akan dibuat
𝜙1 = (3/𝜋)(2( 𝜂20 + 𝜂02 ) − 𝜂00 ) template citra binner yang berformat JPG, proses perubahan
citra binner diproses dengan menggunakan software
𝜙2 = (3/𝜋)2 [(𝜂20 − 𝜂02 )2 + 4𝜂112 ) ] simulasi, jumlah karakter yang akan dikenali adalah 127
𝜙3 = (12/𝜋)2 [(𝜂30 + 𝜂12 )2 + (𝜂03 + 𝜂21 )] karakter Arab Jawi [11].
Rate pengenalan =
Setelah proses pembuatan beberapa karakter Arab B. Hasil Perhitungan Untuk Templeate Biner Citra Huruf
Jawi siap dilakukan maka akan dibuat template-nya. Citra Arab Jawi Cetak
karakter Arab Jawi yang berformat jpg dipotong huruf per
huruf dengan menggunakan software microsoft paint dan Tabel I
ukuran citra yang dibentuk adalah 100x100 pixel. Huruf Yang Dipresentasikan Oleh 3 Momen
Selanjutnya citra yang akan diuji dilakukan proses NO KARAKTER Nilai Moment
perubahan karakter Arab Jawi ke citra biner dengan 1 2 3 4 5 6
menggunakan software simulasi 1 Alif sendiri 122 31 34 296 184 86
2 Alif akhir 127 36 44 219 187 85
3 Ba sendiri 133 42 55 249 184 82
4 Ba awal 132 41 53 229 187 82
5 Ba tengah 132 41 54 241 184 82
6 Ba akhir 134 42 56 260 183 83
7 Ta sendiri 134 43 58 266 177 82
8 T a awal 134 43 58 266 177 82
9 Ta tengah 132 41 54 251 181 83
10 Ta akhir 134 43 58 272 178 82
18
Vol.1 No.3 2016 @2016 kitektro
KITEKTRO: Jurnal Online Teknik Elektro e-ISSN: 2252-7036
Vol.1 No.3 2016: 15-20
20
Vol.1 No.3 2016 @2016 kitektro