Kontak Person:
Elvira Sukma Wahyuni
Jl. Kaliurang Km.14,5 Gedung KH Mas Mansur, Universitas Islam Indonesia, Jogjakarta
E-mail: elvira.sukmawahyuni@gmail.com / elvira.wahyuni@uii.ac.id
Abstrak
Pengenalan pola tulisan tangan merupakan salah satu objek penelitian yang banyak dilakukan oleh para peneliti. Beberapa
karakter huruf hujaiyah memiliki pola yang hampir mirip dan terkadang sulit dibedakan. pada penelitian ini akan dilakukan
pengenalan pola huruf hijaiyah dengan menggunakan metode ekstraksi fitur zernike moment. Metode zernike moment telah
sukses diaplikasikan pada beberapa kasus pengolahan citra, prinsip kerja metode ini adalah menggunakan invarian rotasi
citra untuk mengenali pola yang diinginkan. Data yang digunakan pada penelitian ini adalah tulisan tangan huruf hijaiyah
yang diambil secara offline dari 10 tulisan tangan responden yang berbeda. Setelah dilakukan ekstraksi fitur dengan metode
zernike moment, pola tulisan tangan huruf hijaiyah akan diklasifikasi dengan menggunakan beberapa metode klasifikasi
yaitu JST (Jaringan Syaraf Tiruan), Support Vector Machine (SVM) dan Decision tree . Hasil akhirnya akan dianalisi
seberapa besar keakuratan pengenalan pola tulisan tangan huruf hijaiyah yang diperoleh dari metode yang diusulkan. Hasil
yang diporoleh menunjukkan metode JST dapat mengenali pola tulisan tangan huruf hijaiyah dengan rata-rata akurasi 96%
dengan akurasi tertinggi pada salah satu pengujian sebesar 100%, SVM mendapatkan rata-rata akurasi 95% dengan akurasi
tertinggi pada salah satu pengujian sebesar 100% dan decision tree memperoleh rata-rata akurasi 86% dengan akurasi
tertinggi pada salah satu pengujian sebesar 95%.
1. Pendahuluan
Pengenalan pola tulisan tangan merupakan salah satu jenis penelitian yang banyak
dikembangkan oleh para peniliti. Hal tersebut dikarenakan banyak bidang pekerjaan yang
membutuhkan adanya autentifikasi tulisan tangan seseorang seperti pengenalan tulisan tangan pada
cek bank [1]. Ada dua jenis pengenalan pola tulisan tangan, yaitu secara online dan offline [2]. Pada
pengenalan pola tulisan tangan secara online data diambil selama proses penulisan dengan bantuan
pena khusus dan sebuah antarmuka elektronik. Sedangkan secara offline seseorang menulis diatas
kertas kemudian kertas atau dokumen tersebut dipindai menjadi sebuah citra. Namun penelitian
mengenai penulisan tangan secara offline menjadi tantangan tersendiri karena tidak tersedianya
informasi mengenai srtoke atau goresan dari tulisan tangan tersebut.
Beberapa metode dalam pengenalan pola tulisan tangan telah banyak diterapkan, seperti
penggunaan beberapa jenis fitur, mulai dari fitur global, fitur statistik, dan fitur geometri [3]. Tidak
hanya pemilihan fitur saja, berbagai jenis algoritme klasifikasi pun banyak diujicobakan untuk
mengetahui performa masing-masing algoritme dalam mengklasifikasi pola dari fitur yang diperoleh.
Salah satu metode ekstraksi fitur yang banyak digunakan adalah pengambilan fitur citra tulisan
tanagan berdasarkan invariant moment [4-5], dari kedua penelitian tersebut diketahui bahwa akurasi
pengenalan pola tulisan tangan yang dihasilkan sangat baik.
Pada penelitian ini akan dilakukan pengenalan pola tulisan tangan huruf hijaiyah yang diambil
secara offline dengan menggunakan ekstraksi fitur yang berdasarkan invariant momet, yaitu
menggunakan metode zernike moment. Fitur yang dihasilkan akan diujicobakan kedalam tiga
algoritma klasifikasi yang berbeda yaitu JST, SVM, dan Decision Tree.
2. Metode Penelitian
Metode penelitian yang diusulkan bertujuan untuk melakukan pengenalan pola tulisan tangan
huruf hijaiyah, metode ekstraksi fitur zernike moment dan beberapa algoritme klasifikasi akan
diterapkan untuk mencapai tujuan yang diharapkan. Gambar 1 memperlihatkan blok diagram alur
SENTRA 2016 IV - 41
Seminar Nasional Teknologi dan Rekayasa (SENTRA) 2016
ISSN (Cetak) 2527-6042
eISSN (Online) 2527-6050
penelitian, metode penelitian yang diterapkan terdiri dari tiga fase. Fase pertama adalah pre-proses,
fase kedua adalah ekstraksi fitur dan fase terakhir adalah klasifikasi
Citra Huruf Hijaiyah
Pre-Proses
Training
Ekstraksi fitur
Data base
Klasifikasi
Testing
Evaluasi
Akurasi pengenalan
pola
2.1 Data
Data set yang digunakan pada penelitian ini adalah tulisan tangan huruf hijaiyah yang diambil
secara off-line menggunakan media kertas HVS. Pada peneliatian ini memfokuskan pada beberapa
huruf hijaiyah yang memiliki bentuk yang hampir mirip, adapun huruf hijaiyah yang akan dilakukan
pengenalan pola dapat dilihat pada Tabel 1.
ha
kho
‘ain
ghin
Masing-masing huruf akan diambil sampel untuk 10 jenis tulisan tangan dari responden yang berbeda,
sehingga jumlah data huruf hijaiyah yang digunakan sebanyak 90 tulisan tangan huruf hijaiyah.
Responden dipilih secara acak.
IV - 42 SENTRA 2016
Seminar Nasional Teknologi dan Rekayasa (SENTRA) 2016
ISSN (Cetak) 2527-6042
eISSN (Online) 2527-6050
2.2 Pre-Proses
Langkah pre-proses bertujuan untuk memindai citra kedalam bentuk digital dan memperbaiki
kondisi citra sedemikian rupa. Seperti menghilangkan derau, menstandardkan ukuran citra dan
beberapa proses lainnya. Gambar 2 memperlihatkan beberapa langkah pada pre-proses.
2.2.1 Digitalisasi
Digitalisasi merupakan proses pemindaian data kedalam bentuk digital. Pemindaian dilakukan
dengan menggunakan alat scanner, citra hasil pemindaian disimpan dalam format JPEG.
2.2.2 Cropping
Data yang sudah dalam bentuk digital dilakukan proses pemotongan atau cropping pada
koordinat tertentu. Tujuannya adalah untuk memisahkan masing-masing citra tulisan tangan huruf
hijaiyah, agar dapat dilakukan pemrosesan secara terpisah.
2.2.3 Binerisasi
Citra hasil pemindaian merupakan citra warna, pada tahapan pre-proses ini citra warna akan
dikonversi menjadi citra biner atau citra hitam putih. Proses konversi menggunakan perintah rgb2gray
di MATLAB.
2.2.4 Resizing
Citra hasil cropping memiliki ukuran yang tidak sama, dikarena pemotongan dilakukan pada
koordinat yang berbeda pada masing-masing huruf. Untuk mempermudah proses pengolahan dan
pengenalan pola, ukuran masing-masing citra huruf distandardkan. Pada penelitian ini ukuran citra
yang digunakan adalam 230x230 pixels.
2.2.5 Filtering
Citra hasil pemindaian biasanya mengandung derau yang berupa bintik-bintik hitam, derau
tersebut akan memberikan pengaruh negatif kepada proses pengolahan citra. Untuk menghilangkan
derau pada citra, maka pada tahapan pre-proses dilakukan filtering. Metode filtering yang digunakan
pada penelitian ini adalah median filtering.
2.2.6 Normalisasi
Proses normalisasi bertujuan untuk memperbaiki posisi citra yang miring karena posisi
pemindaian yang tidak presisi. Untuk memperbaiki kemiringan tersebut pada penelitian ini
menggunakan imrotate pada sudut ϴ.
2.2.7 Morphologi
Proses morphologi yang diterapkan pada penelitian ini adalah dilatasi. Proses dilatasi
merupakan proses penambahan pixel pada tepi objek pada citra. Proses ini bertujuan untuk lebih
mempertegas objek pada citra.
SENTRA 2016 IV - 43
Seminar Nasional Teknologi dan Rekayasa (SENTRA) 2016
ISSN (Cetak) 2527-6042
eISSN (Online) 2527-6050
didasarkan pada polinomial zernike yang bersifat ortogonal terhadap lingkaran x2 + y2 < 1, yang
dinyatakan pada persamaan (1) [6].
(1)
dengan adalah radius dari (y,x) ke pusat massa (centroid), adalah sudut antara r dan
sumbu x, dan Rpq(r) adalah polinomial radial ortogonal seperti persamaan (2) berikut [6].
(2)
2.3 Klasifikasi
Pada proses klasifikasi, data hasil ekstraksi fitur dibagi kedalam dua bagian yaitu data
pelatihan (training) dan data pengujian (testing). Pada data training huruf yang akan dilakukan
pengenalan pola diberikan kelas 1 dan yang bukan diberikan kelas 0. Masing-masing algoritme
klasifikasi akan melakukan pembelajaran dan membentuk model pengetahuan berdasarkan data
training tersebut. Model yang dihasilkan oleh algoritme klasifikasi akan diuji cobakan pada data
testing.
2.3.1 JST
Arsitektur dasar jaringan syaraf tiruan sederhana berupa layar tunggal yang terdiri dari
beberapa masukan (input) dan keluaran (output). Elemen penysun jaringan syaraf tiruan terdiri dari
neuron yaitu tempat terjadinya pemrosesan informasi, kemudian neuron-neuron tersebut dihubungkan
diamana penghubung antar neuron memiliki bobot yang akan memperkuat dan memperlemah sinyal.
Untuk menentukan output, setiap neuron menggunakan fungsi aktivasi yang dikenakan pada jumlahan
input yang diterima [7]. Gambar 3 memperlihatkan arsitektur JST.
y menerima input dari neuron x1, x2 dan x3 dengan bobot hubungan masing-masing adalah
w1, w2 dan w3. Ketiga impuls neuron yang ada dijumlahkan,
net x1 w1 x2 w2 x3 w3
besarnya impuls yang diterima oleh y mengikuti fungsi aktivasi y = f(net). Apabila nilai fungsi
aktivasi cukup kuat, maka sinyal akan diteruskan. Nilai fungsi aktivasi (keluaran model jaringan) juga
dapat dipakai sebagai dasar untuk merubah bobot [7].
IV - 44 SENTRA 2016
Seminar Nasional Teknologi dan Rekayasa (SENTRA) 2016
ISSN (Cetak) 2527-6042
eISSN (Online) 2527-6050
2.3.2 SMO
SVM adalah metode machine learning yang bekerja atas prinsip Structural Risk Minimizaton
(SRM) dengan tujuan menemukan hyperplane terbaik yang memisahkan dua buah class pada input
space [8], ilustrasi pencarian hyperplane terbaik dapat dilihat pada Gambar 4.
Positive
Examples
Maximize
distances to nearest points
Negative
Examples
Space of possible
inpus
data yang terdekat dengan hyperplane dinamakan support vector. Hyperplane didefinisikan
pada persamaan (3) [9].
F(x) = xT β + β0 = 0 (3)
dimana :
F(x) : jarak vektor ke hyperplane
xT : Transpose vektor x
β : Unit vektor dengan || β || = 1
Untuk kasus dua kelas saling tumpang tindih dalam ruang vektor, salah satu cara untuk
menangani masalah tersebut adalah dengan tetap memaksimalkan M meskipun beberapa poin masih
berada di sisi margin yang salah. Modifikasi persamaan ditunjukan dalam (5) atau (6).
yi ( xiT 0 ) M i (5)
Atau
yi ( xiT 0 ) M (1 i ) (6)
dimana :
ξ : variabel slack
yi : class lable
SENTRA 2016 IV - 45
Seminar Nasional Teknologi dan Rekayasa (SENTRA) 2016
ISSN (Cetak) 2527-6042
eISSN (Online) 2527-6050
Paramater C dipilih untuk mengontrol tradeoff antara margin dan error klasifikasi ξ . Nilai
C yang besar berarti akan memberikan pinalti yang lebih besar terhadap error klasifikasi [10].
TP TN
Accuracy 100% (8)
TP FP FN TN
Pada penelitian ini juga menerapkan 10-fold cross validation, dimana pada tiap-tiap fold data
training dan testing akan berubah-ubah, sehingga data training pernah menjadi testing dan sebaliknya
data testing pernah menjadi training. Akurasi yang diambil merupakan rata-rata akurasi pada masing-
masing fold.
huruf (sin), yaitu huruf , keempat huruf diuji untuk dikenali polanya secara
bersamaan. Kondisi kedua yaitu pengelompokkan huruf yang cenderung memiliki pola yang sama
dengan huruf (ja), yaitu huruf , sama seperti kondisi pertama kelima huruf
tersebut diuji untuk dikenali polanya secara bersamaan pula. Kondisi ketiga adalah kesemua huruf
diuji secara bersamaan untuk dikenali polanya satu persatu.
95 95 80
92,5 92,5 75
IV - 46 SENTRA 2016
Seminar Nasional Teknologi dan Rekayasa (SENTRA) 2016
ISSN (Cetak) 2527-6042
eISSN (Online) 2527-6050
Tabel 3 memperlihatkan rician pengenalan pola huruf berdasarkan nilai true positive, true
negative, false positive dan false negative.
10 10 6 0 0 4 38 38 36 2 2 4
9 10 6 1 0 4 38 37 34 2 3 6
94 94 80
98 100 82
100 100 96
Tabel 5 memperlihatkan rician pengenalan pola huruf berdasarkan nilai true positive, true
negative, false positive dan false negative.
8 10 8 2 0 2 38 38 36 4 2 2
8 8 3 2 2 7 39 39 37 1 1 3
9 10 6 1 0 4 40 40 35 0 0 5
10 10 8 0 0 2 40 40 40 0 0 0
SENTRA 2016 IV - 47
Seminar Nasional Teknologi dan Rekayasa (SENTRA) 2016
ISSN (Cetak) 2527-6042
eISSN (Online) 2527-6050
Tabel 7 memperlihatkan rician pengenalan pola huruf berdasarkan nilai true positive, true
negative, false positive dan false negative.
8 10 7 2 0 3 78 78 79 2 2 1
8 9 5 2 1 5 79 79 75 1 1 5
7 10 6 3 0 4 80 79 77 0 1 3
10 10 9 0 0 1 80 78 78 0 2 2
IV - 48 SENTRA 2016
Seminar Nasional Teknologi dan Rekayasa (SENTRA) 2016
ISSN (Cetak) 2527-6042
eISSN (Online) 2527-6050
4. Kesimpulan
Pada penelitian ini dilakukan pengenalan pola huruf tulisan tangan huruf hijaiyah dengan
menerapkan metode ekstraksi fitur zernike moment, kemudian dari fitur yang didapatkan dari masing-
masing citra huruf tersebut, dilakukan klasifikasi dengan menggunakan tiga algoritma klasifikasi yang
berbeda. Dari hasil yang diperoleh oleh masing-masing algoritme klasifikasi diketahui bahwa
algoritme klasifikasi JST, SVM dan decision tree mampu mengklasifikasi jenis huruf dengan baik.
Selain itu dapat disimpulkan bahwa metode zernike moment juga menghasilkan fitur yang benar-benar
mencirikan masing-masing huruf secara unik, sehingga mudah dibedakan.
.
Referensi
[1] U. Pal, T. Wakabayashi, and F. Kimura. Comparative Study of Devnagari Handwritten
Character Recognition using Different Feature and Classifiers, 10th International Conference on
Document Analysis and Recognition. 2009.
[2] M. Kumar., M. K. Jindal, and R. K. Sharma. k -Nearest Neighbor Based Offline
Handwritten Gurmukhi Character Recognition, International Conference on Image
Information Processing. 2011.
[3] S. R Patel and J. Jha, Handwritten Character Recognition using Machine Learning Approach - A
Survey, International Conference on Electrical, Electronics, Signals, Communication and
Optimization. 2015.
[4] K.V. Kale, P. D. Deshmukh and S. V. Chavan, Zernike Moment Feature Extraction for
Handwritten Devanagari Compound Character Recognition. Science and Information
Conference. 2013. London.
[5] Z. Zulkifli, P. Saad and I. A. Mohtar, Plant Leaf Identification using Moment Invariants &
General Regression Neural Network, IEEE. 2011.
[6] Abdul Kadir dan Adhi Susanto, Pengolahan Citra Teori dan Aplikasi.: Andi Offset, 2013.
[7] Jong Tjek Siang, Neural Network and MATLAB Programming. Yogyakarta, Indonesia, Indonesia:
ANDI Offset, 2002.
[8] G. Schaefer and T. Nakashima, “Hybrid cost-sensitive fuzzy classification for breast cancer
diagnosis,” in 2010 Annual International Conference of the IEEE Engineering in Medicine and
Biology Society (EMBC), 2010, pp. 6170–6173.
[9] A. S. N. Dwi Handoko and Arief Budi Witarto, “Support Vector Machine : teori dan aplikasinya
dalam bioinformatika,” [Online], Available : http://asnugroho.net/papers/ikcsvm.pdf.
[10] T. Hastie, R. Tibshirani, and J. Friedman, “Support Vector Machines and Flexible
Discriminants,” in The Elements of Statistical Learning, Springer New York, 2009, pp. 417–458.
SENTRA 2016 IV - 49