Anda di halaman 1dari 9

Seminar Nasional Teknologi dan Rekayasa (SENTRA) 2016

ISSN (Cetak) 2527-6042


eISSN (Online) 2527-6050

PENGENALAN POLA TULISAN TANGAN HURUF HIJAIYAH


DENGAN MENGGUNAKAN METODE EKSTRAKSI FITUR
ZERNIKE MOMENT
Elvira Sukma Wahyuni
Jurusan Teknik Elektro, Fakultas Teknologi Industri, Universitas Islam Indonesia, Jogjakarta

Kontak Person:
Elvira Sukma Wahyuni
Jl. Kaliurang Km.14,5 Gedung KH Mas Mansur, Universitas Islam Indonesia, Jogjakarta
E-mail: elvira.sukmawahyuni@gmail.com / elvira.wahyuni@uii.ac.id

Abstrak
Pengenalan pola tulisan tangan merupakan salah satu objek penelitian yang banyak dilakukan oleh para peneliti. Beberapa
karakter huruf hujaiyah memiliki pola yang hampir mirip dan terkadang sulit dibedakan. pada penelitian ini akan dilakukan
pengenalan pola huruf hijaiyah dengan menggunakan metode ekstraksi fitur zernike moment. Metode zernike moment telah
sukses diaplikasikan pada beberapa kasus pengolahan citra, prinsip kerja metode ini adalah menggunakan invarian rotasi
citra untuk mengenali pola yang diinginkan. Data yang digunakan pada penelitian ini adalah tulisan tangan huruf hijaiyah
yang diambil secara offline dari 10 tulisan tangan responden yang berbeda. Setelah dilakukan ekstraksi fitur dengan metode
zernike moment, pola tulisan tangan huruf hijaiyah akan diklasifikasi dengan menggunakan beberapa metode klasifikasi
yaitu JST (Jaringan Syaraf Tiruan), Support Vector Machine (SVM) dan Decision tree . Hasil akhirnya akan dianalisi
seberapa besar keakuratan pengenalan pola tulisan tangan huruf hijaiyah yang diperoleh dari metode yang diusulkan. Hasil
yang diporoleh menunjukkan metode JST dapat mengenali pola tulisan tangan huruf hijaiyah dengan rata-rata akurasi 96%
dengan akurasi tertinggi pada salah satu pengujian sebesar 100%, SVM mendapatkan rata-rata akurasi 95% dengan akurasi
tertinggi pada salah satu pengujian sebesar 100% dan decision tree memperoleh rata-rata akurasi 86% dengan akurasi
tertinggi pada salah satu pengujian sebesar 95%.

Kata kunci: Pengenalan pola, Ekstraksi fitur, zernike moment, Klasifikasi

1. Pendahuluan
Pengenalan pola tulisan tangan merupakan salah satu jenis penelitian yang banyak
dikembangkan oleh para peniliti. Hal tersebut dikarenakan banyak bidang pekerjaan yang
membutuhkan adanya autentifikasi tulisan tangan seseorang seperti pengenalan tulisan tangan pada
cek bank [1]. Ada dua jenis pengenalan pola tulisan tangan, yaitu secara online dan offline [2]. Pada
pengenalan pola tulisan tangan secara online data diambil selama proses penulisan dengan bantuan
pena khusus dan sebuah antarmuka elektronik. Sedangkan secara offline seseorang menulis diatas
kertas kemudian kertas atau dokumen tersebut dipindai menjadi sebuah citra. Namun penelitian
mengenai penulisan tangan secara offline menjadi tantangan tersendiri karena tidak tersedianya
informasi mengenai srtoke atau goresan dari tulisan tangan tersebut.
Beberapa metode dalam pengenalan pola tulisan tangan telah banyak diterapkan, seperti
penggunaan beberapa jenis fitur, mulai dari fitur global, fitur statistik, dan fitur geometri [3]. Tidak
hanya pemilihan fitur saja, berbagai jenis algoritme klasifikasi pun banyak diujicobakan untuk
mengetahui performa masing-masing algoritme dalam mengklasifikasi pola dari fitur yang diperoleh.
Salah satu metode ekstraksi fitur yang banyak digunakan adalah pengambilan fitur citra tulisan
tanagan berdasarkan invariant moment [4-5], dari kedua penelitian tersebut diketahui bahwa akurasi
pengenalan pola tulisan tangan yang dihasilkan sangat baik.
Pada penelitian ini akan dilakukan pengenalan pola tulisan tangan huruf hijaiyah yang diambil
secara offline dengan menggunakan ekstraksi fitur yang berdasarkan invariant momet, yaitu
menggunakan metode zernike moment. Fitur yang dihasilkan akan diujicobakan kedalam tiga
algoritma klasifikasi yang berbeda yaitu JST, SVM, dan Decision Tree.

2. Metode Penelitian
Metode penelitian yang diusulkan bertujuan untuk melakukan pengenalan pola tulisan tangan
huruf hijaiyah, metode ekstraksi fitur zernike moment dan beberapa algoritme klasifikasi akan
diterapkan untuk mencapai tujuan yang diharapkan. Gambar 1 memperlihatkan blok diagram alur

SENTRA 2016 IV - 41
Seminar Nasional Teknologi dan Rekayasa (SENTRA) 2016
ISSN (Cetak) 2527-6042
eISSN (Online) 2527-6050

penelitian, metode penelitian yang diterapkan terdiri dari tiga fase. Fase pertama adalah pre-proses,
fase kedua adalah ekstraksi fitur dan fase terakhir adalah klasifikasi
Citra Huruf Hijaiyah

Pre-Proses

Training
Ekstraksi fitur

Data base

Klasifikasi
Testing

Evaluasi

Akurasi pengenalan
pola

Gambar 1 Alur Penelitian

2.1 Data
Data set yang digunakan pada penelitian ini adalah tulisan tangan huruf hijaiyah yang diambil
secara off-line menggunakan media kertas HVS. Pada peneliatian ini memfokuskan pada beberapa
huruf hijaiyah yang memiliki bentuk yang hampir mirip, adapun huruf hijaiyah yang akan dilakukan
pengenalan pola dapat dilihat pada Tabel 1.

Tabel 1 Huruf hijaiyah yang digunkan dalam penelitian


Huruf
Latin
Hijaiyah
sin
syin
shod
dhod
jim

ha

kho

‘ain

ghin

Masing-masing huruf akan diambil sampel untuk 10 jenis tulisan tangan dari responden yang berbeda,
sehingga jumlah data huruf hijaiyah yang digunakan sebanyak 90 tulisan tangan huruf hijaiyah.
Responden dipilih secara acak.

IV - 42 SENTRA 2016
Seminar Nasional Teknologi dan Rekayasa (SENTRA) 2016
ISSN (Cetak) 2527-6042
eISSN (Online) 2527-6050

2.2 Pre-Proses
Langkah pre-proses bertujuan untuk memindai citra kedalam bentuk digital dan memperbaiki
kondisi citra sedemikian rupa. Seperti menghilangkan derau, menstandardkan ukuran citra dan
beberapa proses lainnya. Gambar 2 memperlihatkan beberapa langkah pada pre-proses.

Pemindaian citra Cropping Binerisasi Resizing

Morphologi Normalisasi Filtering

Gambar 2 Langkah pre-proses

2.2.1 Digitalisasi
Digitalisasi merupakan proses pemindaian data kedalam bentuk digital. Pemindaian dilakukan
dengan menggunakan alat scanner, citra hasil pemindaian disimpan dalam format JPEG.
2.2.2 Cropping
Data yang sudah dalam bentuk digital dilakukan proses pemotongan atau cropping pada
koordinat tertentu. Tujuannya adalah untuk memisahkan masing-masing citra tulisan tangan huruf
hijaiyah, agar dapat dilakukan pemrosesan secara terpisah.
2.2.3 Binerisasi
Citra hasil pemindaian merupakan citra warna, pada tahapan pre-proses ini citra warna akan
dikonversi menjadi citra biner atau citra hitam putih. Proses konversi menggunakan perintah rgb2gray
di MATLAB.
2.2.4 Resizing
Citra hasil cropping memiliki ukuran yang tidak sama, dikarena pemotongan dilakukan pada
koordinat yang berbeda pada masing-masing huruf. Untuk mempermudah proses pengolahan dan
pengenalan pola, ukuran masing-masing citra huruf distandardkan. Pada penelitian ini ukuran citra
yang digunakan adalam 230x230 pixels.
2.2.5 Filtering
Citra hasil pemindaian biasanya mengandung derau yang berupa bintik-bintik hitam, derau
tersebut akan memberikan pengaruh negatif kepada proses pengolahan citra. Untuk menghilangkan
derau pada citra, maka pada tahapan pre-proses dilakukan filtering. Metode filtering yang digunakan
pada penelitian ini adalah median filtering.
2.2.6 Normalisasi
Proses normalisasi bertujuan untuk memperbaiki posisi citra yang miring karena posisi
pemindaian yang tidak presisi. Untuk memperbaiki kemiringan tersebut pada penelitian ini
menggunakan imrotate pada sudut ϴ.
2.2.7 Morphologi
Proses morphologi yang diterapkan pada penelitian ini adalah dilatasi. Proses dilatasi
merupakan proses penambahan pixel pada tepi objek pada citra. Proses ini bertujuan untuk lebih
mempertegas objek pada citra.

2.2 Ekstraksi Fitur


Metode ekstraksi fitur yang digunakan pada penelitian ini adalah metode zernike moment.
Momen zernike diperkenalkan oleh F. Zernike dalam bukunya berjudul Physica yang diterbitkan pada
tahun 1934. Penerapan momen zernike untuk pengolahan citra diperkenalkan pertama kali oleh M.R.
Teague pada tahun 1980. Hasilnya berupa Zernike moment descriptors (ZMD). Momen zernike

SENTRA 2016 IV - 43
Seminar Nasional Teknologi dan Rekayasa (SENTRA) 2016
ISSN (Cetak) 2527-6042
eISSN (Online) 2527-6050

didasarkan pada polinomial zernike yang bersifat ortogonal terhadap lingkaran x2 + y2 < 1, yang
dinyatakan pada persamaan (1) [6].

(1)

dengan adalah radius dari (y,x) ke pusat massa (centroid), adalah sudut antara r dan
sumbu x, dan Rpq(r) adalah polinomial radial ortogonal seperti persamaan (2) berikut [6].

(2)

2.3 Klasifikasi
Pada proses klasifikasi, data hasil ekstraksi fitur dibagi kedalam dua bagian yaitu data
pelatihan (training) dan data pengujian (testing). Pada data training huruf yang akan dilakukan
pengenalan pola diberikan kelas 1 dan yang bukan diberikan kelas 0. Masing-masing algoritme
klasifikasi akan melakukan pembelajaran dan membentuk model pengetahuan berdasarkan data
training tersebut. Model yang dihasilkan oleh algoritme klasifikasi akan diuji cobakan pada data
testing.

2.3.1 JST
Arsitektur dasar jaringan syaraf tiruan sederhana berupa layar tunggal yang terdiri dari
beberapa masukan (input) dan keluaran (output). Elemen penysun jaringan syaraf tiruan terdiri dari
neuron yaitu tempat terjadinya pemrosesan informasi, kemudian neuron-neuron tersebut dihubungkan
diamana penghubung antar neuron memiliki bobot yang akan memperkuat dan memperlemah sinyal.
Untuk menentukan output, setiap neuron menggunakan fungsi aktivasi yang dikenakan pada jumlahan
input yang diterima [7]. Gambar 3 memperlihatkan arsitektur JST.

Gambar 3 Arsitektur JST

y menerima input dari neuron x1, x2 dan x3 dengan bobot hubungan masing-masing adalah
w1, w2 dan w3. Ketiga impuls neuron yang ada dijumlahkan,

net  x1 w1  x2 w2  x3 w3

besarnya impuls yang diterima oleh y mengikuti fungsi aktivasi y = f(net). Apabila nilai fungsi
aktivasi cukup kuat, maka sinyal akan diteruskan. Nilai fungsi aktivasi (keluaran model jaringan) juga
dapat dipakai sebagai dasar untuk merubah bobot [7].

IV - 44 SENTRA 2016
Seminar Nasional Teknologi dan Rekayasa (SENTRA) 2016
ISSN (Cetak) 2527-6042
eISSN (Online) 2527-6050

2.3.2 SMO

SVM adalah metode machine learning yang bekerja atas prinsip Structural Risk Minimizaton
(SRM) dengan tujuan menemukan hyperplane terbaik yang memisahkan dua buah class pada input
space [8], ilustrasi pencarian hyperplane terbaik dapat dilihat pada Gambar 4.

Positive
Examples

Maximize
distances to nearest points

Negative
Examples
Space of possible
inpus

Gambar 4 Linear Support Vector Machine

data yang terdekat dengan hyperplane dinamakan support vector. Hyperplane didefinisikan
pada persamaan (3) [9].
F(x) = xT β + β0 = 0 (3)

dimana :
F(x) : jarak vektor ke hyperplane
xT : Transpose vektor x
β : Unit vektor dengan || β || = 1

margin M ditunjukkan pada (4)


1
M= (4)
||  ||

Untuk kasus dua kelas saling tumpang tindih dalam ruang vektor, salah satu cara untuk
menangani masalah tersebut adalah dengan tetap memaksimalkan M meskipun beberapa poin masih
berada di sisi margin yang salah. Modifikasi persamaan ditunjukan dalam (5) atau (6).
yi ( xiT    0 )  M   i (5)

Atau

yi ( xiT    0 )  M  (1   i ) (6)

dimana :
ξ : variabel slack
yi : class lable

Untuk mengatasi masalah pemrograman kuadratik, sebagai solusi digunakan lagrange


multipliers. Ditunjukkan pada persamaan (7).
N
1
min ||  || 2 C   i (7)
 ,0 2 i 1

SENTRA 2016 IV - 45
Seminar Nasional Teknologi dan Rekayasa (SENTRA) 2016
ISSN (Cetak) 2527-6042
eISSN (Online) 2527-6050

Paramater C dipilih untuk mengontrol tradeoff antara margin dan error klasifikasi ξ . Nilai
C yang besar berarti akan memberikan pinalti yang lebih besar terhadap error klasifikasi [10].

2.3.3 Decision Tree


Decision tree yang digunakan pada penelitian ini adalah C4.5. C4.5 adalah sebuah decision
tree dengan konsep information entropy. Untuk menghasilkan sebuah pruned tree C4.5. pembuatan
keputusan dilakukan dengan men-splitting setiap atribut data kedalam subset yang lebih kecil untuk
memeriksa entropy yang berbeda, dan memilih atribut dengan information gain tertinggi. Splitting
dihentikan ketika menemukan subset instance yang dimasukkan kedalam kelas yang sama, dan dengan
demikian leaf node akan dibuat. Jika tidak ada leaf node yang ditemukan, C4.5 menciptakan simpul
tujuan lebih tinggi berdasarkan nilai kelas yang diharapkan

2.4 Metode Evaluasi


Evaluasi hasil pengenalan pola huruf hijaiyah dialakukan berdasarkan perhitungan akurasi,
dapat dilihat pada persamaan (8).

TP  TN
Accuracy  100% (8)
TP  FP  FN  TN

Pada penelitian ini juga menerapkan 10-fold cross validation, dimana pada tiap-tiap fold data
training dan testing akan berubah-ubah, sehingga data training pernah menjadi testing dan sebaliknya
data testing pernah menjadi training. Akurasi yang diambil merupakan rata-rata akurasi pada masing-
masing fold.

3. Hasil dan Pembahasan


Dilakukan tiga kondisi Percobaan yang berbeda pada pengenalan pola tulisan tangan huruf
hijaiyah. kondisi pertama pengelompokkan huruf yang cenderung memiliki pola yang sama dengan

huruf (sin), yaitu huruf , keempat huruf diuji untuk dikenali polanya secara
bersamaan. Kondisi kedua yaitu pengelompokkan huruf yang cenderung memiliki pola yang sama

dengan huruf (ja), yaitu huruf , sama seperti kondisi pertama kelima huruf
tersebut diuji untuk dikenali polanya secara bersamaan pula. Kondisi ketiga adalah kesemua huruf
diuji secara bersamaan untuk dikenali polanya satu persatu.

3.1 Percobaan Pertama


Tabel 2 memperlihatkan hasil akurasi pengenalan pola kelompok huruf pertama yaitu sin, sya,
shod, dan dhod. Performa masing-masing algoritme klasifikasi sangat baik dalam mengenali pola
huruf, hal ini ditunjukkan dengan hasil akurasi rata-rata mencapai 91%. Namun dari ketiga algoritme
klasifikasi tersebut JST lebih unggul dibandingkan SVM dan decision tree.

Tabel 2 Hasil Akurasi Percobaan Pertama


Akurasi %
Pengenalan
Pola Huruf Decision
SVM JST
Tree
94 96 90
97,5 97,5 95

95 95 80
92,5 92,5 75

IV - 46 SENTRA 2016
Seminar Nasional Teknologi dan Rekayasa (SENTRA) 2016
ISSN (Cetak) 2527-6042
eISSN (Online) 2527-6050

Tabel 3 memperlihatkan rician pengenalan pola huruf berdasarkan nilai true positive, true
negative, false positive dan false negative.

Tabel 3 Hasil TP, TN, FP, dan FN Percobaan Pertama

Pengenalan True Positive True Negative False Positive False Negative


Pola Huruf
SVM JST Tree SVM JST Tree SVM JST Tree SVM JST Tree
7 9 7 3 1 3 40 39 38 0 1 2
9 10 9 1 0 1 30 39 39 0 1 1

10 10 6 0 0 4 38 38 36 2 2 4
9 10 6 1 0 4 38 37 34 2 3 6

3.2 Percobaan Kedua


Tabel 4 memperlihatkan hasil akurasi pengenalan pola kelompok huruf kedua yaitu ja, ha,
kho, „ain dan ghin. Performa masing-masing algoritme klasifikasi juga sangat baik dalam mengenali
pola huruf, hal ini ditunjukkan dengan hasil akurasi rata-rata mencapai 93%. Namun dari ketiga
algoritme klasifikasi tersebut JST masih tetap lebih unggul dibandingkan SVM dan decision tree.

Tabel 4 Hasil Akurasi Percobaan kedua


Akurasi %
Pengenalan
Pola Huruf Decision
SVM JST
Tree
94 96 90
92 96 88

94 94 80

98 100 82

100 100 96

Tabel 5 memperlihatkan rician pengenalan pola huruf berdasarkan nilai true positive, true
negative, false positive dan false negative.

Tabel 5 Hasil TP, TN, FP, dan FN Percobaan Kedua


Pengenalan
True Positive True Negative False Positive False Negative
Pola Huruf
SVM JST Tree SVM JST Tree SVM JST Tree SVM JST Tree
7 9 7 3 1 3 40 39 38 0 1 2

8 10 8 2 0 2 38 38 36 4 2 2

8 8 3 2 2 7 39 39 37 1 1 3

9 10 6 1 0 4 40 40 35 0 0 5

10 10 8 0 0 2 40 40 40 0 0 0

SENTRA 2016 IV - 47
Seminar Nasional Teknologi dan Rekayasa (SENTRA) 2016
ISSN (Cetak) 2527-6042
eISSN (Online) 2527-6050

3.3 Percobaan Ketiga


Tabel 6 memperlihatkan hasil akurasi pengenalan pola untuk keseluruhan huruf yaitu sin, sya,
shod, dhod, ja, ha, kho, „ain dan ghin. Performa masing-masing algoritme klasifikasi jauh lebih baik
dibandingkan percobaan pertama dan kedua dalam mengenali pola huruf, hal ini ditunjukkan dengan
hasil akurasi rata-rata mencapai 95%. Namun pada percobaan kali ini algoritme klasifikasi JST dan
SVM memiliki kemampuan klasifikasi yang lebih unggul dibandingkan decision tree.

Tabel 6 Hasil Akurasi Percobaan ketiga


Akurasi %
Pengenalan
Pola Huruf Decision
SVM JST
Tree
98,9 98,9 94,4
95,5 94,4 97,7
95,5 95,5 91,1
92,2 94,4 94,4
94,4 94,4 94,4

95,5 97,7 95,5

96,6 97,7 88,9

96,6 98,9 92,2

100 97,7 96,6

Tabel 7 memperlihatkan rician pengenalan pola huruf berdasarkan nilai true positive, true
negative, false positive dan false negative.

Tabel 7 Hasil TP, TN, FP, dan FN Percobaan Ketiga

Pengenalan True Positive True Negative False Positive False Negative


Pola Huruf
SVM JST Tree SVM JST Tree SVM JST Tree SVM JST Tree
9 9 8 1 1 2 80 80 77 0 0 3
6 9 8 4 1 2 80 76 80 0 4 0
7 10 5 3 1 5 79 76 77 1 6 3
5 9 7 5 1 3 78 76 78 2 4 2
7 8 6 3 2 4 78 77 79 2 3 1

8 10 7 2 0 3 78 78 79 2 2 1

8 9 5 2 1 5 79 79 75 1 1 5

7 10 6 3 0 4 80 79 77 0 1 3

10 10 9 0 0 1 80 78 78 0 2 2

IV - 48 SENTRA 2016
Seminar Nasional Teknologi dan Rekayasa (SENTRA) 2016
ISSN (Cetak) 2527-6042
eISSN (Online) 2527-6050

4. Kesimpulan
Pada penelitian ini dilakukan pengenalan pola huruf tulisan tangan huruf hijaiyah dengan
menerapkan metode ekstraksi fitur zernike moment, kemudian dari fitur yang didapatkan dari masing-
masing citra huruf tersebut, dilakukan klasifikasi dengan menggunakan tiga algoritma klasifikasi yang
berbeda. Dari hasil yang diperoleh oleh masing-masing algoritme klasifikasi diketahui bahwa
algoritme klasifikasi JST, SVM dan decision tree mampu mengklasifikasi jenis huruf dengan baik.
Selain itu dapat disimpulkan bahwa metode zernike moment juga menghasilkan fitur yang benar-benar
mencirikan masing-masing huruf secara unik, sehingga mudah dibedakan.
.
Referensi
[1] U. Pal, T. Wakabayashi, and F. Kimura. Comparative Study of Devnagari Handwritten
Character Recognition using Different Feature and Classifiers, 10th International Conference on
Document Analysis and Recognition. 2009.
[2] M. Kumar., M. K. Jindal, and R. K. Sharma. k -Nearest Neighbor Based Offline
Handwritten Gurmukhi Character Recognition, International Conference on Image
Information Processing. 2011.
[3] S. R Patel and J. Jha, Handwritten Character Recognition using Machine Learning Approach - A
Survey, International Conference on Electrical, Electronics, Signals, Communication and
Optimization. 2015.
[4] K.V. Kale, P. D. Deshmukh and S. V. Chavan, Zernike Moment Feature Extraction for
Handwritten Devanagari Compound Character Recognition. Science and Information
Conference. 2013. London.
[5] Z. Zulkifli, P. Saad and I. A. Mohtar, Plant Leaf Identification using Moment Invariants &
General Regression Neural Network, IEEE. 2011.
[6] Abdul Kadir dan Adhi Susanto, Pengolahan Citra Teori dan Aplikasi.: Andi Offset, 2013.
[7] Jong Tjek Siang, Neural Network and MATLAB Programming. Yogyakarta, Indonesia, Indonesia:
ANDI Offset, 2002.
[8] G. Schaefer and T. Nakashima, “Hybrid cost-sensitive fuzzy classification for breast cancer
diagnosis,” in 2010 Annual International Conference of the IEEE Engineering in Medicine and
Biology Society (EMBC), 2010, pp. 6170–6173.
[9] A. S. N. Dwi Handoko and Arief Budi Witarto, “Support Vector Machine : teori dan aplikasinya
dalam bioinformatika,” [Online], Available : http://asnugroho.net/papers/ikcsvm.pdf.
[10] T. Hastie, R. Tibshirani, and J. Friedman, “Support Vector Machines and Flexible
Discriminants,” in The Elements of Statistical Learning, Springer New York, 2009, pp. 417–458.

SENTRA 2016 IV - 49

Anda mungkin juga menyukai