Anda di halaman 1dari 6

Pengenalan Tulisan Tangan Angka Arab Menggunakan Ekstraksi Ciri

Geometric Moment Invariant Dan Self Organizing Maps


Aidilia Fitriyanti1, Samsuryadi,M.Kom.,Ph.D2, Julian Supardi,MT3
1. Program Studi Teknik Informatika Bilingual, Fakultas Ilmu Komputer, Universitas Sriwijaya
2. Dosen Pembimbing 1, Fakultas Ilmu Komputer, Universitas Sriwijaya
3. Dosen Pembimbing 2, Fakultas Ilmu Komputer, Universitas Sriwijaya
Jl. Raya Palembang Prabumulih Km. 32 Indralaya, OI, Sumatera Selatan, 30662, Indonesia
Email: aidiliafitrianti@yahoo.com

Abstrak
Pengenalan tulisan tangan angka Arab menjadi hal yang penting, namun untuk melakukan pengenalan tulisan tangan
angka Arab tidaklah mudah. Permasalahan pengenalan tulisan tangan dipengaruhi oleh faktor bentuk dan ukuran dari
tulisan tangan tersebut. Penelitian ini bertujuan untuk mengenali tulisan tangan angka Arab dengan tahapan meliputi,
pra-pengolahan untuk mengubah citra asli menjadi citra biner, ekstraksi ciri menggunakan Geometric Moment Invariant
(GMI), dan pengenalan menggunakan Self-Organizing Maps (SOM). Hasil pengenalan tulisan tangan angka Arab
dengan data 120 dari MADBase Handwriting Arabic Digits dengan setiap angka Arab dibuat 12 kali memiliki ketepatan
tingkat akurasi 96,60%.
Kata kunci: Tulisan Tangan Angka Arab, MADBase Handwriting Arabic Digits, Geometric Moment Invariant, Self
Organizing Maps.

Abstract
Handwritten Arabic numerals recognition become important, but to perform handwriting recognition Arabic numerals is
not easy. The problems handwriting recognition influenced by the shape and size of the handwriting. This study aims to
recognize handwritten Arabic numerals which the stage were pre-processing to convert the original image into a binary
image, feature extraction using Geometric Moment Invariant (GMI), and recognition using Self-Organizing Maps
(SOM). The result handwriting recognition Arabic numerals with the data 120 of MADBase Handwriting Arabic Digits
with every Arabic numerals character made 12 times which had obtained accuracy 96.60%.
Keywords: Handwriting Arabic Numerals, MADBase Handwriting Arabic Digits, Geometric Moment Invariant, Self
Organizing Maps.

1. Pendahuluan

termasuk verifikasi cek pada bank, membaca alamat


pos, dan lain-lain [2].

Pengenalan pola merupakan salah satu teknik yang


bertujuan untuk mengklasifikasikan suatu citra yang
belum diproses dalam kesamaan karakteristik yang
dimiliki [1]. Salah satu pengenalan pola dapat dikenal
dengan sebutan pengenalan karakter. Pengenalan
karakter adalah pengenalan pola yang berbentuk
karakter. Pengenalan pola karakter seperti pengenalan
tulisan tangan angka telah menjadi salah satu topik yang
paling menantang dalam pengolahan citra [2].
Disebabkan karena pengenalan pola karakter merupakan
sebuah aplikasi yang dapat memberikan kontribusi
terhadap proses otomatisasi dalam berbagai aplikasi

Pengenalan tulisan tangan karakter (huruf/numerik)


adalah pekerjaan yang lebih sulit karena memiliki
berbagai gaya/bentuk tulisan tangan yang berbeda setiap
orang yang menulisnya [3]. Hal ini menjadi sebuah
permasalahan dalam tulisan tangan. Beberapa masalah
tulisan tangan lainnya seperti cara penulisan setiap
orang yang berbeda atau bervariasi. Perbedaan tersebut
menyebabkan bentuk tulisan tangan tidak konsisten
dalam bentuk, ukuran, dan rotasi yang berbeda. Selain
itu, alat tulis juga dapat mempengaruhi bentuk tulisan
tangan seperti ketebalan dari tulisan tangan tersebut.

Pengenalan pola karakter telah berhasil dan


mendapatkan berbagai perhatian seperti karakter Latin,
karakter Jepang dan karakter Cina. Sebaliknya karakter
Arab belum menjadi perhatian [4]. Oleh sebab itu,
penelitian ini mengembangkan sebuah perangkat lunak
pengenalan tulisan tangan angka Arab yang
membutuhkan suatu teknik ekstraksi ciri dan
pengenalan yang baik.
Beberapa penelitian yang terkait dengan tulisan tangan
angka Arab berfokus pada ekstraksi ciri, seperti: 1)
Shadow Feature dan Centroid Features [5]; 2) Center of
Gravity [6]; 3) Statistical dan Geometric Moment
Features [7]; 4) Image Centroid Zone (ICZ), Zone
Centroid Zone (ZCZ) dan Hybrid Feature Extraction
ICZ+ZCZ [8]; 3) Discrete Cosine Transform (DCT) [9].
Penelitian
tersebut
menggunakan
metode
pengelompokan, seperti: Multi-Layer Perceptron (MLP)
[5], Hidden Markov Model (HMM) [6] dan Support
Vector Machine (SVM) [8].
Dari semua metode yang digunakan untuk pengenalan
tulisan tangan angka Arab menghasilkan beberapa
tingkat akurasi yang berbeda. Hal ini menjadi sebuah
permasalahan untuk membuat pengenalan tulisan tangan
yang lebih optimal. Penelitian ini menggunakan metode
ekstraksi ciri Geometric Moment Invariant (GMI).
Pemilihan metode ini dipilih tidak adanya pengaruh
terhadap perubahan transformasi citra baik dari rotasi,
translasi dan penskalaan ([10],[11],[7],[12]) Metode ini
juga termasuk metode yang baik, sebab dapat
memberikan tingkat akurasi pengenalan tulisan tangan
90% [13]. Metode pengenalan menggunakan SelfOrganizing
Maps
(SOM)
dapat
melakukan
pengelompokan dengan sangat baik, metode SOM dapat
mengurangi waktu untuk proses pengenalan [14] serta
memiliki tingkat akurasi yang lebih tinggi [15].
Berdasarkan
hal
tersebut,
penelitian
ini
mengembangkan sebuah perangkat lunak menggunakan
metode ekstraksi ciri GMI dan pengelompokan dengan
metode SOM. Kontribusi metode ini diharapkan dapat
memberikan keakuratan yang lebih optimal.

2. Pengenalan
Arab

Tulisan

Tangan

perbedaan yang jauh. Perbedaan tersebut dapat dilihat


pada Tabel 1.
Dapat dilihat pada Tabel 1, perbedaan dari setiap angka
sangat bervariasi. Dari segi gaya tulisan dari ketiganya
sangat berbeda. Hal ini untuk angka Arab memiliki
beberapa kesamaan pada angka Arab 2, 6, 7 dan 8.
Sedangkan untuk angka Latin, kesamaan tersebut
diperoleh pada angka 4 dan 9. Dan untuk angka
Romawi memiliki beragam pariasi yang dapat
dibedakan. Hal tersebut dapat disimpul, untuk
pengenalan tulisan tangan angka Arab lebih sulit dalam
hal pengenalan tulisan tangan.

3. Metode Penelitian
3.1 Analisis Akuisis Data
Data citra tulisan tangan diperoleh dari data primer dan
sekunder masing-masing sebanyak 400 data.
Pengambilan data primer menggunakan scanner dengan
resolusi 140x140. Kemudian, citra tersebut diubah
menjadi format BMP dengan resolusi 28x28 piksel. Hal
ini agar data primer sama dengan data sekunder yang
memiliki format BMP dan memiliki 28x28 piksel.
Sedangkan
data
sekunder
berasal
MADBase
Handwriting Arabic Digits.

3.2 Analisis Pra-Pengolahan


Citra tulisan tangan dari data primer dan sekunder
dilakukan pra-pengolahan meliputi citra biner. Citra
biner adalah proses citra dari citra keabuan menjadi citra
biner dengan nilai ambang (thresholding) yang telah
ditetapkan. Citra biner merupakan citra yang
mempunyai dua nilai tingkat keabuan yaitu hitam dan
putih. Proses untuk menjadikan citra biner dinamakan
binerisasi. Banyak penelitian menggunakan proses
binerisasi citra dimana seluruh nilai keabuan akan
dikonversikan ke dalam nilai 0 untuk warna putih
(background) atau 1 untuk warna hitam (foreground)
atau sebaliknya melalui nilai threshold [17].

Angka

Pengenalan tulisan tangan karakter Arab merupakan


pengenalan karakter yang berbeda dari lainnya.
Dikarenakan sebuah tulisan tangan dari karakter Arab
memiliki cara penulisan yang berbeda. Setiap tulisan
tangan dari karakter Arab ditulis dari kanan ke kiri.
Tetapi, dalam hal penelitian ini menggunakan tulisan
tangan angka Arab.
Perbedaan angka Arab dari angka non-Arab seperti
angka Latin atau angka Romawi memiliki sebuah

Gambar 1. Hasil Citra Biner

3.3 Analisis Ekstraksi Ciri


Ekstraksi ciri merupakan tahapan untuk mengambil ciri
dari objek citra tulisan tangan. Metode ekstraksi ciri
yang digunakan ialah Geometric Moment Invariant
(GMI). GMI pertama kali diperkenalan oleh Hu, dimana
ciri-ciri yang diperoleh adalah Rotation Scale
Translation (RTS)-invariant atau ciri yang dihasilkan
oleh metode ini tidak berubah terhadap perlakuan rotasi,
penskalaan dan translasi [13].
Hu mendefinisikan 7 nilai dalam metode GMI.
Penentuan 7 nilai ciri dari GMI pada Persamaan (1).

Gambar 2. Arsitektur SOM [17]

4. Hasil dan Pembahasan

(2)
3.4 Analisis
Maps

Algoritma

Self

Organizing

Self Organizing Maps (SOM) adalah sebuah algoritma


JST yang diperkenalkan oleh Profesor Teuvo Kohonen
pada tahun 1980an [16]. SOM adalah tipe dari metode
JST yang memiliki pelatihan tidak terawasi [14]. SOM
adalah tipe dari JST yang hanya memiliki input layer
dan output layer tanpa memiliki hidden layer [15].
SOM merupakan mesin pembelajaran dengan
mengorganisir sendiri dan bersifat kompetitif.
Pelatihan dan pengenalan terhadap citra tulisan tangan
angka
Arab
menggunakan
arsitektur
SOM
menggunakan 7 buah syaraf masukan (input values)
yang disesuaikan dengan jumlah ciri dari citra tulisan
tangan. Bobot yang menghubungkan syaraf pada lapisan
masukan dengan peta (maps) ialah bobot acak (random
weight). Setiap bobot mengalami perubahan selama
proses pelatihan. Hasil bobot di dalam peta disimpan ke
file berformat .asus. Arsitektur SOM untuk pengenalan
tulisan tangan angka Arab dapat dilihat pada Gambar 2.

Pengujian dilakukan terhadap 800 citra tulisan tangan


dari data sekunder dan data primer. Pengujian pada data
sekunder dan data primer dibagi menjadi beberapa
sampel uji yaitu masing-masing perbandingan sebanyak
280 (70%) dengan 120 (30%), 240 (60%) dengan 160
(40%), 200 (50%) dan 200 (50%) serta data yang
terotasi. Pengujian tersebut menggunakan iterasi sebesar
1500, peta berukurasn 25x25 dan learning rate sebesar
0,6.
Pengujian dilakukan dapat memasukan 1 atau lebih citra
tulisan tangan angka Arab pada sistem untuk
mengetahui akurasi pengenalan. Hasil akurasi
pengenalan untuk data sekunder diperoleh sebesar
96,60%,95,00% dan 96,50%, dan data primer diperoleh
akursi hasil pengenalan diperoleh sebesar 95,50%,
95,60%, dan 95,50%. Gambar 3 memperlihatkan grafik
hasil perbandingan akurasi pengenalan tulisan tangan
angka Arab pada data sekunder dan data primer.

Gambar 2. Hasil Akurasi Data Sekunder dan Data Primer

Berdasarkan Gambar 3. di atas, terlihat bahwa data


sekunder mempunyai tingkat akurasi yang lebih besar,
sedangkan data primer mempunyai tingkat akurasi
paling kecil. Hal ini pengujian setiap data tersebut
mengalami pengaruh oleh tulisan tangan. Semakin
konsisten bentuk atau ketebalan pada setiap penulisan,
maka keakuratan semakin baik. Hal ini juga dapat
berpengaruh terhadap nilai ekstraksi cirinya. Bentuk
atau ketebalan dari tulisan tangan juga mempengaruhi
hasil dari nilai ciri dari momen invarian.

5. Kesimpulan
Kesimpulan yang diperoleh pada penelitian ini
adalah sebagai berikut:
1. Metode Geometric Moment Invariant (GMI) dapat
digunakan sebagai dasar pengembangan arsitektur
Self Organizing Maps (SOM) untuk melakukan
pengenalan tulisan tangan angka Arab dari
(0)
sampai
(9).
2. Penerapan metode GMI dan SOM untuk mengenali
tulisan tangan angka Arab dengan tingkat akurasi
lebih dari 95% tergolong baik.
3. Penggunaan metode ekstraksi ciri GMI, sistem
masih dapat mengenali tulisan tangan angka Arab
yang telah dirotasi.
4. Hasil pengenalan tulisan tangan angka Arab dari
jenis data mempengaruhi hasil pengenalan.

6. Saran
Saran pengembangan lebih lanjut dari penelitian
ini adalah sebagai berikut:
1. Data masukan citra secara on-line dengan media
perangkat elektronik.
2. Perangkat lunak dapat dikembangkan menjadi
perangkat lunak yang lebih besar seperti untuk
pembelajaran dalam mengenali angka Arab dan
bahkan dapat dikembangkan dengan menangani
kombinasi karakter angka Arab.

3.

Penelitian ini dapat dikembangkan lebih lanjut


menangani kombinasi angka dengan metode
segmentasi untuk memisahkan angka-angka
tersebut.

Referensi
[1] Hendro, Tacbir, Komarudin, A. dan Fadhilah, D.
(2012).
Pengenalan
Pola
Huruf
Arab
menggunakan Jaringan Saraf Tiruan dengan
Metode Backpropagation. Seminar Nasional
Teknologi
Informasi
dan
Komunikasi
(SNASTIKOM). Universitas Jendral Achmad Yani.
[2] Zaghloul, I. R., Enas, B. M. K. D. dan
AlRawashdeh, F. (2012). Recognition of Hindi
(Arabic) Handwritten Numerals. American
Journal of Engineering and Applied Science. Vol.
05 (2). 132-135.
[3] Awaidah dan Mahmoud. (2008). A Multiple
feature/resolustion scheme to Arabic (Indian)
numerals recognition using hidden markov
models. King Fahd University of Petroleum and
Minerlas, College of Computer Sciences and
Engineering.
[4] Liu, C.L. dan Suen C.Y. (2009). A new benchmark
on the recognition of handwritten Bangla and Farsi
numeral characters.National Laboratory of Pattern
Recognition, Instance of Automation, Chinese
Academy of Sciences.
[5] Das, N., Mollah, F. A., Saha, S., Haque, S. S.,
(2006). Handwritten Arabic Numeral Recognition
using a Multi-Layer Perceptron. Proc. National
Conference on Recent Trends in Information
System. 200-203.
[6] Mahmoud, S. (2008). Recognition of WriterIndependet off-line handwritten Arabic (Indian)
Numerals using Hidden Markov Models.
[7] Rashad, M., Amin, K., Hadhoud, M. and Elkilani,
W. (2012). Arabic Character Recognition Using
Stastical and Geometric Moment Features. IEEE.

[8] Sinha, G. dan Kumar, J. Dr., (2013). Arabic


numeral Recognition using SVM Classifier.
International Journal of Emerging Research in
Management & Technology. Vol. 02. No. 05.
[9] Alkhateb, H.Jawad, dan Alseid, M. (2014). DBN
Based Learning for Arabic Hadnwritten Digit
Recognition Using DCT Features. International
Conference on CSIT.
[10] Al-Abudi. (2009). Digit Recogntion Using Fractal
and Moment Invariants. Iraqi Journal of Science.
[11] Muralidharan, R., dan Chandrasekr,C.Dr. (2011).
Object Recognition using SVM-KNN based on
Geometric Moment Invariant. International
Journal of Computer Trends and Technology. July
to Aug. Issue 2011.
[12] Salambue, R. (2013). Pengenalan Pola Tanda
Tangan dengan Metode Moment Invariant dan
Euclidean Distance. Prosiding Semirata FMIPA.
Universitas Lampung.
[13] Ramteke, J.R. (2010). Invariant Moments Based
Feature Extraction for Handwritten Devnagari
Vowels Recognition. International Journal of
Computer Application. (0975-8887).

[14] Kibria, G.M. dan Al-Imtiaz. (2012) Bengali


Optical Character Recognition using SelfOrganizing Maps. IEEE/OSA/IAPR International
Conference on Informatics, Electronics & Vision.
[15] Sharma, K.S., Karwankar, A.R. dan Bhalchandra,
Dr.A.S. (2010). Devnagari Character Recognition
Using Self Organizing Maps. IEEE.
[16] Budhi,S.G., Adipranata,R., Anwar,B., Setiadi,B.,
Hartanto,A., Nathaniel,A. (2010). Kombinasi SelfOrganizing Map Neural Network dan K-Nearest
Neighbor untuk Klasifikasi Otomatis Citra
Kelompok Bintik Matahari.
[17] Budhi, S.G., Liliana and Harryanto S. (2008).
Cluster Analysis Untuk Memprediksi Talenta
Pemain Basket Menggunakan Jaringan Saraf
Tiriuan Self Organizing Maps (SOM). Jurnal
Informatika, Vol. 9. No. 1. (pp. 23-32).
[18] Suliman, A., Sulaiman M.N., Othman M. dan
Wirza R. (2010). Chain Code and Pre Processing
Stages of Handwritten Character Image File.
Electronic Journal of Computer Science and
Information Technology (eJSIT). Vol. 2. No.1.

Tabel 1. Perbedaan Angka Arab dan Angka Non Arab

Arab

Latin

Romawi

II

III

IV

VI

VII

VIII

IX

Anda mungkin juga menyukai