Anda di halaman 1dari 7

See discussions, stats, and author profiles for this publication at: https://www.researchgate.

net/publication/283083037

Pengenalan Tulisan Tangan untuk Angka tanpa Pembelajaran

Conference Paper · October 2015

CITATIONS READS
0 919

3 authors, including:

Iping Supriana Edvin Ramadhan


Bandung Institute of Technology Bandung Institute of Technology
267 PUBLICATIONS   266 CITATIONS    5 PUBLICATIONS   2 CITATIONS   

SEE PROFILE SEE PROFILE

Some of the authors of this publication are also working on these related projects:

Geospatial Search Engine View project

New Generation Cryptographic syatem View project

All content following this page was uploaded by Edvin Ramadhan on 22 October 2015.

The user has requested enhancement of the downloaded file.


Pengenalan Tulisan Tangan untuk Angka
tanpa Pembelajaran
Iping Supriana Suwardi1, Edvin Ramadhan2
Sekolah Teknik Elektro dan Informatika, Institut Teknologi Bandung.
1iping@informatika.org

2edvin.ramadhan@students.itb.ac.id

Abstrak—Terdapat banyak metoda pengenalan angka pencarian pun akan semakin spesifik sehingga
latin tulisan tangan, namun umumnya menggunakan membutuhkan waktu dan biaya yang lebih banyak
metoda statistik. Ciri dari metoda statistik adalah dan objek yang diperlukanpun belum tentu
bahwa sistem tidak pernah mempertimbangkan angka didapatkan.
berapa kira-kira yang sedang diolahnya, karena
sistem hanya mengandalkan contoh yang diberikan Dalam makalah ini diperkenalkan teknik
kepadanya lewat pembelajaran. Dalam makalah ini pengenalan objek tulisan tangan berupa angka, tanpa
diusulkan pengenalan angka tulisan tangan tanpa
melakukan pelatihan atau proses pembelajaran.
pembelajaran. Tetapi cukup dengan memanfaatkan
ciri-ciri spesifik dari angka tersebut yang disebut Metode pengenalan yang diterapkan disini adalah
sebagai properti geometri. Hasil percobaan yang dengan memanfaatkan ciri-ciri spesifik dari objek
dilakukan menunjukkan bahwa pendekatan ini yang diamati. Dalam pengenalan tulisan tangan ini,
memiliki kinerja yang lebih baik dari metoda statistik khususnya dalam pengenalan angka, dapat
yang ada dan memiliki waktu komputasi yang lebih dilakukan pemngamatan terhadap ciri-ciri spesifik
cepat. dari angka tersebut. Pengamatan dengan
menggunakan ciri-ciri spesifik ini diharapkan dapat
Kata Kunci— Properti Geometri, Pengenalan Tulisan
Tangan, Pengenalan Tanpa Pembelajaran, Metoda menunjukkan kinerja yang lebih dan waktu
Non-Statistik. pengenalan yang lebih singkat dibanding
menggunakan metode statistik. Pada bagian berikut
1. PENDAHULUAN akan dijelaskan beberapa pendekatan non-statistik
Penelitian tentang pengenalan tulisan tangan yang pernah ada yang digunakan dalam pengenalan
khususnya untuk angka dan huruf latin, merupakan tulisan tangan terutama pendekatan yang digunakan
salah satu bahasan dalam pengembangan teknik untuk pengenalan angka. Selanjutnya dilanjutkan
pengenalan pola yang masih berkembang saat ini. dengan metode pengenalan yang diusulkan, beserta
Penelitian ini mulai diminati sejak tahun 1990-an, hasil imlementasinya dan beberapa pembahasan
semenjak dipopulerkan oleh Prof. Ching Yee Suen serta kesimpulan yang dapat diambil dari penerapan
[2] berbagai penelitian dilakukan untuk mengenali metode ini.
berbagai bentuk tulisan tangan. Perkembangan
2. KAJIAN PUSTAKA
konsep pengenalan tulisan tangan saat ini yang
paling banyak adalah konsep yang menggunakan Penelitian tentang pengenalan tulisan tangan
metoda statistik. Ciri utama dari penggunaan dari mulai menarik perhatian sejak tahun 1990-an,
metoda statistik adalah sistem yang dikembangkan Beberapa penelitian telah dilakukan dalam
tidak memperhitungkan atau mempertimbangkan mengenali berbagai bentuk tulisan tangan. Baik itu
bentuk tulisan atau objek yang sedang diolah atau dalam bentuk tulisan latin maupun dalam bentuk
dikenalinya. Sistem yang dikembangkan dengan tulisan lain seperti bahasa yang digunakan pada
menggunakan metoda statistik hanya berpedoman Negara Arab [7,8], Jepang, China [6], Korea,
pada contoh pola dari sampel yang di ajarkan Spanyol [13], dan berbagai Negara lain yang tidak
kepadanya, dan didalam proses ekstraksi cirinya pun menggunakan tulisan latin sebagai tulisannya.
secara umum tidak menggunakan ciri – ciri fisik Berbagai pengembangan metode sintaktik telah
yang bisa diamati oleh mata manusia [1]. dilakukan untuk pengenalan tulisan tangan ini,
seperti, Pengenalan huruf Arab yang menggunakan
Pembelajaran seperti ini akan membutuhkan adaptive slant correction algorithm dan polygonal
banyak data untuk proses pembelajarannya, untuk approximation algorithm dalam fungsi fuzzy [10],
beberpa kasus penggunaan metode statistik ini handwriting model for syntactic recognition of
sangat efisien dan memiliki tingkat keakuratan yang cursive script [9]. Penggunaan markov model [12]
tinggi [1,3]. Namun dengan semakin banyaknya data pun juga sangat gemar digunakan saat ini. Berbagai
inipun ternyata tidak membuat sistem pembelajaran sistem pengenalan tulisan baik itu tulisan cetak
dengan menggunakan metode statistik ini akan komputer ataupun tulisan tangan, sudah sangat
menjadi lebih baik, malah akan semakin sulit dalam berkembang dengan memanfaatkan konsep marcov
mengenali, ini dikarenakan semakin banyak data model.
yang digunakan dalam pembelajaran, maka proses
Perhatian utama pada tulisan tangan angka
dengan teks Latin adalah variabilitas tinggi di
kontras antara gambar dari kelas yang sama tetapi
juga dalam satu gambar itu sendiri karena
pemindaian artefak atau gaya penulisan yang
berbeda untuk setiap orang yang menulisnya.
Beberapa langkah pra-pengolahan yang dilakukan
sangat bergantung pada gambar biner (seperti
normalisasi ukuran). Sehingga perlu dilakukan
normalisasi kontras menggunakan nilai ambang
tertentu untuk melakukan proses binarisasi tersebut.
Normalisasi bekerja dengan memetakan pixel terang
ke putih dan pixel yang gelap ke hitam [11].
Selain variabilitas yang tinggi juga perlu
diperhatikan tentang nilai noise dan kemiringan
tulisan yang terdapat pada gambar [11]. Namun
dalam penelitian ini tidak perlu mengkhawatirkan Gambar 1. Bentuk Definisi Angka Nol (0)
tentang kemiringan tulisan pada gambar. Karena
untuk masalah kemiringan tersebut, telah teratasi
dengan ciri spesifik dari karakter yang didefinisikan.
Ciri spesifik ini disebut dengan properti geometri
[14] dari karakter atau angka tersebut.

3. METODE YANG DIUSULKAN


Untuk proses pengenalan, dalam penelitian ini
diperlukan suatu bentuk definisi properti geometri
yang spesifik dari angka yang akan dikenali. Untuk
itu ciri yang dipakai adalah seluruh properti
geometri yang bisa diekstrak dari angka tersebut.
Ciri utama yang menjadi patokan adalah jumlah
ujung dan simpangan yang terdapat pada angka
tersebut. Gambar 1 hingga 10 berikut ini adalah
contoh definisi ciri dari setiap karakter angka yang
menjelaskan bentuk spesifik dari angka tersebut.
Dan analisis ciri ini menjadi pedoman dalam untuk
melakukan rekognisi tulisan tangan berbentuk angka
tanpa melakukan learning terlebih dahulu. Gambar 2. Bentuk Definisi Angka Satu (1)

Pada Gambar 1 diperlihatkan karakteristik dari


Angka Nol (0), dimana ciri utama angka nol adalah
memiliki karakteristik satu bulatan, dan tidak harus
memiliki memiliki persimpangan, titik awal dan titik
akhir.
Pada Gambar 2 diperlihatkan karakteristik dari
Angka Satu (1), dimana angka satu ini memiliki
ukuran panjang rantai kode sebesar tinggi imagenya,
tidak memiliki bulatan, pada umumnya tidak
memiliki persimpangan, selalu diawali dari titik
awal (kotak hitam bernilai 0) pada bagian atas dan
diakhiri pada titik akhir (kotak hitam bernilai 1) pada
bagian bawah. Sebagaian penulisan angka satu
biasanya diberi garis miring pada bagian atas dan
atau alas pada bagian bawah nya. Untuk pemberian
garis miring ini umumnya akan menimbulkan
kerancuan karena akan mirip dengan karakteristik
dari angka tujuh.
Gambar 3. Bentuk Definisi Angka Dua (2)
Pada Gambar 3 diperlihatkan karakteristik dari memiliki satu persimpangan pada bagian kanan
Angka Dua (2), diamana angka dua ini memiliki 2 tengah (kotak kuning berlabel A). Pada
ujung berawal dari kiri atas atau kiri tengah (kotak implementasinya sering terjadi kesalahan
hitam bernilai 0) dan berakhir pada bagian kanan pendeteksian yang disebabkan kemiripannya
bawah (kotak hitam bernilai 1). Dan pada umumnya dengan angka Sembilan, terlebih lagi jika penulisan
angka dua ini tidak memiliki persimpangan dan angka empat nya memiliki bulatan karena ujung
tidak memiliki bulatan. tengah atas dan ujung kanan saling bersinggungan.

Gambar 6. Bentuk Definisi Angka Lima (5)

Gambar 4. Bentuk Definisi Angka Tiga (3)


Pada Gambar 6 dipelihatkan karakteristik dari
Pada Gambar 4 ini diperlihatkan karakteristik Angka Lima (5), karakteristik dari angka lima ini
dari Angka Tiga (3), dimana pada bagian ini berlawanan dengan angka dua, dimana kalau angka
diperlihatkan bahwa angka tiga itu berawal dari kiri dua berawal dari kiri atas atau tengah dan berakhir
atas (kotak hitam bernilai 0) dan berakhir menuju pada kanan bawah, maka pada angka lima ini
kiri bawah (kotak hitam bernilai 1), dan bisa penulisan berawal dari kanan atas (kotak hitam
dipastikan tidak memiliki simpangan atau bulatan. bernilai 0) dan berujung menuju kiri tengah atau
bawah (kotak hitam bernilai 1). Seperti pada angka
dua, angka lima ini tidak memiliki persimpangan
dan tidak memiliki bulatan.

Gambar 5. Bentuk Definisi Angka Empat (4)

Pada Gambar 5 ini diperlihatkan karakteristik


dari Angka Empat (4), dimana angka empat ini Gambar 7. Bentuk Definisi Angka Enam (6)
secara umum memiliki 3 ujung, dimana ujung
pertama dimulai pada bagian tengah atas (kotak Pada Gambar 7 diperlihatkan karakteristik dari
hitam bernilai 0), ujung kedua pada bagian kanan Angka Enam (6), pada umumnya angka enam
atas (kotak hitam bernilai 1) dan ujung ke tiga pada memiliki satu bulatan dan ujung diatasnya.
bagian kanan bawah (kotak hitam bernilai 2), dalam Penulisan dimulai dari ujung atas (kotak hitam
tulisan tangan pada umumnya angka empat ini tidak bernilai 0), dan berakhir pada simpangan dibagian
memiliki bulatan, tapi dapat dipastikan hanya kanan tengah (kotak kuning berlabel A).
sedangkan pada angka sembilan ujung berada pada
bagian bawahnya. Penulisan angka sembilan pada
umumnya dimulai dari persimpngan pada bagian
kanan tengah (kotak kuning berlabel A) dan berakhir
pada ujung yang berada pada bagian kiri bawah
(kotak hitam bernilai 0). Jika pendeteksian
mengunakan sistem rotasi atau gambar yang di
deteksi terbalik, maka tidak akan menutup
kemungkinan angka Sembilan ini akan terdeteksi
sebagai angka enam dan sebaliknya.

Gambar 8. Bentuk Definisi Angka Tujuh (7)

Pada Gambar 8 diperlihatkan karakteristik


standar dari Angka Tujuh (7), dimana penullisan
angka tujuh ini berawal dari kiri atas melewati satu
persimpangan dan berakhir pada bagian bawah.
Pada standarnya angka tujuh ini memiliki 4 titik
ujung yaitu pada kiri atas sebagai awal penulisan
(kotak hitam bernilai 0), pada bagian kanan tengah
(kotak hitam bernilai 1) dan kiri tengah (kotak hitam
bernilai 2) untuk garis tengah dari angka tujuh, dan
pada bagian bawah (kotak hitam bernilai 3). Angka
tujuh sudah dipastikan tidak memiliki bulatan,
namun bisa memiliki 1 persimpangan (kotak kuning
berlabel A), bisa juga tidak memiliki persimpangan. Gambar 9. Bentuk Definisi Angka Delapan (8)
Penulisan angka tujuh yang tidak memiliki garis
tengah akan merubah definisi dari angka tujuh
tersebut, karena jumlah ujung hanya tinggal 2, dan
tidak akan memiliki persimpangan, sehingga
karakteristik yang dimiliki akan mendekati
karakterisitik angka satu. Karena kesalahan inilah
yang membuat sering terjadi kesalahan saat
pendeteksian angka tujuh dan angka satu.
Untuk Angka Delapan (8) yang diperlihatkan
pada Gambar 9 ini dapat dilihat bahwa karakteristik
dari angka delapan ini adalah memiliki dua bulatan
dan memiliki dua persimpangan. Penulisan angka
delapan dimulai dari salah satu persimpangan, yaitu
dimulai dari persimpangan pada kiri tengah (kotak
kuning berlabel A) dan berakhir pada persimpangan
pada kanan tengah (kotak kuning berlabel B). Angka
delapan bisa dipastikan memiliki dua bulatan,
namun belum tentu memiliki dua persimpangan, Gambar 10. Bentuk Definisi Angka Sembilan (9)
pada beberapa penulisan persimpangan bisa saja
menjadi satu jika penulisan dimulai dari bagian
tengah dan berakhir pada bagian tengah juga 4. ALGORITMA PENGENALAN
sehingga persimpangan yang terbentuk hanya satu
saja. Sebelum menggunakan properti geometri dari
angka nol hingga sembilan seperti yang dijelaskan
Terakhir untuk Angka Sembilan (9) yang pada bagian sebelumnya, perlu dilakukan beberapa
diperlihatkan pada Gambar 10, terlihat karakteristik proses pra-pengolahan sebelum mengenali angka
dari angka sembilan yang memiliki satu bulatan dan apa yang sedang diamati tersebut. Secara umum
ujung dibawahnya. Karakteristik ini juga merupakan terdapat 5 langkah utama atau algoritma yang
kebalikan dari angka enam, dimana enam memiliki digunakan dalam pengenalan karakter angka tanpa
satu bulatan namun ujung pada bagian atasnya, proses learning ini adalah sperti berikut :
1. Melakukan Pembacaan Symbol
Bagian ini merupakan bagian awal dari proses
pengenalan yaitu mentukan symbol atau objek mana
yang akan kenali dan mempersiapkan bagian dari
objek tersebut untuk dilakukan proses pra-
pengolahan. Proses ini dapat dimulai dengan
pembacaan gambar, segmentasi, hingga melakukan
pemotongan gambar sesuai dengan objek atau angka
yang akan diamati.
2. Lakukan Penulangan Satu Pixel (Thinning)
Setelah bagian dari objek atau angka yang akan
dimati ditentukan, maka dilakukan proses
penulangan yang dikenal dengan proses thinning.
Terdapat beberapa pendekatan thinning yang pernah
dikembangkan, mulai dari sequential thinning
algorithm, paraller thinning algorithm hingga
uniteratif thinning algoritm [4].
3. Pembuatan Rantai Kode (Chaincode)
Setelah didapatkan skeleton atau hasil
penulangan dari objek yang diamati barulah
dilakukan proses pendataan rantai kode yang
dimiliki dari angka tersebut, pendeteksian rantai
kode dapat dilakukan dengan berbagai pendekatan
dengan dasar Chaincode Freeman [5]. Pendeteksian
rantai kode yang dilakukan dalam penelitian ini
adalah dengan menelusuri rantai kode sesuai dengan
4 arah mata angin, utara (u), selatan (s), timur (t) dan
barat (b).
4. Tentukan ujung, kode arah, simpul dan bulatan.
Dari rantai kode yang didapatkan dapat
ditentukan arah pergerakan rantai kode dari angka
yang diamati, dan dapat pula ditentukan bagian
rantai kode yang termasuk area ujung, percabangan
atau simpul, dan rangkaian rantai kode mana yang
termasuk bulatan atau bersifat sirkuler. Gambar 11. Contoh bentuk implementasi pada Angka
Tunggal.
5. Lakukan pencocokan karakteristik angka yang
didapat berdasar tabel ciri angka. pada bagian 4. Implementasi dilakukan pada 150
angka tunggal (Gambar 11) dan pada 105 kombinasi
Pada bagian ini sistem akan melakukan
dua angka (Gambar 12). Jika dibandingkan dengan
pencocokan karakteristik yang didapat dari objek
beberpa penelitian sebelumnya yang dilakukan
yang sedang diamati dengan data karakteristik angka
dengan metode learning sebelumnya, maka hasil
yang merupakan ciri spesifik dari tiap angka yang
dari metoda pengenalan tanpa learning ini jauh lebih
telah dijelaskan pada bagian 3.
efektif dan efisien. Dikarenakan penenalan ini tidak
5. IMPLEMENTASI memerlukan data pelatihan, sehingga tidak ada
proses belajar, dan waktu untuk proses belajarpun
Sebagai bahan percobaan dilakukan berbagai uji dapat dihilangkan. Dan untuk hasil pendeteksianpun
coba dengan menggunakan berbagai jenis tulisan metode ini memberikan hasil yang cukup
tangan. Dan dari berbagai ujicoba angka yang memuaskan, walaupun masih terdapat beberapa
dilakukan tersebut, pendekatan ini menunjukkan kesalahan yang disebabkan oleh kerancuan
hasil yang cukup memuaskan. Data contoh yang penulisan atau ketidak sempurnaan rantai kode yang
diambil adalah data real tulisan tangan, yang didapatkan. Dari hasil yang diperoleh didapatkan
dituliskan pada lembaran kertas, dimana pada untuk angka tunggal nilai hasil yang benar mencapai
lembaran kertas tersebut telah diberikan kotak 90,66% sedangkan untuk data dengan kombinasi
pembatas untuk setiap huruf, untuk mempermudah dua angka mencapai 67,61 %, dan untuk
proses pemotongan perkarakter atau angkanya. Dan keseluruhan data yang digunakan diperoleh hasil
kemudian dilakukan pembacaan dan pengenalan yang benar mencapai 81,17 %
karakter sesuai dengan algoritma yang dituliskan
diperoleh tingkat keberhasilan mencapai 81,17%
tanpa harus menggunakan learning. Dan jika dilihat
secara keseluruhan metode pengenalan angka tanpa
learning ini lebih baik dari metode yang
menggunakan learning sebelumnya, karena selain
dapat menghemat waktu dan biaya, proses ini sesuai
dengan kaidah Computer Vision yang menduplikasi
cara kerja mata dalam mengenali objek, khususnya
untuk pengenalan tulisan tangan.
Untuk perluasan kedepannya dapat dilakukan
pada huruf kapital dan dilanjutkan pada huruf kecil
biasa, dengan sedikit perbaikan untuk mengatasi
aspek kursif dan ketidak sempurnaan rantai kode
yang didapatkan.

REFERENSI
[1] A. Delorme, Statistical methods, Encycl. Med. Device
Instrum. 6 (2005) 240–264.
[2] S. Impedovo, More than twenty years of advancements
on Frontiers in handwriting recognition, in: Pattern
Gambar 12. Contoh Bentuk Implementasi pada Kombinasi Recognit., 2014: pp. 916–928.
Angka. [3] A.K. Jain, R.P.W. Duin, J. Mao, Statistical pattern
recognition: a review, IEEE Trans. Pattern Anal. Mach.
6. PEMBAHASAN Intell. 22 (2000) 4–37.
[4] L. Lam, S.W. Lee, C.Y. Suen, Thinning
Dari hasil percobaan yang dilakukan ditemukan methodologies--A comprehensive survey, IEEE Trans.
beberapa hasil yang salah. Kesalahan ini disebabkn Pattern Anal. Mach. Intell. 14 (1992) 869–885.
oleh beberapa hal yang menjadi pembahasan dalam [5] S. Li, Z. Ling, J. Cao, K. Li, G. Liu, A step detection
diskusi ini. Beberapa kesalahan yang muncul dapat algorithm based-on Chain Code, in: 2011 IEEE 3rd Int.
disebabkan oleh salah satu kendala berikut: Conf. Commun. Softw. Networks, ICCSN 2011, 2011:
pp. 164–167.
 Rantai kode yang tidak nyambung (Terputus), [6] C.L. Liu, F. Yin, D.H. Wang, Q.F. Wang, Chinese
bagian rantai kode yang terputus ini dapat handwriting recognition contest 2010, in: 2010 Chinese
menyebabkan hilangnya suatu bulatan atau Conf. Pattern Recognition, CCPR 2010 - Proc., 2010:
simpul, dan bisa juga menambah jumlah ujung pp. 1100–1104.
dari objek angka yang diamati, sehingga [7] L.M. Lorigo, V. Govindaraju, Offline Arabic
menyebabkan karakteristik yang didapatkan Handwriting Recognition :, 28 (2006) 712–724.
menjadi lebih banyak atau lebih sedikit dari [8] L.M. Lorigo, V. Govindaraju, Offline arabic
karakteristik yang seharusnya. Dan ini sangat handwriting recognition: A survey, IEEE Trans. Pattern
mempengaruhi nilai hasil yang didapatkan. Anal. Mach. Intell. 28 (2006) 712–724.
[9] M. Parizeau, R. Plamondon, A handwriting model for
 Adanya aspek kursif (tulisan miring) dalam syntactic recognition of cursive script, Proceedings.,
obyek ternyata juga masih dapat merubah hasil 11th IAPR Int. Conf. Pattern Recognition. Vol.II. Conf.
yang diperoleh, seperti angka satu yang terlalu B Pattern Recognit. Methodol. Syst. II (1992) 308–312.
miring akan menyebabkan ia mengarah ke [10] M. Parveze, Arabic Handwritten Text Recognition
Using Structural and Syntactic Pattern Attributes, PhD
angka tujuh, angka empat yang terlalu miring
Diss. 46 (2010) 141–154.
akan mengarah ke angka sembilan, begitu juga
[11] H. Pesch, M. Hamdani, J. Forster, H. Ney, Analysis of
dengan beberapa angka lain yang jika
preprocessing techniques for Latin handwriting
dimiringkan akan menyerupai angka lain yang
recognition, in: Proc. - Int. Work. Front. Handwrit.
dekat dengannya. Recognition, IWFHR, 2012: pp. 280–284.
[12] T. Plötz, G.A. Fink, Markov models for offline
7. KESIMPULAN
handwriting recognition: A survey, Int. J. Doc. Anal.
Hasil yang diperoleh dengan memanfaatkan Recognit. 12 (2009) 269–298.
properti geometri atau ciri spesifik dari angka ini [13] G. Vamvakas, N. Stamatopoulos, B. Gatos, I.
cukup memuaskan, berbagai tulisan tangan untuk Pratikakis, S.J. Perantonis, Greek Handwritten
angka telah dapat dikenali dengan baik, walaupun Character Recognition, Comput. Intell. (2007).
masih terdapat beberapa kesalahan hasil deteksi [14] R. Willett, G. Yu, Geometric property (T), Chinese Ann.
yang disebabkan oleh kerancuan penulisan atau Math. Ser. B. 35 (2014) 761–800.
ketidak sempurnaan rantai kode yang didapatkan.
Dari 255 data yang digunakan untuk pengujian

View publication stats

Anda mungkin juga menyukai