Anda di halaman 1dari 12

Metode Feature Extraction untuk

Character Recognition
Contents
1 Pendahuluan ................................................................................................................................... 2
1.1 Posisi Feature Extraction .......................................................................................................... 2
1.2 Representasi Karakter .............................................................................................................. 3
1.3 Invariant .................................................................................................................................. 3
1.4 Reconstructability .................................................................................................................... 4
2 Metode Feature Extraction.............................................................................................................. 4
2.1 Tipe Feature Extraction ............................................................................................................ 4
2.2 Gray-Scale Image ..................................................................................................................... 4
2.2.1 Template Matching ..................................................................................................... 4
2.2.2 Deformable Templates................................................................................................ 4
2.2.3 Unitary Image Transforms ........................................................................................... 5
2.2.4 Zoning......................................................................................................................... 5
2.2.5 Geometric Moment Invariants .................................................................................... 6
2.2.6 Zernike Moments ........................................................................................................ 6
2.3 Binary Image ............................................................................................................................ 6
2.3.1 Template Matching ..................................................................................................... 6
2.3.2 Projection Histogram................................................................................................... 6
2.3.3 Zoning......................................................................................................................... 7
2.3.4 Geometric Moment Invariants .................................................................................... 8
2.4 Binary Contour......................................................................................................................... 8
2.4.1 Contour Profile............................................................................................................ 8
2.4.2 Zoning......................................................................................................................... 8
2.4.3 Spline Curve Approximation ........................................................................................ 9
2.4.4 Elliptic Fourier Descriptor.......................................................................................... 10
2.5 Vector Represetation (Skeleton)............................................................................................. 10
2.5.1 Template Matching ................................................................................................... 10
2.5.2 Deformable Templates.............................................................................................. 10
2.5.3 Graph Description ..................................................................................................... 10
2.5.4 Discrete Feature........................................................................................................ 10
2.5.5 Zoning....................................................................................................................... 12
2.5.6 Fourier Descriptor ..................................................................................................... 12
3 Referensi ....................................................................................................................................... 12

1 Pendahuluan
1.1 Posisi Feature Extraction
Feature extraction merupakan tahap terpenting dalam sistem character recognition. Sistem Optical
Character Recognition (OCR) biasanya memiliki tahapan pemrosesan sebagai berikut:

1. Gray-level scanning dalam resolusi tertentu, biasanya 300 – 1000 dots/inch.


2. Preprocessing
a. Binarization (two-level thresholding), baik dengan metode global atau adaptif (lokal)
b. Segmentation, untuk mengisolasi individual character.
c. Konversi ke dalam representasi lain, misalnya skeleton atau contour (optional).
3. Feature extraction
4. Classification
5. Contextual verification/postprocessing
1.2 Representasi Karakter
Suatu karakter dapat memiliki representasi yang berbeda-beda. Terhadap masing-masing representasi
dapat dilakukan metode feature extraction yang berbeda-beda. Beberapa representasi tersebut antara
lain:

1. Gray-scale subimage
2. Binary: solid, contour
3. Skeleton (vector)

1.3 Invariant
Satu karakter dapat memiliki berbagai variasi. Karena itu dibutuhkan fitur yang memiliki nilai sama pada
beragam variasi tersebut. Fitur seperti itu dinamakan invariant. Beberapa variasi yang mungkin
dilakukan:

 Rotation
 Scaling
 Stretched
 Skewing
 Mirrored

Jika fitur invariant tidak dapat ditemukan, alternatifnya adalah dengan melakukan normalization
sehingga memiliki standar size, rotation, contrast, dll. Namun perlu diingat bahwa cara ini akan
menghasilkan discretization error.
1.4 Reconstructability
Untuk beberapa metode feature extraction, character dapat direkonstruksi dengan menggunakan fitur
yang tersedia. Dengan merekonstruksi karakter, dapat dilakukan pengecekan secara visual apakah fitur
yang digunakan sudah cukup atau belum.

2 Metode Feature Extraction


2.1 Tipe Feature Extraction
Terdapat beberapa tipe berdasarkan pendekatannya:

1. Statistical
a. Template Matching
b. Deformable Template
c. Projection Histogram
d. Zoning
e. Contour Profile
f. Spline Curve Approximation
2. Stuctural: Discrete Features
3. Transformation & Descriptor
a. Unitary image transforms
b. Geometric Moment
c. Zernike Moment
d. Fourier Descriptor

2.2 Gray-Scale Image


2.2.1 Template Matching
Metode ini sudah lama ditinggalkan oleh sistem OCR modern. Metode ini sebenarnya tidak melakukan
feature extraction, melainkan image itu sendirilah yang menjadi fiturnya (dalam besaran Energy). Yang
dilakukan hanyalah menyesuaikan ukuran image sehingga sama dengan template. Template yang
menghasilkan similarity terbesar atau di atas threshold akan dianggap sebagai kelas hasil klasifikasi.

Metode ini memiliki kekurangan:

1. Hanya dapat mengenali image dengan ukuran dan rotasi yang sama.
2. Hanya dapat dilakukan pada tingkat contrast dan grey level tertentu
3. Rentan terhadap noise dan variasi karakter
4. Menggunakan beberapa template untuk satu kelas dapat dilakukan, namun sangat tidak efisien.

2.2.2 Deformable Templates


Metode ini menggunakan template berupa kontur, skeleton, dll dari suatu kelas karakter. Sebuah image
target ditransformasi agar sesuai dengan template (perubahan ukuran, edge detection, dll), kemudian
template tersebut dideformasi sedemikian rupa sehingga mencapai bentuk yang paling mendekati
image target. Berdasarkan deformasi tersebut, nilai similarity dihitung.

2.2.3 Unitary Image Transforms


Pada template matching, seluruh pixel digunakan sebagai fitur. Tujuan unitary image transform adalah
mengurangi jumlah fitur dengan tetap menjaga informasi penting dari bentuk karakter. Dengan
transformasi ini, pixel diurutkan berdasarkan variansinya kemudian pixel yang memiliki nilai variansi
tertinggi digunakan sebagai fitur. Contoh transformasi: Karhunen-Loeve (KL), Fourier, Hadamard, dan
Haar.

Kelebihan:

1. Mengurangi jumlah fitur dan komputasi


2. Dapat dilakukan inverse-transform sehingga image awal dapat direkonstruksi.

Kekurangan:

1. Not rotation-invariant
2. Input image harus memiliki ukuran yang persis sama
3. Not illumination-invariant

2.2.4 Zoning
Image dibagi ke dalam n x m grid. Kemudian, untuk setiap sel, nilai rata-rata gray-level dihitung. Dari
sana, dihasilkan fitur vektor dengan n x m buah komponen. Fitur yang dihasilkan tidak illumination-
invariant.
2.2.5 Geometric Moment Invariants
Image direpresentasikan dengan menggunakan konsep matematika yang disebut geometric moment.
Dengan menggunakan konsep ini, fitur yang dihasilkan bersifat translation-, scale-, dan rotation-
invariant.

2.2.6 Zernike Moments


Image direpresentasikan dengan menggunakan konsep matematika yang disebut Zernike moment

2.3 Binary Image


Binary image merupakan simplifikasi dari gray-scale image yang dihasilkan melalui binarization, baik
metode global maupun adaptif. Disebut simplifikasi karena hanya terdapat range nilai 0 dan 1, dan
bukannya 0 – 255. Pada binary image, semua invariant masih relevan kecuali illumination.

Solid binary character dapat dikonversi ke dalam bentuk representasi lain: outer contour, contour
profile, skeleton, dll. Dalam konteks sistem OCR, tujuan dilakukan konversi adalah untuk mengambil
informasi yang relevan dan menghilangkan informasi yang kurang relevan untuk mengenali bentuk
karakter.

2.3.1 Template Matching

2.3.2 Projection Histogram


Metode ini dilakukan dengan melakukan proyeksi horizontal dan atau vertical terhadap image. Untuk
proyeksi horizontal, y(xi) merupakan jumlah pixel dimana x = xi. Proyeksi histogram sangat sensitive
terhadap rotasi. Proeyeksi vertical invariant terhadap kemiringan, namun tidak dengan proyeksi
horizontal.

Saat ini, teknik tersebut banyak digunakan untuk segmentasi karakter, kata, dan baris. Selain itu,
digunakan pula untuk mendeteksi apakah input dari scanner terotasi atau tidak. Sebagai variasi,
terdapat pula radial projection.

2.3.3 Zoning
Metode zoning pada binary image digunakan untuk menjawab permasalahan karakter text-printed yang
terdegradasi, sehingga menyebabkan, misalnya self-touching. Baik contour extraction maupun thinning
terbukti tidak dapat menyelesaikan permsalahan tersebut sebagaimana ditunjukkan pada gambar di
bawah ini. Zoning digunakan untuk menghitung jumlah pixel hitam pada suatu zona tertentu.
2.3.4 Geometric Moment Invariants
Metode ini sama dengan pada gray-scale image, hanya saja dipandang sebagai kasus khusus dimana
skalanya hanya 0 dan 1. Berdasarkan studi Belkasim yang membandingkan Hu, Barnieh, Zernike, Teague-
Zernike, dan pseudo-Zernike, menggunakan kNN classifier, dihasilkan bahwa Zernike-lah yang
memberikan hasil terbaik.

2.4 Binary Contour


2.4.1 Contour Profile
Metode ini menghitung jarak (pixel) antara bounding box dengan edge dari karakter. Metode ini
menggambarkan dengan baik bentuk eksternal dari karakter. Metode ini dengan sendirinya bergantung
kepada rotasi.

Sebagai variasi, terdapat pula radial out-in dan in-out profile seperti gambar di bawah ini

2.4.2 Zoning
Zoning pada binary contour sama dengan pada binary image, hanya saja pada setiap sel dihitung jumlah
segmen dari sequence contour berdasarkan orientasinya.
2.4.3 Spline Curve Approximation
Metode ini mengidentifikasi titik-titik pada kontur dimana terjadi lengkungan yang tajam. Titik tersebut
dinamakan break point. Antar break point tersebut dibentuk kurva dengan fungsi spline. Kemudian,
breakpoints dan parameter dari kurva spline dijadikan fitur.
2.4.4 Elliptic Fourier Descriptor

2.5 Vector Represetation (Skeleton)


2.5.1 Template Matching

2.5.2 Deformable Templates


Template dideformasikan dengan menggunakan small steps yang disebut local affine transform (LAT)
untuk agar cocok dengan skeleton input. Jumlah dan tipe transformasi digunakan sebagai fungsi
distance.

2.5.3 Graph Description

2.5.4 Discrete Feature


Dari thinned character, fitur berikut ini dapat diekstraksi:

1. Jumlah loops (lubang)


2. Jumlah T-join
3. Jumlah tikungan/bengkokan
4. Width-to-height ratio of bounding box
5. Adanya isolated dot
6. Jumlah endpoints dan jumlah endpoints pada setiap direction N, S, E, W
7. Jumlah semi lingkarang di setiap direction
8. Jumlah perpotongan dengan garis vertical dan horizontal
9. Jarak dari bounding box berdasarkan garis vertical dan horizontal

10. Hook

11. Open up/open down

12. Garis veritkal/horizontal

13. Blok
14. Garis

2.5.5 Zoning
Metode ini membagi image ke dalam beberapa zona. Pada masing-masing zona dihitung panjang dari
character graph yang ada. Fitur ini dapat dibuat size dependent namun tidak dengan rotation. Ada atau
tidaknya junction atau endpoints pada suatu zona dapat menjadi fitur tambahan.

2.5.6 Fourier Descriptor


Metode ini sama dengan representasi image lainnya.

3 Referensi

1. Feature extraction methods for character recognition-a survey (Ř Due Trier, AK Jain… - Pattern
recognition, 1996 - Elsevier)
2. Optical Character Recognition for Handwritten Characters (Giorgos Vamvakas)
3. Optical Character Recognition dengan Metode Gabungan Template Matching dan Feature
Extraction (Denny Setiawan, Tugas Akhir di Universitas Kristen Petra)
4. Representation and recognition of handwritten digits using deformable templates (Jain,
Zongker. 1997)