Anda di halaman 1dari 4

Melakukan entry data dengan OCR

(Optical Character Recognition)


Optical Character Recognition (OCR) adalah sarana yang digunakan untuk mengenali
karakter optis untuk membaca informasi ke dalam sistem komputer. Indentifikasi karakter
yang tercetak ini dilakukan dengan menggunakan pengindera cahaya seperti yang terdapat
pada scanner.
Sistem pemrosesan data yang ideal merupakan sistem di mana data diterima dari sumber dan
diolah secepat mungkin. Dalam hal ini, mesin mengenali simbol dan angka, langsung dalam
format yang lama, seperti yang digunakan manusia dalam aktivitas bisnis dan sosial seharihari.
Saat ini pola yang dapat dikenali komputer tidak cocok dibaca manusia. Demikian juga, data
yang berasal dari manusia biasanya tidak diimpor langsung ke komputer. Meski demikian,
penanganan data dilambangkan dengan proses konversi dari format manusia ke format
komputer.
Tujuan utamanya adalah memungkinkan komputer langsung membaca dokumen sumber.
Masalah konversi pola di dokumen input ke signal elektronik, yang cocok untuk diolah
komputer merupakan salah satu pengenalan pola.
Pada saat ini terdapat dua sistem otomatis yang dirancang untuk dapat mengenali karakter
cetakan, yakni: OCR (Optlcal Character Recognition) dan MICR (Magnetic Ink Character
Recognition).
Pada awalnya, karakter dicetak dalam format typeface konvensional, atau bar code. Biasanya
bertinta hitam dengan latar belakang putih. Kemudian karakter di-scan dengan mengukur
pantulan optis. Dalam sistem MICR, karakter dicetak dalam format yang mempunyai
stylesheet sempurna, dengan tinta yang difragmentasi dengan partikel bermagnet. Saat
dokumen MICR dibaca, tinta ditarik sebelum karakter berada pada head baca. Signal output
yang dihasilkan, diatur oleh partikel bermagnet yang melewati head untuk memindai segala
karakter proporsional terhadap proyeksi vertikal suatu karakter.
Kemampuan mesin mengenali karakter yang dicetak dalam format yang mudah dikenali
manusia, mempunyai keuntungan besar dalam mengurangi tugas pengumpulan data. Jadi,
dapat mempercepat aliran data di sistem. Biaya persiapan data dapat ditekan dan lebih akurat
dibanding metode yang lebih konvensional.
Sistem pengenalan karakter dikembangkan di berbagai organisasi dan menghasilkan berbagai
macam sumber typeface. Dengan adanya penyempurnaan teknik pengenalan karakter,
standarisasi telah ditetapkan, namun masih terlihat perbedaan sumber yang digunakan.
Di bidang MICR, cenderung sedikit bervariasi, dan hanya ada dua sumber, yakni E13B dan
CMC7. Keduanya diterima sebagai standar intemasional.

Di bidang sistem OCR, banyak terdapat variasi, meski organisasi standar internasional telah
mengajukan dua standar sumber yang bernama OCRA dan OCRB.
Dalam beberapa hal, MICR kurang fleksibel dibanding OCR. Sistem MICR menghendaki
bahwa karakter harus dicetak dalam format yang mempunyai stylesheet sempurna, dan sangat
akurat. Akan tetapi, sistem pengenalan ini terletak pada partikel bermagnet yang membentuk
setiap karakter. Meskipun demikian, sulit dikritik, sistem OCR memiliki sejumlah kelebihan
ketika menangani dokumen yang rusak dan terlipat atau dokumen yang telah kotor atau
ditindih karakter.
Sistem OCR tidak terpengaruh oleh format dengan stylesheet tertentu. Bahkan stylesheet
yang kurang sempurna dapat dikenali. OCR juga dapat mengenali karakter yang dibuat oleh
mesin tik manual dan dapat dikonversi ke dalam karakter yang terdapat dalam komputer.
Aspek ini memungkinkan kemudahan dan fleksibilitas dalam menentukan proses
pengumpulan data. Di kedua sistem, karakter yang dibaca, harus dicetak di area dokumen
yang ditentukan dengan standar registrasi pencetakan yang cukup tinggi.
MICR telah digunakan dalam cek perbankan di seluruh dunia. MICR sorter/reader digunakan
untuk menyortir cek secara otomatis, untuk membagi cek ke nasabah di berbagai cabang, dan
cek sebelumnya dicetak dengan kode cabang. Nomor cek dan nomor rekening nasabah juga
dicetak sebelumnya. Nantinya jumlah transaksi dapat ditambahkan dengan MICR encoder.
Perincian cek otomatis dapat dibaca pada memori komputer untuk meng-update rekening
pelanggan.
OCR telah digunakan sebagai turn around document dalam akuntansi sewa-beli dan aplikasi
serupa. Setiap pelanggan diberi buku voucher yang dicetak beserta jumlah pembayaran dalam
kontrak sewa.
Sebagai langkah pengenalan terhadap sistem OCR, marilah kita lakukan langkah-langkah
pemindaian (scanning) berikut ini.
1. Aktifkan aplikasi FreeOCR.net melalui menu Start dan All Program sehingga muncul
tampilan awal seperti ini.

2. Terdapat beberapa menu dan toolbar yang digunakan, yaitu :

File, digunakan jika kita akan melakukan :


.
.

Open ( membuka) file yang pernah di-scan atau gambar berupa teks.
Scan atau memindai suatu gambar teks.
Select Scanner, bila ada beberapa mesin secanner yang terhubung dengan komputer kita.
Save teks digunakan apabila kita akan menyimpan teks dalam file berektensi txt.
Exit untuk keluar dari software.

Start OCR Process, digunakan ketika kita telah


mendapatkan gambar (image) berupa teks untuk merubahnya menjadi teks yang dapat
disunting (editing).

Pilihlah menu Settings, untuk melakukan setting bahasa.


3. Setelah diset, kini kita siap melakukan pemindaian (scanning) dengan menggunakan
OCR.
4. Simpanlah atau letakkanlah teks yang akan kita scan dalam lensa Scanner. .

5. Pilihlah menu File lalu klik perintah Scan atau klik langsung toolbar Scan

dan tunggulah bebarapa saat ketika aplikasi melakukan Scanning Page


kemudian klik toolbar OCR
maka aplikasi melakukan Recognition Page,
sehingga akhirnya muncul tampilan Text Editor.
6. Pada Text Editor inilah kita dapat mengolah, menyunting, dan memperbaiki teks sesuai
dengan aslinya sebelum kita menyalin dan memindahkannya ke dalam aplikasi Iain (misalnya
ke dalam Microsoft Word).
7. Untuk memindahkan hasil scan pada kolom Text Editor ke Microsoft Word, kita dapat
menyorot teks atau paragraf yang kita perlukan dan mengkopinya (CtrI+C) dan membuka
halaman dokumen Word lalu mem-pastenya (CtrI+V).

Anda mungkin juga menyukai