SKRIPSI
OLEH :
HASRUL ASWAD
NIM : 16010252
SKRIPSI
Diajukan untuk Memenuhi Persyaratan Menyelesaikan Studi Strata Satu (S-1) dan
Memperoleh Gelar Sarjana S.Kom
OLEH :
HASRUL ASWAD
NIM : 16010252
ii
UNTVERSITAS hTT}RT]L JADID
d Biasa
Disahkan oleh,
4,,,-
IIASRTIL ASW AD"
W,/
MAULDIANSYAI{, ll{.Kom
Alamat Tetap Mahasiswa:
ilt
IIALAMAN PERSETUJUAIT
SKRIPSI
APLIKASI KALKT'LATOR TI]LISAI\I TANGAIY SEDERHANA
MENGGT}NAKAI{ OPTTCAL CHARACTER RECOGNITION (OCR)
HASRI}LAS,WAI)
Komisi Pembimbing
MAULIDIANSY
Tim Penguji"
Penguji II
ilr
MOII. AINOL YAOIN. lfl,Kom
tv
IIALAMAN PENGESAHAN
SKRIPSil
Ilisusun Oleh :
HASRI'L ASWAI)
1601w52
DewanPenguji SKRIPSI
NIDN 0748,28702
NIDN 0723A79rc1
Pembimbing I)
,v
PERNYATAA}I
ORISINALITAS SKRIPSI
Demikian surat pernyataan ini saya buat dalam keadaan sadar tanpa paksaan dari
pihakmanapun.
IIASRT'L ASWAI}
IYIM 160102s2
UI
ABSTRAK
Kalkulator adalah alat hitung yang banyak digunakan dalam berbagai bidang
khususnya bisnis dan perdagangan. Penggunaan kalkulator memudahkan
manusia dalam melakukan operasi hitung, tetapi terdapat kendala dalam proses
penginputan angka jika ingin menghitung nilai dari angka-angka pada media
tulis seperti kertas, papan tulis dan sebagainya. Pengguna harus terlebih dahulu
melihat teks pada media tulis, kemudian membacanya dan mengingatnya lalu
mengetik tulisan tersebut pada alat atau aplikasi kalkulator. Kekurangan dari
cara ini adalah ketika pengguna lupa dengan tulisan pada media tulis, maka
pengguna akan melihat teks tulisan nya dan mengingatnya lagi sehingga
membutuhkan waktu yang lebih lama dalam melakukan perhitungan
menggunakan kalkulator. Metode yang digunakan pada penelitian ini adalah
Optical Character Recognition, metode ini dapat mengenali teks yang terdapat
pada gambar atau citra tulisan tangan operasi bilangan matematika. Hasil dari
pengenalan teks tersebut kemudian akan dilakukan perhitungan aritmatika untuk
mendapatkan hasil hitung nya. Dari uji coba terhadap 20 citra tulisan tangan
operasi bilangan matematika, diperoleh hasil akurasi ekstraksi teks sebesar 85%
dan akurasi citra tulisan tangan yang dapat dihitung dan benar sebesar 85%.
vii
KATA PENGANTAR
Puji syukur kehadirat Allah SWT, karena atas rahmat dan hidayah-Nya
sehingga penulis dapat menyelesaikan laporan skripsi ini. Tak lupa pula penulis
mengirimkan salawat serta salam kepada junjungan nabi besar Muhammad SAW.
Laporan skripsi ini merupakan salah satu syarat kelulusan bagi penulis pada
Program studi Informatika di Universitas Nurul Jadid. Adapun judul dari laporan
skripsi penulis adalah “Aplikasi Kalkulator Tulisan Tangan Sederhana
Menggunakan Optical Character Recognition (OCR)”.
1. KH. Moh. Zuhri Zaini, BA selaku pengasuh pondok pesantren Nurul Jadid
sekaligus sang motivator.
2. KH. Abdul Hamid Wahid, M.Ag selaku Rektor Universitas Nurul Jadid.
3. Bapak Gulpi Qorik Oktagalu P. S.Pd., M.Kom selaku ketua Program Studi
Informatika.
4. Bapak Maulidiansyah, M.Kom dan Bapak Supriadi, M.Kom selaku
pembimbing yang telah memberikan arahan dalam penyelesaian laporan
skripsi.
5. Kepada kedua orang tua yang selalu mendukung, memberikan doa, dan
semangat.
6. Kepada keluarga serta sahabat yang telah memberikan dukungan yang besar.
Penulis
viii
DAFTAR ISI
Halaman
HALAMAN SAMPUL ...................................................................................... i
HALAMAN JUDUL ......................................................................................... ii
PENGESAHAN STATUS SKRIPSI ............................................................... iii
PERSETUJUAN SKRIPSI............................................................................... iv
PENGESAHAN SKRIPSI ................................................................................ v
PERNYATAAN ORISINALITAS................................................................... vi
ABSTRAK ........................................................................................................ vii
KATA PENGANTAR ....................................................................................... viii
DAFTAR ISI ...................................................................................................... ix
DAFTAR TABEL ............................................................................................ xi
DAFTAR GAMBAR ........................................................................................ xii
DAFTAR LAMPIRAN .................................................................................... xiii
BAB I PENDAHULUAN .................................................................................. 1
1.1. Latar Belakang ........................................................................................ 1
1.2. Rumusan Masalah ................................................................................... 2
1.3. Tujuan Penelitian ..................................................................................... 2
1.4. Manfaat Penelitian ................................................................................... 2
1.5. Batasan Masalah ...................................................................................... 3
BAB II KAJIAN PUSTAKA ............................................................................ 4
2.1. Penelitian Terkait .................................................................................... 4
2.2. Landasan Teori ........................................................................................ 8
2.2.1. Operasi Aritmatika ............................................................................. 8
2.2.2. Citra Digital ....................................................................................... 9
2.2.3. Thresholding ...................................................................................... 11
2.2.4. Histogram Proyeksi ............................................................................ 11
2.2.5. OpenCV ............................................................................................. 12
2.2.6. OCR (Optical Character Recognition) .............................................. 12
2.2.7. Tesseract OCR ................................................................................... 12
ix
BAB III METODE PENELITIAN .................................................................. 14
3.1. Kerangka Penelitian ................................................................................ 14
3.2. Model Pengembangan ............................................................................. 15
3.2.1. Pengumpulan Dataset......................................................................... 15
3.2.2. Pre-processing.................................................................................... 15
3.2.3. Implementasi Metode Histogram Proyeksi ........................................ 17
3.2.4. Implementasi Optical Character Recognition ................................... 18
3.2.5. Implementasi Perhitungan Aritmatika................................................ 20
3.2.6. Uji Coba ............................................................................................. 21
3.2.7. Kesimpulan ......................................................................................... 21
BAB IV HASIL DAN PEMBAHASAN ........................................................... 22
4.1. Penyajian Data Uji Coba ......................................................................... 22
4.2. Hasil Analisis .......................................................................................... 23
4.2.1. Pre-Processing Citra .......................................................................... 23
4.2.2. Segmentasi Citra Menggunakan Proyeksi Histogram ........................ 24
4.2.3. Implementasi Optical Character Recognition (OCR)........................ 24
4.2.4. Perhitungan Aritmatika ...................................................................... 25
4.3.Hasil Uji Coba .......................................................................................... 26
BAB V PENUTUP ............................................................................................. 32
5.1. Kesimpulan .............................................................................................. 32
5.2. Saran ........................................................................................................ 32
DAFTAR PUSTAKA ........................................................................................ 33
LAMPIRAN-LAMPIRAN
x
DAFTAR TABEL
Halaman
Tabel 2.1 Tabel Perbandingan Penelitian.......................................................... 6
Tabel 4.1 Contoh Dataset ................................................................................. 22
Tabel 4.2 Hasil Ekstraksi Teks Citra Tulisan Tangan Operasi Bilangan
Matematika.......................................................................................................... 26
Tabel 4.3 Hasil Uji Coba Perhitungan Aritmatika ............................................ 29
xi
DAFTAR GAMBAR
Halaman
Gambar 2.1. Citra Biner ......................................................................................... 9
Gambar 2.2. Citra Grayscale ............................................................................... 10
Gambar 2.3. Citra Berwarna ................................................................................ 10
Gambar 2.4. Histogram Proyeksi Horizontal dan Vertikal .................................. 11
Gambar 2.5. Tahapan Proses Tesseract OCR ...................................................... 13
Gambar 3.1. Kerangka penelitian......................................................................... 14
Gambar 3.2. Citra Tulisan Tangan Operasi Bilangan Matematika ...................... 15
Gambar 3.3. Matrik Citra RGB 3x3 ..................................................................... 16
Gambar 3.4. Matrik Citra Grayscale 3x3............................................................. 16
Gambar 3.5. Matrik Biner 3x3 ............................................................................. 17
Gambar 3.6. Proses Histogram Proyeksi ............................................................. 18
Gambar 3.7. Citra Teks Tulisan ........................................................................... 19
Gambar 3.8. Hasil Output OCR ........................................................................... 19
Gambar 3.9. Citra Input, Output Tanpa Whitelist, dan Output Menggunakan
Whitelist ............................................................................................................... 19
Gambar 4.1. Diagram Alir Sistem Kalkulator Tulisan Tangan ........................ 23
Gambar 4.2. Konversi Citra Asli Menjadi Grayscale .......................................... 23
Gambar 4.3. Konversi Citra Grayscale Menjadi Citra Biner............................... 24
Gambar 4.4. Hasil Proyeksi Histogram ............................................................... 24
Gambar 4.5. Hasil Ekstraksi Teks ........................................................................ 25
Gambar 4.6. Proses Perhitungan Aritmatika ........................................................ 25
xii
DAFTAR LAMPIRAN
Halaman
Lampiran 1. Citra Biner ..................................................................................... A-1
Lampiran 2. Citra Grayscale .............................................................................. B-1
Lampiran 3. Citra Berwarna ............................................................................... C-1
xiii
BAB I
PENDAHULUAN
1
tangan angka dan operator matematika yang kemudian mengubahnya menjadi
informasi yang bisa diproses. Informasi yang didapat dari citra tulisan tangan
tersebut kemudian akan diterjemahkan oleh OCR untuk mendapatkan teks angka
dan operator matematika yang kemudian dilakukan operasi aritmatika agar
mendapatkan hasil perhitungan. Dengan adanya penelitian ini, diharapkan dapat
menerapkan metode Image Processing dan Optical Character Recognition untuk
menerjemahkan dan menghitung citra atau gambar tulisan tangan yang
mengandung operasi bilangan matematika dengan akurat.
2
1.5 Batasan Masalah
Agar pembahasan tidak menyimpang dari pokok permasalahan, maka
batasan masalah pada penelitian ini adalah :
1. Canvas atau tempat menulis berwarna putih dan warna tulisan hitam.
2. Library yang digunakan adalah Tess4j dari Tesseract OCR dan OpenCV.
3. Aplikasi hanya dapat menghitung operasi aritmatika sederhana seperti
pertambahan, pengurangan, perkalian dan pembagian.
4. Aplikasi hanya dapat menghitung dua variabel bilangan matematika saja.
3
BAB II
KAJIAN PUSTAKA
4
tangan. Latar belakang penelitian ini adalah berfokus pada pengenalan tulisan
tangan yang merupakan objek penelitian yang sangat menarik di bidang
pengolahan citra, kecerdasan buatan dan komputer visi karena tiap individu
memiliki variasi tulisan tangan yang berbeda antara satu dan yang lainnya.
Pengenalan tulisan tangan atau OCR memproses gambar dengan membandingkan
antara gambar dan pola tulisan yang tersimpan pada sistem.
Pada penelitian ini, metode yang digunakan yaitu image processing yang
terdiri dari grayscale dan thresholding serta segmentasi dan cropping untuk
menghasilkan citra yang baik untuk ekstraksi teks dan jaringan syaraf tiruan untuk
pengenalan karakter tulisan tangan. Hasil dari penelitian ini yaitu aplikasi yang
dibuat mampu menganalisa tulisan tangan. Dari pengujian terhadap 7 buah citra
tulisan tangan, didapatkan hasil persentase akurasi sebesar 70% dengan
menggunakan Jaringan Syaraf Tiruan Backpropagation.
Penelitian berikutnya dilakukan oleh Febri Liantoni (2017) dengan judul
"Pengenalan Karakter Angka Menggunakan Integral Proyeksi " (Liantoni,
2017). Penelitian ini didasari oleh kemajuan teknologi yang membuat komputer
memiliki kemampuan komputasi yang lebih tinggi dalam mengolah data termasuk
pengolahan citra digital yang berhubungan dengan pengenalan karakter angka.
Pengenalan karakter angka termasuk dari salah satu pengenalan pola. Pengenalan
karakter penting untuk mengolah informasi yang memungkinkan proses
identifikasi secara cepat dan otomatis.
Pada penelitian ini, metode yang digunakan merupakan metode Integral
Proyeksi atau Proyeksi Histogram yang berfungsi untuk menghitung jumlah
piksel per baris dan jumlah piksel per kolom. Kelebihan dari metode ini yaitu
pemrosesan yang sederhana dan cepat dalam mengidentifikasi suatu citra digital.
Sedangkan untuk pengenalan angka pada penelitian ini menggunakan metode
ekstraksi fitur yang digunakan untuk mencocokkan karakter angka dari fitur
integral proyeksi vertikal dan horizontal yang telah didapatkan sebelumnya.
Pada pengujian terhadap 20 gambar uji, menghasilkan nilai akurasi sebesar
65% hasil ini membuktikan bahwa metode integral proyeksi mampu melakukan
pengenalan karakter angka. Hasil metode integral proyeksi bergantung dari pre-
5
processing citra. Jika hasil pre-processing citra menghasilkan gambar yang baik,
maka hasil dari integral proyeksi akan menjadi sempurna.
Adapun yang membedakan penelitian ini dengan penelitian sebelumnya
yaitu dari segi objek, metode pengenalan karakter yang digunakan serta
pemanfaatan dari OCR. Pada penelitian yang dilakukan oleh (Maskuri, 2017)
objek yang digunakan pada penelitian ini yaitu citra tulisan tangan huruf alphabet
dan metode yang digunakan untuk pengenalan karakter yaitu metode template
matching. Lalu pada penelitian yang dilakukan oleh (Mahmudi, et al., 2017) objek
yang digunakan yaitu citra tulisan tangan dan metode yang digunakan untuk
pengenalan karakter yaitu jaringan syaraf tiruan backpropagation. Aplikasi dibuat
menggunakan MATLAB sedangkan pada penelitian ini aplikasi dibuat dengan
menggunakan bahasa pemrograman Java yang bersifat open source. Sedangkan
objek yang digunakan pada penelitian ini yaitu citra tulisan tangan operasi
bilangan matematika dan metode yang digunakan untuk pengenalan karakter
adalah Tesseract OCR. Adapun yang menjadi pembeda dengan penelitian yang
dilakukan oleh (Liantoni, 2017) adalah dari segi objek yang digunakan serta
metode pengenalan karakter angka. Untuk lebih jelasnya, perbandingan penelitian
ini dan penelitian sebelumnya dapat dilihat pada Tabel 2.1.
Tabel 2.1. Tabel Perbandingan Penelitian
Pengarang,
No Judul Metode Objek dan Hasil
Tahun
1 Maskuri, M. Implementasi Image Objek citra tulisan
(2017) Metode Template Processing, tangan huruf
Matching Untuk Template alphabet, Dari 3
Media Matching kali ujicoba dengan
Pembelajaran ketebalan 2,4 dan
Pengenalan 15 didapatkan
Karakter Huruf akurasi dibawah
Alphabet 80% dari 104 data
testing pada tiap-
tiap ketebalan.
6
2 Mahmudi, dkk Aplikasi Image Objek citra tulisan
(2017) MATLAB Untuk Processing, tangan, Pada
Mengenali Jaringan Syaraf pengujian terhadap
Karakter Tulisan Tiruan 7 buah citra tulisan
Tangan Backpropagation tangan, didapatkan
hasil akurasi rata-
rata sebesar 70%.
3 Liantoni, F Pengenalan Integral Proyeksi Objek citra
(2017) Karakter Angka (Proyeksi karakter angka,
Menggunakan Histogram), Pada pengujian
Metode Integral Ekstraksi Fitur terhadap 20 citra
Proyeksi karakter angka,
didapatkan hasil
akurasi sebesar
65%.
4 Hasrul Aswad Aplikasi Image Objek citra tulisan
(2020) Kalkulator Processing, tangan operasi
Tulisan Tangan Proyeksi bilangan
Sederhana Histogram, matematika, Dari
Menggunakan Tesseract OCR. pengujian terhadap
Optical 20 citra tulisan
Character tangan operasi
Recognition bilangan
matematika,
didapatkan hasil
akurasi OCR yang
benar sebesar 85%
dan gambar yang
berhasil di
ekstraksi dan benar
sebesar 85%.
7
2.2 Landasan Teori
Landasan teori merupakan penjelasan istilah teori-teori yang terdapat di
dalam penelitian ini. Adapun landasan teori yang terdapat penelitian ini adalah
sebagai berikut :
2.2.1 Operasi Aritmatika
Aritmatika berasal dari bahasa Yunani arithmos yang berarti angka.
Aritmatika adalah cabang tertua dan paling dasar dari matematika yang
digunakan oleh semua orang, Aritmatika biasa digunakan untuk melakukan
perhitungan biasa. yang mencakup penjumlahan,pengurangan, perkalian, dan
pembagian. Operasi-operasi ini merupakan dasar dari operasi aritmatika
tingkat kompleks.
1. Penjumlahan
Penjumlahan adalah dasar dari segala operasi diaritmatika. Bentuk
terdasarnya adalah menggabungkan 2 angka menjadi 1 angka yang adalah
jumlah 2 angka tersebut. Simbol dari penjumlahan dalam matematika adalah
(+).
Contoh :
3+5=8
2+7=9
2. Pengurangan
Pengurangan merupakan kebalikan dari penjumlahan. Pengurangan
mencari selisih dari 2 bilangan. Bila bilangan pengurang lebih kecil dari yang
dikurangi, hasil pengurangan akan positif. Sementara jika pengurang lebih
besar dari yang dikurangi, maka hasil pengurangan akan negatif. Simbol dari
pengurangan adalah (-).
Contoh :
7–5=2
3. Perkalian
Perkalian ialah menggabungkan 2 angka menjadi 1angka yang
merupakan hasil kali 2 bilangan awal disebut pengali dan dikali, atau secara
simpel kita dapat menyebut keduanya faktor. Simbol dari perkalian yaitu (x).
Contoh :
8
2x3=2+2+2=6
4 x 5 = 4 + 4 + 4 + 4 + 4 = 20
4. Pembagian
Pembagian ialah lawan dari perkalian, pembagian mencari bilangan dari
2 bilangan, yaitu pembagi dan yang dibagi. simbol dari pembagian adalah (:).
Contoh :
4 : 2 = 2 karena 2 x 2 = 4 (Rohmah et al., 2016).
2.2.2 Citra Digital
Citra adalah suatu gambaran yang merupakan kemiripan atau imitasi dari
sebuah objek. Citra terbagi menjadi dua jenis, yaitu citra analog dan citra
digital. Citra analog adalah citra yang tidak dapat diolah oleh komputer.
Contohnya adalah lukisan, foto yang tercetak di kertas, hasil CT scan, dan
lain sebagainya. Sedangkan citra digital merupakan citra yang dapat disimpan
kedalam memori dan dapat diolah oleh komputer. Citra analog tidak dapat
ditampilkan dan diolah oleh komputer secara langsung tetapi harus melalui
proses konversi ke citra digital terlebih dahulu.
Citra digital memiliki beberapa jenis yang menentukan cara menyimpan
citra digital kedalam memori. Adapun beberapa jenis citra digital yang biasa
digunakan yaitu :
1. Citra Biner
Citra biner adalah citra yang hanya memiliki 2 warna yaitu hitam dan
putih. Citra biner membutuhkan 1 bit untuk menyimpan kedua warna ini
kedalam memori. Gradasi warna pada citra biner adalah bilangan 0 mewakili
warna hitam dan bilangan 1 mewakili warna putih.
9
2. Citra Grayscale
Citra Grayscale atau Citra Skala Keabuan adalah citra yang banyak
warna nya tergantung dari jumlah bit yang disediakan di memori untuk
menampung warna ini. Pada penyimpanan 8 bit, citra grayscale memiliki
nilai intensitas citra antara 0 sampai 255. 0 mewakili warna hitam dan 255
mewakili warna putih. semakin rendah nilai intensitas citra grayscale maka
warna citra tersebut akan semakin gelap dan sebaliknya jika semakin tinggi
nilai intensitas citra grayscale maka warna citra akan semakin cerah. nilai
intensitas diantara 0 dan 255 merupakan gradasi warna keabuan.
10
2.2.3 Thresholding
Thresholding merupakan proses mengubah citra grayscale menjadi
citra hitam putih atau biner yang mempunyai nilai piksel 0 dan 1.
Thresholding bertujuan untuk mengetahui region yang termasuk objek citra
dan latar belakang citra (Maria et al., 2018). Thresholding dapat didefinisikan
pada persamaan berikut :
1 , 𝑖𝑓 𝑓 (𝑥, 𝑦) ≥ 𝑇
𝑔(𝑥, 𝑦) = { } (1)
0, 𝑖𝑓 𝑓 (𝑥, 𝑦) ≤ 𝑇
Dimana g(x,y) merupakan citra biner hasil dari citra grayscale f(x,y) dan
T merupakan nilai ambang (threshold). Jika nilai piksel pada citra melewati
nilai ambang, maka intensitas warna pada citra akan diubah menjadi 1.
Sebaliknya jika nilai piksel pada citra kurang dari nilai ambang, intensitas
warna pada citra akan diubah menjadi 0 (Masrani et al., 2018).
2.2.4 Histogram Proyeksi
Histogram proyeksi adalah sebuah metode untuk mencari daerah atau
lokasi dari objek. Metode ini menjumlahkan piksel per baris dan piksel per
kolom sehingga dapat diketahui batas-batas dari objek yang berbeda
(Liantoni, 2018). Histogram proyeksi terdiri dari dua bagian yaitu histogram
proyeksi horizontal dan histogram proyeksi vertikal (Septiarini, 2012).
Pv [𝑖] = ∑𝑀
𝑖=1 S[i, j] (2)
11
proyeksi horizontal pada kolom ke-j, yaitu Ph[j], Histogram proyeksi
horizontal dapat didefinisikan dengan persamaan berikut :
𝑀
Ph [𝑖] = ∑𝑗=1 S[i, j] (3)
2.2.5 OpenCV
OpenCV merupakan sebuah library untuk visi komputer yang bersifat
open source yang dibuat oleh Intel dan dapat dioperasikan pada komputer
yang mempunyai sistem operasi Windows ataupun Linux. OpenCV dapat
digunakan untuk penerapan interaksi manusia-komputer, identifikasi objek,
segmentasi, serta pengenalan objek (Irianto, 2010).
2.2.6 OCR (Optical Character Recognition)
Optical Character Recognition merupakan sebuah sistem pada komputer
yang mampu membaca karakter (huruf, angka maupun simbol tertentu) yang
terdapat pada citra atau foto. Foto dapat berupa tulisan cetak maupun tulisan
tangan. hasil ekstraksi foto tersebut menghasilkan teks dengan menyesuaikan
pola karakter per baris dengan pola yang terdapat pada database OCR.
Tingkat akurasi pada OCR sangat bergantung pada kualitas citra dan metode
yang digunakan pada pengolahan citra (Setiawan & Sujaini, 2017). Kelebihan
dari sistem OCR yaitu pengguna dapat memasukkan data tanpa harus
menggunakan papan ketik, melainkan dapat menggunakan pena elektronik
untuk menulis layaknya menulis di sebuah kertas.(Fauzi et al., 2013).
12
Gambar 2.5. Tahapan Proses Tesseract OCR
Penjelasan dari algoritma tesseract adalah sebagai berikut :
1. Langkah pertama adalah Menganalisis komponen yang terhubung. Pada
langkah ini tesseract memeriksa tulisan hitam pada background putih
ataupun tulisan putih yang ada pada background hitam.
2. Hasil dari pemeriksaan atau pendeteksian tulisan hitam atau putih ini
akan menghasilkan blob-blob.
3. Dari hasil blob-blob tersebut, blob-blob diatur sehingga menjadi
kumpulan baris-baris yang telah terpotong-potong lalu dipisahkan kata
per kata dengan menggunakan metode definite space dan fuzzy space.
4. Tahap berikutnya, kata-kata yang sudah terpotong akan di identifikasi
karakternya dari baris teratas hingga baris terbawah. Setiap kata yang
berhasil di identifikasi atau dikenali, dilewatkan dan menjadi data latih
untuk pengklasifikasian adaptif. Tujuan nya agar dapat mengenali kata
selanjutnya dengan lebih akurat.
5. Tahap selanjutnya, proses pengenalan kata akan dilakukan sekali lagi
untuk mengidentifikasi kata-kata yang masih belum dikenali.
6. Langkah terakhir, memecahkan fuzzy space dan menemukan huruf
kecil. Lalu hasil pengenalan karakternya akan ditampilkan.
(Hidayatullah, 2017).
13
BAB III
METODE PENELITIAN
Mulai
Pengumpulan Data
Pre-processing
Uji Coba
Kesimpulan
Selesai
14
3.2 Model Pengembangan
Model pengembangan menjelaskan tentang langkah-langkah atau tahap-
tahap yang akan dilakukan pada penelitian dalam mengumpulkan data atau
informasi hingga tahap pengujian. Adapun penjelasan dari tahap-tahap penelitian
ini adalah sebagai berikut:
3.2.1 Pengumpulan Dataset
Data yang digunakan dalam penelitian ini yaitu citra tulisan tangan
operasi bilangan matematika. Data diambil dari hasil citra tulisan tangan
digital dari canvas atau media tulis yang dibuat dengan bahasa pemrograman
java dengan background dan warna tulisan yang telah ditentukan sebanyak
20 gambar. Tulisan tangan bilangan matematika terdiri dari dua variabel
bilangan dan sebuah operator yang terdiri dari penjumlahan, pengurangan,
perkalian dan pembagian. Gambar tulisan tangan disimpan dengan
menggunakan format .png dengan ukuran gambar berdimensi 484x150
piksel. Adapun contoh hasil data citra tulis tangan dari canvas atau media
tulis adalah sebagai berikut.
15
Sebagai contoh terdapat citra berwarna berukuran 3x3 dengan nilai piksel
sebagai berikut :
R = 90 R = 120 R = 200
G = 120 G = 200 G = 90
B = 200 B = 90 B = 120
R = 120 R = 90 R = 120
G = 200 G = 120 G = 200
B = 90 B = 200 B = 90
R = 200 R = 200 R = 90
G = 90 G = 120 G = 120
B = 120 B = 80 B = 200
Gambar 3.3. Matrik Citra RGB 3x3
Pada piksel (1,1) nilai R = 90, G = 120 dan B = 200 sehingga untuk
mencari nilai grayscale nya adalah :
Y = (0.299 x 90) + (0.587 x 120) + (0.114 x 200)
Y = 26,91 + 70,44 + 22,8
Y = 120,15
Nilai grayscale pada piksel (1,1) adalah 120,15. Dan jika diterapkan pada
semua piksel akan menghasilkan citra grayscale sebagai berikut :
120,15 163,54 126,31
163,54 120,15 163,54
126,31 126,31 120,15
Gambar 3.4. Matrik Citra Grayscale 3x3
Setelah didapatkan citra grayscale langkah berikutnya yaitu dengan
melakukan binerisasi pada citra dengan menggunakan metode thresholding.
Pada penelitian ini metode thresholding yang digunakan yaitu thresholding
tunggal, dimana nilai thresholding ditentukan terlebih dahulu. Jika nilai
intensitas piksel melewati nilai thresholding, nilai intensitas tersebut akan
diubah menjadi 255 (atau 1 pada skala biner) dan jika tidak melewati nilai
thresholding akan diubah menjadi 0. Sebagai contoh, pada gambar 3.4 Matrik
Grayscale akan diubah menjadi Matrik biner. Untuk nilai thresholdnya
ditentukan dari nilai tengah pada rentang nilai intensitas citra grayscale yaitu
127. Nilai grayscale pada piksel (1,1) yaitu 120,15, karena nilai grayscale
piksel 1,1 tidak melewati nilai thresholding maka nilai intensitas pikselnya
akan diubah menjadi 0. Sedangkan pada piksel (2,1) memiliki nilai piksel
163,54, karena nilai nya melewati nilai thresholding maka nilai intensitas
16
pada piksel (2,1) akan diubah menjadi 255. Sehingga, hasil dari matrik
grayscale yang telah diubah menjadi biner yaitu sebagai berikut :
0 1 0
1 0 1
0 0 0
Gambar 3.5. Matrik Biner 3x3
Pada OpenCV, terdapat fungsi COLOR_BGR2GRAY untuk mengubah
citra RGB menjadi grayscale dan fungsi THRESH_BINARY untuk
mengubah citra grayscale menjadi citra biner.
3.2.3 Implementasi Metode Histogram Proyeksi
Pada tahap ini gambar yang telah dijadikan citra biner kemudian akan
dilakukan segmentasi untuk mencari region yang merupakan objek dari citra
dengan menggunakan metode histogram proyeksi. Pada penelitian ini
digunakan metode histogram proyeksi horizontal untuk mendapatkan baris
dari tulisan tangan operasi bilangan matematika. Jumlah piksel yang putih
(nilai intensitas bukan 0) pada setiap baris akan dihitung kemudian dikurangi
oleh jumlah keseluruhan area baris untuk mendapatkan histogram dari citra
hitam yang merupakan region dari objek teks. Untuk menentukan titik awal
dari region objek, dilakukan deteksi pada histogram yang telah dibuat. Titik
piksel awal dimulai dari baris yang pertama kali memiliki nilai histogram
yang bukan 0. Region objek pada citra yaitu sepanjang nilai histogram tidak
bernilai dan titik piksel akhir ditentukan dari nilai histogram yang sudah
kembali bernilai 0. Adapun langkah-langkah untuk melakukan histogram
proyeksi horizontal adalah sebagai berikut :
1. Hitung jumlah piksel putih pada tiap baris pada matrik citra biner
2. Hitung jumlah piksel hitam pada tiap baris pada matrik citra biner dengan
cara rumus berikut ini :
𝑇𝑜𝑡𝑎𝑙 𝑃𝑖𝑘𝑠𝑒𝑙 𝐻𝑖𝑡𝑎𝑚 = 𝑇𝑜𝑡𝑎𝑙 𝑃𝑖𝑘𝑠𝑒𝑙 𝐵𝑎𝑟𝑖𝑠 − 𝑇𝑜𝑡𝑎𝑙 𝑃𝑖𝑘𝑠𝑒𝑙 𝑃𝑢𝑡𝑖ℎ (5)
3. Simpan hasil hitung piksel hitam dari masing-masing baris dalam sebuah
Arraylist
4. Untuk menentukan titik awal dari segmentasi baris yaitu dengan
memeriksa nilai-nilai pada array yang telah dibuat untuk mencari nilai
yang mengandung piksel berwarna hitam. (nilai histogram yang bukan 0)
17
5. Jika nilai yang mengandung piksel berwarna hitam didapatkan, kemudian
mencari titik akhir dari piksel yang berwarna hitam. Titik akhir citra yaitu
jika nilai pada histogram adalah 0.
6. Segmentasi bagian piksel yang mengandung piksel berwarna hitam.
Contoh :
18
Gambar 3.7. Citra Teks Tulisan
Setelah gambar diinputkan ke dalam sebuah objek file, selanjutnya
membuat objek tesseract dan mengatur lokasi dataset pada folder tessdata.
Pada tahap ini, proses ekstraksi teks dapat dilakukan dengan menggunakan
fungsi doOCR. Hasil output dari citra teks tulisan dapat dilihat pada gambar
berikut ini :
19
(a) Citra Input
20
Contoh :
Hasil OCR adalah 14 + 71
Hasil output dari perhitungan diatas adalah 85
3.2.7 Kesimpulan
Tahap terakhir yaitu penarikan kesimpulan dari penelitian yang telah
dilakukan uji coba. penarikan kesimpulan berdasarkan hasil uji coba berupa
akurasi keberhasilan ekstraksi teks dan perhitungan aritmatika. kesimpulan
penelitian ini berguna bagi peneliti lain untuk mengembangkan aplikasi yang
telah dibuat menjadi lebih baik lagi dan mendapatkan hasil akurasi yang lebih
optimal dengan metode-metode lain yang dapat digunakan.
21
BAB IV
HASIL DAN PEMBAHASAN
2 pengurangan1.png Operasi
bilangan
pengurangan
3 perkalian1.png Operasi
bilangan
pengurangan
4 pembagian1.png Operasi
bilangan
pembagian
22
4.2 Hasil Analisis
Pada bagian ini ditampilkan hasil uji coba alir sistem yang telah dilakukan
mulai dari tahap pre-processing, segmentasi citra dengan menggunakan proyeksi
histogram, implementasi OCR, dan perhitungan aritmatika hingga tahap uji coba.
23
Setelah citra grayscale didapatkan, langkah selanjutnya yaitu dengan
mengubah citra grayscale menjadi citra biner yang hanya mempunyai nilai
intensitas 0 dan 1. Cara mengubah citra grayscale menjadi citra biner dapat
dilakukan dengan menggunakan metode thresholding. Adapun proses
thresholding dapat dilihat pada gambar 4.3.
24
output dari ekstraksi teks citra tulisan tangan operasi bilangan matematika dapat
dilihat pada gambar 4.5.
25
Diketahui : Hasil ekstraksi teks yaitu -8-3
Variabel angka pertama : -8
Variabel angka kedua : 3
Operator matematika : -
Sehingga perhitungan aritmatika nya adalah :
Hasil Hitung = Variabel angka pertama – Variabel angka kedua
= -8 - 3
= -11
26
4 penambahan4.png 30+64 Cocok
27
14 perkalian4.png 29*44 Tidak
Cocok
Dari tabel hasil ekstraksi teks diatas, terdapat beberapa hasil ekstraksi teks
yang tidak cocok dengan citra tulisan tangan. Hal itu disebabkan karena Tesseract
OCR mengklasifikasikan karakter tersebut menjadi karakter lain yang tidak sesuai
dengan harapan seperti angka 2 yang terklasifikasi menjadi angka 9 pada gambar
perkalian4.png dan juga dapat terklasifikasi menjadi angka 1 pada gambar
perkalian5.png. Penyebab lainnya yaitu terdapat karakter yang tidak terdeteksi
seperti yang ditunjukkan pada gambar pembagian4.png, Dimana Tesseract OCR
tidak mampu mengenali karakter : (titik dua) yang merupakan simbol pembagian
akan tetapi dapat membaca simbol pembagian yang lain nya yaitu /.
28
Untuk mengetahui akurasi dari ekstraksi teks dapat dihitung dengan rumus
sebagai berikut :
Jumlah Hasil Ekstraksi Teks Cocok
𝐴𝑘𝑢𝑟𝑎𝑠𝑖 = x 100%
Jumlah Total Gambar
17
= x 100%
20
Akurasi = 85%
Setelah pengujian ekstraksi teks terhadap citra tulisan tangan selesai
dilakukan, pengujian berikutnya yaitu untuk mengetahui hasil perhitungan
aritmatika dari teks angka dan huruf dari hasil ekstraksi teks. Indikator penilaian
dari uji coba perhitungan aritmatika yaitu hasil perhitungan sesuai dengan tulisan
tangan yang dibuat. Adapun hasil uji coba perhitungan aritmatika dari hasil
ekstraksi teks yang dilakukan dapat dilihat pada Tabel 4.3.
Tabel 4.3. Hasil Uji Coba Perhitungan Aritmatika
No Citra Hasil Hasil Hitung Keterangan
Ekstraksi
1 3+5 8 Benar
2 -5+7 2 Benar
3 10+-2 8 Benar
4 30+64 94 Benar
29
5 -80+-55 -135 Benar
6 4-6 -2 Benar
8 92—6 98 Benar
11 8*2 16 Benar
30
15 -10*-20 200 Salah
16 9/1 9 Benar
17 -6/3 -2 Benar
18 12/-4 -3 Benar
19 70-2 68 Salah
20 -84/-12 7 Benar
Dari tabel hasil perhitungan diatas, dari uji coba yang dilakukan terhadap 20
dataset citra tulisan tangan operasi bilangan matematika diperoleh total gambar
yang berhasil dihitung dan benar sebanyak 17 citra, sedangkan 3 citra yang
lainnya menghasilkan hasil perhitungan yang salah. Hal itu disebabkan oleh hasil
ekstraksi teks yang tidak sesuai sehingga mempengaruhi hasil dari perhitungan.
Untuk mengetahui akurasi dari uji coba perhitungan aritmatika dapat dihitung
dengan rumus sebagai berikut :
Jumlah Gambar Berhasil Dihitung & 𝐵𝑒𝑛𝑎𝑟
𝐴𝑘𝑢𝑟𝑎𝑠𝑖 = x 100%
Jumlah Total Gambar
17
= x 100%
20
Akurasi = 85%
31
BAB V
PENUTUP
5.1 Kesimpulan
Berdasarkan penelitian yang telah dilakukan, dapat disimpulkan bahwa :
1. Aplikasi kalkulator tulisan tangan sederhana mampu melakukan
perhitungan aritmatika dari citra tulisan tangan operasi bilangan
matematika.
2. Tesseract OCR mampu melakukan ekstraksi teks pada citra tulisan tangan.
Untuk menghasilkan output berupa karakter angka dan operator
matematika dapat dilakukan dengan cara mendaftarkan karakter angka dan
operator pada daftar whitelist.
3. Dari uji coba terhadap 20 citra tulisan tangan operasi bilangan matematika
diperoleh hasil akurasi ekstraksi teks sebesar 85% dan akurasi citra tulisan
tangan yang dapat dihitung dan benar sebesar 85%
5.2 Saran
Berdasarkan kesimpulan diatas, adapun saran dan masukan yang dapat
disampaikan adalah sebagai berikut :
1. Tulisan tangan yang dibuat dapat mempengaruhi keakuratan hasil
ekstraksi teks. Dengan tulisan tangan yang rapi dan jelas, akurasi ekstraksi
teks yang didapat akan semakin tinggi.
2. Hasil ekstraksi teks sangat berpengaruh pada keberhasilan perhitungan
aritmatika sehingga disarankan menggunakan OCR engine yang lebih
bagus untuk meningkatkan akurasi ekstraksi teks tulisan tangan.
3. Aplikasi dapat dikembangkan ke platform lain seperti Android sehingga
input citra tulisan tangan operasi bilangan matematika dapat melalui
kamera smartphone.
32
DAFTAR PUSTAKA
33
Metode Segmentasi Dan Korelasi. Transient,Sistem, 1–5.
https://doi.org/2302-9927
Chakraborty, P., & Mallik, A. (2013). An Open Source Tesseract based Tool for
Extracting Text from Images with Application in Braille Translation for the
Visually Impaired. International Journal of Computer Applications, 68(16),
26–32. https://doi.org/10.5120/11664-7254.
Hidayatullah, Priyanto. 2017. Pengolahan Citra Digital Teori dan Aplikasi
Nyata.Bandung: Penerbit Informatika.
34
LAMPIRAN-LAMPIRAN
penambahan1.png
penambahan2.png
penambahan3.png
penambahan4.png
A-1
penambahan5.png
pengurangan1.png
pengurangan2.png
pengurangan3.png
A-2
pengurangan4.png
pengurangan5.png
perkalian1.png
perkalian2.png
A-3
perkalian3.png
perkalian4.png
perkalian5.png
pembagian1.png
A-4
pembagian2.png
pembagian3.png
pembagian4.png
pembagian5.png
A-5
Lampiran 2. Cek Plagiasi Turnitin
B-1
Lampiran 3. Riwayat Hidup Penulis
Riwayat Hidup
C-1