Anda di halaman 1dari 14

DETEKSI TEXT PADA SERTIFIKAT

MENGGUNAKAN METODE MAXIMALLY STABLE


EXTREMAL REGIONS DAN RULE BASED

Disusun untuk Sidang Proposal Skripsi


Semester Ganjil Tahun Ajaran 2019/2020

OLEH:
Muhammad Iqbal Shorfana
10116465

Program Studi Teknik Informatika


Fakultas Teknik Dan Ilmu Komputer
Universitas Komputer Indonesia
2020
HALAMAN PENGAJUAN PEMBIMBING

DETEKSI TEXT PADA SETIFIKAT MENGGUNAKAN


METODE MAXIMALLY STABLE EXTREMAL
REGIONS DAN RULE BASED

NIM: 10116465
Nama: Muhammad Iqbal Shorfana

Pembimbing Usulan:
Irfan Maliki, S.T., M.T.

i
DAFTAR ISI

DAFTAR ISI............................................................................................................ii

DAFTAR TABEL..................................................................................................iii

DAFTAR GAMBAR..............................................................................................iv

1. Latar Belakang Masalah...................................................................................1

2. Identifikasi Masalah..........................................................................................1

3. Maksud dan Tujuan..........................................................................................1

4. Batasan Masalah...............................................................................................1

5. Metodologi Penelitian.......................................................................................2

5.1 Metode Pengumpulan Data.......................................................................2

5.2 Metode Pembangunan Perangkat Lunak...................................................2

6. Deskripsi Umum Sistem...................................................................................3

7. Review Literatur...............................................................................................3

8. Jadwal dan Tempat Penelitian..........................................................................8

9. Sistematika Penulisan.......................................................................................8

10. Daftar Pustaka...............................................................................................9

ii
DAFTAR TABEL

Tabel 1 Review Literatur.........................................................................................9

iii
DAFTAR GAMBAR

Gambar 1 Metode Pembangunan Perangkat Lunak.................................................2

iv
1

1. Latar Belakang Masalah


Banyak sekali objek yang dijumpai mengandung unsur teks. Tidak hanya
buku, namun juga objek seperti lukisan, papan pengumuman, rambu lalu lintas,
logo, alat – alat elektronik, pakaian, dan lainya yang mengandung unsur teks.
Teks pada citra, memiliki banyak masalah seperti perbedaan jenis tulisan, warna
tulisan, background yang kompleks, dan sebagainya. Deteksi teks pada sebuah
citra merupakan hal utama sebelum melakukan pengenalan karakter kata atau
kalimat.
Secara umum terdapat 3 tahapan utama dalam analisis citra dokumen.
Pertama, mengambil citra dokumen teks dengan menggunakan scanner. Kedua,
proses pengelolaan tingkat piksel. Ketiga, tahap analisis fitur. Proses pengelolaan
tingkat piksel dibagi lagi menjadi beberapa tahap yaitu binerisasi, normalisasi
orientasi, pengurangan noise, perangkaan, dan segmentasi citra dokumen.
Sedangkan proses analisis tingkat fitur dibagi menjadi 2 tahap yaitu pengenalan
dan analisis teks serta pengenalan dan analisis grafis. Diantara tahap – tahap
tersebut, segmentasi citra dokumen adalah tahap yang paling akhir sebelum
pengenalan dan analisis citra teks maupun grafis, yang outputnya akan menjadi
input dan salah satu penentu berhasil tidaknya suatu pengenalan citra dokumen.
Proses segmentasi area teks citra dokumen adalah salah satu tahap pra proses
yang sangat penting dalam pengolahan citra dokumen[1]. Namun seringkali fitur
warna saja tidak cukup untuk dapat memisahkan antara foreground area teks
dengan background citra dokumen yang pada umumnya tidak memiliki warna
yang seragam serta terganggu penuh oleh noise[1]. Mengingat pentingnya proses
segmentasi tersebut, maka dibutuhkan metode segmentasi yang dapat melakukan
pemisahan objek dengan akurat. Ketidak akuratan proses segmentasi dapat
menyebabkan ketidak akuratan pada hasil proses selanjutnya. Secara umum,
proses segmentasi dibagi menjadi tiga yaitu segmentasi berdasar klasifikasi
(classification based segmentation), segmentasi berdasar tepi (edge based
segmentation), dan segmentasi berdasar wilayah (region based segmentation)[2].
Penelitian di bidang deteksi teks ini telah dilakukan dalam penelitian
sebelumnya, diantaranya menggunakan metode Particle Swarm Optimization dan
median filter, namun pada proses pendeteksiannya masih belum optimal.
2

Kemudian pada proses segmentasi dan pendeteksiannya ini perlu adanya metode
baru atau metode lainya untuk meningkatkan kualitas segmentasi dan pengenalan
teks supaya lebih baik lagi atau optimal. Maka dalam penelitian ini perlunya
metode segmentasi dan pengenalan teks yang lain supaya dapat mengenali citra
sertifikat yang lebih detail. Penelitian ini akan dibuat sebuah prototype dari
penerapan metode Maximally Stable Extremal Regions dan Rule Based untuk
proses segmentasinya dan pengenalannya.
Pada penelitian ini metode Maximally Stable Extremal Regions (MSER)
adalah metode untuk mendeteksi gumpalan (blob detection) dalam sebuah citra.
MSER yakni menghubungkan komponen secara stabil dari beberapa set gambar
tingkat abu -abu[3]. MSER didasarkan pada ide dalam mengambil daerah yang
hampir sama melalui berbagai nilai ambang (threshold)[4]. Kemudian teks yang
telah tersegmentasi akan masuk ke tahap pengenalan menggunakan metode Rule
Based.

2. Identifikasi Masalah
Berdasarkan latar belakang yang sudah diuraikan, terdapat identifikasi
masalah yang akan dijadikan bahan penelitian sebagai berikut :
1. Bagaimana penerapan proses segmentasi Maximally Stable Extremal
Regions pada teks di sertifikat?
2. Bagaimana hasil akurasi dari deteksi teks menggunakan rule based?

3. Maksud dan Tujuan


Maksud dari penelitian ini adalah :
1. Menerapkan proses segmentasi Maximally Stable Extremal Regions pada
teks di sertifikat.
Tujuan dari penelitian ini adalah :
1. Mengetahui proses dan hasil segmentasi menggunakan MSER pada
deteksi teks di sertifikat.
2. Mengetahui hasil akurasi dari deteksi teks Rule Based pada teks di
sertifikat.
3

4. Batasan Masalah
Adapun batasan masalah dari penelitian ini adalah sebagai berikut :
1. Proses identifikasi berupa dokumen sertifikat yang di scan.
2. Input merupakan citra sertifikat dalam format .jpg
3. Sistem identifikasi dokumen sertifikat dilakukan secara offline
4. Sistem yang digunakan berbasis desktop application.

5. Metodologi Penelitian
Metode penelitian yang digunakan pada penelitian ini adalah metode
kuantitatif. Hasil dari penelitian ini adalah berupa persentase akurasi dengan
mengakumulasikan tingkat kesesuaian antara input dengan hasil yang didapatkan.

5.1 Metode Pengumpulan Data


Adapun metode pengumpulan data yang digunakan pada penelitian ini adalah
sebagai berikut.
1. Studi Literatur
Studi Literatur dilakukan dengan membaca referensi dari jurnal, paper,
dan buku terkait dengan segmentasi area teks, deteksi teks, metode
pengolahan citra, metode Maximally Stabel Extremal Regions dan metode
Rule Based.
2. Pengumpulan Dataset
Pengumpulan dataset dilakukan dengan mengambil data sampel pada
citra sertifikat. Sampel tersebut nantinya akan digunakan sebagai data
latih pada saat proses segmentasi dengan menggunakan metode
Maximally Stabel Extremal Regions dan metode Rule Based.
5.2 Metode Pembangunan Perangkat Lunak
Metode pembangunan perangkat lunak yang digunakan pada penelitian ini
adalah model prototype. Adapun gambaran metode pembangunan perangkat lunak
dapat dilihat pada gambar 1.
4

Gambar 1 Metode Pembangunan Perangkat Lunak

1. Pengumpulan Data
Tahap ini dilakukan untuk mengumpulkan data terkait penelitian, melalui
jurnal, paper, buku online mengenai metode yang digunakan untuk
preprocessing citra, klasifikasi pola dan pengujian serta pengumpulan
sampel untuk data latih.
2. Perancangan
Tahap ini dilakukan untuk merancang prototype sesuai kebutuhan yang
telah dianalisa berdasarkan pengumpulan data seperti perancangan
database dan antar muka program.
3. Pembangunan
Tahap ini dilakukan untuk membangun prototype berdasarkan
perancangan yang telah dilakukan pada tahap sebelumnya dan
implementasi dari perancangan.
4. Evaluasi
Tahap ini dilakukan untuk mengevaluasi apakah prototype yang dibangun
sesuai kebutuhan pada tahap perancangan dengan melakukan pengujian
terhadap metode yang diterapkan sudah berjalan dengan baik serta apakah
ada fungsionalitas program tidak berjalan dengan baik.
5. Perbaikan
Tahap ini dilakukan untuk memperbaiki prototype yang tidak sesuai
seperti fungsional dan metode-metode yang digunakan dalam
preprocessing, tahap klasifikasi dan keluaran sistem.
6. Pengembangan
Tahap ini adalah tahap akhir dimana fungsionalitas dan metode yang
digunakan sudah berjalan dengan baik.
5

6. Deskripsi Umum Sistem


Sistem yang dibangun berupa prototype yang bertujuan untuk mengenali citra
tulisan atau teks pada sertifikat dengan metode Maximally Stable Extremal
Regions dan metode Rule Based. Keluaran dari sistem ini berupa hasil deteksi teks
berupa gambar output dari hasil deteksi teks dan akurasi deteksi teksnya.

7. Review Literatur
Adapun Review literatur yang menjadi referensi dan memiliki hubungan
terkait masalah penelitian dapa dilihat pada tabel 1.
Review Literatur Pertama
Judul Artikel Deteksi Teks Secara Otomatis Pada Natural
Image Berbasis Superpixel Menggunakan
Maximally Stable Extremal Regions dan Stroke
Width Transform
Penulis Yohannes
Judul Jurnal/Proceeding Jurnal teknik informatika dan sistem informasi
Tahun Penerbitan 2017
Masalah Utama yang Bagaimana cara mendeteksi teks pada natural
diangkat image dengan MSERs dan SWT.
Kontribusi Penulis Memberikan gambaran tentang bagaimana cara
menerapkan metode Maximally Stable Extremal
Regions dan Stroke Width Transfom untuk
mendeteksi teks area pada natural image.
Ikhtisar Artikel Pada jurnal dikatakan bahwa penerapan metode
Maximally Stable Extremal Regions dan Stroke
Width Transfom dengan superpixel lebih baik
dibandingkan dengan tanpa superpixel.
Hasil Penelitan, Kesimpulan a. Hasil Penelitian
dan Saran Penerapan dalam metode tersebut bahwa
metode MSER dengan superpixel mampu
mendeteksi teks pada natural image.
b. Kesimpulan
Program pendeteksi teks pada natural
image dapat mengenali teks dengan baik
dan mendeteksi tepi area teks
menggunakan canny lebih baik dibanding
dengan sobel.
c. Saran
Disarankan untuk mengkombinasi
metode MSER dan metode lain untuk
komputasi lebih cepat dan optimal.
Persamaan dan Perbedaan a. Persamaan
dengan Penelitan - Segmentasi area teks dengan metode
6

Maximally Stable Extremal Regions


dan deteksi teks.
b. Perbedaan
- Metode segmentasi atau pada
preprocessingnya yang digunakan ada
dua yaitu MSER dan SWT.
Komentar Literatur ini dapat menjelaskan bagaimana
penerapan dalam metode Maximally Stable
Extremal Regions dan Stroke Width Transform.
Review Literatur Kedua
Judul Artikel Segmentasi Area Teks Aksara Bali
pada Citra Lontar Kuno Bali
Berdasarkan Peta Nilai Lacunarity
Penulis Made Windu Antara Kesiman
Judul Jurnal/Proceeding Seminar Nasional Aplikasi Teknologi Informasi
(SNATI) 2013
Tahun Penerbitan 2013
Masalah Utama yang Bagaimana perhitungan nilai lacunarity pada
diangkat citra, pembentukan peta lacunarity, dan
bagaimana hasil uji coba deteksi dan segmentasi
area teks aksara bali.
Kontribusi Penulis Memberikan gambaran tentang paparan dari
metode perhitungan nilai lacunarity, kemudian
metode pembentukan peta lacunarity.
Ikhtisar Artikel Pada jurnal dikatakan bahwa segmentasi dengan
metode mathematical morphology dengan
operasi erotion sangat baik digunakan pada tahap
pre-processing
untuk menebalkan bagian aksara bali pada citra
digital lontar kuno bali.
Hasil Penelitan, Kesimpulan 1. Hasil
dan Saran Nilai lacunarity dapaat digunakan secara
efektif untuk mendeteksi area teks aksara
bali, dan lainnya.
2. Kesimpulan
Berdasarkan hasil yang diperoleh dapat
disimpulkan bahwa Nilai lacunarity dapat
digunakan secara efektif untuk
mendeteksi area teks aksara bali pada
citra digital lontar kuno bali. Pemetaan
nilai-nilai lacunarity dapat digunakan
untuk melakukan deteksi dan segmentasi
area teks aksara bali pada citra digital
lontar kuno bali.
3. Saran
Optimalisasi nilai-nilai parameter yang
dibutuhkan untuk seluruh tahapan
pembentukan peta nilai lacunarity, dan
7

uji coba sebaiknya ruang warna selain


RGB.
Persamaan dan Perbedaan 1. Persamaan
dengan Penelitan Segmentasi teks pada citra dokumen
2. Perbedaan
Metode pada penelitian berbeda pada
jurnal tersebut menggunakan metode
Differential Box-Counting pada Citra
Grayscale
Komentar Literatur ini menjelaskan tentang pemaparan
metode perhitungan nilai lacunarity pada citra
pembentuka peta, dan hasil uji coba dan
segmentasi area.
Review Literatur Ketiga
Judul Artikel Kombinasi MSER Dan SURF Dalam
Mendeteksi Teks Pada Gambar Natural
Penulis Kgs Achmad Siddik dan Yohannes
Judul Jurnal/Proceeding ANNUAL RESEARCH SEMINAR 2016
Tahun Penerbitan 2016
Masalah Utama yang Masalah utama yang diangkat dalam
diangkat penelitiannya yaitu mendeteksi teks secara
otomatis menggunakan MSER dan SURF
Kontribusi Penulis Memberikan gambaran tentang metode MSER
dan SURF untuk mendeteksi teks pada gambar
natural
Ikhtisar Artikel Memberikan alur metode yang diusulkan oleh
penulis dan menggambarkan kombinasi dari
MSER dan SURF
Hasil Penelitan, Kesimpulan 1. Hasil
dan Saran Peneltian pada jurnal ini mengusulkan
deteksi teks secara otomatis
menggunakan MSER dan SURF.
2. Kesimpulan
Metode yang diusulkan terdapat dua
bagian yaitu alur metode dan kombinasi
antara metode MSER dan SURF.
3. Saran
Dalam penjelasan pada jurnal masih
belum lengkap seperti hasil dan
pembahasan kemudian dengan
kesimpulan.
Persamaan dan Perbedaan 1. Persamaan
dengan Penelitan Menggunakan metode yang sama
2. Perbedaan
Pada penelitiannya penulis
mengkombinasikan antara metode MSER
dan SURF
Komentar Literatur ini memberikan alur metode yang
8

diusulkan oleh penulis


Tabel 1 Review Literatur

8. Jadwal dan Tempat Penelitian

9. Sistematika Penulisan
Sistematika penulisan yang digunakan pada penelitian ini adalah sebagai
berikut.
BAB I PENDAHULUAN
Pada bab ini menjelaskan mengenai pembahasan masalah umum yang
berhubungan dengan penelitian ini, yang meliputi latar belakang, identifikasi
masalah, maksud dan tujuan, batasan masalah, metodologi penelitian, dan
sistematika penulisan.
BAB II TINJAUAN PUSTAKA
Pada bab ini menjelaskan mengenai teori-teori dasar yang berhubungan
dengan penelitian ini seperti Pengolahan Citra, Preprocessing
Citra, Segmentasi, metode Maximally Stable Extremal Regions, metode Rule
Based dan metode pengujian.
BAB III ANALISA PERANCANGAN SISTEM
Pada bab ini berisi tentang analisa dan perancangan dari sistem yang akan
dibangun, yang meliputi analisis sistem, analisis masukan, analisis preprocessing,
analisis klasifikasi, analisis keluaran, analisis kebutuhan non fungsional, dan
perancangan antarmuka.
BAB IV IMPLEMENTASI DAN PENGUJIAN
Pada bab ini memaparkan tentang hasil implementasi dari analisa dan
perancangan yang telah dilakukan sebelumnya serta hasil pengujian dari sistem
yang dibangun. Pengujian sistem dilakukan dengan menggunakan pengujian black
box.
BAB V KESIMPULAN DAN SARAN
Pada bab ini menjelaskan tentang kesimpulan dari hasil penelitian yang
telah dilakukan dan saran untuk penelitian lebih lanjut.
9

10. Daftar Pustaka


[1] M. W. A. Kesiman, “Segmentasi Area Teks Aksara Bali pada Citra Lontar
Kuno Bali,” Semin. Nas. Apl. Teknol. Inf. 2013, no. 2005, pp. 7–12, 2013.
[2] V. D. A. N. Lankton and P. Soepomo, “ANALISIS PERBANDINGAN
TEKNIK SEGMENTASI CITRA DIGITAL MENGGUNAKAN
METODE LEVEL-SET CHAN &,” vol. 1, pp. 232–240, 2013.
[3] A. Del Bimbo, “Region detectors Requirements for region detection,”
MSER Reg. dettector, p. 10, 2011.
[4] Y. Yohannes, “Deteksi Teks Secara Otomatis Pada Natural Image Berbasis
Superpixel Menggunakan Maximally Stable Extremal Regions dan Stroke
Width Transform,” J. Tek. Inform. dan Sist. Inf., vol. 3, no. 2, pp. 332–343,
2017.
[5] K. A. Siddik, “Kombinasi MSER Dan SURF Dalam Mendeteksi Teks Pada
Gambar Natural,” vol. 2, no. 1, pp. 197–200, 2016.
[6] M. Donoser and H. Bischof, “Efficient Maximally Stable Extremal Region
(MSER) tracking,” Proc. IEEE Comput. Soc. Conf. Comput. Vis. Pattern
Recognit., vol. 1, no. May 2014, pp. 553–560, 2006.

Anda mungkin juga menyukai