Anda di halaman 1dari 4

Prosiding Seminar Nasional MIPA 2016

“Peran Penelitian Ilmu Dasar dalam Menunjang Pembangunan Berkelanjutan”


Jatinangor, 27-28 Oktober 2016
ISBN 978-602-72216-1-1

Segmentasi Baris Berbasis Seam Carving pada Manuskrip


Sunda Kuno
Erick Paulus*, Mira Suryani, Setiawan Hadi, Intan Nurma Yulita
Departemen Ilmu Komputer, Universitas Padjadjaran, Bandung
*E-mail: erick.paulus@unpad.ac.id

Abstrak

Manuskrip Sunda kuno merupakan warisan budaya yang berharga dan memuat informasi
kehidupan sosial seperti kearifan, adat istiadat dan nilai-nilai keagamaan. Proses digitalisasi
terhadap manuskrip Sunda kuno telah dilakukan oleh pemerintah, institusi maupun masyarakat
pencinta budaya sebagai bentuk konservasi dan pelestarian. Namun, citra hasil digitasi masih
perlu dilakukan segementasi baris sebagai tahapan awal dalam ekstrasi aksara atau kata melalui
OCR. Makalah ini memaparkan hasil percobaan segmentasi baris menggunakan metode Seam
Carving tanpa melalui proses binerisasi. Metode ini melakukan komputasi Medial Seam
menggunakan Projection Profile Matching dan komputasi Separating Seam menggunakan
modifikasi prosedur Seam carving. Pengujian dilakukan terhadap 10 sample data yang terdiri
dari citra warna dan citra biner ground truth dari manuskrip Sunda kuno. Penelitian ini
menghasilkan segmentasi baris berserta dengan jumlah baris yang terdapat pada manuskrip
Sunda kuno tersebut. Kinerja kuantitatif yang diperoleh dari eksperimen menunjukan berhasil
100% untuk citra dengan sudut kemiringan baris antara 0 sampai 5 derajat. Sedangkan citra
dengan sudut kemiringan baris lebih besar dari 5 derajat masih memerlukan pengembangan
metode untuk mengoptimalkan kinerja metode Seam Carving.

Kata Kunci: Segmentasi baris, Seam Carving, Manuskrip Sunda kuno

1. Pendahuluan lainnya (overlapping). Gambar 1 menjelaskan


Segmentasi merupakan tahapan penting dalam visualisasi penggunaan profil proyeksi dalam
proses transliterasi otomatis pada citra manuskrip mensegmentasi baris citra manuskrip Sunda
(Widiarti, 2013). Salah satu bentuk segmentasi Kuno.
pada kajian analisis citra dokumen diantaranya Berbagai upaya dilakukan untuk mengatasi
adalah segmentasi baris. Septiarini melaporkan permasalahan segmentasi citra dokumen bertipe
bahwa metode profil proyeksi memiliki keakuratan tulisan tangan. Pada tahun 2009, Nicolaou
yang tinggi untuk citra hasil cetak komputer mempertegas area baris teks dengan cara membuat
(Septiarini, 2012). Namun, segmentasi baris pada citra menjadi kabur (blured image) dan
citra manuskrip kuno tidaklah semudah proses mensegmentasi citra sepanjang jalur putih pada
segmentasi pada dokumen cetak komputer citra kabur. Dilanjutkan dengan connected
berbasis huruf latin (Das, dkk, 2010). Hal ini component pada citra asli berdasarkan segmen
menjadi tantangan tersendiri bagi analisis citra baris yang sudah diperoleh (Nicolaou & Gatos,
dokumen yag bertipe tulisan tangan seperti 2009). Penelitian lainnya memaparkan penggunaan
manuskrip Sunda kuno. metode Local Projection Profile (LPP) berbasis
orientasi lokal yang cocok untuk citra dokumen
degradasi (Bar-Yosef & Hagbi, 2009). Modifikasi
metode profil proyeksi dengan metode connected
component dan hubungan spatial vertikal
digunakan untuk mengatasi permasalahan baris
yang tumpang tindih (Das, dkk, 2010). Tingkat
keakurat segmentasi baris dari metode modifikasi
tersebut dapat mencapai 100% untuk citra cetak
Telugu. Penelitian terkini terkait ekstrasi baris
pada citra manuskrip sejarah dilaporkan
menggunakan prosedur Seam Carving. Adapun
rata-rata tingkat keakuratan segmentasi baris pada
Gambar 1. Segmentasi baris manuskrip Sunda kuno
menggunakan profil proyeksi citra keabuan dan warna dapat mencapai 99.5%
dan mampu mensegmentasi baris tanpa ada
Beberapa tantangan tersebut dapat berupa pemotongan komponen baris (Arvanitopoulos &
kemiringan antar baris yang tidak seragam dan Sabine, 2014). Oleh karena itu, peneliti melakukan
adanya aksara yang terukir masuk area baris eksperimen yang bertujuan untuk mensegmentasi

47
Prosiding Seminar Nasional MIPA 2016
“Peran Penelitian Ilmu Dasar dalam Menunjang Pembangunan Berkelanjutan”
Jatinangor, 27-28 Oktober 2016
ISBN 978-602-72216-1-1

baris manuskrip Sunda kuno menggunakan 2.2 Proses Binerisasi


prosedur Seam Carving dengan harapan mampu Proses binerisasi digunakan untuk merubah
menjawab tantangan yang melekat pada citra citra keabuan menjadi citra biner. Citra biner
dokumen bersejarah. hanya memiliki dua nilai, yaitu nilai 0 (putih)
Makalah ini disusun sebagai berikut : bagian II untuk merepresntasikan area non teks atau 1
memaparkan beberapa landasan teori metode yang (hitam) untuk merepresntasikan area teks (Kaur &
mendukung penelitian. Bagian III menjelaskan Mahajan, 2014). Ada banyak penelitian terkait
cara kerja metode penelitian berserta dengan hasil proses binerisasi. Namun pada penelitian ini,
dan pembahasan. Terakhir, simpulan dibahas pada penulis memperoleh citra biner dari aplikasi
bagaian IV. Pixalaber (Saund, Lin, & Sarkar, 2009). Walaupun
memerlukan waktu pengerjaan yang cukup lama,
2. Metode aplikasi Pixlabeler dan Alethea ini merupakan
Bagian ini menjelaskan beberapa dasar teori salah satu perangkat lunak yang direkomendasikan
yang dipakai dalam pengembangan dan dalam pembuatan groundtruth. Karena proses
implementasi metode segmentasi. pembuatan groundtruth masih memerlukan
2.1 Pemrosesan Citra dan Analisis Citra verifikasi secara manual oleh para filolog (Windu
Secara harfiah, gambar pada bidang dua et al., 2015).
dimensi disebut sebagai citra (Munir, 2004).
2.3 Proses Segmentasi baris
Berdasarkan konteks matematis, citra adalah
Proses segmentasi baris disini menggunakan
fungsi kontinu dari intensitas cahaya pada bidang
pendekatan Seam Carving (Arvanitopoulos &
dua dimensi. Awalnya objek menerima terang dari
Sabine, 2014). Prosedur segmentasi baris ini
sumber cahaya, kemudian objek memantulkan
terdiri dari dua tahapan, yaitu perhitungan titik
kembali sebagian dari berkas cahaya tersebut.
tengah baris teks (Medial Seam) menggunakan
Lalu, alat-alat optik seperti mata pada manusia,
pendekatan profil proyeksi (Liwicki, Inderm,
kamera, dan pemindai (scanner), menangkap
Bunke, & Bern, 2007) dan perhitungan pemisahan
pantulan cahaya tersebut. Jadi, bayangan objek
baris menggunakan prosedur Seam Carving yang
yang direkam oleh alat optik, dapat disebut dengan
dimodifikasia (Avidan & Shamir, 2007). Avidan
citra.
menyatakan bahwa prosedur Seam Carving
Berdasarkan kajian analisa dokumen, ada dua
awalnya digunakan untuk mengubah ukuran citra
kelompok tahapan yaitu pemrosesan citra dan
dengan mempertimbangkan isi yang terkandung
analisis citra. Kedua tahapan tersebut
pada citra.
membutuhkan citra sebagai data input. Pemrosesan
citra menggunakan suatu operasi seperti 2.4 Profil Proyeksi
pemotongan, rotasi, skalalisasi, atau peningkatan Metode profil proyeksi banyak digunakan
kualitas citra lainnya, untuk mengubah citra input untuk segmentasi baris untuk dokumen cetak
menjadi citra output. Sedangkan analisis dokumen (printed document) dimana tulisan antar baris
tidak menghasilkan citra output, tetapi terpisah dengan jelas. Namun, metode ini juga
mengekstrasi informasi /semantik dari citra input. dapat diadaptasi untuk dokumen tulisan tangan
Adapun tahapan metode penelitian ini diawali (Likforman-Sulem, Zahour, & Taconet, 2006).
dengan akusisi data, pra-pemrosesan, binerisasi Metode profil proyeksi terdiri dari dua bagian,
dan segmentasi. Pra-pemrosesan bertujuan untuk yaitu profil proyeksi horizontal dan profil proyeksi
menstandarisasi citra input seperti tipe format file, vertikal. Profil proyeksi horizontal biasa
kemiringan area teks dan pemotongan area latar digunakan untuk segmentasi baris dan profil
belakang yang tidak diperlukan. Gambar 2 proyeksi vertikal dapat digunakan untuk
menjelaskan tahapan penelitian pemrosesan citra segmentasi kata atau aksara.
dan analisis citra. Pada penelitian ini, Profil Proyeksi Horizontal
(PPH) digunakan sebagai representasi suatu
histogram dari penjumlahan piksel hitam citra
biner yang diakumulasikan sepanjang baris pararel
pada suatu dokumen. Adapun fungsi PPH secara
matematika dapat dilihat pada persamaan 3. Piksel
citra dirumuskan dengan fungsi f(x,y) dimana x
dan y secara berturut-turut mewakili baris dan
kolom. Parameter n menjelaskan banyaknya kolom
pada suatu citra

(1)
Gambar 2. Tahapan pemrosesan citra dan analisis citra

48
Prosiding Seminar Nasional MIPA 2016
“Peran Penelitian Ilmu Dasar dalam Menunjang Pembangunan Berkelanjutan”
Jatinangor, 27-28 Oktober 2016
ISBN 978-602-72216-1-1

3. Hasil dan Pembahasan 3. Hitung lintasan optimal dari energi kumulatif


Bagian ini memaparkan dua tahapan M. High-energy regions mewakili komponen
segmentasi baris beserta dengan hasil teks. Low-energy regions mewakili latar
pembahasannya. belakang lontar

3.1 Perhitungan Titik Tengah Baris Teks Citra sample hasil perhitungan pemisah antar
Perhitugan sepanjang titik tengah baris baris dengan menggunakan prosedur Seam
dilakukan berdasarkan urutan berikut: Carving dapat dilihat pada Gambar 4. Pada citra
1. Diketahui citra biner terlihat garis pemisah tidak memotong
komponen baris. Sedangkan citra warna masih
dengan , n : baris dan m : kolom mengalami pemotonga pada bagian aksara yang
2. Membagi halaman secara vertikal menjadi r tumpang tindih.
potongan, dengan lebar

3. Deteksi tepi (Sobel Operator)


4. Hitung smoothed horizontal projection profile
untuk setiap potongan

Gambar 4. Contoh citra dengan garus pemisah baris

Berdasarkan eksperimen, prosedur Seam


Carving dapat melakukan segmentasi baris
dengan g adl cubic spline smoothing filter terhadap citra warna dan citra biner dengan tingkat
5. Temukan dan sambungkan lokal maksimum keberhasilan mendekati 100%.
terdekat dari setiap potongan
Tabel 1. Hasil eksperimen
Citra hasil segmentasi baris tahap pertama
dapat dilihat pada gambar 3. Hasil segmentasi Citra Jumlah Jumlah Persentase
Lontar target baris keberhasilan
baris tahap pertama pada citra biner dan citra
baris terdeteksi (%)
warna dapat mengidentifikasi titik tengah baris
DSC_029 2 2 100
dengan baik dan mengikuti orientasi teks 6_2a.tif
DSC_029 2 2 100
6_2a_GT
1.tif
DSC_029 2 2 100
8_8a.tif
DSC_029 2 2 100
8_8a_GT
1.tif
Gambar 3. Contoh citra dengan garis titik tengah baris
DSC_029 2 2 100
3.2 Perhitungan Pemisah antar Baris Teks 9_8b.tif
Perhitungan pemisah baris menggunakan DSC_029 2 2 100
prosedur Seam Carving yang dimodifikasia 9_8b_GT
1.tif
diuraikan sebagai berikut:
3306.tif 4 4 100
1. Hitung Energy Function :
3306_GT 4 4 100
1.tif
3309.tif 4 4 100
3309_GT 4 4 100
1.tif
dengan Iσ adalah citra asli keabuan yang
dihaluskan oleh Gaussian filter untuk standard
deviation σ 3.3 Ujicoba Metode terhadap Citra Terotasi

2. Hitung kumulatif nilai minimum energy M Eksperimen selanjutnya akan mengukur


kemampuan metode Seam carving dalam
mensegmentasi citra terrotasi. Berdasarkan ujicoba
5, 10, 20, 30 derajat CW (searah jarum jam) dan
CCW(tidak searah jarum jam) menunjukan bahwa
batas toleransi metode Seam Carving dalam

49
Prosiding Seminar Nasional MIPA 2016
“Peran Penelitian Ilmu Dasar dalam Menunjang Pembangunan Berkelanjutan”
Jatinangor, 27-28 Oktober 2016
ISBN 978-602-72216-1-1

segmentasi baris adalah sekitar 5 derajat. Jika Das, M. S., Reddy, C., Govardhan, A., &
kemiringanya lebih dari 5 derajat, sistem tidak Saikrishna, G. (2010). SEGMENTATION
dapat mensegmentasi baris dengan tepat. Contoh OF OVERLAPPING TEXT LINES ,
sampae visualisasi citra tersegmen dapat dilihat CHARACTERS IN PRINTED TELUGU
pada Gambar 5. TEXT DOCUMENT IMAGES. International
Journal of Engineering Science and
Technology, 2(11), 6606–6610.
Kaur, J., & Mahajan, R. (2014). A Review of
Degraded Document Image Binarization
Techniques. International Journal of
Advanced Research in Computer and
Communication Engineering, 3(5), 6581–
6586.
Likforman-Sulem, L., Zahour, A., & Taconet, B.
(2006). Text line segmentation of historical
documents: a survey. International Journal of
Document Analysis and Recognition
(IJDAR), 9(2-4), 123–138.
http://doi.org/10.1007/s10032-006-0023-z
Liwicki, M., Inderm, E., Bunke, H., & Bern, C.-.
(2007). On-Line Handwritten Text Line
Gambar 5. Citra hasil segmentasi baris berdasarkan sudut rotasi
(atas ke bawah): 50CW, 50CCW, 300CCW Detection Using Dynamic Programming. In
International Conference on Document
4. Kesimpulan Analysis and Recognition (pp. 447–451).
Pengujian Segmentasi baris dengan Munir, R. (2004). Pengolahan Citra Digital
menggunakan pendekatan Seam Carving telah dengan Pendekatan Algoritmik. Bandung:
dilakukan dan berhasil untuk citra lontar biner dan Informatika.
warna. Prosedur segmentasi baris ini berhasil Nicolaou, A., & Gatos, B. (2009). Handwritten
untuk komponen baris yang relatif horizontal. Text Line Segmentation by Shredding Text
Prosedur segmentasi baris ini masih perlu into its Lines. Proceedings of the 2009 10th
diperbaiki untuk komponen baris yang relatif International Conference on Document
miring, yaitu dengan menambahkan deteksi sudut Analysis and Recognition, 626–630.
atau transformasi Hough. http://doi.org/10.1109/ICDAR.2009.243
Saund, E., Lin, J., & Sarkar, P. (2009). User
Ucapan Terima Kasih interface for pixel- level labeling of elements
Penulis mengucapkan terima kasih kepada in document images. In Proceedings of
Prodi Sastra Sunda Unpad, Situs Kabuyutan International Conference on Document
Ciburuy, dan Perpustakaan Nasional Republik Analysis and Recognition.
Indonesia yang sudah bersedia menjadi Septiarini, A. (2012). Segmentasi Karakter
narasumber serta menyediakan data manuskrip Menggunakan Profil Proyeksi. Jurnal
Sunda kuno yang dipakai pada penelitian ini. Informatika Mulawarman, 7(2), 66–69.
Penulis juga mengapresiasi atas dukungan dana Widiarti, A. R. (2013). Line Segmentation of
dari Penelitian Kerjasama Luar Negeri Universitas Javanese Image of Manuscripts in Javanese
Padjadjaran Indonesia dan La Rochele University, Scripts. International Journal of Engineering
Perancis. Innovation & Research Volume 2, Issue 3,
ISSN: 2277 – 5668 Line, 2(3), 239–244.
Daftar Pustaka Windu, M., Kesiman, A., Prum, S., Burie, J.,
Arvanitopoulos, N., & Sabine, S. (2014). Seam Ogier, J., Rochelle, L., & Crépeau, A. M.
Carving for Text Line Extraction on Color (2015). An Initial Study On The Construction
and Grayscale Historical Manuscripts. In Of Ground Truth Binarized Images Of
14th International Conference on Frontiers Ancient Palm Leaf Manuscripts. In
in Handwriting Recognition (ICFHR). Proceedings of the 2015 13th International
Crete,Greece. Conference on Document Analysis and
Avidan, S., & Shamir, A. (2007). Seam Carving Recognition (ICDAR) (pp. 656–660).
for Content-Aware Image Resizing. ACM http://doi.org/10.1109/ICDAR.2015.7333843
Transactions on Graphics, 26(3), 10.
Bar-Yosef, I., & Hagbi, N. (2009). Line
segmentation for degraded handwritten
historical documents. Document Analysis and
…, 1161–1165.
http://doi.org/10.1109/ICDAR.2009.191

50

Anda mungkin juga menyukai