Anda di halaman 1dari 10

See discussions, stats, and author profiles for this publication at: https://www.researchgate.

net/publication/343447321

Kinerja Algoritma Canny untuk Mendeteksi Tepi dalam Mengidentifikasi


Tulisan pada Citra Digital Meme

Article in PINTER Jurnal Pendidikan Teknik Informatika dan Komputer · June 2019
DOI: 10.21009/pinter.3.1.8

CITATION READS

1 872

3 authors, including:

Widodo Widodo Bambang Prasetya Adhi


Jakarta State University Jakarta State University
59 PUBLICATIONS 119 CITATIONS 37 PUBLICATIONS 41 CITATIONS

SEE PROFILE SEE PROFILE

All content following this page was uploaded by Widodo Widodo on 01 September 2020.

The user has requested enhancement of the downloaded file.


e-ISSN: 2597- 4475
http://doi.org/10.21009/pinter.3.1.8
VOL 3. NO.1 JUNI 2019

Kinerja Algoritma Canny untuk Mendeteksi Tepi dalam


Mengidentifikasi Tulisan pada Citra Digital Meme
Nisfal Filsa1, Widodo2, Bambang P. Adhi3

1,2,3
Pendidikan Teknik Informatika dan Komputer Fakultas Teknik
Universitas Negeri Jakarta
1
nisfalfilsa@yahoo, 2 widodo@unj.ac.id, 3bambangpadhi@unj.ac.id

ABSTRAK
Citra digital Meme merupakan sarana penyampaian informasi, teks pada Meme sebagian
besar akan bergabung dengan latar pada gambar. Untuk membedakan latar dan teks dapat
dilakukan dengan deteksi Tepi. Algoritma Canny merupakan salah satu algoritma deteksi Tepi
yang memiliki tingkat kesalahan yang minimum dan menghasilkan citra tepian yang optimal.
Salah satu penggunaan deteksi Tepi dapat diterapkan citra digital Meme untuk menentukan
wilayah teks yang terdapat pada citra Meme. Hasil algoritma Canny mendeteksi Tepi untuk
menentukan wilayah tulisan pada Meme lalu diidentifkiasi menggunakan pengenalan karakter
optis (OCR) akan dijadikan perhitungan untuk menilai kinerja algoritma deteksi Tepi Canny.
Kinerja algoritma Canny mendeteksi Tepi untuk menentukan wilayah kandidat teks
meningkatkan akurasi deteksi tulisan pada OCR (Object Character Recognition) dengan
akurasi keberhasilan secara keseluruhan sebesar 65,47% dibandingkan dengan deteksi
tulisan langsung menggunakan OCR sebesar 47,91%. Selain itu mengurangi tingkat kesalahan
deteksi tulisan pada OCR dengan akurasi kesalahan secara keseluruhan yaitu kehilangan
karakter sebesar 34,53% dan kelebihan karakter sebesar 35,98% dibandingkan deteksi tulisan
langsung menggunakan OCR dengan akurasi kehilangan karakter sebesar 52,09% dan
kelebihan karakter sebesar 52,62. Kinerja algoritma Canny mendeteksi wilayah kandidat teks
pada OCR secara keseluruhan meningkatkan akurasi kebenaran dalam mendeteksi tulisan
pada citra digital Meme dan mengurangi persentase kesalahan.

Kata Kunci: Algoritma Deteksi Tepi Canny, Pengenalan Karakter Optis, Deteksi Tulisan,
Deteksi Tepi, Citra Digital, Meme

1. PENDAHULUAN mempunyai kualitas lebih baik dari pada masukan.


Citra (image) merupakan salah satu Pada proses pengolahan citra ini dikenal salah satu
komponen multimedia yang mempunyai peranan teknik yaitu Object Analysis yang terdiri dari
sangat penting sebagai suatu bentuk informasi visual. beberapa konsep yaitu Edge Detection, Hough
Citra mempunyai karakteristik yang tidak dimiliki Transform, Corner Detection, Boundry Tracing in
oleh data teks, yaitu citra kaya dengan informasi. Images dan Quadtree Decoposition.
Pengolahan citra digital merupakan Tepi (Edge) adalah perubahan nilai
pengolahan dan analisis yang banyak melibatkan intensitas derajat keabuan yang cepat atau tiba-tiba
peresepsi visual. Citra digital dapat diperoleh secara (perubahan besar) dalam jarak yang singkat.
otomatik dari sistem penangkapan citra membentuk Sedangakan Deteksi Tepi (Edge Detection) pada
matrik yang elemen-elemenya menyatakan nilai suatu citra adalah sebuah proses yang menghasilkan
intensitas cahaya atau tingkat keabuan suatu piksel. tepi-tepi dari obyek-obyek citra tujuannya untuk
Pengolahan citra adalah salah satu aplikasi yang menandai bagian yang menjadi detail citra.
dapat mengubah gambar menjadi suatu informasi. Terdapat banyak jenis algoritma deteksi
Pengolahan citra bertujuan untuk memperbaiki Tepi, seperti Canny, Sobel, Prewitt, Robert, dan
kualitas citra agar mudah diinterpretasi oleh manusia Laplacian of Gaussian (LoG). Algoritma Canny
atau mesin (dalam hal ini komputer). Teknik-teknik merupakan salah satu algoritma deteksi Tepi
pengolahan citra mentransformasikan citra menjadi modern. Deteksi Tepi Canny ditemukan oleh Marr
citra yang lain. Jadi masukannya adalah citra dan dan Hildreth ypada tahun 1980 yang meneliti
keluaranya juga citra. Namun citra keluaran pemodelan persepsi visual manusia. Kelebihan dari

45
Avalaiable at:
http://journal.unj.ac.id/unj/index.php/pinter/article/view/16357
algortima Canny yaitu mendeteksi karakter dengan - Jika gradient pada sebuah piksel diatas
baik, melokalisasi karakter dengan baik, dan respon nilai ‘High’, piksel tersebut merupakan
yang jelas dengan satu respon untuk setiap Tepi. ‘edge pixel’
Dalam beberapa penelitian sebelumnya algoritma - Jika gradient pada sebuah piksel dibawah
Canny sudah digunakan dalam Deteksi Kanker, nilai ‘Low’, piksel tersebut bukan ‘edge
Deteksi Plat Nomor dan Automatically Detect and pixel’
Recognize Text in Natural Image. - Jika gradient pada sebuah piksel antara
Gambar Meme memiliki Tepi yang lebih nilai ‘Low’ dan ‘High’, maka piksel
rumit dibanding gambar plat nomor karena tersebut termasuk ‘edge pixel’ jika dan
background pada Meme. Algoritma Canny akan hanya jika piksel tersebut terhubung
mengubah gambar Meme menjadi Tepi untuk dengan sebuah ‘edge pixel’ secara
diimplementasikan pada program. Oleh karena itu, langsung atau melalui piksel-piksel antara
penelitian ini membahas kualitas kinerja algoritma ‘Low’ dan ‘High’
Canny dalam mendeteksi Tepi dalam
mengidentifikasi tulisan pada Meme yang 2.1.3. Definisi Deteksi Tepi
diasumsikan dapat mendeteksi dan memfilter tulisan
dengan hasil lebih baik. Deteksi Tepi (Edge Detection) adalah
operasi yang dijalankan untuk mendeteksi garis Tepi
2. Dasar Teori (edges) yang membatasi dua wilayah citra homogen
yang memiliki tingkat kecerahan yang berbeda.
2.1. Kajian Teoritis Menurut Sutoyo, operator-operator dalam
2.1.1. Definisi Algoritma deteksi tepi antara lain:[3]
Algoritma merupakan serangkaian langkah- 1. Operator Roberts
langkah yang tersusun secara sistematis yang Operator Robert adalah operator yang
berdasarkan logika dan mudah dimengerti yang berbasis gradient yang menggunakan dua buah
tujuannya untuk memecahkan masalah. kernel yang berukuran 2x2 piksel. Operator ini
Sedangkan menurut Ema Utami dan mengambil arah diagonal untuk penentuan arah
Suwanto bahwa algoritma merupakan urutan atau dalam penghitungan nilai gradient, sehingga sering
deskripsi langkah-langkah penyelesaian masalah disebut dengan operator silang. Operator Roberts
yang tersususn secara logis, ditulis dengan notasi merupakan variasi dari rumus Gradient Operator
yang mudah dimengerti sedemikian sehingga dengan arah orientasi sebesar 45 derajat dan 135
langkah-langkah tersebut dapat dilaksanakan oleh derajat pada bidang citra. Ini berarti gradient
pemroses[1]. dihitung dengan memanfaatkan titik yang berada
pada arah orientasi 450 dan 1350 yaitu :
2.1.2. Definisi Algoritma Canny + 1, + 1 − 1, + 1
Selain itu operator ini merupakan
Menurut Fajar Astuti bahwa, algoritma
penjabaran dari teknik diferensial pada arah
Canny memiliki kelebihan dapat memberikan hasil
horisontal dan diferensial pada arah vertikal dengan
deteksi Tepi yang optimal dan sekaligus juga
menambahkan proses konversi biner dengan
memberikan fleksibilitas. Algoritma deteksi Tepi
meratakan distribusi warna hitam dan warna putih.
Canny memiliki tahap-tahap sebagai berikut:[2]
Kernel filter yang digunakan dalam metode Robert
1. Penghalusan dengan Gaussian filter unutk
ini adalah:
1
mengurangi noise yang ada pada gambar
2. Cari turunan pertama arah horizontal, Sx , dan = 1 −1 dan =
vertical, Sy , dengan menggunakan operator −1
sobel, kemudian hitung besaran atau
magnitudenya. 2. Operator Prewits
3. Non-maximum Suppression, sesuai dengan Pengembangan dari gradient operator
tujuan Canny adalah mendeteksi lokasi Tepi dengan menggunakan 2 mask (horizontal dan
yang tepat, maka non-maximum suppression vertikal) ukuran 3x3. Pada operator ini kekuatan
bertujuan untuk mempertahankan puncak (dan gradient ditinjau dari sudut pandang horizontal dan
ekuivalen dengan diferensiasi tegak lurus vertikal (memperhatikan titik disekitar pada posisi
terhadap Tepi). Non-maximum suppression horizontal dan vertikal). Selain itu metode Prewitt
pada dasarnya adalah mencari titik tertinggi merupakan pengembangan metode Robert dengan
pada data besaran Tepi, ini diperoleh dengan menggunakan filter HPF yang diberi satu angka nol
menggunakan informasi arah Tepi untuk penyangga. Metode ini mengambil prinsip dari
memeriksa apakah titik tersebut berada pada fungsi laplacian yang dikenal sebagai fungsi untuk
puncak punggung bukit (ridge). membangkitkan HPF. Kernel fillter yang digunakan

−1 0 1 −1 −1 −1
dalam metode Prewitt ini adalah:

= −1 0 1 dan = 0 0 0
4. Hysteresis Thresholding

−1 0 1 1 1 1

46
Avalaiable at:
http://journal.unj.ac.id/unj/index.php/pinter/article/view/16357
pantulan cahaya. Ketika alat optik yang merekam
3. Operator Sobel pantulan cahaya itu merupakan mesin digital,
Operator ini menggunakan dua buah kernel misalnya kamera digital, maka citra yang dihasilkan
yang berukuran 3x3 piksel untuk perhitungan merupakan citra digital. Pada citra digital,
gradient sehingga perkiraan gradient berada tepat di kontinuitas intensitas cahaya dikuantisasi sesuai
tengah jendela. Satu cara untuk menghindari gradien resolusi alat perekam.
yang dihitung pada titik interpolasi dari piksel-piksel
yang terlibat adalah dengan menggunakan jendela 2.1.7. Definisi Meme
3x3 untuk perhitungan gradien, sehingga perkiraan
gradien berada tepat di tengah jendela. Operator Menurut Widya Arifianti, Meme
Sobel adalah operator yang paling banyak digunakan menampilkan image picture semsentara rage comic
sebagai pelacak Tepi karena kesederhanaan dan biasanya terdiri dari beberapa panel gambar dan
keampuhannya. Selain itu metode Sobel merupakan mengungkapkan ekspresi kemarahan. Istilah Meme
pengembangan metode Robert dengan menggunakan sendiri pertama kali diperkenalkan oleh seorang ahli
filter HPF yang diberi satu angka nol penyangga. biologi asal Britania Raya, Richard Dawkins. Akar
Metode ini mengambil prinsip dari fungsi laplacian katanya berasal dari bahasa Yunani, yakni mimesis,
dan gaussian yang dikenal sebagai fungsi untuk yang berarti tiruan.[6]
membangkitkan HPF. Kelebihan dari metode sobel Meme sebagai suatu unit informasi budaya
ini adalah kemampuan untuk mengurangi noise (berupa pemikiran, ide, gagasan, kebiasaan,
sebelum melakukan perhitungan deteksi Tepi. Kernel lagu, fesyen) yang membentuk pola-pola
kebudayaan tertentu. Meme bukanlah sekedar
−1 0 1 −1 −2 −1
filter yang digunakan dalam metode Sobel ini adalah:
komik, ini berawal dari sebuah fans page yang
= −2 0 2 dan = 0 0 0 menyebut diri mereka adalah Meme Comic .
−1 0 1 1 2 1 Walaupun Meme itu memang bisa
berbentuk apa saja namun komik pada Meme itu
biasanya disebut Rage Comic dan pada umumnya
2.1.4. Definisi Identifikasi Meme adalah sebuah image macro yaitu sebuah
Menurut Koenjatiningrat bahwa identifikasi gambar yang diberi caption yang diambil dari quote
adalah suatu bentuk pengenalan terhadap suatu ciri- tokoh terkenal dari sebuah film, untuk dijadikan
ciri fenomena sosial secara jelas dan terperinci.[4] Meme berdasarkan perasaan user yg membuatnya,
Identifikasi berarti dorongan untuk menjadi dan para pembaca akan membaca gambar tersebut
identik dengan orang lain. Identifikasi merupakan persis dengan nada tokoh asli tersebut dengan
prosess pengenalan terhadap sesuatu yang secara kalimat yang berbeda. Bukan cuma dari film, banyak
terperinci dan seidnetik mungkin dengan aslinya. faktor yg membuat sebuah gambar bisa menjadi
image macro dalam lingkup internet meme.
2.1.5. Definisi Tulisan
Menurut Lado bahwa tulisan adalah simbol 2.2. Pengolahan Citra
grafis yang diletakkan dalam kertas atau media Pengolahan citra merupakan proses
menulis lain sebagai upaya untuk mengungkapkan pengolahan dan analisis citra yang banyak
perasaan yang bisa orang lain mengerti apa yang melibatkan persepsi visual. Pengolahan citra
ingin kita sampaikan.[5] bertujuan untuk memanipulasi gambar, yang
Tulisan terdiri dari huruf, angka dan tanda- melingkup teknik-teknik untuk memperbaiki atau
tanda lainnya sesuai dengan bahasa masing-masing. mengurangi kualitas gambar, menampilkan bagian
Sejarah menca tat bahwa bahasa telah berkembang tertentu dari gambar, membuat sebuah gambar yang
secara berbeda pada tiap peradaban manusia. Awal baru dari gambar, membuat sebuah gambar yang
mula tulisan diketahui pada masa proto dengan baru dari beberapa bagian gambar yang sudah ada,
sistem ideografik dan simbol dan beberapa teknik manipulasi gambar lainnya.
menemonik. Berdasarkan sejarah tulisan dibagi Menurut Rinaldi Munir,
menjadi dua kategori yaitu zaman perunggu dan pengolahan citra adalah pemrosesan citra, khususnya
modern. dengan menggunakan komputer, menjadi citra yang
kualitasnya lebih baik [7].
2.1.6. Definisi Citra Digital
2.2.1. Definisi Pengenalan Pola
Citra (image) adalah gambar pada bidang
Menurut Rinaldi Munir bahwa pengenalan
dua dimensi. Dalam tinjauan matematis, citra
merupakan fungsi kontinu dari intensitas cahaya pola bertujuan menentukan kelompok atau kategori
pada bidang dua dimensi. Ketika sumber cahaya pola berdasarkan ciri-ciri yang dimiliki oleh pola
menerangi objek, objek memantulkan kembali tersebut. Dengan kata lain, pengenalan pola
sebagian cahaya tersebut. Pantulan ini ditangkap membedakan suatu objek dengan objek lain.
oleh alat-alat pengindera optik, misalnya mata Terdapat dua pendekatan yang dilakukan dalam
manusia, kamera, scanner dan sebagainya. Bayangan pengenalan pola: pendekatan secara statistik dan
objek tersebut akan terekam sesuai intensitas pendekatan secara sintaktik atau structural[7].

47
Avalaiable at:
http://journal.unj.ac.id/unj/index.php/pinter/article/view/16357
2.4. Kerangka Konseptual
2.2.2. Definisi Pengenalan Karakter Optis Berdasarkan kajian teori yang telah
Pengenalan karakter optis merupakan suatu dijelaskan, perkembangan gambar Meme semakin
aplikasi untuk mengidentifikasi tulisan sesuai pesat dengan didukung kemajuan teknologi
dengan karakter atau huruf yang telah ditentukan informasi. Meme merupakan citra digital dan dapat
berdasarkan pola matriks yang telah disimpan disebarkan ke dunia maya khususnya media sosial
didalam basis data. dengan bebas dan mudah. Dengan kebebasan
Menurut Shelly, Cashman dan Veermat, tersebut Meme dapat digunakan sebagai sarana
pengenalan karakter optis adalah kegiatan komunikasi untuk menyebarkan informasi-informasi
pembacaan karakter-karakter hasil ketikan, cetakan negatif. Maka diperlukan aplikasi untuk menyaring
komputer, atau tulisan tangan dari dokumen- gambar Meme tersebut di dunia maya. Untuk
dokumen biasa serta bisa menerjemahkan gambar- membuat aplikasi tersebut menggunakan deteksi dan
gambar tersebut menjadi bentuk yang dapat diproses lokalisasi teks pada gambar. Tulisan pada Meme
komputer[8]. biasanya akan bergabung dengan background
sehingga akan lebih rumit dalam deteksi dan
2.2.3. Definisi Segmentasi lokalisasi teks. Untuk mendeteksi dan melokalisasi
Segmentasi merupkan teknik untuk tulisan tersebut melakukan proses segmentasi untuk
membagi citra menjadi beberapa daerah (region) di pembagian wilayah selanjutnya dilakukan
mana setiap daerah memiliki kemiripan attribut. pengenalan karakter optis. Pada proses pengenalan
Operasi segmentasi area adalah operasi untuk segmentasi dibutuhkan algoritma deteksi Tepi untuk
mengidentifikasi semua piksel yang mempunyai mengubah gambar menjadi gambar biner (perubahan
intensitas yang sama, dengan cara lain gambar berwarna atau abu-abu menjadi hitam-dan-
mengelompokkan piksel-piksel tersebut ke dalam putih). Maka diterapkan algoritma Canny edge
suatu range terdekat. detection pada aplikasi tersebut untuk menghasilkan
gambar biner. Setelah proses binerisasi ini maka
2.3. MSER akan dihasilkan gambar biner yang akan dilakukan
proses segmentasi, proses segmentasi bertujuan
Menurut Aneta bahwa MSER (Maximally mengelompokkan pixel-pixel objek menjadi wilayah
Stable Extremal Region) dipelopori oleh Matas dkk. (region). Setelah gambar biner dibagi berdasarkan
MSER merupakan kumpulan dari wilayah berbeda wilayah maka pengenalan karakter optis lebih
yang di deteksi dari citra grayscale. Semua wilayah maksimal karena bagian dari latar gambar yang tidak
didefinisikan sebagai property extermal dari fungsi mengandung tulisan akan dihilangkan. Proses
intensitas dalam wilayah dan diatas batas luarnya. pengenalan pola optis akan menghasilkan tulisan
MSER memiliki sifat yang membentuk kemampuan yang diidentifikasi berdasarkan basis data. Huruf
superiornya sama stabil dengan detector local. pada citra akan dibandingkan dengan hasil tulisan
MSER tertutup dalam transformasi geometri dari aplikasi. Selanjtunya hasil deteksi tulisan
perubahan intensitas. menggunakan aplikasi dengan algoritma Canny akan
Pohon komponen adalah struktur yang dinilai berdasarkan perbandingan nilai persentase
memperbolehkan deteksi MSER dalam sebuah citra, kesamaan tulisan pada gambar Meme.
dan sebagai tambahan, menyusun dasar dari
pelacakan MSER. Pohon komponen telah digunakan 2. Metodologi Penelitian
oleh Couprie dkk untuk implementasi pemisahan
batas yang efisien. Pohon komponen adalah pohon 3.1. Tempat, Waktu dan Subjek Penelitian
yang berakar dan saling terhubung dan bisa dibangun Penelitian di lakukan di laboratoriun
untuk citra apapun dengan nilai pixel berasal dari komputer Jurusan Teknik Elektro Universitas Negeri
rangkaian yang digunakan secara total. Tiap cabang Jakarta, dimulai dari bulan Januari 2016 sampai
dari pohon merepresentasikan wilayah yang bulan Maret 2016.
terkoneksi dalam input citra.
Proses ini menghasilkan struktur data yang 3.2. Populasi dan Sampel Penelitian
menyimpan area dari tiap komponen terkoneksi 3.2.1. Populasi
sebagai fungsi intensitas. Gabungan dari 2 Populasi adalah wilayah generalisasi yang
komponen dapat dilihat sebagai eksistansi terminal terdiri atas: objek/ subjek yang mempunyai kualitas
dari komponen yang lebih kecil dan penyisipan dari darn karakteristik tertentu yang ditetapkan oleh
semua piksel komponen yang lebih kecil ke yang peneliti untuk dipelajari dan kemudian ditarik
lebih besar. Kemudian, level intensitas yang kesimpulannya[10]. Populasi dalam penelitian ini
meruoakan local minima dari tingkat perubahan adalah citra digital Meme yang berasal dari website-
fungsi area dipilih sebagai threshold yang website penghasil Meme seperti 9gag.com, 1cak.com
menghasilkan MSER. Sebagai output, MSER dan memegenerator.com serta mesin pencari Google.
direpresentasikan sebagai posisi dari local intensitas
minimum (atau maksimum) dan threshold. [9]

48
Avalaiable at:
http://journal.unj.ac.id/unj/index.php/pinter/article/view/16357
! "! ℎ $%& '&% $%
3.2.2. Sampel
Menurut Sugiyono, sampel adalah bagian dari = × 100%
jumlah dan karakteristik yang dimiliki oleh populasi ! ℎ $%& $&% ( )"
tersebut. Bila populasi besar, dan peneliti tidak Dimana:
mungkin mempelajari semua yang ada pada Xn = hasil akurasi data ke-n
populasi, misalnya karena keterbatasan dana tenaga Setelah akurasi pada setiap gambar telah didapatkan
dan waktu, maka peneliti dapat menggunakan sampel maka dihitung rata-rata akurasi berdasarkan kategori
yang diambil dari populasi itu . rumus sebagai berikut:
Sampel yang digunakan dalam penelitian , − - $%
./ 0/ 1/ … + 3
= × 100%
adalah lima puluh gambar yang terdiri dari lima
kategori berdasarkan latar gambar yaitu manusia, 4
hewan, benda, pemandangan dan kartun. Setiap Dimana:
kategori terdapat sepuluh sampel gambar. Xk = hasil akurasi data ke-k
Teknik pengambilan data yang digunakan K = banyak data pada kategori
dalam pengumpulan data penelitian adalah Non Setelah akurasi pada setiap gambar telah didapatkan
participant Observation, yaitu observasi yang maka dihitung rata-rata akurasi dengan rumus
penelitinya tidak ikut secara langsung dalam sebagai berikut:
kegiatan atau proses yang sedang diamati, artinya , − - $%
./ 0/ 1/ … +
= × 100%
peneliti mengumpulkan data melalui catatan-catatan
pribadi atau hasil karya seseorang, teknik ini disebut 5
juga sebagai studi dokumenter. Dimana:
Xn = hasil akurasi data ke-n
2.3. Definisi Operasional N = banyak data
3.3.1. Variabel Penelitian Untuk menghitung tingkat kesalahan dibagi
a. Variabel Bebas menjadi dua yaitu berdasarkan karakter benar yang
Variabel bebas (independent variable) hilang dan karakter lebih yang tidak seharusnya ada
merupakan variabel yang dipilih oleh peneliti untuk pada citra. Rumus menentukan persentase karakter

47 − 48
mencari pengaruhnya terhadap variabel terikat kurang:
6= × 100%
47
(dependent variable). Variabel bebas dalam
penelitian ini adalah Algoritma Deteksi Tepi Canny.
b. Variabel Terikat Dimana:
Variabel terikat (dependent variable) Y = hasil persentase karakter hilang
merupakan variabel yang kehadirannya dipengaruhi KA = karakter hasil asli gambar
oleh variabel yang lain. Variabel terikat dalam KB = karakter benar hasil aplikasi

4 − 48
penelitian ini adalah hasil Identifikasi Tulisan Pada Rumus menentukan persentase karakter Lebih:
9= × 100%
47
Citra Digital Meme .

2.4. Metode dan Rancangan Penelitian Dimana:


Z = hasil persentase karakter lebih
3.4.1. Metode Penelitian
KX = semua karakter hasil deteksi aplikasi
Metode yang akan digunakan adalah metode KA = karakter hasil asli gambar
eksperimen. Menurut Arief penelitian eksperimen KB = karakter benar hasil aplikasi
adalah penyelidikan ilmiah yang menuntut peneliti
memanipulasi dan mengendalikan satu atau lebih 2.5. Teknik Pengumpulan Data
variabel bebas serta mengamati variabel terikat,
Teknik pengumpulan data yang digunakan
untuk melihat perbedaan yang sesuai dengan
adalah tes yaitu dengan menguji program dengan
manipulasi variabel-variabel bebas tersebut. Tujuan
menggunakan data sample yang telah dicari,
utama eksperimen adaah untuk menetapkan apa yang
selanjutnya hasil dari program akan disimpan dan
mungkin terjadi.
dihitung akurasinya. Tahapan pengumpulan data
Sedangkan menurut Sugiyono, Penelitian tersebut adalah sebagai berikut:
eksperimen adalah metode penelitian yang 1. Langkah awal pada tahap pelaksanaan penelitian
digunakan untuk mencari perbedaan perlakuan adalah peneliti mencari berdasarkan kategori
tertentu terhadap yang lain dalam kondisi yang gambar Meme secara acak di halaman web
terkendali. penghasil Meme dan mesin pencari Google.
2. Menguji setiap gambar pada program saru per
2.4.2. Teknik Analisi Data satu lalu disimpan hasilnya.
Berdasarkan Teknik yang digunakan adalah 3. Menghitung hasil akurasi kebenaran dan
teknik perhitungan akurasi. Pertama-tama mencari persentase kesalahan pada setiap gambar Meme.
akurasi tulisan pada setiap gambar dengan rumus 4. Melakukan analisis data hasil akhir secara
sebagai berikut: keseluruhan maupun berdasarkan kategori.

49
Avalaiable at:
http://journal.unj.ac.id/unj/index.php/pinter/article/view/16357
Dalam penelitian ini peneliti mengumpulkan
data dengan menguji gambar pada program lalu
menghitung nilai akurasi ketepatan deteksi tulisan
dan persentase kesalahan dalam mendeteksi tulisan.
Persentase kesalahan berdasarkan tulisan terdeteksi
yang hilang atau lebih.

3. Hasil Penelitian Dan Pembahasan


4.1. Deskripsi Data Hasil Penelitian
Data Penelitian yang terdiri dari pengumpulan Gambar 4.2. Hasil Deteksi MSER
dan pengelompokan data, konversi citra menjadi Setelah itu, citra yang berupa RGB akan
Tepi, proses deteksi wilayah berupa teks pada citra dirubah menjadi grayscale dengan mengambil rata-
dengan Canny, proses pembacaan tulisan dengan rata dari bit RGB tiap pikselnya. Nilai intensitas
OCR, hingga mendapatkan hasil teks pada citra, grayscale tersebut disimpan dalam arrray pada suatu
sebanyak lima puluh citra diuji dengan program variabel dan setelah itu digunakan sebagai parameter
implementasi algoritma deketsi Tepi Canny fungsi untuk melakukan deteksi Tepi dengan
menentukan wilayah teks pada citra Meme. Hasil memfilter citra dengan operator Sobel. Proses
teks dari program akan dicocokan dengan hasil implementasi algoritma deteksi Tepi Canny
pembacaan teks secara manual. dilakukan akan menghasilkan garis Tepi dari citra
tersebut. Citra diubah menja Tepi seperti gambar 4.3.
4.1.1. Implementasi Algoritma Deteksi Tepi
Canny dalam Program
Dalam Berikut ini adalah salah satu proses
citra uji dalam implementasi algoritma Canny
mendeteksi Tepi untuk pemilihan wilayah tulisan
pada citra dengan program. Program dibangun
menggunakan Matlab, dan source code implementasi
algoritma Canny dengan OCR (Object Character
Recognition). Berikut ini adalah penjelasan proses
citra dalam menghasilkan tulisan menggunakan
program.
Citra dipilih dengan ukuran minimal 335 x Gambar 4.3. Hasil Algoritma Canny
335 piksel dan maksimal 1028 x 1028 piksel Setelah didapat hasil Tepi dari algoritma
dilakukan proses pengujian seperti Gambar 4.1. Canny maka selanjutnya dengan mengkombinasikan
hasil citra Tepi Canny dengan hasil wilayah dari
MSER untuk dilakukan filtering dan mengurangi
bagian background pada citra. Hasil dari kombinasi
Canny dengan MSER pada gambar 4.4.

Gambar 4.1. Pengujian pada Citra


Sebelum dilakukan tahap implementasi
algoritma Canny untuk deteksi Tepi, citra dilakukan
deteksi dengan MSER (Maximally Stable Extremal
Region) dengan memisahkan bagian-bagian wilayah Gambar 4.4. Hasil Kombinasi MSER dan
berdasarkan warna dan kontras. Berikut hasil dari Canny
proses MSER pada gambar 4.2. Setelah proses tersebut selanjutnya
dilakukan filter kandidat teks dengan menganalisis
komponen yang berhubungan antara citra hasil
kombinasi MSER dan Canny dengan citra asli.
Kandidat teks ditentukan apabila komponen piksel
dari data asli yang berhubungan dengan data hasil.
Tahap kedua dilakukan filter kandidat teks untuk
mengidentifikasi bentuk garis Tepi dengan template

50
Avalaiable at:
http://journal.unj.ac.id/unj/index.php/pinter/article/view/16357
karakter yang ada. Hasil dari filter kandidat pada Akurasi
Akurasi Kesalahan
gambar 4.5 Kebenaran
OCR
Perkateg + Kuran Kurang Lebih
Lebih
ori OCR g OCR+ OCR+
CAN OCR
(%) OCR Canny Canny
NY (%)
(%) (%) (%)
(%)

Manusia 43.60 76.26 56.40 23.74 29.42 29.67


Pemanda
ngan 39.00 67.15 61.00 32.85 29.05 29.36

Kartun 57.99 51.33 42.01 48.67 56.70 29.50


102.7
Gambar 4.5. Hasil Filter Kandidat Teks Benda 60.84 68.22 39.16 31.78 6 35.35
Setelah menemukan kandidat teks maka Binatang 38.15 64.38 61.85 35.62 45.19 56.00
tahap selanjutnya dilakukan pemotongan element
yang berpotensi menjadi teks. Pemotongan dapat
Keseluru
dilihat pada Gambar 4.5. berdasarkan tanda dari garis han 47.91 65.47 52.09 34.53 52.62 35.98
merah. Setelah dilakukan pemotongan element,
setiap element diidentifikasi menggunakan OCR
(Object Character Recognition) menggunakan Dari data hasil pada Tabel 4.2. maksud dari
Algoritma Template Matching Correlation akurasi kebenaran pada OCR merupakan persentase
berdasarkan data uji dari Tesseract untuk hasil karakter benar yang terdeteksi hanya dengan
mendapatkan hasil tulisan yang terdapat pada citra menggunakan OCR. Sedangkan OCR+CANNY
dengan keluaran berupa teks pada notepad. Berikut merupakan persentase hasil karakter benar yang
gambar hasil akhir hasil program. terdetksi menggunakan pemilihan wilayah
menggunakan algoritma Canny dan deteksi tulisan
menggunakan OCR. Untuk akurasi kesalahan
merupakan persentase kesalahan yaitu berupa kurang
dan lebih. Maksud dari kurang adalah persentase
karakter benar yang hilang pada tulisan. Maksud dari
lebih adalah persentase karakter lebih yang
seharusnya tidak terdapat pada tulisan.
Beradasarkan keterangan data pada Tabel
4.2. nilai persentase akurasi keberhasilan secara
keseluruhan:

Gambar 4.6. Hasil Keluaran OCR dan Dengan OCR:


OCR+Canny
Pada Latar Manusia = 43.60%
4.1.2. Analisis Data Penelitian Pada Latar Pemandangan = 39.00%
Dalam Dari hasil akurasi keberhasilan akan Pada Latar Kartun = 57.99%
menentukan kinerja Algoritma Canny untuk Pada Latar Benda = 60.84%
mendeteksi Tepi dalam mengidentifikasi tulisan Pada Latar Binatang = 38.15%
pada citra digital Meme untuk menentukan wilayah Dengan OCR secara keseluruhan = 47.91%
dari tulisan. Setelah ditentukan lokasi suatu tulisan
pada citra maka wilayah tersebut akan diidentifikasi
menggunakan Object Character Recognition (OCR). Dengan OCR+Canny:
Pada hasil penelitian ini akan dibahas akurasi Pada Latar Manusia = 76.26%
pengenalan huruf dengan menggunakan identifikasi Pada Latar Pemandangan = 67.15%
wilayah dengan Algoritma Canny yang selanjutnya
Pada Latar Kartun = 51.33%
diidentifikasi tulisan dengan OCR dan sebagai
pembanding dilakukan pengujian dengan identifikasi Pada Latar Benda = 68.22%
tulisan hanya dengan OCR. Nilai akurasi dihitung Pada Latar Binatang = 64.38%
berdasarkan tulisan benar yang terdapat pada citra Dengan OCR+Canny keseluruhan = 65.47%
dan kesalahan pengenalan tulisan yaitu kurang/lebih
jumah tulisan yang terdeteksi. Nilai akurasi rata-rata
berdarkan 5 kategori dan rata-rata secara keseluruhan Persentase Tingkat Kesalahan:
berada pada table 4.2. Dengan OCR:
Tabel 4.1. Hasil Teks pada Citra Uji Tulisan Benar Tidak Terdeteksi (Kurang):
Pada Latar Manusia = 56.40%

51
Avalaiable at:
http://journal.unj.ac.id/unj/index.php/pinter/article/view/16357
Pada Latar Pemandangan = 61.00% OCR sebesar 39,00%. Untuk tingkat kesalahan
Pada Latar Kartun = 42.01% kehilangan karakter pada kinerja algoritma Canny
memiliki hasil akurasi kesalahan lebih kecil pada
Pada Latar Benda = 39.16%
deteksi tulisan OCR dengan hasil akurasi kehilangan
Pada Latar Binatang = 61.85% sebesar 32,85% dibandingkan hasil OCR dengan
Dengan OCR secara keseluruhan = 52.09% hasil akurasi sebesar 61,00%. Untuk tingkat
kesalahan kelebihan karakter kinerja algoritma
Tulisan Yang Tidak Seharusnya Pada Citra (Lebih): Canny memiliki akurasi kesalahan lebih besar
dengan deteksi tulisan OCR dengan hasil akurasi
Pada Latar Manusia = 29.42% kehilangan sebesar 29,36% dibandingkan hasil OCR
Pada Latar Pemandangan = 29.05% dengan hasil akurasi sebesar 29,05%.
Pada Latar Kartun = 56.70% Pada kategori latar berupa kartun, kinerja
Pada Latar Benda = 102.76% algoritma Canny mendeteksi Tepi untuk menentukan
wilayah kandidat teks memiliki akurasi kebenaran
Pada Latar Binatang = 45.19%
lebih kecil dengan deteksi tulisan pada OCR (Object
Dengan OCR secara keseluruhan = 52.62% Character Recognition) sebesar 51,33%
dibandingkan deteksi tulisan hanya dengan OCR
Dengan OCR+Canny: sebesar 57,99%. Untuk tingkat kesalahan kehilangan
karakter pada kinerja algoritma Canny memiliki
Tulisan Benar Yang Tidak Terdeteksi (Kurang):
hasil akurasi kesalahan lebih besar pada deteksi
Pada Latar Manusia = 23.74% tulisan OCR dengan hasil akurasi kehilangan sebesar
Pada Latar Pemandangan = 32.85% 48,67% dibandingkan hasil OCR dengan hasil
Pada Latar Kartun = 48.67% akurasi sebesar 42,01%. Untuk tingkat kesalahan
Pada Latar Benda = 31.78% kelebihan karakter kinerja algoritma Canny memiliki
akurasi kesalahan lebih kecil dengan deteksi tulisan
Pada Latar Binatang = 35.62% OCR dengan hasil akurasi kehilangan sebesar
Dengan OCR+Canny keseluruhan = 34.53% 29,50% dibandingkan hasil OCR dengan hasil
Tulisan Yang Tidak Seharusnya Pada Citra (Lebih): akurasi sebesar 56,70%.
Pada Latar Manusia = 29.67% Pada kategori latar berupa benda, kinerja
algoritma Canny mendeteksi Tepi untuk menentukan
Pada Latar Pemandangan = 29.36% wilayah kandidat teks memiliki akurasi kebenaran
Pada Latar Kartun = 29.50% lebih besar dengan deteksi tulisan pada OCR (Object
Pada Latar Benda = 35.35% Character Recognition) sebesar 68,22%
Pada Latar Binatang = 56.00% dibandingkan deteksi tulisan hanya dengan OCR
sebesar 60,84%. Untuk tingkat kesalahan kehilangan
Dengan OCR+Canny keseluruhan = 35.98%
karakter pada kinerja algoritma Canny memiliki
hasil akurasi kesalahan lebih kecil pada deteksi
4.3. Pembahasan Hasil Penelitian tulisan OCR dengan hasil akurasi kehilangan sebesar
Model Pada kategori latar berupa manusia, 31,78% dibandingkan hasil OCR dengan hasil
kinerja algoritma Canny mendeteksi Tepi untuk akurasi sebesar 39,16%. Untuk tingkat kesalahan
menentukan wilayah kandidat teks memiliki hasil kelebihan karakter kinerja algoritma Canny memiliki
akurasi kebenaran lebih besar dengan deteksi tulisan akurasi kesalahan lebih kecil dengan deteksi tulisan
pada OCR (Object Character Recognition) sebesar OCR dengan hasil akurasi kehilangan sebesar
76,26% dibandingkan deteksi tulisan hanya dengan 35,35% dibandingkan hasil OCR dengan hasil
OCR sebesar 43,60%. Untuk tingkat kesalahan akurasi sebesar 102,76%.
kehilangan karakter pada kinerja algoritma Canny Pada kategori latar berupa binatang, kinerja
memiliki hasil akurasi kesalahan lebih kecil pada algoritma Canny mendeteksi Tepi untuk menentukan
deteksi tulisan OCR dengan hasil akurasi kehilangan wilayah kandidat teks memiliki akurasi kebenaran
sebesar 23,74% dibandingkan hasil OCR dengan lebih besar dengan deteksi tulisan pada OCR (Object
hasil akurasi sebesar 56,40%. Untuk tingkat Character Recognition) sebesar 64,38%
kesalahan kelebihan karakter kinerja algoritma dibandingkan deteksi tulisan hanya dengan OCR
Canny memiliki akurasi kesalahan lebih besar sebesar 38,15%. Untuk tingkat kesalahan kehilangan
dengan deteksi tulisan OCR dengan hasil akurasi karakter pada kinerja algoritma Canny memiliki
kelebihan sebesar 29,67% dibandingkan hasil OCR hasil akurasi kesalahan lebih kecil pada deteksi
dengan hasil akurasi sebesar 29,42%. tulisan OCR dengan hasil akurasi kehilangan sebesar
Pada kategori latar berupa pemandangan, 35,62% dibandingkan hasil OCR dengan hasil
kinerja algoritma Canny mendeteksi Tepi untuk akurasi sebesar 61,85%. Untuk tingkat kesalahan
menentukan wilayah kandidat teks memiliki akurasi kelebihan karakter kinerja algoritma Canny memiliki
kebenaran lebih besar dengan deteksi tulisan pada akurasi kesalahan lebih besar dengan deteksi tulisan
OCR (Object Character Recognition) sebesar OCR dengan hasil akurasi kehilangan sebesar
67,15% dibandingkan deteksi tulisan hanya dengan

52
Avalaiable at:
http://journal.unj.ac.id/unj/index.php/pinter/article/view/16357
56,00% dibandingkan hasil OCR dengan hasil merupakan kategori hasil terburuk diantara
akurasi sebesar 45,19%. kelima kategori.
Berdasarkan kategori latar gambar, kinerja 4. Analisis kinerja algoritma Canny mendeteksi
algoritma Canny dengan OCR yang memiliki akurasi wilayah kandidat teks dipengaruhi kontras
tingkat kebenaran terbaik adalah pada latar manusia warna latar gambar Meme sehingga
sebesar 76,26% dan akurasi tingkat kebenaran mempengaruhi hasil Tepi.
terburuk pada latar kartun sebesar 51,33%.
Sedangkan yang memilki persentase tingkat 1.2. Saran
kesalahan kehilangan karakter terkecil adalah pada Saran yang dapat dilakukan untuk penelitian
latar manusia sebesar 23,74% dan persentase selanjutnya menurut penulis antara lain:
kehilangan karakter terbesar pada latar kartun 1. Melakukan penelitian yang sama dengan objek
sebesar 48,67%. Dan untuk akurasi tingkat ataupun kategori yang berbeda.
kesalahan kelebihan karakter terkecil adalah pada 2. Dilakukan pembandingan dengan algoritma
latar pemandangan sebesar 23,74% dan akurasi deteksi
kesalahan kelebihan karakter terbesar pada latar 3. Tepi lain untuk mengetahui hasil akurasi terbaik.
binatang sebesar 56,00%. 4. Dilakukan pembuatan aplikasi untuk dapat
Dari 50 gambar Meme yang diuji, memilih gambar yang mengandung tulisan
implementasi kinerja algoritma Canny mendeteksi negatif.
Tepi untuk menentukan wilayah kandidat teks 5. Dilakukan kombinasi dengan spell checker
meningkatkan akurasi deteksi tulisan pada OCR untuk pembacaan teks untuk mendapatkan hasil
(Object Character Recognition) dengan akurasi kata yang lebih baik apabila kata kehilangan
keberhasilan secara keseluruhan sebesar 65,47% beberapa karakter.
dibandingkan dengan deteksi tulisan langsung
menggunakan OCR sebesar 47,91%. Selain itu
mengurangi tingkat kesalahan deteksi tulisan pada
6 DAFTAR PUSTAKA
OCR dengan akurasi kesalahan secara keseluruhan
yaitu kehilangan karakter sebesar 34,53% dan
kelebihan karakter sebesar 35,98% dibandingkan [1] Suwanto Raharjo dan Ema Utami. 2004.
deteksi tulisan langsung menggunakan OCR dengan Logika, Algotima dan Implementasinya dalam
akurasi kehilangan karakter sebesar 52,09% dan Bahasa Python di GNU/LINUX . Yogyakarta :
kelebihan karakter sebesar 52,62. Implementasi Andi
algoritma deteksi Tepi Canny untuk menentukan [2] Astuti Hermawati, Fajar. 2013. Pengolahan
wilayah pada Meme secara keseluruhan Citra Digital. Yogyakarta : Andi
meningkatkan kinerja OCR dalam mendeteksi [3] Sutoyo, dkk. 2009. Teori Pengolahan Citra
tulisan pada Meme dan menguraingi persentase Digital. Yogyakarta : Andi
tingkat kesalahan kinerja OCR. [4] Koenjtaraningrat. 1981. Metode Penelitian
Masyarakat. Jakarta : Balai Pustaka
5 Kesimpulan Dan Saran [5] Lado, Robert. 1964. Language Teaching: A
1.1. Kesimpulan Scientific Approach. New York: McGraw-Hill.
[6] Arifanti, Widya. 2015. Meme Comic
Berdasarkan Dari hasil penelitian yang telah
Indonesia. Jakarta: Cahaya Insan Suci
diimplementasikan, maka dapat ditarik kesimpulan
[7] Munir, Rinaldi. 2004. Pengolahan Citra Digital
sebagai berikut:
Dengan Pendekatan Algoritmik . Bandung :
1. Implementasi kinerja algoritma Canny Informatika
mendeteksi wilayah kandidat teks pada OCR [8] Shelly, B., Cashman, J., & Veermat, Misty.
secara keseluruhan meningkatkan akurasi 2007. Discovering Computers Ed 3. Jakarta :
kebenaran dalam mendeteksi tulisan pada citra Salemba Infotek
digital Meme. [9] Aneta. 2012. Perbandingan Pelacakan Wayang
2. Implementasi kinerja algoritma Canny dengan MSER dan MSER Efisien. Depok :
mendeteksi wilayah kandidat teks pada OCR Universitas Indonesia
secara keseluruhan mengurangi tingkat akurasi [10] Sugiyono. 2012. Metode Penelitian
kesalahan berupa kehilangan karakter dan Pendidikan , Pendekatan Kuantitatif, Kualitatif
kelebihan karakter dalam mendeteksi tulisan dan R&D. Bandung : Alfabeta
pada citra digital Meme.
3. Kinerja algoritma Canny mendeteksi wilayah
kandidat teks dengan OCR pada kategori latar
manusia memiliki hasil terbaik diantara kelima
kategori. Sedangkan kategori latar kartun

53
Avalaiable at:
http://journal.unj.ac.id/unj/index.php/pinter/article/view/16357
View publication stats

Anda mungkin juga menyukai