Abstrak
Aksara sunda sebagai aksara nusantara diperkirakan sudah ada sejak abad ke 5, dalam
bidang komputer aksara sunda sudah resmi menjadi bagian standar unicode pada tahun 2008
sehingga karakter dari aksara sunda dapat digunakan sebagai font, ataupun pada proses
komputerasasi lainya. Bahasa sunda sendiri merupakan bahasa yang sehari-hari digunakan
khusunya oleh masyarakat jawa barat, serta merupakan aset penting bagian dari kebudayaan
sunda. Namun seiring berjalanya zaman, budaya sunda perlahan terkikis. Dari itu diperlukan
tindakan guna melestarikan budaya sunda salah satunya dengan mempelajari aksara sunda.
Aksara sunda mempunya pola tulisan yang rumit, dengan itu pola aksara sunda dapat dipelajari
oleh komputer untuk membantu masyarakat belajar bahasa sunda. Tahap pengenalan aksara
sunda terdiri dari dua proses yaitu tahap ekstraksi ciri dan klasifikasi. Metode modified direction
feature (MDF) adalah salah satu metode ekstraksi ciri, dimana metode ini akan mengekstraksi
ciri citra aksara sunda menjadi sebuah vektor berdasarkan arah transisi dari piksel aksara sunda
tersebut. Selanjutnya metode paling mudah di implementasikan untuk klasifikasi adalah K-
Nearest Neighbor (K-NN). K-NN bekerja dengan cara membandingkan jarak/kemiripan antara
data yang di uji dengan data latih. Hasil dari penelitian ini menjelaskan bahwa MDF dan K-NN
mampu dengan baik mengenali aksara sunda, dimana akurasi tertinggi yang berhasil didapatka
sebesar 87.5% dengan nilai K=5
Kata Kunci : Pengenelan Pola, Modified Direction Feature, K-Nearest Neighbor, aksara
sunda
Abstrac
The Sundanese script as the archipelago script is thought to have existed since the 5th
century, in the computer field the Sundanese script officially became part of the Unicode
standard in 2008 so that the characters from the Sundanese script can be used as fonts, or in
other computerized processes. Sundanese language itself is a language that is used every day
especially by the people of West Java, and is an important asset part of Sundanese culture. But
over time, Sundanese culture slowly eroded. From that, action is needed to preserve Sundanese
culture, one of which is by learning the Sundanese script. The Sundanese script has a complex
writing pattern, so the Sundanese script pattern can be learned by computer to help people
learn Sundanese. The Sundanese script recognition stage consists of two processes, namely the
feature extraction and classification stages. The modified direction feature (MDF) method is a
feature extraction method, where this method will extract the Sundanese script image features
into a vector based on the transition direction of the Sundanese script pixels. Furthermore, the
easiest method to implement for classification is K-Nearest Neighbor (K-NN). K-NN works by
comparing the distance/similarity between the data being tested and the training data. The
results of this study explain that MDF and K-NN are able to recognize Sundanese script well,
where the highest accuracy was obtained at 87.5% with a value of K = 5.
76
1. PENDAHULUAN
Pola atau tulisan digunakan oleh masyarakat untuk merepresentasikan bunyi atau suara yang
digunakan untuk berkomunikasi dengan istilah Bahasa. Bentuk atau pola dari Bahasa disebut
dengan aksara atau huruf. Indonesia sebagai negara kepulauan kaya akan beragam jenis budaya
dan aksara, aksara nusantara secara garis besar kelompokan dalam tiga kelompok utama yaitu
aksara aksara Ulu, aksara Batak dan Hanacaraka yang ada di Bali dan di Sunda [1]. Aksara
Sunda diperkirakan sudah ada sejak abad ke 5, dalam bidang komputer aksara sunda sudah
resmi menjadi bagian standar unicode pada tahun 2008 sehingga karakter dari aksara sunda
dapat digunakan sebagai font, ataupun pada proses komputerasasi lainya[2].
Bahasa sunda sendiri merupakan bahasa yang sehari-hari digunakan khusunya oleh
masyarakat jawa barat, serta merupakan asset penting bagian dari kebudayaan sunda. Namun
seiring berjalanya zaman budaya sunda perlahan terkikis. Oleh karena itu, diperlukan
pemasyarakatan budaya sunda secara keselurahan dalam rangka pemeliharaan dan pelestarian
budaya sunda. Pemerintah telah mengambil kebijakan dengan memasukanya bahasa sunda
sebagai salah satu pelajaran muatan lokal (mulok) pada tingkat SD sampai dengan SMA [3].
Namun begitu, tetap saja aksara Sunda tidak begitu banyak dikenal. Hal ini dikarenakan
keberagaman pola yang terdapat pada aksara sunda. Dilihat dari keberagaman pola, aksara
sunda memiliki 32 buah suku kata, yang terdiri atas swara (vokal) dan ngalena (konsonan).
Dengan banyaknya karakter dan pola tersebut maka dapat dilakukan proses pengenalan pola
serta klasifikasi yang digunakan sebagai media untuk mengenal akasara sunda.
Pada penelitian sebelumnya dengan judul “Pengenalan Tanda Tangan Dengan Metode
Modified Direction Feature (MDF) dan Euclidean Distance” disebutkan bahwa Modified
Direction Feature (MDF) merupan metode penggabungan antara Direction Feature (DF) dan
Transition Feature (TF). Peneliti membandingkan apakah jumlah data training dan data testing
mempengaruhi hasil akurasi, hasilnya akurasi tertinggi sebesar 72% dengan menggunakan 100
data training serta 25 data sebagai testing. Sehingga dapat disimpulkan dengan semakin banyak
data latih maka akurasi yang dihasilkan akan semakin baik, dengan kata lain semakin banyak
data latih yang digunakan akan banyak pula pola yang dapat di ekstraksi menggunakan metode
ini[4]. Penelitian lainya dengan judul “Sistem Pengenalan Aksara Sunda Menggunakan Metode
Modified Direction Feature (MDF) Dan Learning Vector Quantization (LVQ)” menyebutkan,
ciri yang dihasilkan merupakan hasil dari transformasi vector arah dan transisi dari sebuah pola
citra biner kemudian menjadi vector yang mewakili citra tersebut. Hanya saja, akurasi dari
proses klasifikasi tergantung dari metode yang digunakan[2]. Penelitian berikutnya dengan
judul “Unjuk Kerja K-Nearest Neighbor Untuk Alihaksara Citra Aksara Nusantara”
menyebutkan bahwa menggunakan metode K-Nearest Neighbor (K-NN) sebagai metode
klasifikasi mempunyai tantangan tersendiri seperti menentukan parameter untuk mengatur jarak
kedekatan object serta membuat data latih yang handal. Tingkat akurasi tertinggi menggunakan
metode K-NN ini adalah 78% dengan variasi nila K-nya adalah 9. Namun dibalik itu, K-NN
merupakan metode klasifikasi yang mudah difahami dan diimplementasikan[5].
Dari itu penelitian ini dilakukan guna mengetahui akurasi dari metode Modified Direction
feature dan K-Nearest Neighbor dalam mengenali aksara sunda.
2. METODE PENELITIAN
2.1. Pengenalan Pola
Pengenalan pola merupakan bagian dari bidang ilmu citra digital yang di gunakan untuk
menggambarkan atau mengelompokan suatu objek berdasarkan pengukuran ciri/sifat dari objek
tersebut. Sedangkan pola itu sendiri merupakan suatu entitas yang bisa diidentifikasi,
didefinisikan dan diberikan label/nama. Contoh pola adalah motif batik, sidik jari, dan lainya.
77
Dalam ilmu citra digital pola biasanya dinyatakan dalam bentuk vektor atau matriks atau dapat
pula berupa kumpulan hasil dari pemantauan atau pengukuran. Strukutur dari sistem
pengenalan pola dijelaskan pada gambar 1 dibawah [6] :
Berikut Langkah-langkah yang dilakukan untuk menemukan label arah bagi masing-
masing piksel foreground :
78
LTi = 1 – ( ) (1)
Untuk menghitung nilai LT apabila pemindaian dilakukan dari arah kanan ke kiri dan dari
arah bawah ke atas dapat dilihat pada persamaan 2 sebagai berikut:
LTi = ( ) (2)
Keterengan :
Xi = index piksel
Maxi = jumlah maksimum piksel
Ketentuan nilai maxi :
1. Maxi = lebar citra, apabila pemindaian dari arah kanan ke kiri dan dari arah kiri ke
kanan.
2. Maxi = panjang citra. apabila pemindaian dari arah bawah ke atas dan dari arah atas ke
bawah.
Longitude transition (LT) tiap arah selalu bernilai 0-1. Nilai LT dipengaruhi oleh
banyaknya jumlah transisi yang digunakan. Jumlah transisi tidak boleh melebihi jumlah transisi
maksimal yang ditetapkan. Apabila jumlah transisi lebih dari jumlah yang ditetapkan maka
transisi tersebut tidak dihitung dan sebaliknya apabila jumlah transisi yang ditemukan kurang
dari jumlah maksimal transisi yang ditetapkan maka nilai transisi sisanya adalah 0.
79
Selanjutnya lakukan pula perhitungan Direction Transisiton pada DF untuk setiap transisi
pada TF. Jadi apabila ditemukan satu transisi pada TF, maka DF untuk foreground yang
bersangkutan juga harus dihitung.
Nilai DT dari DF ini diambil dari melakukan pembagian nilai arah dengan nilai 10.
Penggunaan nilai 10 ini bertujuan agar nilai yang didapatkan berada pada rentang antara 0-1.
Persamaan mencari nilai DT dapat dilihat pada persamaan 3 sebagai berikut :
_ ( )_
𝐷𝑇𝑖 =( ) (3)
Dimana:
nrFeature = LT dan DT
nrTransitions = Jumlah Transisi
nrVectors = Jumlah arah pencarian
nrMatrixHeight(Width) = jumlah ukuran normalisasi matriks yang digunakan.
Keterangan:
𝑑𝑖, = Euclidean distance
𝑋𝑖𝑘, 𝑋𝑗𝑘 = vektor ciri.
2.7. Evaluasi
Untuk menentukan apakah suatu metode dinyatakan sesuai atau tidak maka diperlukan
proses evaluasi. Pada penelitian ini proses evaluasi menggunakan confussion matrix untuk
menghitung tingkat akurasinya. Perhitungan akurasi menggunakan rumus :
Proses pengenalan pola aksara sunda pada penelitian ini dibagi dalam 3 tahapan yaitu taha
pre-Proccessing, tahap ekstarksi ciri dengan metode MDF dan tahap kalsifikasi dengan metode
K-NN.
81
Gambaran dari tiap tahapan pada pre-proccessing ditunjukan pada gambar 3 berikut :
Selanjutnya nilai arah dicari untuk setiap piksel foreground. Nilai Direction Feature (DF)
keseluruhan ditunjukan sebagai berikut :
82
Berdasarkan gambar diketahui pada piksel (2,8); (2,9); (2,10) dan (2,11) terdapat transisi
dari arah kiri kea rah kanan, dengan nilai index nya yaitu 8, 9, 10 dan 11. Dari itu maka berlaku
persamaan 1 :
LT2 = 1 – ( ) = 0,46
LT2 = 1 – ( ) = 0,4
LT2 = 1 – ( ) = 0,33
Karena transisi yang digunakan berjumlah 3 maka untuk index 11 tidak dilakukan
perhitungan. Lakukan hal yang sama untuk 2 buah baris lainya. Setelah didapatkan nilai LT
pada setiap baris, selanjutnya mencari nilai rata – rata yang digunakan untuk normalisasi LT
sebagai berikut :
, , ,
nLT2 = ( ) = 0,51
83
Selanjutnya mencari nilai DT, nilai DT didapatkan dengan membagikan nilai DF dari piksel
dengan 10. Nilai DT pada gambar 6 dapat ditemukan menggunakan persamaan 3 sebagai
berikut :
DT2= ( ) = 0,4
DT2= ( ) = 0,4
DT2= ( ) = 0,4
Karena jumlah transisi yang digunakan adalah 3 maka, nilai DT pada index 11 tidak dicari.
Setelah nilai tiap-tiap DT ditemukan, selanjutnya menghitung nilai rata-rata sebagai normalisasi
DT sebagai berikut :
, , ,
nDT2 =( ) = 0,3
Nilai Keseluruhan LT dan DT hasil perhitungan pada gambar 7 dan gambar 8 berikut :
Setelah semua nilai LT dan DT normalisasi didapatkan, selanjutnya seluruh nilai hasil dari
normalisasi tersebut disatukan dalam satu buah vector citra. Vektor ini yang akan digunakan
dalam klasifikasi sebagai ciri dari citra aksara sunda I. Untuk mengetahui banyaknya jumlah
vektor dalam satu ciri citra aksara sunda, dapat menggunakan persamaan 4 sehingga diketahui
jumlah vektor ciri dalam satu citra adalah :
Nilai 2 merupakan LT dan DT, Nilai 3 adalah banyaknya transisi yang digunakan, nilai 4
adalah jumlah arah dari pencarian, dan 5 adalah ukuran matriks hasil normalisasi. Untuk nilai
vektor ciri, berisi nilai TF yaitu nilai keseluruhan dari hasil normalisasi matriks 4 arah pencarian
LT dan DT yang disusun dimulai dari nilai LT kiri ke kanan, kanan ke kiri, atas kebawah, dan
bawah ke atas. Dilanjutkan dengan nilai DT dimulai dari arah kiri ke kanan, kanan ke kiri, atas
ke bawah dan bawah ke atas. Sehingga didapatkan vektor ciri yang dapat dilihat pada gambar 11
berikut :
Berdasarkan tabel diatas akan dicari kelas untuk data uji yang kelasnya berlum diketahui.
Berikut Langkah penylesaian Menggunakan K-NN :
1. Menentukan Nilai Parameter K
Nilai K akan digunakan sebagai banyaknya tetangga yang akan menjadi acuan dalam
pemberian kelas. Dalam contoh ini nilai parameter K adalah 3.
2. Menghitung Jarak dan pasangan jarak antar kelas
Guanakan persamaan persamaan 5 untuk menghitung jarak tiap data data uji dengan data
latih Sebagai berikut :
D1 = (0.20 − 0.49) + (0.44 − 0.31) … + (0.20 − 0.27) = 11.54
Sehingga didapatkan jarak beserta urutan dan pasanganya sebagai berikut :
D1 11.54 8 A
D2 11.30 7 A
D3 11.29 6 A
D4 11.02 1 E
D5 11.20 2 E
D6 11.26 4 E
86
D7 11.25 3 I
D8 11.59 9 I
D9 11.28 5 I
Berdasarkan tabel hasil pengujian dapat diketahui hasil klasifikasi vector citra menggunakan
metode K-Nearest Neighbor paling tinggi sebesar 87,5% dengan nilai parameter K = 5
4. KESIMPULAN
Dari hasil penelitian dan pengujian yang telah dilakukan maka bisa diambil kesimpulan :
1. Metode yang digunakan dapat dengan baik melakukan eksatraksi ciri dan pengenalan
pada citra aksara sunda.
2. Banyaknya vektor yang merepresentasikan fitur citra dari aksara sunda akan tergantung
pada arah pencarian dan matriks hasil normalisasi pada proses ekstraksi ciri
menggunakan metode modified direction (MDF).
3. Berdasarkan hasil penelitian, Akurasi tertinggi yang didapatkan dalam pengenalan
aksara sunda dengan metode Modified Direction Feature dan K-Nearest Neighbor (K-
NN) adalah 87,3 % dengan nilai parameter K = 5. Sedangkan terendah yang didapatkan
pada penelitian ini adalah 84,6% dengan nilaiparameter K =1 dan K= 7.
5. SARAN
Berdasarkan penelitian yang telah dilakukan, terdapat beberapa saran agar dapat diperbaiki pada
penelitian berikutnya :
1. Mengembangkan jumlah transisi yang dilakukan pada tahap ekstraksi ciri MDF, seperti
menggunkan 4 transisi.
87
2. Mengembangkan metode yang digunakan dalam penelitian ini untuk kasus lain seperti
pengenalan aksara jawa, pengenalan aksara jepang dan lain-lain.
3. Mengembangkan penelitian ini dengan mengganti Sebagian metode atau keseluruhan
metode, baik itu untuk metode ekstraksi ciri maupun klasifikasinya.
DAFTAR PUSTAKA