Klasifikasi Pola Sidik Bibir Untuk Menentukan Jenis Kelamin Manusia Dengan
Metode Gray Level Co-Occurrence Matrix Dan Support Vector Machine
Eka Novita Shandra1, Budi Darma Setiawan2, Yuita Arum Sari3
Program Studi Teknik Informatika, Fakultas Ilmu Komputer, Universitas Brawijaya
Email: 1ekanovitashandra@gmail.com, 2s.budidarma@ub.ac.id, 3yuita@ub.ac.id
Abstrak
Identifikasi merupakan satu cara yang dapat dilakukan untuk mengenali ciri-ciri individu. Identifikasi
diperlukan untuk mencari tahu kejelasan identitas personal pada orang yang sudah meninggal maupun
orang yang masih hidup. Didalam dunia kedokteran forensik, peran identifikasi ini sangat penting.
Seperti sidik jari, sidik bibir juga memiliki karakteristik unik pada setiap individu. Sidik bibir dapat
digunakan sebagai sarana untuk identifikasi kasus forensik maupun non forensik. Untuk kasus
nonforensik, sidik bibir dapat menentukan jenis kelamin pada individu. Untuk membantu pada proses
identifikasi jenis kelamin berdasarkan sidik bibir, dibutuhkan suatu sistem klasifikasi yang dapat
mengklasifikasikan jenis kelamin wanita dan pria. Proses diawali dengan mengumpulkan citra sidik
bibir yang kemudian dilakukan preprocessing dan melakukan ekstraksi fitur tekstur dengan metode
Gray Leveled Co-ocurrence (GLCM). Fitur yang digunakan ada 4 yaitu ASM, Contrast, Correlation
dan IDM dengan sudut 0o, 45o, 90o dan 135o. Kemudian nilai fitur digunakan data untuk proses
training dan testing menggunakan metode Support Vector Machine (SVM). Data latih yang digunakan
pada pengujian yaitu 60 data. Hasil pada penelitian ini belum memberikan tingkat akurasi yang baik
karena sistem hanya mampu memberikan akurasi sebesar 51,4% dengan pengujian parameter GLCM
yaitu jarak =1 dan parameter SVM λ (lambda) = 0.5, C (complexity) = 1, (gamma) = 0.01, dan itermax
= 100.
Kata kunci: Identifikasi, Sidik Bibir, Jenis Kelamin, Support Vector Machine, Gray Leveled Co-Occurrence
Abstract
Identification is one way that can be done to recognize individual characteristics. Identification is
needed to find out the clarity of personal identity, for both deceased and living people. In the world of
forensic medicine, the role of identification is very important. Like fingerprints, lip prints also have
unique characteristics for each individual. Lip prints can be used as a means to identify forensic and
non-forensic cases. For nonforensic cases, lip prints can determine the sex of an individual. To help in
the process of identifying gender based on lip prints, a classification system is needed that can classify
the sex of women and men. The process begins with collecting lip print images which are then
preprocessed and extracted texture features using the Gray Leveled Co-ocurrence (GLCM) method.
There are 4 features that are used namely ASM, Contrast, Correlation and IDM with angles of 0o, 45o,
90o and 135o. Then the feature value is used by data for the training and testing process using the
Support Vector Machine (SVM) method. The training data used in the test is 60 data. The results of
this study have not provided a good level of accuracy because the system is only able to provide an
accuracy of 51.4% by testing the GLCM parameter, namely distance = 1 and SVM parameters λ
(lambda) = 0.5, C (complexity) = 1, constant (gamma) = 0.01, and itermax = 100.
Keywords: Identification, Lip Prints, Gender, Support Vector Machine, Gray Leveled Co-Occurrence
guratan garis yang menyebar di seluruh Second Moment, Contrast, Correlation, dan
permukaannya. Studi yang mempelajari tentang Inverse Difference Moment. Salah satu penelitian
metode identifikasi berdasarkan sidik bibir tentang ekstraksi fitur GLCM diantaranya yaitu
disebut cheiloscopy (Randhawa, Narang, & penelitian oleh Kurniawan (2016) yaitu
Arora, 2011). Sidik bibir dapat menjadi sarana identifikasi penyakit daun tembakau dengan
identifikasi untuk kasus forensik maupun non- metode GLCM sebagai ekstraksi fitur tekstur dan
forensik. Untuk kasus forensik, sidik bibir dapat menggunakan metode SVM sebagai
digunakan untuk memecahkan kasus pengklasifikasi jenis penyakit daun tembakau.
pembunuhan, pemerkosaan ataupun pencurian. Rata-rata akurasi yang dihasilkan yaitu 74% dan
Sedangkan pada kasus yang non-forensik, sidik untuk akurasi tertinggi yaitu 80%
bibir dapat digunakan untuk mengidentifikasi menggunakan kernel Polynomial dan
jenis kelamin, usia, dan juga ras (Septadina, menggunakan jarak piksel 1, 2, 3, 5 dan 6.
2015). Sedangkan untuk akurasi terwndah yaitu 63%
Dari website Data Informasi Bencana menggunakan kernel gaussian (rbf) dan
Indonesia (DIBI), pada 10 tahun terakhir menggunakan jarak piksel 1. Pada penelitian
Indonesia mengalami bencana dengan jumlah tersebut menggunakan 4 fitur GLCM yaitu
kejadian sebanyak 20.733 kali dan tercatat ASM, Contrast, Correlation, dan IDM, yang
memakan korban jiwa sebanyak 8.197 korban, kemudian hasil dari masing-masing ekstraksi
diantaranya ada yang meninggal dan hilang. fitur diklasifikasikan menggunakan metode
Kecelakaan terbakarnya pesawat Garuda GA 200 Support Vector Machine. SVM dipilih karena
PK-GZC Boeing 737-400 di tahun 2007 yang merupakan salah satu metode klasifikasi yang
membawa 133 penumpang dan 7 awak pesawat, robust dalam mengklasifikasikan dua kelas data
telah menewaskan 21 penumpang. tidak semua (Lathief, 2016).
jenazah dapat diidentifikasi dengan mudah karena Dari hasil pemaparan diatas terkait dengan
banyak korban yang ikut terbakar. Karena korban sidik bibir, metode GLCM dan metode SVM
terbakar, maka tidak semua jenazah dapat tersebut menjadikan alasan utama Penulis
diidentifikasi dengan mudah, sehingga digunakan dalam membuat suatu sistem yang dapat
berbagai cara kombinasi berguna dan membantu penentuan jenis kelamin
dari identifikasi pada korban jiwa individu menggunakan sidik bibir yaitu dengan
(Prawestiningtyas & Algozi, 2009). memanfaatkan citra digital dalam
Pemeriksaan forensik dengan DNA mengidentifikasi jenis kelamin manusia.
tidaklah cukup untuk membantu penanganan
secara medis pada korban jiwa bencana. Oleh 2. LANDASAN KEPUSTAKAAN
karena itu, identifikasi perlu dikembangkan. 2.1. Sidik Bibir
Sidik bibir bisa dikembangkan pada proses Sidik bibir memiliki berbagai macam
forensik karena sidik bibir memiliki pola yang variasi, bentuk, maupun arah pada setiap
unik dan bersifat individual setiap orangnya. individu. Arah yang terbentuk dapat berupa
Sidik bibir sudah dapat diamati saat bayi masih vertikal, horizontal, dan miring. Alur yang
berusia empat bulan. Beberapa penelitian terbentuk akan berbeda pada setiap individu,
melaporkan bahwa sidik bibir bersifat permanen maka dari itu didapatkan sidik bibir dari
dan tidak berubah selama hidup seseorang gambaran alur-alur pada bibir. Berikut
(Septadina, 2015). Sehingga sidik bibir dapat klasifikasi sidik bibir oleh Suzuki dan
dijadikan salah satu saran dalam Tsuchihashi (1970) yang membagi pola sidik
mengidentifikasi korban jiwa secara langsung bibir menjadi enam.
ditempat kejadian perkara.
GLCM merupakan salah satu metode yang
digunakan untuk mendapatakan nilai ciri-ciri
tekstur pada citra yang dihitung nilai
probabilitas hubungan ketetanggaan antara dua
piksel pada jarak dan arah tertentu. Haralick
(1973) mengusulkan berbagai jenis ciri tekstur
yang dapat diekstraksi dari matriks kookurensi.
Adapun parameter atau ciri-ciri tekstur yang
Gambar 3. Tipe Sidik Bibir Suzuki dan
biasa digunakan dalam penelitian sebelumnya
Tsuchihashi
dari metode GLCM diantaranya adalah Angular
Penelitian yang dilakukan oleh Vahanwala- 1. Momen Angular Kedua (Angular Second
Parekh disarankan agar pola sidik bibir Moment) atau Energy. Rumus ASM dapat
diklasifikasikan berdasarkan jenis kelamin dilihat pada Persamaan 2.
dengan ketentuan pada Tabel 1. = ( , )2 (2)
Tabel 1. Klasifikasi Sidik Bibir Berdasarkan
∑
, =0
2012). Keterangan:
Langkah-langkah metode GLCM Ng = Nilai Level Keabuan.
1. Normalisasi, yaitu proses mengubah i dan j = Nilai sifat keabuan dari resolusi 2
rentang nilai intensitas pixel. Dengan rumus min- piksel yang berdekatan.
max normalization pada Persamaan 1. ( , ) = Nilai pada baris i dan kolom j pada
−
matriks kookurensi yang sudah
( − ) + (1) ternormalisasi.
−
= Nilai rata-rata elemen kolom pada
Keterangan: matriks ( , ).
nilai minimum variabel I newMax = nilai = Nilai simpangan baku elemen kolom
baru maksimal variable I newMinv = pada matriks.
nilai baru minimum variable I = Nilai simpangan baku elemen
2. Membuat area kerja matriks yang
digunakan untuk memasukkan hubungan spasial baris pada matriks.
dari nilai piksel citra. 4. Momen Selisih Terbalik (Inverse
3. Menentukan hubungan spasial antara piksel Difference). Rumus IDM dapat dilihat pada
referensi dengan piksel tetangga, berapa nilai sudut Persamaan 5.
dan jarak d. Kemudian menghitung jumlah 1
Keterangan:
4. Membuat matriks simetris dengan
Ng = Nilai Level Keabuan.
menjumlahkan matriks kookurensi dengan matriks
i dan j = Nilai sifat keabuan dari resolusi 2
transposenya.
piksel yang berdekatan.
( , ) = Nilai pada baris i dan kolom j pada matriks kookurensi yang sudah
5. Normalisasi matriks untuk mengubahnya ke
bentuk probabilitas.
Selanjutnya menghitung nilai tekstur
dengan persamaan Haralick (1973) yang
didefenisi-kan sebagai berikut:
Fakultas Ilmu Komputer, Universitas Brawijaya
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer 2756
ternormalisasi. Keterangan:
= alfa ke-i
2.3. Support Vector Machine (SVM)
= delta alfa ke-i
Konsep sederhana dari algoritme SVM
3. PENGUMPULAN DATA
adalah menacari hyperplane atau garis pembatas
terbaik yang berfungsi untuk memisahkan dua Pengumpulan data dilakukan dengan
kelas pada input space. Untuk mendapatkan mengambil langsung beberapa foto bibir dari
garis hyperplane terbaik digunakan perhitungan mahasiswa dan mahasiswi Fakultas Ilmu
margin hyperplane dan mencari titik maksimal. Komputer, Universitas Brawijaya. Ketentuan
Langkah-langkah dalam melakukan sequential pengambilan foto yaitu bibir dalam kondisi
training akan ditunjukkan pada persamaan normal, dalam posisi istirahat dan tidak
sebagai berikut (Vijayakumar S, 1999). menggunakan pewarna bibir yang mengkilap.
1. Melakukan inisialisasi terhadap = 0 dan Lokasi pengambilan data bertempat di ruang
parameter lainnya, seperti nilai λ , γ , dan kelas dan diluar kelas Fakultas Ilmu Komputer,
iterasi maksimal Universitas Brawijaya. Perangkat yang
Keterangan: digunakan dalam pengumpulan data citra bibir
= alfa ke-I, digunakan untuk mencari yaitu kamera dari Iphone 5s dengan spesifikasi
support vector. kamera 8MP (belakang), Dual LED, F/2.2.
γ= konstanta gamma untuk mengontrol Format yang digunakan pada citra bibir yaitu
kecepatan. Joint Photographic Group (.jpg). Jarak
= konstanta C untuk membatasi nilai alfa. pengambilan foto kurang lebih 20cm dari objek.
λ= nilai Lambda Jumlah citra bibir yang diambil sebanyak 60,
2. Menghitung matriks Hessian menggunakan untuk citra bibir pria diambil sebanyak 30 dan
Persamaan 6 sebagai berikut. wanita sebanyak 30.
= ( ( , ) + λ2) (6)
Dengan i, j = 1,…,…,n.
Keterangan:
= data ke-i
= data ke-j
= kelas data ke-i
= kelas data ke-j (a) (b)
n = jumlah data Gambar 2. (a) Bibir Pria, (b) Bibir Wanita
λ = nilai lambda
4. PERANCANGAN ALGORITME
( , ) = fungsi kernel yang digunakan
25
20
15
AKURASI
10
5
0
NILAI LAMBDA
Gambar 4. Diagram Alir Proses Support Vector Rata-rata tingkat akurasi terbaik didapatkan
pada saat parameter lambda diberikan nilai 0.5
yaitu sebesar 36,2%. Nilai parameter lambda
memiliki pengaruh terhadap jarak margin yaitu dapat
menghasilkan nilai hyperplane yang baik
Fakultas Ilmu Komputer, Universitas Brawijaya
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer 2758
Rata-Rata Akurasi(%)
37,8
34,6 34,8 34,6
40 33,2
29,6 31,6 29,6 31,2
26,2
30
AKURASI (%)
20
10
0
0,0010,01 0,1 1 1,5 2 2,5 3 3,5
NILAI GAMMA
Untuk pengujian ini juga menggunakan parameter C = 1, λ = 0.5 dan itermax = 10.
30 60 51,4 49,6
25 46,2
AKURASI
20 44,6 43 44,6
15 41,2 41,4
10 50
5 36,2 38
0 40
1 5 10 20 30 40 50 100 150 200 30
AKURASI(%)
NILAI C 20
Untuk pengujian ini juga menggunakan parameter λ = 0.5, γ = 0.01 dan itermax = 10.
Parameter C 0
10 20 30 40 50 100 200 300 400 500
Rata-rata tingkat akurasi terbaik didapatkan
ITERASI MAKSIMUM
pada saat parameter complexity diberikan nilai
yaitu sebesar 41,2%. Nilai rata-rata akurasi
mengalami penurunan pada saat nilai C bernilai 5 Gambar 8. Grafik Hasil Pengujian Parameter
sampai 30. Penting untuk memaksimalkan margin Iterasi Maksimal
dan meminimalkan jumlah slack Pada saat nilai C Rata-rata tingkat akurasi terbaik didapatkan
semakin mendekati 0, maka lebar margin pada pada saat parameter nilai iterasi maksimal
hyperplane akan maksimal dan menyababkan diberikan nilai 100 yaitu sebesar 51,4%. Nilai
rata-rata akurasi mengalami kenaikan pada saat
1 TYPE_V
2 TYPE_V PRIA PRIA
nilai iterasi maksimal bernilai 10 sampai 100, 3 TYPE_II
tetapi kemudian disaat iterasi maksimal bernilai
200 sampai 500 mengalami penurunan. Ini
menunjukkan bahawa semakin besar jumlah
iterasi tidak menjamin nilai akurasi yang lebih
tinggi karena nilai αi belum mencapai nilai
konvergen. Menurunnya akurasi disaat iterasi
bertambah terjadi karena rasio support vector
yang tidak seimbang dan beberapa data terletak
jauh dari bidang pemisah (hyperplane) yang
ideal (Harahap, Muflikhah, & Rahayudi, 2018).
5.5. Pengujian Nilai Jarak (d)
Pengujian parameter nilai jarak bertujuan
untuk mengetahui pada nilai jarak berapa yang
memberikan nilai akurasi terbaik untuk sistem.
Pengujian nilai d merupakan pengujian
parameter ekstraksi fitur GLCM yang
menentukan hasil pembentukan nilai matriks
awal berdasarkan jarak pixel. Nilai yang dipakai
pada pengujian nilai jarak ada 5, yaitu 1,2,3,4
dan 5.
Rata-Rata Akurasi
51,2
60 46,4 46,2
41,2
50
(%)
40
30
AKURASI
20
10
0
1 2 3 4
NILAI JARAK
yang tidak sesuai dengan kelas nya ada 3 data. Ilmu Komputer, Volume 2, pp. 3843-
Hal ini disebabkan karena kurangnya data untuk 3848.
pelatihan pada kelas tersebut. Solusi yang dapat Haralick, R. M., Shanmugam, K. & Dinstein ,
dilakukan yaitu melakukan perbaikan citra agar I., 1973. Textural Features for Image
dapat membedakan pola kelas dengan baik dan Classification. pp. 610 - 621.
memperbanyak data latih agar dapat dengan Hidanti, M., Zahra, A. A. & Isnanto, R. R.,
tepat memberikan hyperplane yang optimal 2016. Sistem Identifikasi Jenis Tanaman
untuk dapat memberikan hasil klasifikasi yang Obat Menggunakan Matriks Kookurensi
benar. Aras Keabuan (GLCM) dan Jarak
Canberra. Proceedings Seminar Nasional
6. KESIMPULAN Teknik Elektro (FORTEI 2016), p. 115.
Kadir,A. & Susanto, A., 2012. Teori dan
Permasalahan klasifikasi jenis kelamin
Aplikasi Pengolahan Citra. Yogyakarta:
dengan metode gray level co-occurance matrix
Andi.
dan support vector machine, sistem masih kurang
Kasprzak, J., 1990. Possibilities of Cheiloscopy.
dapat memberikan hasil klasifikasi sesuai dengan
Forensic Science International, pp. 145-
kelasnya. Hal ini karena tidak adanya seleksi fitur
151.
untuk setiap data agar mewakili ciri yang spesifik
untuk pembeda dengan kelas lainnya dan jumlah Kurniawan, N. Z., Rasmana, S. T. &
juga dataset yang sedikit. Nilai rata-rata akurasi Triwidyastuti, Y., 2016. Identifikasi Jenis
hanya mampu mencapai nilai 51,4% dengan Penyakit Daun Tembakau Menggunakan
skenario pengujian yaitu rasio data 80% data Metode Gray Level Co-Occurrence
training : 20% data testing, menggunakan kernel Matrix (GLCM) Dan Support Vector
polynomial dan nilai parameter yaitu =0.5, =0.01,
Machine (SVM). JCONES, Volume 5,
=1, itermax = 100 dan jarak=1. Pengaruh variasi
pp. 158-163.
nilai parameter lambda, gamma, C, iterasi Kurniawaty, D., Cholissodin, I. & Adikara, P.
maksimal dan d pada pengujian memberikan hasil P., 2018. Klasifikasi Gangguan Jiwa
yaitu hampir semua nilai akurasi data nilainya Skizofrenia Menggunakan Algoritme
tidak optimal. Akurasi yang rendah tersebut Support Vector Machine (SVM). Jurnal
disebabkan karena nilai tekstur pada beberapa Pengembangan Teknologi Informasi dan
dataset yang kelasnya berbeda memiliki Ilmu Komputer, Volume 2, pp. 1866-
kemiripan dan perbedaan pola pada setiap kelas 1873.
tidak signifikan. Walaupum rata-rata akurasi yang Lathief, D., 2016. Klasifikasi Jenis Kelamin
didapatkan masih rendah, sistem sudah dapat Manusia menggunakan Citra Wajah
dengan benar mengklasifikasikan beberapa tipe berbasis Metode Support Vector Machine
bibir. (SVM).
Prawestiningtyas, E. & Algozi, A. M., 2009.
Untuk penelitian lebih lanjut agar dapat Forensic Identification Based on Both
meningkatkan hasil yang diperoleh sistem, Primary and Secondary Examination
Priority in. Jurnal Kedokteran
dengan melakukan perbaikan seperti
Brawijaya, Volume XXV.
menambahkan beberapa tahapan pre-processing
agar membuat kualitas citra menjadi lebih baik Puspitasari, A. M., Ratnawati, D. E. & Widodo,
untuk dapat memisahkan dengan benar kelas- A., 2018. Klasifikasi Penyakit Gigi Dan
kelas yang termasuk didalamnya dan juga dapat Mulut Menggunakan Metode Support
mencoba menggunakan metode ekstraksi fitur
Vector Machine. Jurnal Pengembangan
lainnya. Kemudian untuk kasus multi-class pada
Teknologi Informasi dan Ilmu Komputer,
SVM dapat mencoba menggunakan strategi One
Volume 2, pp. 802-810.
Against One ataupun strategi yang lainnya. Septadina, I. S., 2015. Identifikasi Individu dan
Jenis Kelamin Berdasarkan Pola Sidik
7. DAFTAR PUSTAKA Bibir. April, Volume II, pp. 231-236.
Vijayakumar, S. & Wu, S., 1999. Sequential
Harahap, E. H., Muflikhah, L. & Rahayudi, B., Support Vector Classifiers and
2018. Implementasi Algoritma Support Regression. International Conference on
Vector Machine (SVM) Untuk Penentuan SoftComputing, pp. 610-619.
Seleksi Atlet Pencak Silat. Jurnal
Pengembangan Teknologi Informasi dan