Sandi Fajar Rodiyansyah Magister Ilmu Komputer Universitas Gadjah Mada Yogyakarta ABSTRAK
Image index and retrieval merupakan salah satu bagian dari multimedia database. Salah satu teknik pengolahan citra digital adalah perhitungan histogram dan perhitungan similarity dari citra-citra digital tersebut sehingga dapat menghasilkan nilai similarity. Hal ini merupakan dasar dari sistem content based index and retrieval khususnya dalam data citra digital. Dengan menggunakan vektor space dan euclidian distance dapat menghasilkan nilai similarity dari citra-citra digital tersebut. Keyword : citra digital, histogram, index and retrieval, content based index and retrieval system, similarity, vektor space, euclidian distance
I. PENDAHULUAN
Salah satu dari kemampuan komputer multimedia yang berkembang saat ini adalah penyimpanan citra digital. Penyimpanan citra digital ini dapat dilakukan dalam berbagai format. Citra digital adalah representasi dua dimensi untuk bentuk fisik nyata tiga dimensi. Dengan semakin banyaknya penggunaan citra digital dalam keperluan manusia sebagai pengguna, maka semakin banyak aplikasi-aplikasi pengolahan citra digital. Salah satu teknik pengolahan citra digital adalah ekstraksi histogram dari citra digital. Histogram adalah tampilan grafis dari tabulasi frekuensi yang digambarkan dengan grafis batangan sebagai manifestasi data. Tiap tampilan batang menunjukkan proporsi frekuensi pada masing-masing deret kategori yang berdampingan dengan interval yang tidak tumpang tindih. Untuk dapat melakukan index dan retrieval dari citra digital diperlukan suatu metode yang dapat menghitung kemiripan suatu citra dengan citra yang lain.
gangguan yang disebabkan oleh interferensi peralatan pembuat citra, baik berupa transduser, peralatan elektronik ataupun peralatan optik. Teknik dan proses untuk mengurangi atau menghilangkan efek degradasi pada citra digital meliputi perbaikan/peningkatan citra (image enhancement), restorasi citra (image restoration), dan tranformasi spasial (spasial transformation). Subyek lain dari pengolahan citra digital diantaranya adalah pengkodean citra (image coding), segmentasi citra (image segmentation), representasi dan deskripsi citra (image representation and description). Pengolahan citra dilakukan dengan komputer digital maka citra yang akan diolah terlebih dahulu ditransformasikan ke dalam bentuk besaran-besaran diskrit dari nilai tingkat keabuan pada titik-titik elemen citra. Bentuk citra ini disebut citra digital. Setiap citra digital memiliki beberapa karakteristik, antara lain ukuran citra, resolusi dan format lainnya. Umumnya citra digital berbentuk persegi panjang yang memiliki lebar dan tinggi tertentu, yang biasanya dinyatakan dalam banyaknya titik atau piksel (picture elemen/pixel). Ukuran citra dapat juga dinyatakan secara fisik dalam satuan panjang (misalnya mm atau inch). Dalam hal ini tentu saja harus ada hubungan antara ukuran titik penyusun citra dengan satuan panjang. Hal tersebut dinyatakan dengan resolusi yang merupakan ukuran banyaknya titik untuk setiap satuan panjang. Biasanya satuan yang digunakan adalah dpi (dot per inch). Makin besar resolusi makin banyak titik yang terkandung dalam citra dengan ukuran fisik yang sama. Hal ini memberikan efek penampakan citra menjadi semakin halus. Format citra digital ada bermacam-macam. Karena sebenarnya citra merepresentasikan informasi tertentu, sedangkan informasi tersebut dapat dinyatakan secara bervariasi, maka citra yang mewakilinya dapat muncul dalam berbagai format. Citra yang merepresentasikan informasi yang hanya
bersifat biner untuk membedakan 2 keadaan tentu tidak sama citra dengan informasi yang lebih kompleks sehingga memerlukan lebih banyak keadaan yang diwakilinya. Pada citra digital semua informasi tadi disimpan dalam bentuk angka, sedangkan penampilan angka tersebut biasanya dikaitkan dengan warna. Citra digital (digital image) adalah citra kontinyu f(x,y) yang sudah didiskritkan baik koordinat spasial maupun tingkat kecerahannya. Setiap titik biasanya memiliki koordinat sesuai dengan posisinya dalam citra. Koordinat ini biasanya dinyatakan indeks x dan y hanya bernilai bilangan bulat positif, yang dapat dimulai dari 0 atau 1. Citra digital yang selanjutnya akan disingkat citra sebagai matrik ukuran M x N yang baris dan kolomnya menunjukkan titik-titiknya yang diperlihatkan pada persamaan sebagai berikut :
( ) ( ( ( ( ) ) ) ( ( ( ) ) ) ( ( ( ) ) )
2.3. Histogram
Kata histogram berasal dari bahasa Yunani: histos dan gramma. Pertama kali digunakan oleh Karl Pearson pada tahun 1895 untuk memetakan distribusi frekuensi dengan luasan area grafis batangan menunjukkan proporsi banyak frekuensi yang terjadi pada tiap kategori. Histogram citra adalah grafik yang menggambarkan penyebaran nilai-nilai intensitas pixel dari suatu citra atau bagian tertentu di dalam citra. Histogram juga dapat menunjukkan banyak hal tentang kecerahan (brightness) dan kontras (contrast) dari sebuah gambar. Secara grafis histogram ditampilkan dengan diagram batang Misal citra digital memiliki L derajat keabuan. (misalnya citra dengan kuantisasi derajat keabuan 8bit, nilai derajat keabuan dari 0 255) secara matematis dapat dihitung dengan rumus :
Setiap titik juga memiliki nilai berupa angka digital yang merepresentasikan informasi yang diwakili titk tersebut. Format nilai piksel sama dengan format citra keseluruhan. Pada kebanyakan sistem pencitraan, nilai ini biasanya berupa bilangan bulat positif.
Dimana ni = jumlah pixel yang memiliki derajat keabuan i dan n = jumlah seluruh pixel di dalam citra Sebagai contoh, berikut merupakan matrik citra berukuran 8 x 8 dengan derajat keabuan dari 0 sampai 15 ( ada 16 buah derajat keabuan).
3 2 14 12 0 4 15 2
7 0 6 12 2 5 13 1
7 8 0 0 5 9 11 8 3 4 0 0 11 10 0 10
10 1 8 8 5 1 9 11
12 8 10 10 13 0 9 14
14 15 9 11 10 2 8 13
10 15 12 1 14 2 7 12
Data citra digital di atas kemudian hitung distribusi frekuensi dari data citra digital tersebut dan nilai histogram yang kemudian akan dipakai untuk perhitungan similarity. Tabel 1 merupakan tabel distribusi frekuensi dan nilai similarity dari data citra digital diatas. Untuk dapat melakukan perhitungan distribusi frekuensi dan perhitungan nilai histogram, dikembangkan algoritma untuk melakukan hal tersebut. Berikut merupakan algoritma histogram :
Algoritma histogram(A,int N,int M) /* A= array citra N,M =panjang, lebar citra */ /* inisialisasi Hist[0..255] dengan 0 */ for (i=0; i<=255; i++) Hist[i]=0 Endfor /* mencacah frekuensi kemunculan */ for(k=0;k<=255;k++) for (i=0; i<=N-1; i++) for (j=0; j<=M-1; j++) if (A[j,k]==i-1) Hist[i]=Hist[i]+1 endif endfor endfor endfor /*normalisasi Hist[i] dengan jumlah seluruh pixel */ n=N*M //n = adalah jumlah pikel image for (i=0; i<=255; i++) Hist[i]=Hist[i]/n endfor
Nilai euclidean distance merupakan nilai kemiripan citra digital. Semakin dekat (mendekati nilai 0) semakin mirip citra digital tersebut.
III. METODE
Dalam menyelesaikan permasalahan ekstraksi dan perhitungan nilai similarity dikembangkan perangat lunak untuk menghitung dan meng-generate histogram berdasarkan algoritma yang dikembangkan diatas. Kemudian nilai histogram tersebut diolah kembali untuk menghasilkan nilai similarity dari citra digital tersebut. Proses diawali dengan pembacaan dua citra digital *.jpg, *.bmp, *.png, *.tif'. kemudian dari pembacaan file tersebut data diolah untuk meng-generate histogram dengan algoritma yang dikembangkan dan perhitungan nilai similarity dengan menggunakan metode euclidean distance untuk menghasilkan nilai similarity.
2.4. Pengukuran Kemiripan Citra Digital dengan Teknik Euclidean distance dalam Ruang Vektor
Dalam matematika, euclidean distance atau adalah jarak antara dua titik yang dapat diukur dan dihasilkan oleh formula pytagoras. Euclidean vector atau sering hanya disebut dengan vector adalah obyek geometri yang memiliki panjang (magnitude) dan arah (direction). Sedangkan ruang vektor adalah sebuah structur matematika yang dibentuk oleh sekumpulan vektor. Vektor-vektor tersebut dapat ditambahkan, dikalikan dengan bilangan real dan lain-lain. Gambar 1 merupakan contoh dari ruang vektor, pada ruang vektor tersebut terdapat 2 vektor yaitu vektor A dan vektor B. Untuk menghitung jarak antara vektor A dan vektor B digunakan persamaan euclidean distance. Berikut merupakan penyelesaian dalam menghitung jarak antara vektor A dan vektor B. Panjang vektor A dan B dapat didefinisikan sebagai berikut:
Dengan demikian, untuk menghitung jarak antara kedua vektor tersebut menggunakan persamaan sebagai berikut : ( ) ( ) ( )
Sedangkan untuk n dimensi ruang vektor, jarak euclidean distance ditentukan dengan menggunakan persamaan sebagai berikut : ( ) ( ) ( ) ( )
Akan tetapi dalam implementasi pada makalah ini hanya menggunakan perhitungan euclidean distance pada ruang vektor 2 dimensi.
4.2. Pengujian
Untuk dapat membuktikan keakuratan metode ini, penulis menguji dengan membandingkan dua file
*.jpg dan membandingkan satu file *.jpg dengan dirinya sendiri. Setelah dilakukan pengujian hasil dari perbandingan antara dua file *.jpg menghasilkan nilai 1,03863 dan hasil perbandingan antara satu file *.jpg dengan dirinya sendiri menghasilkan nilai 0. Nilai nol merupakan nilai similarity yang dihasilkan apabila satu file *.wav dibandingkan dengan dirinya sendiri (identik). Gambar 3 dan 4 menunjukan hasil perhitungan nilai similarity.
V. KESIMPULAN
Histogram merupakan representasi grafik dari persebaran nilai derajat keabuan dari sebuah citra digital. Euclidean distance merupakan teknik berbasis vektor space yang dapat digunakan untuk menghitung nilai similarity dari dua sinyal digital yang dibandingkan. Perhitungan similarity dengan menggunakan teknik histogram akan bernilai mendekati 0 pada gambar yang sama meskipun gambar dibalik sekalipun.
DAFTAR PUSTAKA
Lu, Guojun. 1963. Multimedia Database Manajemen Systems. Artech House: Norwood Supatman. 2009. Deteksi Pembesaran Kelenjar Getah Bening pada Paru dengan Pengolahan Citra Digital untuk Mendiagnosa Penyakit Primer Kompleks Tuberkulosis (PKTB). Seminar Nasional Aplikasi Teknologi Informasi 2009 (SNATI 2009) Jurusan Teknik Informatika, Fakultas Teknologi Industri, Universitas Islam Indonesia Yogyakarta. Istachotil Jannah, Suci. (2010) Implementasi Fungsi Histogram Equalization pada Matlab Munir, Rinaldi. 2005. Pengolahan Citra Digital Dengan Pendekatan Algoritmik Bandung: Informatika.
Tabel 1: Distribusi Frekuensi dari Citra Digital ni 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 8 4 5 2 2 3 1 3 6 3 7 4 5 3 4 3 Hi=ni/n (n=64) 0.125 0.0625 0.078125 0.03125 0.03125 0.046875 0.015625 0.0156875 0.09375 0.046875 0.109375 0.0625 0.078125 0.046875 0.0625 0.046875