Anda di halaman 1dari 5

Ekstraksi Histogram Citra Digital Untuk Mengukur Similarity dengan Menggunakan Metode Euclidian Distance

Sandi Fajar Rodiyansyah Magister Ilmu Komputer Universitas Gadjah Mada Yogyakarta ABSTRAK
Image index and retrieval merupakan salah satu bagian dari multimedia database. Salah satu teknik pengolahan citra digital adalah perhitungan histogram dan perhitungan similarity dari citra-citra digital tersebut sehingga dapat menghasilkan nilai similarity. Hal ini merupakan dasar dari sistem content based index and retrieval khususnya dalam data citra digital. Dengan menggunakan vektor space dan euclidian distance dapat menghasilkan nilai similarity dari citra-citra digital tersebut. Keyword : citra digital, histogram, index and retrieval, content based index and retrieval system, similarity, vektor space, euclidian distance

I. PENDAHULUAN
Salah satu dari kemampuan komputer multimedia yang berkembang saat ini adalah penyimpanan citra digital. Penyimpanan citra digital ini dapat dilakukan dalam berbagai format. Citra digital adalah representasi dua dimensi untuk bentuk fisik nyata tiga dimensi. Dengan semakin banyaknya penggunaan citra digital dalam keperluan manusia sebagai pengguna, maka semakin banyak aplikasi-aplikasi pengolahan citra digital. Salah satu teknik pengolahan citra digital adalah ekstraksi histogram dari citra digital. Histogram adalah tampilan grafis dari tabulasi frekuensi yang digambarkan dengan grafis batangan sebagai manifestasi data. Tiap tampilan batang menunjukkan proporsi frekuensi pada masing-masing deret kategori yang berdampingan dengan interval yang tidak tumpang tindih. Untuk dapat melakukan index dan retrieval dari citra digital diperlukan suatu metode yang dapat menghitung kemiripan suatu citra dengan citra yang lain.

gangguan yang disebabkan oleh interferensi peralatan pembuat citra, baik berupa transduser, peralatan elektronik ataupun peralatan optik. Teknik dan proses untuk mengurangi atau menghilangkan efek degradasi pada citra digital meliputi perbaikan/peningkatan citra (image enhancement), restorasi citra (image restoration), dan tranformasi spasial (spasial transformation). Subyek lain dari pengolahan citra digital diantaranya adalah pengkodean citra (image coding), segmentasi citra (image segmentation), representasi dan deskripsi citra (image representation and description). Pengolahan citra dilakukan dengan komputer digital maka citra yang akan diolah terlebih dahulu ditransformasikan ke dalam bentuk besaran-besaran diskrit dari nilai tingkat keabuan pada titik-titik elemen citra. Bentuk citra ini disebut citra digital. Setiap citra digital memiliki beberapa karakteristik, antara lain ukuran citra, resolusi dan format lainnya. Umumnya citra digital berbentuk persegi panjang yang memiliki lebar dan tinggi tertentu, yang biasanya dinyatakan dalam banyaknya titik atau piksel (picture elemen/pixel). Ukuran citra dapat juga dinyatakan secara fisik dalam satuan panjang (misalnya mm atau inch). Dalam hal ini tentu saja harus ada hubungan antara ukuran titik penyusun citra dengan satuan panjang. Hal tersebut dinyatakan dengan resolusi yang merupakan ukuran banyaknya titik untuk setiap satuan panjang. Biasanya satuan yang digunakan adalah dpi (dot per inch). Makin besar resolusi makin banyak titik yang terkandung dalam citra dengan ukuran fisik yang sama. Hal ini memberikan efek penampakan citra menjadi semakin halus. Format citra digital ada bermacam-macam. Karena sebenarnya citra merepresentasikan informasi tertentu, sedangkan informasi tersebut dapat dinyatakan secara bervariasi, maka citra yang mewakilinya dapat muncul dalam berbagai format. Citra yang merepresentasikan informasi yang hanya

II. TINJAUAN PUSTAKA


2.1. Citra Digital
Citra adalah representasi dua dimensi untuk bentuk fisik nyata tiga dimensi. Citra dalam perwujudannya dapat bermacam-macam, mulai dari gambar hitamputih pada sebuah foto (yang tidak bergerak) sampai pada gambar berwarna yang bergerak pada pesawat televisi. Proses transformasi dari bentuk tiga dimensi ke bentuk dua dimensi untuk menghasilkan citra akan dipengaruhi oleh bermacam-macam faktor yang mengakibatkan penampilan citra suatu benda tidak sama persis dengan bentuk fisik nyatanya. Faktorfaktor tersebut merupakan efek degradasi atau penurunan kualitas yang dapat berupa rentang kontras benda yang terlalu sempit atau terlalu lebar, distorsi geometrik, kekaburan (blur), kekaburan akibat obyek yang bergerak (motion blur), noise atau

bersifat biner untuk membedakan 2 keadaan tentu tidak sama citra dengan informasi yang lebih kompleks sehingga memerlukan lebih banyak keadaan yang diwakilinya. Pada citra digital semua informasi tadi disimpan dalam bentuk angka, sedangkan penampilan angka tersebut biasanya dikaitkan dengan warna. Citra digital (digital image) adalah citra kontinyu f(x,y) yang sudah didiskritkan baik koordinat spasial maupun tingkat kecerahannya. Setiap titik biasanya memiliki koordinat sesuai dengan posisinya dalam citra. Koordinat ini biasanya dinyatakan indeks x dan y hanya bernilai bilangan bulat positif, yang dapat dimulai dari 0 atau 1. Citra digital yang selanjutnya akan disingkat citra sebagai matrik ukuran M x N yang baris dan kolomnya menunjukkan titik-titiknya yang diperlihatkan pada persamaan sebagai berikut :
( ) ( ( ( ( ) ) ) ( ( ( ) ) ) ( ( ( ) ) )

sebagai RGB color yang nantinya akan membentuk citra warna.

2.3. Histogram
Kata histogram berasal dari bahasa Yunani: histos dan gramma. Pertama kali digunakan oleh Karl Pearson pada tahun 1895 untuk memetakan distribusi frekuensi dengan luasan area grafis batangan menunjukkan proporsi banyak frekuensi yang terjadi pada tiap kategori. Histogram citra adalah grafik yang menggambarkan penyebaran nilai-nilai intensitas pixel dari suatu citra atau bagian tertentu di dalam citra. Histogram juga dapat menunjukkan banyak hal tentang kecerahan (brightness) dan kontras (contrast) dari sebuah gambar. Secara grafis histogram ditampilkan dengan diagram batang Misal citra digital memiliki L derajat keabuan. (misalnya citra dengan kuantisasi derajat keabuan 8bit, nilai derajat keabuan dari 0 255) secara matematis dapat dihitung dengan rumus :

Setiap titik juga memiliki nilai berupa angka digital yang merepresentasikan informasi yang diwakili titk tersebut. Format nilai piksel sama dengan format citra keseluruhan. Pada kebanyakan sistem pencitraan, nilai ini biasanya berupa bilangan bulat positif.

Dimana ni = jumlah pixel yang memiliki derajat keabuan i dan n = jumlah seluruh pixel di dalam citra Sebagai contoh, berikut merupakan matrik citra berukuran 8 x 8 dengan derajat keabuan dari 0 sampai 15 ( ada 16 buah derajat keabuan).

2.2. Representasi Citra Digital


Komputer dapat mengolah isyarat-isyarat elektronik digital yang merupakan kumpulan sinyal biner (bernilai dua: 0 dan 1). Untuk itu, citra digital harus mempunyai format tertentu yang sesuai sehingga dapat merepresentasikan obyek pencitraan dalam bentuk kombinasi data biner. Citra yang tidak berwarna atau hitam putih dikenal sebagai citra dengan derajat abu-abu (citra graylevel/grayscale). Derajat abu-abu yang dimiliki ini bisa beragam mulai dari 2 derajat abu-abu (yaitu 0 dan 1) yang dikenal juga sebagai citra monochrome, 16 derajat keabuan dan 256 derajat keabuan. Dalam sebuah citra monochrome, sebuah piksel diwakili oleh 1 bit data yang berisikan data tentang derajat keabuan yang dimiliki piksel tersebut. Data akan berisi 0 bila piksel berwarna hitam dan 1 bila piksel berwarna putih. Citra yang memiliki 16 derajat keabuan (mulai dari 0 yang mewakili warna hitam sampai dengan 15 yang mewakili warna putih) direpresentasikan oleh 4 bit data. Sedangkan citra dengan 256 derajat keabuan (nilai dari 0 yang mewakili warna hitam sampai dengan 255 yang mewakili warna putih) direpresentasikan oleh 8 bit data. Dalam citra berwarna, jumlah warna bisa beragam mulai dari 16, 256, 65536 atau 16 juta warna yang masing-masing direpresentasikan oleh 4,8,16 atau 24 bit data untuk setiap pikselnya. Warna yang ada terdiri dari 3 komponen utama yaitu nilai merah (red), nilai hijau (green) dan nilai biru (blue). Paduan ketiga komponen utama pembentuk warna tersebut dikenal

3 2 14 12 0 4 15 2

7 0 6 12 2 5 13 1

7 8 0 0 5 9 11 8 3 4 0 0 11 10 0 10

10 1 8 8 5 1 9 11

12 8 10 10 13 0 9 14

14 15 9 11 10 2 8 13

10 15 12 1 14 2 7 12

Data citra digital di atas kemudian hitung distribusi frekuensi dari data citra digital tersebut dan nilai histogram yang kemudian akan dipakai untuk perhitungan similarity. Tabel 1 merupakan tabel distribusi frekuensi dan nilai similarity dari data citra digital diatas. Untuk dapat melakukan perhitungan distribusi frekuensi dan perhitungan nilai histogram, dikembangkan algoritma untuk melakukan hal tersebut. Berikut merupakan algoritma histogram :

Algoritma histogram(A,int N,int M) /* A= array citra N,M =panjang, lebar citra */ /* inisialisasi Hist[0..255] dengan 0 */ for (i=0; i<=255; i++) Hist[i]=0 Endfor /* mencacah frekuensi kemunculan */ for(k=0;k<=255;k++) for (i=0; i<=N-1; i++) for (j=0; j<=M-1; j++) if (A[j,k]==i-1) Hist[i]=Hist[i]+1 endif endfor endfor endfor /*normalisasi Hist[i] dengan jumlah seluruh pixel */ n=N*M //n = adalah jumlah pikel image for (i=0; i<=255; i++) Hist[i]=Hist[i]/n endfor

Nilai euclidean distance merupakan nilai kemiripan citra digital. Semakin dekat (mendekati nilai 0) semakin mirip citra digital tersebut.

III. METODE
Dalam menyelesaikan permasalahan ekstraksi dan perhitungan nilai similarity dikembangkan perangat lunak untuk menghitung dan meng-generate histogram berdasarkan algoritma yang dikembangkan diatas. Kemudian nilai histogram tersebut diolah kembali untuk menghasilkan nilai similarity dari citra digital tersebut. Proses diawali dengan pembacaan dua citra digital *.jpg, *.bmp, *.png, *.tif'. kemudian dari pembacaan file tersebut data diolah untuk meng-generate histogram dengan algoritma yang dikembangkan dan perhitungan nilai similarity dengan menggunakan metode euclidean distance untuk menghasilkan nilai similarity.

2.4. Pengukuran Kemiripan Citra Digital dengan Teknik Euclidean distance dalam Ruang Vektor
Dalam matematika, euclidean distance atau adalah jarak antara dua titik yang dapat diukur dan dihasilkan oleh formula pytagoras. Euclidean vector atau sering hanya disebut dengan vector adalah obyek geometri yang memiliki panjang (magnitude) dan arah (direction). Sedangkan ruang vektor adalah sebuah structur matematika yang dibentuk oleh sekumpulan vektor. Vektor-vektor tersebut dapat ditambahkan, dikalikan dengan bilangan real dan lain-lain. Gambar 1 merupakan contoh dari ruang vektor, pada ruang vektor tersebut terdapat 2 vektor yaitu vektor A dan vektor B. Untuk menghitung jarak antara vektor A dan vektor B digunakan persamaan euclidean distance. Berikut merupakan penyelesaian dalam menghitung jarak antara vektor A dan vektor B. Panjang vektor A dan B dapat didefinisikan sebagai berikut:

IV. IMPLEMENTASI DAN PENGUJIAN


4.1. Implementasi
Pada tahap ini dilakukan pengembangan perangkat lunak untuk menghitung kemiripan citra digital. Citra digital yang dapat dihitung kemiripan dalam perangkat lunak ini adalah sinyal suara berformat *.jpg, *.bmp, *.png, *.tif'. Dalam melakukan analisis sinyal suara, penulis menggunakan tools yang banyak dipakai untuk visualisasi data-data yaitu dengan menggunakan Matlab. [gambar,letak]=uigetfile({'*.jpg';'*.bm p';'*.png';'*.tif'},'Pilih Gambar'); asli1=imread([letak, gambar]); asli1=imresize(asli1,[600 800]); Potongan kode program tersebut merupakan proses pembacaan file citra digital yang kemudian di standarisasi ukurannya menjadi (600x800). [Hist1, dataHist1]=Histogram(asli1); axes(handles.axes3); bar(dataHist1,'DisplayName','dataHist1' ); Pada proses ini, dilakukan perhitungan nilai histogram dan meng-generate histogram dari citra. Proses perhitungan ini dilakukan pada fungsi Histogram sim=sum(abs(Hist2-Hist1)); set(proyek.text2,'String',sim); Dalam kode ini, dilakukan proses perhitungan nilai similarity. Perhitungan ini hanya mencari jumlah dari selisih nilai-nilai histogram yang bersesuaian karena vektor yang terbentuk dari citra digital adalah vektor satu dimensi.

Dengan demikian, untuk menghitung jarak antara kedua vektor tersebut menggunakan persamaan sebagai berikut : ( ) ( ) ( )

Sedangkan untuk n dimensi ruang vektor, jarak euclidean distance ditentukan dengan menggunakan persamaan sebagai berikut : ( ) ( ) ( ) ( )

Akan tetapi dalam implementasi pada makalah ini hanya menggunakan perhitungan euclidean distance pada ruang vektor 2 dimensi.

4.2. Pengujian
Untuk dapat membuktikan keakuratan metode ini, penulis menguji dengan membandingkan dua file

*.jpg dan membandingkan satu file *.jpg dengan dirinya sendiri. Setelah dilakukan pengujian hasil dari perbandingan antara dua file *.jpg menghasilkan nilai 1,03863 dan hasil perbandingan antara satu file *.jpg dengan dirinya sendiri menghasilkan nilai 0. Nilai nol merupakan nilai similarity yang dihasilkan apabila satu file *.wav dibandingkan dengan dirinya sendiri (identik). Gambar 3 dan 4 menunjukan hasil perhitungan nilai similarity.

V. KESIMPULAN
Histogram merupakan representasi grafik dari persebaran nilai derajat keabuan dari sebuah citra digital. Euclidean distance merupakan teknik berbasis vektor space yang dapat digunakan untuk menghitung nilai similarity dari dua sinyal digital yang dibandingkan. Perhitungan similarity dengan menggunakan teknik histogram akan bernilai mendekati 0 pada gambar yang sama meskipun gambar dibalik sekalipun.

Gambar 1 : Vektor space 2 dimensi

DAFTAR PUSTAKA
Lu, Guojun. 1963. Multimedia Database Manajemen Systems. Artech House: Norwood Supatman. 2009. Deteksi Pembesaran Kelenjar Getah Bening pada Paru dengan Pengolahan Citra Digital untuk Mendiagnosa Penyakit Primer Kompleks Tuberkulosis (PKTB). Seminar Nasional Aplikasi Teknologi Informasi 2009 (SNATI 2009) Jurusan Teknik Informatika, Fakultas Teknologi Industri, Universitas Islam Indonesia Yogyakarta. Istachotil Jannah, Suci. (2010) Implementasi Fungsi Histogram Equalization pada Matlab Munir, Rinaldi. 2005. Pengolahan Citra Digital Dengan Pendekatan Algoritmik Bandung: Informatika.

Gambar 2 : Flow Chart Perangkat Lunak

Tabel 1: Distribusi Frekuensi dari Citra Digital ni 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 8 4 5 2 2 3 1 3 6 3 7 4 5 3 4 3 Hi=ni/n (n=64) 0.125 0.0625 0.078125 0.03125 0.03125 0.046875 0.015625 0.0156875 0.09375 0.046875 0.109375 0.0625 0.078125 0.046875 0.0625 0.046875

Gambar 3 : Hasil perhitungan pada dua gambar berbeda

Gambar 4 : Hasil perhitungan pada dua gambar yang sama