Anda di halaman 1dari 9

Penggunaan Color Histogram Dalam Image Retrieval

Yanu Widodo
yanuwid@gmail.com

Lisensi Dokumen:
Copyright ' ())*-())+ #lmuKomputer.Com ,eluruh dokumen di #lmuKomputer.Com dapat digunakan, dimodifikasi dan disebarkan secara bebas untuk tujuan bukan komersial (nonprofit , dengan syarat tidak menghapus atau merubah atribut penulis dan pernyataan copyright yang disertakan dalam setiap dokumen. Tidak diperbolehkan melakukan penulisan ulang, kecuali mendapatkan ijin terlebih dahulu dari #lmuKomputer.Com.

Koleksi-koleksi gambar digital di bidang perdagangan, pemerintahan, akademik, dan rumah sakit jumlahnya semakin banyak. Koleksi tersebut merupakan hasil digitalisasi foto-foto analog, diagram-diagram, lukisan-lukisan, gambar-gambar, dan buku-buku. Cara yang biasa dipakai untuk mencari koleksi tersebut adalah menggunakan metadata, seperti tag, caption, atau keywords. Tentu saja cara ini tidak praktis, melelahkan, dan juga mahal karena masih menggunakan tenaga manusia untuk mendeskripsikan gambar dalam database. Tulisan ini membahas informasi umum tentang penggunaan histogram warna (color histogram , dalam pencarian gambar (image retrie!al .

1. Pendahuluan
Content-based image retrie!al (C"#$ , adalah suatu aplikasi computer !ision yang digunakan untuk melakukan pencarian gambar-gambar digital pada suatu database. Yang dimaksud dengan %Content-based% di sini adalah: bahwa yang dianalisa dalam proses pencarian itu adalah actual contents (kandungan aktual) sebuah gambar. Istilah content pada konteks ini merujuk pada warna, bentuk, tekstur, atau informasi lain yang didapatkan dari gambar tersebut. !" #roses umum dari $%I& adalah pada gambar yang menjadi 'uery dilakukan proses ekstraksi feature (image contents , begitu halnya dengan gambar yang ada pada sekumpulan gambar juga dilakukan proses seperti pada gambar 'uery. #arameter feature gambar yang dapat digunakan untuk retrie(al pada system ini dapat berupa histogram, susunan warna, teksture, dan shape, tipe spesifik dari obyek, tipe e!ent tertentu, nama indi(idu, lokasi, emosi )"

2. Fitur Warna
*elain bentuk dan te+tur, warna merupakan salah satu image contents yang sering digunakan pada kebanyakan sistem $%I&. ,odel warna (color model adalah
Komunitas e&earning #lmuKomputer.Com Copyright ' ())*-())+ #lmuKomputer.Com

sebuah cara untuk merepresentasikan warna yang diindera manusia dalam komputasi. ,odel warna yang digunakan saat ini dapat digolongkan ke dalam dua kategori: hardware-oriented dan user-oriented. ,odel warna hardware-oriented banyak digunakan untuk warna alat-alat. ,isalnya model warna &-% (red, green, blue), biasa digunakan untuk warna monitor dan kamera. ,odel warna $,Y (cyan, magenta, yellow), digunakan untuk warna printer. dan warna YI/ digunakan untuk penyiaran t( warna. *edangkan model warna yang user-oriented termasuk 01*, 0$2, 0*2, ,3,, dan $I4-152, didasarkan pada tiga persepsi manusia tentang warna, yaitu hue (keragaman warna), saturation (kejenuhan), dan brightness (kecerahan) 6". %erikut penjenjelasan ringkas tentang berbagai macam model atau format warna: a) Format warna RGB 7ormat ini digunakan untuk menghasilkan warna di monitor dan tele(isi tabung yang menggunankan gelombang elektromagnetik. *ebuah titik ditembak dengan spektrum &, - dan %. ! Format warna H"# atau H"I atau H"$ 7ormat ini merupakan format warna alamiah dengan mempertimbangkan bahwa spektrum warna adalah sebuah koordinat polar seperti warna pantulan yang jatuh di mata manusia. 7ormat ini sangat baik untuk membedakan warna-warna yang 8terlihat8. %! Format warna CI& 7ormat warna ini adalah (arians dari &-% dengan normalisasi spektrum, sehingga sifat orthogonalitas dari masing-masing komponen warna lebih dijamin. 79rmat ini merupakan standard dalam /%I$ d! Format warna YCrC 7ormat warna ini disebut juga dengan warna chrominant. 7ormat ini banyak digunakan dalam skin-detection. e! Format warna C'Y( 7ormat warna ini adalah penghasil warna pada cat atau tinta. 7ormat warna ini yang digunakan oleh mesin cetak.

2.1. H"# dan RGB


,odel warna &-% merupakan yang paling banyak digunakan pada sistem $%I&. #ada model ini, warna direpresentasikan menjadi tiga warna primer, yaitu: red, green, dan blue :". ;ilai masing-masing warna primer itu berkisar antara < - =>>. *edangkan 0*2 (hue, saturation, (alue) merupakan model warna yang diturunkan dari &-%. 1iteratur ?" menunjukkan bahwa performa 0*2 ternyata lebih baik dalam membedakan warna jika dibandingkan dengan &-%. %erikut ini rumus mengkon(ersi nilai-nilai &-% menjadi 0*2 !=": &umus untuk menentukan h:

Komunitas e&earning #lmuKomputer.Com Copyright ' ())*-())+ #lmuKomputer.Com

&umus untuk menentukan s:

&umus untuk menentukan (: ( @ ma+

3. Color Histogram
Color histogram adalah representasi distribusi warna dalam sebuah gambar yang didapatkan dengan menghitung jumlah pi+el dari setiap bagian range warna, secara tipikal dalam dua dimensi atau tiga dimensi :". ,isalnya ada sebuah gambar berukuran A+A pi+el dengan nilai &-% sebagai berikut: (!,!,!) (!,=,<) (!,=,<) (!,!,<) (=,!,<) (=,A,!) (A,=,!) (=,=,!) (=,!,<) %ila yang digunakan adalah format 0(r,g,b) dimulai dari 0(<,<,<) sBd 0(A,A,A) , maka histogram gambar tersebut adalah sebagai berikut : 0(<,<,<)@< 0(<,<,!)@< 0(<,<,=)@< 0(<,<,A)@< 0(<,!,<)@< 0(<,!,!)@< 0(<,!,=)@< 0(<,!,A)@< 0(<,=,<)@< 0(<,=,!)@< 0(<,=,=)@< 0(<,=,A)@< 0(<,A,<)@< 0(<,A,!)@< 0(<,A,=)@< 0(<,A,A)@< 0(!,<,<)@< 0(!,<,!)@< 0(!,<,=)@< 0(!,<,A)@< 0(!,!,<)@! 0(!,!,!)@! 0(!,!,=)@< 0(!,!,A)@< 0(!,=,<)@! 0(!,=,!)@< 0(!,=,=)@< 0(!,=,A)@< 0(!,A,<)@< 0(!,A,!)@< 0(!,A,=)@< 0(!,A,A)@< 0(=,<,<)@< 0(=,<,!)@< 0(=,<,=)@< 0(=,<,A)@< 0(=,!,<)@= 0(=,!,!)@< 0(=,!,=)@< 0(=,!,A)@< 0(=,=,<)@< 0(=,=,!)@! 0(=,=,=)@< 0(=,=,A)@< 0(=,A,<)@< 0(=,A,!)@! 0(=,A,=)@< 0(=,A,A)@< 0(A,<,<)@< 0(A,<,!)@< 0(A,<,=)@< 0(A,<,A)@< 0(A,!,<)@< 0(A,!,!)@< 0(A,!,=)@< 0(A,!,A)@< 0(A,=,<)@< 0(A,=,!)@! 0(A,=,=)@< 0(A,=,A)@< 0(A,A,<)@< 0(A,A,!)@< 0(A,A,=)@< 0(A,A,A)@< Cika ditulis, histogram dari data-data diatas adalah: 0 @ D<, <, <, <, <, <, <, <, <, <, <, <, <, <, <, <, <, <, <, <, !, !, <, <, !, <, <, <, <, <, <, <, =, <, <, <, <, !, <, <, <, !, <, <, <, <, <, <, <, <, <, <, <, <, <, <, <, !, <, <, <, <, <, <E

Komunitas e&earning #lmuKomputer.Com Copyright ' ())*-())+ #lmuKomputer.Com

3.1. Color Quantization


Falam pembuatan histogram, nilai &-% yang punya range dari < sampai =>> akan punya kemungkinan kombinasi warna sebesar !G666=!G (didapat dari: =>> + =>> + =>>). #ada proses komputasi, tentu saja ini proses yang menghabiskan banyak waktu (time consuming . ,asalah tersebut dapat diatasi dengan color -uanti.ation (kuantisasi warna), yaitu suatu prosedur untuk mengurangi kemungkinan jumlah warna. Fengan cara ini, jumlah warna yang besar tadi bisa dikurangi, sehingga proses yang dibutuhkan akan semakin mudah. *eperti dijelaskan dalam literatur 6", misalnya nilai sebuah pi+el &-% adalah (=G<, =<<, !><). ,aka setelah melalui kuantisasi menjadi G? warna, misalnya, range &: <-A, range -: <-A, dan range %: <-A, nilai itu menjadi (=G< H ?B=>>, =<< H ?B=>>, !>< H ?B=>>) atau (A,A,= ).

-ambar =.!: -ambar %erwarna IJI dan 0istogramnya $olour ;umber of #i+els (<,<,<) =A? (<,<,!) =A (<,<,=) ?6: ... ... ... ... ... ... (A,A,A) A?=) 3abel =.!: $olor 0istogram gambar IJI -ambar =.! dan tabel =.! menunjukkan bahwa gambar IJI yang telah melalui proses kuantisasi menjadi G? warna. *esuai dengan distribusi warna pada tiap pi+el, color histogram gambar IJI adalah sebagai berikut: 0J @ D=A?, =A, ?6:, ..., A?=)E.

Komunitas e&earning #lmuKomputer.Com Copyright ' ())*-())+ #lmuKomputer.Com

).2. *ormalisasi
#enggunaan nilai-nilai aktual distribusi warna pada distogram, membuat untuk dipahami. ;amun pemakaian dengan cara ini akan menimbulkan masalah jika diterapkan pada gambar yang mempunyai ukuran berbeda namun seebenarnya mempunyai distribusi warna yang sama 6". *ebagai contoh, misalnya ada A gambar dengan ukuran berbeda yang terkuantisasi menjadi = warna (hitam dan putih) - lihat gambar =.=

-ambar =.=: 5kuran beda, tapi distribusi warna sama 0istogram A gambar ini adalah: 0J @ D=><<,=><<E 0% @ D>G=>, >G=>E 0$ @ D!<<<<,!<<<E *eperti dilihat, meskipun ketiga gambar tadi mempunyai distribusi warna yang sama, tapi mempunyai histogram yang berbeda. Ini dikarenakan perbedaan ukuran gambar (dan tentu saja jumlah pi+el). 9leh karena itu, untuk membuat histogram tetap sama pada gambar yang mempunyai kesamaan distribusi warna, maka diperlukan suatu normalisasi histogram. Jlih-alih menggunakan jumlah aktual, lebih baik menggunakan persentase pembagian jumlah aktual dengan jumlah total pi+el gambar yang digunakan color histogram. Fengan cara ini, selama distribusi warna pada gambar sama, histogram warnanya akan sama, tidak tergantung lagi pada ukuran gambar. %erikut adalah hasil histogram warna pada gambar = yang sudah ternormalisasi: HA = {50%, 50%} HB = {50%, 50%} HC = {50%, 50%}

4. Content Based Image Retrieval


Content "ased #mage $etrie!al ,ystem ($%I&) merupakan suatu teknik pencarian kembali gambar yang mempunyai kemiripan karakteristik atau content dari sekumpulan gambar. #roses umum dari $%I& adalah gambar yang menjadi 'uery dilakukan proses ekstraksi fitur, begitu halnya dengan gambar yang ada pada

Komunitas e&earning #lmuKomputer.Com Copyright ' ())*-())+ #lmuKomputer.Com

>

sekumpulan gambar juga dilakukan proses seperti pada gambar 'uery. 7itur gambar yang dapat digunakan untuk retrie(al pada system ini misalnya histogram, susunan warna, teksture, dan shape, tipe spesifik dari obyek, tipe e(ent tertentu, nama indi(idu, lokasi, emosi )". 7okus pembahasan pada bagian ini adalah penggunaan color histogram pada image retrie!al.

+.1. Pengu,uran -ara, .ntar Dua Histogram


7itur warna merupakan fitur yang paling banyak digunakan pada sistem $%I&. %anyak diantaranya mengunakan image color histogram. Color histogram antara dua gambar tadi kemudian dihitung jaraknya. -ambar yang memiliki jarak paling kecil, merupakan solusinya. *ebagai penjelasan, dimisalkan ada dua gambar dengan histogram ? warna yang sudah terkuantisasi sebagai berikut: 0J @ D=<K, A<K, !<K, ?<KE 0% @ D!<K, !<K, ><K, A<KE 1iteratur 6" menyebutkan cara termudah untuk menghitungnya, yaitu dengan dengan menggunakan rumus:

Cika nilai = histogram tersebut dimasukkan ke dalam rumus diatas, maka hasilnya adalah sebagai berikut: d(/," @ L<.= - <.!L M L<.A - <.!L M L<.! - <.>L M L<.? - <.AL @ <.: $ara lain untuk melakukan perhitungan jarak antar dua histogram adalah menggunakan rumus jarak 4uclidan. &umusnya:

Cika nilai dua histogram diatas dimasukkan ke dalam rumus, maka hasilnya adalah sebagai berikut: d(/," 0

<.= <.! = <.A <.! = <.! <.> = <.? <.A = @ <.?6


j =!

4.2. Colour Histogram !"e


0istogram warna terdiri dari dua tipe, 1lobal colour histograms (#CHs dan &ocal colour histograms (LCHs . #ada penggunaan -$0, distribusi warna global suatu gambar diambil dan digunakan sebagai metada. Cika pengguna mencari gambar dengan yang dalam sistem databasenya hanya memperhatikan distribusi warna global suatu gambar, memang, -$0 adalah pilihan terbaik. Nalaupun demikian, karena -$0 hanya mengambil distribusi warna global suatu gambar sebagai pertimbangan untuk membandingkan gambar, ini bisa mengembalikan hasil yang tidak sesuai dengan persepsi (isual 6".

Komunitas e&earning #lmuKomputer.Com Copyright ' ())*-())+ #lmuKomputer.Com

,isalkan ada tiga gambar yang telah dikuantisasi menjadi tiga warna: hitam, abu-abu, dan putih (gambar ?.A). ,isalkan gambar J adalah 'uery image, sedangkan gambar % dan $ adalah gambar-gambar dalam database.

-ambar =.A: 3iga gambar yang terkuantisasi menjadi A warna Image J % $ 0itam Jbu-abu A6.>K A6.>K A!.=>K A6.>K A6.>K A6.>K 3abel =.=: -$0 #mage J, %, dan $ #utih =>K A!.=>K =>K

*edangkan Fistribusi warna (-$0) tiga gambar diatas adalah seperti pada tabel. ,aka, jarak antara gambar J dengan gambar % dan $ adalah: d(/," @ L<.A6> - <.A!=>L M L<.A6> - <.A6>L M L<.=>-<.A!=>L @ <.!=> d(/,C @ L<.A6> - <.A6>L M L<.A6> - <.A6>L M L<.=> - <.=>L @ < Fari hasil pembandingan, gambar $ ternyata ditemukan lebih mirip daripada gambar % (karena jarak $ lebih kecil). #adahal, sesuai dengan persepsi, yang lebih mirip dengan gambar J sebenarnya adalah gambar % 6". -$0 merepresentasikan keseluruhan bagian gambar dengan satu histogram. *edangkan 1$0 membagi gambar menjadi beberapa bagian dan kemudian mengambil histogram warna tiap bagian tadi. 1$0 memang berisi lebih banyak informasi tentang gambar, namun metode ini membutuhkan lebih banyak proses komputasi !<, !!".

/.

Penutu0

Falam praktiknya, pencarian dengan $%I& ternyata tidak hanya melibatkan satu atau dua gambar saja, namun melibatkan lebih banyak lagi (ratusan atau lebih). 9leh karena itu, untuk lebih mempercepat proses pencarian, gambar-gambar tadi dikelompokkan terlebih dahulu menjadi bebarapa cluster berdasarkan kesamaan histogramnya (clustering . 3eknik clustering ini bisa menggunakan algoritma O-,eans, Jlgoritma -enetika, 7-OJ =" dan sebagainya . *elanjutnya, pencarian dapat dilakukan dengan membandingkan histogram sample gambar dengan nilai-nilai pusat cluster (centroid) tersebut. 1. Re2erensi
!" Jnonym, I$ontent-based basedPimagePretrie(al image retrie(al,I http:BBen.wikipedia.orgBwikiB$ontent-

=" 4ntin ,artiana, Q#erbaikan Oinerja Jlgoritma Olusterisasi O-,eans -enetika,R 73I7I3*.
Komunitas e&earning #lmuKomputer.Com Copyright ' ())*-())+ #lmuKomputer.Com

A" Yi 1u, *hiyong 1u, 7arshad 7otouhi, Youping Feng, and *usan %rown, I7ast -enetic O-means Jlgorithm and its Jpplication in -ene 4+pression Fata Jnalysis,I 3echnical &eport 3&-F%-<G-=<<A, Fepartment of $omputer *cience, Nayne *tate 5ni(ersity, Cune, =<<A. ?" Nen $hen, Yun /. *hi, and -uorong Suan, IIdentifying $omputer -raphics 5sing 0*2 $olor ,odel and *tatistical ,oments of $haracteristic 7unctions,I tanpa tahun. >" -edhe Niryana Nardana, IImage $lustering %erdasarkan Narna 5ntuk Identifikasi %uah dengan ,etode 0ill $limbing,ICurusan 3eknologi Informasi, #oliteknik 4lektronika ;egeri *urabaya - Institut 3eknologi *epuluh ;opember, =<<6. G" 0elmy 0asniawati, IImage $lustering %erdasarkan Narna 5ntuk Identifikasi %uah dengan ,etode 2alley 3racing,I Curusan 3eknologi Informasi, #oliteknik 4lektronika ;egeri *urabaya - Institut 3eknologi *epuluh ;opember, =<<6. 6" Yue Thang, I9n the use of $%I& in Image ,osaic -eneration,I Fepartment of $omputing *cience, 5ni(ersity of Jlberta, 4dmonton, Jlberta, $anada , =<<=. :" Jnonym, I$olor histogram,I http:BBen.wikipedia.orgBwikiB$olorPhistogram. )" %ayu %agus, IImage Fatabase ,enggunakan *istem $ontent %ased Image &etrie(al dengan 4kstraksi 7itur 3erstuktur,I Curusan 3eknologi Informasi, #oliteknik 4lektronika ;egeri *urabaya - Institut 3eknologi *epuluh ;opember, =<<6. !<"*hengjiu Nang, QJ &obust $%I& Jpproach 5sing 1ocal $olor 0istograms,R Fepartment of $omputer *cience, 5ni(ersity of Jlberta, 4dmonton, Jlberta, $anada, 3ech. &ep. 3& <!-!A, 9ctober =<<!. !!"&ami Jl-3ayeche dan Jhmed Ohalil, I$%I&: $ontent %ased Image &etrie(al,I Fepartment of *ystems and $omputer 4ngineering, 7aculty of 4ngineering, $arleton 5ni(ersity, =<<A. !=" 0*1 and 0*2, http:BBen.wikipedia.orgBwikiB0*1PandP0*2

Komunitas e&earning #lmuKomputer.Com Copyright ' ())*-())+ #lmuKomputer.Com

Biogra2i Penulis
Yanu Nidodo, lahir di 3ulungagung pada tahun !):!. ,enekuni ilmu permesinan saat masih sekolah di *3, ;egeri 3ulungagung. *etelah lulus pada tahun !))), lalu melanjutkan ke 3eknik #erancangan dan Oonstruksi di #oliteknik #erkapalan ;egeri *urabaya, Institut 3eknologi *epuluh ;opember (##;*-I3*). #enasaran dengan dunia elektronika dan komputer, lalu pada tahun =<<! hingga =<<> belajar 3eknik Oomputer Oontrol di Curusan 3eknik 4lektro I3*. *elepas bekerja di 9ptical Fisc Fri(e Fepartment, #3. #anasonic *hikoku 4lectronics %atam (#*4$%), pada pertengahan tahun =<<G lalu mendalami pengetahuan bidang 3eknologi Informasi di #oliteknik 4lektronika ;egeri *urabaya (#4;*I3*). *etelah mendapatkan gelar *arjana *ains 3erapan (*.*3) pada bulan september =<<:, lalu bekerja di %ali$amp.

Komunitas e&earning #lmuKomputer.Com Copyright ' ())*-())+ #lmuKomputer.Com

Anda mungkin juga menyukai