Anda di halaman 1dari 5

Purwarupa Sistem Content Based Image Retrieval

untuk Pencarian Produk Sepatu

Baldri, Septia Rani, Izzati Muhimmah


Jurusan Informatika Fakultas Teknologi Industri
Universitas Islam Indonesia
Yogyakarta
baldriusman@gmail.com, septia.rani@uii.ac.id, izzati@uii.ac.id

Abstract—Di era teknologi informasi, salah satu proses yang dokumen yang berisi informasi yang relevan dengan query
penting dalam pengelolaan data yaitu adanya proses temu balik yang dimasukkan oleh pengguna.
informasi atau information retrieval (IR). Di dalam dunia nyata,
implementasi dari IR dapat ditemui pada mesin pencari seperti Dalam IR terdapat tempat penyimpanan dokumen-
situs google.com dan bing.com. Pada mesin pencari tersebut, dokumen dan pengguna akan merumuskan suatu pertanyaan
proses pencarian kebanyakan dilakukan dengan kata kunci atau (request atau query) yang jawabannya adalah himpunan
query berupa teks, namun ada juga beberapa yang sudah dokumen yang mengandung informasi yang diperlukan.
mendukung pencarian dengan query berupa gambar. Teknik Pengguna akan memperoleh dokumen-dokumen yang
untuk melakukan temu balik informasi berdasarkan gambar diperlukannya dengan membaca semua atau sebagian dokumen
dikenal juga dengan istilah content based image retrieval (CBIR). dalam tempat penyimpanan, menyimpan dokumen-dokumen
Dengan banyaknya situs e-commerce seperti sekarang ini, yang relevan, dan membuang dokumen lainnya. Di dalam
keberadaan fitur pencarian produk menjadi salah satu aspek dunia nyata, implementasi dari IR dapat ditemui pada mesin
yang penting. Pencarian berdasarkan query teks terkadang pencari seperti situs google.com dan bing.com.
kurang memuaskan karena seringkali pengguna kesulitan untuk
mendeskripsikan produk yang dicari. Salah satu alternatif Pada mesin pencari, proses pencarian kebanyakan
solusinya adalah melakukan pencarian produk berdasarkan dilakukan dengan query berupa teks, namun ada juga beberapa
query gambar. Dalam penelitian ini penulis mengembangkan yang sudah mendukung proses pencarian berupa gambar.
sebuah purwarupa sistem CBIR untuk pencarian produk sepatu. Terkadang pencarian menggunakan query yang berbentuk teks
Query berupa citra sepatu akan dimasukkan oleh pengguna ke saja tidak cukup. Terlebih jika pengguna ingin mencari produk
dalam sistem. Selanjutnya citra query ini akan mengalami proses seperti baju atau sepatu yang memiliki jumlah variasi model
ekstraksi fitur bentuk, warna, dan tekstur untuk menemukan yang sangat banyak di sebuah situs e-commerce, seringkali
kesamaan terhadap citra-citra yang tersimpan dalam basis data. pengguna kesulitan untuk mendeskripsikan produk yang dicari.
Proses penemuan citra tersebut menggunakan perhitungan jarak Ditemui juga kasus bahwa pengguna telah memiliki citra dari
euclidean distance. produk yang dicari dan pengguna ingin mencari apakah produk
Beberapa skenario pengujian dilakukan untuk mengetahui tersebut (atau produk yang mirip) dimiliki oleh toko yang
performansi sistem. Berdasarkan hasil pengujian diperoleh nilai
dimaksud. Untuk kasus-kasus tersebut, pencarian
rata-rata presisi sebesar 81,33%.
menggunakan query berbentuk citra akan lebih sesuai
Kata kunci—content based image retrieval; produk sepatu; dibandingkan pencarian menggunakan query berbentuk teks.
ekstraksi fitur; euclidean distance Teknik untuk melakukan temu balik informasi berdasarkan isi
(content) dalam sebuah citra dikenal juga dengan istilah
content based image retrieval (CBIR).
I. PENDAHULUAN
Dalam penelitian ini penulis mengembangkan sebuah
Perkembangan teknologi informasi dan perluasan purwarupa sistem CBIR untuk pencarian produk sepatu. Ke
pemanfaatan teknologi komputer telah menjadikan komputer depannya sistem ini diharapkan dapat diimplementasikan pada
sebagai kebutuhan utama dalam pengelolaan berbagai data. situs e-commerce penjualan produk sepatu agar fitur pencarian
Peranan pokok teknologi informasi, terutama dalam hal produk menjadi lebih handal. Selanjutnya pembahasan pada
pengelolaan data telah mampu memberikan peningkatan makalah ini akan disajikan sebagai berikut. Pada bagian 2 akan
pendapatan, efektifitas, dan efisiensi yang lebih baik bagi dijelaskan mengenai kajian pustaka terkait dengan penelitian
perorangan, instansi, maupun pemerintah. Salah satu proses ini. Pada bagian 3 akan dijelaskan tentang metodologi yang
yang penting dalam pengelolaan data yaitu adanya proses digunakan. Di bagian 4 dipaparkan mengenai hasil dan
penemuan kembali informasi yang dibutuhkan oleh pengguna. pembahasan. Terakhir pada bagian 5 berisi kesimpulan dan
Proses ini disebut dengan istilah temu balik informasi atau saran untuk penelitian lebih lanjut.
information retrieval (IR). Tujuan dari IR adalah memberikan
II. KAJIAN PUSTAKA Adapun ciri-ciri atau fitur dasar dari gambar sebagai berikut:
• Bentuk
A. Content Based Image Retrieval Ciri bentuk suatu gambar dapat ditentukan oleh tepi
Temu kembali citra (image retrieval) merupakan proses (sketsa) atau besaran momen dari suatu gambar.
untuk mendapatkan sejumlah citra berdasarkan masukan satu Pemakaian besaran momen pada ciri bentuk ini banyak
buah citra. Istilah yang lebih spesifik lagi adalah content based digunakan orang dengan memanfaatkan nilai-nilai
image retrieval (CBIR) atau temu kembali citra berdasarkan transformasi fourier dari gambar. Proses yang dapat
isinya. CBIR adalah sebuah metode pencarian citra dengan digunakan untuk menentukan ciri bentuk adalah deteksi
melakukan perbandingan antara citra query dengan citra yang tepi, threshold, segmentasi dan perhitungan momen
ada di basis data berdasarkan informasi yang ada pada citra seperti (mean, median dan standar deviasi dari setiap
tersebut. Metode CBIR yang sering digunakan adalah lokal gambar).
pencarian berdasarkan kemiripan bentuk, warna, dan tekstur. • Warna
Ciri warna suatu gambar dapat dinyatakan dalam bentuk
Pada awalnya CBIR digunakan untuk pencarian citra secara histogram dari gambar tersebut yang dituliskan dengan: H
otomatis di dalam basis data yang didasarkan pada fitur bentuk (r,g,b), dimana H (r,g,b) adalah jumlah munculnya
dan warna. Sejak saat itu, bermunculan berbagai sistem CBIR. pasangan warna R (red), G (green) dan B (blue).
Contoh yang terkenal adalah Query By Image Content (QBIC) • Tekstur
yang dikembangkan IBM [1]. Pada perkembangan selanjutnya, Tekstur merupakan karakteristik intrinsik dari suatu citra
fitur tekstur juga dimasukkan sebagai bagian untuk melakukan yang terkait dengan tingkat kekasaran (roughness),
pencarian citra. Sistem CBIR secara umum dibangun dengan granularitas (granulation), dan keteraturan (regularity)
melihat karakteristik dari suatu gambar atau dengan kata lain susunan struktural piksel. Aspek tekstural dari sebuah
dengan melihat ciri dari gambar tersebut. Ciri merupakan suatu citra dapat dimanfaatkan sebagai dasar dari segmentasi,
tanda yang khas, yang membedakan antara satu gambar dengan klasifikasi, maupun interpretasi citra.
gambar yang lain. Pada dasarnya suatu gambar memiliki ciri-
ciri dasar yaitu: bentuk, warna, dan tekstur.
C. Perhitungan Kesamaan Antara Dua Citra
Prinsip sistem CBIR adalah melakukan perbandingan Pada pencarian citra, untuk merepresentasikan sebuah citra
antara citra query dengan citra yang ada di basis data. Dalam biasanya digunakan vektor fitur. Selanjutnya untuk
perbandingan tersebut, jenis dan banyaknya citra query yang menentukan kesamaan antara dua buah citra maka dapat
digunakan oleh peneliti sesuai dengan kepentingan dan digunakan pendekatan perhitungan jarak antara dua vektor fitur
kebutuhan masing-masing. Berikut ini beberapa penelitian citra tersebut. Tingkat kesamaan dinyatakan dengan suatu skor
sebelumnya yang terkait dengan topik pada penelitian ini. Azis atau ranking. Semakin kecil nilai ranking, semakin dekat
[2] mengembangkan sebuah sistem temu kembali citra berbasis kesamaan kedua vektor tersebut. Pengukuran jarak dilakukan
tekstur dan warna untuk objek citra kain. Ekstraksi ciri tekstur dengan beberapa cara. Metode yang sering digunakan yaitu
dilakukan dengan menerapkan metode ekstraksi ciri statik orde menggunakan jarak Euclidean. Jarak Euclidean [6]
dua, sedangkan untuk ciri warna menggunakan histogram didefinisikan dengan rumus (1).
HSV. Selain itu, ada juga Sadli [3] yang mengajukan sistem
image retrieval untuk citra bunga. Pada penelitiannya
digunakan histogram warna untuk pengindeksan warna citra
dan integrated region matching untuk memperhitungkan nilai
(1)
warna. Adapun penelitian CBIR dengan objek citra sepatu
pernah dilakukan oleh Ulinnuha dan Sa'dyah [4]. Pada metode Dalam hal ini, p dan q adalah dua vektor yang jaraknya akan
yang mereka ajukan digunakan prosedur pencarian dua fase dihitung dan n menyatakan dimensi vektor.
dengan fitur histogram multi tekston. Pada penelitian ini, akan
digunakan objek citra sepatu dengan metode ekstraksi fitur D. Recall dan Precision
warna menggunakan statistika warna, ekstraksi fitur bentuk
Pengukuran efektivitas suatu sistem temu kembali
menggunakan momen invariant, dan ekstraksi fitur tekstur
informasi dapat dilakukan dengan perhitungan terhadap nilai
menggunakan tekstur berbasis histogram. perolehan (recall) dan nilai ketepatan (precision). Recall
berhubungan dengan kemampuan sistem untuk memanggil
B. Ekstraksi Fitur dokumen yang relevan. Untuk menghitung nilai recall
Pada umumnya fitur dinyatakan dengan suatu tanda yang digunakan rumus (2).
khas, yang membedakan antara satu gambar dengan gambar
yang lain. Fitur-fitur suatu objek mempunyai peran penting
untuk berbagai aplikasi berikut [5]: (2)
• Pencarian citra: fitur dipakai untuk mencari objek-objek
tertentu yang berada di dalam basis data. Precision (presisi) dapat diartikan sebagai kecocokan antara
permintaan informasi dengan jawaban terhadap permintaan itu.
• Penyederhanaan dan hampiran bentuk: bentuk objek
Untuk menghitung nilai presisi digunakan rumus (3). Jumlah
dapat dinyatakan dengan representasi yang lebih ringkas.
yang besar dari dokumen yang relevan di dalam basis data
• Pengenalan dan klasifikasi: sejumlah fitur dipakai untuk
membuat recall sulit untuk dihitung. Oleh karena itu presisi
menentukan jenis objek.
lebih banyak digunakan untuk menilai keefektifan dalam
sebuah sistem temu balik informasi [7].

(3)

III. METODOLOGI
Pada penelitian ini, pertama-tama dilakukan pengumpulan
data yang akan disimpan menjadi basis data. Data yang
digunakan kurang lebih 100 citra sepatu yang terdiri dari dua
jenis yaitu sepatu pria dan sepatu wanita. Sepatu pria terdiri
dari tiga kategori, yaitu casual, formal, dan sandal. Sedangkan
untuk sepatu wanita terdiri dari tujuh kategori, yaitu sandal flat,
sandal hak, sepatu casual, sepatu formal, sepatu hak, dan
wedges. Sepatu difoto dari sisi samping dengan masing-masing
citra foto berukuran 300 x 300 piksel. Data sepatu diperoleh
dari salah satu website toko online penjualan produk sepatu.
Beberapa contoh data citra sepatu yang digunakan dapat dilihat
pada Gambar 1.
Tahap selanjutnya yaitu melakukan pemodelan sistem.
Rancangan alur sistem yang akan dibangun dapat dilihat pada
Gambar 2. Penjelasan alur sistem CBIR yang akan dibangun
adalah sebagai berikut:
• Pengguna terlebih dahulu memasukkan query yang berupa Gambar 2. Alur sistem secara umum
citra sepatu.
• Citra query tersebut diekstraksi. Dalam proses ekstraksi ada Metode yang digunakan untuk ekstraksi fitur bentuk yaitu
tiga fitur yang diambil yaitu fitur bentuk, warna, dan tekstur moment invariant yang memperhitungkan area objek. Momen
yang selanjutnya digabungkan menjadi sebuah vektor ciri. yang dihasilkan dapat mengatasi proses transformasi seperti
• Vektor ciri kemudian dinormalisasi sehingga dihasilkan translasi, dilatasi, dan rotasi citra. Dari hasil perhitungan sesuai
data fitur citra ternormalisasi. yang ada pada referensi [5] akan diperoleh tujuh buah nilai
• Untuk data citra yang tersimpan dalam basis data, sebagai ciri fitur bentuk. Untuk ekstraksi fitur warna,
dilakukan proses yang sama seperti citra query sehingga digunakan perhitungan statistika warna [5] pada setiap
untuk masing-masing citra akan direpresentasikan dalam komponen warna R, G, dan B. Karakteristik yang dihitung
vektor ciri. yaitu rerata, simpangan baku, skewness, dan kurtosis. Dari hasil
• Antara vektor ciri citra query dengan vektor ciri yang perhitungan akan diperoleh dua belas buah nilai sebagai ciri
tersimpan dalam basis data akan dibandingkan satu sama fitur warna. Adapun untuk ekstraksi fitur tekstur menggunakan
lain untuk mencari kesamaannya. Proses similarity metode tekstur berbasis histogram [5]. Perhitungan yang
matching ini menggunakan perhitungan Euclidean distance. dilakukan yaitu dengan mencari nilai rerata intensitas,
• Setelah proses pembandingan tersebut, akan terpilih simpangan baku, skewness, nilai energi (keseragaman), entropi,
beberapa citra dari basis data yang memiliki nilai vektor ciri dan tingkat kehalusan intensitas pada citra (smoothness). Dari
yang sama atau hampir sama dengan citra query. Citra-citra hasil perhitungan akan diperoleh enam buah nilai sebagai ciri
tersebut akan diurutkan dari yang paling kecil jaraknya fitur tekstur. Dengan demikian, dari hasil proses ekstraksi fitur
(paling mirip) kemudian ditampilkan ke pengguna sebagai secara keseluruhan, masing-masing citra akan
hasil pencarian. direpresentasikan menggunakan 25 nilai ciri/fitur.
Selain merancang alur sistem, dirancang juga antarmuka
sistem. Antarmuka sistem merupakan jembatan komunikasi
antara pengguna dengan sistem, sehingga sistem dapat lebih
mudah untuk digunakan. Rancangan antarmuka untuk sistem
temu kembali citra pencarian produk sepatu dapat dilihat pada
Gambar 3. Pada rancangan yang dibuat, pengguna dapat
memilih citra query dan memilih basis data yang akan
digunakan. Kemudian pada hasil pencarian hanya akan
ditampilkan sebanyak 10 buah citra yang paling mirip.
Setelah perancangan selesai dilakukan, selanjutnya sistem
diimplementasikan dengan menggunakan MATLAB R2013a.
Kemudian sistem CBIR akan diuji performansinya
Gambar 1. Contoh data sepatu yang digunakan menggunakan pendekatan perhitungan presisi.
kemudian diambil 10 citra dengan nilai jarak terkecil yang
berasal dari tiga kelompok yang terpilih tadi.
Setelah dilakukan percobaan dengan beberapa citra uji,
ternyata hasil pencarian menggunakan metode pengelompokan
dan mengambil dari tiga kelompok ini belum memberikan nilai
presisi yang bagus, yaitu rata-rata sebesar 61% dari sepuluh
kali percobaan pencarian. Maka dari itu selanjutnya dicoba
digunakan metode pengelompokan dengan mengambil dua
kelompok saja untuk diurutkan kembali. Pada proses
pengujian, digunakan data uji sejumlah 15 yang terdiri dari 10
data uji citra yang ada di dalam basis data dan 5 data uji citra
yang tidak ada di dalam basis data. Rekapitulasi hasil
pengujian dengan menggunakan metode ini dapat dilihat pada
Gambar 3. Rancangan antarmuka sistem Tabel I. Adapun salah satu contoh hasil pengujian dapat dilihat
pada Tabel II.
IV. HASIL DAN PEMBAHASAN
Pada Gambar 4 dapat dilihat contoh tampilan dari
purwarupa sistem temu kembali citra sepatu yang telah dibuat.
Pada tampilan tersebut, terdapat tombol “Set Database” yang
berfungsi untuk memilih basis data yang digunakan (basis data
dalam bentuk kumpulan citra sepatu yang disimpan dalam
sebuah folder), sekaligus akan dilakukan proses ekstraksi fitur
citra. Hasil ekstraksi fitur citra yang telah dinormalisasi
kemudian disimpan dalam file Excel. Contoh nilai fitur yang
tersimpan dalam file Excel dapat dilihat pada Gambar 5.
Banyaknya baris menyatakan banyaknya citra pada basis data,
sedangkan banyaknya kolom menyatakan banyaknya fitur citra
yang terdiri dari 7 kolom nilai fitur bentuk, 6 kolom nilai fitur
tekstur, dan 12 kolom nilai fitur warna. Tombol “Browse”
digunakan untuk memilih citra query, tombol “Search” untuk Gambar 4. Antarmuka sistem temu kembali citra sepatu
memulai proses similarity matching, kemudian tombol “Clear”
untuk menghapus kembali tampilan citra yang ada pada
purwarupa sistem.
Pada pengujian performansi sistem, pada awalnya
dilakukan dengan cara membandingkan satu citra query dengan
semua citra yang ada di basis data. Kemudian setelah dihitung
nilai jarak terhadap semua citra yang ada di basis data, nilai
tersebut diurutkan dari yang terkecil. Dari hasil pengurutan ini
dapat diketahui citra yang mirip dengan citra query. Namun
setelah dicoba dengan menggunakan metode ini, ternyata Gambar 5. Data hasil ekstraksi fitur yang tersimpan dalam file Excel
tingkat presisinya sangat rendah, yaitu rata-rata sebesar 34%
dari sepuluh kali percobaan pencarian. Berdasarkan hasil ini,
kemudian dilakukan modifikasi terhadap metode pencarian
yang digunakan, yaitu dengan melakukan pengelompokan
terlebih dahulu untuk membatasi ruang pencarian dalam basis
data. Ilustrasi dari metode pengelompokan yang digunakan
pada penelitian ini dapat dilihat pada Gambar 6.
Berdasarkan ilustrasi pada Gambar 6, pertama-tama
dilakukan pengelompokan pada 100 data citra yang ada dalam
basis data. Data tersebut dikelompokkan ke dalam 10
kelompok dengan masing-masing kelompok berisi 10 citra.
Setelah itu, citra query dibandingkan dengan semua citra yang
ada dalam basis data. Kemudian nilai jaraknya diurutkan secara
ascending (dari yang kecil ke besar). Dari pengurutan ini
didapatkan tiga nilai jarak yang terkecil. Jika tiga nilai jarak
tersebut masing-masing diperoleh dari citra yang berbeda
kelompok, maka semua nilai jarak yang ada dalam tiga
kelompok tersebut diurutkan kembali dari yang terkecil
Gambar 6. Ilustrasi metode pengelompokan pada pencarian citra
TABEL I. REKAPITULASI HASIL PENGUJIAN PERFORMANSI SISTEM Berdasarkan pengujian yang telah dilakukan, persentase
presisi sistem temu kembali citra sepatu yang dibangun
memiliki nilai 50% - 100%, dengan nilai rata-rata presisi
sebesar 81,33%. Hal ini menunjukkan bahwa sistem yang
dibangun sudah dapat memberikan hasil pencarian dengan
menampilkan citra-citra yang relevan. Meskipun demikian,
hasil pencarian akan sangat bergantung pada dua buah citra
yang memiliki nilai jarak paling kecil (paling mirip) terhadap
citra query. Jika berdasarkan penilaian objektif kedua buah
citra tersebut berada pada kelompok yang sama dengan citra
query, maka presisi hasil pencarian akan tinggi. Namun apabila
salah satu atau keduanya berada pada kelompok yang berbeda
dengan kelompok citra query yang sebenarnya maka sistem
dapat mengembalikan beberapa citra yang tidak relevan.

V. KESIMPULAN DAN SARAN


Pada penelitian ini sudah berhasil dibangun sebuah
purwarupa sistem content based image retrieval untuk
pencarian produk sepatu berdasarkan fitur bentuk, fitur warna,
dan fitur tekstur yang dimiliki oleh citra sepatu. Dari hasil
pengujian diperoleh nilai rata-rata presisi sistem yang dibangun
sebesar 81,33%. Hal ini menunjukkan bahwa sistem yang
TABEL II. CONTOH SALAH SATU HASIL PENCARIAN dibangun sudah dapat memberikan hasil pencarian dengan
menampilkan citra-citra yang relevan. Untuk ke depannya, data
citra yang digunakan sebagai basis data perlu ditambah lagi
jumlahnya. Selain itu juga perlu dieksplorasi pengaruh metode
ektraksi fitur yang berbeda terhadap tingkat presisi sistem.

REFERENSI
[1] M. Flickner, et al, “Query by image and video content: The QBIC
system,” Computer, vol. 28.9, 1995, pp.23-32.
[2] F. Azis, “Sistem temu kembali citra kain berbasis tekstur dan warna,”
Diss. Universitas Islam Negeri Sultan Syarief Kasim Riau, 2013.
[3] M. Sadli, "Image retrieval berdasarkan warna dan bentuk dengan metode
color histogram dan integrated region matching," Skripsi Sekolah Tinggi
Teknologi Indonesia Tanjungpinang, 2014.
[4] N. Ulinnuha dan H. Sa’dyah, “Sistem temu kembali citra untuk e-
commerce menggunakan prosedur pencarian dua fase dengan fitur
histogram multi tekston,” Systemic: Information System and Informatics
Journal, vol. 1.1, 2015, pp. 35-41.
[5] A. Kadir dan A. Susanto, “Teori dan aplikasi pengolahan citra,”
Yogyakarta: Andi, 2013.
[6] L.H. Lee, C.H. Wan, R. Rajkumar, and D. Isa, “An enhanced Support
Vector Machine classification framework by using Euclidean distance
function for text document categorization,” Applied Intelligence, vol.
37.1, 2012, pp. 80-99.
[7] J. Hasugian, “Penelusuran informasi ilmiah secara online: Perlakuan
terhadap seorang pencari informasi sebagai real user,” Pustaha, vol. 2.1,
2006, pp.1-13.

Anda mungkin juga menyukai