Perbandingan Metode Histogram of Oriented Gradients
dengan Partial Least Squares pada Aplikasi Human Detector
Nama : Daniel Paulus Sihombing Nomor Mahasiswa : 11/319296/TK/38426 Mata Kuliah : Pengolahan Statistis Isyarat
TEKNIK ELEKTRO JURUSAN TEKNIK ELEKTRO DAN TEKNOLOGI INFORMASI FT.UGM YOGYAKARTA 2012
I. PENDAHULUAN A. Latar Belakang Human detection adalah sebuah sistem yang digunakan program untuk mendeteksi adanya manusia atau tidak di hadapan suatu mesin. Beberapa metode yang digunakan saat ini untuk membuat sistem human detection ini adalah Histogram of Oriented Gradients (HOG), Partial Least Squares Analysis (PLS), Global template, dan lain-lain. Pendeteksi manusia atau Human detection ini memiliki banyak fungsi dilihat dari berbagai aspek kehidupan kita, mulai dari teknologi seperti smart phone, kamera dan keamanan. Human detection bisa pula digunakan untuk kegiatan medis bahkan sampai hiburan atau entertainment. Oleh karena itu perlu adanya perkembangan riset mengenai human detection. Dalam teknologi human detection, metode yang paling banyak dikenal adalah metode Histogram of Oriented Gradients (HOG). Metode ini menggunakan teknik menghitung nilai gradien dari setiap piksel gambar. Selanjutnya menentukan jumlah bin orientasi yang akan digunakan dalam pembuatan histogram. Lalu dilakukan perhitungan geometri R-HOG. Metode lain yang dapat digunakan untuk melakukan human detection adalah Partial Least Squares Analysis. Metode ini tidak terlalu berbeda dengan HOG. Hanya saja pada metode ini ia menambahkan pengumpulan data mengenai warna pada gambar yang disebut color frequency dan tekstur yang dikomputasi dari co-occurrence matrices. Human detection harus memiliki tingkat efisiensi yang tinggi, terlebih untuk kepentingan kemananan (security) dan medis. Oleh karena itu perlu dilakukan penelitian untuk melihat perbedaan antara metode satu dengan metode yang lainnya. Pada Karya ilmiah ini, akan dibahas mengenai perbandingan antara metode metode yang biasa digunakan untuk human detection. Perbandingan yang akan dibahas pun dari segi efisiensi dan keberhasilan dalam melakukan human detection-nya.
B. Rumusan Masalah 1. Bagaimana tingkat efisiensi dari metode-metode human detection yang ada? 2. Apakah ada perbedaan fungsi atau kondisi antar metode agar satu metode lebih efektif digunakan?
C. Tujuan Adapun tujuan dari karya ilmiah ini adalah sebagai berikut: 1. Meneliti lebih lanjut mengenai metode-metode yang digunakan untuk human detection seperti Histogram of Oriented Gradients (HOG) dan Partial Least Square (PLS) Analysis. 2. Membandingkan efisiensi antara kedua metode tersebut dan perbedaan kondisi untuk memilih metode apa yang lebih efektif.
D. Manfaat Adapun manfaat dari karya ilmiah ini adalah: 1. Merupakan penelitian untuk mengetahui tingkat efisiensi dari masing-masing metode serta perbedaan karakteristiknya. 2. Menjadi sumber untuk penelitian lebih lanjut mengenai human detection.
II. TINJAUAN PUSTAKA A. Landasan Teori Histogram of Oriented Gradients Metode Histogram of Oriented Gradients adalah salah satu metode dalam melakukan human detection. Metode ini digunakan untuk mengekstraksi fitur pada obyek gambar dengan menggunakan obyek manusia. Berdasarkan langkahnya, proses awal pada metode HOG adalah dengan mengkonversi citra berwarna RGB (Red, Green, Blue) menjadi grayscale, yang kemudian dilanjutkan dengan menghitung nilai gradien setiap piksel. Setelah mendapatkan nilai gradien, maka proses selanjutnya yaitu menentukan jumlah bin orientasi yang akan digunakan dalam pembuatan histogram. Proses ini disebutspatial orientation binning. Namun sebelumnya pada proses gradient computegambar pelatihan dibagi menjadi beberapa cell dan dikelompokkan menjadi ukuran lebih besar yang dinamakan block. Sedangkan pada proses normalisasi blockdigunakan perhitungan geometri R-HOG. Proses ini dilakukan karena terdapat blockyang saling tumpang tindih. Berbeda dengan proses pembuatan histogram citra yang menggunakan nilai nilai intensitas piksel dari suatu citra atau bagian tertentu dari citra untuk pembuatan histogramnya. Berikut merupakan langkah umum untuk melakukan pendeteksian dengan metode HOG
Gamma & Colour Normalization Pada langkah ini, gambar yang didapat masi berwarna dalam bentuk RGB. Gambar dapat diubah menjadi grayscale untuk mempermudah komputasi namun dalam percobaannya, mengubah gambar ke versi grayscale dapat mengurangi performa dari pendeteksian sampai 1,5% pada 10 -4 FPPW (False Positive per Window). Gradient Computation Pada langkah ini, dilakukan perhitungan dengan gradien-gradien yang didapat. Performa sebuah detektor sangat sensitif dengan hal ini. Perhitungan gradien dapat dilakukan dengan gaussian smoothing (gaussian blur) diikuti dengan beberapa derivative mask diskret. Dari beberapa percobaan yang dilakukan dengan berbagai jenis skala penghalusan (smoothing scale ) dan mask diskretnya ditemukan yang terbaik adalah = 0 dengan 1-D [- 1,0,1]. Untuk gambar berwarna, diukur masing-masing gradien untuk setiap kanal warna. Spatial / Orientation Binning Pada langkah ini, setiap piksel dihitung nilai bobotnya dan diakumulasikan menjadi bin orientasi atas daerah lokal spasial yang disebut sel. Nilai bobot didapat dari fungsi dari magnitude gradien pada piksel. Nilainya bisa berupa nilai magnitude itu sendiri atau kuadratnya atau akar kuadratnya. Namun pada prakteknya, hasil terbaik didapat dari nilai magnitudenya saja tanpa dikuadratkan atau diakarkan. Normalization and Descriptor Blocks Nilai gradien berubah menurut perbedaan penerangan dan kekontrasan antara foreground-background. Jadi normalisasi kekontrasan merupakan langkah yang baik untuk menaikkan performa deteksi. Pada langkah ini, dibuat sebuah blok geometris yang digunakan untuk mendeteksi objek pada suatu gambar. Pada umumnya ada dua blok geometris, yaitu blok persegi yang dipartisi dengan sel spasial yang berbentuk persegi. Lalu ada blok lingkaran yang dipartisi dalam sel berbentuk log-polar. Detector Window and Context Detection window adalah daerah yang dideteksi Pada suatu gambar dengan suatu ukuran pixel. Dengan beberapa percobaan ditemukan yang detection window yang baik adalah window dengan ukuran pixel 64x128. Pengurangan ukuran window akan mengurangi performa dan efisiensi keberhasilan dalam pendeteksian.
Partial Least Squares Analysis Metode ini digunakan untuk pemodelan hubungan antara variabel yang terukur dengan variabel tersembunyi dengan bantuan HOG. Intinya PLS adalah untuk membuat variabel peramal, variabel tersembunyi baru. Adanya persamaan X = T P T + E dan y = U q T + f, dimana T dan U adalah matriks n x p yang berisi vektor tersembunyi. (m x p) matriks P dan (1 x p) vektor q melambangkan beban dan (n x m) matriks E dan (n x 1) vektor f adalah residunya. Metode PLS menggunakan algoritma nonlinear iterative partial least squares (NIPALS) yang menghasilkan vektor beban W = {w 1 , w 2 , . . . w p } dengan persamaaan
Dimana t i adalah kolom ke-i pada matriks T, u i adalah kolom ke i pada matriks U dan cov(t i ,u i ) adalah sample covariance antara vektor tersembunyi t i dan u i .
B. Hipotesis Dari pembandingan yang akan dilakukan dapat ditemukan kelebihan dan kekurangan dari metode HOG dan PLS. Dari landasan teori yang ada, dimungkinkan teori PLS akan memiliki kemampuan dan performa yang lebih dibandingkan HOG karena PLS merupakan perkembangan lebih lanjut dari HOG. Dapat diketahui dalam kondisi kondisi seperti apa suatu metode sangat efektif digunakan.
III. METODOLOGI A. Metode Penelitian Adapun metode penelitian dari karya ilmiah ini adalah dapat dilihat dengan diagram blok berikut:
B. Variabel Penelitian Pada karya ilmiah variabel yang diteliti pada metode metode yang digunakan adalah dilihat dari segi miss rate (tingkat kesalahan dalam pendeteksian), FPPW (False Positive per Window). Dari variabel-variabel tersebut nantinya akan didapat metode mana yang lebih efisien untuk dilakukan.
C. Rencana Analisis Analisis yang dilakukan adalah dengan melihat hasil penelitian milik orang lain dengan metode yang berbeda, yaitu HOG dan PLS. Setelah itu dilakukan pembandingan antara kedua hasil penelitian dan ditentukan metode apa yang lebih baik untuk melakukan human detection.
IV. HASIL DAN ANALISIS Metode Histogram of Oriented Gradients Pada percobaan yang telah dibuat oleh peneliti, dataset yang digunakan untuk mencoba metode HOG adalah INRIA dataset. INRIA dataset memiliki dua format, yaitu gambar-gambar original yang sesuai dengan keterangannya dan gambar-gambar positif (ada manusia) dalam format pixel 64x128 dicampur dengan gambar negatif (bukan manusia). Dengan dataset INRIA tersebut, metode HOG dilakukan dengan variabel yang berbeda-beda seperti pada blok geometris berupa persegi atau lingkaran (rectangular / circulation) dan cara pengklasifikasiannya menggunakan linear atau kernel. Ditemukan hasil percobaan adalah sebagai berikut:
Dari gambar diatas ditemukan bahwa metode HOG memiliki miss rate antara 30-50% pada 10 -6 FPPW dan memiliki miss rate antara 10-40% pada 10 -4 FPPW. Metode lain yang digunakan adalah metode Partial Least Squares (PLS) Metode Partial Least Squares Pada metode ini dilakukan pula percobaan kepada INRIA dataset. Dilakukan pula dengan beberapa variabel yang berbeda seperti menggunakan beberapa metode pengklasifikasian dengan PLD dimensi rendah. Ditemukan hasil percobaan adalah sebagai berikut:
Dari Gambar diatas dapat dilihat bahwa dengan metode Partial Least Squares (PLS) memiliki miss rate antara 1-8% pada 10 -4 FPPW. Ada pula pembandingan Detection Error Tradeoff (DET) untuk metode menggunakan HOG dengan ditambahkan dengan frekuensi warna dan co-occurence. Hasil penelitian adalah sebagai berikut:
Dari gambar tersebut terlihat bahwa adanya peningkatan performa dan meningkatkan tingkat efisiensi pada pendeteksian saat metode HOG ditambah dengan frekuensi warna terlebih lagi jika ditambah dengan co-occurence. Semua metode digabung dapat menurunkan tingkat kegagalan sampai 20% pada 10 -6 FPPW.
V. KESIMPULAN DAN SARAN A. Kesimpulan Adapun kesimpulan yang dapat diambil dari hasil pembandingan kedua metode (Histogram of Oriented Gradients dan Partial Least Squares) adalah sebagai berikut: Metode Partial Least Squares memiliki tingkat efisiensi yang lebih tinggi dibanding dengan metode Histogram of Oriented Gradients yang dapat terlihat pada grafik bahwa pada 10 -4 FPPW, metode PLS dapat mendeteksi dengan miss rate sekitar 1-8%, sedangkan pada metode HOG masih memiliki miss rate sekitar 10-40%. Metode Partial Least Squares dapat dibilang merupakan perkembangan dari metode Histogram of Oriented Gradients karena dalam metode tersebut masih menggunakan HOG namun ada tambahan yang dilakukan untuk meningkatkan performa pendeteksiannya. Metode PLS memiliki langkah yang lebih banyak dan lebih kompleks namun memiliki performa dalam melakukan pendeteksian yang lebih baik dibanding dengan HOG.
B. Saran Beberapa saran yang dapat diberikan adalah sebagai berikut: Metode PLS sudah memiliki performa yang cukup baik dalam proses human detection namun perlu diadakan penelitian lebih lanjut untuk menemukan metode yang lebih efektif dan efisien untuk melakukan pendeteksian manusia.
VI. REFERENSI 1. N. Dalal, B. Triggs. Histograms of Oriented Gradients for Human Detection. Coference on Computer Vision and Pattern Recognition (CVPR). 2005. 2. L. Davis, D. Harwood, A. Kembhavi, W. Schwartz. Human Detection Using Partial Least Squares Analysis. Univeristy of Maryland, A.V. Williams Building. 2010. 3. Q. Zhu, M-C Yeh, K-T Cheng, S. Avidan. Fast Human Detection Using a Cascade of Histogram of Oriented Gradients. Coference on Computer Vision and Pattern Recognition (CVPR). 2006. 4. http://en.wikipedia.org/wiki/Histogram_of_oriented_gradients 5. http://pascal.inrialpes.fr/data/human/ 6. http://rauluwiyahnuroktavianis.blogspot.com/2013/03/histogram-of-oriented- gradients.html