HistogramofOrientedGradients
GustavodeMelloCrivelli,JooPedroRamosLopes
CursodeEngenhariadeComputaoUniversidadeEstadualdeCampinasCampus
deCampinas
13081970CampinasSPBrasil
g136008@dac.unicamp.br, j139546@dac.unicamp.br
1.Introduo
Em problemas de viso computacional, comum surgirem situaes onde
precisodescobrirseumaimagemcontmumaoumaisinstnciasdeumobjeto,seja
esse uma pessoa, um cachorro, um carro, etc. Softwares que realizam esse tipo de
deteco precisam primeiro transformar aimagem em umconjunto mais enxuto de
dados,chamados features,quedescrevemcaractersticaschavedaimagemaomesmo
tempo que tentam minimizar rudo e descartar informaes irrelevantes. Uma vez
extradoovetordefeatures,aimagempodeserclassificadapormeiodeumarede
neuraloupormtricasdedistnciaacritriodoprogramador.
Neste trabalho, foi desenvolvida uma verso paralelizada em CPU de um
algoritmoextratordefeaturescriadoporDalal&Triggsparadetectarhumanos,que
resultaemumvetordefeatureschamadoHistogramadeGradientesOrientados(em
ingls, HistogramofOrientedGradients,ouHOG).Oprogramafoidesenvolvidoem
Java, e foi usada a ferramenta HPROF para o profiling e anlise dos tempos de
execuo.
2.HistogramofOrientedGradients
Odescritor defeatures HOG,conforme apresentado porDalal &Triggs em
2005,temosseguintespassos:
1. Capturarumajanelade64x128pixelsdaimagemdeentradaoriginal.
2. Dividiraimagemdajanelaem128clulasde8x8pixels.
3. CalcularovetorgradienteG=[,]decadapixeldaclula,onde
adiferenaentreosvizinhosinferioresuperior,e adiferenaentre
osvizinhosdaesquerdaedadireita.
4. Montar um histograma de 9 colunas (10, 30, , 170) por clula,
conformeosngulosdosgradientesencontrados.Acontribuiodecada
gradientecalculadadistribuindosuamagnitudeentreasduascolunas
maisprximaspormeiodeumainterpolaolinear.
5. Agruparasclulasem105blocosde2x2clulascomsobreposio(ou
seja,blocosvizinhoscompartilham2clulas)naprtica,cadabloco
ser a concatenao de 4 histogramas, resultando em vetores de 36
componentes.
6. Normalizarcadablocoafimderemoverpossveisrudosprovenientes
devariaesdecontrasteeiluminao.
7. Concatenarosvetoresdecadablocoemumvetorfinalde105x4x9=
3,780componentes,quedescreveajanelatoda.
3.ParalelizaodoHOG
No mtodo proposto por Dalal & Triggs, o passo 1 acima necessrio
(juntamentecomumprprocessamentodaimagem)paradetectarcorretamentepessoas
em escalas diferentes. Como o foco deste trabalho apenas a construo do vetor
descritor, e no a deteco de objetos, foi decidido que as imagens seriam sempre
trabalhadascomoumtodo.
Aparalelizaodoprocessorelativamentesimples,feitaemduasetapas(mais
detalhes sobre escolha dos trechos a serem paralelizados na seo 4). Primeiro a
imagem de entrada dividida em regies onde cada thread ir operar. Assim, os
histogramasdasclulas8x8serosempreescritosporapenasumathreadcada,sem
concorrncia.
Umavezquetodasasthreadsterminaramseustrabalhosetodasasclulastm
seusrespectivoshistogramas,feitoumnovoparalelismo,tambmcomumadivisode
carga,paraaconcatenaodoshistogramasemblocosde2x2clulasesuaconseguinte
normalizao. Finalmente, quando todas as threads criaram os histogramas
normalizadosdosblocos,todossoconcatenadosemumanicasada.
4.Profiling
Para o profiling do cdigo serial, foi utilizada a ferramenta HPROF, com o
seguinteresultado(apenasas10primeirasentradas,porconciso):
CPU SAMPLES BEGIN (total = 217) Tue Jul 5 03:07:00 2016
rank
self
accum
count trace method
1
68.66% 68.66%
149 300343 java.lang.StrictMath.atan2
2
6.45% 75.12%
14 300246 sun.java2d.cmm.lcms.LCMS.colorConvert
3
4.15% 79.26%
9 300374 Hog.getOutput
4
2.76% 82.03%
6 300342 Hog.getHistograms
5
2.30% 84.33%
5 300372
com.sun.imageio.plugins.jpeg.JPEGImageWriter.writeImage
6
1.38% 85.71%
3 300224
com.sun.imageio.plugins.jpeg.JPEGImageReader.readImage
7
0.92% 86.64%
2 300094 java.lang.ClassLoader$NativeLibrary.load
8
0.92% 87.56%
2 300221 sun.awt.image.ByteInterleavedRaster.putByteData
9
0.92% 88.48%
2 300345 Hog.getHistograms
10
0.92% 89.40%
2 300369 java.lang.Object.clone
Evidentemente,oprocessamentomaiscarooclculodaarcotangentedurante
aconstruodosvetoresgradientes,motivopeloqualfoidecididodividiracargade
trabalhoentreasthreads.Emsegundolugarestaconversodaimagemparaescalade
cinza,queinevitvel. Emterceiro, aconstruodovetorfinaldeoutput,que o
segundopontoondeconsideramosnecessriaaparalelizao.Emquartolugar,afuno
deconstruodoshistogramas,quenarealidadeincluioclculodaarcotangenteeque
portantodeveriaestaremprimeiro.
5.Resultados
Variando o tamanho da imagem e o nmero de threads, foram obtidas as
seguintesrelaesdespeedupemrelaoaocdigoserial:
Tabela 1. Dados utilizados para testes de eficiencia do algoritmo
Imagem
N.
Threads
Speedup
Imagem
N.
Threads
Speedup
Penguin.jpg
2.285
4.244
3.034
5.776
3.008
7.104
16
2.629
16
5.337
32
2.595
32
5.695
3.027
4.159
3.636
5.976
4.264
6.687
16
4.460
16
6.682
32
3.330
32
6.971
(800x450)
Zebra.jpg
(2133x1073)
Canguru.jpg
(1280x854)
Tiger.jpg
(2560x1600)
6.DificuldadesEncontradas
Inicialmente, foi escolhida a linguagem Python para o desenvolvimento do
projeto. Maistarde,porm, descobrimosquealinguagemno oferece suportecomo
padroaparalelismo,quandooobjetivoeficincia(ocdigoemparaleloeramuitas
vezesmaislentoqueoserial).MudamosentoparaalinguagemJava,aqualfornece
umbomsuporteaoparalelismodealgoritmos.
AindacomoprojetoPythonemmente,foiplanejadodemonstrarospeedupdo
paralelismoemrelaoaoserialismoemtemporeal, usandoofeeddevdeodeuma
webcamcomoinputparaoprograma,ecomparandoondicedeFramesPorSegundo
conformeacriaodosvetoresgradientes;Essaideiafoimaistardedescartadaquando
foidescobertoqueusarPythonerainvivel,equeacomplexidadedecapturarvdeoem
Javaeramuitoacimadoesperado.
Referncias
Dalal,N.andTriggs,B.,HistogramsofOrientedGradientsforHumanDetection,
IEEEComputerSocietyConferenceonComputerVisionandPatternRecognition,
2005,SanDiego,CA,USA.
McCormick, C. HOG Person Detector Tutorial. Disponvel:
http://mccormickml.com/2013/05/09/hogpersondetectortutorial/.
Acesso:Junho/2016
Tomasi, C. Histograms of Oriented Gradients. Disponvel:
https://www.cs.duke.edu/courses/fall15/compsci527/notes/hog.pdf.
Acesso:Junho/2016