RESUMO
Em razo da implantao da TV Digital, no Brasil, o estudo de tcnicas para a compresso de imagens tornou-se indispensvel para a transmisso ou armazenamento de dados de forma eficiente. Grande parte da informao gerada pela digitalizao de uma imagem composta por redundncias que podem ser eliminadas ou reduzidas sem acarretar uma imagem visualmente disforme. A compresso de imagens empregada nos CODECs de TV Digital a fim de proporcionar o uso eficiente da largura de banda do canal atravs de uma multiprogramao em uma mesma freqncia. Este artigo tem por objetivo descrever os principais algoritmos de compresso de imagens estticas que so empregados nos codificadores de vdeo, tais como: Huffman (Entropia), RLE (Run Length Encoding) e DCT (Discrete Cosine Transform).
Palavras-chave: compresso de imagens, cdigo de Huffman, RLE (Run Length Encoding) e DCT (Discrete Cosine Transform).
II Congresso de Pesquisa e Inovao da Rede Norte Nordeste de Educao Tecnolgica Joo Pessoa PB - 2007
1. INTRODUO
A digitalizao de uma imagem produz uma grande quantidade de bits, o que requer um canal com maior capacidade de transmisso e uma quantidade maior de memria para o seu armazenamento. Com o intuito de solucionar esse impasse tcnicas de compresso de imagens foram e continuam a ser desenvolvidas. Grande parte da informao contida numa imagem pode ser removida sem causar distores, uma vez que o sistema visual humano no sensvel s altas freqncias menos contributivas para a imagem (WALDMAN, 2000). As tcnicas de compresso de imagens tentam fazer dessa limitao do olho humano a sua aliada para reduzir a quantidade de bits representativos da imagem. A compresso de imagens encontra aplicaes em diversos segmentos tais como computao multimdia, transmisso de televiso, imageamento mdico e geogrfico, entre outras. Em razo da implantao da TV Digital, no Brasil, essas tcnicas tornaram-se indispensveis otimizao do canal de transmisso, sendo empregadas nos codificadores e decodificadores (CODECs) de vdeo dos diferentes padres de TV Digital. Neste artigo sero apresentados os principais algoritmos de compresso de imagens estticas que so empregados nos codificadores de vdeo, tais como: Huffman (Entropia), RLE (Run Length Encoding) e DCT (Discrete Cosine Transform).
II Congresso de Pesquisa e Inovao da Rede Norte Nordeste de Educao Tecnolgica Joo Pessoa PB - 2007
II Congresso de Pesquisa e Inovao da Rede Norte Nordeste de Educao Tecnolgica Joo Pessoa PB - 2007
Y Smbolo
Transformao
Mapeador
Codificador de Smbolos
Palavra-Cdigo
Transformada
Quantizador
Codificador
II Congresso de Pesquisa e Inovao da Rede Norte Nordeste de Educao Tecnolgica Joo Pessoa PB - 2007
H ( s) l med H ( s ) + 1
em que H(s) a entropia da fonte e lmed o comprimento mdio do cdigo.
[Eq. 01]
Com o objetivo de tornar o processo de codificao mais eficiente, Huffman procurou atender ao seguinte critrio: representar smbolos com maior probabilidade de ocorrncia com um nmero menor de bits diferentemente daqueles de menor probabilidade, os quais so representados por um nmero maior de bits. O processo de codificao de Huffman realizado ao se ordenar os smbolos por ordem decrescente de probabilidade para formar o diagrama de rvore, (ver Figura 3). As etapas para a construo do diagrama de rvore so apresentadas abaixo: 1. Dada uma fonte com alfabeto S = {s0, s1, s2,...,sk} com suas respectivas probabilidades, ordena-se os smbolos da fonte em ordem decrescente de probabilidade de cima para baixo. 2. Ao ordenar as probabilidades d-se incio reduo da fonte a partir da soma das duas probabilidades menores. 3. A probabilidade resultante dessa soma ser colocada em outra coluna, em que as probabilidades da coluna anterior sero repetidas e o novo valor ser alocado de maneira a manter a ordem decrescente. O processo continua at que a soma das probabilidades seja igual a 1, nmero associado raiz da rvore. 4. Aps a etapa 3, a cada smbolo atribudo um cdigo que obtido ao pegar os bits da raiz como sendo o incio da seqncia e segue a ramificao at chegar ao smbolo sk. A Tabela 1 mostra os cdigos obtidos para o exemplo da Figura 3.
II Congresso de Pesquisa e Inovao da Rede Norte Nordeste de Educao Tecnolgica Joo Pessoa PB - 2007
Tabela 1 - Palavras-cdigo obtidas pela codificao Smbolo s0 s1 s2 s3 s4 Sabendo-se que a entropia dada por: Probabilidade 0,4 0,2 0,2 0,2 0,1 Palavra-cdigo 00 10 11 010 011
H ( s ) = p ( si ) log 2 p ( si ) (bits/smbolo)
i =0
[Eq. 02]
lmed = p ( si )li
i =0
[Eq. 03]
H ( x) lmed
[Eq. 04]
A partir dos dados contidos na Tabela 1 e ao usar as equaes 02, 03 e 04 possvel calcular a entropia da fonte, o comprimento mdio e a eficincia da codificao exemplificada na Figura 3. Dessa forma, tem-se: H(x) = -(0,4log20,4 + 0,2 log20,2 + 0,2 log20,2 + 0,2 log20,2 + 0,1log20,1) = 2,26 bits/smbolo lmed = 0,4.2 + 0,2.2 + 0,2.2 +0,2.3 +0,4.3 = 2,5 bits/smbolo = 0,904 Como j foi visto o processo de codificao consiste em mapear os smbolos-fonte em uma seqncia de palavras-cdigo. A decodificao pode ser realizada ao construir uma lookup table (KARAM, 2000). A lookup table possui o nmero de entradas igual a 2lmx, onde lmx o comprimento da maior palavracdigo. Um smbolo sk ter 2(lmx li) entradas relacionadas a ele, em que li o seu comprimento. Para cada smbolo mapeado em palavras-cdigo nomeia-se em todas as entradas da tabela um par (sk,li). Ao decodificar um trem de bits identificado lmx e este usado como ndice, na lookup table, para obter sk decodificado cujo tamanho corresponde a li. Em seguida, o ndice relacionado ao primeiro li descartado e a sua direita anexa-se o prximo li , e assim por diante, at decodificar todo o trem de bits. A lookup table tem por vantagem tornar o processo de decodificao mais rpido, no entanto, o tamanho da memria e complexidade cresce exponencialmente com lmx. Na codificao de imagens os smbolos-fonte so os nveis de cinza e aos que tm maior probabilidade de ocorrncia se atribui os cdigos de menor tamanho. A eficincia do cdigo de Huffman est diretamente relacionada maneira como a fonte modelada, ou seja, ao grau de variao das suas probabilidades. Em fontes cujo arranjo de probabilidades varia com o tempo, pode ocorrer falha de codificao. Ao procurar solucionar esse problema encontrou-se a soluo na codificao adaptativa de Huffman. Atravs desta
II Congresso de Pesquisa e Inovao da Rede Norte Nordeste de Educao Tecnolgica Joo Pessoa PB - 2007
introduzido um contador de nmero de ocorrncias de um determinado smbolo e atualiza-se a tabela de mapeamento dos smbolos-fonte em palavras-cdigo, usada tanto no codificador quanto no decodificador. Assim, o cdigo de Huffman adaptado dinamicamente para diferentes estatsticas de fonte.
II Congresso de Pesquisa e Inovao da Rede Norte Nordeste de Educao Tecnolgica Joo Pessoa PB - 2007
[Eq. 08]
Obtm-se o valor da igualdade, identifica-se o subintervalo de probabilidade de ocorrncia no qual ele est contido e atribui-se o smbolo correspondente. 4. Sabendo-se o subintervalo em que est contido o smbolo sk necessrio atualizar o intervalo. Para isso, utilizam-se as equaes 06 e 07. 5. Enquanto o ltimo smbolo no for decodificado repete-se a operao a partir da etapa 2. Quanto maior a seqncia a ser codificada maior ser o comprimento da palavra-cdigo devido necessidade de grande preciso. Com a finalidade de facilitar a compreenso da codificao aritmtica a Figura 4 mostra as etapas de codificao e decodificao para um alfabeto A= {a1, a2, EOS}, em que EOS (End-of-sequence) representa o cdigo de final de seqncia, com probabilidades p(A) = {0,5, 0,4, 0,1}, sabendo-se que a seqncia codificada a2, a1, a2, EOS.
a1
a1
a1
a1
a1
a2
a2
a2
a2
a2
a2
a1
a2
a1
a1
a1
a1
a2
a2
a2
a2
a2
a1
a2
II Congresso de Pesquisa e Inovao da Rede Norte Nordeste de Educao Tecnolgica Joo Pessoa PB - 2007
O resultado da aplicao da transformada DCT a uma imagem pode ser visualizado na Figura 5. Os coeficientes mais significativos podem ser vistos na regio mais clara da imagem dos coeficientes, enquanto que a parte escura corresponde aos coeficientes com pouca energia.
(a) Imagem Original (b) Coeficientes DCT Figura 5: Compresso de uma imagem atravs da DCT (GONZALEZ, 2000).
Para uma matriz NN com coeficientes xi,j, i,j = 0,1, ... , N 1, ao aplicar a transformada DCT bidimensional obtm-se os coeficientes transformados Xi,j, i,j = 0,1, ... , N 1. (BATISTA, 2005).
N 1 N 1 1 (2 j + 1) j (2i + 1)i ci c j xij cos , i, j =0, 1, ... , N 1 cos 2N 2N 2N i =0 j =0
Xij = em que:
[Eq. 10]
ci,cj=
(1/2)1/2 1
Como j foi mencionado o olho humano no tem acuidade visual para altas freqncias, portanto, elimin-las no acarreta distores para a imagem. Nesse caso a DCT age agrupando as altas e baixas freqncias em coeficientes distintos, sendo que os coeficientes de baixas freqncias concentram mais energia, diferentemente dos de alta freqncia. As magnitudes dos coeficientes de alta freqncia, geralmente, so prximas ao valor 0 (zero) o que permite que estes possam ser eliminados durante a quantizao. Devido a sua alta capacidade de concentrao de energia, o que implica um nmero menor de coeficientes em relao a outras transformadas, a DCT tem como principal aplicao a compresso de sinais (OPPENHEIM, 1998).
5. CONSIDERAES FINAIS
Mediante o cenrio de convergncia tecnolgica, em que o trfego de imagens e vdeo entre os equipamentos multimdia j uma realidade surge o problema de como possibilitar maior fluxo de dados sem sobrecarregar o canal de transmisso. Alm disso, a migrao do sistema de TV analgico para o digital, no Brasil, exige o desenvolvimento de alternativas que otimizem o uso do canal de transmisso j existente para permitir multiprogramao e interatividade ao telespectador. A fim de atender s necessidades de otimizar os processos de transmisso e armazenamento, a compresso um mtodo eficiente para alcanar tal objetivo. Para isso elimina as redundncias de uma imagem que so irrelevantes para os observadores humanos.
II Congresso de Pesquisa e Inovao da Rede Norte Nordeste de Educao Tecnolgica Joo Pessoa PB - 2007
Neste artigo viu-se os principais algoritmos empregados tanto na compresso de imagens estticas quanto nos codificadores de TV Digital: Huffman, aritmtica e DCT. Em geral, para aumentar a taxa de compresso combinam-se diferentes tipos de codificao em um mesmo codificador. As codificaes de Huffman e aritmtica so muito usadas para compresso sem perdas. A primeira no exige grande complexidade computacional e seu uso prefervel em fontes que no tenham uma alta variao de ocorrncia. No caso da codificao aritmtica, uma palavra-cdigo representa uma seqncia inteira de smbolos de entrada e em relao a Huffman prefervel como codificao adaptativa. A DCT embora no seja diretamente responsvel pela reduo das redundncias muito utilizada para compresso por perdas devido ao seu alto poder de concentrao de energia em poucos coeficientes. Dessa forma possibilita a eliminao de um nmero maior de coeficientes, com valores prximos de zero, no processo de quantizao. Dessa maneira, a utilizao dos diferentes tipos de codificao depende do tipo de aplicao desejada e podem ser utilizados em um mesmo codificador como forma de obter taxas de compresso mais elevadas ao suprir as deficincias das outras.
REFERNCIAS
BATISTA, L. V. Notas de Aula da Disciplina Introduo Teoria da Informao. 2005. . Notas de Aula da Disciplina Introduo ao Processamento Digital de Imagens. 2005a. FERRAZ, M. C. Codificao de Imagens. 1998. 232 f. Tese (Mestrado em Cincias) Instituto de Matemtica Pura e Aplicada, Rio de Janeiro, 1998. GONZALEZ, Rafael C.; WOODS, Richard E. Processamento de Imagens Digitais. 1. ed. So Paulo: Edgard Blcher, 2000. HUNT, B. R. Digital Image Processing. In: OPPENHEIM, A. V. Applications of Digital Signal Processing. Englewood Cliffs: Prentice Hall, 1978. p. 169-187. KARAM, L. J. Lossless Coding. In: BOVICK, A. C. Handbook of Image and Video Processing. New York: Academic Press, 2000. p. 461-470. OPPENHEIM, A. V.; SCHAFER, R. W.; BUCK, J. R. Discrete-Time Signal Processing. 2. ed. Upper Saddle River: Prentice Hall, 1998. p. 589-599. SOUZA, M. S. Codificao de Imagem utilizando Turbo Quantizao Codificada por Trelias. 2005. 98 f. Tese (Mestrado em Cincias em Engenharia Eltrica) Coordenao dos Programas de Ps-Graduao de Engenharia, Universidade Federal do Rio de Janeiro, Rio de Janeiro, 2005. TUDOR, P. N. MPEG-2 Video Compression. IEE J Langham Thompson Prize: Eletronics & Communication Engineering Journal, dez. 1995. Disponvel em: <http://www.bbc.co.uk/rd/pubs/papers/paper_14/paper_14.shtml >. Acesso em: 15 nov. 2006. WALDMAN, H.; YACOUB, M. D. Telecomunicaes: Princpios e Tendncias. 4. ed. So Paulo: rica, 2000. p. 83-98. Srie Reuniversidade.