Anda di halaman 1dari 24

Rodrigo Silva Mello

Codificao Distribuda de Vdeo com Modelagem do Canal de Correlao no Domnio da Transformada

PUC-Rio - Certificao Digital N 0610789/CA

Tese de Doutorado Tese apresentada ao Programa de Ps-graduao em Engenharia Eltrica da PUC-Rio como requisito parcial para obteno do ttulo de Doutor em Engenharia Eltrica. Orientador: Marco Antonio Grivet Mattoso

Rio de Janeiro, Dezembro de 2010

Rodrigo Silva Mello Codificao Distribuda de Vdeo com Modelagem do Canal de Correlao no Domnio da Transformada
Tese apresentada como requisito parcial para obteno do grau de Doutor pelo Programa de Ps-Graduao em Engenharia Eltrica do Departamento de Engenharia Eltrica do Centro Tcnico Cientfico da PUC-Rio. Aprovada pela Comisso Examinadora abaixo assinada.

PUC-Rio - Certificao Digital N 0610789/CA

Prof. Marco Antonio Grivet Mattoso Maia Orientador Centro de Estudos em Telecomunicaes /PUC-Rio Profa Carla Liberal Pagliari IME Prof. Lisandro Lovisolo UERJ Prof. Marcelo Roberto P. Baptista Jimenez Centro de Estudos em Telecomunicaes /PUC-Rio Prof. Weiler Alves Finamore Centro de Estudos em Telecomunicaes /PUC-Rio Prof. Rodolfo Sabia Lima de Souza Inmetro

Prof. Jos Eugenio Leal Coordenador Setorial do Centro Tcnico Cientfico - PUC-Rio Rio de Janeiro, 16 de dezembro de 2010

Todos os direitos reservados. proibida a reproduo total ou parcial do trabalho sem autorizao do autor, do orientador e da universidade.

Rodrigo Silva Mello possui curso tcnico em Mecnica Industrial pelo Centro Federal de Educao Tecnolgica Celso Suckow da Fonseca (1997), graduao em Engenharia Eltrica com nfase em Telecomunicaes pela Universidade do Estado do Rio de Janeiro (2002), mestrado em Engenharia Eltrica (Telecomunicaes) pela Pontifcia Universidade Catlica do Rio de Janeiro (2005) e doutorado em Engenharia Eltrica (Telecomunicaes) pela Pontifcia Universidade Catlica do Rio de Janeiro (2010). Tem experincia na rea de Engenharia Eltrica, com nfase em Sistemas de Telecomunicaes e Processamento de Sinais, atuando principalmente nos seguintes temas: Codificao de Vdeo Digital, Sistemas Mveis Celulares e Rdio Troncalizado, Telefonia IP e Comunicao de Dados pela Rede Eltrica (PLC).

PUC-Rio - Certificao Digital N 0610789/CA

Ficha Catalogrfica Mello, Rodrigo Silva Codificao distribuda de vdeo com modelagem do canal de correlao no domnio da transformada / Rodrigo Silva Mello; orientador: Marco Antonio Grivet Mattoso. 2010. 209 f. il. (color.); 30 cm Tese (doutorado)Pontifcia Universidade Catlica do Rio de Janeiro, Departamento de Engenharia Eltrica, 2010. Inclui bibliografia 1. Engenharia eltrica Teses. 2. Codificao distribuda de vdeo. 3. Teorema de Slepian-Wolf. 4. Teorema de Wyner-Ziv. 5. Informao lateral. 6. Quadro Wyner-Ziv. 7. Cdigo de canal. 8. Plano de bits. 9. Canal de correlao. 10. Interpolao de quadros. I. Mattoso, Marco Antonio Grivet. II. Pontifcia Universidade Catlica do Rio de Janeiro. Departamento de Engenharia Eltrica. III. Ttulo. CDD: 621.3 CDD: 621.3

Agradecimentos

A Deus e Nossa Senhora, pelas bnos e graas que me sustentaram em todos os momentos, ajudando-me a superar obstculos para a realizao deste estudo.

Aos meus pais Fernando e Bernardete, pelo amor, carinho educao, empenho e pelo sustento proporcionados ao longo dessa difcil jornada.
PUC-Rio - Certificao Digital N 0610789/CA

Aos meus irmos, Fernanda e Ramon e demais familiares, pelo apoio, compreenso e incentivo durante todo este tempo.

Ao meu orientador, Professor Marco Antonio Grivet Mattoso, pela sua competncia e por seu papel fundamental na estruturao deste trabalho, com sua orientao e dedicao incansveis.

Aos professores Carla Liberal Pagliari e Lisandro Lovisolo, pela cooperao nos estudos desenvolvidos.

professora Ana Pavani, pela amizade e grande parceria no encaminhamento das questes para alcance dos objetivos.

PUC-Rio, e em especial ao corpo docente do CETUC, pela contribuio dada ao meu aprendizado profissional na rea de Telecomunicaes.

Aos colegas do CETUC pelo apoio em todos os momentos.

Aos meus amigos em geral, pela amizade e estmulo constantes.

Resumo

Mello, Rodrigo Silva; Mattoso, Marco Antonio Grivet. Codificao distribuda de vdeo com modelagem do canal de correlao no domnio da transformada. Rio de Janeiro, 2010. 209p. Tese de Doutorado Departamento de Engenharia Eltrica, Pontifcia Universidade Catlica do Rio de Janeiro. A codificao distribuda de vdeo um novo paradigma de codificao de vdeo que permite explorar a estatstica da fonte apenas no decodificador. Nesse cenrio, duas fontes correlatadas so independentemente codificadas usando codificadores distintos e os fluxos binrios associados a cada uma so conjuntamente decodificados, explorando a correlao entre eles. A resilincia a erros uma importante funcionalidade deste novo paradigma uma vez que a
PUC-Rio - Certificao Digital N 0610789/CA

tradicional malha de predio no codificador e a propagao de erros associada a esta malha no existe ao no se explorar a correlao do sinal no codificador. Desta forma, esta tese tem como objetivo apresentar uma nova arquitetura de codificao distribuda de vdeo, desenvolvendo e analisando algoritmos mais eficientes para a mesma, reduzindo, desta forma, o gap de desempenho quando comparado aos sistemas tradicionais de codificao de vdeo [68]. Assim, o codec proposto nesta tese proporcionou: a otimizao da arquitetura DVC (Distributed Vdeo Coding), o desenvolvimento de novas ferramentas para a gerao da informao lateral, a incluso de um mdulo de medida de correlao entre quadros para auxiliar na decodificao, a utilizao de um processo de quantizao Wyner-Ziv varivel, a opo de uma codificao parcial de bitplanes, uma modelagem do canal de correlao baseada na estimao de parmetros em nvel de banda e de coeficientes da transformada DCT (Discrete Cosine Transform), a incluso de um mdulo de normalizao da informao lateral e o desenvolvimento de um cdigo de canal mais adequado arquitetura proposta.

Palavras-chave
Codificao Distribuda de Vdeo; Teorema de Slepian-Wolf; Teorema de Wyner-Ziv; Informao Lateral; Quadro Wyner-Ziv; Cdigo de Canal; Plano de bits; Canal de Correlao; Interpolao de Quadros.

Abstract

Mello, Rodrigo Silva; Mattoso, Marco Antonio Grivet (Advisor). Distributed video coding with correlation channel modeling in the transform domain. Rio de Janeiro, 2010. 209p. Dsc. Thesis Departamento de Engenharia Eltrica, Pontifcia Universidade Catlica do Rio de Janeiro.

Distributed video coding is a new video coding paradigm that allows exploiting the source statistics at the decoder only. In this scenario, two correlated sources are independently encoded using separated encoders and the bit streams associated to each one are jointly decoded exploiting the correlation between them. Improved error resilience is another major functionality of this new video
PUC-Rio - Certificao Digital N 0610789/CA

coding paradigm since the usual encoder prediction loop and the associated error propagation do not exist anymore, because the signal correlation is not explored in the encoder. Therefore, this thesis aims to present a new architecture for distributed video coding, analyzing and developing more efficient algorithms for it, thus reducing the gap in performance when it is compared to traditional video coding [68]. Therefore, the codec proposed in this thesis provided: a DVC architecture optimization; the development of new tools for side information generation process; inclusion of a module for measuring correlation between frames in order to assist in the Wyner-Ziv frame reconstruction; the use of a Wyner-Ziv variable quantization process; the option of partial coding of bitplanes; a correlation channel model based on the estimation of parameters in band and DCT coefficient levels; an inclusion of a normalization stage to the side information; and the development of a channel code more appropriate to the proposed architecture.

Keywords
Distributed Video Coding; Slepian-Wolf Theorem; Wyner-Ziv Theorem; Side Information; Wyner-Ziv frame; Channel Code; Bitplanes; Correlation Channel; frame interpolation.

Sumrio

1 Introduo 1.1. Fundamentos da Codificao Distribuda 1.2. Teorema de Slepian-Wolf para Codificao Distribuda 1.3. Codificao de Sndrome 1.4. Principais Objetivos da Tese 1.5. Apresentao do Trabalho 1.6. Publicaes 2 Aplicao da Codificao Wyner-Ziv para Vdeo 2.1. Clculo de Taxa-Distoro para Codificao com Informao
PUC-Rio - Certificao Digital N 0610789/CA

25 26 28 30 33 36 37 38

Lateral no Receptor 2.2. Reviso de literatura sobre codificao Wyner-Ziv 2.3. Funcionamento da Codificao de Vdeo de Baixa Complexidade 2.4. Arquitetura-padro para Codec DVC 3 Cdigo de Baixa Densidade, Irregular e com Taxa Varivel 3.1. Escolha do cdigo 3.2. DVC baseado em Sndromes 3.3. Escolha do cdigo 3.3.1. Fundamentos da Codificao LDPC Irregular 3.3.2. Probabilidades e LLR a posteriori 3.3.3. Transferncia de Probabilidades entre Ns dos Grafos 3.3.4. Regras de Atualizao de Mensagens Probabilsticas 3.3.5. Mtodo para Sntese de ns de Sndrome 3.3.6. Algoritmo de Produto-e-Mximo 3.3.6.1. Codificao com o Cdigo LIA 3.3.6.2. Decodificao com o Cdigo LIA 3.4. Consideraes sobre o Cdigo Proposto 3.4.1.1. Avaliao da influncia das Iteraes do Decodificador LIA na Reconstruo dos Bitplanes

38 40 41 43 49 49 49 51 52 53 54 57 60 62 63 65 68

68

4 Codificador WZ-LIA 4.1. Motivao 4.2. Arquitetura do Codec WZ-LIA 4.3. Procedimento de Codificao 4.4. Procedimento de Decodificao 4.5. Mtodos e Tcnicas do Codec Proposto 4.5.1. Transformada DCT no Codec WZ-LIA 4.5.2. Quantizador do Codec WZ-LIA 4.5.2.1. Quantizao dos Coeficientes DC 4.5.2.2. Quantizao do Coeficiente AC 4.5.3. Nmero de Nveis de Quantizao 4.5.4. Abordagem sobre a Faixa Dinmica 4.5.5. Clculo do Passo de Quantizao do Coeficiente DC
PUC-Rio - Certificao Digital N 0610789/CA

75 75 76 77 80 83 83 87 87 91 97 98 100 102 104 107 114 114 117 118 119 119 120 121 125 126

4.5.6. Clculo do Passo de Quantizao dos Coeficientes AC 4.5.7. Descrio do Mtodo Proposto para Quantizao 4.5.8. Avaliao do Mtodo de Quantizao Proposto 4.5.9. Procedimento de Gerao dos Bitplanes 4.5.9.1. Avaliao Objetiva da Transmisso Parcial dos Bitplanes 4.5.9.2. Avaliao Subjetiva da Transmisso Parcial dos Bitplanes 4.5.10. Procedimento de Gerao das Sndromes 4.6. Tcnicas Propostas para Decodificao 4.6.1. Decodificao Iterativa LIA 4.6.2. Buffer e Transmisso Parcial das Sndromes 4.6.3. Estimao de Taxa Mnima 4.6.3.1. Medida de Confiana 4.6.4. Modelagem do Canal de Correlao 4.6.4.1. Estimao do Rudo de Correlao em nvel de Sequncia (offline) 4.6.5. Modelos de Rudo de Correlao Estimados Online 4.6.5.1. Estimao do Rudo de Correlao em nvel de Frame 4.6.5.2. Estimao Proposta para o Rudo de Correlao: em Nvel de Banda

128 129 129

131

4.6.5.3. Estimao do Rudo de Correlao em Nvel de Bloco 4.6.5.4. Estimao Proposta para o Rudo de Correlao: em Nvel de Coeficiente 4.6.6. Avaliao da Modelagem do canal de Correlao 4.6.7. Gerao da Informao Lateral 4.6.8. Mtodo Proposto para Gerao da Informao Lateral 4.6.8.1. Estimao Direta de Movimento 4.6.8.2. Estimao Reversa do Movimento 4.6.9. Avaliao dos Mtodos de Estimao Bidirecional de Movimento 4.6.9.1. Problemas da Compensao de Frames Interpolados 4.6.9.2. Interpolao com base na Correlao entre Frames 4.6.9.3. Interpolao baseada na Estimativa de movimento 4.6.9.4. Extrapolao
PUC-Rio - Certificao Digital N 0610789/CA

132

133 134 139 143 143 148

149 159 161 162 163

4.6.10. Avaliao Subjetiva do Mdulo Proposto para Gerao da Informao Lateral 4.7. Avaliao Objetiva das Ferramentas Propostas para o Mdulo de Gerao da Informao Lateral 4.7.1. Avaliao Objetiva do mdulo de Normalizao 4.7.2. Avaliao Subjetiva Conjunta do processo de Normalizao e de gerao da Informao Lateral 4.7.3. Verificador de Falha 4.7.4. Reconstruo dos Coeficientes DCT 4.7.5. Simulaes Gerais com o Codec WZ-LIA 4.7.5.1. PSNR mdia em funo do Tempo de Processamento 4.7.5.2. PSNR ao longo da sequncia para Diferentes Taxas de Compresso 4.7.5.3. Avaliao da influncia da substituio das bandas zeradas do Frame WZ pela informao Lateral 5 Concluses e Trabalhos Futuros 5.1. Sugestes para Trabalhos Futuros 6 Referncias 185 187 190 193 184 177 178 179 183 183 167 173 164

7 Apndice A Construo do Cdigo LDPC 8 Apndice B Opes de Configurao do Codec Proposto 9 Apndice C Algoritmo Proposto para Decodificao dos Bitplanes

202 207

208

PUC-Rio - Certificao Digital N 0610789/CA

Lista de figuras

Figura 1.1: Codificao distribuda de duas sequncias aleatrias estatisticamente dependentes, X e Y. Figura 1.2: Teorema de Slepian-Wolf: Regio de taxa admissvel para codificao distribuda de duas fontes estatisticamente dependentes e igualmente distribudas. Figura 1.3: Codificao de uma sequncia de smbolos aleatrios X utilizando na decodificao a informao lateral Y correlacionada a X. Figura 1.4: (a) Codificador e decodificador utilizam a informao lateral Y, a qual correlatada a X. Aqui, X pode ser codificado com 2 bits. (b) Aqui, somente o decodificador tem acesso a Y e ainda assim X pode ser codificado usando apenas 2 bits.
PUC-Rio - Certificao Digital N 0610789/CA

26

27

28

31

Figura 2.1: Compresso com perdas de uma sequncia X utilizando a informao lateral Y (relacionada estatisticamente a X) no decodificador. Figura 2.2: Um codificador Wyner-Ziv prtico obtido cascateando um quantizador e um codificador Slepian-Wolf. Figura 2.3: Arquitetura de transcodificao de vdeo para transmisso wireless, utilizada na rede mvel celular [68]. Figura 2.4: Codificador de vdeo de baixa complexidade e decodificador correspondente. Figura 2.5: Frames da sequncia Salesman, QCIF: (a) Informao lateral 43 42 39 38

S no decodificador, gerada por interpolao compensada do movimento


(b) Frame reconstrudo S depois da decodificao conjunta Wyner-Ziv. Figura 2.6: Desempenho taxa-distoro de um codec de vdeo Wyner-Ziv, comparado codificao de vdeo intraframe e interframe convencional, para sequncia Salesman. Figura 2.7: Desempenho taxa-distoro de um codec de vdeo Wyner-Ziv, comparado codificao de vdeo intraframe e interframe convencional, para sequncia Hall Monitor. Figura 3.1: Cenrio resumido de codificao assimtrica da fonte. Figura 3.2: Incio da difuso de mensagens dos ns de variveis para 47 49 47 46

os ns de paridade. Figura 3.3: Exemplo de transferncia de mensagens entre os ns de grafos bipartidos. Figura 3.4: As funes VAR e PAR em ns de grau 3. Figura 3.5: Sntese de n de paridade de grau 3. Figura 3.6: Codificador de baixa densidade, irregular e acumulado. Figura 3.7: Grafo de decodificao das variveis com o codificador transmitindo todas as sndromes acumuladas. Figura 3.8: Grafo de codificao com o codificador transmitindo somente as sndromes acumuladas de ndice par. Figura 3.9: Grafo de decodificao com o codificador transmitindo os bits das sndromes de ndice par. Figura 3.10: PSNR do frame Wyner-Ziv para diferentes nmeros de iteraes do decodificador LIA, para sequncia Foreman, com
PUC-Rio - Certificao Digital N 0610789/CA

56

56 60 62 64

65

66

67

QP = 25 (intra) e TQ = 18 (WZ). Figura 3.11: Diferena entre a PSNR do frame Wyner-Ziv utilizando uma e cinquenta iteraes, para a sequncia Foreman, com QP = 25 (intra) e TQ = 18 (WZ). Figura 3.12: PSNR do frame Wyner-Ziv para nmeros diferentes de iteraes do decodificador LIA, para sequncia News, com QP = 25 (intra) e TQ = 18 (WZ). Figura 3.13: PSNR do frame Wyner-Ziv para nmeros diferentes de iteraes do decodificador LIA, para sequncia News, com QP = 25 (intra) e TQ = 18 (WZ), em uma escala maior (melhor visualizao). Figura 3.14: Diferena entre a PSNR do frame Wyner-Ziv utilizando uma e cinquenta iteraes, para a sequncia News, com QP = 25 (intra) e TQ = 18 (WZ). Figura 3.15: PSNR do frame Wyner-Ziv para nmeros diferentes de iteraes do decodificador LIA, para sequncia Foreman, com QP = 26 (intra) e TQ = 7 (WZ). Figura 3.16: Diferena entre a PSNR do frame Wyner-Ziv utilizando uma e cinquenta iteraes, para a sequncia Foreman, com QP = 26 (intra) e TQ = 7 (WZ).

70

70

71

71

72

72

73

Figura 3.17: PSNR do frame Wyner-Ziv para nmeros diferentes de iteraes do decodificador LIA, para sequncia News, com QP = 26 (intra) e TQ = 7 (WZ). Figura 3.18: Diferena entre a PSNR do frame Wyner-Ziv utilizando uma e cinquenta iteraes, para a sequncia News, com QP = 26 (intra) e TQ = 7 (WZ). Figura 4.1: Diagrama de blocos da arquitetura de codificao distribuda proposta. Figura 4.2: Ordem das posies (frequncias espaciais) dentro de um bloco 4x4 de coeficientes DCT. Figura 4.3: Quantizador escalar uniforme para o coeficiente DC com largura W do intervalo de quantizao. Figura 4.4: Distribuio dos coeficientes DCT para a banda DC (b1) da sequncia Foreman.
PUC-Rio - Certificao Digital N 0610789/CA

73

74

77

85

88

89

Figura 4.5: Distribuio dos coeficientes DCT para a banda DC (b1) da sequncia News. Figura 4.6: Distribuio dos coeficientes DCT para a banda DC (b1) da sequncia Coastguard. Figura 4.7: Distribuio dos coeficientes DCT para a banda DC (b1) da sequncia Soccer. Figura 4.8: Distribuio dos coeficientes DCT para a banda AC (b2) de mais baixa frequncia espacial da sequncia Foreman, QCIF. Figura 4.9: Distribuio dos coeficientes DCT para a banda AC (b2) de mais baixa frequncia espacial da sequncia News, QCIF. Figura 4.10: Distribuio dos coeficientes DCT para a banda AC (b2) de mais baixa frequncia espacial da sequncia Coastguard, QCIF. Figura 4.11: Distribuio dos coeficientes DCT para a banda AC (b2) de mais baixa frequncia espacial da sequncia Soccer, QCIF. Figura 4.12: Distribuio dos coeficientes DCT para a banda AC (b3) de mais alta frequncia espacial da sequncia Foreman QCIF. Figura 4.13: Distribuio dos coeficientes DCT para a banda AC (b3) de mais alta frequncia espacial da sequncia News, QCIF. Figura 4.14: Distribuio dos coeficientes DCT para a banda AC (b3) 94 93 93 92 92 91 90 90 89

de mais alta frequncia espacial da sequncia Coastguard, QCIF. Figura 4.15: Distribuio dos coeficientes DCT para a banda AC (b3) de mais alta frequncia espacial da sequncia Soccer, QCIF. Figura 4.16: Quantizador escalar uniforme sem um intervalo de quantizao simtrico em torno da amplitude zero. Figura 4.17: problema de quantizao dos coeficientes AC usando um quantizador sem um intervalo de quantizao simtrico em torno da amplitude zero. Figura 4.18: Quantizador escalar uniforme com um intervalo de quantizao simtrico em torno da amplitude zero. Figura 4.19: 18 matrizes de quantizao associadas a diferentes desempenhos taxa-distoro, onde cada elemento da mesma o nmero de nveis de quantizao da banda correspondente quela posio. Figura 4.20: 8 matrizes de quantizao associadas a diferentes
PUC-Rio - Certificao Digital N 0610789/CA

94

95

95

96

97

106

desempenhos taxa-distoro, onde cada elemento da mesma o nmero de nveis de quantizao da banda correspondente quela posio. Figura 4.21: PSNR do frame Wyner-Ziv utilizando diferentes tcnicas de quantizao, para sequncia Foreman, com QP = 26 (intra) e TQ = 18 (nvel de qualidade). Figura 4.22: PSNR do frame Wyner-Ziv utilizando diferentes tcnicas de quantizao, para sequncia News, com QP = 26 (intra) e TQ = 18 (nvel de qualidade). Figura 4.23: PSNR do frame Wyner-Ziv utilizando diferentes tcnicas de quantizao, para sequncia Coastguard, com QP = 26 (intra) e TQ = 18 (nvel de qualidade). Figura 4.24: PSNR do frame Wyner-Ziv utilizando diferentes tcnicas de quantizao, para sequncia Soccer, com QP = 26 (intra) e TQ = 18 (nvel de qualidade). Figura 4.25: PSNR do frame Wyner-Ziv utilizando diferentes tcnicas de quantizao, para sequncia Foreman, com QP = 36 (intra) e TQ = 7 (nvel de qualidade). Figura 4.26: PSNR do frame Wyner-Ziv utilizando diferentes tcnicas de quantizao, para sequncia News, com QP = 36 (intra) 112 111 111 110 110 106

e TQ = 7 (nvel de qualidade). Figura 4.27: PSNR do frame Wyner-Ziv utilizando diferentes tcnicas de quantizao, para sequncia Coastguard, com QP = 36 (intra) e TQ = 7 (nvel de qualidade). Figura 4.28: PSNR do frame Wyner-Ziv utilizando diferentes tcnicas de quantizao, para sequncia Soccer, com QP = 36 (intra) e TQ = 7 (nvel de qualidade). Figura 4.29: PSNR do frame Wyner-Ziv codificando-se diferentes quantidades de bitplanes, para sequncia Foreman, com QP = 27 (intra) e TQ = 18 (nvel de qualidade). Figura 4.30: PSNR do frame Wyner-Ziv codificando-se diferentes quantidades de bitplanes, para sequncia News, com QP = 27 (intra) e TQ = 18 (nvel de qualidade). Figura 4.31: (a) frame WZ original da sequncia Foreman; (b)
PUC-Rio - Certificao Digital N 0610789/CA

112

113

113

116

116

frame WZ reconstrudo considerando todos os bitplanes; (c) excluindo-se o bitplane menos significativo; (d) excluindo-se os dois bitplanes menos significativos; (e) excluindo-se os trs bitplanes menos significativos. Figura 4.32: (a) frame WZ original da sequncia News; (b) frame WZ reconstrudo considerando todos os bitplanes; (c) excluindo-se o bitplane menos significativo; (d) excluindo-se os dois bitplanes menos significativos; (e) excluindo-se os trs bitplanes menos significativos. Figura 4.33: Probabilidade condicional do bit x2,j dada a informao lateral yj e que o bit anterior, x1,j, foi estimado com valor igual 1. Figura 4.34: PSNR para diferentes nveis de estimao do parmetro laplaciano, para a sequncia Foreman, QCIF, com QP = 32 (intra) e TQ = 9 (WZ). Figura 4.35: PSNR para diferentes nveis de estimao do parmetro laplaciano, para a sequncia News, QCIF, QP = 32 (intra) e TQ = 9 (WZ). Figura 4.36: PSNR para diferentes nveis de estimao do parmetro laplaciano, sequncia Coastguard, QCIF, QP = 32 (intra) e TQ = 9 (WZ). Figura 4.37: PSNR para diferentes nveis de estimao do parmetro laplaciano, para a sequncia Soccer, QCIF, QP = 32 (intra) e TQ = 9 (WZ). 137 137 136 136 124 118 117

Figura 4.38: PSNR para decodificao com e sem a utilizao da modelagem do canal de correlao, para a sequncia Foreman, QCIF, com QP = 32 (intra) e TQ = 9 (WZ). Figura 4.39: PSNR para decodificao com e sem a utilizao da modelagem do canal de correlao, para a sequncia News, QCIF, com QP = 32 (intra) e TQ = 9 (WZ). Figura 4.40: hipteses de estimao de movimento do frame atual. Figura 4.41: Processo de gerao da informao lateral Proposto Figura 4.42: Componentes bsicos do processo de estimao direta de movimento Figura 4.43: (a) estimao direta do movimento passando pelo frame interpolado Y2i. (b) projeo dos blocos utilizados na estimao do movimento. Figura 4.44: interpolao a partir do processo de compensao
PUC-Rio - Certificao Digital N 0610789/CA

138

138 141 142

144

145

do movimento, apresentando vrias estimaes associadas a um nico ponto do frame interpolado. Figura 4.45: Sentido e direo dos vetores de movimento na estimao reversa. Figura 4.46: PSNR da informao lateral ao longo da sequncia para diferentes mtodos de estimao de movimento, sequncia Foreman, com QP = 40 (intra), macrobloco 8x8. Figura 4.47: PSNR da informao lateral ao longo da sequncia para diferentes mtodos de estimao de movimento, sequncia News, com QP = 40 (intra), macrobloco 8x8. Figura 4.48: Nmero mdio de buscas por macrobloco, para diferentes mtodos, para a sequncia Foreman, com QP = 40 (intra), macrobloco 8x8. Figura 4.49: Nmero mdio de buscas por macrobloco, para diferentes mtodos, para a sequncia News, com QP = 40 (intra), macrobloco 8x8. Figura 4.50: PSNR da informao lateral ao longo da sequncia para diferentes mtodos de estimao de movimento, sequncia Foreman, com QP = 26 (intra), macrobloco 8x8. Figura 4.51: PSNR da informao lateral ao longo da sequncia para diferentes mtodos de estimao de movimento, sequncia News, com 153 152 152 151 151 149 147

QP = 26 (intra), macrobloco 8x8. Figura 4.52: Nmero mdio de buscas por macrobloco, para diferentes mtodos, para a sequncia Foreman, com QP = 26 (intra), macrobloco 8x8. Figura 4.53: Nmero mdio de buscas por macrobloco, para diferentes mtodos, para a sequncia News, com QP = 26 (intra), macrobloco 8x8. Figura 4.54: PSNR da informao lateral para diferentes mtodos de estimao de movimento, sequncia Foreman, com QP = 40 (intra), macrobloco 16x16. Figura 4.55: PSNR da informao lateral ao longo da sequncia para diferentes mtodos de estimao de movimento, sequncia News, com QP = 40 (intra), macrobloco 16x16. Figura 4.56: Nmero mdio de buscas por macrobloco, para diferentes mtodos, sequncia Foreman, com QP = 40 (intra), macrobloco 16x16. Figura 4.57: Nmero mdio de buscas por macrobloco, para diferentes
PUC-Rio - Certificao Digital N 0610789/CA

153

154

154

155

155

156

mtodos, para a sequncia News, com QP = 40 (intra), macrobloco 16x16. Figura 4.58: PSNR da informao lateral para diferentes mtodos de estimao de movimento, sequncia Foreman, com QP = 26 (intra), macrobloco 16x16. Figura 4.59: PSNR da informao lateral ao longo da sequncia para diferentes mtodos de estimao de movimento, sequncia News, com QP = 26 (intra), macrobloco 16x16. Figura 4.60: Nmero mdio de buscas por macrobloco, para diferentes mtodos, sequncia Foreman, com QP = 26 (intra), macrobloco 16x16. Figura 4.61: Nmero mdio de buscas por macrobloco, para diferentes mtodos, para a sequncia News, com QP = 26 (intra), macrobloco 16x16. Figura 4.62: Pixels descobertos no frame interpolado devido estimao de movimento no partir do centro dos blocos do frame interpolado [70]. Figura 4.63: Exemplo de disposio de blocos resultantes da estimao e compensao do movimento no frame interpolado. Figura 4.64: Disposio dos blocos resultantes da compensao de movimento, no frame interpolado: (a) utilizando blocos 8x8; (b) utilizando blocos 16x16. Figura 4.65: Mtodo de extrapolao proposto neste trabalho.

156

157

157

158

158

159

160

160 163

Figura 4.66: Frame WZ reconstrudo utilizando a seguinte tcnica de gerao da informao lateral: (a) Interpolao simples; (b) Interpolao ponderada (proposta); (c) Mtodo proposto (d) Frame WZ original da sequncia Foreman. Figura 4.67: Frame WZ 138 reconstrudo utilizando a seguinte tcnica de gerao da informao lateral: (a) interpolao simples; (b) Interpolao ponderada (proposta); (c) Mtodo proposto (d) Frame WZ original da sequncia News. Figura 4.68: Frame WZ 138 reconstrudo utilizando a seguinte tcnica de gerao da informao lateral: (a) interpolao simples; (b) Interpolao ponderada (proposta); (c) Mtodo proposto (d) Frame WZ original da sequncia Soccer. Figura 4.69: Frame WZ 138 reconstrudo utilizando a seguinte tcnica de gerao da informao lateral: (a) interpolao simples;
PUC-Rio - Certificao Digital N 0610789/CA

165

166

166

(b) Interpolao ponderada (proposta); (c) Mtodo proposto (d) Frame WZ original da sequncia Coastguard. Figura 4.70: PSNR para as diversas etapas do processo de gerao da informao lateral, para a sequncia Foreman, QCIF, com passo de quantizao QP = 24 (intra). Figura 4.71: PSNR para as diversas etapas do processo de gerao da informao lateral, para a sequncia News, QCIF, com passo de quantizao QP = 24 (intra). Figura 4.72: PSNR para as diversas etapas do processo de gerao da informao lateral, para a sequncia Coastguard, QCIF, com passo de quantizao QP = 24 (intra). Figura 4.73: PSNR para as diversas etapas do processo de gerao da informao lateral, para a sequncia Soccer, QCIF, com passo de quantizao QP = 24 (intra). Figura 4.74: PSNR para as diversas etapas do processo de gerao da informao lateral, para a sequncia Foreman, QCIF, com passo de quantizao QP = 38 (intra). Figura 4.75: PSNR para as diversas etapas do processo de gerao da informao lateral, para a sequncia News, QCIF, com passo de 171 171 170 170 169 167

quantizao QP = 38 (intra). Figura 4.76: PSNR para as diversas etapas do processo de gerao da informao lateral, para a sequncia Coastguard, QCIF, com passo de quantizao QP = 38 (intra). Figura 4.77: PSNR para as diversas etapas do processo de gerao da informao lateral, para a sequncia Soccer, QCIF, com passo de quantizao QP = 38 (intra). Figura 4.78: PSNR do frame Wyner-Ziv utilizando diferentes fatores de normalizao, para sequncia Foreman, com QP = 38 (intra) e TQ = 7 (WZ). Figura 4.79: PSNR do frame Wyner-Ziv utilizando diferentes fatores de normalizao, para sequncia News, com QP = 38 (intra) e TQ = 7 (WZ). Figura 4.80: PSNR do frame Wyner-Ziv utilizando diferentes
PUC-Rio - Certificao Digital N 0610789/CA

172

172

173

174

175

fatores de normalizao, para sequncia Coastguard, com QP = 38 (intra) e TQ = 7 (WZ). Figura 4.81: PSNR do frame Wyner-Ziv utilizando diferentes fatores de normalizao, para sequncia Soccer, com QP = 38 (intra) e TQ = 7 (WZ). Figura 4.82: Comparao entre o valor mdio dos pixels do frame WZ e da informao lateral, para sequncia News. Figura 4.83: Comparao entre o valor mdio dos pixels do frame WZ e da informao lateral, para sequncia Foreman. Figura 4.84: Frames resultantes do processo de: (a) interpolao ponderada da estimao bidirecional de movimento 8x8; (b) interpolao ponderada da estimao bidirecional de movimento 16x16; (c) extrapolao do frame interpolado; (d) normalizao da informao lateral; (e) frame WZ original. Figura 4.85: Procedimento de reconstruo de cada coeficiente DCT da banda bk: (a) Caso I, (b) Caso II, (c) Caso III. Figura 4.86: PSNR mdia para a sequncia Foreman, para 3 nveis diferentes de qualidade (QP, TQ) versus tempo de processamento. Figura 4.87: Variao da PSNR do frames WZ, ao longo dos da 184 182 178 177 176 176 175

sequncia Foreman, para diferentes passos de quantizao intraframe e diferentes qualidades: {QP=24, TQ=18},{QP=28, TQ=10},{QP=32, TQ=4}. 185 Figura 4.88: PSNR do frame Wyner-Ziv, substituindo-se as bandas com nmero de nveis igual a zero pelas correspondentes da informao lateral, para sequncia News, com QP = 28 (intra) e TQ = 13 (WZ). Figura 4.89: PSNR do frame Wyner-Ziv, substituindo-se as bandas com nmero de nveis igual a zero pelas correspondentes da informao lateral, para sequncia News, com QP = 28 (intra) e TQ = 13 (WZ). 186 186

PUC-Rio - Certificao Digital N 0610789/CA

Lista de Tabelas

Tabela 4.1: Mtodos de clculo da faixa dinmica do coeficiente DC Tabela 4.2: Composio dos bitplanes da k-sima banda. Tabela 4.3: nmero total de bits transmitidos por banda, conforme o nmero de bitplanes codificados. Tabela 4.4: PSNR mdia e nmero de parmetros laplacianos que necessitam ser calculados em funo do nvel de granularidade.

105 112

113

133

PUC-Rio - Certificao Digital N 0610789/CA

Lista de Algoritmos

Algoritmo 4.1: clculo do passo de quantizao baseado no mtodo dvc Algoritmo 4.2: clculo do passo de quantizao para o mtodo proposto Algoritmo 4.3: verificao do grau de confiabilidade em relao aos bits decodificados Algoritmo 4.4: clculo do frame interpolado Algoritmo 4.5: interpolao baseada na quantidade de movimento Algoritmo 4.6: extrapolao de pixels Algoritmo 4.7: reconstruo dos coeficientes DCT

106 107

124 145 161 162 180

PUC-Rio - Certificao Digital N 0610789/CA

Lista de Siglas e Abreviaturas

ADSL APP ARPS AVC BCJR BP Codec Coset CRC DCT DS


PUC-Rio - Certificao Digital N 0610789/CA

Asynchronous Digital Subscriber Line A Posteriori Probability Adaptive Rood Pattern Search Advanced Video Coding Bahl-Cocke-Jelinek-Raviv Belief Propagation Codificador e decodificador Codeword set Cyclic Redundancy Check Discrete Cosine Transform Diamond Search Distributed Source Coding Distributed Video Coding extended Irregular Repeat Accumulate Exhaustive Search Group of Pictures Human Visual System Inverse Discrete Cosine Transform International Telecommunication Union - Telecomunications Transformada de Karhunen-Love Low Density Parity-Check LDPC Acumulado LDPC Irregular, Acumulado e Adaptativo Log-Likelihood Ratio Least Significant Bits Mean Absolute Difference Maximum A Posteriori Maximum Likelihood Multimedia Messaging Service Moving Picture Experts Group

DSC DVC eIRA ES GOP HVS IDCT ITU-T KLT LDPC LDPCA LIA LLR LSB MAD MAP ML MMS MPEG

MSB MSE MV NCC NTSS PDWZ PRISM

Most Significant Bits Mean Square Error Motion Vector Nmero de Casos Confiveis New Three Step Search Pixel Domain Wyner-Ziv Power-efficient, Robust, high compression, Syndrome-based Multimedia (coding)

PSNR QCIF QP RCPT RD SISO


PUC-Rio - Certificao Digital N 0610789/CA

Peak Signal-to-Noise Ratio Quarter Common International Format Quantization Parameter Rate-Compatible Punctured Turbo Rate-Distortion Soft Input-Soft Output Sum-Product Simple and Efficient TSS Four Step Search Transform Domain Wyner-Ziv Tabela de Quantizao Three Step Search Wyner-Ziv

SP SES 4SS TDWZ TQ TSS WZ

Anda mungkin juga menyukai