Anda di halaman 1dari 171

Captulo 3

Compresso de Dados
Multimdia
Roberto Willrich
INE - CTC-UFSC
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

2
Cap 3. Compresso de Dados Multimdia
Contedo:
Necessidade de compresso
Princpios da compresso
Classificao das tcnicas de compresso
Medio do desempenho de compresso
Tcnicas de compresso sem perdas
RLE, Huffman, LZW (GIF)
Tcnicas de compresso de udio, vdeo e imagens
Tcnicas de compresso de voz
Tcnicas de compresso de som
Padres de compresso multimdia
JPEG, MPEG, MPEG-4, H.261, H.263
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

3
Necessidade da compresso
Tcnicas de compresso so essenciais para as
aplicaes multimdia, devido
Ao grandes requisito de espao para armazenamento
de dados multimdia
A largura de banda da rede que no permite a
transmisso de mdia em tempo-real
A pequena largura de banda dos dispositivos de
armazenamento que no podem apresentar dados
multimdia em tempo-real
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

4
Requisitos das Informaes multimdia
Requisitos de espao para armazenamento





Aplicao multimdia tpica contm
30 minutos de vdeo, 2000 imagens e 40 minutos de som estreo
aplicao necessitaria de 50 GBytes para armazenar o vdeo, 15
Gbytes para armazenar as imagens e 0,4 GBytes para armazenar o
udio (total de 65,4 Gbytes)
necessria a utilizao de tcnicas de compresso de dados
multimdia para viabilizar o armazenamento
Aplicaes Requisitos de
Armazenamento (MBytes)
Livro de 500 pginas 1
100 imagens monocr. 7
100 imagens coloridas 100
1h de udio qual. telefone 28,8
1h de udio-CD 635
1h Vdeo qual. VHS 24300
1h TV 97000
1h HDTV 389000

R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

5
Requisitos das Informaes multimdia
Requisitos de largura de banda






Transmisso de som de qualidade CD no compactado
possvel em redes locais
10 Mbits/s (Ethernet) e 100 Mbits/s (fast Ethernet)
redes de media e longa distncia este taxa torna-se atualmente
invivel
Transmisso de vdeo de qualidade televiso
incompatvel com qualquer rede local e transmisso em WAN
Aplicaes Taxa de bits (Kbps)
CD-Audio 1.411
DAT 1.536
Telefone Digital 64
Radio digital, long play DAT 1.024
Vdeo de qualidade televiso 216.000
Vdeo de qualidade VHS 54.000
HDTV 864.000

R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

6
Necessidade da compresso
Pequena largura de banda dos dispositivos de armazenamento
No possvel apresentar vdeo no compactado em tempo-real devido a
taxa de bits insuficiente de alguns dispositivos de armazenamento
Dispositivo de armazenamento deveria ter uma taxa de 30 MBytes/s
para apresentar um vdeo em tempo real com um quadro de 620x560
pixeis a 24 bits por pixel a 30 fps
1x no CD = 150 kBps (velocidade para cd udio)
1x no DVD = 1,32 MBps
tecnologia de CD-ROM de hoje fornece
uma taxa de transferncia de 7,62 MBps
(x52) a 10,8 MBps (x70)
nica soluo compactar o dado antes
de armazenar e descompactar ele antes
da apresentao
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

7
Necessidade da compresso
Concluso
necessrio compactao afim de armazenar,
apresentar e transmitir informaes
multimdia
tcnicas de compresso modernas reduzem os requisitos de
armazenamento e portanto os requisitos de largura de banda da rede
e do dispositivo de armazenamento
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

8
Princpios da Compresso de Dados
Fatores explorados pelas tcnicas de compresso
Redundncia de dados
Propriedades da percepo humana
Redundncia de Dados
Representao de dados multimdia
udio digital uma srie de valores amostrados
imagem uma matriz de valores amostrados (pxeis)
vdeo uma seqncia de imagens apresentadas numa certa taxa
Amostras vizinhas no so inteiramente diferentes
valores vizinhos so de algum modo relacionados (redundncia)
Remoo da redundncia no altera o significado do dado
Princpios da Compresso de Dados
Redundncia em udio digital
Amostragens adjacentes so similares:
prximo valor pode ser previsto baseado no valor atual
tcnicas de compresso: Codificao preditiva

R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

9
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

10
Princpios de Compresso: Redundncia
Redundncia em imagem digital
Amostras vizinhas so similares
chamada de redundncia espacial
removida utilizando tcnicas de codificao predictiva ou outras
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

11
Princpios de Compresso: Redundncia
Redundncia em vdeo digital
Vdeo uma seqncia de imagens
imagens tem redundncia espacial
Imagens vizinhas so normalmente similares
redundncia temporal
removida utilizando tcnicas de codificao predictiva ou outras
Princpios de Compresso:
Propriedades Percepo Humana
Humanos no so perfeitos
Podem tolerar alguns erros de informao
ou perdas sem afetar a efetividade da
comunicao
verso compactada no necessita representar
exatamente a informao original
Em dados alfanumricos no se tolera
qualquer erro ou perda
Algumas informaes so mais
importantes para a percepo humana
que outras
Tcnicas de compresso podem remover
informaes desnecessrias
udios mascarados, intensidade luminosas/cor R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

12
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

13
Classificao das Tcnicas de Compresso
Sem perda (Codificao por Entropia):
Dado original pode ser exatamente reconstrudo (reversvel)
Tcnica genrica: trata cadeias de bytes sem levar em conta seu
significado
tcnicas de compresso sem perda exploram apenas estatsticas de
dados (redundncia de dados)
baixas taxa de compresso
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

14
Classificao das Tcnicas de Compresso
Com perda (codificao na origem)
utilizado em dados multimdia onde erros e perdas so tolerveis
leva em considerao a semntica dos dados
removendo dados irrelevantes compactando o dado original
utiliza propriedades da percepo humana
altas taxa de compresso
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

15
Classificao das Tcnicas de Compresso
Codificaes Hbridas
Combinam tcnicas com perda e sem perdas
vrias tcnicas so agrupadas para formar uma nova tcnica de
codagem
Taxa de compresso mais altas
Descarta dados
irrelevantes para
a percepo
(com perdas)
Elimina
Redundncia
(sem perdas)
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

16
Parmetros de Desempenho
Taxa de compresso
tamanho do dado original/tamanho do dado aps a compresso
para sem perdas: quanto maior esta taxa melhor a tcnica
Qualidade da mdia reconstituda (para tcnicas com perda)
medida em SNR (Razo Sinal/Rudo)
maior SNR melhor a qualidade
Complexidade de implementao e velocidade de
compresso
importante para aplicaes tempo-real (como videoconferncia)
compresso e descompresso devem ser realizadas em tempo-real
para aplicaes de obteno e apresentao de informao:
velocidade de compresso no muito importante
velocidade de descompresso importante
Tcnicas de compresso sem perdas
Codificao RLE (Codificao por entropia)
Tcnica simples de compresso de dados
Aplicao: formatos padres como PCX, BMP (RLE) e Photoshop
BMP RLE suporta 256 cores
Dados podem ser compactados atravs da supresso de
seqncias de mesmos smbolos
Um exemplo simples
Original:
WWWWWWWWWWWWBWWWWWWWWWWWWBBBWWWW
WWWWWWWWWWWWWWWWWWWWBWWWWWWWWWW
WWWW
Compactado: 12W1B12W3B24W1B14W

R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

17
Tcnicas de compresso sem perdas
Codificao RLE (Codificao por entropia)
Tem diversas variaes
Seqncias idnticas so substitudas por um smbolo especial, nmero de
ocorrncias e o smbolo repetido
Original: UHHHHHHIMMG1223
Compactado: U!6HIMMG1223
Se o smbolo especial ocorrer no dado de entrada, ele deve ser substitudo por dois
smbolos
entrada: U!HIIIIID
sada: U!!H!5ID
Tcnica no utilizada para seqncias menores que 4
exemplo: U!6HI!2MG1223 (no a compactao)
Algoritmo pode ser facilmente otimizado
pode-se substituir seqncias maiores que um
requer que o tamanho da seqncia seja codificado ou pode-se usar um caractere
especial de fim
entrada: UFYUGDUFHUFHUFHUFHUFHBFD
sada: UFYUGD!5UFH$BFD
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

18
Tcnicas de compresso sem perdas
Codificao RLE (Codificao por entropia)
Mais uma variao (Modified Huffman coding)
Considere a codificao Run-Length de uma imagem binria de FAX
cujas primeiras linhas de varredura so mostras a seguir
ImagemFAX={
11111111111000000000000000000000011111111111111111
00000000000000111111111111111111110000000000000000
}
Cdigo RLC=[....11,22,17,EOL,0,14,20,16,EOL,...]
Tcnicas de compresso sem perdas
Codificao RLE (Codificao por entropia)
Fator de compresso depende do dado de entrada
Demonstrao usando BMP RLE
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

20
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

21
Tcnicas de compresso sem perdas
Codificao Run-Length
S traz ganhos relevantes se houver grandes agrupamentos de
smbolos iguais
As principais aplicaes so imagens bitmap
em imagens com grandes espaos envolvendo uma s cor
em imagens geradas por computador
onde os dados esto agrupados de forma mais geometricamente
definida
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

22
Tcnicas de compresso sem perdas
Codificao de Huffman (Codificao Estatstica)
Mtodo que atribui menos bits a smbolos que aparecem mais
freqentemente e mais bits para smbolos que aparecem menos
Idia usada no cdigo de Morse
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

23
Tcnicas de compresso sem perdas
Codificao de Huffman (Codificao Estatstica)
Exemplo de funcionamento:
suponha um arquivo de 1000 smbolos: e, t, x, z.
frequncia de ocorrncia: e = 0.8, t = 0.16, x = 0.02 e z = 0,02
necessitamos de 2 bits para representar cada um dos 4 smbolos
e = 00, t = 01, x = 10 e z = 11
arquivo ter um tamanho de 2*1000=2000 bits
usando Codificao de Huffman podemos usar quantidades
diferentes para representar estes smbolos (de acordo com a
frequncia de ocorrncia)
e = 0, t = 10, x = 110 e z = 111
tamanho do arquivo seria 1000*(1*0.8+2*0.16+3*0.02+3*0.02) = 1240
apesar de x e z terem sido representados com um maior nmero de bits,
o arquivo ser menor pois eles ocorrem menos
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

24
Tcnicas de compresso sem perdas
Codificao de Huffman (Original)
Gerao dos cdigos Huffman
a) colocao dos smbolos ao longo de uma linha de probabilidade
acumulada (probabilidade aumenta de baixo para cima)
smbolos de mesma frequncia: colocar em qualquer ordem
0
1.00
0.02 z(0.02)
0.04 x(0.02)
0.20
t(0.16)
e(0.80)
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

25
Tcnicas de compresso sem perdas
Codificao de Huffman
Gerao dos cdigos Huffman
b) Junta-se os dois smbolos de menor probabilidade a um n para
formar dois ramos na rvore
0
1.00
0.02 z(0.02)
0.04 x(0.02)
0.20
t(0.16)
e(0.80)
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

26
Tcnicas de compresso sem perdas
Codificao de Huffman
Gerao dos cdigos Huffman
b) Junta-se os dois smbolos de menor probabilidade a um n para
formar dois ramos na rvore
0
1.00
0.02 z(0.02)
0.04 x(0.02)
0.20
t(0.16)
e(0.80)
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

27
Tcnicas de compresso sem perdas
Codificao de Huffman
Gerao dos cdigos Huffman
c) Nova rvore formada tratada como um smbolo nico com a
probabilidade igual a soma dos smbolos ramos
0
1.00
0.02 z(0.02)
0.04 x(0.02)
0.20
t(0.16)
e(0.80)
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

28
Tcnicas de compresso sem perdas
Codificao de Huffman
Gerao dos cdigos Huffman
d) Repita b) e c) at que todos os smbolos sejam inseridos na rvore
ltimo n chamado de raiz
N raiz
0
1.00
0.02 z(0.02)
0.04 x(0.02)
0.20
t(0.16)
e(0.80)
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

29
Tcnicas de compresso sem perdas
Codificao de Huffman
Gerao dos cdigos Huffman
d) Repita b) e c) at que todos os smbolos sejam inseridos na rvore
ltimo n chamado de raiz
N raiz
0
1.00
0.02 z(0.02)
0.04 x(0.02)
0.20
t(0.16)
e(0.80)
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

30
Tcnicas de compresso sem perdas
Codificao de Huffman
Gerao dos cdigos Huffman
e) Partindo do n raiz, atribua bit 0 ao ramo de maior prioridade e bit 1
ao ramo de menor prioridade de cada n
0
1
1
1
0
0
N raiz
0
1.00
0.02 z(0.02)
0.04 x(0.02)
0.20
t(0.16)
e(0.80)
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

31
Tcnicas de compresso sem perdas
Codificao de Huffman
Gerao dos cdigos Huffman
f) Cdigo para cada smbolo obtido montando cdigos ao longo do
caminho entre n raiz ao smbolo
Smbolo Cdigo
e
t
x
z
0
10
110
111
0
1
1
1
0
0
N raiz
0
1.00
0.02 z(0.02)
0.04 x(0.02)
0.20
t(0.16)
e(0.80)
Tabela chamada
de codebook
Exemplo de Codificao de Huffman
Exerccio mais
completo
Freqncias dos
caracteres
Gere a tabela de
Huffman para o
arquivo.
125

Freq
93

80

76

73

71

61

55

41

40

E

Char
T

A

O

I

N

R

H

L

D

31

27

C

U

65

S

0000

Fixo
0001

0010

0011

0100

0101

0111

1000

1001

1010

1011

1100

0110

838

Total

4.00

Exemplo de Codificao de Huffman
R S N I
E
H
C U
31 27
55
71 73 61 65
125
40
T
D L
41
93
A O
80 76
Exemplo de Codificao de Huffman
R S N I
E
H
C U
58
D L
A O T
31 27
55
71 73 61 65
125
40 41
93
80 76
Exemplo de Codificao de Huffman
R S N I
E
H
C U
58
D L
81
A O T
31 27
55
71 73 61 65
125
40 41
93
80 76
Exemplo de Codificao de Huffman
R S N I
E
H
C U
58
113
D L
81
A O T
31 27
55
71 73 61 65
125
40 41
93
80 76
Exemplo de Codificao de Huffman
R S N I
E
H
C U
58
113 126
D L
81
A O T
31 27
55
71 73 61 65
125
40 41
93
80 76
Exemplo de Codificao de Huffman
R S N I
E
H
C U
58
113 144 126
D L
81
A O T
31 27
55
71 73 61 65
125
40 41
93
80 76
Exemplo de Codificao de Huffman
R S N I
E
H
C U
58
113 144 126
D L
81
156
A O T
31 27
55
71 73 61 65
125
40 41
93
80 76
Exemplo de Codificao de Huffman
R S N I
E
H
C U
58
113 144 126
D L
81
156 174
A O T
31 27
55
71 73 61 65
125
40 41
93
80 76
Exemplo de Codificao de Huffman
R S N I
E
H
C U
58
113 144 126
238
T
D L
81
156 174
A O
71 73 61 65
40 41
93
80 76
125
Exemplo de Codificao de Huffman
R S N I
E
H
C U
58
113 144 126
238
270
T
D L
81
156 174
A O
31 27
55
71 73 61 65
125
40 41
93
80 76
Exemplo de Codificao de Huffman
R S N I
E
H
C U
58
113 144 126
238
270
330
T
D L
81
156 174
A O
31 27
55
71 73 61 65
125
40 41
93
80 76
Exemplo de Codificao de Huffman
R S N I
E
H
C U
58
113 144 126
238
270
330 508
T
D L
81
156 174
A O
31 27
55
71 73 61 65
125
40 41
93
80 76
Exemplo de Codificao de Huffman
R S N I
E
H
C U
58
113 144 126
238
270
330 508
838
T
D L
81
156 174
A O
31 27
55
71 73 61 65
125
40 41
93
80 76
Exemplo de Codificao de Huffman
R S N I
E
H
C U
58
113 144 126
238
270
330 508
838
T
D L
81
156 174
A O
31 27
55
71 73 61 65
125
40 41
93
80 76
0
0
0
1
1
1
1
0
0
1
1
1
0
0
0
1
0
1
1
0
0
1
0
1
Exemplo de Codificao de Huffman
125

Freq
93

80

76

73

71

61

55

41

40

E

Char
T

A

O

I

N

R

H

L

D

31

27

C

U

65

S

0000

Fixo
0001

0010

0011

0100

0101

0111

1000

1001

1010

1011

1100

0110

000

Huff
100

110

111

0100

0101

0111

0011

1010

1011

00100

00101

0110

838

Total

4.00

3.62

R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

48
Tcnicas de compresso sem perdas
Codificao de Huffman
Operao computacional mais custosa
adio de floats (probabilidades)
ocorre no lado do codificador
No decodificador
realiza uma simples verificao na tabela de Huffman
tabela de Huffman parte do fluxo de dados ou conhecida pelo
decodificador
Tabelas de Huffman padres so muito usadas
usada para vdeo em tempo-real
tabelas so conhecidas pelo codificador e decodificador
codificao e decodificao so mais rpidas
desvantagem: tabelas padres obtm fator de compresso um pouco
menores
elas no so necessariamente timas
Tcnicas de compresso sem perdas
Lempel-Ziv (LZ)
Algoritmos de codificao baseada em dicionrio
Finais dos anos 70, Jacob Ziv e Abraham Lempel
Muitas variantes com objetivo de solucionar limitaes das verses
originais

R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

49
Tcnicas de compresso sem perdas
Codificaes derivadas do Lempel-Ziv (LZ)
Explora a redundncia de dados -> a repetio de padres
(partes) de smbolos no arquivo.
baseada na construo de um dicionrio de smbolos (grupos de
um ou mais smbolos) a partir do fluxo de entrada
Ilustrao em um arquivo de texto
Quando uma nova frase encontrada
a mquina de compresso adicionada a frase dicionrio
um token que identifica a posio da frase no dicionrio substitui a
frase no documento
Se a frase j foi registrada
ela substituda pelo token de sua posio no dicionrio
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

50
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

51
Tcnicas de compresso sem perdas
Codificaes derivadas do Lempel-Ziv (LZ)
Exemplo do poder da codagem LZW
suponha que temos um arquivo de 10000 caracteres
se ns representarmos o arquivo usando 8 bits por caractere, o
arquivo requer 80000 bits para represent-lo
assumindo que o arquivo tenha 2000 palavras ou frases das quais
500 so diferentes
necessitamos 9 bits como token para identificar cada palavra ou frase
precisamos de 9*2000 bits para codificar o arquivo
obtemos uma taxa de compresso de 4,4
na prtica, o dicionrio armazenando todas as frases nicas deve ser
armazenado tambm
baixando a taxa de compresso obtida
Tcnicas de compresso sem perdas
Exemplo de compactao LZW
Compresso da cadeia de caracteres ABACABA
Primeiro passo: inicializar um dicionrio de cdigos com todos os
caracteres existentes na string que pretendemos compactar:
#0 = A, #1 = B, #2 = C
Caractere A (existe na tabela) ABACABA
representamos A por #0
AB recebe #3
Caractere B (existe na tabela) ABACABA
representamos AB por #0#1
BA recebe #4
Caractere A (existe na tabela) ABACABA
representamos ABA por #0#1#0
junta AC na tabela com ndice #5
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

52
Tcnicas de compresso sem perdas
Exemplo de compresso LZW
Compresso da cadeia de caracteres ABACABA
Dicionrio atual:
#0 = A, #1 = B, #2 = C, #3 = AB, #4 = BA, #5 = AC
Caractere C (existe na tabela) ABACABA
representamos ABAC por #0#1#0#2
CA recebe #6
Caractere AB (existe na tabela) ABACABA
representamos ABACAB por #0#1#0#2#3
ABA recebe #7
Caractere A (existe na tabela)
representamos ABACABA por #0 #1 #0 #2 #3 #0
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

53
Codificao derivadas do Lempel-Ziv (LZ)
Aplicaes
UNIX Compression
O algoritmo LZC usado pelo utilitrio compress do sistema
operativo UNIX.
GIF (Graphics Interchange Format)
Muito similar ao compress do UNIX, tambm usa o algoritmo
LZW.
Protocolo V.42bis (compresso de dados em Modem)
Usa uma variante do LZW (LZT).
O Zip e o gzip usam uma variante do LZ77 combinada com
Huffman esttico.
O ARJ usa a codificao de Huffman e o algoritmo LZSS.
O WINRAR usa o LZ77 e Huffman.
O WINZIP entre outros algoritmos usa o LZW.

R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

54
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

55
Tcnicas de compresso sem perdas
LZW e o formato de imagem GIF
GIF utiliza a tcnica LZW
GIF um dos formatos de armazenamento de imagens sem
perdas que oferece as melhores taxas de compresso.
taxas de compresso no so grandes, em geral 4:1
GIF apenas admite o tratamento de imagens com uma
profundidade de cor at 8 bits/pixel
imagens com um mximo de 256 cores
ao converter imagem true color, com 24 bits/pixel, para o formato
GIF, estamos perdendo grande parte da informao de cor
Extenso GIF89a permite
definir uma cor transparente
entrelaamento
animao
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

56
Tcnicas de compresso sem perdas
LZW e o formato de imagem GIF
Algoritmo LZW do GIF propriedade da Unisys
era do domnio pblico
Unisys resolveu passar a cobrar uma taxa pela sua utilizao
Este motivo provocou a definio de uma alternativa vlida ao
formato GIF
formato PNG (Portable Network Graphics)
Suporta mltiplos nveis de transparncia
Correo gama para ajuste da exibio da imagem s caractersticas do
monitor
Entrelaamento mais avanado que o GIF
suporta 48-bit truecolor ou 16-bit escalas de cinza
no suporta animao
usa os algoritmos LZ77 e de Huffman (DEFLATE)
Formatos MNG (Multiple-Image Network Graphics) e APNG
Extenses do PNG que suportam animaes
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

57
Compresso de Dados Multimdia
Contedo:
Necessidade de compresso
Princpios da compresso
Classificao das tcnicas de compresso
Medio do desempenho de compresso
Tcnicas de compresso sem perdas
RLE, Huffman, LZW (GIF)
Tcnicas de compresso de udio, vdeo e imagens
Tcnicas de compresso de voz
Tcnicas de compresso de som
Padres de compresso multimdia
JPEG, MPEG, MPEG-4, H.261, H.263
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

58
Tcnicas de Compresso de Vdeo e Imagem
Imagens e vdeos digitais puros so codificadas em PCM
Representados por vetores bi-dimensionais de pxeis
Tcnicas de compresso de vdeo e imagens
Baseiam-se na alta redundncia das imagens e vdeos
Certas reas de figuras so uniformemente coloridas ou
altamente correlatas (podendo formar padres)
redundncia espacial ou correlao espacial
removida tanto quanto possvel para uma certa qualidade de
apresentao
No existem grandes diferenas entre quadros de um vdeo
redundncia temporal ou correlao temporal
alta taxa de compresso
Tcnicas de Compresso de Vdeo e Imagem
Tcnica de Reduo da Resoluo Geomtrica
Reduo da resoluo das imagens
Reduo de linhas e colunas do bitmap
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

59
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

60
Tcnicas de Compresso de Vdeo e Imagem
Tcnica de Truncagem
Consiste em truncar dados arbitrariamente baixando o nmero
de bits por pxel (imagem) ou taxa de quadros (vdeo)
feito pela eliminao dos bits menos significativos de cada pxel
(imagem) e imagens por segundo (vdeo)
Tcnica atrativa pois ela simples





Exemplo: imagens coloridas com 24 bits por pxel poderiam ser
reduzidas para 8 bits
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

61
Tcnicas de Compresso de Vdeo e Imagem
Codificao Predictiva
DPCM (PCM diferencial)
Tcnica mais simples de codificao preditiva
Compara pxeis adjacentes e apenas erros de predio so
quantificados e codificados
Erro de predio tem uma alta probabilidade de ser menor que o valor
do novo pixel
Erro pode ser expresso com uma quantidade menor de bits
na descompresso
informao de erro usado para modificar o(s) pxel(eis)
anterior(es)
ADPCM (DPCM adaptativo)
Existem vrias maneiras de implementar ADPCM, a mais comum
variar o tamanho de passo representado pelos bits diferenas
Exemplo: se um passo preto-para-branco for detectado, pode-se
aumentar o passo de quantificao antes deste passo chegar
Tcnicas de Compresso de Vdeo e Imagem
Codificao Preditiva
Preditores tpicos
2D ordem, 3 de Preditor 0.8 62 . 0 8 . 0
,
^
2D ordem, 2 de Preditor 48 . 0 48 . 0
,
^
1D ordem, 1 de Preditor 97 . 0
^
, 1 1 , 1 1 ,
, 1 1 ,
1
n m n m n m
n m n m
n
s s s
n m
s
s s
n m
s
s
n
s

+ =
+ =
=
s
m-1,n-1
s
m,n-1
s
m-1,n
s
m,n
Tcnicas de Compresso de Vdeo e Imagem
Codificao Preditiva:
Usar para a primeira fila e primeira coluna o preditor de 1
ordem

Para as outras filas e colunas o de 3 ordem.

Sada DPCM calculada subtraindo a sada predita com os valores
originais

Sada prevista Sada DPCM Original
(
(
(
(





(
(
(
(

12 . 3 30 . 0 18 . 2 43 . 1
00 . 2 22 . 2 24 . 4 54 . 1
16 . 0 22 . 0 20 . 0 4 . 1
34 . 0 63 . 1 6 . 1

2 . 16 70 . 14 82 . 13 43 . 18
00 . 14 22 . 16 24 . 19 46 . 17
16 . 19 78 . 19 8 . 18 4 . 19
34 . 21 37 . 20 4 . 19 20 X
(
(
(
(

13 15 16 17
16 14 15 19
19 20 19 18
21 22 21 20
1D ordem, 1 de Preditor 97 . 0
^
1
=
n
s
n
s
2D ordem, 3 de Preditor 0.8 62 . 0 8 . 0
,
^
, 1 1 , 1 1 , n m n m n m
s s s
n m
s

+ =
Tcnicas de Compresso de Vdeo e Imagem
Codificao Preditiva
Imagem original e imagem com apenas o erro de predio
Se os pixeis tiverem valores muito prximos, pode-se usar un
nmero menor de bits para armazenar o erro de predio do que
aquele usado para codificar o valor absoluto
Tcnicas de Compresso de Vdeo
Reviso de Vdeo
Um vdeo uma sequncia de imagens amostradas rapidamente;
A velocidade da amostragem engana o crebro, criando a iluso
de movimento.
65
n-2 n-1 n n+1 n+2 n+3
Foreman 30fps
(30 imagens exibidas a cada segundo)
Tcnicas de Compresso de Vdeo
Preenchimento Condicional
Explora redundncia temporal em vdeos
animao de imagens implica que pxeis na imagem anterior esto em diferentes posies que na
imagem atual
Imagem segmentada em reas estacionarias e com movimento
so transmitidos apenas os dados de reas com movimento
detector de movimento localiza diferenas inter-quadros significantes
Uma forma particular de DPCM onde se envia o erro de predio se este for superior a um
dado limite
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

66
Tcnicas de Compresso de Vdeo
Preenchimento Condicional
Quadro Preditor Quadro Atual





Diferena

R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

67
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

68
Tcnicas de Compresso de Vdeo e Imagem
Estimativa e Compensao de Movimento
Imagem dividida em blocos de tamanho fixos
um casamento para cada bloco procurado na imagem anterior
deslocamento entre estes dois blocos chamado vetor de movimento
uma diferena de blocos obtida calculando diferenas pxel a pxel
Vetor de movimento e a diferena de bloco codificado e transmitido
Tcnicas de Compresso de Vdeo e Imagem
Exemplo simples: Compara a similaridade entre
blocos






Mantm a diferena entre os blocos (resduo);
Cria o vetor de movimento, referenciando o bloco do
quadro anterior;



R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

69
Quadro n (original)
At o fim do
frame...
Escolha do bloco
mais similar
A B C D E F
1

2

3

4

5


(3,D)
Quadro n-1 (referncia)
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

70
Padres de Compresso Multimdia
Vrias tcnicas e produtos para compresso so disponveis
utilizao de padres promove a compatibilidade entre diferentes
equipamentos/aplicaes (interoperabilidade)
Exemplos de formatos de Imagens
PCX: usado por aplicativos grficos mais antigos (256 cores);
GIF: usado para distribuio comercial de imagens sem perda (256
cores)
BMP: padro fundamental do windows
TGA: usado pelos adaptadores grficos Targa e por programas de
animao e processamento de vdeo
Formatos de vdeo
RealVideo, Microsoft RLE, Microsoft Video 1, Microsoft MPEG 4,
Cinepak, Indeo, DivX, VDOWave/VDOLive, ClearVideo
Formato de udio
Wav: padro do windows
voxware
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

71
Padres de Compresso Multimdia
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

72
Padres de Compresso Multimdia
Vrias tcnicas e produtos para compresso so
disponveis
utilizao de padres promove a compatibilidade entre diferentes
equipamentos/aplicaes (interoperabilidade)
Exemplos de padres
TIFF: padro independente de fabricante para imagens
PNG: padro de imagens alternativo ao GIF
ISO JPEG para compresso de imagens;
ISO JBIG para compresso sem perda de imagens bi-nveis (1
bit/pxel) para transmisso fac-smile
ITU-TS H.261 para videofonia e aplicaes de teleconferncias na
taxa de bits mltiplos de 64 Kbps;
ITU-TS H.263 para aplicaes de videofonia na taxa abaixo de 64
Kbps;
ISO MPEG para compresso de vdeo e udio associado;
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

73
Padro de Compresso de Imagens JPEG
JPEG colaborao entre a ISO/IEC e a ITU-TS (1992)
Uma das melhores tecnologia de compresso de imagem
Implementado em software e hardware
Codificao/decodificao JPEG tempo-real tem sido
implementada para vdeo (Motion JPEG - MJPEG)
Compresso parametrizvel
JPEG cobre grande faixa de qualidades de imagens e permite
especificar o comportamento do codificador a partir de
parmetros
Quatro modos de operao:
Codificao seqencial (baseline)
Codificao progressiva
Codificao sem perda
Codificao hierrquica

R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

74
Padro de Compresso de Imagens JPEG
Codificao Seqencial (baseline)
Suportado por toda implementao JPEG
Modo com perdas baseada em DCT
Componentes de imagem so codificados em uma nica varredura da
esquerda para direita e de cima para baixo
Codificao progressiva
Com perdas baseada em DCT expandido
Fornece avanos ao modo baseline
Varreduras sucessivas
imagem compactada em um processo de mltiplas linhas de varredura
Geralmente utilizada em arquivos que so transmitidos pela Internet
pois possibilita a visualizao da imagem inteira, em menor resoluo,
enquanto o restante da imagem esta sendo enviada
Padro de Compresso de Imagens JPEG
Codificao sem perda
Reproduo exata
Necessria em aplicaes que no toleram perdas (mdicas e legais)
Existem duas variaes:
o original, que foi normalizado em 1992, e o novo mtodo JPEG-LS, que
dever deixar obsoleto o formato JPEG lossless original.
A codificao de Huffman aplicada aps a codificao preditiva
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

75
Preditor
Codificao
por
entropia
Imagem
Compactada
Padro de Compresso de Imagens JPEG
Codificao hierrquica
Oferece uma codificao progressiva que aumenta de resoluo
espacial entre estgios progressivos
Verses podem ser acessadas sem a necessidade de primeiro
descompactar a imagem na resoluo completa
Os elementos de imagem das resolues j recebidas so
utilizados na prxima resoluo, diminuindo desta forma o
tamanho do arquivo
Taxa de compresso mais baixa que
ter uma resoluo nica
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

76
Algoritmo de compresso JPEG
Operaes a compresso JPEG (Sequencial)
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

77
FDCT (Forward
Discrete Cosine
Transform)
Algoritmo de compresso JPEG
Transformao do espao de cores para
YCrCb
Componentes RGB da imagem so
convertidos para componentes de luminncia
(Y) e crominncia (Cr e Cb)
Y: Luminncia uma escala de representao
numrica do cinza,
CrCb: Crominncia so duas escalas numricas,
que juntas representam as cores.



YCbCr permite uma maior compresso sem um
efeito significante na qualidade da imagem
percebida.


R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

78
Algoritmo de compresso JPEG
Operaes a compresso JPEG
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

79
FDCT (Forward
Discrete Cosine
Transform)
Algoritmo de compresso JPEG
Subamostragem
Onde feita uma reduo da resoluo das matrizes YCbCr.
Taxas de subamostram que so normalmente aplicados no JPEG
4:4:4 (sem subamostragem)
4:2:2 onde as matrizes de crominncia so reduzidas na taxa de 2:1
horizontalmente (cada duas linhas convertida em uma),
4:2:0 mais comumente adotada, onde a uma reduo do fator 2 nas
direes horizontais e verticais.
A matriz de luminncia no reduzida
pois o olho humano mais sensvel luminncia (tonalidade de
cinza) do que crominncia (tonalidades das cores), o que permite
maior taxa de perda de crominncia sem que esta perda seja
percebida
No resto do processo de compresso, Y, Cb e Cr so processadas
separadamente de maneira muito similar.
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

80
Algoritmo de compresso JPEG
Operaes a compresso JPEG
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

81
FDCT (Forward
Discrete Cosine
Transform)
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

82
Algoritmo de compresso JPEG
Decomposio da imagem em blocos
Imagem decomposta em blocos de 8x8 pxeis
Transformao discreta de co-seno (DCT) dos blocos
Blocos 8x8 so transformado para o domnio da frequncia
espacial usando a transformada DCT
efetua uma separao das componentes de baixa e de alta freqncia
presentes numa imagem
permitindo que se faa uma seleo destas ltimas, de acordo com a
qualidade pretendida para a imagem compactada
maior a taxa de compresso escolhida, maior o nmero de
componentes de alta freqncia desprezados
levando ao aparecimento do efeito de bloco, ou seja, perda de definio
nos contornos das imagens
Algoritmo de compresso JPEG
Transformada Discreta do Coseno
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

84
Algoritmo de compresso JPEG
Transformao discreta de co-seno (DCT) dos blocos
Sinal discreto de 64 pontos (um para cada bloco) transformado
uma funo de duas dimenses espaciais, x e y
estas componentes so chamadas de freqncias espaciais ou
coeficientes DCT
maior parte dos coeficientes DCT so zero ou muito prximo de zero
no necessitam ser codificados
Algoritmo de compresso JPEG
Operaes a compresso JPEG
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

85
FDCT (Forward
Discrete Cosine
Transform)
Algoritmo de compresso JPEG
Quantificao
No domnio da frequncia
as mudanas abruptas que acontecem nos contornos de uma figura esto concentradas
nas frequncias mais altas.
uma imagem com poucos contornos deve concentrar seus coeficientes nas frequncias baixas.
coeficientes das frequncias altas so menos importantes e perdas nesses coeficientes
podem diminuir um pouco a nitidez da imagem, mas para muitas aplicaes isto pode
ser aceitvel.
Quantificao prioriza a baixa frequncia
os coeficientes gerados so quantizados de forma diferenciada, usando uma maior
preciso para as frequncias mais baixas.
Fator de quantificao (Qc) definido pela qualidade selecionada pelo usurio
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

86
Algoritmo de compresso JPEG
Operaes a compresso JPEG
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

87
FDCT (Forward
Discrete Cosine
Transform)
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

88
Algoritmo de compresso JPEG
Ordenao dos coeficientes DCT
Coeficientes DCT so ordenados em uma seqncia zig-zag
para obter uma seqncia unidimensional de dados para ser usado
na codificao por entropia
coeficiente 0
coeficiente 63
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

89
Algoritmo de compresso JPEG
Ordenao dos coeficientes DCT
Propsito do escaneamento zig-zag ordenar os coeficientes em
uma ordem decrescente de freqncias espectral
coeficientes de alta freqncias (no canto direito inferior) tem
valores mais prximos a zero
isto leva a uma maior eficincia da codificao por entropia
coeficiente 0
coeficiente 63
1055 86 40 22 15 10 7 5
53 37 25 17 11 8 6 4
21 21 19 13 9 7 5 4
12 12 11 9 7 5 4 3
7 7 7 7 5 4 3 3
5 5 5 4 4 3 3 3
3 3 3 3 3 3 3 3
3 3 3 3 3 3 3 2

Algoritmo de compresso JPEG
Operaes a compresso JPEG
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

90
FDCT (Forward
Discrete Cosine
Transform)
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

91
Algoritmo de compresso JPEG
Codificao por entropia
Esta etapa fornece uma compresso adicional
JPEG define dois mtodos de codificao por entropia
Codificao de Huffman
nica especificado no modo baseline
Codificao aritmtica
normalmente 10% mais eficiente que a codificao de Huffman
Padro de Compresso de Imagens JPEG
Taxas de compresso obtidas
Quanto maior for a taxa de compresso maior ser o nmero de
componentes de alta freqncia desprezados
para obter taxas de compresso muito elevadas descartado um
nmero significativo de componentes de alta freqncia
levando ao aparecimento do efeito de bloco (perda de definio nos
contornos das imagens).
Valores mdios
Taxas de compresso de 10:1 a 20:1 Alta qualidade de imagem
Taxas de compresso de 30:1 a 50:1 Mdia qualidade de imagem
Taxas de compresso de 60:1 a 100:1 Fraca qualidade de imagem

R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

92
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

93
Algoritmo de compresso JPEG
Taxas de compresso obtidas e qualidades
Alta qualidade
Taxa de 2.6:1





Boa qualidade
Taxa de 15:1



R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

94
Algoritmo de compresso JPEG
Taxas de compresso obtidas e qualidades
Qualidade mdia
Taxa de 23:1





Baixa qualidade
Taxa de 46:1



R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

95
Algoritmo de compresso JPEG
Taxas de compresso obtidas e qualidades
Mais baixa qualidade
Taxa de 144:1





Demonstrao:
http://cgjennings.ca/toybox/hjpeg/










R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

96
Padro de Compresso de Imagens JPEG
JPEG para imagens fotogrficas
JPEG apresenta timas taxas de compresso para imagens
fotogrficas naturais multi-tonais
Qualidade diminui consideravelmente quando aplicado a
imagens grficas com contornos e reas bem definidas de cor, ou
imagens com texto, como o caso dos logotipos
Para imagens grficas e com texto
JPEG introduz rudo nas zonas de imagem compostas por cores
slidas
pode distorcer o aspecto geral da imagem
Imagem PNG ou GIF compactam mais eficazmente que JPEG e
apresenta uma melhor definio dos contornos do texto

R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

97
Algoritmo de compresso JPEG
JPEG para imagens fotogrficas

Imagem GIF (9,4 Kbytes) Imagem JPEG (11,7 Kbytes)





Concluso
imagem GIF comprime mais eficazmente que a JPEG
imagem GIF apresenta uma melhor definio dos contornos do
texto
Tcnicas de Compresso de udio Digital
Caractersticas do udio
Amostras vizinhas so relacionadas
V
a
l
o
r
e
s

d
e

a
m
o
s
t
r
a
s

Amostras
Passos de quantificao
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

99
Tcnicas de Compresso de udio Digital
Codificao Preditiva
Quantifica e codifica a diferena entre uma previso
do valor da amostra e do valor real (erro de predio)
em vez da amostra
Modulao por pulso codificado diferencial (DPCM)
erro de predio quantificado e codificado com base nas
amostras anteriores
na decodificao: erro adicionado ao valor previsto da
amostra (3 ou 4 bits)
Reduz a representao da informao pois:
valores de amostras vizinhas so correlacionados
erro de previso ser menor que o valor original da amostra
Tcnicas de Compresso de udio Digital
Caractersticas do udio
Previso a
i
= a
i-1
V
a
l
o
r
e
s

d
e

a
m
o
s
t
r
a
s

Amostras
Tcnicas de Compresso de udio Digital
No LPC (Linear Predictive Coding)
Uma amostra de udio prevista com base nas amostras
anteriores




x[n-k]: amostras anteriores
p: ordem do modelo
a
k
: coeficiente de previo
e[n]: erro de predio



| | | | | | n e k n x a n x
P
k
k
+ =

=1
Tcnicas de Compresso de udio Digital
Codificao Predictiva
DPCM adaptativo (ADPCM) pode ser utilizado para aumentar a
qualidade mantendo a taxa de bits
tamanho passo de quantificao aumenta com o aumento da
variao do sinal
Se o sinal passa bruscamente de uma tenso elevada a uma tenso baixa,
o valor do passo ser grande; ao contrrio, se o sinal de entrada
apresenta variaes de tenso baixas, o tamanho do passo ser pequeno
Menos bits so usados para diferenas menores
Usado para mapear uma srie de amostras de 8 bits -law (ou a-
law) em uma srie de amostras ADPCM de 4 bits
A capacidade da linha dobrada

R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

102
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

103
Recomendaes ITU-TS para Voz
Recomend.
Tcnica de
Compresso
Largura de
banda da
voz (kHz)
Taxa de
amostragem
(kHz)
Taxa de bit
compactado
(kbps)
Durao do
payload
(ms)
Tamanho
do payload
(bytes)
G.711
PCM no
linear
3,4 8 64 20 160
G.721 ADPCM 3,4 8 32
G.722
ADPCM
sub-banda
7 16 48, 56, 64
G.723.1m MP-MLQ 3,4 8 6.4 30 24
G.723.1a ACELP 3,4 8 5.3 30 20
G.726 ADPCM 3,4 8
16, 24, 32,
40
15 60
G.728 LD-CELP 3,4 8 16 20 40
G.729A CS-CELP 3,4 8 8 20 20
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

104
Codecs, Quadros e Pacotes de Voz
Quadro de voz
A maioria dos codificadores de voz se baseia em quadros
Codecs compactam blocos contendo um nmero fixo de amostras
em vez de amostra por amostra.
Cada quadro de voz tem uma durao de 1 a 30 ms
dependendo do codec utilizado
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

105

Montagem do quadro
Fluxo de dados de udio precisa ser
acumulado
at que ele atinja o tamanho do bloco antes
de ser processado pelo codificador
Acumulao de amostra leva tempo
soma-se ao atraso fim-a-fim.
Amostra Amostra Amostra Amostra Amostra Amostra Amostra Amostra
Amostra
Amostra
CAD
Q
u
a
d
r
o

Codecs, Quadros e Pacotes de Voz
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

106

CAD
Q
u
a
d
r
o

Amostra
Amostra
Amostra
Amostra
Amostra
Amostra
Amostra
Amostra
Amostra
Amostra
Codecs, Quadros e Pacotes de Voz
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

107

CAD
Q
u
a
d
r
o

Amostra
Amostra
Amostra
Amostra
Amostra
Amostra
Amostra
Amostra
Amostra
Amostra
Amostra
Amostra
Amostra
Amostra
Amostra
Amostra
Amostra
Amostra
Amostra
Amostra
Codecs, Quadros e Pacotes de Voz
Quadro
compactado
Usando um
algoritmo
particular
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

108
Quadro
Compactado

CAD
Q
u
a
d
r
o

Codecs, Quadros e Pacotes de Voz
Quadro
compactado
Usando um
algoritmo
particular
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

109

Amostra Amostra Amostra Amostra Amostra Amostra Amostra Amostra
Amostra
Amostra
CAD
Q
u
a
d
r
o

Quadro
Compactado
Codecs, Quadros e Pacotes de Voz
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

110

CAD
Q
u
a
d
r
o

Amostra
Amostra
Amostra
Amostra
Amostra
Amostra
Amostra
Amostra
Amostra
Amostra
Quadro
Compactado
Codecs, Quadros e Pacotes de Voz
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

111

CAD
Q
u
a
d
r
o

Amostra
Amostra
Amostra
Amostra
Amostra
Amostra
Amostra
Amostra
Amostra
Amostra
Amostra
Amostra
Amostra
Amostra
Amostra
Amostra
Amostra
Amostra
Amostra
Amostra
Quadro
Compactado
Codecs, Quadros e Pacotes de Voz
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

112
Quadro
Compactado

CAD
Q
u
a
d
r
o

Quadro
Compactado
Codecs, Quadros e Pacotes de Voz
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

113
Codecs, Quadros e Pacotes de Voz
Look-ahead
Alguns codificadores precisam
conhecer mais amostras do que
aquelas contidas no quadro
que eles vo codificar.
Aumenta o atraso do algoritmo
do codec
Amostra Amostra Amostra Amostra Amostra Amostra Amostra Amostra
Amostra
Amostra
CAD
Q
u
a
d
r
o

Amostra
Amostra
Amostra
Amostra
Amostra
Amostra
Amostra
Amostra
Amostra
Amostra
Amostra
Amostra
Amostra
Amostra
Amostra
Amostra
Amostra
Amostra
Amostra
Amostra
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

114
Codecs, Quadros e Pacotes de Voz
Tamanho do pacote de voz
Tamanho do payload (em bytes)
Taxa do Codec (em bits/sec) x tempo do pacote de voz (ms)
8 (bits/byte) x 1000 (ms/sec)
Exemplo 1:
Codec G.711 => 64 kbps
Tamanho do pacotes = 20ms
Tamanho do payload = (64000 x 20)/8000 = 160 bytes
Teramos 50 pacotes de 160 B de dados a cada segundo

Exemplo 2:
Codec G.711 => 64 kbps
Tamanho do pacotes = 30ms
Tamanho do payload = (64000 x 30)/8000 = 240 bytes
Teramos 33 pacotes de 240 B de dados a cada segundo


R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

115
Codecs, Quadros e Pacotes de Voz
Problema da sobrecarga de protocolos
Para ser transmitido na rede, o pacote de voz deve ser
encapsulado em diversos protocolos
At chegar camada de enlace, aos pacotes de voz vo ser
adicionados 40 bytes: RTP (12 bytes) + UDP (8 bytes) + IP (20
bytes) = 40 bytes.
Exemplo
Tamanho tpico do payload quando usado o codec G.729 20 bytes
Taxa do codec sobre de 8 kbps para 24 kbps na camada de rede
IP UDP RTP
Pacote de voz
(payload)
Codecs, Quadros e Pacotes de Voz
Reduo de atraso x Taxa de compresso
Para reduo do atraso, o codec escolhido deveria ter um
comprimento de quadro pequeno
Mas caso o quadro for pequeno a taxa de compresso tende a ser
menor
Exemplo 1:
Codec G.711 => 64 kbps
Tamanho do pacotes = 20ms
Tempo de empacotamento ser 20ms
Exemplo 2:
Codec G.711 => 64 kbps
Tamanho do pacotes = 30ms
Tempo de empacotamento ser de 30ms


R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

116
Codecs, Quadros e Pacotes de Voz
Reduo do atraso x Taxa de bits
Quadro voz so transportados por pacotes encapsulando
diversos protocolos (por exemplo, RTP, UDP, IP)
Se o quadro pequeno, a sobrecarga do cabealho dos protocolos
ser maior
Exemplo 1: Codec G.711 => 64 kbps
Tamanho do pacote de voz = 20ms
Tamanho do Pacote IP 40+160 = 200 B
Teramos 50 pacotes IP de 200 B de dados a cada segundo
Taxa de bits de 50*200*8 = 80 kbps
Exemplo 2: Codec G.711 => 64 kbps
Tamanho do pacote de voz = 30ms
Tamanho do pacote IP = 40 + 240 = 280 B
Teramos 33 pacotes de 280 B de dados a cada segundo
Taxa de bits de 33*280*8 = 73,9 kbps

R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

117
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

118
Recomendaes ITU-TS para Voz
G.711
Usa PCM compandido (escala semilogartmica)
Serve para aumentar a resoluo de sinais de baixa amplitude
Mais importante para os humanos
Operando de forma anloga ao ouvido humano
Dois tipos de escala
A-law (Europa)
M-law (EUA)
Usado em redes ISDN e na maioria dos backbones telefnicos digitais
Fluxo de bits de 64 kbps
8 bits por amostra, 8000 amostras/s (uma amostra a cada 125s)
Supresso de silncio opcional
Reduz a taxa de bits gerada

Recomend.
Tcnica de
Compresso
Largura de
banda da
voz (kHz)
Taxa de
amostragem
(kHz)
Taxa de bit
compactado
(kbps)
Durao do
payload
(ms)
Tamanho do
payload
(bytes)
G.711
PCM no
linear
3,4 8 64 20 160
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

119
Recomendaes ITU-TS para Voz
G.711
Quanto utilizado em aplicaes conversacionais (voz sobre IP,
etc.)
amostras so agrupadas em blocos para envio na forma de pacotes
IP: payload
Pacotes de voz so enviados em intervalos constantes
Valor tpico do payload no G.711 de 160 amostras
constituindo um tempo de voz de 20ms
Tamanho do payload em bytes pode ser calculado por
Payload = (taxa*durao)/8
Recomend.
Tcnica de
Compresso
Largura de
banda da
voz (kHz)
Taxa de
amostragem
(kHz)
Taxa de bit
compactado
(kbps)
Durao do
payload
(ms)
Tamanho do
payload
(bytes)
G.711
PCM no
linear
3,4 8 64 20 160
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

120
Recomendaes ITU-TS para Voz
Tamanho do Payload
Quanto menor o payload de voz maior a banda do canal necessria
isto devido ao aumento da sobrecarga dos diversos protocolos de transmisso
da voz
Quanto maior o payload maior o atraso na aplicao
para aguardar a montagem do payload
Recomendao
Taxa de bit
compactado (kbps)
Durao
do payload
(ms)
Tamanho do
payload (bytes)
G.711 64 20 160
G.723.1m 6.4 30 24
G.723.1a 5.3 30 20
G.726 16, 24, 32, 40 15 60
G.728 16 20 40
G.729A 8 20 20
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

121
Recomendaes ITU-TS para Voz
G.721
converte um fluxo de 64 kbps em um fluxo de 32 kbps aplicando
uma compresso ADPCM
A previso e o tamanho do passo altera com o histrico do sinal
Recomend.
Tcnica de
Compresso
Largura de
banda da
voz (kHz)
Taxa de
amostragem
(kHz)
Taxa de bit
compactado
(kbps)
Durao do
payload
(ms)
Tamanho do
payload
(bytes)
G.711
PCM no
linear
3,4 8 64 20 160
G.721 ADPCM 3,4 8 32
G.722
ADPCM
sub-banda
7 16 48, 56, 64
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

122
Recomendaes ITU-TS para Voz
G.722
fornece uma melhor qualidade que o G.711 e G.721
Utiliza 14 bits por amostra
ADPCM Sub-banda: sinal de voz dividido em duas sub-bandas: alta (4-8kHz) e
baixa (0-4kHz)
2 bits/amostra para banda
alta (16 kbps)
6 bits/amostra para banda
baixa (48 kbps)
Prprio para aplicaes de videoconferncia uma vez que telefones comuns no
respondem na faixa de 7kHz
Recomend.
Tcnica de
Compresso
Largura de
banda da
voz (kHz)
Taxa de
amostragem
(kHz)
Taxa de bit
compactado
(kbps)
Durao do
payload
(ms)
Tamanho do
payload
(bytes)
G.711
PCM no
linear
3,4 8 64 20 160
G.721 ADPCM 3,4 8 32
G.722
ADPCM
sub-banda
7 16 48, 56, 64
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

123
Recomendaes ITU-TS para Voz
G.723.1
Codec mnimo de referncia para o padro H.323
Opera a 6,4 kbps (Multipulse-Maximum Likelihood Quantification) e a
5,3 kbps (Algebraic-Code-Excited Linear Prediction)
Em cada janela de 30 ms do sinal de voz
so analisadas 240 amostras de 16 bits do sinal de voz (tomadas a 8kHz) para
identificao de padres repetitivos (pitches) e so gerados 12 ou 10 cdigos
de 16 bits, conforme o algoritmo esteja configurado para uma taxa de 6,3 ou
5,3 kbps
Valor tpico de tamanho do pacote de voz (payload) de 30ms (20 ou 24
bytes)
Recomend.
Tcnica de
Compresso
Largura de
banda da
voz (kHz)
Taxa de
amostragem
(kHz)
Taxa de bit
compactado
(kbps)
Durao do
payload
(ms)
Tamanho
do payload
(bytes)
G.711
PCM no
linear
3,4 8 64 20 160
G.723.1m MP-MLQ 3,4 8 6.4 30 24
G.723.1a ACELP 3,4 8 5.3 30 20
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

124
Recomendaes ITU-TS para Voz
G.726
O G.726 utiliza o ADPCM a 40, 32, 24 e 16 kbps
codificao da diferena entre amostras consecutivas feita de forma no
linear j que o valor do passo de quantificao varivel
Sinal de voz amostrado a 8kHz, codificado em 8 bits (leis A ou ) e so
transmitidas diferenas entre amostras com 5, 4, 3 ou 2 bit em
quantificao adaptativa
valor tpico de tamanho do pacote de voz (payload) de 15ms (60 bytes
Recomend.
Tcnica de
Compresso
Largura de
banda da
voz (kHz)
Taxa de
amostragem
(kHz)
Taxa de bit
compactado
(kbps)
Durao do
payload (ms)
Tamanho
do payload
(bytes)
G.711 PCM linear 3,4 8 64 20 160
G.723.1m MP-MLQ 3,4 8 6.4 30 24
G.723.1a ACELP 3,4 8 5.3 30 20
G.726 ADPCM 3,4 8 16, 24, 32, 40 15 60
G.728 LD-CELP 3,4 8 16 20 40
G.729A CS-CELP 3,4 8 8 20 20
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

125
Recomendaes ITU-TS para Voz
G.728
Tcnica de codificao LD-CELP (Low-Delay, Code-Excited Linear
Prediction), gerando uma taxa de bits de 16 kbps
Em cada janela de 0,625ms do sinal de voz so analisadas 5 amostras de
8 bits e gerado 1 cdigo de 10 bits
Tabela (codebook) utilizada formada por 1024 valores
contm os valores de cdigos (vetores) que representam as possveis
amostras do sinal de voz
Valor tpico de tamanho do pacote de voz de 20ms (40 bytes)
Recomend.
Tcnica de
Compresso
Largura de
banda da
voz (kHz)
Taxa de
amostragem
(kHz)
Taxa de bit
compactado
(kbps)
Durao do
payload (ms)
Tamanho
do payload
(bytes)
G.711 PCM linear 3,4 8 64 20 160
G.723.1m MP-MLQ 3,4 8 6.4 30 24
G.723.1a ACELP 3,4 8 5.3 30 20
G.726 ADPCM 3,4 8 16, 24, 32, 40 15 60
G.728 LD-CELP 3,4 8 16 20 40
G.729A CS-CELP 3,4 8 8 20 20
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

126
Recomendaes ITU-TS para Voz
G.729
Bastante popular em aplicaes de voz sobre frame relay e em modems
V.70 para voz e dados
G.729 Tcnica de codificao LD-CELP gerando uma taxa de bits de 8
kpbs e G.729A a codificao CS-ACELP (Algebraic-ACELP)
Em cada janela de 10ms do sinal de voz so analisadas 80 amostras de 8
bits para gerao de 10 cdigos de 8 bits
Valor tpico de tamanho do pacote de voz de 20ms (20 bytes)
Recomend.
Tcnica de
Compresso
Largura de
banda da
voz (kHz)
Taxa de
amostragem
(kHz)
Taxa de bit
compactado
(kbps)
Durao do
payload (ms)
Tamanho
do payload
(bytes)
G.711 PCM linear 3,4 8 64 20 160
G.723.1m MP-MLQ 3,4 8 6.4 30 24
G.723.1a ACELP 3,4 8 5.3 30 20
G.726 ADPCM 3,4 8 16, 24, 32, 40 15 60
G.728 LD-CELP 3,4 8 16 20 40
G.729A CS-CELP 3,4 8 8 20 20
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

127
Supresso de Silncio e remoo de sons repetitivos
Compresso da voz via remoo dos perodos de silncio e de
informaes redundantes encontradas na fala humana
Existem informaes na fala humana que no so necessrias para que
uma comunicao efetiva exista atravs de uma rede
Sons repetitivos, inerentes voz, so causados pela vibrao das
cordas vocais
transmisso destes sons idnticos no necessria para efetivao da
comunicao e a sua remoo resulta em um aumento de eficincia na
utilizao da banda de rede
Composio da fala
22% do que se fala so componentes essenciais da comunicao
devem ser transmitidos para o entendimento do dilogo
22% so padres repetitivos
56% representa as pausas entre falas
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

128
Supresso do silncio: Componentes
VAD (Detector de Presena de Voz)
Responsvel por determinar quando o usurio est conversando e
quando ele est em silncio
til para economizar energia no caso de dispositivos que
funcionam a bateria
Deve ser bastante sensvel
Caso contrrio, o incio das palavras podem ser perdidas e um
silncio intil pode ser includo no final das sentenas
Mas ao mesmo tempo no pode ser disparado por rudo de fundo.
Ola, como vai?
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

129
Supresso do silncio: Componentes
DTX (Discontinuous Transmission)
Capacidade de um codec de parar de transmitir quadros quando o VAD
tiver detectado um perodo de silncio
VAD + DTX: modo eficiente de liberar dinamicamente a banda
proporcionando uma economia de at 50% da banda
Alguns codecs avanados no vo interromper a transmisso
completamente
Em vez disso, vo para um modo de silncio no qual usam muito menos
largura de banda e enviam apenas os parmetros mnimos para que o
receptor possa restituir o rudo de fundo (intensidade, etc.)
Pacote de voz
Supresso de Silncio e remoo de sons repetitivos
Alguns pontos devem ser considerados na supresso do
silncio
Quando a fala muito frequente, contnua, os ganhos com a
supresso do silncio no so alcanados;
Os algoritmos de compresso avanados j possuem integradas
as funes de VAD;
Como a deteco da presena de voz na transmisso no
imediata
Pode ocorrer o corte das primeiras slabas da locuo
Fenmeno denominado de clipping;
Quando o rudo de fundo muito alto
Torna-se difcil distinguir entre o que rudo e o que realmente
fala
Corre-se o perigo de empacotamento de rudo.
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

130
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

131
Cap 3. Compresso de Dados Multimdia
Contedo:
Necessidade de compresso
Princpios da compresso
Classificao das tcnicas de compresso
Medio do desempenho de compresso
Tcnicas de compresso sem perdas
RLE, Huffman, LZW (GIF)
Tcnicas de compresso de udio, vdeo e imagens
Tcnicas de compresso de voz
Tcnicas de compresso de som
Padres de compresso multimdia
JPEG, MPEG, MPEG-4, H.261, H.263
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

132
Recomendaes ITU-TS para Voz (reviso)
Recomend.
Tcnica de
Compresso
Largura de
banda da
voz (kHz)
Taxa de
amostragem
(kHz)
Taxa de bit
compactado
(kbps)
Durao do
payload
(ms)
Tamanho
do payload
(bytes)
G.711
PCM no
linear
3,4 8 64 20 160
G.721 ADPCM 3,4 8 32
G.722
ADPCM
sub-banda
7 16 48, 56, 64
G.723.1m MP-MLQ 3,4 8 6.4 30 24
G.723.1a ACELP 3,4 8 5.3 30 20
G.726 ADPCM 3,4 8
16, 24, 32,
40
15 60
G.728 LD-CELP 3,4 8 16 20 40
G.729A CS-CELP 3,4 8 8 20 20
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

133
Supresso do silncio: Reviso
VAD (Detector de Presena de Voz)
Responsvel por determinar quando o usurio est conversando e
quando ele est em silncio
til para economizar energia no caso de dispositivos que
funcionam a bateria
Deve ser bastante sensvel
Caso contrrio, o incio das palavras podem ser perdidas e um
silncio intil pode ser includo no final das sentenas
Mas ao mesmo tempo no pode ser disparado por rudo de fundo.
Ola, como vai?
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

134
Supresso do silncio: Reviso
DTX (Discontinuous Transmission)
Capacidade de um codec de parar de transmitir quadros quando o VAD
tiver detectado um perodo de silncio
VAD + DTX: modo eficiente de liberar dinamicamente a banda
proporcionando uma economia de at 50% da banda
Alguns codecs avanados no vo interromper a transmisso
completamente
Em vez disso, vo para um modo de silncio no qual usam muito menos
largura de banda e enviam apenas os parmetros mnimos para que o
receptor possa restituir o rudo de fundo (intensidade, etc.)
Pacote de voz
MPEG-Audio
Padro de compresso de udio genrico (at 20 kHz)
e no apenas para voz (de 3,4 a 7 kHz)
explora a percepo humana e no as caractersticas da fonte do udio
Princpio de Compresso
Faixa de freqncia audvel humana
Filtra sons acima de 20 KHz
Limiar de audio na faixa de freqncia audvel
Explora a curva de percepo da audio humana dentro da faixa de freqncias audveis
(limiar de audio)
Sensibilidade para sons dentro desta faixa no uniforme (depende da freqncia)
O que se faz descartar amostras que se encontrem abaixo deste limiar.
Mascaragem: um som pode tornar outro impossvel de ser ouvido, ou pode tornar
o outro sem peso
tipos de mascaragem: total ou parcial
sons mascarados podem ser descartados (no so audveis)
caracterstica explorada pelo padro internacional MPEG-udio
explora as limitaes perceptivas do sistema auditivo humano

R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

135
MPEG-Audio
Principais caractersticas do MPEG-1 Audio:
Seqncia de bits compactada pode suportar um ou dois canais
um canal nico
dois canais independentes
um sinal estreo
Trs taxas de amostragens
32, 44.1 ou 48 kHz
MPEG-2.5 (no oficial) 8, 11.025, 12, 16, 22.05 e 24 kHz.
Fluxo compactado pode ter uma das vrias taxas de bits fixas e
predefinidas variando de 32 a 320 kbps
Padro MPEG-2.5 (no oficial)
Taxa de bits de 8, 16, 24, e 144 kbps
Razo de compresso: 2,7 a 24 (depende da taxa de amostragem)
6:1 ouvintes experientes no detectam diferenas
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

136
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

137
Um codificador bsico MPEG-udio
Bloco mapeamento tempo-frequncia
Divide a entrada em sub-bandas de frequncias mltiplas
Bloco modelo psico-acstico
Cria um conjunto de dados para controlar a operao do bloco
quantificador e codificador
Mapeamento
Tempo-Frequncia
Modelo
Psico-acstico
Quantificador
e
Codificador
Empacotamento
de
quadros
Entrada de
amostragem de udio
Fluxo
codificado
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

138
Um codificador bsico MPEG-udio
Bloco quantificador e codificador
Cria um conjunto de smbolos de cdigo
sub-bandas menos importantes e udios inaudveis so removidos
Bloco Empacotamento de quadros
Monta e formata os smbolos de cdigo e adiciona outras
informaes
Mapeamento
Tempo-Freqncia
Modelo
Psico-acstico
Quantificador
e
Codificador
Empacotamento
de
quadros
Entrada de
amostragem de udio
Fluxo
codificado
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

139
MPEG Audio
MPEG Audio especifica uma famlia de 3 esquemas de
codificao de udio
Chamadas de Layer-1, Layer-2 e Layer-3
de Layer-1 a Layer-3, a complexidade e desempenho (qualidade de
som e taxa de bits) aumentam
Os trs codificadores so compatveis no modo hierrquico
decodificador Layer-N capaz de decodificar um fluxo de bits fluxo
codificado com codificador Layer-N e abaixo de N
MP3 MPEG-1 Layer-3
Padro especifica o formato do fluxo de bits e o
decodificador para cada esquema de codificao
no especifica o codificador para avanos futuros
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

140
MPEG-2 udio
Estende as funcionalidades do MPEG-1 udio
cinco canais (esquerdo, direito, centro, e dois canais surround)
mais um canal de baixa frequncia
ou sete canais multilngues/comentrios
tem taxas de amostragens adicionais
Padro ISO/IEC MPEG
Motion Picture Expert Group
Grupo de padres de representao codificada de vdeos, udios e
suas combinaes
armazenados e recuperados em Digital Storage Media (DSM)
dispositivos de armazenamento convencionais, CD-ROMs, drivers de
fita, HDs, drivers tico escrevveis e canais de telecomunicao (redes de
longa distncia, locais, etc.)
Caractersticas
MPEG usa a compresso intra e inter-quadros de vdeos
obtm altas taxas de compresso devido a alta redundncia dos
vdeos
Especificaes MPEG tambm incluem um algoritmo para
compresso de udio
Compresso do udio associado e a sincronizao udio-visual no
podem ser independente da compresso do vdeo
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

141
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

142
Padro ISO/IEC MPEG
Vrios itens de trabalho
MPEG-1 (1993)
para vdeo com qualidade VHS
360x280 pxeis com 30 quadros por seg. na taxa de 1.5 Mbps
conhecido como padro MPEG
MPEG-2 (1994)
para vdeo com qualidade de televiso digital CCIR 601
720x480 pxeis com 30 quadros por seg. na taxa entre 2 a 10 Mbps
MPEG-3
para vdeo com qualidade HDTV na taxa de 40 Mbps
interrompido em julho 1992
MPEG-4 (1998)
codificao para audiovisual com muito baixa taxa de transmisso (variando
de 4,8 a 64 Kbps)
MPEG-7 (2001)
Interface de Descrio de Contedo Multimdia: um padro de descrio de
dados multimdia (informaes audio-visuais)
Permitindo a busca e filtragem
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

143
Padro ISO/IEC MPEG
MPEG 1/2 tem quatro partes principais
MPEG-Vdeo
compresso de sinais de vdeo;
MPEG-udio
compresso de um sinal de udio digital
MPEG-Sistemas
sincronizao e multiplexao de fluxos de udio e vdeo
compactados
Conformidade
especifica procedimento para determinar as caractersticas dos
fluxos codificados e para testar a conformncia com os requisitos
identificados no udio, Vdeo e Sistemas
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

144
Padro ISO/IEC MPEG
Hierarquia do fluxo de dados MPEG-1
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

145
Especificao do Fluxo de Vdeo MPEG-1
Fluxo de vdeo:






GOP (Grupo de imagens): fornece um ponto de acesso aleatrio
Camada de imagem contem todas as informaes codificadas de uma
imagem
cabealho contem a referncia temporal de uma imagem, o tipo de
codificao, etc..
Cabealho
de seqncia
GOP
1
... GOP
i
... GOP
n

Fim da
Seqncia
Cabealho
de GOP
Imagem
1
... Imagem
j
... Imagem
m

Cabealho
de Imagem
Pedao
1
... Pedao
k
... Pedao
p

Cabealho
de Pedao
Macrobloco
1
... Macrobloco
l
... Macrobloco
q
Cabealho
de Macrobloco
Bloco
1
Bloco
2
Bloco
3
Bloco
4

Camada
Seqncia
Camada
GOP
Camada
Imagem
Camada
Pedao
Camada
Macrobloco
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

146
Especificao do Fluxo de Vdeo MPEG-1
Fluxo de vdeo






Imagens so divididas em pedaos (slices):
cada pedao consiste de um nmero de macroblocos (16x16 pixeis)
Importante para o controle de erro
Se existe um erro no fluxo de dados, o decodificador pode saltar um pedao
Maior o nmero de pedaos, melhor o tratamento de erro
Macrobloco
Usado na estimativa e compensao do movimento
Bloco de Imagem
um bloco uma matriz 8x8 pixeis tratados como unidades e entrada para o DCT

R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

147
Padro ISO/IEC MPEG
MPEG especifica a sintaxe dos fluxos codificados para
que decodificadores possam decodificar
como gerar o bitstream no padronizado
permite inovaes no projeto e implementao de codificadores
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

148
Especificao do Fluxo de Vdeo MPEG-1
Imagem
a unidade elementar para a codificao do
vdeo
Imagem MPEG
Grupo de trs matrizes retangulares que
representam a luminncia (Y) e a crominncia (Cr
e Cb)
Um elemento da matriz 1 pixel
Representao YCrCb equivalente ao RGB
prefervel YCrCb pois o olho mais sensvel a
luminosidade que a crominncia
armazenando menos informao nas matrizes Cr e
Cb que na matriz Y
Na codificao 4:2:2 (mais corrente), as matrizes
Cr e Cb so de dimenso duas vezes menor que a
matriz Y
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

149
Padro ISO/IEC MPEG
Compactao MPEG-1 Video
Em vdeo existem dois tipos de redundncia: espacial e temporal
MPEG-1 explora estes duas redundncias
Redundncia espacial
pode ser explorada pela simples codificao em separado de cada quadro com
o JPEG
estratgia utiliza quando h a necessidade de se acessar aleatoriamente cada
quadro, como na edio de produes de vdeo
Redundncia temporal
compactao adicional pode ser obtida explorando o fato de que dois quadros
consecutivos so, com freqncia, quase idntico
MPEG faz compensao de movimento
Calcula o vetor de movimento dos macroblocos e a diferena macro-bloco a
macrobloco
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

150
Tcnicas de Compresso de Vdeo e Imagem
Estimativa e Compensao de Movimento
Imagem dividida em blocos de tamanho fixos
um casamento para cada bloco procurado na imagem anterior
deslocamento entre estes dois blocos chamado vetor de movimento
uma diferena de blocos obtida calculando diferenas pxel a pxel
Vetor de movimento e a diferena de bloco codificado e transmitido
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

151
Compactao MPEG-1 Video
Grupo de Imagem consiste de quatro tipos de quadros:
Quadros I (Intracoded)
imagens estticas, independentes e codificadas com o JPEG.
Quadro P (Predictive)
diferena bloco a bloco com o quadro I ou P anterior
Quadro B (Birectional)
diferena com o ltimo quadro e com o quadro seguinte
Quadro D (DC-coded)
Mdias de bloco usadas para o avano rpido (fast forward).
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

152
Compactao MPEG-1 Video
Quadro I
Imagens estticas, independentes e codificadas com o JPEG
necessrio que quadros I apaream periodicamente no fluxo de sada
no caso de transmisso multicast
receptores podem entrar no grupo em tempos distintos, requerendo um quadro I
para comear a decodificao MPEG-1
se um quadro for recebido com erro
decodificao no ser mais possvel
Quadros I so inseridos na sada uma ou duas vezes por segundo
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

153
Compactao MPEG-1 Video
Quadro P
Codificam as diferenas entre os quadros
50% do tamanho de um quadro I
Se baseiam na idia dos macroblocos, de 16x16 pixeis
macrobloco codificado da seguinte forma:
tentando-se localiz-lo, ou algo parecido com ele, no quadro anterior
Decodificar quadros P requer que o decodificador armazene o
quadro I ou P anterior em um buffer
a partir do qual o novo quadro construdo
baseado em macroblocos completamente
codificados e macroblocos contendo
diferenas com o quadro anterior
Compactao MPEG-1 Video
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

154
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

155
Compactao MPEG-1 Video
Quadro P
Estimativa e compensao do movimento









Quadro P
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

156
Compactao MPEG-1 Video
Quadro P
Estimativa e compensao do movimento
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

157
Compactao MPEG-1 Video
Quadro B
Codificam as diferenas com o ltimo quadro I ou P e com o
quadro seguinte
15% do tamanho de um quadro I
permitem que o macrobloco de referncia esteja tanto no quadro
anterior quanto no quadro seguinte
acarreta uma melhoria na compensao do movimento
Para decodificar quadros B
decodificador precisa manter trs quadros decodificados na memria
ao mesmo tempo: o quadro anterior, o atual e o prximo
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

158
Compactao MPEG-1 Video
Quadro P
Estimativa e compensao do movimento
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

159
Compactao MPEG-1 Video
Quadro D
S so usado para possibilitar a apresentao de uma imagem de
baixa resoluo quando um avano rpido ou um retrocesso
Um fluxo MPEG-1
Uma seqncia de quadros codificados teria a seguinte forma:
IBBPBBPBBPBBIBBPBBPBBPB..........
Codificao MPEG-2
fundamentalmente semelhante codificao MPEG-1
com quadros I, P e B
quadros D no so aceitos
Transformao discreta de co-seno de 10x10 em vez de 8x8
para proporcionar mais 50 por cento de coeficientes
melhor qualidade
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

160
MPEG-1 Sistemas
Define uma estrutura para:
Combinar fluxos elementares, incluindo udio, vdeo e outros
fluxos de dados
chamado de Fluxo MPEG
at 32 fluxos de udio MPEG e 16 fluxos de vdeo MPEG podem ser
multiplexados juntamente com 2 fluxos de dados de diferentes tipos
Especifica o modo de representar as informaes
temporais necessrias para reproduo de seqncias
sincronizadas em tempo real
sincronizao de fluxos elementares
gerenciamento de buffer nos decodificadores
acesso aleatrio
identificao do tempo absoluto do programa codificado
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

161
MPEG-4
Padro MPEG-4
comeou a ser concebido em julho de 1993, tendo sido aprovado
como padro internacional em 2000.
Uso
Vrios vdeos transmitidos pela Internet fazem uso deste padro,
assim como telefones celulares que utilizam imagens
Tambm utilizado em diversos padres de transmisso de TV
digital, especialmente os de alta definio (HDTV)
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

162
MPEG-4
MPEG-4 absorve muita das caractersticas do MPEG-1 e
MPEG-2 e outros padres relacionados, adicionando
novas caractersticas
suporte VRML (Virtual Reality Metadata Language) para
apresentaes 3D,
arquivos compostos orientados a objetos (incluindo objetos de
udio, vdeo e VRML),
suporte para Gerenciamento de Direitos Autorais externamente
especificados
e vrios tipos de interatividade.
MPEG-4
Partes do MPEG-4
23 Partes abordando diferentes aspectos do padro.
Exemplos
Parte 1 descreve a sincronizao de udio e vdeo;
Parte 2 uma tecnologia de compresso de vdeo;
Parte 3 o processo de compresso do udio;
Parte 10 do padro foi includa quando uma verso mais otimizada
da parte 2 (compresso de vdeo) foi desenvolvida

R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

163
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

164
MPEG-4
MPEG-4 Parte 2
Tecnologia de compresso de vdeo desenvolvida pela MPEG.
Um padro de compresso DCT similar aos padres MPEG-1 e
MPEG-2
21 Perfis (Profiles)
Agrupam caractersticas em perfis (profiles) e nveis.
Para permitir seu uso em vrias aplicaes, variando de cmeras de
segurana de baixa qualidade, baixa resoluo a HDTVs e DVDs,
Perfil Simple Profile (SP): usado em situaes onde a baixa taxa de
bits e baixa resoluo so mandatrios devido a largura de banda da
rede, tamanho do dispositivo, etc
telefones celulares, sistemas de segurana, etc.
Perfil Advanced Simple Profile (ASP): muito similar ao H.263,
incluindo suporte para a quantificao do estilo MPEG, suporte a
vdeo entrelaado, suporte a imagens do tipo B, compensao de
movimento QPel (Quarter Pixel) e Global (GMC).
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

165
MPEG-4
MPEG-4 Parte 10
Tambm conhecidos como H.264 ou AVC (Advanced Video
Coding)
Um padro de codec de vdeo digital que tem a caracterstica de
alta taxa de compresso.
O padro define 7 perfis, voltadas a classes de aplicaes
especficas. Por exemplo:
Baseline Profile (BP) voltado para aplicaes de custo mais baixo
com limitado recursos computacionais, usado em aplicaes de
videoconferncia e mveis.
Extended Profile (XP) voltado para streaming de vdeo, com alta
taxa de compresso e robustez para perda de dados.
High Profile (HiP) o principal perfil para aplicaes de
armazenamento em disco e broadcast, particularmente para
aplicaes de HDTV e adotado pelos discos HD-DVD e Blu-ray.
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

166
CCITT H.261
Origem
Necessidade de fornecer servios de vdeo onipresentes na Rede
Digital de Servios Integrados (ISDN)
Um dos padres da famlia H.320 para videofonia e
teleconferncia na taxa de 64 Kbps a 2 Mbps
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

167
CCITT H.261
Caractersticas
Para aplicaes de videofonia e teleconferncia
Algoritmo de compresso de vdeo opera em tempo-real com
atraso mnimo
Algoritmo combina codificao intraquadro e interquadro para
fornecer um rpido processamento para compresso/descompresso
tempo-real de vdeo
Fornece uma resoluo cerca de oito vezes mais baixa que a
qualidade TV PAL/SECAM
para aplicaes usualmente sem movimentos intensos
algoritmo usa uma limitada estratgia de busca e estimao de
movimento para obter taxas de compresso mais altas
H.261 pode obter taxas de compresso de 100:1 a mais de 2000:1
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

168
CCITT H.261
Padro de compresso de vdeo para transmisso em
taxas de p*64Kbps
Cobre as capacidades do canal ISDN
p*64 Kbps (p=1 a 30)
p = 1 ou 2 apropriado para comunicao visual face-a-face e
baixo movimento (videofonia)
p > 5 melhor qualidade (videoconferncia)
Mxima taxa de bits disponvel 1,92 Mbps (p=30)
suficiente para obter imagens de qualidade VHS
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

169
CCITT H.261
Formatos de imagens
H.261 opera com dois formatos de imagem
CIF (Common Intermediate Format) - 320x288
permite usar um formato nico dentro e entre regies usando padres
de TV de 625 e 525 linhas
QCIF (quarter-CIF) - 160x144
mais til em taxas de bit menores (p<6).
Algoritmo de compresso
Algoritmo de codificao hbrido
Eliminao da redundncia espacial
transform coding (DCT): similar ao JPEG
Predio inter-quadro
remove redundncia temporal
compensao de movimento
codificao por entropia (codificao de Huffman)
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

170
CCITT H.263
H.263
Padro de vdeo a baixa taxa de bits para aplicaes de
teleconferncia que opera a taxas abaixo de 64 Kbps
Algoritmo de codificao
uma extenso do H.261 e descreve um mtodo de codificao
DPCM/DCT
Uma idia interessante do H.263 o quadro PB
consiste de duas imagens codificadas em uma unidade
nome PB derivado da terminologia MPEG dos quadros P e B
quadro PB consiste de um quadro P que produzido a partir do ltimo
quadro P decodificado e um quadro B que produzido a partir do ltimo
quadro P decodificado e do quadro P sendo decodificado
R
o
b
e
r
t
o

W
i
l
l
r
i
c
h

-

I
N
E
/
U
F
S
C

-

2
5
/
0
9
/
2
0
1
2

171
CCITT H.263
H.263 suporta cinco resolues
QCIF e CIF que suportado pelo H.261
SQCIF - aproximadamente a metade da resoluo do QCIF
4CIF e 16CIF - 4 e 16 vezes a resoluo do CIF
codec poderia competir com outras codificaes de mais altas taxas
de bits como os padres MPEG
H.263 x H.261
Testes atuais mostram que o H.263 tem
um desempenho 1 a 2,5 melhor que o
H.261
taxa de bits H.261 aproximadamente
2,4 vezes a gerada pelo H.263
(dada uma qualidade de imagem)

Anda mungkin juga menyukai