Anda di halaman 1dari 107

CODIFICACIN DE LA

FUENTE
TELEVISIN DIGITAL

12/10/15

CODIFICACIN DE LA
Los mtodos de FUENTE
compresin usan algoritmos de
compresin de datos generales aplicables a
cualquier tipo de datos.
La redundancia espacial y las peculiaridades de
la percepcin visual para imgenes fijas (JPEG)
La redundancia temporal muy alta entre
imgenes sucesivas en el caso de imgenes en
movimiento (MPEG).
Los mtodos de compresin de audio explotan
particularidades de la percepcin auditiva
humana para reducir las tasas de bits mediante
la eliminacin de informacin inaudible

CODIFICACIN DE LA
FUENTE
Principios generales de compresin de datos
Run length coding (RLC)
Cuando una fuente de informacin emite elementos
sucesivos de mensajes que pueden generar una serie
relativamente larga de elementos idnticos.
La codificacin que no pierde ninguna informacin se
define como reversible.
Este mtodo se utiliza normalmente para la
compresin de archivos relacionados con el
almacenamiento en disco o transmisin por
ordenadores (zip, etc), sino que es tambin el mtodo
utilizado en las mquinas de fax.

CODIFICACIN DE LA
FUENTE
Principios generales de compresin de datos
Variable length coding (VLC) or entropy coding
Este mtodo de reduccin de la tasa de bits se basa en el hecho
de que la probabilidad de ocurrencia de un elemento generado
por una fuente a veces no es el mismo para todos los elementos.
Con el fin de reducir la tasa de bits requerida para transmitir las
secuencias generadas por la fuente, es ventajoso para codificar
los elementos ms frecuentes con menos de n bits y los
elementos menos frecuentes con ms bits, resultando en una
longitud media que es menor que una longitud fija de n bits.
Este mtodo se utilizado:
Compresin de texto.
Imgenes de vdeo.

El mtodo ms conocido para la codificacin de longitud variable


es el algoritmo de Huffmann

CODIFICACIN DE LA
FUENTE

La cantidad de informacin Q
transmitida por un elemento:
Q = log2(1/p)

La suma de la cantidad de informacin


de todos los elementos generados por
una fuente multiplicado por la
probabilidad de aparicin se denomina
entropa, H, de la fuente:
H =pi log2(1/pi)

COMPRESIN PARA
IMAGENES
La transformada de coseno discreta (DCT) es un caso
particular de la transformada de Fourier se aplica a
seales discretas, que se descompone de una seal
peridica.
La seal puede ser representada por una serie de
coeficientes de cada una de estas funciones.
La seal original, la imagen, es una seal muestreada
bidimensional, por lo que tambin tendr una DCT
bidimensional (direcciones horizontal y vertical), que
transformar la luminancia (o crominancia) a valores
discretos de un bloque de N x N pxeles en otro bloque (o
matriz) de N N coeficientes que representan la
amplitud de cada una de las funciones coseno armnicos.

COMPRESIN PARA
IMAGENES
Las especificidades psicofisiolgicos de la visin humana
(sensibilidad reducida a las frecuencias espaciales altas), es posible,
sin degradacin perceptible de la calidad de la imagen, para eliminar
los valores por debajo de un cierto umbral de la frecuencia.
Los valores eliminados son sustituidos por 0 (una operacin
conocida como umbral); esta parte del proceso, obviamente no es
reversible, ya que algunos datos son desechados.
Los coeficientes restantes se cuantifica con una precisin decreciente
con las frecuencias crecientes espaciales, lo que de nuevo reduce la
cantidad de informacin necesaria para codificar un bloque, pero
tiene poco efecto sobre la calidad de imagen percibida.
Los parmetros de umbral y cuantificacin se puede utilizar para
regular dinmicamente la tasa de bits requerida para transmitir
imgenes en movimiento.

COMPRESIN PARA
IMAGENES
Las transformadas de una imagen generan conjuntos de
datos que contienen la misma informacin que las
imgenes originales, con la propiedad de poder volver a
generar las imgenes originales mediante las
correspondientes transformadas inversas.
Una imagen monocolor de dimensiones N x N, se puede
expresar como una funcin de dos variables f(x,y) donde
(x,y) son las coordenadas de cada pxel (x=0,1,...,N-1 e
y=0,1,...,N-1)
f(x,y) es la intensidad de color del pxel (x,y).

La transformada discreta del coseno consiste en calcular


otra matriz F a partir de la anterior.
El dominio de F es el mismo que el de f.

COMPRESIN PARA
IMAGENES

La inversa de la transformada tiene por


frmula:

COMPRESIN PARA
IMAGENES

COMPRESIN PARA
IMAGENES

LA COMPRESIN DE IMGENES FIJAS

Las primeras aplicaciones dirigidas a


reducir la cantidad de informacin
necesaria para la codificacin de
imgenes fijas apareci en la dcada
de 1980, y tenan como objetivo
principal la reduccin significativa del
tamao de los archivos grficos y
fotografas en vista de
almacenamiento o transmisin de
ellos.

LA COMPRESIN DE IMGENES
FIJAS
JPEG (Joint Photographic Experts
Group)
Cabe sealar que la compresin JPEG
puede ser con o sin prdidas,
dependiendo de la aplicacin y el
factor de compresin deseado.

LA COMPRESIN DE IMGENES
FIJAS
Este tipo de compresin consta de 3 pasos:
Primero se pasa la imagen del formato RGB al formato YIQ.
El formato de color YIQ representa una divisin entre la
luminosidad (cantidad de luz percibida) y la informacin
sobre el color.
El ojo humano es mucho ms sensible a la luminosidad que al
color, cosa que se aprovecha para la compresin.

Despus, se realiza una transformacin en la imagen


mediante la transformada discreta del coseno (DCT)
Por ltimo, se codifica el conjunto de datos obtenidos al
aplicar la DCT, usando un mtodo que no producen
prdida (cdigo de Huffman).

LA COMPRESIN DE IMGENES
FIJAS

LA COMPRESIN DE IMGENES
FIJAS

LA COMPRESIN DE IMGENES
FIJAS
En el formato de color RGB, las imgenes a color
se almacenan en 3 canales independientes (rojo,
verde y azul) que toman valores de 0 a 255
dependiendo de la intensidad.
El formato de color YIQ representa una divisin
entre la luminosidad (Y) y el color (I, Q). La
conversin entre RGB e YIQ es:

LA COMPRESIN DE IMGENES
FIJAS

LA COMPRESIN DE IMGENES
FIJAS
El ojo humano es menos sensible a
los matices de color que a la
cantidad de luz percibida.
Es por ello que podemos reducir la
informacin almacenada para los
canales I y Q de una imagen YIQ

COMPRESIN PARA
IMAGENES

COMPRESIN PARA
IMAGENES

COMPRESIN PARA
Un flujo de bits
en serie se obtiene por "zig-zag"
IMAGENES

la lectura de los coeficientes.


Este mtodo es uno de los que permiten una
serie relativamente larga de coeficientes nulos

COMPRESIN PARA
IMAGENES

COMPRESIN PARA
IMAGENES

Resta 128

COMPRESIN PARA
IMAGENES

COMPRESIN PARA
IMAGENES

Matriz DCT

COMPRESIN PARA
IMAGENES

COMPRESIN PARA
IMAGENES

SIF (formato de cdigo


intermedio)
Este formato se obtiene dividiendo por la mitad
de la resolucin espacial en ambas direcciones,
as como la resolucin temporal
Convierte en 25 Hz para sistemas de lnea de 625
lneas
Convierte en 29,97 Hz para sistemas de 525 lneas

Resolucin de luminancia: 360 288 (625


lneas) o 360 240 (525 lneas);
Crominancia resolucin: 180 144 (625 lneas)
o 180 120 (525 lneas).

SIF (formato de cdigo


intermedio)

CIF (formato intermedio


comn)
Resolucin espacial se toma de la SIF
de 625 lnea (360 288)
Resolucin temporal de la SIF de 525
lneas (29,97 Hz).
Es la base utilizada para
videoconferencias.

QCIF (cuarto CIF)


Una vez ms, esto reduce la
resolucin espacial de 4 (2 en cada
direccin) y la resolucin temporal
por 2 o 4 (15 Hz o 7,5).
Es el formato de entrada utilizado para
videotelefona RDSI utilizando el
algoritmo de compresin H261.

Formatos de Alta Definicin


720p / 1080i
El formato 720p
Es un formato de barrido progresivo con
una resolucin horizontal de 1280
pxeles y una resolucin vertical de 720
lneas/pixeles.

El formato 1280i
Es un formato entrelazado ofrece una
resolucin horizontal de 1920 pxeles y
una resolucin vertical de 1080
lneas/pixels

La compresin de imgenes en
movimiento
En 1990, la necesidad de almacenar y
reproducir imgenes en movimiento y el
sonido asociado en formato digital para
aplicaciones multimedia
La ISO lidero para formar un grupo de
expertos a de las mismas lnea que JPEG
MPEG (Motion Pictures Experts Group).

La compresin de imgenes en
movimiento
El primer resultado de su trabajo fue
la norma internacional ISO / IEC 11172
MPEG-1

El objetivo principal era permitir el


almacenamiento en CD-ROM
Una sola velocidad en ese momento de
vdeo en directo y el sonido estreo
Tasa de bits mxima de 1,5 Mb / s.

La compresin de imgenes en
movimiento
El estndar MPEG-1 consta de tres
partes bien diferenciadas, publicado
en noviembre de 1992:
MPEG-1 sistema (ISO / IEC 11172-1)
MPEG-1 multiplex structure

Vdeo MPEG-1 (ISO / IEC 13818-2)


MPEG-2 de codificacin de vdeo

MPEG-1 Audio (ISO / IEC 13818-3)


MPEG-2 de codificacin de audio

La compresin de imgenes en
movimiento
La calidad de la imagen de MPEG-1
no era adecuado para aplicaciones de
difusin
La codificacin de imgenes entrelazadas
o la evolucin hacia la HDTV.

El grupo MPEG as trabajado en la


definicin de una norma
Esta norma internacional es conocido
como MPEG-2.

La compresin de imgenes en
movimiento
MPEG-2 se especifica en tres partes
bien diferenciadas, publicado en
noviembre de 1994:
Sistema MPEG-2 (ISO / IEC 13818-1)
MPEG-2 streams

Vdeo MPEG-2 (ISO / IEC 13818-2)


MPEG-2 codificacin de vdeo

MPEG-2 de audio (ISO / IEC 13818-3)


MPEG-2 codificacin de sonido

Principios de la codificacin de
vdeo de MPEG-1
La velocidad binaria constante de 1,5 Mb / s para almacenar
vdeo y audio en CD-ROM.
La parte de video cuenta con 1,15 Mb/s
Los 350 kb/s siendo utilizado por los datos de audio

La codificacin de vdeo utiliza los mismos principios que JPEG


con prdidas
Estas tcnicas de explotar la fuerte correlacin entre las
imgenes sucesivas a fin de reducir considerablemente la
cantidad de informacin
Conocidas como Prediccin con Compensacin de Movimiento

Estas tcnicas consiste en deducir la mayora de las imgenes


de una secuencia de imgenes anteriores y posteriores
Esto requiere la presencia en el codificador MPEG de un estimador de
movimiento

Principios de la codificacin de
vdeo de MPEG-1
La descodificacin tiene que llevarse a cabo en tiempo
real
Significa un retraso en el procesamiento aceptable y
constante

La codificacin se puede hacer en ms de una pasada


para aplicaciones en tiempo real no es necesario pero
donde la calidad es de importancia primordial
La realizacin prctica del codificador es por lo tanto un
compromiso entre:
La velocidad
La tasa de compresin
La complejidad y la calidad de la imagen
Tiempo de sincronizacin

Principios de la codificacin de
vdeo de MPEG-1
El tiempo de acceso aleatorio a una
secuencia tiene que ser mantenido
dentro de un lmite aceptable
No exceda de 0,5 s que limita el nmero
mximo de imgenes
El sistema opera 25 imgenes/seg.

Los diferentes tipos MPEG


I (intra) imgenes son codificadas sin
referencia a otras imgenes
Manera muy similar a JPEG.
Contienen toda la informacin necesaria
para su reconstruccin por el decodificador
Son el punto de entrada esencial para
acceder a la secuencia de vdeo.
La tasa de compresin de imgenes es
relativamente baja

Los diferentes tipos MPEG


P (predicted) imgenes se codifican
a partir de la imagen I o P anterior,
utilizando las tcnicas de prediccin
con compensacin de movimiento.
Cuadros P pueden utilizarse como base
para prximos cuadros predichos
La tasa de compresin de imgenes P
es significativamente mayor las
imgenes I.

Los diferentes tipos MPEG


B (bi-direccional o predicho
bidireccionalmente) imgenes se
codifican por interpolacin bi-direccional
entre la imagen I o P que precede y sigue.
Como no se utilizan para la codificacin de
las imgenes subsiguientes
Imgenes B no se propagan errores de
codificacin.
B ofrecen la ms alta tasa de compresin.

Los diferentes tipos MPEG

Los diferentes tipos MPEG

M es la distancia (en nmero de imgenes) entre dos


sucesivos imgenes P.
N es la distancia entre dos sucesivas imgenes I, que
define una
"Grupo de fotografas

Descomposicin de una
secuencia de vdeo MPEG
MPEG define una jerarqua de capas dentro de una
secuencia de vdeo
Cada una de estas capas tiene la funcin especfica
en el proceso de MPEG.
Secuencia. Esta es la capa ms alta que define el
contexto vlido para toda la secuencia
Parmetros bsicos de vdeo

Grupo de imgenes (GOP). Esta es la capa que


determinar el acceso aleatorio a la secuencia, que
siempre comienza con una imagen I
Imagen. Esta es la unidad de visualizacin elemental,
que puede ser de uno de los tres tipos (I, P o B).

Descomposicin de una
secuencia de vdeo MPEG
Macrobloque. Esta es la capa utilizada para
la estimacin de movimiento /
compensacin.
Un macrobloque tiene un tamao de 16 x 16
pxeles
Se compone de cuatro bloques de luminancia y
dos bloques de crominancia.

Bloque. Una imagen se divide en bloques


de 8 8 pixeles.
El bloque es la capa donde la DCT se lleva a
cabo.

Descomposicin de una
secuencia de vdeo MPEG
Slice(Rebada). Esta es la capa de
direccionamiento de INTRA trama y resincronizacin
Se define como un conjunto de
macrobloques contiguos.
El conjunto de las rebanadas cubre toda la
imagen sin ningn solapamiento entre los
diferentes segmentos.
El tamao de un sector es una fila
completa de macrobloques.

Descomposicin de una
secuencia de vdeo MPEG

Descomposicin de una
secuencia de vdeo MPEG

La prediccin, estimacin de
movimiento y compensacin
Estimacin de movimiento consiste en definir un
vector de movimiento que garantiza la correlacin entre
una zona de llegada en la segunda imagen y una zona de
salida en la primera imagen
Utilizando una tcnica conocida como correspondencia de
bloques

Esto se hace en el nivel de macrobloque (16 x 16 pixeles)


moviendo un macrobloque de la imagen actual dentro de
una ventana de bsqueda pequea de la imagen anterior
Compara con todos los macrobloques posibles de la
ventana con el fin de encontrar el que es ms similar.
La diferencia en la posicin de los dos macrobloques
coincidentes da un vector de movimiento

La prediccin, estimacin de
movimiento y compensacin
La diferencia (o error de prediccin)
entre el bloque actual para ser
codificado y la correspondencia de
bloques se calcula y codifica de
manera similar a los bloques de las
imgenes I (DCT, cuantizacin, RLC /
VLC).
Este proceso se denomina
compensacin de movimiento.

La prediccin, estimacin de
movimiento y compensacin
Para las imgenes B, los vectores de movimiento se calculan por
interpolacin temporal de los vectores de la imagen P siguiente, de
tres formas:
adelante
atrs
Bidireccional

El resultado que de el error ms pequeo de prediccin se conserva y


se codifica de la misma manera que para imgenes P.
Slo los macrobloques que difieren de la imgen utilizada para la
prediccin tendrn que ser codificados, lo que reduce sustancialmente
la cantidad de informacin necesaria para la codificacin de imgenes
P y B.
Como el tamao de los objetos en movimiento es generalmente ms
grande que un macrobloque, hay una fuerte correlacin entre los
vectores de movimiento de bloques consecutivos, un mtodo de
codificacin diferencial (DPCM) se utiliza para codificar los vectores

La prediccin, estimacin de
movimiento y compensacin

Salida de la tasa de bits


de control
El tren de bits generado por el vdeo/
audio codificador se llama flujo elemental
(ES).
Las limitaciones del canal (transmisin o
grabacin / reproduccin) y de la memoria
intermedia de entrada especificada para
el decodificador MPEG de referencia.
La tasa de bits de este flujo elemental
generalmente debe mantenerse constante

Salida de la tasa de bits


de control

Salida de la tasa de bits


de control

Codificacin de vdeo de
MPEG-2
Los cuatro niveles se puede describir como sigue:
El bajo nivel corresponde a la resolucin SIF
utilizada en MPEG-1 (hasta 360 x 288);
El nivel principal se corresponde con resolucin
estndar 4:2:0 (hasta 720 576);
El nivel alto-1440 est dirigido a televisin de
alta definicin (resolucin de hasta 1440
1152);
El alto nivel est optimizado para pantalla
ancha HDTV (resolucin de hasta 1920 1152).

Codificacin de vdeo de
MPEG-2

Codificacin de vdeo de
MPEG-2
Nivel: Determinan la resolucin de la
imagen (desde SIF hasta HD), se encuentran
las capas de audio y video soportados por
los perfiles escalados, determinan la
mxima velocidad binaria por cada perfil.
Bajo: SIF utiliza en MPEG-1
Medio: Resolucin 4:2:0 normal hasta 720 x 256
Alto (1440): HDTV hasta 1440 x 1152
Alto: HDTV hasta 1920 x 1152

Codificacin de vdeo de
MPEG-2
PERFILES: Muestra las herramientas de
comprensin como algoritmos compatibles.
SIMPLE: Codificador y decodificador simple, no
utiliza imgenes tipo B
MEDIO: mejor relacin calidad vs tasa de
compresin, utiliza imgenes tipo I,B,P.
ESCALABLES: Para futuras aplicaciones,
escalable en resolucin espacial o cuantificaci.
Imagen bsica + informacin
suplementaria, (calidad SD + HD)

Perfil Medio/ Nivel Medio:


Adoptado por MPEG-2 para SDTV.
Mxima velocidad de flujo de datos: 15
Mbps.
Vb entre 4Mbps y 9Mbps
Codificacin con DCT.
Perfil Alto / Nivel Alto: Tv en alta
definicin (4:2:2 o 4:2:0)
Resolucin hasta 1920 x 1152
Mxima Vb a 80 Mbps
No puede ser utilizada en TV analgica.

Codificacin de vdeo de
MPEG-2
La principal novedad de MPEG-2 en comparacin con
MPEG-1 es el procesamiento de imgenes
entrelazadas.
En el modo de cuadro, un macrobloque tomado de
un campo impar se utiliza para predecir un
macrobloque correspondiente en el campo impar
siguiente, y lo mismo vale para los campos pares.
Los vectores de movimiento corresponden en este
caso a la duracin de dos campos (40 ms).
En el modo de campo, la prediccin de un
macrobloque se realiza mediante el campo anterior, y
los vectores de movimiento corresponden a la
duracin de un campo (20 ms).
En el modo mixto, la prediccin se hace de
macrobloques pertenecientes a dos tramas.

Codificacin de vdeo de
MPEG-2

Codificacin de vdeo de
MPEG-2

La compresin MPEG-4.10
Estndar de vdeo (H.264/AVC)
Proporciona un incremento considerable en la
eficiencia de compresin sobre MPEG-2
Un aumento de al menos 50%
Televisin de alta definicin (HDTV)

Usado en GSM, ADSL, SDTV, HDTV, IP TV, mviles,


sistemas de almacenamiento, sistemas de edicin.
Consta de dos capas:
Una capa de codificacin de vdeo (VCL), que representa,
en la forma ms compacta posible, el contenido de vdeo
Una capa de abstraccin de red (NAL), con formato la VCL
Transporte o el almacenamiento

La compresin MPEG4.10
H.264 es compatible con la codificacin de
imgenes entrelazadas o progresivas en formato
4:02:00
Una secuencia puede incluir ambos tipos de imgenes

La codificacin de la entropa es adaptable al


contexto y pueden usar dos modos
CABAC (adaptables al contexto codificacin aritmtica
binaria)
CABAC permite por s mismo una reduccin de
aproximadamente el 10 al 15% de la tasa de bits requerida de
una imagen

CAVLC (adaptacin al contexto de longitud variable


Coding).

La compresin MPEG4.10

La compresin MPEG4.10

COMPRESIN DE AUDIO

Audio digital aparece con el CD en los aos 80.


Alta fidelidad con fm=20KHz .
Digitalizacin PCM a 16 bits
Vb= 44,1Khz x 16 x 2(stereo)=1411.2 Kbps
Flujo aceptable sin comprensin para un CD
(640Mbytes, 74 minutos).
Aparecen otras frecuencias de muestreo de 32 y 48 KHZ
Otras MPEG adopta estas velocidades bsicas (1 a 1.5
Mbps). Se debe comprimir para los broadcast
Comprensin de audio:
Aprovechar los punto dbiles
Caractersticas del odo humano (modelos psicoacsticos).

COMPRESIN DE AUDIO
Las limitaciones del odo humano ser explotado en a
fin de reducir la cantidad de informacin.
El odo humano tiene una sensibilidad mxima para
las frecuencias de audio que van de 1 a 5 kHz.

Umbral de audicin en el silencio

COMPRESIN DE AUDIO
Enmascaramiento en frecuencia.
B enmascara A

Enmascaramiento temporal
Est vinculado con la imposibilidad del odo humano de percibir un
sonido dbil si antes de ste se estaba escuchando un sonido ms
potente

COMPRESIN DE AUDIO

COMPRESIN DE AUDIO

Enmascaramiento temporal

COMPRESIN DE AUDIO
Otro concepto de la psicoacstica es el de las
bandas crticas
El sistema auditivo humano tiene una respuesta
en frecuencia limitada en cuanto a resolucin
Existen bandas de frecuencia que el odo humano
percibe como una sola
No identifica diferencias entre 2 frecuencias distintas
dentro de una misma banda

Las bandas criticas no son constantes


Frecuencias bajas miden menos de 100Hz
Frecuencias altas miden ms de 4KHz

Hay 25 bandas de frecuencias criticas

COMPRESIN DE AUDIO
El principio del proceso de codificacin
consta:
La divisin de la banda de frecuencia de
audio en 32 sub-bandas de igual anchura
por medio de un banco de filtro polifsico.
La seal de salida de un filtro de subbanda correspondiente a una duracin de
32 muestras PCM se llama una muestra
de sub-banda.

COMPRESIN DE AUDIO

COMPRESIN DE AUDIO
Banco de filtros
Es un componente fundamental del
codificador MPEG-1
Divide la seal de audio en 32 bandas
de frecuencias de igual ancho
Son filtros pasabanda trabajando en paralelo

Todos reciben la misma seal de entrada


y todos entregan una porcin del
espectro a la salida

COMPRESIN DE AUDIO

COMPRESIN DE AUDIO
Modelo psicoacsitco
Es un modelo matemtico del
comportamiento del odo humano
Su funcionamiento es analizar la
entrada de audio y la salida de los filtros
para determinar que bandas de
frecuencias deben conservarse
Algunas bandas de frecuencia van a ser
enmascaradas por otras bandas vecinas y
no ser necesario en la salida

COMPRESIN DE AUDIO

COMPRESIN DE AUDIO

COMPRESIN DE AUDIO

COMPRESIN DE AUDIO

COMPRESIN DE AUDIO
El formato de audio MPEG define tres capas de codificacin:
Capa I / pre-MUSICAM.
Se utiliza el algoritmo PASC (Precisin de Adaptacin Sub-bandas de
Codificacin).
El banco de filtros divide la seal de audio en 32 sub-bandas de frec.
(fs/64)
Se implementan usando FFT de 512 puntos

Se utiliza una tasa de bits fija elegida entre 32 y 448 kb/s


La ventaja principal de la capa I es la relativa simplicidad del
codificador y del decodificador.
El modelo psico acstica utilizado se conoce como modelo 1.
Precisin de la cuantificacin de los coeficientes de sub-banda se define por
toda la duracin de la trama por un nmero de 4-bit que permite una
codificacin de 0 a 15 bits para cada sub-banda, y el factor de escala de 6bits tambin se define para la marco general.
Solo se usa el mascaramiento de frecuencia

COMPRESIN DE AUDIO

COMPRESIN DE AUDIO

COMPRESIN DE AUDIO
Layer II
Este es el modo ms utilizado en el sistema DVB y utiliza el
algoritmo conocido como MUSICAM
Para una calidad de audio equivalente, la capa II requiere un 3050% menor tasa de bits de la capa I
La tasa de bits es fija y elegida desde 32 hasta 192 kb/s por
canal.
El modelo psychoacoustical utilizado es el mismo que para la
capa I (modelo 1) pero la duracin de la trama es tres veces ms.
Con el fin de reducir la tasa de bits, la precisin de la
cuantificacin de los coeficientes de sub-banda disminuye con la
frecuencia
Cuantizacin definido en 4 bits para bandas bajas, 3 bits para bandas
medias y los bits 2 para bandas de alto.

COMPRESIN DE AUDIO

COMPRESIN DE AUDIO

Layer III.
Este es el formato MP3
Es un desarrollo con un modelo diferente psychoacoustical (modelo 2)
Usa una codificacin Huffmann y un anlisis DCT basado en la seal
en lugar de la codificacin sub-banda usadas en las capas I y II.
La tasa de compresin de la capa III es de aproximadamente 2 veces
tan alto como con la capa II
El codificador y el decodificador son sustancialmente ms complejo y
el tiempo de codificacin/decodificacin es mucho ms largo.
La calidad de la velocidad requiere slo 64 kb/s por canal
128 kb/s en estreo

Layer III se destina principalmente para aplicaciones unidireccionales


de baja velocidad binaria medios de comunicacin (RDSI, por
ejemplo), y su uso no est previsto para el consumidor televisin
digital

COMPRESIN DE AUDIO

COMPRESIN DE AUDIO

COMPRESIN DE AUDIO
Cuatro modos de audio principales son
posibles:
Modo estreo, los canales izquierdo y derecho
son codificados de forma completamente
independiente;
Joint_stereo, explota la redundancia entre los
canales izquierdo y derecho con el fin de
reducir la tasa de bits de audio
dual_channel, dos canales independientes que
llevan sonidos no correlacionados
Mono, slo un canal de audio.

Formato de la trama de audio


MPEG
La trama de audio es la unidad de
acceso primaria a una secuencia de
audio MPEG.
Se compone de cuatro partes
principales:
Cabecera de 32 bits
Paridad (CRC) de ms de 16 bits
Los datos de audio de longitud variable
Datos auxiliares (AD) de longitud
variable.

Formato de la trama de la layer


I
Representado por 384 muestras PCM
de la seal de audio, y contiene 12
sucesivas muestras de sub-banda.
Como el nmero de muestras es
independiente de la frecuencia de
muestreo
La duracin de la trama es
inversamente proporcional a la
frecuencia de muestreo.

Formato de la trama de
la layer I

Formato de la trama de la Layer


II
Est compuesto de 12 SBS
cada uno representando 96 (3 32)
muestras de audio de PCM

La duracin de este modo es tres


veces mayor que trama capa I
La asignacin de bits es ms
compleja, debido a las numerosas
opciones de codificacin.

Formato de la trama de la Layer


II

Dolby Digital
Como el sonido multicanal se ha
convertido cada vez ms importante con la
amplia disponibilidad de los sistemas de
cine en casa
DVB ha aadido la capacidad de transmitir
audio a 5.1 utilizando el sistema Dolby
Digital (AC-3) o DTS .
La inclusin de estos formatos adicionales
es el resultado directo del fracaso de
MPEG-2 de audio multicanal.

Dolby Digital

Dolby Digital

Dolby Digital
Dolby Digital soporta frecuencias de muestreo
de 32, 44,1 y 48 kHz de audio y las tasas de
bits-32-640 kb/s,
Puede representar el audio
Mono
Estreo
Multicanal 5.1

Tambin es el sistema de codificacin de audio


utilizado por
American DTV systems ATSC
DSS (satlite).

Dolby Digital

La trama contiene 2 campos CRC


El campo BSI indica los siguientes:
La frecuencia de muestreo
Tasa de bits
El nmero de canales de audio
Los servicios disponibles (control de gama dinmica, el modo de karaoke,
etc.)

La carga til es de seis bloques de audio de 256 muestras cada uno,


o 1536 muestras de audio por trama
La duracin efectiva de la trama depende de la frecuencia de
muestreo y la velocidad de bits.

Anda mungkin juga menyukai