FUENTE
TELEVISIN DIGITAL
12/10/15
CODIFICACIN DE LA
Los mtodos de FUENTE
compresin usan algoritmos de
compresin de datos generales aplicables a
cualquier tipo de datos.
La redundancia espacial y las peculiaridades de
la percepcin visual para imgenes fijas (JPEG)
La redundancia temporal muy alta entre
imgenes sucesivas en el caso de imgenes en
movimiento (MPEG).
Los mtodos de compresin de audio explotan
particularidades de la percepcin auditiva
humana para reducir las tasas de bits mediante
la eliminacin de informacin inaudible
CODIFICACIN DE LA
FUENTE
Principios generales de compresin de datos
Run length coding (RLC)
Cuando una fuente de informacin emite elementos
sucesivos de mensajes que pueden generar una serie
relativamente larga de elementos idnticos.
La codificacin que no pierde ninguna informacin se
define como reversible.
Este mtodo se utiliza normalmente para la
compresin de archivos relacionados con el
almacenamiento en disco o transmisin por
ordenadores (zip, etc), sino que es tambin el mtodo
utilizado en las mquinas de fax.
CODIFICACIN DE LA
FUENTE
Principios generales de compresin de datos
Variable length coding (VLC) or entropy coding
Este mtodo de reduccin de la tasa de bits se basa en el hecho
de que la probabilidad de ocurrencia de un elemento generado
por una fuente a veces no es el mismo para todos los elementos.
Con el fin de reducir la tasa de bits requerida para transmitir las
secuencias generadas por la fuente, es ventajoso para codificar
los elementos ms frecuentes con menos de n bits y los
elementos menos frecuentes con ms bits, resultando en una
longitud media que es menor que una longitud fija de n bits.
Este mtodo se utilizado:
Compresin de texto.
Imgenes de vdeo.
CODIFICACIN DE LA
FUENTE
La cantidad de informacin Q
transmitida por un elemento:
Q = log2(1/p)
COMPRESIN PARA
IMAGENES
La transformada de coseno discreta (DCT) es un caso
particular de la transformada de Fourier se aplica a
seales discretas, que se descompone de una seal
peridica.
La seal puede ser representada por una serie de
coeficientes de cada una de estas funciones.
La seal original, la imagen, es una seal muestreada
bidimensional, por lo que tambin tendr una DCT
bidimensional (direcciones horizontal y vertical), que
transformar la luminancia (o crominancia) a valores
discretos de un bloque de N x N pxeles en otro bloque (o
matriz) de N N coeficientes que representan la
amplitud de cada una de las funciones coseno armnicos.
COMPRESIN PARA
IMAGENES
Las especificidades psicofisiolgicos de la visin humana
(sensibilidad reducida a las frecuencias espaciales altas), es posible,
sin degradacin perceptible de la calidad de la imagen, para eliminar
los valores por debajo de un cierto umbral de la frecuencia.
Los valores eliminados son sustituidos por 0 (una operacin
conocida como umbral); esta parte del proceso, obviamente no es
reversible, ya que algunos datos son desechados.
Los coeficientes restantes se cuantifica con una precisin decreciente
con las frecuencias crecientes espaciales, lo que de nuevo reduce la
cantidad de informacin necesaria para codificar un bloque, pero
tiene poco efecto sobre la calidad de imagen percibida.
Los parmetros de umbral y cuantificacin se puede utilizar para
regular dinmicamente la tasa de bits requerida para transmitir
imgenes en movimiento.
COMPRESIN PARA
IMAGENES
Las transformadas de una imagen generan conjuntos de
datos que contienen la misma informacin que las
imgenes originales, con la propiedad de poder volver a
generar las imgenes originales mediante las
correspondientes transformadas inversas.
Una imagen monocolor de dimensiones N x N, se puede
expresar como una funcin de dos variables f(x,y) donde
(x,y) son las coordenadas de cada pxel (x=0,1,...,N-1 e
y=0,1,...,N-1)
f(x,y) es la intensidad de color del pxel (x,y).
COMPRESIN PARA
IMAGENES
COMPRESIN PARA
IMAGENES
COMPRESIN PARA
IMAGENES
LA COMPRESIN DE IMGENES
FIJAS
JPEG (Joint Photographic Experts
Group)
Cabe sealar que la compresin JPEG
puede ser con o sin prdidas,
dependiendo de la aplicacin y el
factor de compresin deseado.
LA COMPRESIN DE IMGENES
FIJAS
Este tipo de compresin consta de 3 pasos:
Primero se pasa la imagen del formato RGB al formato YIQ.
El formato de color YIQ representa una divisin entre la
luminosidad (cantidad de luz percibida) y la informacin
sobre el color.
El ojo humano es mucho ms sensible a la luminosidad que al
color, cosa que se aprovecha para la compresin.
LA COMPRESIN DE IMGENES
FIJAS
LA COMPRESIN DE IMGENES
FIJAS
LA COMPRESIN DE IMGENES
FIJAS
En el formato de color RGB, las imgenes a color
se almacenan en 3 canales independientes (rojo,
verde y azul) que toman valores de 0 a 255
dependiendo de la intensidad.
El formato de color YIQ representa una divisin
entre la luminosidad (Y) y el color (I, Q). La
conversin entre RGB e YIQ es:
LA COMPRESIN DE IMGENES
FIJAS
LA COMPRESIN DE IMGENES
FIJAS
El ojo humano es menos sensible a
los matices de color que a la
cantidad de luz percibida.
Es por ello que podemos reducir la
informacin almacenada para los
canales I y Q de una imagen YIQ
COMPRESIN PARA
IMAGENES
COMPRESIN PARA
IMAGENES
COMPRESIN PARA
Un flujo de bits
en serie se obtiene por "zig-zag"
IMAGENES
COMPRESIN PARA
IMAGENES
COMPRESIN PARA
IMAGENES
Resta 128
COMPRESIN PARA
IMAGENES
COMPRESIN PARA
IMAGENES
Matriz DCT
COMPRESIN PARA
IMAGENES
COMPRESIN PARA
IMAGENES
El formato 1280i
Es un formato entrelazado ofrece una
resolucin horizontal de 1920 pxeles y
una resolucin vertical de 1080
lneas/pixels
La compresin de imgenes en
movimiento
En 1990, la necesidad de almacenar y
reproducir imgenes en movimiento y el
sonido asociado en formato digital para
aplicaciones multimedia
La ISO lidero para formar un grupo de
expertos a de las mismas lnea que JPEG
MPEG (Motion Pictures Experts Group).
La compresin de imgenes en
movimiento
El primer resultado de su trabajo fue
la norma internacional ISO / IEC 11172
MPEG-1
La compresin de imgenes en
movimiento
El estndar MPEG-1 consta de tres
partes bien diferenciadas, publicado
en noviembre de 1992:
MPEG-1 sistema (ISO / IEC 11172-1)
MPEG-1 multiplex structure
La compresin de imgenes en
movimiento
La calidad de la imagen de MPEG-1
no era adecuado para aplicaciones de
difusin
La codificacin de imgenes entrelazadas
o la evolucin hacia la HDTV.
La compresin de imgenes en
movimiento
MPEG-2 se especifica en tres partes
bien diferenciadas, publicado en
noviembre de 1994:
Sistema MPEG-2 (ISO / IEC 13818-1)
MPEG-2 streams
Principios de la codificacin de
vdeo de MPEG-1
La velocidad binaria constante de 1,5 Mb / s para almacenar
vdeo y audio en CD-ROM.
La parte de video cuenta con 1,15 Mb/s
Los 350 kb/s siendo utilizado por los datos de audio
Principios de la codificacin de
vdeo de MPEG-1
La descodificacin tiene que llevarse a cabo en tiempo
real
Significa un retraso en el procesamiento aceptable y
constante
Principios de la codificacin de
vdeo de MPEG-1
El tiempo de acceso aleatorio a una
secuencia tiene que ser mantenido
dentro de un lmite aceptable
No exceda de 0,5 s que limita el nmero
mximo de imgenes
El sistema opera 25 imgenes/seg.
Descomposicin de una
secuencia de vdeo MPEG
MPEG define una jerarqua de capas dentro de una
secuencia de vdeo
Cada una de estas capas tiene la funcin especfica
en el proceso de MPEG.
Secuencia. Esta es la capa ms alta que define el
contexto vlido para toda la secuencia
Parmetros bsicos de vdeo
Descomposicin de una
secuencia de vdeo MPEG
Macrobloque. Esta es la capa utilizada para
la estimacin de movimiento /
compensacin.
Un macrobloque tiene un tamao de 16 x 16
pxeles
Se compone de cuatro bloques de luminancia y
dos bloques de crominancia.
Descomposicin de una
secuencia de vdeo MPEG
Slice(Rebada). Esta es la capa de
direccionamiento de INTRA trama y resincronizacin
Se define como un conjunto de
macrobloques contiguos.
El conjunto de las rebanadas cubre toda la
imagen sin ningn solapamiento entre los
diferentes segmentos.
El tamao de un sector es una fila
completa de macrobloques.
Descomposicin de una
secuencia de vdeo MPEG
Descomposicin de una
secuencia de vdeo MPEG
La prediccin, estimacin de
movimiento y compensacin
Estimacin de movimiento consiste en definir un
vector de movimiento que garantiza la correlacin entre
una zona de llegada en la segunda imagen y una zona de
salida en la primera imagen
Utilizando una tcnica conocida como correspondencia de
bloques
La prediccin, estimacin de
movimiento y compensacin
La diferencia (o error de prediccin)
entre el bloque actual para ser
codificado y la correspondencia de
bloques se calcula y codifica de
manera similar a los bloques de las
imgenes I (DCT, cuantizacin, RLC /
VLC).
Este proceso se denomina
compensacin de movimiento.
La prediccin, estimacin de
movimiento y compensacin
Para las imgenes B, los vectores de movimiento se calculan por
interpolacin temporal de los vectores de la imagen P siguiente, de
tres formas:
adelante
atrs
Bidireccional
La prediccin, estimacin de
movimiento y compensacin
Codificacin de vdeo de
MPEG-2
Los cuatro niveles se puede describir como sigue:
El bajo nivel corresponde a la resolucin SIF
utilizada en MPEG-1 (hasta 360 x 288);
El nivel principal se corresponde con resolucin
estndar 4:2:0 (hasta 720 576);
El nivel alto-1440 est dirigido a televisin de
alta definicin (resolucin de hasta 1440
1152);
El alto nivel est optimizado para pantalla
ancha HDTV (resolucin de hasta 1920 1152).
Codificacin de vdeo de
MPEG-2
Codificacin de vdeo de
MPEG-2
Nivel: Determinan la resolucin de la
imagen (desde SIF hasta HD), se encuentran
las capas de audio y video soportados por
los perfiles escalados, determinan la
mxima velocidad binaria por cada perfil.
Bajo: SIF utiliza en MPEG-1
Medio: Resolucin 4:2:0 normal hasta 720 x 256
Alto (1440): HDTV hasta 1440 x 1152
Alto: HDTV hasta 1920 x 1152
Codificacin de vdeo de
MPEG-2
PERFILES: Muestra las herramientas de
comprensin como algoritmos compatibles.
SIMPLE: Codificador y decodificador simple, no
utiliza imgenes tipo B
MEDIO: mejor relacin calidad vs tasa de
compresin, utiliza imgenes tipo I,B,P.
ESCALABLES: Para futuras aplicaciones,
escalable en resolucin espacial o cuantificaci.
Imagen bsica + informacin
suplementaria, (calidad SD + HD)
Codificacin de vdeo de
MPEG-2
La principal novedad de MPEG-2 en comparacin con
MPEG-1 es el procesamiento de imgenes
entrelazadas.
En el modo de cuadro, un macrobloque tomado de
un campo impar se utiliza para predecir un
macrobloque correspondiente en el campo impar
siguiente, y lo mismo vale para los campos pares.
Los vectores de movimiento corresponden en este
caso a la duracin de dos campos (40 ms).
En el modo de campo, la prediccin de un
macrobloque se realiza mediante el campo anterior, y
los vectores de movimiento corresponden a la
duracin de un campo (20 ms).
En el modo mixto, la prediccin se hace de
macrobloques pertenecientes a dos tramas.
Codificacin de vdeo de
MPEG-2
Codificacin de vdeo de
MPEG-2
La compresin MPEG-4.10
Estndar de vdeo (H.264/AVC)
Proporciona un incremento considerable en la
eficiencia de compresin sobre MPEG-2
Un aumento de al menos 50%
Televisin de alta definicin (HDTV)
La compresin MPEG4.10
H.264 es compatible con la codificacin de
imgenes entrelazadas o progresivas en formato
4:02:00
Una secuencia puede incluir ambos tipos de imgenes
La compresin MPEG4.10
La compresin MPEG4.10
COMPRESIN DE AUDIO
COMPRESIN DE AUDIO
Las limitaciones del odo humano ser explotado en a
fin de reducir la cantidad de informacin.
El odo humano tiene una sensibilidad mxima para
las frecuencias de audio que van de 1 a 5 kHz.
COMPRESIN DE AUDIO
Enmascaramiento en frecuencia.
B enmascara A
Enmascaramiento temporal
Est vinculado con la imposibilidad del odo humano de percibir un
sonido dbil si antes de ste se estaba escuchando un sonido ms
potente
COMPRESIN DE AUDIO
COMPRESIN DE AUDIO
Enmascaramiento temporal
COMPRESIN DE AUDIO
Otro concepto de la psicoacstica es el de las
bandas crticas
El sistema auditivo humano tiene una respuesta
en frecuencia limitada en cuanto a resolucin
Existen bandas de frecuencia que el odo humano
percibe como una sola
No identifica diferencias entre 2 frecuencias distintas
dentro de una misma banda
COMPRESIN DE AUDIO
El principio del proceso de codificacin
consta:
La divisin de la banda de frecuencia de
audio en 32 sub-bandas de igual anchura
por medio de un banco de filtro polifsico.
La seal de salida de un filtro de subbanda correspondiente a una duracin de
32 muestras PCM se llama una muestra
de sub-banda.
COMPRESIN DE AUDIO
COMPRESIN DE AUDIO
Banco de filtros
Es un componente fundamental del
codificador MPEG-1
Divide la seal de audio en 32 bandas
de frecuencias de igual ancho
Son filtros pasabanda trabajando en paralelo
COMPRESIN DE AUDIO
COMPRESIN DE AUDIO
Modelo psicoacsitco
Es un modelo matemtico del
comportamiento del odo humano
Su funcionamiento es analizar la
entrada de audio y la salida de los filtros
para determinar que bandas de
frecuencias deben conservarse
Algunas bandas de frecuencia van a ser
enmascaradas por otras bandas vecinas y
no ser necesario en la salida
COMPRESIN DE AUDIO
COMPRESIN DE AUDIO
COMPRESIN DE AUDIO
COMPRESIN DE AUDIO
COMPRESIN DE AUDIO
El formato de audio MPEG define tres capas de codificacin:
Capa I / pre-MUSICAM.
Se utiliza el algoritmo PASC (Precisin de Adaptacin Sub-bandas de
Codificacin).
El banco de filtros divide la seal de audio en 32 sub-bandas de frec.
(fs/64)
Se implementan usando FFT de 512 puntos
COMPRESIN DE AUDIO
COMPRESIN DE AUDIO
COMPRESIN DE AUDIO
Layer II
Este es el modo ms utilizado en el sistema DVB y utiliza el
algoritmo conocido como MUSICAM
Para una calidad de audio equivalente, la capa II requiere un 3050% menor tasa de bits de la capa I
La tasa de bits es fija y elegida desde 32 hasta 192 kb/s por
canal.
El modelo psychoacoustical utilizado es el mismo que para la
capa I (modelo 1) pero la duracin de la trama es tres veces ms.
Con el fin de reducir la tasa de bits, la precisin de la
cuantificacin de los coeficientes de sub-banda disminuye con la
frecuencia
Cuantizacin definido en 4 bits para bandas bajas, 3 bits para bandas
medias y los bits 2 para bandas de alto.
COMPRESIN DE AUDIO
COMPRESIN DE AUDIO
Layer III.
Este es el formato MP3
Es un desarrollo con un modelo diferente psychoacoustical (modelo 2)
Usa una codificacin Huffmann y un anlisis DCT basado en la seal
en lugar de la codificacin sub-banda usadas en las capas I y II.
La tasa de compresin de la capa III es de aproximadamente 2 veces
tan alto como con la capa II
El codificador y el decodificador son sustancialmente ms complejo y
el tiempo de codificacin/decodificacin es mucho ms largo.
La calidad de la velocidad requiere slo 64 kb/s por canal
128 kb/s en estreo
COMPRESIN DE AUDIO
COMPRESIN DE AUDIO
COMPRESIN DE AUDIO
Cuatro modos de audio principales son
posibles:
Modo estreo, los canales izquierdo y derecho
son codificados de forma completamente
independiente;
Joint_stereo, explota la redundancia entre los
canales izquierdo y derecho con el fin de
reducir la tasa de bits de audio
dual_channel, dos canales independientes que
llevan sonidos no correlacionados
Mono, slo un canal de audio.
Formato de la trama de
la layer I
Dolby Digital
Como el sonido multicanal se ha
convertido cada vez ms importante con la
amplia disponibilidad de los sistemas de
cine en casa
DVB ha aadido la capacidad de transmitir
audio a 5.1 utilizando el sistema Dolby
Digital (AC-3) o DTS .
La inclusin de estos formatos adicionales
es el resultado directo del fracaso de
MPEG-2 de audio multicanal.
Dolby Digital
Dolby Digital
Dolby Digital
Dolby Digital soporta frecuencias de muestreo
de 32, 44,1 y 48 kHz de audio y las tasas de
bits-32-640 kb/s,
Puede representar el audio
Mono
Estreo
Multicanal 5.1
Dolby Digital