Anda di halaman 1dari 9

PROCESOS DE LA DIGITALIZACIN DE LA

INFORMACIN MULTIMEDIA

Codificacin y compresin son conceptos tan ligados que es frecuente su


confusin. La codificacin es el proceso en el que se representa una
informacin de vdeo o audio digital de manera diferente a la original, sin
perder ninguna informacin en el proceso.
La mayora de codificaciones existentes tienen como objetivo o bien comprimir
la informacin o bien ofuscarla para hacerla ms segura (o ambos). En esta
asignatura, slo nos vamos a centrar en el primero.
As pues, una codificacin implica usualmente una compresin, una reduccin
del tamao final del fichero sin prdida alguna de informacin. Este
comportamiento se conoce tambin como compresin sin prdidas.
Lamentablemente no tiene ni de lejos buenos resultados con vdeo o audio, por
ello necesitamos una tcnica complementaria: la compresin con prdidas.
En general, la compresin hace referencia a la reduccin de la informacin
perdiendo o no parte de sta, al menos sin reducir excesivamente su calidad.
Hablamos entonces de compresin sin prdidas o con prdidas, aunque esta
ltima es la ms utilizada, ya que consigue reducir mucho ms el tamao de la
informacin que la compresin sin prdidas. Si bien un cambio de la
codificacin por s solo puede lograr cierta reduccin del volumen de datos, es
sin duda la compresin el quid de todo sistema de almacenamiento o
distribucin audiovisual. La combinacin de los dos es la tcnica habitual de
trabajo de todos los estndares audiovisuales actuales.
Todo ello es posible si se trata con informacin digital: los sistemas de audio y
vdeo actuales poseen una primera etapa de conversin analgica a digital, ya
que la realidad que nos envuelve es analgica por naturaleza.
En cambio, en entornos industriales y semiprofesionales, la captura y la
compresin vienen juntas, como es el caso del hardware y software que usa el
estndar MPEG.
La digitalizacin es el proceso de convertir informacin analgica en formato
digital. Etc. En este trabajo solo me centrar en textos e imgenes tangibles. El
objetivo de la digitalizacin es mejorar el acceso a las materiales. A tal fin,
muchos de los materiales digitalizados pueden ser buscados a travs de bases
de datos en internet. Para que los materiales puedan ser digitalizados existen
varias maneras de capturarlos: por medio de escner, fotografa digital,
grabacin digital, etc. una amplia variedad de equipamiento est disponible
para ayudar en este proceso.

INTRODUCCIN A LA COMPRESIN DE DATOS (II).


Un sistema de compresin consta de:
Codificador y decodificador

Codificador y decodificador pueden ser:

Asimtricos

El codificador suele ser ms complejo y lento que el


decodificador (Ej.: Vdeo por demanda)
Simtricos

Coste computacional similar (Ej: Videoconferencia).

Con prdidas (lossy compression) o irreversible

Adecuada para medios continuos (audio y vdeo).

Mayores tasas de compresin.

Sin prdidas (lossless compression) o reversible:

Ficheros de datos, imgenes mdicas, etc.

BASADA EN CODIFICACION ENTROPIA


Entropa:

Valor medio de informacin de un conjunto de smbolos procedente


de una fuente de informacin (es imposible de medir en la prctica).
(pi = probabilidad del smbolo i)
Por ejemplo: Sea S = {4, 5, 6, 7, 8,9}, en donde la probabilidad de
cada smbolo es la misma (1/6).
Segn la teora de la informacin (Shannon), esta fuente no puede
ser codificada (sin prdidas) con menos de 2.585 bits por smbolo.

CODIFICACIN HUFFMAN
Representan los smbolos con un nmero de bits inversamente
proporcional a su frecuencia.
Algoritmo genrico:

Se construye un rbol binario de abajo hacia arriba agrupando los


smbolos de menor frecuencia y asignado la suma de las
probabilidades de ambos al nodo padre del rbol.
Cada smbolo estar representado por una hoja del rbol y su
cdigo sern los bits recorridos hasta la raz del mismo.
Ejemplo:
CODIFICACIN ARITMETICA
Identifica una secuencia de smbolos asignndoles una representacin
binaria de un intervalo de una longitud inferior a la unidad.
Siempre son ms eficientes que los cdigos Huffman

Separa el modelo probabilstico de la asignacin de bits pudiendo


definir codificadores adaptativos.
Es computacionalmente eficiente, aunque est sujeto a patentes.

Ejemplo:

Supongamos slo dos smbolos, A y B con una probabilidad de


P(A)=1/3 y P (B)=2/3.

CODIFICACION BASADA EN LA FUENTE


Se basan fundamentalmente en las propiedades de la fuente de datos a
codificar.
Suelen tolerar prdidas en la codificacin (lossy codecs) que
perceptualmente pasan inadvertidas para el usuario.
Son codificadores de propsito especfico.

Por trmino general obtienen mayores prestaciones que los codificadores


basados en la entropa.

CODIFICACION DIFERENCIAL
Se basa en la codificacin de las diferencias entre dos smbolos
consecutivos.
Ciertos tipos de datos tienen la propiedad de similitud entre smbolos
consecutivos:
Seal de Audio, vdeo, imgenes, etc.
Esto permite codificar con pocos bits las diferencias.

Ejemplo:

DPCM (Differential Pulse Code Modulation)

Codificacin con prdida.

DIGITALIZACION Y CUANTIFICACION:
La digitalizacin de las seales de audio se realiza mediante convertidores A/D.
Muestrean la seal analgica de audio a una frecuencia determinada.

Segn Nyquist: Si la seal de entrada tiene una frecuencia mxima de f, la


frecuencia de muestreo tiene que ser de al menos 2f (al muestrear a Sf captaremos
hasta la frec. Sf/2)

En el conversor D/A, un filtro paso bajo puede interpolar la parte de seal entre las
muestras, para poder reconstruir perfectamente la seal original.

Cuantificacin: Las muestras obtenidas se codifican en un nmero finito de


bits

Error de cuantificacin (quantification noise).


Codificacin lineal o logartmica.
PCM (Pulse Code Modulation).

Usado para la digitalizacin de seales de audio.


Parmetros: Sf, bits/muestra, niveles de cuantificacin*
CARACTERSTICA DEL AUDIO
El rango de frecuencias audibles por los humanos est entre 20Hz
y 20KHz.
Una seal de audio no es ms que una onda acstica (variaciones
de presin del aire)
La seal de audio es unidimensional (tiempo)
El micrfono transforma las ondas acsticas que lo golpean, en
seales elctricas (niveles de voltaje)
El odo es muy sensible a las variaciones de sonido de corta
duracin (ms) al contrario que el ojo humano.
La relacin de dos sonidos A y B se mide en decibelios:
dB=20 log10 (A/B).
La intensidad de un sonido A se mide en decibelios tomando como
referencia el menor sonido audible.
0 dB: Menor sonido audible
La seal de referencia (B) es una onda senoidal a 1khz que
provoca una presin de 0.0003 dinas/cm2
A y B son amplitudes (si fueran potencias sera 10 log10 (A/B))
50 dB: Conversacin normal.
120dB: Umbral del dolor.

Audible

No audible
CALIDAD DE UNA SEAL DE AUDIO
Voz (telefona)

Se define para los servicios de telefona digital.


Estndar G.711 (ITU): Codificacin logartmica.
Japn y USA: Transformacin -law.
Resto: Transformacin A-law. (+)
Parmetros:
Seal de audio de 3.5 KHz (BW).
Sf = 8 KHz
8 bits/muestra.
Tasa de bits: 64Kbps (N-ISDN).
Otras tcnicas de codificacin y compresin:
DPCM y ADPCM,
G.72x,
GSM,
LPC y CELP,
etc.
CD-Digital Audio.
Calidad de audio superior: Sonido Hi-Fi estereofnico.
Utiliza una codificacin lineal. Las diferencias de amplitud
deben ser respetadas por igual.
Parmetros:
Seal de audio de 20 KHz (BW).
Sf = 41.1 KHz
16 bits/muestra.
Soporta estereofona (dos canales)
Tasa de bits: 1.411 Mbps.
Otros estndares utilizan esta calidad de audio:
DAT (32.4 y 48 KHz),
MPEG (32, 44,1 y 48 KHz),
DVI,
etc.
Codificacin diferencial:
DPCM (Differential Pulse Code Modulation).
Explota la redundancia temporal entre las muestras.
Se transmite la diferencia entre muestras (bastante
menor).

Problema: Sobrecarga de gradiente (slope overload)


Las diferencias en altas
frec.(cercanas a Nyquist) no se pueden representar con el mismo
nmero de bits.
ALGORITMOS DE COMPRESIN (VOZ)
Codificacin diferencial adaptativa:
ADPCM (Adaptive Differential Pulse Code Modulation). Predice la
muestra y cuantiza adaptativamente.
Cuantizacin adaptativa: Usa pasos ms largos para codificar
diferencias entre muestras muy distintas en magnitud (de alta
frecuencia) y pasos ms pequeos para muestras que son similares
(bajas frecuencias).
CALIDAD TELEFNICA
Tabla resumen de algunos codecs de audio.

MPEG AUDIO: FUNDAMENTOS.


Se basa en la capacidad de percepcin que tiene el odo humano
(modelos psico-acsticos) Enmascaramiento de seales dbiles
(noise masking):

Anda mungkin juga menyukai