El audio digital es la codificacin digital de una seal elctrica que representa una onda
sonora. Consiste en una secuencia de valores enteros y se obtienen de dos procesos:
elmuestreo y la cuantificacin digital de la seal elctrica.
1 Tasa de muestreo
o
1.1 Aliasing
4 Vase tambin
5 Referencias
6 Bibliografa
7 Enlaces externos
Tasa de muestreo[editar]
Ejemplo de reconstruccin de una seal de 14,7 kHz (lnea gris discontinua) con slo cinco muestras.
Cada ciclo se compone de slo 3 muestras a 44100 muestras por segundo. La reconstruccin terica
resulta de la suma ponderada de la funcin de interpolacin g(t) y sus versiones correspondientes
desplazadas en el tiempo g(t-nT) con
las muestras x(n). En esta imagen cada funcin de interpolacin est representada con un color (en
total, cinco) y estn ponderadas al valor de su correspondiente muestra (el mximo de cada funcin
pasa por un punto azul que representa la muestra).
De acuerdo con el Teorema de muestreo de Nyquist, la tasa de muestreo, esto es, el nmero
de muestras con las que se realiza el proceso de muestreo en una unidad de tiempo,
determina exclusivamente la frecuencia mxima de los componentes armnicos que pueden
formar parte del material a digitalizar.1 Satisfechos los requerimientos de Nyquist y un pequeo
margen prctico, y al contrario de lo que es una creencia errnea muy extendida, 2 no existe
relacin directa entre el sobremuestreo A/D (realizar el muestreo digital a una tasa mayor de la
estrictamente necesaria para el ancho de banda de inters) y una mayor fidelidad en la
posterior reconstruccin de la seal en todo el espectro (hasta la frecuencia de Nyquist).3
Aliasing[editar]
Con objeto de evitar el fenmeno conocido como aliasing, es necesario eliminar todos los
componentes de frecuencias que exceden la mitad de la tasa de muestreo, es decir, del lmite
de Nyquist, antes del proceso de digitalizacin (conversin A/D). En la prctica, estos
componentes se atenan fuertemente mediante un filtro activo analgico paso-bajo que se
aplica a la seal analgica de inters antes de su digitalizacin y que para este objetivo se
denomina filtro antialiasing. En el proceso de reconstruccin posterior (conversin D/A) de la
reproduccin se deber aplicar en esencia el mismo filtrado analgico mediante un filtro que,
empleado en este proceso, se denomina de reconstruccin.
Por tanto, una cuantificacin de 16 bits permite un mximo terico para la relacin seal
sinusoidal a ruido de cuantificacin de 98,09 dB (122,17 dB para 20 bits, valor muy cercano al
lmite real que permite el ruido de Johnson-Nyquist (tambin conocido como ruido trmico) de
los mejores convertidores A/D actuales). En la prctica, el lmite de una seal analgica para
que pueda ser cuantificada sin merma dinmica es, aproximadamente, el 90% del lmite
terico.5 Por lo tanto, el lmite que debe tener una seal (por ejemplo, la seal directa de un
micrfono o la que resultara de un mster analgico) para ser cuantificada con seguridad con
slo 14 bits es de unos 78 dB, an cuando el lmite terico sea de 86,05 dB en este caso.
Una vez que la relacin seal a ruido de cuantificacin que permite un proceso
de cuantificacin dado excede la relacin seal a ruido mxima del material sonoro que se
pretende cuantificar, esta podr ser cuantificada totalmente sin prdidas en su rango dinmico.
Pasado este umbral, de nada sirve aumentar el nmero de bits por muestra del proceso de
cuantificacin: no resultar en una conversin ms fiel. Por ejemplo, una relacin seal a ruido
de cuantificacin de 90 dB (una relacin prctica que permiten sobradamente los 16 bits por
muestra de un CD-Audio) es suficiente para cuantificar cualquier grabacin musical normal,
cuyo rango de intensidad sonora puede ir desde los 25 dB(SPL) del ruido de fondo de un
estudio de grabacin hasta los 115 dB(SPL), casi el umbral del dolor de la audicin
humana,6 en la posicin del micrfono durante una grabacin en dicho estudio.
El tamao de las muestras necesario en un proceso de cuantificacin digital se determina, por
tanto, a partir del anlisis del ruido de fondo y de la intensidad mxima del material sonoro a
registrar. Aumentar por encima de lo necesario el tamao de las muestras es slo un
desperdicio de ancho de banda, especialmente en los formatos finales de distribucin. No
supone mejora alguna, ni siquiera mensurable, ya que slo servira para registrar el ruido con
ms bits, es decir, ms bits intiles cuyo valor depender exclusivamente del azar o, segn se
ajuste la ganancia, para dejar los bits ms significativos a cero en todas las muestras (o una
combinacin de ambas cosas). De modo parecido, un recipiente de capacidad mayor a la del
lquido que se pretende depositar en l no mejora en medida alguna la calidad o cantidad de
dicho lquido respecto al uso de un recipiente de menor capacidad siempre que sta
capacidad menor sea an suficiente para el volumen del lquido. Dicho de otro modo, al
contrario de lo que es una creencia errnea muy extendida,7 el tamao de las muestras a
emplear en una cuantificacin depende del material sonoro que se pretende cuantificar y nada
tienen que ver la fidelidad de la reconstruccin en la reproduccin o los lmites psicoacsticos
humanos (por la percepcin de dicha fidelidad) con esta determinacin, por ejemplo. Si un
material sonoro a digitalizar "cabe" en 10 bits por muestra, cuantificar a 14 bits (o 20) no hace
ms fiel su reconstruccin posterior ni, consecuentemente, es posible percibir diferencias
subjetivas que no resulten de la sugestin.
Los archivos de audio digital almacenan toda la informacin que ocurra en el tiempo, el
tamao del archivo no vara as contenga 'silencio' o sonidos muy complejos [cita requerida]. Existen
muchos formatos de archivo de audio digital, que se pueden dividir en dos categoras PCM y
comprimidos. Como se vio arriba el tamao puede depender de la cantidad de canales que
tenga el archivo y de la resolucin (tasa de muestreo y profundidad).
Formatos PCM Los formatos PCM contienen toda la informacin que sali del convertidor
analgico a digital, sin ninguna omisin y por eso, tienen la mejor calidad. Dentro de esta
categora se encuentran los formatos WAV, AIFF, SU, AU y RAW (crudo). La diferencia
principal que tienen estos formatos es el encabezado, alrededor de 1000 bytes al comienzo
del archivo[cita requerida].
Formatos comprimidos Para usar menos memoria que los archivos PCM existen formatos
de sonido comprimidos, como por ejemplo el MP3, AAC y Ogg. Ciertos algoritmos de
compresin descartan informacin que no es perceptible por el odo humano para lograr que
el mismo fragmento de audio pueda ocupar en la memoria hasta la dcima parte -o incluso
menos- de lo que ocupara un archivo PCM[cita requerida]. La reduccin en tamao implica una
prdida de informacin y por esto a los formatos de este tipo se les llama
formatos comprimidos con prdida[cita requerida]. Existen tambin formatos de
archivo comprimido sin prdida, entre los que se cuentan el FLAC y el Apple Lossless
Encoder, cuyo tamao suele ser de aproximadamente la mitad de su equivalente
PCM[cita requerida].
Formatos descriptivos: Archivos MIDI Este formato de archivos no es precisamente de
audio digital, pero s pertenece a las tecnologas de la informtica musical. El archivo MIDI no
almacena "sonido grabado", sino las indicaciones para que un sintetizador o cualquier otro
dispositivo MIDI "interprete" una serie de notas u otras acciones (control de un mezclador, etc.)
[cita requerida]
. Podemos imaginarlos como algo similar a una partitura, con los nombres de los
instrumentos que hay que utilizar, las notas, tiempos y algunas indicaciones acerca de la
interpretacin.