Curso 2014-15
MULTIMEDIA 1
TEMA 3. Codificación de voz. Curso 2014-15
Espectro
instantáneo
MULTIMEDIA 2
TEMA 3. Codificación de voz. Curso 2014-15
Aparato fonador
Sonoros:
• Vibración cuasi-periódica de las cuerdas vocales
• La frecuencia de vibración depende de:
− presión de aire
− tensión y masa de las cuerdas vocales
varía (aprox.) entre 50 y 250 Hz en los hombres
(frecuencias algo más elevadas en mujeres)
Sordos:
• No hay vibración de las cuerdas vocales, sólo un
estrechamiento o cierre en el tracto vocal
• La fuente es un ruido turbulento y/o transitorio
MULTIMEDIA 3
TEMA 3. Codificación de voz. Curso 2014-15
/i/
/a/
/o/
/a/ cerrada
/u/
/e/
Carta de formantes
3000
2500
frec. 2o formante (Hz)
1500
/a/
1000 /u/ /o/
500
200 300 400 500 600 700 800 900 1000
frec. 1er formante (Hz)
22/09/2014 DTSC. Grado en Ingeniería Informática. Curso 2014/15 8
MULTIMEDIA 4
TEMA 3. Codificación de voz. Curso 2014-15
Audición
Oído externo:
• pabellón
• conducto auditivo externo
Oído medio:
• tímpano
• cadena osicular:
martillo,
yunque
y estribo
Oído interno:
• ventanas oval y redonda
• canales semicirculares
• caracol
MULTIMEDIA 5
TEMA 3. Codificación de voz. Curso 2014-15
2. Estrategias de codificación
MULTIMEDIA 6
TEMA 3. Codificación de voz. Curso 2014-15
Tipos de codificadores
Calidad
Excelente
Híbridos
Buena
Forma de Onda
Regular
Pobre
Vocoders
Mala
1 2 4 8 16 32 64 kb/s
MULTIMEDIA 7
TEMA 3. Codificación de voz. Curso 2014-15
MULTIMEDIA 8
TEMA 3. Codificación de voz. Curso 2014-15
Cuantificación adaptativa
Problema:
Margen dinámico Ruido de cuantificación
MULTIMEDIA 9
TEMA 3. Codificación de voz. Curso 2014-15
Codificación diferencial
Predictibilidad ⇔ Redundancia
MULTIMEDIA 10
TEMA 3. Codificación de voz. Curso 2014-15
Diversidad de locutores
• Cuantificación adaptativa
y variabilidad
en un mismo locutor • Predicción adaptativa
2.2. Vocodificación
MULTIMEDIA 11
TEMA 3. Codificación de voz. Curso 2014-15
Vocodificadores
MULTIMEDIA 12
TEMA 3. Codificación de voz. Curso 2014-15
Vocodificadores
MULTIMEDIA 13
TEMA 3. Codificación de voz. Curso 2014-15
Codificación híbrida
MULTIMEDIA 14
TEMA 3. Codificación de voz. Curso 2014-15
MULTIMEDIA 15
TEMA 3. Codificación de voz. Curso 2014-15
Predictor corto
Predictor largo
MULTIMEDIA 16
TEMA 3. Codificación de voz. Curso 2014-15
Ponderación perceptual
A( z )
W(z) =
A( z / γ )
3. Estándares
MULTIMEDIA 17
TEMA 3. Codificación de voz. Curso 2014-15
Necesidad de estandarización
Especificaciones
Calidad
Tasa binaria
Complejidad computacional
Retardo
Robustez
MULTIMEDIA 18
TEMA 3. Codificación de voz. Curso 2014-15
Vocodificación
MULTIMEDIA 19
TEMA 3. Codificación de voz. Curso 2014-15
Codificación híbrida
Comparación
MULTIMEDIA 20
TEMA 3. Codificación de voz. Curso 2014-15
Ejemplos
Fuente: http://www.data-compression.com/speech.html
MULTIMEDIA 21