Anda di halaman 1dari 9

Seminario Internacional de Acstica 2003 Santiago

Seminario Internacional de Acstica 2003

Aplicaciones del anlisis acstico en los estudios de la voz humana


Matas Zaartu Salas Unidad de Acstica - Escuela de Fonoaudiologa Universidad Mayor Av. Libertador Bdo. OHiggins 2013 - Santiago - Chile Fono: (56) 2 4205715 - Fax: (56) 2 4205775 mzanartu@email.umayor.cl

Resumen
El anlisis espectral tiene una serie de aplicaciones relativas al procesamiento de los sonidos de la voz humana, las cuales se presentan en softwares dedicados que incluyen una serie de herramientas que han sido especialmente diseadas para facilitar el anlisis e interpretacin de los resultados. En este trabajo se exponen las principales aplicaciones en fontica acstica y en identificacin de patologas de la voz realizadas con estas herramientas, que actualmente se desarrollan en el Laboratorio de Acstica de la Escuela de Fonoaudiologa de la Universidad Mayor, las cuales son llevadas a cabo por un equipo multidisciplinario de especialistas en el tema, conformado por Ingenieros Acsticos, Fonoaudilogos especialistas tanto en Lingstica, Audiologa como Trastornos de la voz, y Mdicos otorrinolaringlogos, entre otros. El trabajo presenta adems una breve resea de los criterios acsticos asociados al estudio de la voz humana, de los modelos de voz normal y patolgica actualmente aceptados internacionalmente, de las variables fonticas de mayor inters, y de las caractersticas bsicas del funcionamiento de los programas de anlisis dedicados para el estudio de la voz de la familia de softwares de Kay Elemetrics Corp.

Seminario Internacional de Acstica 2003 Santiago

1. Introduccin
1.1. Conceptos bsicos sobre la generacin de la voz humana
Tradicionalmente necesitamos de tres grupos o sistemas de rganos para que, coordinadamente podamos producir lenguaje hablado. Estos grupos son: Sistema Respiratorio, Sistema Fonatorio y Sistema Articulatorio. Mediante estos sistemas se puede definir un modelo acstico de generacin de voz humana, el cual considera las siguientes etapas: Generacin del sonido madre: Mediante vibracin de las cuerdas vocales (se distinguen dentro de esta categora al menos tres patrones vibratorios diferentes), mediante flujo de aire y mediante golpes de presin acumulada. Modulacin del tracto vocal: Se puede considerar al tracto vocal como tubo de seccin variable, controlado segn la articulacin determinada por los msculos de la faringe, el cuerpo y punta de la lengua, el velo del paladar y los labios. Al igual que en un tubo simple, el fenmeno de resonancias en el tracto aumentan la amplitud de un grupo de frecuencias alrededor de una determinada banda de frecuencia. A cada resonancia se le denomina formante. Radiacin de salida: La salida del sonido tiene asociada una impedancia de radiacin que influye sobre el sonido variando la composicin espectral del sonido y los niveles de presin sonora con respecto al ngulo de salida.
Figura N1. Modelo acstico bsico de la generacin de la voz

Figura N2. Esquema del efecto del tracto vocal sobre la seal del sonido madre

Seminario Internacional de Acstica 2003 Santiago

1.2. Fonemas: Vocales y Consonantes


El fonema es la mnima unidad lingstica capaz de producir cambios de significados. Estos fonemas pueden ser agrupados en dos grandes entidades: Fonemas Voclicos y Fonemas Consonnticos. Ambos tipos de fonemas pueden clasificarse segn el estado vibratorio de las cuerdas vocales, en fonemas fonados ( sonoros) y fonos ( sordos). Los Fonemas Voclicos son siempre fonados, a diferencia de los consonnticos que pueden ser o no fonados. Sin embargo, la principal diferencia entre los fonemas voclicos y consonnticos es el tamao de estas constricciones asociadas a las articulaciones en el tracto, siendo en las consonantes estas obstrucciones mucho ms estrechas. Las vocales se clasifican segn la apertura del tracto vocal (vocales abiertas y cerradas) y segn el grado de elevacin del dorso de la lengua (vocales anteriores, centrales y posteriores). Por otro lado las consonantes se clasifican segn el punto de articulacin (lugar de contacto de los articuladores que participan en la produccin de un fonema especfico), modo de articulacin (forma como se interrumpe el flujo areo espiratorio), funcin de las cuerdas vocales (presencia o ausencia de este al momento de producir un fonema), y posicin del velo del paladar (capacidad de controlar el paso de aire hacia la cavidad nasal u oral).

1.3. Prosodia: Acentuacin y Entonacin


La prosodia evala las variaciones del tono de los fonemas sonoros en base al seguimiento de su frecuencia fundamental. Se distinguen dentro de ella dos patrones lingsticos de inters: la acentuacin y la entonacin. La acentuacin es un rasgo que permite poner en relieve un fonema para diferenciarlo de otras unidades del mismo nivel dentro de un nivel morfolgico (palabra). El concepto de entonacin es similar al de acentuacin slo que representa expresin a nivel de oraciones, siendo adems mucho ms clara la variacin en la frecuencia fundamental.

1.4. Computerized Speech Lab (CSL)


Software de anlisis espectral enfocado especialmente para el anlisis de la voz humana. Tiene las mismas herramientas de FFT que otros softwares de anlisis espectral tales como espectro lineal, espectrograma, espectro 3D, ms una serie de anlisis especialmente diseados para el estudio de la voz humana, tales como LPC (calcula la envolvente del espectro en base a una prediccin lineal), historia de formantes, (identifica los formantes a lo largo del tiempo), Pitch (seguimiento de la fundamental a lo largo del tiempo), Cepsturm (calcula el logaritmo del espectro), Palatogramas (representa los movimientos lengua-paladar), estadsticas dedicadas, entre otros.

1.5. Multi-Dimensional Voice Program (MDVP)


El Multi-Dimensional Voice Program (MDVP) es un software que trabaja en conjunto con el Computerized Speech Lab (CSL). El MDVP permite la adquisicin, anlisis y clculo de ms de 33 parmetros de la voz a partir de una vocalizacin sostenida de un fonema sonoro, los cuales estn disponibles como un archivo numrico, en ventanas de anlisis o pueden ser mostrados grficamente comparndolos con una base de datos. Esta comparacin grfica permite una rpida visualizacin de todos los parmetros del paciente. Este programa no evala posibles trastornos resonanciales a nivel del tracto vocal.

Seminario Internacional de Acstica 2003 Santiago

Algunos de los parmetros que se extraen en el programa han sido largamente estudiados y se ha logrado establecer sus relaciones con ciertas patologas de la voz (Ej. Jitter, Shimer). Sin embargo, una gran cantidad de estos parmetros son nuevos y an estn en estudio, por lo que se consideran slo referenciales hasta no contar con ms informacin que los respalde. El origen de todos los parmetros contenidos en este programa se basan en el modelo de voz patolgica presentado en la Figura N3, el cual presenta la misma estructura del modelo simple pero con mayor detalle en el origen del sonido a nivel de las cuerdas vocales. Se observa adems en la Figura que no se consideran en este modelo parmetros asociados al tracto vocal ni a la radiacin de salida en este modelo
Figura N3. Modelo acstico de la voz patolgica

Los resultados son obtenidos a partir de una serie de procedimientos automticos y comparados con una base de datos interna del programa que cuenta con valores referenciales de voces normales y patolgicas. Esta base de datos es bastante pobre ya que cuenta con un total de slo 68 personas evaluadas en EEUU (normales y patolgicos). Sin embargo el programa permite la modificacin de los valores de referencia a partir de datos del usuario. Esto permite adaptar los umbrales, a medida que se cuente con mayor informacin. De esta forma, podemos resumir el anlisis realizado por el MDVP en seis grupos de anlisis, de acuerdo al nivel de perturbacin: Variaciones de Pitch y de Amplitud: Problemas asociados a excitacin a nivel fonatorio, dado por un aumento de volumen en las cuerdas o problemas respiratorios. Quiebre e irregularidades de la Voz: Asociados a la interrupcin de un sonido sostenido. Componentes Sub-Armnicos: Evala la cantidad de componentes de frecuencia menores a la fundamental. Estos efectos son tpicos para las voces diplofnicas, Escape de aire y ruido: Posibles problemas de escape de aire (hiatus) y deficiente fonacin. Temblores de la voz: Evala variaciones de frecuencia y amplitud de la seal asociadas a trastornos a nivel respiratorio que influye en la excitacin en las cuerdas.

Seminario Internacional de Acstica 2003 Santiago

Figura N4 Reporte de parmetros en forma de diagrama radial

No necesariamente existe una correlacin directa entre todos los parmetros y los eventos fisiolgicos que ocurren en las patologas de la voz, de modo que algunos parmetros son ms fciles de interpretar que otros. Aunque varios de los parmetros nos entreguen una idea del tipo de desorden, como es el caso de valores de Jitter y Shimmer elevados que indican la presencia de una masa anmala a nivel de las cuerdas vocales, sus valores no son necesariamente indicadores de las caractersticas propias de la patologa, como el tamao y ubicacin de la masa. Por otro lado resulta muy difcil diferenciar auditivamente algunos de los parmetros tales como Jitter y Shimmer. Finalmente se considera al MDVP como un mtodo que permite respaldar de forma complementaria un diagnstico, pero debe ser contrastado con otros mtodos de anlisis.

2. Aplicaciones en Lingstica: Fontica Acstica


Podemos clasificar las aplicaciones del anlisis acstico en el estudio de lenguajes en base a los siguientes tipos anlisis:

2.1. Estudio de fonemas individuales y de coarticulacin.


Se realiza mediante anlisis espectral de cada fonema y de la coarticulacin entre ellos. La coarticulacin se asocia a la transicin de los formantes que se produce desde la configuracin de un fonema hacia otro. El movimiento que realizan los formantes aporta informacin sobre el modo y lugar de articulacin. Se evala cada fonema a partir de frases que contengan informacin fonticamente balanceada.

Seminario Internacional de Acstica 2003 Santiago

2.2. Estudio de la articulacin voclica


En base al anlisis de los formantes en fonemas voclicos, se puede obtener una relacin directa con su clasificacin lingstica. Esto se realiza mediante la carta de formantes, anlisis que permite obtener la configuracin de los elementos articulatorios que se producen en las distintas vocales, en un grfico que se construye a partir de la relacin del primer y segundo formante. Para estos efectos se requiere de la emisin de todas las vocales por separado.
Figura N5. Carta de formantes para los fonemas voclicos de la lengua Espaola

i e a o

2.3. Estudio de la prosodia


La prosodia se asocia a las variaciones en el tiempo de la frecuencia fundamental (Fo) de la vibracin de las cuerdas vocales, las cual determina la meloda de la voz, tanto a nivel de entonacin (frases) como acentuacin (palabras). Es uno de los principales rasgos fonticos que vara localmente dentro de una misma lengua. Se realiza mediante la evaluacin del habla espontnea.
Figura N6. Esquema utilizado para el estudio de la prosodia

Seminario Internacional de Acstica 2003 Santiago

3. Aplicaciones en estudios de Patologas Vocales


De igual forma podemos clasificar las aplicaciones en el estudio de emisin vocal mediante los tipos de anlisis realizados:

3.1. Estudio de patrones objetivos de la emisin de voces


Gran parte de los criterios que se utilizan actualmente para describir las caractersticas vocales se basan en criterios auditivos que muchas veces suelen ser subjetivos. La aplicacin de las herramientas de anlisis espectral describe de modo objetivo la emisin de una voz lo que permite unificar conceptos dentro de los especialistas.

3.2. Descripcin detallada de patologas vocales


Las herramientas presentadas permiten implementar un completo examen acstico de la voz, identificando tanto el comportamiento general de la voz (incluyendo trastornos resonanciales) como el detalle de la emisin fonada a nivel de las cuerdas. Para estos efectos se requieren mltiples herramientas de anlisis espectral y estadstico. Estas metodologas siempre consideran la comparacin de los patrones vibratorios en estudio con bases de datos de emisin normal de voz que permiten identificar el tipo de patologa.
Figura N7. Estudio de Patologas de la voz mediante el contraste de espectro completo

Seminario Internacional de Acstica 2003 Santiago

Figura N8. Resultado del anlisis del programa MDVP para una voz con fonacin deficiente

3.3. Seguimiento de tratamientos fonoaudiolgicos


Gran parte de los tratamientos fonoaudiolgicos requiere de un nmero de sesiones donde el paciente va presentando una evolucin en su trastorno. Las herramientas de anlisis espectral entregan una descripcin objetiva de la evolucin del paciente, la cual se est desarrollando como parte de la ficha mdica del paciente. Por otro lado, la visualizacin grfica de los parmetros sonoros de la voz facilita el tratamiento con cada paciente.

4. Otras aplicaciones
Existen una gran variedad de otras posibles aplicaciones de las herramientas de anlisis espectral en el estudio de la voz humana. Una de ellas consiste en el Reconocimiento e identificacin de voces mediante el uso de las mismas herramientas de anlisis espectral presentadas. Con estas herramientas es posible identificar patrones de voz caractersticos de una persona, aunque no mediante reconocimiento automtico de estos patrones. Es posible lograr identificar patrones tales como su relacin entre formantes, duracin de fonemas caractersticos, puntos de articulacin, entre otros, los cuales son requeridos en el modelo estadstico que permitir diferenciarlos de otros patrones de voz. De esta forma este procedimiento slo se realiza mediante post proceso de las seales en estudio.

Seminario Internacional de Acstica 2003 Santiago

5. Conclusiones
Se ha presentado en este trabajo cmo herramientas de anlisis ampliamente usadas por especialistas en Acstica pueden tener interesantes aplicaciones en distintas reas del conocimiento, como es el caso de las ramas asociadas al estudio de la voz humana. La aplicacin de estas herramientas entrega una nueva perspectiva que presenta grandes beneficios tanto en el diagnstico y seguimiento de patologas vocales, as como en aplicaciones al estudio de los lenguajes. Hoy en da los estudios de la voz y la audicin humana requieren cada vez ms de equipos multidisciplinarios de especialistas que aporten desde sus distintas perspectivas los conocimientos necesarios para lograr un fin comn, y la participacin de Ingenieros especialistas en Acstica en estos equipos se hace cada vez ms necesaria y conciente.

6. Bibliografa
Zaartu M., Barrera A., Espinoza V. Guas de Laboratorio de Fsica Acstica, Escuela de Fonoaudiologa, Universidad Mayor, 2002. Dimitar D. Deliyski, Acoustic Model and Evaluation of Pathological Voice Production, Proceedings: 3-rd Conference on Speech Communication and Technology EUROSPEECH'93, Berlin, Germany. Crocker M., Handbook of Acoustics, Wiley-Interscience, 1998. Quilis A.M., Fontica Acstica de la Lengua Espaola, Editorial Gredos, 2000. Jackson Menaldi, La Voz Patolgica, Editorial Medica Panamericana, 2002.

Anda mungkin juga menyukai