Braslia-DF.
Elaborao
Carolina Ghelli Ferreira de Melo
Produo
Equipe Tcnica de Avaliao, Reviso Lingustica e Editorao
Sumrio
APRESENTAO.................................................................................................................................. 4
ORGANIZAO DO CADERNO DE ESTUDOS E PESQUISA..................................................................... 5
INTRODUO.................................................................................................................................... 7
UNIDADE I
LABORATRIO DE VOZ........................................................................................................................... 9
CAPTULO 1
ANLISES.................................................................................................................................. 9
CAPTULO 2
CUIDADOS ESPECIAIS NA AVALIAO ACSTICA..................................................................... 15
UNIDADE II
ESPECTROGRAFIA ACSTICA................................................................................................................ 20
CAPTULO 1
CONCEITO E FUNDAMENTOS ASSOCIADOS............................................................................. 20
CAPTULO 2
TERMINOLOGIA ASSOCIADA .................................................................................................. 24
CAPTULO 3
PARMETROS ACSTICOS ....................................................................................................... 34
CAPTULO 4
PARMETROS AUDITIVOS E CORRELATOS ESPECTROGRFICOS ACSTICOS.............................. 41
UNIDADE III
SOFTWARES DISPONVEIS NO MERCADO PARA ANLISE ACSTICA....................................................... 44
CAPTULO 1
SOFTWARES DISPONVEIS NO MERCADO PARA ANLISE ACSTICA........................................... 44
PARA (NO) FINALIZAR..................................................................................................................... 47
REFERNCIAS................................................................................................................................... 48
Apresentao
Caro aluno
A proposta editorial deste Caderno de Estudos e Pesquisa rene elementos que se entendem
necessrios para o desenvolvimento do estudo com segurana e qualidade. Caracteriza-se pela
atualidade, dinmica e pertinncia de seu contedo, bem como pela interatividade e modernidade
de sua estrutura formal, adequadas metodologia da Educao a Distncia EaD.
Pretende-se, com este material, lev-lo reflexo e compreenso da pluralidade dos conhecimentos
a serem oferecidos, possibilitando-lhe ampliar conceitos especficos da rea e atuar de forma
competente e conscienciosa, como convm ao profissional que busca a formao continuada para
vencer os desafios que a evoluo cientfico-tecnolgica impe ao mundo contemporneo.
Elaborou-se a presente publicao com a inteno de torn-la subsdio valioso, de modo a facilitar
sua caminhada na trajetria a ser percorrida tanto na vida pessoal quanto na profissional. Utilize-a
como instrumento para seu sucesso na carreira.
Conselho Editorial
Organizao do Caderno
de Estudos e Pesquisa
Para facilitar seu estudo, os contedos so organizados em unidades, subdivididas em captulos, de
forma didtica, objetiva e coerente. Eles sero abordados por meio de textos bsicos, com questes
para reflexo, entre outros recursos editoriais que visam a tornar sua leitura mais agradvel. Ao
final, sero indicadas, tambm, fontes de consulta, para aprofundar os estudos com leituras e
pesquisas complementares.
A seguir, uma breve descrio dos cones utilizados na organizao dos Cadernos de Estudos
e Pesquisa.
Provocao
Textos que buscam instigar o aluno a refletir sobre determinado assunto antes
mesmo de iniciar sua leitura ou aps algum trecho pertinente para o autor
conteudista.
Para refletir
Questes inseridas no decorrer do estudo a fim de que o aluno faa uma pausa e reflita
sobre o contedo estudado ou temas que o ajudem em seu raciocnio. importante
que ele verifique seus conhecimentos, suas experincias e seus sentimentos. As
reflexes so o ponto de partida para a construo de suas concluses.
Praticando
Sugesto de atividades, no decorrer das leituras, com o objetivo didtico de fortalecer
o processo de aprendizagem do aluno.
Ateno
Chamadas para alertar detalhes/tpicos importantes que contribuam para a
sntese/concluso do assunto abordado.
Saiba mais
Informaes complementares para elucidar a construo das snteses/concluses
sobre o assunto abordado.
Sintetizando
Trecho que busca resumir informaes relevantes do contedo, facilitando o
entendimento pelo aluno sobre trechos mais complexos.
Exerccio de fixao
Atividades que buscam reforar a assimilao e fixao dos perodos que o autor/
conteudista achar mais relevante em relao a aprendizagem de seu mdulo (no
h registro de meno).
Avaliao Final
Questionrio com 10 questes objetivas, baseadas nos objetivos do curso,
que visam verificar a aprendizagem do curso (h registro de meno). a nica
atividade do curso que vale nota, ou seja, a atividade que o aluno far para saber
se pode ou no receber a certificao.
Para (no) finalizar
Texto integrador, ao final do mdulo, que motiva o aluno a continuar a aprendizagem
ou estimula ponderaes complementares sobre o mdulo estudado.
Introduo
A avaliao acstica est cada vez mais presente na realidade fonoaudiolgica e tem sido utilizada
como uma importante ferramenta nas avaliaes de vozes patolgicas e profissionais, e o seu
emprego nas anlises da qualidade vocal tem crescido bastante nos ltimos anos. Pode-se dizer que
essa anlise uma tcnica no invasiva, baseada no processamento digital do sinal de voz, podendo
ser utilizada como um instrumento eficiente para a deteco precoce e auxlio ao diagnstico de
patologias vocais e, tambm, no controle e na evoluo da qualidade vocal de profissionais da
voz, tais como atores, cantores, locutores, dentre outros. Alm da utilizao dessa tcnica para
determinao objetiva de alteraes da funo vocal, pode ser aplicada tambm nas avaliaes de
cirurgias, nos tratamentos farmacolgicos e na reabilitao vocal.
Para a discriminao de vozes patolgicas, por meio de anlise acstica, essencial que o processo
de caracterizao acstica da patologia seja bem-estabelecido. Para isso, existem correlatos
espectrogrficos acsticos que diferenciam uma voz patolgica de uma voz normal e que facilitam a
visualizao dessa diferena ou mesmo a sugesto do tipo de patologia existente, o que otimiza um
treinamento da leitura acstica. Entretanto, a literatura ainda no conclusiva e insuficiente com
relao s caractersticas acsticas ou aos parmetros mais adequados para modelagem de uma
patologia em particular. Frequentemente, a maioria das pesquisas fundamenta-se na discriminao
entre vozes normais e patolgicas, sem especificar a patologia. Alguns estudos focalizam uma
determinada patologia sem, no entanto, apresentar um modelo acstico correspondente. Sendo
assim, a pesquisa para uma anlise acstica ainda um campo promissor e crescente.
A anlise acstica est inserida em um contexto de avaliao vocal e faz parte de uma srie de
procedimentos que tm por objetivo principal identificar e conhecer o comportamento vocal de um
indivduo, de maneira que contribua para o estabelecimento da melhor conduta pelo terapeuta.
importante dizer que essa anlise deve ser utilizada como tcnica complementar aos mtodos
usados para se avaliar a voz de um indivduo, tal como a avaliao perceptivo-auditiva e outros
exames e avaliaes relacionados, sendo que nenhum substitui o outro, mas, sim, integram um
conjunto de ferramentas para que se possa traar a linha de base de uma voz.
No tocante voz profissional, como dito anteriormente, a anlise em questo tem sido utilizada
crescentemente na prtica clnica como uma maneira de se acompanhar o desenvolvimento de uma
voz ao longo do tempo, de forma que a melhor conduta para reabilitao ou treinamento seja tomada.
importante tambm que seja dito e reforado que a anlise acstica no se restringe somente a fins
clnicos, ela tem sido utilizada em uma rea relativamente nova, na realidade brasileira chamada
de Fonoaudiologia Forense. Nesta anlise, busca-se, prioritariamente, identificar o falante, por meio
de critrios tcnicos de comparao, identificao e interpretao dos materiais sonoros, apoiados
por programas (softwares) especficos para tal avaliao.
Objetivos
Oferecer maior compreenso acstica.
Estreitar linhas de associao entre as anlises perceptivo-auditiva e acstica.
Incentivar o raciocnio clnico por meio de dados objetivos.
Promover o conhecimento de softwares especficos para a anlise em questo e sua
aplicao nas avaliaes vocais.
Proporcionar os conhecimentos acerca das contribuies da anlise acstica para a
avaliao e o monitoramento teraputico de pacientes nas reas de voz.
Orientar sobre os cuidados necessrios durante a coleta de dados para anlise
acstica, com vistas obteno de resultados confiveis.
Desmistificar o emprego da anlise acstica na prtica clnica e a ideia de que ela
requer recursos sofisticados e caros.
Enriquecer a prtica clnica e profissional na rea de voz.
LABORATRIO DE
VOZ
UNIDADE I
CAPTULO 1
Anlises
Anlise acstica
A mente que se abre a uma nova ideia jamais voltar ao seu
tamanho original.
(Albert Einstein Nota: Autoria no confirmada. Frase adaptada do original de Oliver Wendell
Holmes)
Conceito e contextualizao
Os laboratrios de voz apresentam mtodos e programas objetivos especficos utilizados na avaliao,
pesquisa e terapia dos distrbios da voz e no acompanhamento de vozes profissionais. De maneira
didtica e para melhor entendimento, so consideradas anlises bsicas de um laboratrio de voz
as seguintes: laringoestroboscopia, anlise acstica, eletroglotografia, eletromiografia, filtragem
inversa e fluxometria (BEHLAU et al., 2001). De forma geral, os mtodos de anlise permitem a
avaliao objetiva, traando uma linha de base da voz de um indivduo, til para medir o grau de
evoluo do padro vocal, permitindo, portanto, mensurar a evoluo da fonoterapia ou de algum
tipo de treinamento especfico. to til tambm na avaliao dos momentos pr e ps-operatrio
de cirurgias larngeas.
A anlise acstica integra um dos mtodos de anlise do laboratrio de voz e realiza mensuraes
do sinal sonoro vocal. Apesar do seu recente uso na prtica clnica e profissional, j demonstrou
utilidades inquestionveis, conforme j citados brevemente. Corroborando, apresentam-se na
presente leitura os ganhos mais imediatos na utilizao da anlise acstica, com fins essencialmente
clnicos, descritos por Behlau (1997): prover dados normativos para diferentes realidades vocais
(culturais, profissionais ou patolgicas), oferecer dados suficientes para traar a linha de base da voz
de um indivduo (uso profissional ou teraputico), monitorar a evoluo de um tratamento vocal,
comparar resultados de diferentes procedimentos teraputicos, convergir as linhas de associao
entre as anlises perceptivo-auditiva e acstica, acompanhar o desenvolvimento de uma voz
profissional ao longo do tempo e auxiliar na deteco precoce de problemas vocais e larngeos.
A espectrografia acstica, discutida adiante, um dos principais mtodos dessa anlise, a qual
fornece uma representao grfica (monitoramento visual) das caractersticas acsticas de uma
emisso.
Ao contrrio do que muitos imaginam, a anlise acstica uma tcnica de custo relativamente
baixo quando comparada aos exames mdicos usuais, utilizados em grande parte nas avaliaes
otorrinolaringolgicas, os quais precisam de fontes de luz especiais, instrumentos endoscpicos e
equipamentos de videocmera especializados (GODINO-LLORENTE et al., 2006).
Histrico
O sculo XX marcou o perodo moderno da anlise acstica de sons. Na dcada de 1920, aconteceu
a produo de oscilogramas, que so grficos que representam a variao da amplitude do som
em funo do tempo. Nessa poca, as anlises vocais eram feitas, preferencialmente, por meio de
amostras de vogais sustentadas, por serem mais fceis de analisar.
Na dcada de 1940, na Segunda Guerra Mundial, houve um grande avano dessa tecnologia, quando
se desenvolveu uma mquina chamada de espectrgrafo do som, cuja utilidade inicial era detectar
o deslocamento das tropas do eixo, por meio da anlise da voz do operador de rdio. Tecnicamente,
esse aparelho registrava o sinal a ser analisado em um tambor magntico, associado a uma fita
loop e a diversos filtros que auxiliavam a determinar as diferentes regies de frequncias do som.
Assim, a corrente do sinal eltrico era transferida para um papel termossensvel que se queimava
10
LABORATRIO DE VOZ
UNIDADE I
em diferentes graus de escurecimento, de acordo com o som analisado. O registro dessa anlise,
ou seja, o grfico final impresso, um grfico tridimensional chamado espectrograma (Figura 1)
(representado detalhadamente e discutido adiante).
Na dcada de 1970, houve um novo avano, por meio da introduo do processamento digital de
sinais, ou seja, os computadores produziam espectrogramas semelhantes aos espectrgrafos de
som, conferindo maior rapidez e confiabilidade na obteno de parmetros acsticos, e ainda outras
vantagens: eliminao do processo de queima do papel e armazenamento digital.
A avaliao acstica clnica foi introduzida na dcada de 1990 na realidade brasileira.
Figura 1: Representao de um espectrograma de uma vogal [i], sustentada por um cantor, de uma gravao
de cerca de 9.9 segundos. H uma representao das frequncias no eixo vertical (Y) e do tempo no eixo
horizontal, com aplicao de filtro de banda estreita, evidenciando os harmnicos (espectrograma gerado no
software Praat).
Aplicaes e deficincias
medida que o laboratrio vocal computadorizado torna-se habitual na prtica clnica, suas
aplicaes mostram-se mais notrias e evidentes. At o presente momento, podem-se enumerar
importantes sugestes no emprego da anlise espectrogrfica acstica (detalhada adiante) (BEHLAU
et al., 2001):
11
1 Entende-se por trato vocal todas as estruturas que em comprimento se estendem desde a glote at os lbios (NEMETZ, M. A.
et al., 2005)
12
LABORATRIO DE VOZ
UNIDADE I
13
14
CAPTULO 2
Cuidados especiais na avaliao
acstica
Diversos textos oferecem sugestes para se obter um registro de udio de vozes, com qualidade,
como o de Behlau, 1997; Titze, 1994, dentre outros. Este captulo de fundamental importncia para
o profissional que vai atuar com avaliaes acsticas, pois a confiabilidade dos dados obtidos pelas
anlises feitas pelos softwares acsticos esto diretamente ligados qualidade do udio captado.
Por uma questo didtica e de fcil entendimento, os cuidados especiais que sero discorridos a
seguir esto apoiados nas sugestes de Behlau et al. (2001).
Condies de registro
Conforme dito anteriormente, qualquer mtodo de aquisio e armazenamento de sinais sonoros
pode afetar fortemente a qualidade do sinal.
a. As gravaes devem ser realizadas em ambientes silentes, com rudo ambiental
inferior a 50 dB, em circunstncias controladas e que sejam passveis de
reprodutibilidade.
b. O indivduo deve ficar preferencialmente de p e com o corpo livre.
c. O microfone deve ser instalado em um pedestal, de forma que a distncia permanea
fixa em relao sua boca, e posicionado em um ngulo de 45 a 90 em relao a
ela. Para as vogais sustentadas, indicada uma distncia menor que 10 cm, ao redor
de 3 a 4 cm, para que no ocorram interferncias no sinal, e que a dosagem de
rudo seja baixa e no comprometa a gravao; para a fala encadeada, necessrio
manter uma distncia de pelo menos 10 cm e menor que 20 cm, a fim de que o rudo
respiratrio no contamine a gravao. No tocante voz cantada, a distncia tanto
para a emisso de vogal sustentada como para um trecho cantado normalmente
maior do que as das indicaes acima, especialmente para cantores treinados (em
que a projeo vocal considervel), a distncia entre a boca do cantor e o microfone
precisam ser cuidadosamente recomendadas.
d. Caso a emisso tenha um excesso de ar, como nos casos de vozes soprosas e nas
vogais posteriores ([o], [u]), posicione o microfone na lateral da boca do indivduo,
podendo chegar a 90 graus de deslocamento lateral, com o intuito de reduzir o
rudo aerodinmico na gravao, o qual influencia negativamente no sinal acstico.
e. A captao direta da voz no computador ideal, para tanto, indicado que a
mquina disponha de uma boa placa de som (mnimo recomendado: 16 bit de placa
analgico-digital). Quando a tecnologia da placa apresentada pelo computador
15
Protocolos de gravao
No existe uma normatizao com relao aos protocolos utilizados para anlise acstica, mas
existem sugestes de tarefas fonatrias para fins clnicos, conforme sugeriu Behlau et al. (2001).
a. No registro do indivduo, alm de sua identificao, deve-se incluir pelo menos a
emisso de uma vogal sustentada e um trecho de uma sequncia automtica de fala
encadeada, a fim de se verificar o impacto da alterao de voz na inteligibilidade
de fala ou na efetividade da comunicao.
b. Sugere-se que o protocolo obedea sempre a mesma sequncia de tarefas fonatrias
para facilitar a posterior edio. Pelas sugestes do Centro de Estudos em Voz, o
protocolo inclui as vogais [e], [a], [i] e [u] na frequncia e intensidades habituais
do falante, emitidas isoladamente e sustentadas; e, ainda, incluem-se os dias da
semana, os meses do ano, a contagem de 1 a 30, uma emisso de voz cantada em
Parabns a voc e, por fim, um depoimento sobre a prpria voz.
c. Conforme dito anteriormente, deve-se selecionar o material de fala conveniente
para a anlise que se prope, especialmente, com fins cientficos.
d. Para anlise de qualidade vocal, use preferencialmente uma amostra de fala
encadeada.
e. Para a anlise de frequncia fundamental e seus ndices de perturbao (jitter,
shimmer, tremor e vibrato), devem ser registradas vogais sustentadas e no fala
encadeada; h sugestes de que sejam analisadas uma vogal aguda [i] e outra grave
[o], para melhor descrio e entendimento das perturbaes.
16
LABORATRIO DE VOZ
UNIDADE I
f. Lembre-se que quanto maior for o desvio vocal a ser analisado, mais cuidados e
maior nmero de anlises devem ser realizadas.
g. muito comum que acontea problemas tcnicos nos registros e falhas
nas gravaes, portanto, aps cada gravao, verifique se est tudo
dentro do proposto e esperado.
Sistemas de gravao
indicado que as gravaes sejam registradas no prprio computador. Quando isso no for possvel,
seguem aqui algumas sugestes de gravadores para registro do material sonoro.
a. Caso utilize algum gravador, ele deve ser profissional, condensador, mono,
unidirecional, com sensibilidade mnima de -60dB e deslocado da unidade de
gravao, para que seja evitada a captao do rudo do maquinrio.
b. Os gravadores de fita cassete, pouco utilizados atualmente, permitem apenas a
extrao da frequncia fundamental e a anlise espectrogrfica descritiva. No
utilize as fitas minicassetes nem as cassetes de longa durao (C90 ou C120), porque
sua resistncia menor.
c. Os gravadores profissionais com fita DAT (Digital Audio Tapes) apresentam boa
qualidade e durabilidade de registro, mas tm cado gradualmente no desuso por
conta da evoluo dos minidiscs.
d. Minidiscs profissionais (no os populares) so uma tendncia moderna de gravao
e oferecem os resultados qualitativos mais prximos dos resultados obtidos pelas
gravaes feitas diretamente no computador. Entretanto, deve-se ter cautela na
passagem dos arquivos para o computador ou para outras mdias, porque o sistema
de compresso pode alterar parmetros acsticos mais sensveis.
e. Os Minidiscs populares possuem boa qualidade quando comparados aos no
profissionais, mas no so indicados para gravaes cientficas.
f. O CD-R (recordable compact disc) e o CD-RW (compact disc rewritable)
so considerados excelentes mdias para o registro de vozes, tanto no quesito
durabilidade como na fidelidade da qualidade dos arquivos gravados.
g. As fitas VHS (fitas de vdeo) podem ser analisadas somente auditivamente ou
perceptualmente e no acusticamente, visto que o sinal geralmente insuficiente
para uma anlise acstica de qualidade e acontece um acrscimo de energia nas
regies agudas do espectro do som. Somente em situaes de extrema necessidade
analisa-se acusticamente os registros de uma fita VHS.
17
Figura 3: Exemplo esquemtico de sinais do tipo 2 e 3, respectivamente (adaptado de BEHLAU et al., 2001).
18
LABORATRIO DE VOZ
UNIDADE I
Com relao aos sinais sonoros, pode-se dizer que a obteno de medidas acsticas
e a anlise do traado espectrogrfico confivel somente nos sinais do tipo 1. As
vozes patolgicas ou disfnicas, com poucos desvios, apresentam sinais do tipo 2 e
permitem a anlise confivel do traado espectrogrfico. Nos sinais do tipo 3, que
so caracterizadas por vozes bastante desviadas, a anlise acstica no confivel e
a anlise perceptivo-auditiva a indicada e soberana.
19
ESPECTROGRAFIA
ACSTICA
UNIDADE II
CAPTULO 1
Conceito e fundamentos associados
H, em vrios estudos, a tentativa de definio e anlise dos diferentes parmetros que se alteram
na presena de uma patologia de voz, uma preocupao com a anlise detalhada de parmetros
acsticos, tais como o pitch, jitter, shimmer e rudo.
20
ESPECTROGRAFIA ACSTICA
UNIDADE II
Figura 4 Os dois grficos referem-se a uma gravao de cerca de 2.1 segundos de uma vogal [a] sustentada
por um tenor, na nota D 3 (261.6 Hz). H uma representao da amplitude no eixo vertical e do tempo no eixo
horizontal. Em ambos ocorrem representaes no domnio do tempo, sendo o primeiro com a durao total e o
segundo com os primeiros 100 milissegundos.
21
importante ressaltar que a representao no domnio das frequncias pode assumir formas
bastante distintas, de acordo com a escolha do intervalo temporal sobre o qual se far a anlise
espectral. H sempre uma compensao entre as resolues temporais e de frequncia: quanto mais
resoluo temporal, menos resoluo em frequncia, e vice-versa.
Encontramos as expresses wide-band (banda larga) e narrow-band (banda estreita) para as
filtragens realizadas pelas transformadas de Fourier em intervalos temporais curtos e em intervalos
mais longos, respectivamente. Na anlise vocal, deve-se sempre buscar o intervalo mais adequado
para cada caso, j que as rpidas variaes consonantais demandam um intervalo curto e a anlise
vocal um intervalo mais longo. Didaticamente, os filtros de banda estreita privilegiam a visualizao
dos harmnicos e os filtros de banda larga privilegiam a visualizao de formantes.
A figura a seguir, retirada do Handbook of Phonetic Sciences, ilustra os efeitos dessa escolha,
utilizando-se uma banda estreita de cerca de 45 Hz e uma banda larga de cerca de 300 Hz. Nesse
caso, o intervalo temporal da filtragem com banda larga 6.6 maior do que o da banda estreita.
22
ESPECTROGRAFIA ACSTICA
UNIDADE II
Figura 6 Os grficos se referem a trs gravaes da frase Thats wonderful, em entonaes distintas:
a) entonao normal; b) tom de pergunta com surpresa; c) entonao excitada, com destaque nas
palavras that e wonderful. A linha superior traz espectrogramas com banda estreita de filtragem,
evidenciando os harmnicos e a inferior com banda larga, evidenciando os formantes
(fonte: Handbook of Phonetic Sciences, p. XX).
23
CAPTULO 2
Terminologia associada
Para o melhor entendimento da espectrografia acstica, faz-se necessrio a definio de uma
terminologia frequentemente utilizada e que de interesse para a atuao clnica.
24
ESPECTROGRAFIA ACSTICA
UNIDADE II
25
Figura 9 O grfico refere-se a uma gravao de cerca de 2.1 segundos de uma vogal [a] sustentada e mostra
a curva de variao da intensidade (imagem gerada pelo programa Praat).
26
ESPECTROGRAFIA ACSTICA
UNIDADE II
da voz e relaciona trs fenmenos acsticos: fonte sonora, filtro acstico e radiao. Para melhor
entendimento da combinao desses fenmenos, hipoteticamente no dependentes, segue uma
breve explicao: para qualquer som produzido no aparelho fonador, existe uma fonte sonora (ou
de rudo) que proporciona a entrada de energia acstica no sistema e tambm um filtro que se
responsabiliza por modificar e amplificar seletivamente (filtrar) os sons provenientes desta fonte,
os quais sero irradiados (efeito de radiao) pela boca (FANT, 1970 apud KENT e READ, 1992;
TITZE, 1994).
A fonte sonora pode ter sua origem associada a trs fatores: vozeamento, rudo turbulento do ar
originado por constrio e combinao das duas fontes citadas anteriormente. No que diz respeito
ao vozeamento, o som produzido exclusivamente pela vibrao das pregas vocais e constitui a fonte
de energia sonora necessria produo das vogais (FANT, 1970 apud KENT e READ, 1992). O
rudo turbulento est relacionado produo das consoantes pelo estreitamento ou pela obstruo
dos articuladores do trato vocal passagem do ar e, neste caso, as pregas vocais no so utilizadas
como fonte. Por fim, possvel a combinao de sons vozeados pelas pregas vocais e de um rudo
turbulento gerado por constrio do trato vocal, originando as consoantes vozeadas, como, por
exemplo, [v] e [z]. importante frisar que por meio da vibrao das pregas vocais produzida uma
srie de ondas relativamente peridicas e complexas, sendo que o nmero de ciclos dessas ondas
determina, em Hz, o valor da frequncia fundamental de uma voz, F0, e uma srie harmnica.
J o filtro comparado com um tubo (Figura 10) que contm um dos lados abertos, representando
a boca, e o outro fechado, representando as pregas vocais. O tubo o ressonador e vai favorecer ou
abafar seletivamente as frequncias de acordo com sua forma e seu comprimento. Seguindo essa
analogia e exemplificando o que foi dito anteriormente, tratos vocais mais compridos favorecem
as frequncias mais baixas e os mais curtos favorecem as frequncias mais altas. As frequncias
de ressonncia so denominadas de formantes e so representadas por picos no espectro sonoro.
Tradicionalmente, o trato vocal possui quatro ou cinco formantes mais relevantes, os quais sofrero
o efeito de radiao e sero irradiados em todas as direes ao sair da boca. Nesse processo, ocorre
uma nova filtragem do tipo passa-altas, pois h uma tendncia de as altas frequncias propagaremse em linha reta, enquanto que as baixas tendem a se difratar (espalhar). Portanto, a uma longa
distncia do locutor, predominam as altas frequncias (FANT, 1970 apud KENT e READ, 1992).
A figura 11 mostra o processo de produo das vogais como um todo e ilustra o que foi dito
anteriormente.
Figura 10 Acima, um tubo uniforme com um dos lados fechados, simulando o trato vocal (adaptado de KENT;
READ, 1992).
27
O som larngeo produzido pela vibrao das pregas vocais, considerada como
fonte ou fonte gltica (associada produo de sons vozeados vogais e/ou rudo
turbulento-consoantes vozeadas). O filtro pode ser considerado o trato vocal que
vai modificar ou modelar o som originado na fonte, abafando ou amplificando
frequncias, de acordo com sua conformao anatmica. Sendo assim, o trato
vocal (filtro) responsvel pela maior parte da informao de um sinal vocal, mas a
qualidade e o tipo de sonoridade percebidos so decorrentes da combinao desses
dois fenmenos: fonte e filtro.
28
ESPECTROGRAFIA ACSTICA
UNIDADE II
29
30
ESPECTROGRAFIA ACSTICA
UNIDADE II
Figura 13 Espectrograma de uma gravao de uma voz no treinada, emitindo a vogal sustentada [u], com aplicao de
filtro de banda estreita, evidenciando uma deficincia da srie harmnica, visvel at a faixa de 1.000Hz, aproximadamente,
sugerindo uma voz patolgica (imagem gerada pelo programa Praat).
Figura 14 Espectrograma de uma gravao de uma cantora profissional, emitindo a vogal sustentada [a], com
aplicao de filtro de banda estreita, evidenciando uma riqueza de harmnicos at a faixa de 8.000 Hz (imagem
gerada pelo programa Praat).
Legenda: Time Tempo; (s) segundos; Frequency: Frequncia; (Hz) Hertz. Ct cantor(a).
31
O formante do cantor
O cantor treinado tem a capacidade de sobressair-se ao som de uma orquestra sem fazer uso de
amplificao sonora como o microfone e sem prejudicar seu aparelho fonador. Na maioria das vezes,
o responsvel por esse fenmeno o formante do cantor (CORDEIRO et al., 2007; SUNDBERG,
1974).
O formante do cantor encontrado geralmente em vozes com treinamentos especficos do canto
erudito e definido pela amplificao sonora das frequncias entre 2.000 e 4.000 Hz, sendo
demonstradas no espectro acstico pela juno do terceiro, quarto e quinto formantes superiores
(F3, F4 e F5). Isso se deve sua localizao na regio aguda e ao elevado pico de amplitude, desta
forma, no se tem ocorrncia em outras vozes ou mesmo em instrumentos da orquestra (BEHLAU
et al., 2001; CORDEIRO et al., 2007; SUNDBERG, 1987). Segundo Fant (1970 apud KENT e READ,
1992), o trato vocal, por meio do controle ativo no canto, pode incrementar de 3 a 5 dB na amplitude
das frequncias agudas, alm do acrscimo natural de 10 a 15 dB j existente.
Segundo Sundberg (1987 apud BARRICHELO et al., 2005) a tcnica lrica utilizada pelos cantores
de pera, que apresentam mecanismos inteligentes para destacarem suas vozes da orquestra, por
isso suas vozes apresentam um pico espectral intenso e largo em torno de 3.000 Hz. este pico que
proporciona aos harmnicos uma maior amplitude relativa e o agrupamento dos formantes que,
conforme descrito por este autor, proporciona ao ouvinte a sensao de brilho e projeo vocal.
Ratificando, o responsvel pelo fenmeno descrito o formante do cantor e a ocorrncia desta
manifestao est relacionada ao abaixamento da laringe e ao alargamento da cavidade farngea,
embora este no seja o nico mecanismo existente.
Abaixo, seguem figuras que contribuem para o entendimento sobre o formante do cantor:
32
ESPECTROGRAFIA ACSTICA
UNIDADE II
Figura 15 Espectro do formante do cantor e sua comparao com a orquestra, note que ocorre um pico
espectral por volta da regio de 3.000 Hz (adaptado de YASUNORI et al., 2005).
33
CAPTULO 3
Parmetros acsticos
34
ESPECTROGRAFIA ACSTICA
UNIDADE II
al., 2001). Boersma traz no manual do Praat o valor de 1.04% como esse limite, mas indica que esse
valor deve ser provavelmente menor, j que as medies realizadas no clculo foram influenciadas
por rudos. O valor de referncia estabelecido por Viera et al. (1997) para vozes no disfnicas o de
0,30%. V-se que no acontece uma padronizao das medidas de jitter dentre os autores, portanto,
esta medida deve ser usada com cautela.
Com relao s sugestes na obteno das medidas de jitter, vale ressaltar que deve ser medido por
anlise de vogais sustentadas, numa nica frequncia, sem variao musical ou de intensidade, em
emisso habitual, eliminando-se o incio e o fim da produo, por suas caractersticas irregulares
(BEHLAU et al., 2001).
Outro parmetro que deve ser levado em considerao refere-se medida da variao da amplitude
da vibrao. Esta medida recebe o nome de shimmer e o seu conceito pode ser explicado por analogia
ao seu companheiro de perturbao, o jitter. Shimmer representa a variao da amplitude de ciclo
para ciclo e permite quantificar as alteraes mnimas da amplitude do sinal, com base em cada ciclo
fonatrio (COLTON; CASPER, 1998). Se, em termos de fonao, a voz humana fosse absolutamente
estvel, tal medida seria zero. No entanto, assim como o jitter, havendo uma patologia em termos
de funcionamento da laringe, por exemplo, tais valores sero sempre elevados.
Assim como acontece no jitter, existe uma diversidade de valores limites para a normalidade do
shimmer, dependendo do programa ou do autor escolhido para referncia. Pelo fato de o software
Praat oferecer com maior completude as medidas acsticas, ele citado como referncia. O respectivo
software oferece seis valores de shimmer: o shimmer local calculado de forma anloga ao jitter
local, sendo resultado da diviso da mdia dos valores absolutos das diferenas de amplitude entre
perodos vizinhos pela amplitude mdia do trecho analisado. tambm expresso em %. O shimmer
(local, dB), expresso em decibis, resultado da multiplicao por 20 do logaritmo de base 10 da
mdia dos valores absolutos das diferenas de amplitude. As outras medidas so shimmer (apq3),
shimmer (apq5), shimmer (apq11), shimmer (dpp), cujos mtodos de clculo esto detalhados no
manual do software.
Todas as medidas relativas de shimmer so oferecidas em porcentagem e o valor limite de shimmer
local de 3% (BEHLAU et al., 2001). Boersma e Weenink (2010) estabelecem 3,81% como um
limite para a patologia, no Praat.
Tremor e vibrato
Assim como o jitter e o shimmer, o tremor e o vibrato representam ndices de perturbao da
frequncia fundamental (F0) e possuem representaes espectrogrficas que podem ocasionar
dvida se no forem bem-compreendidas.
Fisiologicamente, o tremor vocal patolgico caracteriza-se pelo movimento rtmico da laringe, que
produz alteraes rtmicas de pitch e loudness durante a fonao. Estes movimentos larngeos so
muitas vezes acompanhados de tremor da cabea e de extremidades (INAMURA; TSUJI, 2006
apud ARONSON et al., 1968) e podem ser provenientes de um ou de vrios componentes da fala,
35
36
ESPECTROGRAFIA ACSTICA
UNIDADE II
Figura 18 Espectrograma de emisso de uma vogal sustentada, cantada, por cantor erudito, evidenciando o
vibrato vocal (adaptado de BEHLAU et al., 2001) (imagem gerada pelo software Gram 5.0).
37
Por exemplo, um falante saudvel pode produzir uma vogal sustentada [a] ou [i] com
um harmonicidade de cerca de 20 dB e um [u] em torno de 40 dB, a diferena vem das
altas frequncias em [a] e [i] versus as baixas frequncias em [u], resultando em uma
maior sensibilidade de HNR de jitter em [a] e [i] do que em [u]. Falantes roucos tero
um [a] com um harmonicidade muito menor do que 20 dB (BOERSMA, WEENINK,
2003).
Abaixo, para ilustrao, um exemplo de uma curva de harmonicidade. A harmonicidade
mdia do trecho medido de 31.2 dB, demonstrando uma voz normal e com boa HNR.
Foram eliminados os 100 milissegundos iniciais e finais do sinal gravado nos clculos
efetuados.
Figura 19 Curva de harmonicidade de uma gravao de cerca de 2.1 segundos de uma vogal [a] sustentada
por um tenor, na nota D 3 (261.6 Hz). H uma representao da harmonicidade no eixo vertical e do tempo no
eixo horizontal (imagem gerada pelo software Praat).
38
ESPECTROGRAFIA ACSTICA
UNIDADE II
39
40
CAPTULO 4
Parmetros auditivos e correlatos
espectrogrficos acsticos
Na realidade brasileira, no ano de 1999, Behlau publicou diversos correlatos espectrogrficos
acsticos vinculados a parmetros auditivos especficos. Os correlatos espectrogrficos podem ser
vistos como descries qualitativas do traado espectrogrfico de acordo com a qualidade associada.
Como os correlatos so diversos, sero mostrados, neste captulo, os espectrogramas relacionados
a qualidades vocais que frequentemente so encontradas na prtica clnica e seus correlatos
espectrogrficos acsticos, conforme se v abaixo.
Sugere-se a leitura do captulo 3 (Avaliao de Voz) do livro Voz I, de Mara Behlau,
para que voc tenha acesso e conhecimento das qualidades vocais listadas e de seus
correlatos espectrogrficos correspondentes, ou na prpria publicao feita pela
autora no ano de 1999.
Atente-se para os correlatos espectrogrficos descritos por Behlau (1999) e compare com os grficos
apresentados adiante, lembrando que cada correlato deve ser associado qualidade vocal em
questo, seguem:
a. qualidade vocal rouca: perturbao da forma de onda, registro dos formantes
substitudo por rudo e, dependendo da gravidade da leso que gera tal qualidade vocal,
os harmnicos podem no existir. Imagem de esburacamento no traado de faixalarga. Conforme dito, quanto maior o grau de rouquido, mais os formantes superiores
vo sendo decompostos. A marca fisiolgica da qualidade vocal rouca apresentar uma
a aperiodicidade de vibrao das pregas vocais e/ou fluxo de ar turbulento na glote,
como caracterstico nos casos de ndulos vocais ou nas fendas glticas;
b. qualidade vocal soprosa: apresenta nvel de energia reduzido no espectro, abaixo de
5.000 Hz; formantes fracos e claros (indicando rebaixamento da intensidade); o nvel
de energia que pode figurar acima de 5.000 Hz est relacionado presena de rudo
(ar no sonorizado), nota-se um preenchimento por meio de estrias verticais, no
espectrograma de faixa larga; quanto maior a soprosidade, mais escuras e definidas
apresentam-se as estrias na regio aguda do espectro e mais claras na regio mais
grave do espectro; no espectrograma de faixa estreita, os harmnicos so fracos,
com recheio de rudo entre eles, ou seja, entenda por uma imagem hachurada entre
as linhas dos harmnicos, o que configura os casos de pregas vocais com coaptao
insuficiente, como nas fendas glticas ou no sulco vocal.
c. qualidade vocal tensa: apresenta uma frequncia fundamental aguda e com alto
nvel de energia, o traado espectrogrfico bem-definido, o que caracteriza,
fisiologicamente, pouca massa em vibrao, como nos casos de sulco vocal (rigidez
de mucosa) ou na muda vocal incompleta.
41
42
ESPECTROGRAFIA ACSTICA
UNIDADE II
43
SOFTWARES
DISPONVEIS NO
MERCADO PARA
ANLISE ACSTICA
UNIDADE III
CAPTULO 1
Softwares disponveis no mercado para
anlise acstica
Os softwares e hardwares de anlise acstica da voz e da fala apresentam inmeras funcionalidades,
sendo que cada um foi elaborado com um propsito especco: alguns so mais indicados para o
contexto clnico, pedaggico, e outros esto associados investigao/pesquisa. No contexto clnico,
distinguem-se as fases de avaliao e interveno teraputica. Todos os softwares e hardwares
podem ser utilizados para recolher dados para a avaliao da voz e da fala, considerando-se alguns
mais indicados para o efeito.
Em um artigo interessantssimo (leitura complementar), Mendes et al. (2006) fazem um
levantamento dos softwares e hardwares mais conhecidos e disponveis no mercado e de suas
funcionalidades mais pertinentes nos quesitos relacionados anlise da voz e da fala. E, por fim,
correlacionam os dados levantados s necessidades do profissional da sade que atua nas reas de
voz e de fala. Confira na ntegra, as informaes do referido estudo no link indicado para leitura
complementar.
Nesse texto, as autoras destacaram o Praat 5.3.04, pelo fato de ser um software gratuito que
permite a obteno de vrios parmetros acsticos e seus principais grcos. um software
bastante completo, uma das dificuldades encontradas pelo fonoaudilogo est ligada concepo
dos scripts, para que se obtenha as medidas. Quanto aos softwares pagos, foram destacados os
seguintes: MDVP, Multi-Speech, Vox Metria, Real Analysis, Vocal Assessment e LingWAVES
Voice Clinic Suite Pro, que tambm fornecem variadas informaes sobre as caractersticas
vocais do avaliado. O CSL um hardware que pode ser complementado com softwares da
KayPENTAX, tais como o MDVP ou o VRP, fornecendo uma excelente variedade de parmetros
acsticos e de representaes grcas referentes anlise da voz do avaliado, embora tenha
valores de aquisio elevados. Destacaram-se ainda o LingWAVES Voice Clinic Suite Pro pelo
feedback visual que fornece ao utente quando da avaliao.
44
UNIDADE III
45
M.N.;
fonoaudiolgica.
ROSA,
In:
LL.C.;
PINHO,
Avaliao
S.M.R.
et
acstica
al.
na
prtica
Fundamentos
em
46
47
Referncias
BAKEN, R. J.; ORLIKOFF, R. F. Clinical measurement of speech and voice. Singular
Publishing Goup, San Diego, n. 2, p. 162-164, 226-227, 2000.
BARRICHELO, V. Voz ressoante em alunos de teatro: correlatos perceptivo-auditivo e
acsticos da emisso treinada Y-Buzz de Lessac. Tese de mestrado apresentada a Universidade
Federal de So Paulo. Escola Paulista de Medicina. Programa de Ps-Graduao em Distrbios da
comunicao humana. 112f. So Paulo, 2007.
BARROS, A. P. B.; CARRARA DE ANGELIS, E. Anlise acstica da voz. In: DEDIVITIS, R. A.;
BARROS, A. P. B. Mtodos de avaliao e diagnstico de laringe e voz. So Paulo: Lovise, 2002.
BEHLAU, M. Alteraciones de la voz. In: Gil-CARCEDO et al. Tratado de Otorrinolaringologia y
Cirurgia de Cabeza y Cuello. Madrid Proyetos Mdicos, 1999.
______. Consideraes sobre anlise acstica em laboratrios computadorizados de
voz. In: ARAJO, R. et al. Fonoaudiologia atual. Rio de Janeiro: Revinter, 1997. p. 93-115.
BEHLAU, M. et al. Determinao da frequncia fundamental e suas variaes em altura
(jitter) e intensidade (shimmer), para falantes do portugus brasileiro. Acta
AWHO; 4(1):5-10, 1985.
______. Avaliao de voz. In: BEHLAU, M. (Org.). O livro do especialista. Rio de Janeiro:
Revinter, 2001, cap. 3, vol. I.
______. Voz profissional: aspectos gerais e atuao fonoaudiolgica. In: BEHLAU, M. (org.)
Voz: o livro do especialista. 2. ed. Rio de Janeiro: Revinter, 2005. vol. II, cap. 12.
BEHLAU, M.; RUSSO, I. Percepo da fala: anlise acstica do portugus brasileiro. So Paulo:
Lovise, 1993. p. 57.
BEHLAU, M.; REHDER, M. I. Higiene vocal para o canto coral. 1. ed. Rio de Janeiro: Revinter,
1997. vol. I.
BEHLAU, M.; PONTES, P. A avaliao da voz. In: BEHLAU, M.; PONTES, P. Avaliao e
Tratamento das disfonias. So Paulo: Lovise, 1995. cap. 3, p. 68-135.
BOERSMA, P.; WEENINK, D. (2010). Praat: doing phonetics by computer [Computer program]:
software livre. Version 5.1.32, retrieved 30 April 2010 from <http://www.praat.org/>. Disponvel
em: <www.praat.org>. Acesso em: 20 maio 2010.
COLTON, R. H.; CASPER, J. K. Mau uso e abuso vocal: efeitos sobre a fisiologia larngea. In:
COLTON, R. H.; CASPER, J. K. Compreendendo os problemas de voz: uma perspectiva fisiolgica
ao diagnstico e tratamento. Porto Alegre: Artes Mdicas, 1996. p. 81-118.
48
REFERNCIAS
CORDEIRO, G. F. et al. Formante do cantor um enfoque fisiolgico. In: PINHO, S. Temas em
voz profissional. So Paulo: Lovise, 2007. p. 23-30.
CUKIER, S.; CAMARGO, Z. A. Abordagem da qualidade vocal em um falante com
deficincia auditiva: aspectos acsticos relevantes do sinal de fala. Rev. CEFAC. 2005;
7(1):93-101.
DE BODT, M. S. et al. The perceptual evaluation of voice disorders. Acta Otohinolaryngol
Belg, v. 50, p. 283-91, 1996.
DEJONCKERE, P. et al. Vibrato. San Diego: Singular Publishing, 1995.
DINVILLE, C. A tcnica da voz cantada. 2. ed. Rio de Janeiro: Enelivros, 1993.
ELLIOT, N. et al. What happens during vocal warm-up? Journal of Voice, Philadelphia, v. 9,
p. 37-44, 1995.
FAWCUS, M. Disfonias: diagnstico e tratamento. Traduo de Mara Behlau. 2. ed. Rio de Janeiro:
Revinter, 2001. Original ingls.
FEX, S. Perceptual evaluation. Journal of Voice, Philadelphia, v. 6, n. 2, p. 55-8, 1992.
GODINO-LLORENTE, J.
49
REFERNCIAS
SATALOFF, R. T. et al. The clinical voice laboratory: pratical design and clinical application.
Journal of Voice, v. 4, p. 264-279, 1990.
SHADLE, C. The aerodynamics of speech. In: HARDCASTLE, WILLIAM J.; LAVER, JOHN
(eds). The Handbook of Phonetic Sciences. Blackwell Publishing, 1999.
SUNDEBERG, J. Articulatory interpretations of songing formant. Journal of Acoustical.
Society of Americana, 1974. 55:838-844.
______. Vocal tract resonance. In: SATALOFF, R. T. (Ed.). Professional voice: The science and
art of clinical care. 2. ed. New York: Raven Press, 1991. p. 49-68.
TITZE, I. Principles of voice production. Universidade de Michigan. Prentice Hall, 1994.
VIEIRA, M. N. et al. Comparative assessment of electroglottographic and acoustic
measures of jitter in pathological voices. J Speech Lang Hear Res, v. 40, p. 170-182, 1997.
YAMASAKI, R.; BEHLAU, M. Comparison of acoustical measurements of voice recorded
in three different systems. Program and Abstract Book, 24th, IALP Congress IALP. Amsterdam,
1998, p. 242.
YASUNORI, O.; MASATAKA, G.; KATUNOBU, I.; KAZUYA, T. Discrimination between singing
and speaking voices. In: INTERSPEECH 2005, p. 1.1411.144, 2005.
Sites:
<http://pt.wikiquote.org/wiki/Discuss%C3%A3o:Albert_Einstein>, acessado em 23 dez. 2013
<http://en.wikipedia.org/wiki/Sine_wave>, acessado em jan. 2013.
<http://www.fon.hum.uva.nl/praat/>, acessado em jan. 2013.
<http://revistas.pucsp.br/index.php/dic/article/viewFile/13159/9693>, acessado em dez. 2013.
<www.ctsinformatica.com.br/>, acessado em dez. 2013.
50