VISION ACCESS: SISTEMA DE SNTESE E RECONHECIMENTO DE VOZ PARA
DEFICIENTES VISUAIS Orientadora: Simone Azevedo Bandeira de Melo Co-Orientador: Artur Bernardo da Silva Reis
Imperatriz - MA 2012 1
JOABE SOUZA DA SILVA
VISION ACCESS: SISTEMA DE SNTESE E RECONHECIMENTO DE VOZ PARA DEFICIENTES VISUAIS
Imperatriz MA 2012 Projeto de pesquisa apresentado FEBRACE 2013. 2
SUMRIO 1. RESUMO...........................................................................................................3 2. INTRODUO..................................................................................................4 3. REFERENCIAL TERICO................................................................................5 2.1 Acessibilidade.......................................................................................5 2.2 Deficincia Visual.................................................................................5 2.3 Ferramentas de Multimdia (Tecnologia Assistiva)...........................6 4. TECNOLOGIAS USADAS................................................................................8 3.1 Java........................................................................................................9 3.2 Java Speech..........................................................................................9 3.3 Software IBM Via Voice......................................................................10 5. COMPARATIVO ENTRE OS SISTEMAS PARA DEFICIENTES VISUAIS....11 4.1 DOSVOX...............................................................................................11 4.2 JAWS....................................................................................................11 4.3 Vision Access......................................................................................12 4.4 Comparao........................................................................................12 6. RESULTADOS................................................................................................13 7. TRABALHOS FUTUROS................................................................................15 8. CONCLUSO..................................................................................................16 9. REFERNCIAS BIBLIOGRFICAS...............................................................17
3
1. Resumo O mundo vive atualmente a Revoluo Tecnocientfica, a utilizao de tecnologias avanadas de informao e comunicao est em expanso no mundo. So os computadores que possibilitam a interao entre o homem e a informao automatizada, apesar de observar-se que uma grande parcela da comunidade ainda no est inserida nesse contexto, como o caso dos deficientes visuais. A cincia vem procurando aumentar ao mximo o aproveitamento do computador por parte de pessoas com algum tipo de deficincia, j que o computador alm de ser, hoje, a principal forma de comunicao, ele uma ferramenta essencial no mercado de trabalho. Desta vez devemos garantir os direitos de pessoas com deficincia visual e incorpor-los nesta sociedade, agora informatizada, o que pode ser realizado atravs de sistemas computacionais planejados para essas pessoas. Nessa perspectiva desenvolvemos um sistema computacional capaz de aumentar o acesso dos deficientes visuais ao computador atravs da sntese de fala, que atravs do som dispe ao usurio os recursos apresentados na tela, tornando a utilizao do computador independente da viso. O sistema desenvolvido, denominado Vision Access, funciona como um gerenciador de outros aplicativos internos que oferecem ao usurio uma verso adaptada das principais atividades que um sistema operacional comum oferece aos seus usurios. A sntese de fala permite que o deficiente visual compreenda a sada de dados, porm, ainda existe a dificuldade na insero de dados, que obriga o deficiente a se adequar ao computador, quando na verdade a mquina quem deveria se adequar ao deficiente. Para eliminar essa dificuldade implantamos em nosso sistema a tecnologia para reconhecimento de voz, que possibilita uma comunicao gil e fcil com a mquina da forma mais natural possvel, a fala. Com esse sistema demonstramos a possibilidade da insero dos deficientes visuais nesse novo mundo da informao.
4
2. Introduo A utilizao do computador vem se tornando cada vez mais essencial no mundo atual, principalmente no mercado de trabalho, os avanos na rea da informtica e a penetrao das novas tecnologias no nosso cotidiano fazem com que, em praticamente todas as profisses, aumente a procura por mo-de- obra qualificada (COSTA, 1995). Nessa perspectiva, A ERA DA INFORMAO traz conceitos da economia, como produtividade e qualidade, para criar novos caminhos para o desenvolvimento e exige uma nova postura diante de suas mudanas sociais. Pensando nessa questo tem-se observado que uma grande parcela da comunidade ainda no est inserida nesse contexto, como o caso dos deficientes visuais. Para o Deficiente Visual, como para qualquer outra pessoa, obter e aplicar conhecimento passa a ser item bsico para enfrentar essas mudanas. A informao no-acessvel a maior barreira aos deficientes visuais, no justo que por um individuo ser ou estar desprovido de suas plenas capacidades visuais, fosse incapacitado de utilizar da tecnologia informacional. Ainda que impossibilitado de enxergar, uma pessoa com esse tipo de deficincia pode se comunicar com outras pessoas atravs da voz e receber informaes atravs de sua audio. Diante desse contexto o objetivo desse projeto desenvolver um sistema computacional baseado na utilizao de comandos de voz para auxiliar os deficientes visuais, tentando ajudar a melhorar a qualidade de vida dessas pessoas, proporcionando-lhes acessibilidade no ramo informacional.
5
3. Referencial Terico
3.1 Acessibilidade A Constituio Federal (Brasil, 1988) estabelece, em seu Artigo 5, que todos so iguais perante a lei, sem distino de qualquer natureza, garantindo- se aos brasileiros e aos estrangeiros residentes no Pas a inviolabilidade do direito vida, liberdade e igualdade. Nos ltimos anos, muito se tem falado sobre acessibilidade para as pessoas com deficincia, porm poucos so os estudos e pesquisas sobre a sua efetiva realizao dentro do contexto dirio da vida social. O termo acessibilidade pode assumir diversos significados, dependendo do contexto em que se faz a reflexo. A acessibilidade pressupe a eliminao das barreiras e obstculos que a entravam. Barreiras so conceituadas como qualquer entrave ou obstculo que limite ou impea o acesso, a liberdade de movimento [] (Lei n 10.098/00 - art. 2, II). A acessibilidade no para um grupo especfico de pessoas, mas tem como objetivo a incluso das especificidades do universo de pessoas no desenho urbano e de produtos. Em sentido mais amplo, a acessibilidade entendida como equiparao das oportunidades de acesso ao que a vida oferece: estudo, lazer, bem estar social e econmico, enfim, realizao de objetivos que so, na verdade direitos universais. (Fernandes, 2003, p. 11) Nesse contexto analisamos que existem varios tipos de deficincia, entre elas destacamos os deficientes visuais, razo pela qual nos motivou a direcionarmos nossa pesquisa para esse pblico.
3.2 Deficincia Visual O termo deficincia visual faz referncia a uma situao irreversvel de diminuio da resposta visual, devido s causas congnitas ou hereditrias, mesmo aps tratamento clnico e/ ou cirrgico e uso de culos convencionais. 6
A diminuio da resposta visual pode ser leve, moderada, severa, profunda (que compem o grupo de viso subnormal ou baixa viso) e ausncia total da resposta visual (cegueira). Essa deficincia, de acordo com BARRAGA (1976), pode ser distinguida em trs tipos: Cegueira: quando o deficiente perdeu totalmente a viso, podendo ou no ter apenas a percepo da luz; Viso parcial: quando o deficiente capaz de ver o objeto estando a poucos centmetros ou no mximo a meio metro de distncia, ou seja, ele tm limitaes da viso distncia; Viso reduzida: quando o deficiente pode ter seu problema visual corrigido por cirurgias ou pelo uso de lentes. Diante deste contexto consideramos as distines entre os nveis de deficincia visual, para que os resultados venham a beneficiar este grupo como um todo, valendo-se das capacidades que o deficiente visual ainda possui, como a audio, a fala e em alguns casos, parte da prpria viso. Percebemos que as ferramentas tecnolgicas utilizadas nos sistemas computacionais ainda so uma grande barreira de acesso aos deficientes visuais, devido a maior parte dessas tecnologias necessitarem do uso da viso. Verificamos em nossa pesquisa que podemos utilizar as prprias ferramentas de multimdia para possibilitar a esse pblico o acesso a tecnologia.
3.3 Ferramentas de Multimdia (Tecnologia Assistiva) Atualmente a grande maioria das formas de exibio de dados utilizadas no ramo informacional utilizam ferramentas de multimdia como textos, imagens, sons, animaes e etc, e a maioria dessas exibies de dados so atravs de meios que exigem que o usurio tenha plenas capacidades visuais, como a exibio de um vdeo em um monitor, por exemplo. Porm outras formas de utilizao das ferramentas de multimdia pode possibilitar pessoas desprovidas de tais capacidades, como a centralizao das exposies de dados em ferramentas de udio como um auto-falante, ou atravs da utilizao de pinos dinmicos para apresentao de textos em Braile, que utiliza o sentido do tato. 7
Apartir dessas anlises, para uma melhor e maior interao homem- computador de deficientes visuais com a mquina, tm-se hoje no mercado equipamentes especficos para esta rea. Os mais aceitos so: Teclados ampliados: funciona como um teclado normal, s que o tamanho das suas teclas so ampliadas 400% do seu tamanho normal, indicado para deficientes visuais com viso reduzida. Teclados em Braille: so iguais a um teclado comum, diferenciando-se pelo fato de as teclas serem tambm identificadas pela linguagem Braille em alto-relevo. Impressora em braille: funciona como uma mquina em braille, sua impresso ao invs de ser tinta feita com perfuraes. Ampliadores de telas: funciona como uma lupa, ampliando imagens e textos apresentados na tela, tambm indicado para deficientes visuais que tm a viso reduzida. O computador pessoal tambm dispes de ferramentas que podem ser utilizadas para estes fins como o microfone e os auto-falantes, ainda que bem inexploradas. Para controlar o processamento de informaes no computador so utilizadas Linguagens de Programao, atravs das quais o computador executa determinadas instrues, proporcionando assim o controle dessas ferramentas.
8
4. Tecnologias Utilizadas Para podermos criar um sistema que proporcione uma ampliao no acesso dos deficientes visuais ao computador utilizamos ferramentas de programao, dentre essas ferramentas est a prpria linguagem de programao Java e suas APIs, e at mesmo softwares externos como o IBM ViaVoice.
4.1 Java Hoje, a linguagem Java tem se destacado e vem se tornando cada vez mais forte quando se fala em programao. Suas principais vantagens so: Portabilidade: por ser uma linguagem interpretada, o Java pode ser executado em qualquer plataforma ou equipamento que possua um interpretador Java, e que tenha sido especialmente compilado para o sistema a ser utilizado. Robustez: os recursos da linguagem e do ambiente para o tempo de execuo garantem que o cdigo no derrube o sistema de algum que "tropece" em uma home page contendo uma animao. Segurana: alm de proteger o sistema do cliente contra possveis ataques no-intencionais, o ambiente tambm deve proteger contra aes premeditadas. Muito tempo e esforo dos desenvolvedores de Java est sendo aplicado para que a linguagem se desenvolva nesse sentido. Orientao a Objetos: Java uma linguagem totalmente orientada a objetos, o que permite a herana e a reutilizao de cdigos de forma dinmica e esttica. Dinamismo: por ter um projeto orientado a objetos, o dinamismo faz parte da natureza do Java, o que permite a extensibilidade durante a execuo. Alto Desempenho: a linguagem Java suporta vrios recursos de alto desempenho, como multithreading, compilao just-in-time e utilizao de cdigo nativo. O byte-code do Java possui um desempenho aproximadamente 20 vezes inferior que o de um cdigo nativo do 9
processador (ou linguagem de mquina), mas que em comparao com linguagens Script, como o HTML, o JavaScript ou o VBScript, ou at mesmo o prprio byte-code do VB (Visual Basic), possui uma performance muitas vezes superior. Esta performance, pela quantidade de esforos aplicados sobre a sua otimizao pelos desenvolvedores de Java, est cada vez mais sendo aumentada, podendo um dia comparar-se com uma linguagem compilada para o processador em especfico (linguagem nativa). Inclusive j foram criados processadores para suportar diretamente o byte-code da linguagem Java. Facilidade: a linguagem derivada da linguagem C e C++, sendo assim familiar. Alm disso, o ambiente retira do programador a responsabilidade de gerenciar a memria e os ponteiros. Por esses motivos decidimos utilizar a linguagem de programao Java, que permite a interao com sistemas de software livre e software pago atravs de sua portabilidade e facilitar o desenvolvimento do sistema Vision Access, por conter suporte a diversos tipos de tecnologias, dentre elas o reconhecimento e a sntese de voz atravez da API JavaSpeech.
4.2 Java Speech JavaSpeech uma tecnologia de sntese e reconhecimento da fala que melhora a acessibilidade aos computadores para muitas pessoas com limitaes fsicas. O Java Speech API define um padro para a utilizao da fala para interao com o computador. Duas tecnologias de fala so suportadas pelo Java Speech API. Uma delas o reconhecedor de fala e a outra o sintetizador de fala. O reconhecimento de fala fornece aos computadores a habilidade de escutar a lngua falada e de determinar o que foi dito, ou seja, processa a entrada de udio que contm a fala convertendo para texto. O sintetizador de fala, por sua vez, fornece o processo reverso de produzir a fala sinttica do texto gerado por uma aplicao, por um applet ou por um usurio. chamada freqentemente como a tecnologia text-to-speech (texto para fala). 10
4.3 Software IBM ViaVoice Um outro software utilizado no desenvolvimento desse sistema foi o IBM ViaVoice que um software de reconhecimento e sintese de voz desenvolvido em portugus. Ele exige a conexo com um dispositivo de sada de audio e um microfone. Utilizamos este sofware, pois a API JavaSpeech o implementa em sua utilizao para que seja possvel a sntese e o reconhecimento de fala na lngua portuguesa.
11
5. Comparativo entre os Sistemas desenvolvidos para Deficientes Visuais J existem alguns sistemas que tambm tm o propsito de promover a acessibilidade no ambiente da informtica para os deficientes visuais, a grande maioria ampliador ou leitor de tela, ainda que alguns tenham muitas funes bem mais complexas, no encontramos nenhum sistema que pudesse oferecer suporte ao reconhecimento de voz, porm outros softwares de outras reas de pesquisa no ramo da informao j utilizam esse tipo de tecnologia para dar mais conforto aos usurios na utilizao do computador, decidimos ento unir essas tecnologias com o objetivo de diminuir o acesso ao computador atravs do teclado e mouse. Para isso foram feitos estudos especficos com dois sistemas para deficientes visuais, o DosVox e o JAWs, que so os mais utilizados no Brasil, e comparamos com o nosso sistema, o Vision Access, desta forma procuramos utilizar as vantagens e buscamos solucionar as desvantagens encontradas a partir de nossas anlises.
5.1 DOSVOX Sistema desenvolvido no Brasil por um deficiente visual no Ncleo de Computao e Eletrnica da Universidade Federal do Rio de Janeiro (NCE- UFRJ), seu projeto teve incio em 1993. Ele um sistema operacional baseado na sntese de voz de interface bastante simples e amigvel. At hoje ele o sistema voltado para uso por deficientes visuais mais utilizado no Brasil por ser relativamente fcil de se aprender, um software gratuito e seu processamento ser rpido.
5.2 JAWs O JAWs um programa que d acesso a outros programas da plataforma Windows e a Internet. Ele um software leitor de telas que foi desenvolvido para pessoas cegas pela empresa Norte Americana Enter-Joyce, o qual l as informaes das janelas com o seu sintetizador de voz utilizando uma placa de som do computador. 12
J foi traduzido para 17 lnguas no mundo inteiro, sendo a lngua potuguesa uma delas. considerado o melhor software desenvolvido para deficientes visuais do mundo.
5.3 Vision Access O sistema Vision Access foi desenvolvido com o propsito de ser um sistema capaz de realizar as tarefas bsicas mais utilizadas em um computador por um usurio comum, porm, com as adaptaes necessrias para um deficiente visual, procurando tornar desnecessria a utilizao de qualquer programa externo ao sistema. Ele foi desenvolvido baseado na lngua portuguesa e d suporte entrada de dados por comandos de voz, fazendo uma interao com o usurio forte o suficiente para evitar que o deficiente visual necessite habituar-se algum teclado.
5.4 Comparao Caractersticas DOSVOX JAWs Vision Acces Fcil utilizao X X X Alta portabilidade (roda em qualquer sistema) X Gratuito X X Interface amigvel X X Instalao facilitada X Projeto nacional X X Reconhecimento do voz X
13
6. Prottipo do Sistema (Vision Acces) A partir das pesquisas realizadas sobre acessibilidade, deficientes visuais, e tcnicas de programao, conseguimos desenvolver um prottipo do sistema Vision Access que j expe nossos objetivos e idias para a soluo deste problema. Ao executar o programa, antes de entrar no sistema propriamente dito, ele exibe uma tela que pede ao usurio a entrada de um nome de usurio e uma senha, apresentando tambm o nome e senha de usurio padro (como mostra na Figura 1). Nesta tela inicial o sintetizador de fala diz: Bem - vindo., e quando o campo de entrada de usurio recebe o foco ele diz Digite seu nome de usurio., quando pressionado Enter o campo de senha recebe o foco e sintetizado Digite sua senha e caso o usurio e a senha lidos estejam corretos ele diz Senha aceita, ento ele entra no sistema. Figura 1: Primeira tela exibida, pedindo um nome de usurio e senha.
Ao entrar na tela inicial do sistema o sintetizador comea por sintetizar o nome da tela que detm o foco para que o deficiente visual saiba em que parte da execuo do sistema ele se encontra. A tela inicial do sistema tem uma barra de menus com os menus Arquivo, Texto, Multimdia, Configuraes, e Ajuda (como mostrado na Figura 2); com o passar do mouse sobre cada menu o sintetizador fala seu nome, e o mesmo ocorre com cada item de cada menu.
Figura 2: Tela inicial do sistema.
14
A maioria dos itens dos menus abre alguma aplicao do sistema, sintetizando o nome desta nova janela, como o item Editor de Texto do menu Texto. Optando por esse item aberta uma nova janela com o aplicativo editor de texto do sistema (apresentado na Figura 3), esse aplicativo contm apenas um menu em sua barra de menus, o menu Arquivo, nele esto os itens Novo, Abrir, Salvar Como e Sair, e alm da barra de menus o aplicativo tem em seu painel principal uma rea de texto que abrange todo o resto da janela. medida que o mouse passa por cima do menu e dos itens o sintetizador fala seus nomes da mesma forma como ocorre na tela inicial, e medida que o usurio digita um novo caractere na rea de texto o sintetizador fala este novo caractere. O item Novo limpa a rea de texto, permitindo a escrita de um novo texto; o item Abrir exibe uma pequena janela de escolha de arquivo na qual o usurio escolhe um arquivo *.txt para ser carregado na rea de texto; o item Salvar Como abre uma pequena janela onde o usurio escolhe onde o novo arquivo *.txt ser criado, ento ele recupera o texto da rea de texto e cria um novo arquivo no diretrio escolhido que contm este texto, podendo ser carregado novamente com a opo Abrir; o item Sair fecha o aplicativo sem salvar o texto digitado e retorna para a tela inicial. Figura 3: Aplicativo Editor de Texto do sistema.
Esse editor de texto fundamentado na mesma idia que rege todos os outros aplicativos do sistema, que funciona como um gerenciador de tarefas falado, o qual posteriormente receber a funcionalidade de comando de voz em todas as suas funes. 15
7. Trabalhos Futuros O sistema, atualmente, se encontra em uma fase bem primitiva, em comparao a tudo o que temos em mente para ele, e mesmo que neste estgio ele j possa apresentar o ideal de nossa pesquisa, almejamos continuar a melhor-lo. Para continuao do projeto iremos fazer algumas melhorias como: Aprimoramento de todas as funes existentes; Aprimoramento da interface existente, melhorando-a esteticamente para torn-la mais amigvel; Implantao de reconhecimento de voz para execuo de algumas tarefas bsicas do sistema; Desenvolvimento de uma rea de trabalho na tela principal do software; Acesso rede e pginas de internet;
16
8. Concluso A partir dos estudos realizados a respeito da problemtica encontrada na interao entre o deficiente visual e o computador, foi desenvolvido um sistema capaz de propiciar um aumento no acesso dos deficientes visuais ao computador pessoal utilizando a tecnologia de sntese de voz para apresentar dados em forma de som, para permitir a interao com o computador atravs do sentido da audio. Atravs de sistemas assim os deficientes visuais podero se igualar as outras pessoas no campo da informtica sem ter a falta total ou reduo da viso como uma barreira.
17
9. Referncias Bibliogrficas Normas e Critrios Gerais quanto promoo de acessibilidade a portadores de deficincia ou com mobilidade reduzida. Disponvel em: <http://www.planalto.gov.br/ccivil_03/Leis/L10098.htm> Acessado em 15 de fevereiro de 2011.
Vantagens e outros comentrios quanto acessibilidade Digital. Disponvel em: <http://www.timaster.com.br/revista/materias%5Cmain_materia.asp?codigo=1 728> Acessado em 20 de fevereiro de 2011.
COSTA, Sely. Impactos Sociais das Tecnologias de Informao. Brasilia. R. Bibliotecon. v.19, n. 1, p.3-22, jan./jun. 1995.
Incluso digital para deficientes visuais. Disponvel em: <http://www.donosdelanhouse.com.br/inclusao-digital/inclusao-digital-para- deficientes-visuais/>Acessado em 18 de junho de 2011
Incluso digital para deficientes visuais. Disponvel em: <http://espacoliberdade.blog.br/blog/linux/inclusao-digital-para-deficientes- visuais/>Acessado em 23 de junho de 2011
YAMADA, Bruno. Incluso digital para deficientes visuais. Disponvel em: <http://www2.dc.uel.br/nourau/document/?view=306>. Acessado em 17 de agosto de 2011.
PIMENTEL, Maria das Graas. Incluso digital e usurios com deficincia visual no DF: estudo de acessibilidade na sociedade da informao. Disponvel em: <http://repositorio.bce.unb.br/bitstream/10482/8731/1/2011_MariaDasGraasP imentel.pdf>. Acessado em 02 de setembro de 2011.
18
BRASIL. Constituio da Repblica Federativa do Brasil de 1988. Disponvel em: <http://www.planalto.gov.br/ccivil_03/Constituicao/Constituiao.htm>. Acessado em 16 novembro de 2011.