Anda di halaman 1dari 12

ARQUITETURA PARA A DESCRIO BIBLIOGRFICA SEMNTICA: requisito para a interoperabilidade em ambientes informacionais digitais

Fabiano Ferreira de Castro


Doutor em Cincia da Informao, Coordenador do Curso de Biblioteconomia da Universidade Federal de Sergipe UFS/SE

Plcida Leopoldina Ventura Amorim da Costa Santos


Livre-docente em Catalogao, Professora da Universidade Estadual Paulista UNESP/Marlia

RESUMO Nos ambientes informacionais digitais atualmente, onde vrios tipos de recursos coexistem com formatos e padres de metadados heterogneos, muitos esforos tm sido feitos para alcanar a interoperabilidade, a fim de utilizar vrios padres de metadados e de reutilizar os registros de metadados, atravs do desenvolvimento de estratgias, que vo desde os simples mapeamentos entre elementos de metadados modelagem estrutural complexa. O tratamento dado ao recurso informacional requer uma descrio de forma e de contedo legvel por mquinas, com resultados compreensveis aos humanos, e, que ainda, atenda aos requisitos de interoperabilidade entre os ambientes informacionais. Nesse sentido, a investigao prope a reflexo e um olhar pautados numa proposta de desenvolvimento de uma arquitetura para a descrio bibliogrfica semntica, que garanta a interoperabilidade em ambientes informacionais digitais. Por meio de uma metodologia de anlise exploratria e descritiva do tema, verifica-se que as metodologias da Catalogao Descritiva e uma ontologia para a descrio bibliogrfica, explicitada nas regras e cdigos de catalogao, e nos padres de metadados redesenham a construo de novos ambientes informacionais digitais melhor estruturados, para a recuperao da informao e no estabelecimento efetivo da interoperabilidade. Palavras-chave: Interoperabilidade. Padres de metadados. Modelagem de ambientes informacionais digitais. Catalogao automatizada. Ontologia para descrio bibliogrfica. Informao e Tecnologia.

ARCHITECTURE FOR THE SEMANTIC BIBLIOGRAPHIC DESCRIPTION: requirement for interoperability in digital informational environments ABSTRACT Actually in the digital informational environments, where several types of resources coexist with shapes and patterns of heterogeneous metadata, many efforts have been made to achieve interoperability in order to use multiple metadata patterns and reuse the metadata records through the development of strategies, ranging from simple mappings between metadata elements to the complex structural modeling. The treatment of the information resource

requires a description of form and content machine readable, understandable results to humans, and which also meets the requirements of interoperability between information environments. In this sense, the research proposes a reflection and a look lined a proposal to develop an architecture for the bibliographic description semantics, which ensures interoperability in digital informational environments. Through an analysis methodology exploratory and descriptive of the subject, it appears that the methodologies of Descriptive Cataloging and ontology for bibliographic description, explained the rules and codes of cataloging and metadata standards to redesign the construction of new digital informational environments better structured for information retrieval and effective establishment of interoperability. Keywords: Interoperability. Metadata patterns. Modeling of digital informational environments. Automatized cataloguing. Ontology for bibliographic description. Information and Technology.

1 INTRODUO
Pode-se observar contemporaneamente um cenrio marcado por grandes transformaes tecnolgicas e pelo surgimento e criao das mais variadas tcnicas para as questes de representao, de descrio, de produo, de organizao, de transmisso e de uso das informaes em ambientes informacionais digitais. O ambiente Web, por possuir informaes heterogneas e efmeras, pode ser caracterizado como catico, onde profissionais de diversas reas buscam solues para um tratamento mais significativo dos contedos que ali esto armazenados e disponibilizados para um uso mais efetivo. Idealizada por Tim Berners-Lee e liderada pelo World Wide Web Consortium (W3C) - a Web Semntica um projeto que visa a solucionar e a minimizar os problemas de recuperao da informao na Web por meio do acesso automatizado aos recursos informacionais. Para tanto, pretende implantar uma estrutura tecnolgica e instaurar uma maior representao do conhecimento na rede com o estabelecimento semntico das informaes contidas nas unidades e assim, possibilitar tcnicas mais eficazes de recuperao (BERNERS-LEE; HENDLER; LASSILA, 2001, traduo nossa). Durante as ltimas dcadas observou-se que mais e mais informaes tm sido publicadas, armazenadas e disponibilizadas na Web. No entanto, somente uma parte dessas informaes e em ambientes especficos, tais como as bibliotecas digitais, por exemplo, possuem um padro de metadados para a descrio bibliogrfica e que possibilite a padronizao dos recursos informacionais para atender aos requisitos da interoperabilidade. As bibliotecas digitais apresentam-se e atuam como um segmento na Internet onde procuram desenvolver e criar mtodos e tcnicas para a padronizao dos recursos informacionais. Mas garantir/assegurar a interoperabilidade entre ilhas de informaes bem estruturadas e padronizadas entre formatos bibliogrficos distintos encontra-se numa questo de investigao e preocupao pela comunidade cientfica. (CASTRO; SANTOS, 2010). Novas tecnologias baseadas em pesquisas na temtica Web Semntica desenvolvem-se com o intuito de tentar agregar semntica descrio bibliogrfica para um tratamento mais efetivo dos contedos digitais. A Web Semntica oferece algumas solues para diferentes problemas criando uma nova viso para o armazenamento e o processamento dos dados. Algumas dessas solues poderiam ser implementadas para potencializar os resultados das buscas no mbito das bibliotecas digitais. A preocupao da comunidade biblioteconmica advinda com as novas regras para a descrio bibliogrfica aplicadas no ambiente digital, levam os profissionais a repensarem o

seu fazer profissional, na tentativa de caminharem em consonncia com as novas transformaes trazidas no bojo da recontextualizao tecnolgica das bibliotecas. Dessa forma, pretende-se apontar e refletir sobre tais mudanas, numa proposta de um modelo de requisitos funcionais, para a modelagem de catlogos bibliogrficos, pautados na lgica descritiva das metodologias da Catalogao Descritiva, nas ontologias para a descrio bibliogrfica explicitadas nas regras e cdigos de catalogao e em padres de metadados, no estabelecimento efetivo da interoperabilidade em ambientes informacionais digitais.

2 A CATALOGAO DESCRITIVA NO SCULO XXI: impactos no ambiente digital


No cenrio atual da comunidade da Biblioteconomia e da Cincia da Informao, h uma preocupao e um reconhecimento crescente de que haver a necessidade de um sucessor do formato bibliogrfico MARC 21, devido s novas transformaes no domnio bibliogrfico, permeada pelo uso intensivo das Tecnologias de Informao e Comunicao (TIC). Segundo Coyle (2011) tais discusses tendem a se concentrar principalmente nas questes estruturais, o novo formato ser XML (eXtensible Markup Language), ele far uso de RDF (Resource Description Framework) e padres de dados ligados1? O que essas questes no se referem a tarefa muito mais complexa de traduzir a semntica dos dados bibliogrficos para a construo de um novo padro. De acordo com Thomale (2010) basta apenas uma pequena investigao dos dados codificados no formato MARC 21, para revelar que as tags e os subcampos em si, so insuficientes para definir os elementos dos dados reais realizados pelos registros de um catlogo bibliogrfico. O primeiro passo na transformao de MARC 21 para um outro formato identificar quais so os elementos contidos num registro bibliogrfico MARC 21, o que no parece to simples. (THOMALE, 2010, p. 3, traduo nossa). O entusiasmo recm-desenvolvido para RDF se tornar a base para os dados bibliogrficos de uma biblioteca tem ocorrido uma srie de esforos e aplicaes que convertam MARC 21 para RDF, mas nenhuma oficialmente ou recomendada pelos organismos internacionais da Catalogao Descritiva. Dentre as iniciativas oficialmente aceitas da transformao dos dados em RDF encontram-se na Library of Congress (LC) padres para a descrio de recursos, tais como o MODS (Metadata Object Description Standard). Outras propostas para a transformao dos dados de bibliotecas para RDF podem ser vistas em: ISBD2 (International Standard Bibliographic Description) em RDF, FRBR3 em RDF e RDA4 em RDF. Cada um desses esforos toma uma biblioteca padro e usa RDF como sua tecnologia subjacente, criando um esquema de metadados completo que define cada elemento do padro em RDF. O resultado que se tem uma srie de "silos" RDF, e cada elemento de dados definido como se pertencessem exclusivamente a esse padro. Existem quatro declaraes diferentes, por exemplo, no elemento lugar de publicao em ISBD, RDA, FRBR e MODS, cada um com seu prprio URI e tambm h
O termo dados ligados (Linked Data) refere-se ao conjunto das melhores prticas para a publicao e a interligao de dados estruturados na Web. Essas melhores prticas foram introduzidas por Tim Berners-Lee em sua nota Web Architecture e tornaram-se conhecidas como princpios de dados ligados. (HEATH; BIZER, 2011, traduo nossa). 2 Maiores informaes no site: Disponvel em: <http://www.ifla.org/en/node/1795>. Acesso em: 20 jan. 2012. 3 Maiores informaes no site: Disponvel em: <http://metadataregistry.org/schema/show/id/5.html>. Acesso em: 20 jan. 2012. 4 Maiores detalhes no site: Disponvel em: <http://metadataregistry.org/schema/show/id/1.html>. Acesso em: 20 jan. 2012.
1

diferenas entre elas (por exemplo, RDA separa lugar de publicao, produo etc., enquanto ISBD no o faz), certamente devero ter uma estrutura (vocabulrio) comum para solucionar essas questes. (COYLE, 2012). Uma possvel soluo seria se as diferentes instncias do "lugar de publicao" pudessem ser tratadas como tendo um significado comum, tal que elementos de FRBR pudessem ser ligados a um elemento ISBD, mas o mesmo no ocorre. A razo pela qual no ocorre se justifica, porque cada uma dessas restringe os elementos de forma nica (individual) que define seu relacionamento com um contexto de dados particular (o que geralmente pensamos das estruturas de um registro). Os elementos no so independentes do contexto, e isso significa que cada um somente pode ser usado dentro desse contexto particular. Essa a anttese do conceito de dados ligados, onde conjuntos de dados de fontes diversas compartilham elementos de metadados. E esta reutiliza os elementos que cria o "link" em dados ligados (vinculados). Para conseguir tal processo, os elementos de metadados precisam ser irrestritos por um contexto particular. (COYLE, 2012). A ligao pode tambm ser alcanada atravs dos relacionamentos verticais, similares aos termos (mais amplos e mais restritos) num tesauro. Essa opo menos direta, mas torna possvel a "mistura" de conjuntos de dados que tm diferentes nveis de granularidade. No caso do "lugar de publicao" da ISBD, poderiam ser definidos mais amplamente para os trs elementos de RDA que tratam esse separadamente. Coyle (2012) afirma que infelizmente isso no possvel devido forma que ISBD e RDA foram definidos em RDF. Coyle (2012) refora que o resultado que agora tem-se uma srie de silos RDF, expresses dos dados em RDF que faltam a capacidade de cruzamento dos dados ligados, porque eles so obrigados a especificar estruturas de dados e pouco se ganha em termos de dados ligados sob a ptica bibliogrfica. No somente os esquemas RDF so incompatveis com outros, ningum ser ligado a dados bibliogrficos de comunidades fora de bibliotecas que publicarem seus dados na Web. O que significa a no ligao dos dados Amazon, Wikipedia, para citaes em documentos. Coyle (2012) diz que devido ao estgio inicial em que estamos no desenvolvimento de dados ligados para o ambiente das bibliotecas, tm-se duas opes em relao ao uso do RDF. Definir "super-elementos" que estejam acima dos registros de formatos e que no esto vinculados pelas restries dos registros definidos em RDF. Neste caso, haveria um "lugar de publicao" geral que seria um "super" elemento correspondente a todos os lugares de publicao nos vrios registros e seriam subordinados a um conceito geral de "lugar" utilizado amplamente. Para implementar a ligao, cada elemento de registro seria extrapolado para os seus "super-elementos". Definir primeiro os elementos de dados fora de qualquer formato de registro especfico, e ento us-los em esquemas de registros. Neste caso haveria apenas uma instncia do "lugar de publicao" e que seria utilizado nos vrios registros bibliogrficos, sempre que um elemento necessrio. O intercmbio desses registros seria possvel com a ligao dos dados de seus elementos componentes, e iria interagir com outros dados bibliogrficos na Web utilizando os elementos RDF definidos e seus relacionamentos. Coyle (2012) conclui ainda que precisa-se criar dados, no somente registros, e que necessita-se criar primeiramente os dados, em seguida, registros com os mesmos para aplicaes de acordo com a necessidade de cada ambiente informacional. Esses registros iro operar internamente nos sistemas de bibliotecas, enquanto os dados tm o potencial para fazer conexes no espao de dados ligados. Um esforo maior tem que acontecer em descobrir e definir os elementos de nossos dados e olhar para os diversos dados que deseja unir, no vasto universo de informaes.

As bibliotecas tm seu foco nos registros bibliogrficos que compem os acervos institucionais, geralmente um documento complexo que atua como um substituto do catlogo, tal como um livro ou uma gravao de msica. RDF, nesse contexto, no menciona nada sobre os registros, apenas diz que existem dados que representam coisas (recursos) e os relacionamentos entre essas coisas. O que muitas vezes confundido que qualquer coisa pode ser uma coisa em RDF, assim, o livro, o autor, a pgina, a palavra na pgina, qualquer uma, ou todas essas poderiam ser as coisas em seu universo. (COYLE, 2012). As discusses acerca do futuro das bibliotecas digitais e sua configurao para a adoo de tecnologias da Web Semntica manifestam-se da necessidade que os ambientes e sistemas de informao criem uma estrutura de dados que aproveitem as potencialidades do RDF, permitam os relacionamentos de forma explicitada e promovam a interoperabilidade. Vale destacar que os relacionamentos bibliogrficos sempre existiram no interior dos catlogos bibliogrficos entre os dados de um registro bibliogrfico, por meio das regras e esquemas de catalogao, porm no explicitados aos sujeitos institucionais para o uso e (re) uso das informaes nos ambientes de manipulao de dados bibliogrficos e catalogrficos.

3 Modelagem estrutural de dados em ambientes informacionais digitais


Ao pensar na criao e no desenvolvimento de um modelo de dados, nos deparamos com as questes de granularidade e anlise dos dados a serem catalogados. O que no algo novo no domnio bibliogrfico, onde se desenvolveu um modelo de dados implcito nas regras de descrio (AACR2) e nos formatos de intercmbio de dados bibliogrficos (MARC 21). Atualmente com o desenvolvimento de novas regras e padres para a modelagem dos ambientes informacionais, tais como FRBR, FRAD e RDA, reconhece-se que h uma tendncia na estruturao e na definio dos dados a serem catalogados preparando-os para mov-los e torn-los compatveis com a Web Semntica. Nas camadas intangveis dos dados (definida na representao e descrio dos recursos informacionais), h um aumento na estrutura e na granularidade dos dados. Yee (2009) aponta que mais estrutura e mais granularidade possibilitam apresentaes mais sofisticadas aos usurios dos sistemas e aumentam a possibilidade de produo de dados interoperveis.
Qualquer mudana ou mapeamento que foi contratado para criar dados interoperveis produziria um menor denominador comum (os dados mais simples e menos granular), e uma vez interoperveis, no seria possvel sua recuperao na ntegra, devido sua perda. Dados com menos estrutura e menos granularidade poderiam ser mais fceis e mais baratos para aplic-los e ter o potencial mais simples para as comunidades envolvidas. (YEE, 2009, p. 59, traduo nossa).

Vamos tomar como exemplo um nome pessoal. Conforme as regras de catalogao (AACR2), demarca-se o sobrenome, do nome prprio, registrando primeiro o sobrenome, seguido por uma vrgula e depois o nome. Essa quantidade de granularidade pode representar muitas vezes um problema para o catalogador numa cultura desconhecida, que no domina necessariamente as regras. Mais granularidade pode ocasionar situaes ambguas para os sujeitos que esto coletando os dados. Outro exemplo quanto ao gnero do criador, onde o catalogador poderia se deparar com uma situao, que no saberia se o definiria como masculino ou feminino. (YEE, 2009, p. 59, traduo nossa). Yee (2009) comenta que se adicionarmos uma data de nascimento e de morte, seja qual for, as utilizamos juntas em um subcampo $d sem qualquer codificao separada para indicar qual o nascimento e qual a morte (embora um ocasional "b" ou "d" nos dir esse

tipo de informao). Poderamos fornecer mais granularidade para datas, mas tornaria o formato MARC 21 muito mais complexo e difcil de aprender. Na representao do campo 100 (autor pessoal), por exemplo, a forma autorizada para descrever o contedo definida da seguinte maneira: 100 1#$a Adams, Henry, $d1838-1918. Nesse caso, o subcampo $d (Datas associadas ao nome NR5), 1838 corresponde data de nascimento, enquanto 1918 data de falecimento do autor.

De acordo com Yee (2009), granularidade e estrutura tambm podem ocorrer "tenso" uma com a outra. Mais granularidade pode conduzir a uma menor estrutura (ou mais complexidade para manter a estrutura junto com a granularidade). Na busca de maior granularidade de dados que se tem agora, (RDA tenta apoiar RDF na codificao XML), tm sido atomizados os dados para torn-los teis aos computadores, mas isso no necessariamente tornar os dados mais compreensveis aos humanos. Para ser til aos humanos, deve ser possvel agrupar e organiza-los de forma significativa para a catalogao, a indexao e a apresentao dos mesmos. Os desenvolvedores do Simple Knowledge Organization System (SKOS) referem-se ao montante de informaes no estruturadas (isto , legvel por humanos) na Web, rotulando bits de dados como relacionamentos semnticos dos registros em uma mquina acionvel, de forma que no necessariamente fornece o tipo de estrutura necessria para tornar os dados legveis por humanos e, portanto, teis para as pessoas na Web. (YEE, 2009). Para reforar seu pensamento, Yee (2009, p. 59, traduo nossa) afirma que:
Quanto mais granular os dados, menos o catalogador pode construir ordem, sequenciamento e a ligao dos dados; a codificao deve ser cuidadosamente projetada para permitir a ordem, o sequenciamento e a ligao dos dados desejados, para que a catalogao, a indexao e a apresentao sejam possveis, o que poderia ser chamado de uma codificao dos dados ainda mais complexa.

No que tange estrutura de dados, Yee (2009) diz que existem vrios significados atrelados ao termo, conforme pode ser observado. Estrutura um objeto de um registro (estrutura de documento), por exemplo, Elings e Waibel referem-se a "campos de dados... tambm referidos como elementos... que esto organizados em um registro por uma estrutura de dados". Estrutura a camada de comunicao, ao contrrio da camada de apresentao ou designao de contedo. Estrutura o registro, o campo e o subcampo. Estrutura a ligao de bits de dados em conjunto, na forma de vrios tipos de relacionamentos. Estrutura a apresentao dos dados de maneira estruturada, ordenada e sequenciada para facilitar a compreenso humana. Estrutura de dados a forma de armazenamento dos dados em um computador para que ele possa ser usado eficientemente (isto , como os programas de computadores usam o termo). Conforme as definies apresentadas por Yee (2009), Castro (2012, p. 168) ressalta que,
(NR) No Repetido, significa que s pode existir apenas um subcampo com apenas um cdigo associado ao nome do responsvel pela obra.
5

Chamar-se- de estrutura de dados, a camada intangvel de instanciamento dos dados bibliogrficos modelados para a representao e a descrio, tal como os formatos e/ou padres de metadados, de forma a permitir a interoperabilidade dos ambientes informacionais digitais, por agentes humanos e no humanos, garantindo interfaces mais acessveis aos usurios para posterior recuperao, uso e (re) uso dos recursos informacionais.

Quando se menciona estrutura de dados, no domnio bibliogrfico, pensa-se no modelo conceitual de dados, estabelecido pelos Requisitos Funcionais para Registros Bibliogrficos (FRBR). FRBR faz uso de um modelo entidade-relacionamento, o qual consiste em dois principais conceitos: "coisas" e relacionamentos. FRBR define 10 categorias "coisas", as quais so denominadas entidades: Obra, Expresso, Manifestao, Item, Pessoa, Entidade coletiva, Conceito, Objeto, Evento e Lugar. As entidades podem ser compreendidas, por exemplo, como uma obra, um texto, um livro etc. Os atributos correspondem s caractersticas dos dados relacionados entidade e servem para diferenciar o contedo intelectual ou artstico. Os relacionamentos descrevem as ligaes entre uma entidade e outra, na facilitao de manuseio do recurso informacional pelo usurio em um sistema. (MORENO, 2006). Moreno (2006, p. 35, grifo do autor) apresenta as principais terminologias no modelo conceitual de dados FRBR:
Obra uma entidade abstrata, uma criao intelectual ou artstica distinta. A entidade Expresso a realizao intelectual ou artstica especfica que assume uma obra ao ser realizada, excluindo-se a aspectos de alterao da forma fsica. Uma Manifestao a materializao de uma expresso de uma obra, ou seja, seu suporte fsico, que podem ser livros, peridicos, kits multimdia, filmes, etc., que representada pelo Item, um nico exemplar de uma manifestao. As duas ltimas entidades refletem a forma fsica, so entidades concretas, enquanto as duas primeiras refletem o contedo intelectual ou artstico.

A contextualizao e a exemplificao dos FRBR podem ser interpretadas da seguinte maneira. Tomemos como exemplo, um romance literrio (Obra), onde se tem o texto original e o mesmo fora traduzido ou tivera alguma modificao, tal como uma edio ilustrada (Expresso); as formas em que a obra est disponvel podem ser encontradas/visualizadas em um formato impresso (manual) ou num formato eletrnico/digital (Manifestao); e no momento em que a obra est disponibilizada na estante de uma biblioteca, ou seja, os exemplares relativos quela obra so denominados Itens (materializao do recurso bibliogrfico). (CASTRO, 2012). Os FRBR constituem em uma nova 6 abordagem para a Catalogao Descritiva contemporaneamente nos seus moldes convencionais, no sentido de propiciar uma recuperao mais efetiva e intuitiva dos itens bibliogrficos, agindo como um bibliotecrio de referncia, ou seja, relaciona todos os materiais atrelados ao termo da busca, trazendo-os de uma s vez em uma nica interface. Por exemplo, se um determinado autor alm de livros, possui outras manifestaes, tais como discos, CDs e DVDs, o sistema/agente permitir atravs do modelo de relacionamento FRBR, no momento da busca realizada pelo usurio, relacionar todas essas manifestaes e recuper-las uma nica vez, apresentando-as aos usurios.
6

Nova no sentido de explicitar os relacionamentos entre registros bibliogrficos, uma prtica que j acontece, por exemplo, entre os elementos do formato de intercmbio MARC 21, mas de forma no visvel aos usurios dos catlogos on-line.

Os bibliotecrios que se acostumarem com os Requisitos Funcionais para Registros Bibliogrficos - FRBR - provavelmente no encontraro muita dificuldade na transio do modelo conceitual para o modelo RDF. (CASTRO, 2012). Riley (2010) aprofunda o estudo comparativo terminolgico do RDF no contexto da Biblioteconomia e da Cincia da Informao, especificando: Assunto: em bibliotecas, o que um recurso informacional abrange em termos de contedo; em RDF o que diz uma declarao sobre alguma coisa (recurso informacional). Vocabulrio: em bibliotecas, implica num certo tipo de vocabulrio controlado (termos autorizados, estruturas hierrquicas, termos relacionados etc.); em RDF definies muito mais flexveis (inclui definies formais de classes e de propriedades de um recurso informacional). Classe: em bibliotecas, um esquema de classificao (Classificao Decimal de Dewey CDD; Classificao Decimal Universal CDU etc.) indicando o tpico geral ou rea do conhecimento abrangido pelo recurso informacional; em RDF - um tipo ou categoria pertencente a um objeto ou recurso informacional. Schema: XML Schema define um conjunto de elementos destinados a ser usados juntos; RDF Schema define classes e propriedades destinadas a ser usadas em qualquer lugar, sozinhas ou em combinao. A dificuldade em qualquer exerccio de modelagem de dados, sobretudo, no domnio bibliogrfico, encontra-se em decidir o que tratar como entidade ou classe e o que tratar como um atributo ou propriedade. FRBR decidiu criar uma classe chamada expresso para tratar qualquer mudana no contedo de uma obra. Os FRBR em comparao ao modelo de dados RDF, encontra-se em harmonia, as entidades do FRBR so registradas como classes, enquanto as relaes so registradas como propriedades. FRBR em RDF7 acrescenta apenas trs classes. Duas delas (Endeavor e Entidade Responsvel) so super conjuntos de classes FRBR. Endeavor uma generalizao que pode ser relacionada obra, expresso, ou manifestao, ou seja, uma classe cujos membros so qualquer um dos produtos da atividade artstica ou criativa. Entidade Responsvel um termo mais geral que pode se relacionar a uma entidade coletiva ou a uma pessoa. Essas classes especificam mais claramente informaes sobre o contedo intelectual de um recurso, sem necessitar fornecer informaes adicionais. A terceira classe que adicionada o assunto. Todas as trs incluem alguma instncia do assunto em seus esquemas. FRBR trata claramente assunto como um relacionamento. (DAVIS; NEWMAN, 2005; COYLE, 2012). Com base na sustentao terica apresentada nesse texto, at o presente momento, fica evidente que a condio dos ambientes informacionais digitais interoperar seus dados a modelagem conceitual, esta definida e codificada por uma srie de requisitos funcionais estabelecidos pelas arquiteturas de metadados, regras e esquemas de descrio bibliogrfica e ontologias, que fornecer ambientes melhor estruturados, na garantia de recuperao de informaes mais efetiva aos usurios (humanos e no humanos).

4 Proposta de arquitetura para descrio bibliogrfica semntica: caminhos para interoperabilidade


A palavra de ordem na constituio de ambientes informacionais digitais, sobretudo, no mbito das bibliotecas digitais a interoperabilidade. Para tanto, para que a
7

As expresses do ncleo de conceitos e vocabulrios FRBR em RDF podem ser melhor visualizados no site. Disponvel em: <http://vocab.org/frbr/core.html>. Acesso em: 20 jan. 2012.

interoperabilidade acontea de maneira eficiente, faz-se necessrio um olhar mais acurado nas camadas estuturantes e delineadoras dos catlogos bibliogrficos digitais, ou seja, na representao e na descrio dos dados, a fim de potencializar as formas de busca e recuperao de informaes. Como um ponto de partida para garantir a interoperabilidade, esta investigao, a partir das observaes e reflexes no campo da Catalogao Descritiva, destaca alguns requisitos e diretrizes funcionais que podem ser utilizados no estabelecimento da interoperabilidade em ambientes informacionais digitais de uma forma mais efetiva. Para tanto, pretende-se compreender a estrutura intangvel, numa proposta apresentada em camadas sobrepostas, conforme a figura 1, uma vez que elas devem trabalhar em sinergia para a consistncia e funcionamento pleno do ambiente digital.

FIGURA 1: Proposta de modelagem para interoperabilidade no domnio bibliogrfico.

Fonte: Castro (2012, p.177)

Camada 1 - Tipologia dos dados: nessa fase inicial o projetista (catalogador) define quais os dados sero trabalhados para alimentao e modelagem do ambiente informacional, a partir do recurso bibliogrfico a ser catalogado. Exemplo: dados textuais, imagticos, udio etc. Vale destacar que nessa tese nos teremos apenas nos dados textuais, explicitados nos cdigos de catalogao (AACR2) e nos padres de metadados (MARC 21). Camada 2 - Preparao dos dados: uma vez definidos os dados bibliogrficos a serem utilizados no sistema, a preparao dos dados consiste na adoo de ferramentas para a

converso8 de dados em RDF. Os dados que foram extrados de outras fontes, ou seja, dados no RDF, o W3C tem recomendado alguns conversores que auxiliam a transformao, como RDFizer. A adoo do RDFizer se justifica uma vez que no se tem oficialmente representaes de dados MARC em RDF, nesse sentido, tal conversor transforma dados do padro de metadados MODS em RDF, iniciativa essa promovida pela Library of Congress (MODS, 2011). Camada 3 Tratamento e Armazenamento dos dados: Aps a converso dos dados em RDF, a prxima camada consiste na adoo efetiva pelo catalogador das regras e/ou dos esquemas de descrio bibliogrfica (AACR2 e RDA), ou seja, a catalogao dos recursos bibliogrficos, na confeco padronizada de metadados; a definio dos padres de metadados (MARC 21), da arquitetura de metadados RDF para a estruturao dos dados e RDF Schema para sua validao. Vale dizer que nesse momento o catalogador dever tambm adotar os Requisitos Funcionais para Registros Bibliogrficos (FRBR), em consonncia com os Requisitos Funcionais para Dados de Autoridade (FRAD) e os Requisitos Funcionais para Dados de Assunto (FRSAD). As ontologias aparecem nesse contexto para definir os conceitos dos elementos de um registro bibliogrfico, por meio das regras e esquemas de descrio para a confeco metodolgica dos metadados e dos padres de metadados. Camada 4: Apresentao (Display) dos dados: A fase final consiste em tornar disponveis os dados (output) e apresent-los aos usurios do ambiente informacional. Os dados podero aparecer da maneira como foram construdos e armazenados (input) nas camadas 1 e 3, para a camada tangvel de recuperao e tambm visualizado na Web. Acredita-se que esses requisitos e recomendaes podem propiciar uma modelagem dos catlogos melhor estruturados, para posterior recuperao, uso e re (uso) das informaes, garantindo a interoperabilidade e potencializando os relacionamentos bibliogrficos semnticos, iniciativa essa que vai de encontro aos ideais vislumbrados pela Web Semntica.

5 GUISA DE CONSIDERAES E RFLEXES


Acredita-se que tal modelo/esquema de arquitetura nessa investigao, pode possibilitar o compartilhamento entre padres de metadados e ambientes e sistemas informacionais distintos, trabalhando numa filosofia de colaborao entre os recursos informacionais disponveis e as tecnologias que esto abarcadas na sua construo, no estabelecimento da interoperabilidade, na otimizao dos relacionamentos bibliogrficos e ampliados para a construo padronizada de recursos na Web.
Um conversor para RDF uma ferramente que converte aplicaes de dados de um formato especfico em RDF para uso com ferramentas de RDF e integrao com outros dados. Conversores podem ser parte de um esforo de migrao, ou parte de um sistema em execuo que fornece uma viso Web Semntica de uma determinada aplicao. (W3C, 2012, traduo nossa).
8

Segundo Castro (2012), modelos ontolgicos de relacionamentos bibliogrficos tm vantagens para a estruturao de novos catlogos. Uma ideia com muitas variaes estender campos do formato MARC 21 para ligaes explcitas para outras obras. MARC 21 tem uma organizao de arquivos de dados muito complexa. possvel converter a estrutura idiossincrtica de registros MARC, ou seja, os cdigos de campos, os subcampos e os valores condicionados aos indicadores para mais formatos padro. A necessidade de faz-lo, portanto, impede a utilizao do avano na corrente principal de tecnologias de banco de dados. (LEE; JACOB, 2011). A utilizao de ontologias, de metadados e dos fundamentos tericos e metodolgicos da Catalogao Descritiva uma vez articuladas, podem redesenhar novas opes aos ambientes informacionais, seja na modelagem do banco de dados (catlogos), ou ainda, na forma de representao dos recursos informacionais, garantindo a possibilidade de interoperabilidade semntica e no auxlio s formas de apresentao dos recursos, proporcionando aos usurios uma multiplicidade nas formas de busca, de acesso e de recuperao de informaes pertinentes, significativas e relevantes, bem como o uso, a preservao e o (re) uso numa nica interface. (CASTRO, 2012). Quanto aos profissionais da Cincia da Informao, em especial os bibliotecrios catalogadores, no podem prescindir de compreender a necessidade de construo de registros bibliogrficos, que estejam pautados numa base terico-epistemolgica e metodolgica que os sustentem e obedea a registros pr-determinados e estabelecidos por regras e/ou esquemas de descrio bibliogrfica internacionais, visando o controle bibliogrfico universal. De acordo com Castro (2012), a estrutura estratgica para promoo da interoperabilidade em ambientes informacionais digitais se d na unio da camada intangvel (representao e descrio dos dados) de instanciamento e persistncia dos dados bibliogrficos, com a camada visvel de apresentao para os usurios. O catalogador projeta por antecipao o ambiente informacional, utilizando ontologias para a descrio bibliogrfica explicitadas nas regras e esquemas para a representao e descrio dos recursos bibliogrficos, definindo conceitualmente os elementos, juntamente com os modelos conceituais e os padres de metadados, garantindo a unicidade dos recursos, apresenta-os conforme as solicitaes das estratgias de busca e de recuperao ao usurio. Assim, a arquitetura para a representao e a descrio bibliogrfica semntica e os nveis de interoperabilidade desenvolvida nesse estudo, propicia a modelagem estrutural dos ambientes informacionais digitais atualmente, a partir da heterogeneidade de esquemas de metadados, tornando-se, dessa forma, uma estrutura nica a ser adotada por vrios catalogadores, ampliando seu escopo para a construo padronizada de recursos na Web. Alm disso, a adoo desse modelo configura o estabelecimento efetivo da interoperabilidade, principalmente com os impactos tecnolgicos na Catalogao Descritiva.

REFERNCIAS
BERNERS-LEE, T.; HENDLER, J.; LASSILA, O. The semantic web: a new form of web content that is meaningful to computers will unleash a revolution of new possibilities. Scientific American, New York, May, 2001. Disponvel em: <http://www.sciam.com/2001/050lissue/0501berners-lee.html>. Acesso em: 28 jun. 2005.

CASTRO, Fabiano F. de; SANTOS, Plcida L. V. A. C. Catalogao e metadados: interlocues nos ambientes informacionais digitais. In: ARELLANO, Filiberto Felipe Martnez (Org.). Memoria del IV encuentro de catalogacin y metadatos. Mxico: Centro Universitario de Investigaciones Bibliotecolgicas de la Univ. Nacional Autnoma de Mxico, 2010. v. 4, p. 301-318. CASTRO, Fabiano F. de. Elementos de interoperabilidade na catalogao descritiva: configuraes contemporneas para a modelagem de ambientes informacionais digitais. 2012. 202 f. Tese (Doutorado em Cincia da Informao) - Faculdade de Filosofia e Cincias, Universidade Estadual Paulista, Marlia, 2012. COYLE, Karen. MARC 21 as data: a start. Code4Lib Journal, Vol. 14, 2011. COYLE, Karen. Bibliographic framework: RDF and linked data. Berkeley, United States, Jan. 2012. Disponvel em: < http://kcoyle.blogspot.com/2012/01/bibliographic-frameworkrdf-and-linked.html>. Acesso em: 20 jan. 2012. DAVIS, Ian; NEWMAN, Richard. Expression of core FRBR concepts in RDF. 2005. Disponvel em: < http://vocab.org/frbr/core.html>. Acesso em: 20 jan. 2012. HEATH, Tom; BIZER, Christian. Linked data: evolving the web into a global data space. Morgan & Claypool, Vol. 1 no. 1, 2011. 136 p. (Synthesis Lectures on the Semantic Web: Theory and Technology). Disponvel em: < http://linkeddatabook.com/editions/1.0/#linkedData>. Acesso em: 15 nov. 2011. LEE, Seungmin; JACOB, Elin K. An integrated approach to metadata interoperability: construction of a conceptual structure between MARC and FRBR. Library Resources & Technical Services, Vol. 55, no. 1, p.17-32, Jan. 2011. MODS. Metadata Object Description Schema. Library of Congress, Mar. 2011. Disponvel em: < http://www.loc.gov/standards/mads/rdf/>. Acesso em: 21 maio 2011. MORENO, F. P. Requisitos funcionais para registros bibliogrficos - FRBR: um estudo no catlogo da rede bibliodata. 2006. 202 f. Dissertao (Mestrado em Cincia da Informao) Faculdade de Economia, Administrao, Contabilidade e Cincia da Informao e Documentao, Universidade de Braslia, Braslia, 2006. RILEY, Jenn. Enhancing interoperability of FRBR-based metadata. In: Proc. Intl Conf. on Dublin Core and Metadata Applications. 2010a. p. 31-43. Disponvel em: <http://dcpapers.dublincore.org/index.php/pubs/article/view/1037>. Acesso em: 12 dez. 2011. THOMALE, Jason. Interpreting MARC: wheres the bibliographic data? Code4Lib Journal, Vol. 11, 2010. W3C. Converter to RDF. 2012. Disponvel em: < http://www.w3.org/wiki/ConverterToRdf>. Acesso em: 21 jan. 2012. YEE, Martha M. Can bibliographic data be put directly onto the semantic web? Information Technology and Libraries, Vol. 28, no. 2, p. 55-80, Jun. 2009.