Uma ontologia define os termos utilizados para descrever e representar uma área de
conhecimento. Ontologias são utilizadas por pessoas, bases de dados e aplicações que
necessitam de partilhar informação sobre um domínio (um domínio específico é apenas
uma área temática ou área do conhecimento, como medicina, construção, fabricação de
ferramenta, bens imobiliários, reparação automóvel, gestão financeira, etc.).
A palavra ontologia tem sido usada para descrever artefactos com diferentes graus de
estrutura. Estas vão desde simples taxonomias (como hierarquia Yahoo), esquemas de
metadados (como o Dublin Core), até às teorias lógicas. A Web Semântica precisa de
ontologias com um grau significativo de estrutura. É necessário especificar descrições
para os seguintes tipos de conceitos:
As ontologias são figura proeminente na Web Semântica emergente como uma forma de
representar a semântica dos documentos, permitindo que a semântica possa ser utilizada
por aplicações web e agentes inteligentes. Ontologias podem revelar-se muito úteis para
a comunidade como uma forma de estruturar e definir o significado de termos, os
metadados, que são actualmente recolhidos e padronizados. Usando ontologias, as
aplicações futuras podem vir a ser “inteligentes”, no sentido de que se possa trabalhar
com mais precisão a um nível conceitual humano.
As ontologias são peças críticas para aplicações que pretendem pesquisar através de ou
proceder à fusão de informações provenientes de diversas comunidades. Embora XML
DTDs e esquemas XML sejam suficientes para a troca de dados entre as partes que
tenham acordado previamente as definições, a sua falta de fiabilidade semântica impede
as máquinas de realizar essa tarefa quando aparecem novos vocabulários XML. O
mesmo termo pode ser usado com (por vezes subtil) significado diferente em contextos
diferentes, e os diferentes termos podem ser utilizados para itens que têm o mesmo
significado. RDF e RDF Schema têm vindo a começar uma abordagem a este problema,
permitindo a uma semântica simples, ser associada com identificadores. Com RDF
Schema, pode ser definida uma classe que pode ter várias subclasses e super classes,
podendo ser definidas propriedades, que podem ter sub propriedades, domínios, e
intervalos. Neste sentido, RDF Schema é uma simples linguagem ontologica. No
entanto, para atingir interoperacionalidade entre numerosos, autonomamente
desenvolvidos e geridos esquemas, são necessárias semânticas mais ricas. Por exemplo,
RDF Schema não pode especificar que as classes Pessoa e Carro são disjuntas, ou que
um quarteto de cordas tenha exactamente quatro músicos como membros.
A idéia da Web Semântica surgiu em 2001, quando Tim Berners-Lee, James Hendler e
Ora Lassila publicaram um artigo na revista Scientific American, intitulado: “Web
Semântica: um novo formato de conteúdo para a Web que tem significado para
computadores vai iniciar uma revolução de novas possibilidades.”
O objectivo principal da Web semântica não é, pelo menos para já, treinar as máquinas
para que se comportem como pessoas, mas sim desenvolver tecnologias e linguagens
que tornem a informação legível para as máquinas. A finalidade passa pelo
desenvolvimento de um modelo tecnológico que permita a partilha global de
conhecimento assistido por máquinas (W3C 2001). A integração das linguagens ou
tecnologias eXtensible Markup Language (XML), Resource Description Framework
(RDF), arquiteturas de metadados, ontologias, agentes computacionais, entre outras,
favorecerá o aparecimento de serviços Web que garantam a interoperabilidade e
cooperação.
A Web Semântica
Tim Berners-Lee inventou a World Wide Web em 1989. Ele a criou como uma interface
para a Internet e como um método de as pessoas compartilharem informações entre si.
Berners-Lee discute a existência daWeb 2.0 (em inglês), chamando-a de "nada mais do
que um jargão sem sentido" [fonte: Register (em inglês)]. Berners-Lee ainda afirma que
ele pretendia que a World Wide Web fizesse tudo o que Web 2.0 deve fazer.
A visão de Berners-Lee para a futura Web é similar ao conceito da Web 3.0. Ela é
chamada de Web Semântica. Neste momento, a estrutura da Web é ajustada para os
humanos. É fácil para nós visitarmos uma página da Web e compreendermos seu
sentido. Os computadores não conseguem fazer isso. Um site de busca pode ser capaz
de analisar palavras-chaves, mas não consegue entender como essas palavras são usadas
no contexto de uma página.
Com a Web Semântica, os computadores analisarão e interpretarão as informações das
páginas utilizando agentes de software. Esses agentes serão programas que navegarão
através da Web, procurando informações relevantes. Eles serão capazes disso porque a
Web Semântica terá conjuntos de informação chamados de ontologias. Em termos de
Internet, uma ontologia é um arquivo que define as relações entre um grupo de termos.
Por exemplo, o termo "primo" se refere à relação familiar entre duas pessoas que
compartilham um conjunto de avós. Uma ontologia da Web Semântica definiria cada
papel familiar da seguinte maneira:
• avô: um ancestral direto há duas gerações do sujeito;
• pais: um ancestral direto há uma geração do sujeito;
• irmão ou irmã: alguém que compartilha os mesmos pais do sujeito;
• sobrinho ou sobrinha: filho do irmão ou da irmã do sujeito;
• tio ou tia: irmão ou irmã de um dos pais do sujeito;
• primo: filho de uma tia ou de um tio do sujeito.
Para a Web Semântica ser eficaz, as ontologias precisam ser detalhadas e
compreensivas. No conceito de Berners-Lee, elas existiriam na forma demetadados. Os
metadados são informações incluídas nos códigos das páginas da Web e são invisíveis
aos humanos, mas perceptíveis pelos computadores.
A construção de ontologias requer muito trabalho. De fato, esse é um dos grandes
obstáculos que a Web Semântica enfrenta. As pessoas estarão dispostas a aplicar o
esforço necessário para fazer ontologias compreensivas em seus sites? Elas irão manter
essas ontologias enquanto ocorrem mudanças nos sites? Críticas sugerem que a tarefa de
criar e manter tais arquivos complexos é trabalho demais para a maioria das pessoas.
Por outro lado, algumas pessoas realmente gostam de rotular ou identificarobjetos e
informações da Web. As identificações da Web categorizam o objeto ou informação
identificados. Vários blogs incluem uma opção de identificação, tornando fácil
classificar as postagens sob tópicos específicos. Sites de compartilhamento de
fotos como o Flickr permitem que os usuários identifiquem as imagens. O Google até
mesmo transformou isso em um jogo: o Google Image Labeler coloca duas pessoas uma
contra a outra em uma disputa de identificação. Cada jogador tenta criar o maior
número de identificações relevantes para uma série de imagens. De acordo com alguns
especialistas, a Web 3.0 será capaz de pesquisar identificações e rótulos e mostrar os
resultados mais relevantes para o usuário. Talvez a Web 3.0 combine o conceito da Web
Semântica de Berners-Lee com a cultura de identificação da Web 2.0.
Embora a Web 3.0 esteja mais para teoria do que para realidade, isso não impediu que
as pessoas tentassem adivinhar o que está por vir. Continue lendo para conhecer o
extenso futuro da Web