Anda di halaman 1dari 6

2600 palabras

LA ONTOLOLOGÍA Y LA WEB SEMÁNTICA: RECOMENDACIONES DEL W3C

1. INTRODUCCIÓN

- La Web hoy
- La Web del futuro: la Web Semántica (WS)

2. EL WORLD WIDE WEB CONSORTIUM (W3C)

- Concepto, misión y objetivos


- Actividad normativa
- Las recomendaciones para la WS:
- RDF
- OWL

3. RDF (RESOURCE DESCRIPTION FRAMEWORK)

- La Semántica: RDF
- La Sintaxis: XML

4. OWL (ONTOLOGY WEB LANGUAGE)

- Concepto Ontología
- OWL: el lenguaje para construir ontologías

5. EL CAMINO HACIA LA WS

- El alto coste de la transición


- Aplicación de la Inteligencia Artificial para la manipulación de los datos
- La Biblioteca Digital Universal
- Todavía queda mucho por hacer

1
2600 palabras

1. INTRODUCCIÓN

 LA WEB HOY

La Web es uno de los servicios de Internet más importantes y que más ha conseguido popularizar la red. Fue
concebida por Tim Berners-Lee, quien presentó el proyecto de la W en 1989, en el CERN (Suiza). Este
proyecto era, sin embargo, mucho más ambicioso de lo que conocemos hoy en día de la Web.

Las posibilidades que ofrece la Web en la actualidad son, a pesar de ello, asombrosas, e impensables hace tan
sólo unas décadas. La Web nos permite realizar de forma remota infinidad de actividades de todos los
ámbitos: educativo (e-learning), cultural (visitas virtuales a museos, bibliotecas, ciudades), administrativo
(declaración de la renta), económico (cuentas corrientes, compra-venta de valores), laboral (teletrabajo), ocio
(juegos, literatura, prensa, fotos), etc.

El volumen de información que alberga la red es inabarcable. Se dice que “todo está en la red”, y lo que no
está es porque no existe. A la Web superficial se le suma la Web profunda (Internet invisible), compuesta por
todos los contenidos que están ahí pero que no aparecen en los buscadores cuando preguntamos por ellos,
debido normalmente a que son recursos dinámicos pertenecientes a Bases de Datos.

Sin embargo, a pesar de contar con este ingente almacén de información, es bien sabido que la capacidad de la
red para satisfacer necesidades de información es limitada. La calidad, volatilidad y obsolescencia de los
contenidos ponen trabas a la satisfacción de muchos internautas. Otro gran problema de la Web es su
abrumadora obtención de resultados ante una búsqueda genérica, lo que denota una gran falta de precisión.

Esta falta de precisión se hace patente cuando lanzamos una búsqueda cualquiera en alguno de los motores o
directorios existentes, por ejemplo, preguntando por “San Bernardo” y nos devuelve resultados acerca de
distintas realidades inconexas: una raza de perro, una calle de Madrid o un Santo devoto.

Este problema, tan habitual por otra parte, ocurre porque la Web actual carece de capacidad para
expresar significados. Únicamente se limita a recoger cadenas de caracteres indizadas en grandes BD’s,
buscar por ellas cuando son requeridas y presentarlas en la pantalla del ordenador para su visualización por
parte de un ser inteligente. Pero la máquina no sabe realmente lo que la información significa.

Aquí es donde surge la apuesta por la construcción de una Web Semántica (WS), también llamada Web
Inteligente.

 LA WEB DEL FUTURO: LA WEB SEMÁNTICA

La WS es una corriente promovida por el propio inventor de la Web, Tim Berners-Lee, cuyo fin es lograr que
las máquinas puedan entender y por tanto utilizar lo que la Web contiene. De ahí que se haya tomado el
concepto de Semántica, que desde el punto de vista lingüístico es la disciplina que estudia el significado de
los términos.

Se pretende desarrollar una Web más cohesionada, donde sea más fácil localizar, compartir e integrar
información y servicios, para sacar un mayor partido a los recursos disponibles.

Tal y como expresó el mismo Berners-Lee en un artículo publicado por la revista Scientific American en 2001, la
WS es una extensión de la Web actual, no una sustitución. La WS no pierde las características esenciales de
la Web actual, como por ejemplo ser descentralizada.

Para poder llegar a este (por ahora) lejano objetivo de WS hay que recorrer un largo camino, primero de
desarrollo de estándares para la representación, organización y recuperación de información en la red, y
segundo de promoción y concienciación por parte de toda la comunidad web para su uso.

La WS persigue el establecimiento de una forma universal de representar las relaciones entre los
datos, y entre éstos y sus significados para que un sistema automático (agente) sea capaz de sacar sus
propias conclusiones respecto a la búsqueda que se está realizando.

Para que las máquinas empiecen a procesar “conocimiento” y no únicamente “datos”, hay que conseguir
que la información esté convenientemente estructurada y clasificada. Esto conlleva la utilización de los llamados
“lenguajes para la representación del conocimiento”. Para las personas vinculadas al mundo de la
2
2600 palabras

documentación y de los lenguajes documentales, esto no es una novedad. De hecho, uno de los lenguajes más
conocidos en este ámbito para describir recursos en Internet es el sistema de metadatos Dublin Core,
respaldado por la DCMI.

En este tema vamos a tratar otros lenguajes: las tecnologías más importantes planteadas por el W3C
para construir la WS: el metalenguaje XML, la arquitectura RDF, y el lenguaje OWL.

2. EL WORLD WIDE WEB CONSORTIUM (W3C)

 CONCEPTO

El World Wide Web Consortium (W3C) es un organismo encargado de velar por la normalización en
Internet. Está presidido desde su creación en 1994 por Tim Berners-Lee, quien a su vez es el máximo
impulsor de la WS. En la actualidad, son miembros del W3C unas 400 organizaciones.

La misión del W3C es “guiar a la Web hacia su máximo potencial mediante el desarrollo de protocolos
comunes que promuevan su evolución y garanticen su interactividad”

Los objetivos del W3C a largo plazo son:

- Acceso universal: hacer la Web accesible a todos los usuarios de todos los continentes
salvando las diferencias tecnológicas

- Web Semántica: desarrollo de las tecnologías adecuadas para optimizar el uso de la Web

- Web de Confianza: guiar el futuro de la red teniendo en cuenta los nuevos aspectos legales,
comerciales y sociales.

 ACTIVIDAD NORMATIVA

El W3C lleva a cabo su actividad normativa a través de Recomendaciones. Cada recomendación es una
especificación estable desarrollada por un Grupo de Trabajo del W3C y revisada por los miembros del consorcio.
Estas recomendaciones son aceptadas tanto por la industria como por los internautas como verdaderos
estándares.

Al igual que en el ámbito bibliotecario la normalización ha sido un pilar básico que ha favorecido la
cooperación y ha beneficiado a las bibliotecas en muchos otros aspectos, en el entorno de Internet también lo
es. Así pues, las recomendaciones del W3C favorecen la “interoperabilidad” de las tecnologías web, es
decir, la capacidad de sistemas heterogéneos para interactuar entre sí e intercambiar información.

 RECOMENDACIONES PARA LA WS: RDF y OWL

En febrero de 2004 el consorcio W3C anunció la aprobación de dos recomendaciones fundamentales para
la construcción de la WS: RDF (Resource Description Framework) y OWL (Ontology Web Language).

Cada una de estas recomendaciones ha sido elaborada por sendos Grupos de Trabajo y se compone de 6
documentos. Los 6 documentos de la Recomendación RDF están destinados a diferentes segmentos de
usuarios que deseen aprender, utilizar, implementar o entender RDF. Igual ocurre con los 6 documentos de la
Recomendación OWL. Ambas recomendaciones cuentan con una guía de uso, con especificaciones
técnicas e informáticas, así como con casos de uso y conjuntos de pruebas para ayudar a los
desarrolladores a implementar estas tecnologías. (al loro: pura informática)

Veamos cada una de ellas por separado:

3. RDF (RESOURCE DESCRIPTION FRAMEWORK)

3
2600 palabras

RDF (Resource Description Framework) ofrece un marco de trabajo (una superestructura) para la
descripción de recursos web de forma sencilla.

Hoy en día es el estándar más popular y extendido en la comunidad web.

RDF facilita un conjunto claro de reglas para proporcionar información descriptiva. Este conjunto de reglas
permite la construcción de una estructura semántica no ambigua, ya que usa URI’s para la identificación
de recursos, y permite la codificación, intercambio y procesamiento automático de los metadatos
normalizados.

Cada sentencia RDF consta de tres partes:

- Sujeto: el recurso propiamente


- Predicado: el nombre de la Propiedad
- Objeto: el valor de la Propiedad

Eplo.: Maite es la autora de este horrible tema

- Sujeto: este horrible tema (el recurso)


- Predicado: es la autora (la propiedad)
- Objeto: Maite (el valor de la propiedad)

(Aclaración: esto es para que el ordenador comprenda las descripciones. El humano puede entender que
significa lo mismo “Maite es la autora de este horrible tema” que “Este horrible tema tiene como autora a
Maite”, pero el ordenador no. Así le damos desmenuzada cada parte para que la identifique esté en el orden
que esté.)

El Esquema RDF proporciona un modo de combinar las descripciones dadas en un vocabulario único
(control del vocabulario). Las especificaciones RDF conforman una base práctica sobre la que se puede
construir OWL y el resto de la WS.

RDF se integra en una variedad de aplicaciones, incluyendo entre otras:

- Catálogos de bibliotecas
- Directorios mundiales
- Colecciones personales de música, fotos, eventos
- Organización de noticias, software y contenidos

Dado que RDF define el marco abstracto para describir recursos, requiere de una sintaxis concreta para
expresar el conocimiento y transferirlo. Esa sintaxis es XML (Extensible MarkUp Language).

XML es un metalenguaje desarrollado en 1998 bajo los auspicios del W3C.

Se trata de un lenguaje de marcas, un subgrupo de SGML, específicamente pensado para ser utilizado en
entorno web. Es tal la importancia que está adquiriendo este lenguaje que se dice que “XML es el futuro de
Internet”.

XML ofrece información sobre la estructura de los contenidos, lo que permite intercambiar datos
estructurados. El otro conocidísimo lenguaje de etiquetas para crear páginas web, HTML, tiene una gran
desventaja, y es que sólo tiene capacidad para describir la apariencia de los contenidos en Internet (colores,
tamaños, enlaces, etc.).

XML, por su parte, ofrece una capacidad limitada para expresar semántica. Por eso se entiende que
RDF es a la Semántica lo que XML es a la Sintaxis. El modelo de datos XML consiste en un árbol que no
distingue entre objetos y relaciones, ni tiene noción de jerarquías de clases. En cambio RDF cuenta con clases y
subclases que definen “esquemas”.

Por tanto, gracias a RDF se expresan afirmaciones y gracias a su lenguaje de base XML se define la
estructura de esas afirmaciones.
4
2600 palabras

XML responde a la necesidad de contar con una sintaxis que fuera capaz de representar el modelo
planteado por RDF en archivos legibles por ordenador.

La otra recomendación del W3C relacionada con la WS e íntimamente ligada a RDF es OWL (Ontology Web
Language).

4. OWL (ONTOLOGY WEB LANGUAGE)

 CONCEPTO ONTOLOGÍA

La Ontología es un concepto perteneciente al área de la Filosofía que fue tomado por la Informática y que
ahora se usa habitualmente para la WS.

La Ontología en Informática hace referencia al intento de formular un exhaustivo y riguroso esquema


conceptual dentro de un dominio dado, con la finalidad de facilitar la comunicación y la compartición de la
información entre distintos sistemas.

Las ontologías son, por tanto, herramientas para la representación del conocimiento y constituyen un
vehículo para acercarnos a la WS.

Una ontología contiene un vocabulario de conceptos así como las relaciones entre estos conceptos.

Las ontologías definen de forma estándar los términos y sus relaciones dentro de un determinado
dominio (área del conocimiento), formando redes jerárquicas semánticas (Aclaración: una cosa así como los
tesauros, pero en lenguaje de ordenador).

Las ontologías facilitan reglas lógicas y restricciones para hacer comprender a las máquinas los conceptos
que se manejan en ese campo. (Eplo.: en una ontología de arte, establecemos que todos los escultores son
artistas pero no todos los artistas son escultores).

Las ontologías están pensadas para actuar como referencia común entre sistemas distintos que utilizan
conceptos similares (control del vocabulario). Se busca lograr el consenso sobre cómo representar el
conocimiento para poder así compartirlo y facilitar la interoperabilidad. Estas herramientas codifican el
conocimiento de un dominio y también el conocimiento que se expande a través de varios dominios. La
adopción de ontologías comunes es clave para que todos los que participan en la WS puedan trabajar de
forma autónoma con la garantía de que “hablan el mismo idioma”.

Las ontologías pueden hacer uso de cualquier de los lenguajes de representación del conocimiento existentes,
normalmente basados en XML, pero el más común es RDF.

Una ontología contiene:

- Clases: conceptos generales de un dominio determinado. (Eplo.: en una ontología de deportes, cada clase
sería un deporte. Fútbol, Baloncesto, Ciclismo, cada uno conformaría una clase).

- Instancias: instancias particulares del concepto (subclases)

- Propiedades de las clases y las instancias (características)

- Relaciones entre clases e instancias (jerarquías)

- Restricciones y reglas de inferencia: aplican la lógica (Si A tiene relación con B, B tiene relación con A)

Visto el concepto de ontología y su posible aplicación a la WS pasamos a ver el OWL.

 OWL

5
2600 palabras

El Lenguaje de Ontologías Web (OWL) proporciona un lenguaje para definir ontologías estructuradas
basadas en Web.

OWL pretende facilitar un lenguaje para ser usado con el fin de describir las clases, las propiedades de las
clases y la relación entre las clases (cardinalidad, igualdad, simetría, etc.)

OWL se construye sobre RDF, quien ofrece la base adecuada para desarrollar ontologías. Las ontologías
basadas en RDF podrán ser distribuidas en muchos sistemas y serán compatibles con otros estándares web.

El Grupo de Trabajo de Ontología Web del W3C afirma que “supone un gran paso adelante en la
representación y organización del conocimiento en la World Wide Web”.

Existen otros grupos que han desarrollado lenguajes de ontología web durante la última década, pero no eran
tan compatibles con la arquitectura de la Web y mucho menos con la WS. De hecho, OWL se basa en el
lenguaje DAML+OIL. Este a su vez es la fusión del lenguaje DAML (de la Agencia de defensa DARPA de los EE
UU) y del lenguaje OIL (de la Comunidad Europea).

Escribir en lenguajes como RDF y OWL resulta sumamente difícil y propenso a errores. En lo tocante a
ontologías, existen en el mercado algunas herramientas de edición de ontologías, entre las que
destacamos Protégé. Este software, desarrollado por la Universidad de Stanford, es el que más usuarios tiene
actualmente. Permite editar ontologías con una sencilla interfaz, facilitando su desarrollo, ya que es una tarea
que requiere una gran capacidad de abstracción y síntesis.

Hemos visto cómo XML, RDF y OWL permiten a la Web ser una infraestructura global para la compartición de
datos y documentos, lo que hace más fácil y fiable la búsqueda y reutilización de la información.

5. EL CAMINO HACIA LA WS

La transición de la Web actual a la WS puede, sin embargo, implicar un coste altísimo (en tiempo, dinero
y esfuerzo) ya que no sólo se trata de estructurar la información venidera en la Web, sino también la ya
existente, labor que se prevé irrealizable.

La WS es aún una visión, un concepto futuro muy ambicioso.

La WS permitirá en un futuro, y ayudándose de la Inteligencia Artificial, realizar en la Web un sinfín de


operaciones, mucho más amplias que lo que conocemos a día de hoy. El tener toda la información
etiquetada sintáctica y semánticamente facilitará la implementación eficaz de los llamados agentes
inteligentes. Estos agentes serán capaces de ofrecernos la información de la Web que más nos interese en
función de las circunstancias personales de cada usuario (personalización máxima).

Por ejemplo, un agente me podrá ayudar a planificar las fiestas de Navidad teniendo en cuenta mi agenda, mis
gustos, mi saldo en la cuenta corriente, etc. Así, la máquina me sugerirá ponerme tal vestido, cocinar tal receta
para Nochebuena, el regalo de mi sobrino a la mejor calidad-precio, el itinerario óptimo a seguir para dirigirme
al centro de la ciudad, me recordará las llamadas telefónicas pendientes, etc.

Como vemos, la WS no sólo pretende la representación adecuada del conocimiento, sino también su
manipulación.

Esta situación imaginaria tiene ya cierta base real cuando constatamos cómo tiendas como Amazon sugieren al
usuario la compra de productos similares a los adquiridos con anterioridad en esa tienda.

En el terreno de las bibliotecas, la WS será un momento decisivo para la Biblioteca Digital Universal, la
biblioteca única, donde todo es accesible de forma rápida y precisa se encuentre donde se encuentre.

A pesar de este bonito futuro que se augura y de las experiencias piloto llevadas a cabo hasta el momento,
todavía queda mucho por hacer.

Anda mungkin juga menyukai