NDICE
NDICE...............................................................................................2 INTRODUCCIN. ONTOLOGAS, QU SON?......................................3 CMO ES LA ESTRUCTURA DE UNA ONTOLOGA?............................5 RELACIN DE LAS ONTOLOGAS CON LOS TESAUROS........................6 COMPARACIN ENTRE ONTOLOGAS Y TESAUROS...........................7 USOS DE LAS ONTOLOGAS: ORGANIZAR PARA RECUPERAR.............9 ONTOLOGAS Y WEB SEMNTICA....................................................10 APLICACIONES PRCTICAS...............................................................11 ALGUNAS CRTICAS A LAS ONTOLOGAS.........................................13 BIBLIOGRAFA.................................................................... ............14 OTROS RECURSOS............................................................. .............15 OBSERVACIONES TCNICAS............................................... ............15 GLOSARIO.......................................................................... ............16
Estas definiciones dejan entrever el cambio que se produce en la concepcin del trmino Ontologa, es a partir de los aos 1990 cuando el trmino ontologa se empieza a desarrollar fuera del mbito de la metafsica dando lugar a la concepcin que actualmente se le da en el mbito de la documentacin y la informtica. Debido a la irrupcin de las tecnologas informticas en el mundo documental-informativo, estn apareciendo trminos nuevos a partir de conceptos antiguos ya conocidos. Por esta razon, hoy se habla de las ontologas como sinnimo de lenguajes documentales, pero con una estructura muy diferente a la de aquellos.
Diferencias en la concepcin de ontologa en Metafsica y en Informtica. Fuente: Ontologas, taxonoma y tesauros : manual de construccin y uso (CURRS, 2005)
En la bsqueda de Currs (CURRS, 2005) por encontrar una explicacin al uso del trmino ontologa aplicada a la informtica, lo clarifica de la siguiente forma: Se desea encontrar un paralelismo entre el estudio de lo que existe, es decir, un dominio de conocimiento, con lo que asumimos que existe, es decir la transformacin de un lenguaje natural, realidad, del dominio elegido, a un lenguaje codificado; = asumimos que existe; para conseguir una descripcin coherente de la realidad, es decir, poder obtener de aquel dominio, una respuesta coherente de la realidad.
* Psicolgico * Social * De ideas A continuacin, establece los subniveles: objetos, sucesos, substratos, forma, relacin, determinacin, dependencia, estructura, parte, todo, unidad, multiplicidad, dimensin, continuo, discreto, identidad, diversidad, posibilidad, realidad, necesidad, cambio. Brian Vickery muestra otra estructura donde cita unas categoras ordenadas por niveles de importancia, o preferencia: 1. Actividades y procesos 2. Estrategias 3. Organizacin 4. Economa de mercado Se trata, pues, de una ontologa orientada hacia la economa.
Diagrama que muestra conjuntos de informacin vinculados a travs de linked data Fuente: http://linkeddata.org/
Teniendo en cuenta ese nuevo escenario de actuacin la diferencia fundamental entre tesauros y ontologas se encuentra en tres puntos: 1): las ontologas son interpretadas y legibles tanto por humanos como por ordenadores mientras que los tesauros slo pueden ser usados por personas 2): las ontologas aportan valor semntico a la informacin, valor que est propiciado por su propia estructura basada en relaciones, clases, propiedades, instancias, etc. Por su parte los tesauros son
herramientas basadas en texto donde el poco valor semntico que tienen descansa en las relaciones de jerarqua y asociacin que facilita. 3): por otra parte las ontologas tienen salida al mundo real mientras que los tesauros estn destinados a recoger conceptos de un dominio concreto pero restringido a los documentos de ese dominio.
Semejanzas Tesauro & Ontologa Representacin del conocimiento Especializado Finalidad Dominio
Diferencias Tesauro Se usa Personas: expertos y usuarios finales Palabras para representar los conceptos que hay en los documentos Jerrquica, alfabtica y contextual Textual Ontologa Se interpreta Personas y mquinas Palabras y relaciones (estructuras) para representar conocimiento En clases, propiedades, instancias y relaciones Metadatos, cdigo Uso Usuarios
Base
Estructura Sintaxis
Instrumento
Funcionamiento Busqueda por palabras Sin relacin semntica entre los documentos
Trabaja con...
mbito
Motores de bsqueda
Web actual
Ontologas
Web semntica
Lo novedoso de la aplicacin de ontologas en la recuperacin de informacin es que facilitan una representacin ms rica de los datos. Esto supone integracin de datos de naturaleza distinta, interrelacin mediante asociaciones semnticas y en definitiva una consulta amplificada de la informacin en un sentido totalizador.
La web semntica apuesta por colgar datos en bruto (raw data) y con ellos confeccionar lo que Berners Lee denomina linked data, datos que en iteraccin con otros produce conocimiento, semntica. Las tecnologas de la nueva web permiten a las personas crear repositorios de datos, construir vocabularios y establecer normas para la correcta importacin de datos en la web, pero es importante que el registro del contenido web se estandarice para que pueda ser utilizado por el mayor nmero de aplicaciones posible. Otro aspecto importante de la web semntica es su carcter relacional por el cual los documentos no slo son recuperables por si mismos sino que ser posible visualizar las relaciones que tienen con otros documentos.
10
Como estamos diciendo, para que esto sea posible la informacin debe estar normalizada con un formato estndar. RDF (Resource Description Framework) se ha elegido como el modelo estndar para el intercambio de informacin en la web. Este esquema hace uso asimismo de los metadatos, en el lenguaje que sea, normalmente XML, para describir los recursos web. Un modelo para plasmar en cdigo esa descripcin es Dublin Core
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:dc="http://purl.org/dc/elements/1.1/"> <rdf:Description rdf:about="http://www.ugr.es"> <dc:creator>Universidad de Granada</dc:creator> <dc:title>Pgina web de la Universidad de Granada</dc:title> <dc:description>Pgina web de la Universidad de Granada donde se puede acceder a todo tipo de informacin relacionada con la institucin, sus centros, facultades, etc. </dc:description> <dc:date>2010-10-15</dc:date> </rdf:Description> </rdf:RDF> Ejemplo de descripcin mediante RDF/XML que describe las caractersticas esenciales de la web de la UGR.
La idea que es que mediante las herramientas usadas en este ejemplo (XML, RDF y Dublin Core) se cree a gran escala un sistema para que los documentos web sean descritos tanto en su forma como en su contenido y gracias a ello se contribuya a interrelacionar los documentos de una manera semntica
APLICACIONES PRCTICAS
Algunos de los proyectos de innovacin de ontologas, especialmente los ms comerciales, no tienen o no han podido mantener una implementacin en la web. Existe una gran variedad de ontologas accesibles a travs de buscadores especializados (por ejemplo, el de SchemaWeb) A continuacin se presentan someramente algunas implementaciones prcticas de las ontologas:
SearchMonkey Aplicacin de Yahoo, es un buscador web que recoge informacin directamente de otras pginas y la devuelve de forma enriquecida en un formato estndar (XML). Actualmente no est operativo pero hay algunos ejemplos disponibles en la red: http://developer.search.yahoo.com/help/objects/product
11
Iuriservie Sistema de apoyo al Consejo General del Poder Judicial de Espaa. La aplicacin Iuriservie utiliza ontologas jurdicas para compartir conocimiento judicial y agilizar as la labor de los magistrados. Para ello se basa en dos recursos diferentes: un sistema de bsqueda de preguntas y respuestas puntuales sobre temas que afectan al ejercicio jurdico; y un sistema de bsqueda de casos legales. En ambos casos se accede al conocimiento a travs de un buscador que recupera la informacin en base a su significado legal y no a la bsqueda textual de los trminos de la consulta. El servicio parece estar restringido al uso exclusivo de los jueces Ms informacin: http://www.isoco.com/innovacion_web_semantica_c.htm Oncoterm Oncoterm es un repositorio terminolgico especializado en vocabulario concerniente al cncer. Esta base de datos tiene unos 2000 conceptos relacionados con la oncologa que se encuentran relacionados semnticamente entre si. Tambin cuenta con alrededor de 4000 trminos en ingls y en espaol los cuales funcionan como entradas terminolgicas y contienen informacin general y gramatical, imgenes, links, as como ndices KWIC que facilitan su consulta para estudios lingusticos. Ms informacin: Oncoterm es un proyecto del grupo de investigacin Lexicon de la UGR. Se puede consultar en http://www.ugr.es/~oncoterm/alpha-index.html (Consultado: 26/11/2010)1 Vocabulario musical (Kanzaki) Vocabulario que describe piezas y actuaciones de msica clsica as como sus categoras, propiedades, etc. Ms informacin: http://www.kanzaki.com/ns/music.rdf Document List Vocabulario sencillo para crear listas de documentos asignndoles etiquetas especficas (URI, dominio, rango, etc.) a propiedades generales (nombre corto, categora, nmero). No tiene interfaz grfica. Ms informacin: http://www.junkwork.net/xml/DocumentList Ontologa myGrid Se trata de una ontologa sobre servicios y dominios de la actividad cientfica en informtica, bioinformtica y biologa molecular. El esquema, que an no tiene una interfaz de consulta, recoge por una parte vocabulario, descripciones de datos y relaciones sobre datos de bioinformtica; por otra describe las caractersticas de las operaciones efectuadas en la web, como imputs y outputs. Mediante la combinacin de trminos se puede saber qu hace un determinado servicio, a qu fuentes de datos accede, cules y cuntas son las salidas y entradas aplicadas en el sistema, y qu mtodos de qu dominio especfico participan . Ms informacin: http://www.mygrid.org.uk/tools/service-management/mygrid-ontology/
1
Entre los proyectos de Lexicon tambin figura Puertoterme un interesante tesauro virtual y multilinge especializado en medioambiente que en cuanto prestaciones podra clasificarse como ontologa ya que prove de informacin relacionada como imgenes, URLs, etc. Se puede acceder al recurso en http://ecolexicon.ugr.es/visual/index_es.html
12
BIBLIOGRAFA
ARANO, Silvia. Los tesauros y las ontologas en la Biblioteconoma y la Documentacin [en linea]. Hipertext.net, n 3, 2005. Consultado: 26/11/2010. Disponible en: http://www.upf.edu/hipertextnet/numero-3/tesauros.html BATES, M.J.; MAACK, M.N. Encyclopedia of Library and Information Sciences. 3rd ed. Boca Raton, FL: CRC Press, 2010. ISBN: 978-0-8493-9712-7 BERNERS LEE, TIM. Linked data. [en lnea] 27/07/2006. Consultado 26/11/2010. Disponible en: http://www.w3.org/DesignIssues/LinkedData.html. BERNERS LEE, TIM. What the semantic web can represent. [en lnea] 17/09/2008 Consultado 26/11/2010. Disponible en: http://www.w3.org/DesignIssues/RDFnot.html. CODINA, Llus; ROVIRA, Cristfol, PEDRAZA-JIMNEZ, Rafael. Web semntica y ontologas en el procesamiento de la informacin documental. El profesional de la informacin. v. 16. n 6. NoviembreDiciembre 2007. Tambin disponible en http://www.elprofesionaldelainformacion.com/contenidos/2007/noviembre/04.pdf CURRS, Emilia. Ontologas, taxonoma y tesauros : manual de construccin y uso. 3 ed. Gijn: Trea, 2005. 337 p. ISBN: 84-970-4157-7 Enciclopedia Hispnica. Barcelona: Encyclopaedia Britannica, 1989. ISBN: 96-845-7137-2 Enciclopedia Universal Ilustrada Europeo-Americana. Madrid: Espasa Calpe, 1958. ISBN: 84-239-45006. GRUBER, T.R. A Translation Approach to Portable Ontologies. Knowledge Acquisition, vol. 5, no. 2, pp. 199-220. ISSN: 1042-8143
LAMARCA LAPUENTE, Maria Jess. Hipertexto: El nuevo concepto de documento en la cultura de la imagen. Director: Felix del Valle Gastamiza. Universidad Compluense de Madrid, Madrid, 2006 Tambin disponible en: http://www.hipertexto.info/documentos/ontologias.htm
14
OTROS RECURSOS
Buscador de ontologas. http://www.schemaweb.info Web del W3C: http://www.w3.org/ Base de datos de tesis doctorales TESEO. https://www.educacion.es/teseo/irGestionarConsulta.do Web de ISOCO (empresa tecnolgica). http://www.isoco.com/
OBSERVACIONES TCNICAS
Para facilitar el acceso a los recursos electrnicos que se referencian en este trabajo se ha colgado en la web una versin electrnica Las tablas o grficos son de elaboracin propia salvo que se exprese lo contrario Las referencias y citas bibliogrficas siguen la norma ISO 690-1987 para documentos impresos y audiovisuales y la norma ISO 690-2 para documentos electrnicos. La confeccin del trabajo se ha hecho colaborativamente en el entorno que propone GoogleDocs el cual aporta una serie de valores aadidos que facilitan el trabajo en grupo permitiendo, entre otras opciones, la comunicacin a tiempo real por medio de un chat, la exposicin pblica en la red, creacin de copias de seguridad, etc.
15
GLOSARIO
Dublin Core Vocabulario estandarizado de metadatos que permite describir los recursos de informacin facilitando as su recuperacin Linked data Informacin dispuesta en formatos estandarizados que permite ser contextualizada y relacionada a travs de herramientas de la web semntica. La principal caracterstica de la linked data es su interrelacin. OWL Ontology Web Language. Lenguaje estndar de la web semntica para expresar y codificar ontologas con el objetivo de poder ser interpretadas por ordenadores RDF Resource Description Framework: modelo estndar que posibilita el intercambio de datos en la red y la integracin de los mismos independientemente de los modelos subyacentes Web semntica Estadio de la web donde los datos se hayan integrados, relacionados y estandarizados de modo que puedan ser tratados autnomamente por ordenadores y que faciliten su comprensin a las personas Web 3.0 vease Web semntica XML EXtensible Markup Language. Metalenguaje que permitir establecer la sintaxis de lenguajes especficos sobre cualquier tipo de tema o disciplina
16