Por:
Resumen
INTRODUCCIÓN
A continuación se aborda una reflexión sobre las diferentes herramientas que se utilizan
en los procesos de organización de la información en las bibliotecas y centros de
documentación. Se hará alusión a las normas de catalogación tradicionales, así como a los
sistemas de análisis de información, traducidos en lo que se denomina como lenguajes
documentales, para luego pasar a otras opciones de organización que surgen como
producto del desarrollo de las Tecnologías de la Información y la comunicación y en las
que se aportan mayores desarrollos a los procesos de organización tradicionales y que en
muchas unidades de información, se están utilizando de manera continua.
1
HERRAMIENTAS ACTUALES DE LOS PROCESOS DE ORGANIZACIÓN DOCUMENTAL
Estas se inician a partir de 91 reglas que fueron impresas en el catálogo del Museo
Británico en 1841 por Panizzi, denominado en su momentos “El Guardián de los Libros”.
De igual forma, Charles Ammi Cutter publica en Estados Unidos las reglas que orientan
sobre los objetivos de la catalogación, aún vigentes para muchos. A finales del siglo XIX, la
American Library Association y la Library Association del Reino Unido trabajan
inicialmente en colaboración, pero no se ponen de acuerdo en algunos aspectos, situación
que motiva el que se publique de manera separada en el año de 1902 y en 1908. De
manera similar se trabaja por parte de la Library Congress junto con la ALA, en sus propias
reglas y después se publican unas complementarias para incrementar las reglas de la ALA.
2
Más adelante en el año de 1978 y luego de obtener aportes norteamericanos e ingleses,
siguiendo acuerdos sobre la ISBD dentro de IFLA y junto al deseo de los países de habla
inglesa de llegar a un acuerdo respecto a las reglas, se publican las RCA2, (Reglas de
Catalogación Anglo Americanas 2). Con esta segunda edición se logra que por primera vez
ambos países Inglaterra y Estados Unidos, se compartan las mismas reglas, a pesar de
algunas diferencias en algunos puntos relacionados con las opciones permitidas en ellas.
Surgen en la IFLA en la década de los años 70 del siglo XX, como respuesta a la necesidad
de formalizar el control bibliográfico internacional y lograr una mayor cooperación
mundial en materia informativa. (Garrido Arilla,1996)1
Más adelante se generan nuevas herramientas en torno a las ISBD, para normalización de
publicaciones seriadas, material no libro, material cartográfico, libros raros, música
impresa, recursos electrónicos, para las partes componentes, para asegurar armonía en el
tratamiento de la información y puntuación prescrita, así como el colaborar con los
autores de las Normas Angloamericanas de Catalogación 2 AACR2 en la preparación de las
ISBD (General). En los años 80 se introducen mejoras en asuntos relacionados con
materiales publicados en alfabetos no latinos.
1
GARRIDO ARILLA, María Rosa. Teoría e historia de la catalogación de documentos. – Madrid : Síntesis,
1996. – p.29
2
BIRUM, John D. Nacimiento y renacimiento de las ISBDS: proceso y procedimientos para crear y para
revisar las descripciones bibliográficas internacionales normalizadas // En: 16th IFLA Council and general
conference. – Jerusalén : IFLA, 2000.
3
1.3. FORMATO MARC
El formato MARC se define como aquel Formato legible por máquina (Machine Readable
Cataloguing Record). Se constituye en un conjunto de normas que permite almacenar
información mediante registros de diversa índole, y poder así procesarla, ubicarla,
exportarla o disponerla para la consulta con los usuarios.
Este tipo de herramienta, se origina con el propósito de contribuir con el uso, desarrollo y
mantenimiento de las bases de datos de toda unidad de información, lo cual ha favorecido
la catalogación cooperativa y los procesos de automatización de las bibliotecas. El
formato MARC inició su aparición en los años 50 en la investigación para desarrollar un
formato legible por máquina en la Biblioteca del Congreso de los Estados Unidos.
El formato MARC I aportó información para establecer una norma para registros legibles
por máquina. Este formato fue perfeccionado y extendido a partir de 1967 en el formato
conocido como MARC II, concebido para intercambio de datos, capaz de almacenar
información bibliográfica sobre toda clase de materiales.
Entre los principales Lenguajes Documentales que mayor uso tienen en bibliotecas y
centros de documentación, se encuentran las Listas de Encabezamientos de Materia, los
Sistemas de Clasificación, los sistemas de clave de autor, los Tesauros, las ontologías,
entre otros.
3
GIL URDICIAIN, Blanca. Manual de Lenguajes Documentales. -- Madrid : Noesis, 1996. – p. 18
4
1.4.1. LISTAS DE ENCABEZAMIENTOS DE MATERIA
Se caracterizan por ser un tipo de Lenguaje Documental que se manifiesta mediante una
lista alfabética de palabras o expresiones del lenguaje natural y que se estructura de tal
forma que pueda representar los temas específicos de los que trata un documento dado.
A su vez la lista está compuesta por encabezamientos de materia y subencabezamientos
de materia, así como por una serie de relaciones entre los encabezamientos y
subencabezamientos, tales como de Vease (V), Use por (UP), Véase además (VA). Es
posible además encontrar Listas de Encabezamientos de Materia, que presenten
relaciones semánticas similares a las que se dan en los tesauros. Por tanto, también
pueden aparecen las relaciones de USE, Use por, (UP), Término General (TG) , Término
Específico (TE), Término Relacionado(TR). Entre algunas de las listas de Encabezamientos
de materia más conocidas se pueden señalar, la LCSH (Library Congress Subjet Headings)
Lista de Encabezamientos de Materia de la Biblioteca del Congreso, que aparece en línea
en la actualidad. Lista de Encabezamientos de Materia de Sears, es más pequeña que la
de LCSH, y es muy útil para usar en Bibliotecas Escolares. La Lista de Encabezamientos de
Materia de la OEA (Carmen Rovira y Jorge Agüayo), La Lista de Encabezamientos de
Materia de Lemb, entre otras.
1.4.2. TESAUROS
4
GIL URDICIAIN, Blanca. Ibid. p. 183
5
El acto de clasificar consiste en el dicotómico proceso de distinguir cosas u objetos que
poseen cierta característica de aquellos que no la tienen, y agrupar en una clase cosas u
objetos que tienen una propiedad o característica en común”.5
1.4.4. ONTOLOGÍAS
Según Silvia Arano “Una ontología es una representación formal del conocimiento donde
los conceptos, las relaciones y las restricciones conceptuales son explicitadas mediante
formalismos en un determinado dominio. Su función más frecuente en la Lingüística es de
apoyo para sistemas de Traducción Automática Basada en el Conocimiento y para la
Terminografía (práctica de la Terminología). En ambos casos, la ontología es una
representación formal y explícita de la estructura conceptual del campo sobre el que se
trabaja. Este recurso lingüístico incluye como mecanismo de inferencia a la herencia, que
implica una economía en la codificación de la información: los conceptos superiores
transmiten sus características a los conceptos inferiores. Por consiguiente, la ontología es
uno de los módulos asociados a un sistema de conocimiento donde su función es la de
apoyo semántico para las unidades léxicas, es decir que las unidades léxicas son descritas
como objetos lingüísticos en una base de datos léxica y son relacionadas con una jerarquía
conceptual localizada en una ontología.”6
Por tanto las bases de conocimiento, ontologías o tesauros, se constituyen en una opción
avanzada de base de datos que no solo almacena, recupera y modifica enormes
cantidades de información, sino que además plasman elementos de conocimiento, así
como las formas en las cuales debe ser usado el mismo.
5
GIL URDICIAIN, Blanca. Ibid. p. 67
6
ARANO, Silvia . La ontología: una zona de interacción entre la Lingüística y la Documentación [en linea].
"Hipertext.net", núm. 2, 2003. <http://www.hipertext.net>
6
Según Arano, “La base de conocimiento utiliza al esquema de representación como
notación precisa para representar el conocimiento que contiene. El tipo de esquema de
representación de mayor difusión son las redes semánticas que estructuran sus datos en
nodos que simbolizan a los conceptos unidos por arcos que representan las relaciones
conceptuales. La red semántica también utiliza la herencia como método de inferencia,
donde los nodos inferiores heredan las características de los nodos superiores
permitiendo así una economía de codificación.”7
El catálogo en Línea Opac surge como fruto de la incorporación de las nuevas tecnologías
de la información y la comunicación en el escenario de las bibliotecas y centros de
documentación, aparece el Catálogo en Línea OPAC, como producto de la automatización
de las unidades de información y el proceso de desarrollo de las normas ISBD y el formato
MARC. Su aparición en escena se da en los Estados Unidos, en la década de los años 70,
en Europa a principios de los 80 y en América Latina a finales de la década de los años 80.
7
ARANO, Silvia. Ibid. [en línea]. “Hipertext.net”, núm. 2, 2003 <http://www.hipertext.net>
7
La evolución de los OPACS se ha producido debido a la evolución de la informática, por los
avances tecnológicos en las telecomunicaciones. Así, hace unos años las interfaces eran
aún muy toscas y se accedía a ellas mediante conexiones telnet, actualmente son más
amigables y se accede mediante conexiones web utilizando el protocolo http, la
realización de investigaciones que ponen de manifiesto los errores existentes o los
problemas que tienen los usuarios para realizar consultas, al tiempo que proponen
mejoras, las propias exigencias de los usuarios, cuando se les pide su opinión (a través de
entrevistas, encuestas…)
“Charles Hildreth (1989), señalaba, a finales de los años ochenta, tres característica de los
catálogos automatizados que en aquel momento parecían una novedad (aunque
actualmente puedan parecer casi una obviedad):
Por otra parte Hildreth establece una clasificación de los catálogos OPACS con base en su
desarrollo. Es así como define OPACS de 1ª, 2ª y 3ª generación.
8
GARCÍA LÓPEZ, Genaro Luis. Los sistemas automatizados de acceso a la información bibliográfica:
evaluación y tendencias en la era de Internet. Salamanca : Universidad, 2007. – p. 30-31
8
Al aparecer en Internet en las bibliotecas, estimula el incremento de su utilización, así
como el desarrollo de sus aplicaciones y servicios. Se caracterizan fundamentalmente por:
Estar diseñados para el entorno web, con formularios y estrategias de búsqueda abiertos.
Es así como a principios de la década de los años 90, se conforma en la IFLA el Grupo de
Estudio sobre “Requisitos Funcionales para Registros Bibliográficos” (FRBR) Functional
Requirements for Bibliographic Records e introducen nuevas propuestas de realizar la
descripción bibliográfica. Es así como se empiezan a gestar las normas de catalogación
RDA.
Las RDA (Resource Description and Access) Descripción y Acceso de Recursos, vienen a
reemplazar las Reglas de Catalogación Angloamericanas RCA2 debido a que en “los
últimos años las reglas RCA han recibido muchas críticas por la complejidad de su
estructura; por estar muy ligadas a los procedimientos y modelos establecidos para los
catálogos de fichas; por las dificultadas que presentan para describir los recursos
electrónicos y digitales; por la ausencia de ejemplos aplicables a los países de América
Latina; por su extensión y por ser poco amigables para quien no es un experto en el
tema.”9
Estas normas se relacionan directamente con los modelos conceptuales de FRBR, que
proveen al RDA de un marco conceptual que le permite abarcar los diferentes tipos de
9
MEJÍA, Gloria María Botero de. Tendencias en organización y tratamiento de la información. // En: IX
Congreso Nacional de Bibliotecología y Ciencias de la Información y XII Encuentro Nacional de Bibliotecas
Públicas. – Armenia, Quindío : [Ascolbi], 2007.
10
PÉREZ, Marina Estela. RDA – FRBR. De RCA2 A RDA: Descripción y acceso a los recursos. // En: VII
Encuentro de la Red Latinoamericana de Información Teológica -- Asunción, Paragüay : Instituto
Bíblico Asunción, 2008. -- 13 p.
9
contenido y soporte y ser lo suficientemente flexible para acomodar nuevas
características de los recursos. Estos modelos serían:
2.3. METADADOS
Según Filiberto Felipe Martínez Arellano del CUIB, UNAM, “Los metadatos han sido
definidos de diversas formas, desde las definiciones más simples: datos acerca de datos o
información acerca de información; o conjunto de elementos que pueden ser usados para
describir y representar objetos de información, los cuales también podrían ser aplicables a
la catalogación descriptiva, hasta otras en donde se toman en cuenta la naturaleza y las
características de los recursos de información electrónica. Los metadatos también han
sido definidos como datos asociados con objetos de información, los cuales permiten a sus
usuarios potenciales tener un conocimiento previo de sus existencia y/o sus características
(Dempsey y Heery). Datos que describen los atributos de un recurso de información y
apoyan su localización, identificación, evaluación y selección, entre otras funciones, las
cuales pueden ser llevadas a cabo por un usuario final o por sus agentes.”11
Los Descriptivos se definen como aquellos que otorgan la descripción para la localización e
identificación de los recursos de información. Como componentes de este tipo de
metadatos se pueden señalar : título, autor/creador, idioma, palabras claves, atributos
físicos, como mesdios, condición de las dimensiones.
11
MARTÍNEZ ARELLANO, Filiberto Felipe. Organización de la información: del catálogo a la web
semántica. // En: Memoria del XXVI Coloquio de Investigación Bibliotecológica y sobre la Información /
Filiberto Felipe Martínez Arellano, Juan José Calva González. – México : UNAM, CUIB, 2009. – p. 6
10
Los Administrativos, se constituyen en datos técnicos tales como tipo y modelo de
escáner, resolución, profundidad de bit, espacio de color, formato de archivo,
comprensión, fuente de luz, propietario, fecha de registro de derecho de autor,
limitaciones en cuanto al copiado y distribución, información sobre licencia, actividades de
preservación, etc.
Con el advenimiento del Internet se generan nuevas formas de llevar a cabo diversas
dinámicas de la vida diaria, es el caso de las bibliotecas, escenarios en los cuales las
aplicaciones de Internet, se manifiestan en los procesos técnicos, los servicios que se
ofrecen, los sistemas de comunicación, entre otros. Para el caso específico de la
organización de la Información, en los procesos de catalogación y clasificación. Por tanto,
en Internet se logran encontrar fuentes de información acerca de diversos formatos
bibliográficos, sistemas de clasificación, tesauros, ontologías, listas de encabezamientos,
entre otras.
Por ejemplo, es ya común la consulta en línea de catálogos OPACS y que en muchos casos
forman parte de catálogos colectivos que contribuyen a la optimización del trabajo en
muchas unidades de información.
Otro aspecto que se ve muy beneficiado con la utilización del Internet en los procesos de
organización de la información, es la consulta y en algunas ocasiones descarga de registros
bibliográficos de catálogos de bibliotecas o centros de documentación similares, con lo
cual se contribuye además de la normalización, a la optimización del tiempo. Un ejemplo
de esta situación se puede observar en el protocolo Z39-50, que consiste en un protocolo
para la estandarización en la recuperación de la información a nivel electrónico. REBECA,
es una red de la cual se pueden extraer registros de manera gratuita, para ser integrados
en catálogos automatizados de las bibliotecas que trabajen con el formato Ibermarc.
A continuación se dará una idea sobre algunas propuestas de software libre que se
ofrecen a través de Internet, según apreciaciones de Dante Ortiz Ancona de la Dirección
General de Bibliotecas de la Universidad Nacional Autónoma de México.
11
3.2. HERRAMIENTAS DE SOFTWARE LIBRE:
LUCENE : Es una interfaz para programas de aplicaciones que contiene un motor para
indexar, buscar y recuperar información tanto de registros como texto completo. Es sin
duda, dentro de su clase, el software con mayor respaldo en soporte, documentación y
desarrollo de proyectos. Aun cuando utiliza principalmente el idioma inglés, provee una
interfaz de programación que le permite incorporar, con gran facilidad, otros idiomas. Fue
desarrollado en el lenguaje de programación Java, esto le ha permitido una gran
portabilidad para funcionar en cualquier sistema operativo y arquitectura de cómputo, así
como una gran interoperabilidad con otros sistemas computacionales. No utiliza un
sistema de metadatos descriptivo, sin embargo, resulta bastante simple adaptarse a
cualquier sistema de metadatos.
A su vez esta interfaz utiliza por defecto un analizador lexicográfico, para texto en idioma
inglés, eliminando del vocabulario palabras sin importancia en búsqueda de información
(stopwords) tales como artículos, preposiciones, verbos comunes (is, have, get, etc.)
palabras acerca de la estructura del texto, etc. El analizador sintáctico permite que un
usuario o programador especifique un archivo que contenga esta lista de palabras dando
la posibilidad de aumentar o disminuir el diccionario de palabras sin importancia.
Aun cuando el motor de Lucene fue desarrollado para indexar, buscar y recuperar
información en texto plano. Se han desarrollado otras herramientas de software libre
tales como Zilverline, LIUS y Regain que tienen como núcleo a Lucene y que amplían su
funcionalidad al incorporar filtros que permiten transformar documentos de diferentes
formatos (word, powerpoint, excel, postscript, PDF, HTML, XML, etc.) a texto plano. Estas
herramientas proveen una interfaz de usuario vía web para administrar el índice,
incorporar documentos de texto, realizar búsquedas avanzadas (incorporando operadores
lógicos, de agrupamiento, de selección de campos, comodines, de proximidad y de rangos)
y recuperar información ya sea textual o descriptiva.
ZEBRA es una interfaz para programas de aplicaciones que contiene un motor para
indexar, buscar y recuperar información. Es una herramienta de propósito general y de
rendimiento alto, indexa texto estructurado, lee registros en una variedad de formatos de
entrada (correo electrónico, XML, MARC) proporcionando acceso a ellos a través de una
poderosa combinación de expresiones de búsquedas lógicas y de relevancia. Soporta
bases de datos grandes (decenas de millones de registros, decenas de gigabytes de datos)
12
permitiendo actualizaciones seguras en tiempo real. Soporta el protocolo estandarizado
Z39.30 para recuperación e intercambio de información.
Cuenta con un amplio respaldo en soporte, documentación y desarrollo. Fue desarrollado
en el lenguaje de programación C estándar, esto le ha permitido una gran portabilidad
para funcionar en cualquier sistema operativo y arquitectura de cómputo, así como
interoperabilidad con otros sistemas computacionales. Provee una interfaz en modo de
comandos para administrar el índice y para búsqueda y recuperación de información,
permitiendo realizar búsquedas avanzadas (incorporando operadores lógicos, de
agrupamiento, de selección de campos, comodines y proximidad).
FEDORA Es un software con una gran simplicidad, para instalar y usar, comparado con
otras herramientas de software similares. Tiene un fuerte respaldo en soporte,
documentación y está en constante desarrollo. Está programado en Java, esto le ha
13
permitido una gran portabilidad para funcionar en cualquier sistema operativo y
arquitectura de cómputo.
Lucene forma parte de su núcleo y utiliza sistemas de administración de bases de datos
como McKoi, MySQL, Postgres y Oracle para el almacenamiento de metadatos y
documentos digitales. Su sistema de metadatos es FOXML, Dublín Core y aparentemente,
puede configurarse para aceptar otro sistema de metadatos. Para el intercambio de
información usa el estándar OAI-PMH y Z39.50. Provee una interfaz de usuario que
permite administrar colecciones. Se han desarrollado otras herramientas para ampliar su
funcionalidad y definir niveles de acceso a la información y crear usuarios con diferentes
permisos para la administración, búsqueda y acceso a los recursos digitales. Ofrece un
conjunto de servicios web para proveer, a otros estrategias de preservación digital como
autenticidad, replicación y manejo de versiones.
GREENSTONE Es un software que ofrece una gran funcionalidad, tiene un fuerte respaldo
en soporte, documentación y está en constante desarrollo. Está programado en varios
lenguajes pero principalmente en C estándar y Perl, esto le ha permitido una gran
portabilidad para funcionar en cualquier sistema operativo y arquitectura de cómputo.
Managing Gigabytes y Zebra forman parte de su núcleo. Cuenta con un sistema de
administración de bases de datos propios (GDBM) para el almacenamiento de metadatos
y documentos digitales. Provee Dublín Core por defecto, pero tiene conectores con una
gran variedad de metadatos como MARC, XML, METS, CDS/ISIS, etc. Para el intercambio
de información usa el estándar OAI-PMH y Z39.50. Provee una interfaz de usuario, que
funciona en WEB, que permite administrar colecciones, definir niveles de acceso a la
información y crear usuarios con diferentes permisos para la administración, búsqueda y
acceso a los recursos digitales. Provee algunas estrategias par la preservación y
conservación digital tales como reformateo, rejuvenecimiento y replicación, incorporando
algunas herramientas de software para este fin.”12
12
ORTIZ ANCONA, Dante. Software libre en la representación, búsqueda, recuperación e intercambio de
información. // En: Memorias del I Simposio Internacional sobre Organización del Conocimiento:
bibliotecología y terminología / Catalina Naumis Peña. – México: UNAM, CUIB, 2009. – p. 422-430
14
4. CONCLUSIONES
15
5. BIBLIOGRAFIÍA
1. ARANO, Silvia.
La ontología: una zona de interacción entre la Lingüística y la Documentación
[en línea]. // En: Hipertext.net. – Barcelona. – Número 2 (2003). –
http://www.hipertext.net
2. BIRUM, John D.
Nacimiento y renacimiento de las ISBDS: proceso y procesimientos para crear y para
revisar las descripciones bibliográficas internacionales normalizadas // En: 16th IFLA
Council and general conference. – Jerusalén : IFLA, 2000.
7. MARCONDES, Carlos H.
Bibliotecas digitais: saberes e Práticas / Carlos H. Marcondes … [et al].
Salvador/Brasilia : UFBA/IBICT, 2006. – 336 p.
16
9. MEJÍA DE BOTERO, Gloria María
Tendencias en organización y tratamiento de la información // En: IX Congreso
Nacional de Bibliotecología y Ciencias de la Información y XII Encuentro Nacional de
Bibliotecas Públicas. – Armenia, Quindío ; [ASCOLBI], 2007.
17