Anda di halaman 1dari 59

na como directora de la

nitral de la Universidad
(Crdoba, Argentina),
su perodo la obtencin de
5n ISO 9001:2008 de los
biblioteca, otorgada por
as Certification. Es licenciatecologa y Documentacin.
adora de la red de Bibliotetadas de la Provincia de
lUC). Ha sido docente de
y Clasificacin en la Escueecologa de la Universidad
Crdoba en el perodo
-la participado como asesoDS proyectos de automatizalotecas. Ha dictado cursos
:in en la especialidad y
como ponente en diferentes
bibliotecarios.

=a como directora del


3ibliotecas de la Universide Crdoba (Argentina).
i Documentacin Digital,
i Informtica y licenciada en
ta y Documentacin. Es
la Licenciatura en Bibliote3 Universidad Nacional de
docente y miembro del
esinas de la Licenciatura en
ta, modalidad a distancia,
sidad Nacional del Litoral
rgentina). Ha dictado nume; de formacin docente y
ares relacionados con tecnouedas y recuperacin de
cientfica y acadmica. Es
proyectos de automatizacin
de tecnologas en bibliote-

> METADATOS PARA LA DESCRIPCIN


DE RECURSOS ELECTRNICOS EN LNEA:
ANLISIS Y COMPARACIN

Silvina Marcela Angelozzi


Sandra Gisela Martn

> METADATOS PARA LA DESCRIPCIN


DE RECURSOS ELECTRNICOS EN LNEA:
ANLISIS Y COMPARACIN

Alfagrama
Ediciones

Angelozzi, Silvina Marcela


Metadatos para la descripcin de recursos electrnicos en lnea : anlisis y
comparacin de metadatos / Silvina Marcela Angelozzi y Sandra Gisela Martn. ed. - Buenos Aires : Alfagrama, 2010.
117 p. ; 23x16 cm. - (Biblioteca Alfagrama)
ISBN 978-987-1305-55-1
1. Recursos Electrnicos. 2. Catalogacin. 3. Metadatos. 4. Lenguajes de
marcado. I. Martn, Sandra Gisela II. Ttulo III. Serie
CDD 025 302 85

NDICE

INTRODUCCIN

Alfagrama Ediciones S.R.L.


Bolvar 547 - 29- of. A
(Cio66AAK) Ciudad Autnoma de Buenos Aires
Tel. 434 2-2452
E-mail: libros@alfagrama.com.ar
www.alfagrama.com.ar

CAPTULO I.

Objetivos
Marco terico
Metodologa
Recursos electrnicos
Tipologa

12

CATALOGACIN DE LOS RECURSOS ELECTRNICOS

19

CAPTULO II. METADATOS

Correccin: Ernesto Gutirrez


Diseo de Tapa: Diego Soler

Funciones
Tipologa

8
9
14

15

23
25
27

Composicin Interior: DONAGH I MATULICH


CAPTULO III. NORMATIVAS INTERNACIONALES PARA LA DESCRIPCIN
La reproduccin total o parcial de este libro, en cualquier forma que sea, idntica o modificada, escrita a mquina, por el sistema "multigraph", mimegrafo, impreso por fotocopia, fotoduplicacin, etctera, no autorizada por los editores, viola derechos reservados. Cualquier utilizacin debe ser previamente solicitada.

1.1 edicin, 2010


Impreso en Argentina - Printed in Argentina
Queda hecho el depsito que previene la ley 11.723
2010 Alfagrama Ediciones S.R.L.

ISBN 978-987-1305-55-1

DE RECURSOS ELECTRNICOS

29

Estndares de contenido
AACR2R
ISBD

3o
3o

CAPTULO IV. ANLISIS DE LOS ESQUEMAS DE METADATOS

MARC 21/MARCXML
Dublin Core
MODS (Metadata Object Description Schema)
TEI (Text Encoding lnitiative)

32

35

37
45
6o
79

CAPTULO V.

LENGUAJES DE MARCADO

91

SGML
HTML
XML
RDF

91
92

CAPTULO VI. COMPARACIN DE LOS ESQUEMAS DE METADATOS

Estructura, contenido, sintaxis


Simplicidad, extensibilidad, flexibilidad
Interoperabilidad
CAPTULO VII. METADATOS Y RECUPERACIN DE LA INFORMACIN

Buscadores o motores de bsqueda


Metabuscadores (metasearch engines)
Directorios (web directories)

93
94
97

INTRODUCCIN
99
100
101
103
10 4
1o6
107

CONCLUSIONES

109

BIBLIOGRAFA CONSULTADA

113

La sociedad de la informacin y la globalizacin


conllevan a un cambio de paradigma en el campo de la organizacin del
conocimiento. La informacin electrnica presenta una arquitectura
hipertextual, no lineal y distribuida que plantea nuevos desafos al profesional bibliotecario.
Internet ha permitido el acceso remoto a los catlogos y a los instrumentos de descripcin, e incluso los propios fondos documentales de las
bibliotecas estn siendo digitalizados y puestos a disposicin de los usuarios a travs de este poderoso medio de comunicacin. Una eclosin de
diversos tipos de documentos va poblando Internet a un ritmo de crecimiento exponencial. Una consecuencia de ello es que cualquier catlogo de
biblioteca puede abastecerse de la gran cantidad de documentos que se
distribuyen por Internet, superando los fondos locales y abrindose al
inmenso espacio digital. Esto est claro en la teora, pero an muchas

METADATOS PARA LA DESCRIPCIN DE RECURSOS ELECTRNICOS EN LNEA

bibliotecas no catalogan fondos de Internet, aunque s ofrezcan un espacio


de consulta y un servicio de referencia virtual.
Como lo plantean Pinto Molina, Garca Marco y Agustn Lacruz (2002), si
bien no es una experiencia nueva el hecho de que una parte muy importante de los documentos de inters para los usuarios est fuera de la propia biblioteca, s es una situacin innovadora que comiencen a ser extraordinariamente accesibles. Ms adelante, estos autores, que sealan la facilidad con la que se pueden digitalizar los documentos textuales y audiovisuales, la transmisin instantnea a distancia, su simultaneidad de uso, su
utilizacin sin deterioro y la reduccin del espacio de almacenamiento,
ponen de manifiesto que con los documentos digitales han desaparecido
las limitaciones espaciales y temporales intrnsecas al resto de los documentos, lo que dispara de un modo espectacular sus posibilidades informativas. Por ello, la integracin de registros bibliogrficos de materiales
remotos se ha convertido en una creciente necesidad para la creacin y el
mantenimiento de los catlogos de las bibliotecas.
En este estudio se aborda el tema de los metadatos y las normativas
internacionales para la descripcin de recursos electrnicos de informacin
disponibles en lnea, analizando los problemas que comportan a nivel conceptual y de desarrollo de nuevas formas de estructurar la informacin.
Desde una perspectiva bibliotecolgica, se da preponderancia a la normalizacin y a las posibilidades de aplicacin de los desarrollos estudiados
para organizar la informacin accesible va Web.
La informacin digital difiere de la documentacin impresa en muchos
aspectos, por lo que se ha generado un debate en el mbito de los profesionales bibliotecarios con respecto a los mtodos tradicionales de
procesamiento de la informacin. En este trabajo se trata de responder
preguntas tales como: Qu son realmente los metadatos? Es un concepto realmente nuevo? Cul es la diferencia con la catalogacin tradicional? Para qu sirven? Qu normativas han surgido? Qu diferencias
y similitudes hay entre ellas?

Objetivos
Analizar similitudes y diferencias entre la catalogacin de materiales
tradicionales y de recursos de informacin en Internet.
Analizar diferentes esquemas de metadatos para la descripcin de
recursos electrnicos accesibles por Internet.

INTRODUCCIN

Comparar los esquemas analizados sobre la base de los criterios


establecidos.
Elaborar conclusiones en cuanto a los resultados de la comparacin
y en relacin con la recuperacin de informacin en la Web.

Marco terico
Los metadatos tienen un rol importante en el contexto del surgimiento de las bibliotecas digitales, ya que la organizacin
de la informacin disponible en las redes depende de la administracin
efectiva de ellos.
En este trabajo se entiende por metadatos, siguiendo a Taylor (2004), a
la descripcin codificada de un paquete de informacin cuyo propsito es
proporcionar un nivel intermedio a travs del cual se puede acceder a la
informacin por medio de lo que uno desea ver o buscar, sin tener que
investigar enormes cantidades de texto completo irrelevante.
Burnett, Bor Ng y Park (1999) sealan que los metadatos han sido abordados desde dos pticas:

la del control bibliogrfico, con origen y proponentes desde la bibliotecologa; y

la del procesamiento de datos, con origen y proponentes desde las


ciencias de la computacin.
A pesar de las diferencias, estos dos abordajes usan metadatos para
localizar, identificar, recuperar y administrar la informacin; y a medida que
avanza el desarrollo, estas dos corrientes se van acercando e integrando.
Eito Brum (2008) manifiesta que la proliferacin de los documentos
publicados en la Web hizo que la comunidad bibliotecaria aplicara tcnicas
similares a la catalogacin tradicional para la identificacin, localizacin y
posterior recuperacin de estos nuevos recursos.
Las bibliotecas tienen una larga tradicin en el desarrollo de sistemas de
informacin, y se concentran en organizar y proveer acceso a los documentos.
Para ello utilizan la descripcin bibliogrfica, el anlisis de contenido y la clasificacin, de modo que cada entidad de informacin pueda ser eficientemente descripta, identificada, localizada y recuperada. Mediante el establecimiento de una normativa especfica, han logrado implementar con xito complejos
sistemas documentales. As, la unidad bsica del catlogo, el registro bibliogrfico, representa unvocamente y describe de forma precisa un documento.

30

METADATOS PARA LA DESCRIPCIN DE RECURSOS ELECTRNICOS EN LNEA

La necesidad de intercambiar informacin entre instituciones a nivel


local, nacional e internacional ha hecho que se desarrollen normas y
procedimientos que aseguren la interoperabilidad de los sistemas de
informacin. Aunque no se resuelvan todos los requerimientos de la
organizacin de la informacin digital, las reglas que se vienen usando
sirven de base y tienen un impacto significativo.
Las ciencias de la computacin tambin tienen un largo camino recorrido en cuanto al procesamiento de datos y a la organizacin de la informacin. Hay numerosos sistemas computarizados de almacenamiento y recuperacin de informacin, tanto para datos textuales como relacionales, que
proveen seguridad, integridad y posibilidad de intercambio de datos, adems de las funciones tradicionales de localizacin, identificacin y recuperacin. Todo el avance logrado desde las ciencias de la computacin tambin tiene una fuerte influencia en el desarrollo de metadatos.
Desde la perspectiva del control bibliogrfico, se desarrollaron metadatos orientados a la catalogacin de los recursos de informacin en
Internet, como la utilizacin del formato MARC (MAchine Readable
Cataloguing) como estructura de metadatos y la formulacin de Dublin
Core. Esta corriente se focaliza en la descripcin e identificacin de los
objetos de informacin.
Desde la perspectiva de la computacin, se dio preponderancia a la
manipulacin de los datos para su uso, ms all de su mera descripcin, y
se inctuyeron datos de acceso, de autentificacin, administrativos, etc. Se
han desarrollado lenguajes de marcacin de textos como HTML (Hyper Text
Mark-up Language), XML (eXtensible Mark-up Language), SGML (Standard
Generalized Mark-up Language), Warwick Framework, y formatos como IAFA
(Internet Anonymous FTP Archives) y TEI (Text Encoding Initiative).
A pesar de que estas dos aproximaciones a los metadatos son diferentes, de ningn modo son excluyentes o incompatibles, ms bien son complementarias, y la solucin definitiva provendr de un estudio interdisciplinario, que integre tcnicas de una y otra.
Como seala Taylor (2004), entre los profesionales de la informacin
el concepto de metadatos puede aparecer complejo y confuso. Esto se
debe, en parte, a la naturaleza multifactica del tema. Es importante
recordar que el trmino metadatos puede significar diferentes cosas para
diferentes comunidades. Cuando un bibliotecario habla de metadatos,
tiene una nocin diferente de la que posee quien trabaja, por ejemplo,
con metadatos geoespaciales.
Dovey (1999) identifica tres corrientes principales a las que denomina escuelas: "la escuela de la catalogacin", "la escuela estructuralista" y "la es-

INTRODUCCIN

11

cuela de la estructura de datos". La primera incluye a los catalogadores que


proceden del mundo bibliotecario y que han estado generando metadatos
prcticamente desde que existen las bibliotecas; tambin aqu ubica a los informticos preocupados por generar estructuras que hagan la informacin ms
manejable, y dedicados a construir metadatos para catalogar. En esta lnea se
ubican los creadores de Dublin Core y RDF. La segunda, la escuela estructuralista, est constituida por los creadores de los lenguajes de marcado, cuyos
estndares y modelos estn basados en la estructura del texto, como por
ejemplo HTML o SGML. La tercera de estas escuelas, llamada de estructura de
datos, pone de relieve el problema de la separacin del contenido de la presentacin en los documentos electrnicos; esta corriente ve al XML como un
lenguaje universal para describir estructuras de datos, adecuado para el intercambio tanto de la estructura de las bases de datos como del contenido.
Tal como lo sealan Pinto Molina, Garca Marco y Agustn Lacruz (2002),
si algo caracteriza el momento actual es la superacin de la ecuacin tradicional "documento = texto verbal escrito". La aparicin de diferentes
soportes a lo largo del tiempo ha llevado a utilizar ciertos nuevos trminos
muy imprecisos como "materiales especiales", "nuevos documentos",
"documentos no textuales". El problema se complica aun ms con los documentos multimedia y virtuales. Una de las caractersticas de stos es que
integran los tipos anteriores, por ejemplo un multimedia interactivo contiene textos escritos, sonidos, imgenes y videos.
En la actualidad, cualquier documento se puede convertir a formato digital; as cuando se habla de documento digital o electrnico, se hace referencia al formato de codificacin utilizado para su almacenamiento y procesamiento ms que a la forma de presentacin de la informacin contenida
en l. Cuando se utiliza el trmino documento digital slo para aqullos distribuidos por Internet, se confunde formato y medio, ya que Internet es un
medio de comunicacin y dichos documentos preceden a Internet.
La utilizacin del trmino "recurso de informacin" es de procedencia
anglosajona donde se ha popularizado el trmino "information resources".
En este trabajo se lo utiliza, si bien puede objetrsele el ser poco especfico, porque supera, en cierto modo, la dificultad terminolgica ah no
resuelta en cuanto a la tipologa documental. Es importante destacar que
las ISBD(CF) (International Standard Bibliographic Description: Computer
Piles) se revisan en 1997, y se cambia la denominacin de "archivos de
ordenador" por "recursos electrnicos", dando origen a la ISBD(ER)
(International Standard Bibliographic Description: Electronic Resources).
Siguiendo esta lnea, otro concepto que se adopta en este trabajo es el
de "objeto de informacin", DLO (Document Like Object) segn su sigla en

12

METADATOS PARA LA DESCRIPCIN DE RECURSOS ELECTRNICOS EN LINEA

ingls. Tal como lo plantea Mndez Rodrguez (2002), una de las claves
principales de la teora de metadatos est en definir qu es un objeto de
datos o qu es un documento entendido como objeto. As, en un ambiente digital, se puede definir un DLO como un elemento o un grupo de elementos que constituyen una unidad informativa que una computadora
puede manejar, independientemente del formato del archivo y del tipo de
informacin que reflejen. Entendido as, en las pginas subsiguientes se utilizan trminos como recurso electrnico, documento electrnico, objeto
digital u objeto de informacin, para referirse a esta entidad.

INTRODUCCIN

13

Disciplina/mbito de aplicacin: considera quines estn usando activamente este formato y si ste est asociado con una disciplina acadmica o inters profesional en particular.

Facilidad de creacin de la descripcin: se refiere a la complejidad


de la creacin del registro, si se requieren habilidades especiales, si
estn diseados para que asigne los metadatos el autor, el editor o
los proveedores centralizados.

Contenido: incluye estructura, sintaxis y contenido.


Metodologa
El presente trabajo responde a un diseo bibliogrfico o investigacin documental. Tamayo y Tamayo (2000) definen la investigacin documental como "la que se realiza con base a la revisin de documentos, manuales, revistas, peridicos, actas cientficas, conclusiones de
simposios y seminarios y/o cualquier tipo de publicacin considerado como
fuente de informacin". El presente estudio se limita a aquellos proyectos
cuyos responsables son instituciones de reconocido prestigio en el campo
de la bibliotecologa, tales como la Library of Congress (LC) u Online
Computer Library Center (OCLC), a emprendimientos cooperativos interna-

cionales y de instituciones pioneras en redes digitales. As, los esquemas


de metadatos seleccionados para la comparacin son: MARC 21/MARCXML,
Dublin Core, MODS (Metadata Object Description Schema) y TEI (Text
Encoding Initiative).

Se realiz una bsqueda sobre el tema en libros y publicaciones


peridicas, y especialmente en Internet, ya que la mayor parte de la
informacin relevante y actualizada sobre la Web est en la misma Web.
Se analiz bibliografa publicada a partir de 1994, ao en el que el tema
de metadatos cobra fuerza en el mbito bibliotecolgico y llega hasta la
fecha de cierre de este trabajo, en diciembre de 2009. Para la descripcin de los elementos y caractersticas de los esquemas de metadatos se
utilizaron las fuentes primarias de informacin, es decir los sitios web
oficiales de cada iniciativa.
La grilla de comparacin se construy sobre la base de los criterios propuestos por Heery (1996), Dempsey y Heery (1998) y Taylor (2004), y qued
conformada de la siguiente manera:

Protocolos de Internet asociados: hace referencia a si los metadatos


son soportados por los protocolos de Internet existentes y si una
base de datos con dichos metadatos puede ser interrogada usando
los protocolos existentes.

Contribucin a la normalizacin internacional: considera la ratificacin del esquema de metadatos como norma internacional.

Interoperabilidad: se refiere a la compatibilidad de dos o ms sistemas de modo que puedan intercambiar datos e informacin y utilizar la informacin sin ninguna manipulacin especial.

Extensibilidad: tiene en cuenta la posibilidad de incluir mayor


nivel de detalle, si fuera necesario, mediante campos opcionales,
calificadores, etc.

Flexibilidad: se puede aplicar a dos aspectos: a la flexibilidad para


describir diferentes tipos de documentos y a la flexibilidad para
evolucionar de acuerdo con los cambios en las reglas de catalogacin y tecnologa.
A travs de este cotejo se pretende establecer cules son los metadatos

que se perfilan con mayor posibilidad de xito y difusin en el mbito de


la catalogacin de recursos en red.

14

METADATOS PARA LA DESCRIPCIN DE RECURSOS ELECTRNICOS EN LNEA

Recursos electrnicos
Lyons.(1997) define un objeto digital o recurso electrnico como un conjunto de bits arreglados en una secuencia, que contiene
datos que pueden ser interpretados, y que incluye un identificador nico.
Segn las Reglas de Catalogacin Angloamericanas (segunda edicin,
actualizacin 2003, AACR2R), un recurso electrnico es un documento codificado para ser manipulado con la computadora. Se los divide, por un lado,
en datos (informacin en la forma de nmeros, letras, grficos, imgenes y
sonido, o combinacin de cualesquiera de ellas) y programas (instrucciones
o rutinas para ejecutar ciertas tareas); y por otro, se distinguen entre los
de acceso local (con soporte fsico, disco, casete, disquete) y remoto (disponibles a travs de redes).

INTRODUCCIN

Administradores de sistemas: responsables del manejo informtico


de los archivos, de los programas de recuperacin de la informacin, de los equipos de computacin e interconexin de redes, servicios de respaldo y recuperacin, migracin de datos, establecimiento de cdigos de seguridad.
Bibliotecas: aisladas o en consorcios, encargadas de poner los
recursos de informacin a disposicin de su comunidad de usuarios, se mantienen archivos digitales in situ o se conectan a proveedores comerciales.
Archivos digitales: mantienen copias de los recursos electrnicos,
una a la que se permite el acceso y otra copia de resguardo, distinguiendo entre ambos roles: uso y preservacin.
Tipologa

Segn las normas de la Descripcin Bibliogrfica Internacional


Normalizada (ISBD); (edicin consolidada, 2007), los recursos electrnicos son materiales controlados por computadora, incluidos los que
requieran el uso de perifricos (por ejemplo un lector de CD-ROM), y
dichos recursos pueden ser o no utilizadoS- en un modo interactivo. Los
divide en: datos (informacin en la forma de nmeros, letras, grficos,
imgenes y sonido, o combinacin de cualesquiera de ellas) y programas
(instrucciones o rutinas par= Pjecutar ciertas tareas); pueden ser tambin
una combinacin de datos y programas (por ejemplo, un software educativo que contenga texto, grficos y programas).
Esta definicin se aplica a los recursos que estn disponibles e incluye
tambin aquellos de acceso remoto va telecomunicaciones. Sin embargo,
los juguetes programados, las calculadoras y otros objetos programados se
consideran fuera del alcance de la ISBD.
Una caracterstica interesante de destacar es la cantidad de actores
que intervienen en la produccin y conservacin de los recursos electrnicos (Lazinger, 2001):
Creadores: individuos o instituciones generadores de la informacin
contenida en ellos.
Editores: en el caso de recursos publicados que poseen los dere-

15

Segn Ede (1999) existen dos tipos de recursos


electrnicos:
en mano: soportes fsicos como disquetes, CD-ROM o cintas magnticas;
en lnea: cualquier objeto que se puede encontrar en la Web:
bases de datos, revistas electrnicas, pginas, listas de correo,
grupos de noticia, sitios ftp, etc.
En cambio, Hedstrom (1998), los divide en:
creados originalmente en forma digital y adquiridos a travs de compra, donacin o depsito legal; y
digitalizados a partir de documentos impresos, o manuscritos convertidos a formato electrnico.
Una diferencia entre ambas categoras es que los primeros son ms
amorfos, menos controlados bibliogrficamente.
Por su parte, Waters (1995), establece cinco categoras:
1. Origen y modo de distribucin:

chos y licencias.
Distribuidores: proveedores del acceso que no crean ni publican la
informacin, sino que slo la ponen a disposicin; no se incluyen
aqu las bibliotecas.

de propiedad personal (e-mail, notas, manuscritos, pre-impresos, etc.);


de propiedad corporativa (reportes de empresas, registros financieros, documentos de planificacin, etc.);

1.6

METADATOS PARA LA DESCRIPCIN DE RECURSOS ELECTRNICOS EN LINEA

emanados de editoriales (libros, revistas, grabaciones, filmes);


pertenecientes a bibliotecas, museos e instituciones educacionales.
2. Contexto:
fuentes secundarias (catlogos, ndices, directorios, etc.);
fuentes primarias (textos monogrficos, imgenes, grabaciones,
colecciones de datos).
3. Estructura de codificacin, formato y contenido:
codificados segn formatos normalizados (ASCII, TIFF, etc.);
con caractersticas de autodescripcin (SGML con DTD);
multimedia que incorporen varios formatos.
4. Cualidades dinmicas:
pueden ser revisados y actualizados, de modo que existen versiones o ediciones;
con cambios acumulativos o de manera interactiva, como por
r!.,,
mplo las contribuciones a listas de discusin;
variacin de los enlaces entre un objeto y otros.
5. Uso:
objetos que por falta de consulta son borrados, sin tener en consideracin una posible demanda futura.
A su vez, Law (1996) los agrupa en cuatro categoras:
1. Publicados comercialmente (libros y revistas electrnicos, bases de
datos, etc.). Este material es en general ms fcil de describir.
2. Documentos de trabajo (literatura gris, pre-impresos, pginas web
personales, etc.). Material difcil de controlar, no est asegurada su
permanencia o acceso.

INTRODUCCIN

17

3. Datos en bruto (estadsticas, producidos por los gobiernos y organizaciones no gubernamentales, tomados de satlites). Muchas veces
es informacin encriptada y puesta a disposicin slo de un grupo
selecto de usuarios bajo ciertos trminos.
4. Archivos cientficos (trabajos y correspondencia entre investigadores),
considerados muy importantes para el avance de una disciplina.

CAPTULO 1

CATALOGACIN DE LOS
RECURSOS ELECTRNICOS

A continuacin se presentan las caractersticas especiales de los recursos electrnicos, las cuales influyen a la hora de catalogarlos.
Wendler (200o) presenta las siguientes caractersticas:
Variabilidad en la presentacin: la apariencia y el orden del contenido no estn normalizados, y la presentacin depende muchas

veces del navegador.


Formas no familiares de publicacin: se asemejan a las publicaciones de hojas sueltas removibles; la nueva versin sustituye a la anterior y frecuentemente sin una numeracin o indicacin de que la ver-

Sin. ha cambiado.
Relaciones mal definidas de los materiales con otros soportes: un
subconjunto de las publicaciones electrnicas se deriva o est vinculado con documentos en otros soportes. No siempre es posible

20

METADATOS PARA LA DESCRIPCIN DE RECURSOS ELECTRNICOS EN LNEA

CAPTULO 1. CATALOGACIN DE LOS RECURSOS ELECTRNICOS

identificar el grado de coincidencia en cuanto al contenido o no


existe consenso con respecto a cmo expresar estas relaciones.
Mutabilidad: nada garantiza que un recurso en lnea permanezca
inalterado en el tiempo ni que su contenido no sea alterado sin previo aviso.
Movilidad: no se puede asegurar la permanencia de un documento
en el mismo sitio web.
Ausencia de un receptor fsico: la falta de un usuario convencional
elimina el punto clave sobre el cual la mayora de las bibliotecas ha
construido los procedimientos de mantenimiento del catlogo.
A todo lo anterior se puede agregar:
Gran variedad de recursos: en Internet hay gran cantidad de textos,
imgenes, sonidos, presentados en las ms variadas formas como
ser archivos, informes, listas de discusin, artculos de revistas,
directorios, libros electrnicos, pginas web, portales, etc.
Heery (1996) presenta adems dificultades relacionadas con las siguientes caractersticas:
Ubicacin: un registro de un catlogo en lnea de acceso pblico
(OPAC) de una biblioteca se refiere a ubicaciones dentro de dicha institucin. Los metadatos se refieren a ubicaciones remotas, por lo tanto
se requerirn datos asociados al tipo de acceso (ftp, http) y a las restricciones de acceso (clave requerida). Muchas veces un recurso puede
estar alojado en varios servidores (sitios espejo); en este sentido, los
metadatos se asemejan a un registro de catlogo colectivo.
Versiones diferentes: el mismo documento puede existir en diferentes formatos a la vez (p. ej.: Postscript, ASCII). Podra asemejarse a
las distintas ediciones de un impreso.

"Granu/aritr: o nivel de detalle, otra particularidad de los recursos


electrnicos en lnea es que bajo un mismo ttulo se pueden agrupar mltiples recursos. Ejemplo de esto son las suscripciones a texto
completo de un paquete de revistas, que plantea la alternativa de
catalogar individualmente cada ttulo o simplemente el conjunto de
ellos. Esto es simple cuando la cantidad de ttulos es pequea, pero
se complica mucho para aquellas bases de datos de texto completo

21

con miles y miles de revistas. El catalogador debe decidir a qu nivel


analizar un documento: se describe una base de datos o deben
incluirse los registros individuales?; en el caso de las pginas web en
varios niveles, por ejemplo, cada vnculo se describe por separado?,
es un documento o varios?
Beall (1997) agrega como caracterstica especial la "volatilidad" y la distingue en tres tipos: externa, referida al cambio de URL o desaparicin del
sitio completo; interna, relacionada con el mantenimiento de los enlaces
referidos en la pgina, y la intelectual, en cuanto a la actualizacin de contenidos. Seala que los sitios mantenidos por individuos tienen mayor
grado de volatilidad que aquellos asociados con instituciones.
Sintetizando lo expuesto, se presentan en el siguiente cuadro las principales diferencias de los recursos electrnicos en lnea con los libros, en
cuanto a catalogacin se refiere:
Libros

Recursos electrnicos en lnea

Presentacin esttica.

Variabilidad en la presentacin.

Responsables se identifican fcilmente (portada). Muchos responsables involucrados, no


siempre detallados cuando se presenta
el recurso.
Forma de publicacin normalizada.

Formas no familiares de publicacin.

Generalmente soporte original.

Relaciones mal definidas de los materiales


con otros soportes.

Contenido inmutable.

Mutabilidad.

Permanece en su ubicacin.

Movilidad.

Interaccin bibliotecario-usuario.

Ausencia de un receptor fsico identificable


(hombre o programa).

El cuadro anterior resume algunas de las razones por las cuales las
nuevas formas de publicacin alteran nuestros modelos establecidos para
el control bibliogrfico.
Las formas bsicas de las publicaciones electrnicas en lnea an no
son estables ni normalizadas, por lo cual describirlas resulta particularmente complejo. Los conceptos establecidos en las reglas de catalogacin, tales como la fuente principal de informacin (portada), son difciles de aplicar a estos documentos. Es necesario ampliar los modelos

22

METADATOS PARA LA DESCRIPCIN DE RECURSOS ELECTRNICOS EN LINEA

abstractos, las normativas y los procedimientos de la bibliotecologa,


para poder describir las publicaciones electrnicas.
Por estas razones es que han surgido opiniones diversas entre los
biblioteclogos con respecto a la catalogacin de los recursos en lnea. As,
hay quienes los consideran demasiado inestables como para ser efectivamente catalogados de la manera tradicional (Wendler, 2000; Mndez
Rodrguez, 2002); otros esperan que se desarrollen buscadores poderosos
y herramientas automticas de indizacin como para obviar la necesidad de
catlogos; y algunos, como Xu (1996) y Jul (1997), llegaron a la conclusin
de que a pesar de las numerosas dificultades que se encuentran al tratar
de catalogarlos, los recursos de informacin disponibles en Internet deben
ser catalogados como se viene haciendo con otros tipos de documentos
para que puedan ser recuperados y utilizados eficientemente,

CAPTULO

METADATOS

Existen diferentes definiciones sobre el trmino metadatos, siendo la ms sencilla y de aceptacin general: "datos sobre los datos".
A continuacin se presentan una serie de definiciones de diferentes autores.
Captan (1995) adopta la definicin "datos sobre datos" y considera
las fichas de los catlogos tradicionales como metadatos, ya que
poseen datos bibliogrficos: autor, ttulo, editorial, etc., que se refieren a otros documentos.
Xu (1997) sostiene que es un conjunto de elementos que pueden
ser usados para describir y representar objetos de informacin. En
esta definicin, Xu habla de objetos de informacin, independientemente del medio o soporte.
Younger (1997) entiende que los metadatos describen recursos,
indican dnde estn ubicados y qu se requiere para utilizarlos
exitosamente.

24
METADATOS PARA LA DESCRIPCIN DE RECURSOS ELECTRNICOS EN LNEA

CAPTULO II. METADATOS

En el marco del World Wide Web Consortium (W3 Consortium), se los


define como informacin sobre objetos de informacin en la Web,
que puede ser leda por computadora (Swick, 2002).

- Contenido: es el valor asignado a los elementos de metadatos.


- Codificacin: representa la sintaxis o estructura. Los metadatos
pueden ser codificados en diferentes sintaxis. Un esquema de
metadatos puede tener reglas de sintaxis que indican cmo deben
ser codificados sus elementos o puede no tener reglas, en cuyo
caso se denomina esquema con sintaxis independiente.

Dempsey y Heery (1998) los definen como datos que describen los
atributos de un recurso.
Tennant (1998) define los metadatos como "informacin estructurada sobre informacin", y destaca que la palabra clave es "estructurada", ya que una descripcin en texto libre no es suficiente; es necesario contar con ciertos elementos identificados formalmente y con
una codificacin para la especificacin de una sintaxis dada.

Milstead y Feldman (1999) consideran el registro bibliogrfico en s


como metadatos y no necesariamente necesitaran estar codificados.
Para Wendler (2000),
la definicin es: "informacin necesaria para
identificar, localizar; manejar y acceder a un recurso electrnico".
Gorman (2000)
diferencia lo lue son estndares de estructura de
los que prescriben el contenido del registro bibliogrfico. Para este
autor, los metadatos han sido diseados para responder a las
necesidades de:
a)
contar con una opcin para la catalogacin de los recursos electrnicos;
b)
encontrar una alternativa intermedia entre los altos costos de la
catalogacin "tradicional" y la simple bsqueda por palabra clave.
Para este autor no es necesario "inventar" algo nuevo ya que las tcnicas de descripcin bibliogrfica de la catalogacin tradicional cubren satisfactoriamente las necesidades de catalogacin de los recursos electrnicos en lnea, de acuerdo con las actualizaciones de las
ISBD y de las Reglas de Catalogacin Angloamericanas (AACR2R).
Taylor (2004)
introduce dos conceptos, el de contenido y el de codificacin, presentes ambos en la acepcin del uso comn del trmino
metadatos. Cuando slo hay contenido, se lo denomina registro
bibliogrfico; cuando hay slo codificacin, es identificado como una
"estructura". Para esta autora, metadatos es una descripcin codificada de un paquete de informacin.
El documento
Understanding metadata (NISO, 2004) define:
- Esquema de metadatos: es un conjunto de elementos de metadatos diseados para un objetivo especfico. El esquema define los
nombres de los elementos y la semntica. Opcionalmente puede
determinar reglas de cmo asignar el contenido.
- Semntica: constituye la definicin o el significado de cada uno de
los elementos.

25

En este trabajo se entiende por metadatos, siguiendo a Taylor (2004), la


descripcin codificada de un paquete de informacin como, por ejemplo, un
registro AACR2 codificado con MARC, un registro Dublin Core, etc. El propsito de los metadatos es proporcionar un nivel intermedio a travs del cual se
puede acceder a la informacin por medio de lo que uno desea ver o buscar;
sin tener que investigar enormes cantidades de texto completo irrelevante.

Funciones
Segn Dempsey y Heery (1998), a un usuario, persona o programa le interesara respecto de los recursos electrnicos:

Descubrir o saber de la existencia de stos.


Adems de una descripcin bsica (autor, ttulo, tema), conocer el origen, la integridad, la autenticidad y las relaciones con otros recursos.
Informarse acerca de los derechos de propiedad intelectual.
Saber acerca de las posibilidades de manipulacin, si se puede
extraer parte de l, qu herramientas son necesarias para ello, qu
equipamiento mnimo se requiere.
Conocer bajo qu condiciones se puede utilizar, si es necesario pagar
o es de libre acceso, si est restringido a personas de una institucin, si se solicita clave de acceso.
Saber qu interfaces tcnicas, qu protocolos de acceso se utilizan,
qu tipo de bsquedas soporta, cules son los formatos de salida.
Los metadatos pretenden que toda la informacin sobre los datos est
disponible en lnea, as las funciones bsicas son:
1. Describir un recurso de informacin (identificacin).
2. Brindar puntos de acceso (recuperacin).
3. Codificar la descripcin para que sea recuperada automticamente
por los buscadores (localizacin y acceso).

26

METADATOS PARA LA DESCRIPCIN DE RECURSOS ELECTRNICOS EN LINEA

Como puede apreciarse, las funciones anteriormente citadas coinciden


con las de la catalogacin tradicional.
A estas funciones se agregan (Lagoze, 1996):
1. Proveer trminos y condiciones para el uso de dicha informacin.
2. Presentar datos administrativos.
3. Establecer vnculos y relaciones (por ejemplo, de un artculo con la
revista que lo contiene, entre un documento y su traduccin, entre
los componentes de un multimedios).
4. Dar datos estructurales y tcnicos.
5. Facilitar la interoperabilidad de sistemas para el intercambio de
informacin.
6. Brindar datos sobre la historia o procedencia, como su fuente original y transformaciones subsiguientes.
Las funciones enumeradas estn referidas a la administracin y el uso
de los recursos de informacin.
Para lanella y Waugh (1997), los metadatos cumplen la funcin de:
Resumir el significado (es decir, sobre qu tratan los datos).
Permitir la bsqueda.
Ayudar a los usuarios a determinar si la informacin es la que
mente buscan.
Prevenir que ciertos usuarios (ej.: nios) accedan a contenidos
no permitidos.
Recuperar y poder usar una copia del recurso.
Instruir sobre cmo interpretar los datos (p. ej.: formato, codificacin, encriptacin).
Ayudar a decidir qu formato escoger, en el caso que se presenten varios.
Presentar informacin sobre el uso, como condiciones legales,
tamao, fecha original.
Informar sobre la historia, como ser la fuente original y las transformaciones subsiguientes.
Dar datos para contactarse con los propietarios.
Indicar relaciones con otros recursos (como ser vnculos a versiones
anteriores o posteriores, documentos derivados, programas que se
requieren para su utilizacin).

Proveer informacin sobre la administracin de los datos (p. ej.:


requerimientos para su archivo).

CAPTULO II. METADATOS

27

En sntesis, a partir de lo expuesto por Dempsey y Heery (1998), Lagoze


(1996), lannella y Waugh (1997), y como se desprende de la definicin de
Taylor (2004) anteriormente citada, es posible afirmar que las funciones primarias de los metadatos son facilitar la identificacin, ubicacin, recuperacin, manipulacin y uso de recursos de informacin accesibles en lnea.

Tipologa
De acuerdo a la naturaleza de los datos que describen, existen tres tipos de metadatos (Lazinger, 2001):
1. Descriptivos: informacin bibliogrfica.
2. Estructurales: referidos a formatos y estructuras.
3. Administrativos: incluye permisos, copyright y toda informacin
relacionada con el acceso.
Weibel (1997) distingue tres modelos para la creacin y el uso de
los metadatos:
1. Modelo embebido (embedded model): los metadatos son formulados
por el creador del documento electrnico y la descripcin reside
incluida en ste. No se requiere de otro sistema adicional de organizacin. Esto es equivalente a la catalogacin en la fuente o catalogacin en publicacin (CIP).
2. Generados por terceros (third-party metadata): una agencia crea,
rene y administra los registros, pero stos no estn incluidos en el
recurso en s. Se generaran productos similares a las bases de datos
referenciales. Si bien el registro est separado del recurso, se le
puede agregar un vnculo para acceder directamente a l.
3. Visualizacin filtrada (the view-filter mode): una agencia administra
registros de metadatos, con diferentes estructuras, y los traduce en
una descripcin comn compartida por todos los usuarios. Tiene la
gran ventaja de proveer una interfaz nica de bsqueda.
De acuerdo con la riqueza de la descripcin y nivel de detalle, los metadatos pueden clasificarse en tres niveles (Dempsey & Heery, 1998):
Nivel 1: datos no estructurados; extrados automticamente de los documentos e indizados para la bsqueda.

28

METADATOS PARA LA DESCRIPCIN DE RECURSOS ELECTRNICOS EN LNEA

Nivel 2: estructurados, son relativamente nuevos y muchos han sido


diseados ad hoc
para su uso en Internet. En principio no estuvieron
normalizados, pero actualmente algunos estn surgiendo como normas, soportan bsquedas por campo y son relativamente fciles de
aplicar, estn pensados para que los incluya el autor del documento.
Por ejemplo: Dublin Core.
Nivel 3: ricos para la descripcin de documentos, diseados para ser
aplicados por profesionales de las ciencias de la informacin, son complejos y estn basados en normas internacionales. Su nivel de detalle
implica afta prestacin en la recuperacin y dificultad en su aplicacin.
Por ejemplo, el formato MARC.

CAPTULO

NORMATIVAS INTERNACIONALES
PARA LA DESCRIPCIN DE
RECURSOS ELECTRNICOS

Las reglas de descripcin bibliogrfica que prescriben el contenido de la catalogacin fueron desarrolladas mucho antes
que los estndares de codificacin y continan existiendo como normativas separadas.
Gorman (2000) y Taylor (2004) diferencian entre los estndares de contenido y los de estructura. Los primeros son reglas que indican qu datos deben
ser registrados para la identificacin del documento y en qu forma
deben registrarse. Los estndares de estructura son los que se conocen
como formatos; stos permiten el registro de los datos descriptivos de
manera codificada que puede ser leda e interpretada por la computadora.
Cuando se habla de metadatos, como seala Taylor (2004), es difcil
hacer esta divisin entre contenido y estructura, ya que la descripcin a
travs de metadatos tiene intrnsecamente asociada una codificacin. Un
registro de metadatos puede ser creado primero determinando el conte-

30
METADATOS PARA LA DESCRIPCIN DE RECURSOS ELECTRNICOS EN LNEA

nido descriptivo y luego codificndolo, o se puede comenzar con una


estructura de cdigos y rellenar luego con los datos cada campo. A su vez,
un mismo contenido puede ser codificado con estructuras diferentes, y
ciertos metadatos incluyen ambas especificaciones tanto para la codificacin como para el contenido.

Estndares de contenido
Los estndares para registro de los datos descriptivos que existen actualmente, probados por largo tiempo, perfeccionados y
utilizados ampliamente por las bibliotecas, son AACR2 e ISBD. Si bien no
es objetivo de este trabajo analizar con exhaustividad las reglas de catalogacin, a continuacin se presenta brevemente el modo en que tratan los
recursos electrnicos ambas normativas.

CAPTULO H. NORMATIVAS INTERNACIONALES PARA LA DESCRIPCIN...

31

Las reas que deben consignarse son:


Ttulo y mencin de responsabilidad (ttulo propio, designacin general del material, ttulo paralelo, subttulo, una o ms menciones de
responsabilidad).
Edicin (versin, tirada, actualizacin, nivel).
Publicacin, distribucin, etc. (lugar, editor, productor o distribuidor, fecha).
Descripcin fsica (soporte, caractersticas tcnicas, dimensiones).
Serie (ttulo de la serie, subserie, nmero de serie).
Notas.
rea de nmero normalizado y condiciones de disponibilidad.
En 2002, en las AACR2 el Captulo 12 cambia su denominacin de
"Publicaciones seriadas" a "Recursos Continuos" y se incorpora la categora de
recurso integrado (integrating resource) definido de la siguiente manera:

AACR2
En la actualidad se mantiene la segunda edicin
de las AACR, que fue revisada en el ao 2002,
y actualizada en los aos
2003, 2004 y zoos, con los cambios aprobados por el
loint Steering
Committee for Revision of AACR (ISC)
que, a su vez, cambi su propia
denominacin por
joint Steering Committee for Development of RDA
(jSC)
en abril de 2007. El JSC se encuentra trabajando en el nuevo cdigo de catalogacin "RDA: Resource Description and Access". Segn los
anuncios del JSC se implementar en junio de
2010. Para que el organismo se pueda concentrar en este trabajo la ltima actualizacin para las
AACR2 fue en 2005.
El Captulo 9 es el dedicado a recursos electrnicos. Las enmiendas del
ao 2001
de las AACR2 incluyen una revisin de las reglas para describirlos. Uno de los cambios es el reemplazo del trmino "archivo de computadora" por el trmino "recurso electrnico"; otro es la inclusin de la distincin entre recursos electrnicos de acceso directo y de acceso remoto.
En ese momento se realizaron los cambios para ajustar la descripcin a la
ISBD (ER). En 2004 se elimin el rea 3 (rea de tipo y extensin del recurso). Tambin se autoriz la aplicacin de trminos de uso comn para describir el soporte de recursos electrnicos de acceso directo, como por
ejemplo: CD-ROM, DVD-ROM. Se provey la opcin de registrar la extensin de los recursos de acceso remoto (por ejemplo,
1 texto electrnico)
en el rea de descripcin fsica.

"Un recurso integrado es aquel que se adiciona o se cambia mediante actualizaciones que no permanecen separadas y que se integran
para formar un todo. Los recursos integrados pueden ser finitos o
continuos" (AACR2, 2002).
Este concepto es aplicable a los recursos electrnicos dinmicos, como
son las bases de datos y los sitios web, por lo que en estos casos deber
consultarse tambin el Captulo 12 para su descripcin.
Las RDA estn pensadas para ayudar a las bibliotecas a progresar
hacia el entorno digital, apoyan el intercambio de metadatos entre las
comunidades que usan diferentes esquemas. Los usuarios podrn utilizar el contenido de RDA con muchos otros esquemas de codificacin (por
ejemplo, MODS Metadata Object Description Standard, MARC 21 o
Dublin Core). El cdigo RDA es adaptable y flexible, con el potencial de
poder ser utilizado por otras comunidades adems de las bibliotecas.
Provee un marco flexible para el contenido de la descripcin de recursos
digitales y a la vez sirve a las necesidades de organizacin de recursos
tradicionales de las bibliotecas, permite la descripcin de mltiples
aspectos de una obra dado que se utiliza el modelo conceptual FRBR
(Functional Requirements for Bibliographic Records). RDA ha identificado
y agregado elementos no incluidos en RCAA2, que se utilizan comnmente para la descripcin de recursos digitales.

32
METADATOS PARA LA DESCRIPCIN DE RECURSOS ELECTRNICOS EN LINEA
CAPITULO III. NORMATIVAS INTERNACIONALES PARA LA DESCRIPCIN...

33

580

Los recursos electrnicos en ISBD


(2007) son tratados de dos formas, dependiendo de si su acceso es directo o remoto.
Por acceso directo se entiende que hay un medio fsico que se puede
describir, por ejemplo, un disco, casete, cartucho, que debe ser insertado en una computadora o perifrico. Por acceso remoto se entiende que
no hay un medio fsico que manipular, sino que el acceso es slo a travs de un dispositivo de entrada-salida (por ejemplo, una
conectado a un sistema o red de computadoras, o utilizando recursos
almacenados en un disco duro.
De acuerdo a las ISBD, las reas de la descripcin que deben incluirse son:

Ttulo y mencin de responsabilidad (ttulo propio, designacin


general del material, ttulo paralelo, subttulo, una o ms menciones
de responsabilidad).

Edicin (versin, tirada, actualizacin, nivel).

Publicacin, produccin y distribucin (lugar, editor, productor o


distribuidor, fecha).

Descripcin fsica (soporte, caractersticas tcnicas, dimensiones). Se


aplica slo a recursos de acceso local, para los de acceso remoto no
se proveen este; datos.

Serie (ttulo de la serie, subserie, nmero de serie).


Notas.

Identificador del recurso y trminos de disponibilidad.


El rea de tipo y extensin de recurso (rea 3
ISBD(ER)
1997) ha sido eliminada para recursos electrnicos presente en
da de 2007.
en la edicinla consolidaEn tanto que como designacin general del material (DGM) se
adopta [Recurso electrnico].
En el rea de notas, incluye las siguientes notas especficas:

Requerimientos del sistema: caractersticas del equipo en cuanto a


hardware y software. Esta nota es obligatoria para recursos de acceso directo y precede a las dems.

Modo de acceso: protocolo requerido y ubicacin del recurso (URL,


servidor FTP, etc.). Esta nota es obligatoria para recursos de acceso remoto.

tem descripto: en el caso de acceso remoto debe registrarse siempre la fecha de consulta.
Identificador, por ejemplo DOI (Digital Object Identifler).
A partir de 2002, siguiendo los cambios de la AACR2, se incorpora tambin la categora de "recurso integrado", ciertos recursos electrnicos,
como por ejemplo las pginas web, se tratan como recursos integrados.

ANLISIS DE LOS ESQUEMAS


DE METADATOS

Los esquemas de metadatos que se analizan en este


trabajo se han seleccionado en funcin de ciertos criterios: que estn
actualmente en aplicacin, que hayan sido generados en forma cooperativa o por instituciones con trayectoria reconocida en la descripcin bibliogrfica, que posean una base bibliotecolgica, y con posibilidades de que
se sigan actualizando. Por lo tanto, los esquemas de metadatos que se
comparan en este trabajo son MARC 21/MARCXML, Dublin Core, MODS y TEI.
Para elaborar la grilla de comparacin se adoptaron los criterios que surgen de la adaptacin de los ya propuestos por Heery (1996), Dempsey &
Heery (1998) y Taylor (2004), como se expuso anteriormente. A continuacin de define su alcance.

1. Ao de origen.
2. Organismo creador.

36
METADATOS PARA LA DESCRIPCIN DE RECURSOS ELECTRNICOS EN LNEA
CAPTULO IV. ANLISIS DE LOS ESQUEMAS DE METADATOS

37

3. Mantenimiento:

se refiere especialmente al organismo encargado del


desarrollo, actualizacin y mantenimiento del esquema de metadatos.
4. Documentacin existente:
existencia de manuales, tutoriales, listas
de distribucin, etc.
5. Objetivos/misin:
la finalidad con que han sido creados.
6. Disciplina/mbito de aplicacin:
rea acadmica o grupo profesional
que utiliza el formato de metadatos.
7. Corriente terica a la que responden:
si proviene de la comunidad
bibliotecaria, informtica, de editores o proveedores.
8. Simplicidad/complejidad:
en cuanto a la facilidad de creacin del registro, si se requieren habilidades especiales, si estn diseados para que
asigne los metadatos el autor, el editor o los proveedores centralizados.
9. Interoperabilidad:
entendida segn la definicin del documento
Understanding metadata
(NISO, 2004) como la habilidad de sistemas
mltiples con diferentes plataformas de hardware y software, estructuras de datos e interfaces, para intercambiar datos con una mnima
prdida de contenido y funcionalidad.
lo. Extensibilidad:
posibilidad de incluir mayor nivel de detalle, si es
necesario, mediante campos opcionales, calificadores, etc.
11. Flexibilidad:
posibilidad de elegir los campos/elementos a incluir.
12.
Estructura: elementos o campos de la codificacin y caractersticas de stos.
a. Opcin:
si contiene campos/elementos que son opcionales y obligatorios.
b. Repeticin:
si admite campos y subcampos repetibles.
c. Subcampos:
admisin o no de subcampos.
d. Control:
posibilidad de controlar valores en algunos campos.
13. Contenido:
si prescriben cmo debe ser elaborada la descripcin
en cada campo o si se valen de normativas externas, como por
ejemplo AACR2.
14. Nivel de catalogacin permitida:

se refiere al nivel de detalle de catalogacin permitido, asociado a nivel de complejidad


1, 2 3, que va
desde los formatos simples, a los ricos o muy estructurados.
15. Actualizacin:
ltimas versiones o modificaciones disponibles.
16. Contribucin a la normalizacin internacional:
protocolos de Internet
asociados y clases de normas que incluyen, y si en s mismos se han
consolidado como normas de hecho o de derecho. Por normas de
hecho se entiende a las adoptadas por organismos o asociaciones
profesionales (IFLA, ALA, etc.) y por normas de derecho, a las adoptadas por organismos de normalizacin (ISO, AENOR, etc.).

17. Sintaxis: la sintaxis del esquema de metadatos que indica cmo


deben ser codificados sus elementos.
18. Resultados obtenidos hasta el presente: se refiere al grado de difusin del esquema de metadatos en cuanto a aplicaciones concretas.
A continuacin se presenta el anlisis de cada esquema de metadatos,
segn las categoras descriptas.

MARC 21/MARCXML
AO DE ORIGEN: MARC es un trmino genrico aplicado a una familia de
formatos MAchine Readable Cataloguing (Catalogacin legible por mquina).
MARC- 21, surgi en 1998 de la armonizacin de USMARC y CANMARC. En
2004, la British Library discontinu UKMARC y se sum a MARC 21.
La tarea de desarrollar un formato legible por computadora para los
registros del catlogo se inici en la Biblioteca del Congreso de Estados
Unidos a principios de 1965. La meta era desarrollar uno que empleara campos de longitud variable en un registro legible por mquina, que pudiera
emplearse para representar e intercambiar datos bibliogrficos entre sistemas automatizados. De esta forma se dise un sistema que fuera de
"comunicacin" y no slo un formato de procesamiento o almacenamiento.
La versin inicial de MARCXML apareci en 2002, como un marco para
trabajar con formato MARC en un ambiente XML. El objetivo era que fuese
flexible y extensible como para permitir a los usuarios trabajar con MARC
de acuerdo con sus propias necesidades.
ORGANISMO CREADOR: Library of Congress.
MANTENIMIENTO: a cargo de la Network Development and MARC
Standards Office, Library of Congress y la Standards and the Support Office,
Library and Archives Canada, que trabajan en permanente consulta con
varias comunidades de usuarios.
DOCUMENTACIN EXISTENTE: manuales en lnea en varios idiomas accesibles a travs de la Web de LC, tutoriales y listas de distribucin.
OBJETIVOS/MISIN: proveer un mecanismo mediante el cual las computadoras intercambien, usen e interpreten informacin bibliogrfica. Ha
cirin rincnrmlinrin inirinlmesnfn nono

rrsev;ri-rn

Irnctrttne

irrinrocnc

38

METADATOS PARA LA DESCRIPCIN DE RECURSOS ELECTRNICOS EN LNEA

especficamente obras monogrficas, y luego fue incorporando campos


para otro tipo de recursos: publicaciones seriadas, archivos de computadora, mapas, msica, registros sonoros, manuscritos, material audiovisual y recursos electrnicos.
Se ha definido una familia de formatos para albergar cinco tipos de datos:
bibliogrficos, existencias, autoridades, clasificacin e informacin comunitaria.
MARC ha sido diseado tambin para soportar funciones de despliegue
visual en pantalla y para la recuperacin de informacin.
DISCIPLINA/MBITO DE APLICACIN: se utiliza para describir documentos en distintos formatos y en todas las disciplinas, y es empleado especialmente por la comunidad bibliotecaria.
CORRIENTE TERICA A LA QUE RESPONDE: proviene de la comunidad
bibliotecaria; por lo tanto, es ampliamente utilizado en ese mbito. Se
puede decir que proviene de una corriente estructuralista.

SI MPLICIDAD/COMPLEJIDAD:

MARC es un formato complejo; para la creacin de un registro bibliogrfico completo se requiere personal especializado y capacitado, con conocimiento profundo de las reglas de catalogacin. Dada su complejidad, presenta un alto costo de descripcin

INTEROPERABILIDAD:
puede ser exportado a distintos formatos bibliogrficos y de metadatos.
MARC ha sido mapeado a los siguientes formatos:
MODS
Dublin Core
MARC Character Sets to UCS/Unicode
2
Digital Geospatial Metadata
Los siguientes metadatos han sido mapeados a MARC
MODS
Dublin Core
UNIMARC to MARC 21
ONIX (Online Information Exchange)
Digital Geospatial Metadata to MARC

21.

EXTENSIBILIDAD: permite incluir mayor nivel de detalle, si es necesario,


mediante campos opcionales, o el empleo de ciertos subcampos.

CAPTULO IV. ANLISIS DE LOS ESQUEMAS DE METADATOS

39

FLEXIBILIDAD: MARC tiene poca flexibilidad a la hora de elegir los campos


para una descripcin bibliogrfica. Hay campos obligatorios establecidos.
ESTRUCTURA: un registro MARC incluye tres elementos: la estructura, la
designacin del contenido y los datos bibliogrficos. A su vez, la estructura tiene tres componentes principales: una cabecera, con extensin fija, la
cual contiene elementos necesarios para procesar el registro; un directorio,
que Consiste de una serie de entradas que incluyen la etiqueta, su extensin y la posicin de inicio de cada una de ellas; y los campos variables,
los cuales conforman la mayor parte.
En MARC 21 Bibliogrfico existen campos de datos diseados para
incluir los nombres de las personas y organismos que crearon el documento o contribuyeron a su creacin, diferenciando entre autora personal y corporativa, as como entre punto de acceso principal y secundario
(campos 1XX y 7XX). Proporciona campos para mostrar y dar acceso a
varios ttulos relacionados con el documento (campos 240, 245, 246,
73o, 740). Tiene un campo para la informacin sobre la edicin (250),
uno para la publicacin (260) y otro para la descripcin fsica (300). La
informacin relacionada es codificada en los campos de serie (4XX y 8XX),
en los campos de enlace (76X-78X), igual que en algunos campos de
notas (5XX). Los campos o5X-o9X contienen nmeros de clasificacin o
informacin apropiada para la localizacin fsica de los documentos,
mientras que el campo 856 permite la localizacin y acceso a los recursos electrnicos disponibles en la Web.
Caractersticas generales de los campos:
a. Opcin: contiene campos que son opcionales y obligatorios.
b. Repeticin: en teora todos los campos y subcampos son repetibles,
pero la naturaleza de ciertos datos hace que determinados campos o
subcampos sean no repetibles como por ejemplo el campo upo (campo
no repetible) $a (subcampo no repetible) $c (subcampo repetible).
c. Subcampos: contiene numerosos subcampos.
d. Control: recomienda controlar valores en algunos campos, como
por ejemplo en el uso de vocabularios controlados y en el control de autoridades.
En el siguiente cuadro se presenta un esquema de los grupos de campos de
datos y luego se detalla el subconjunto especfico para recursos electrnicos.

40
METADATOS PARA LA DESCRIPCIN DE RECURSOS ELECTRNICOS EN LINEA
CAPITULO IV. ANLISIS DE LOS ESQUEMAS DE METADATOS

Etiquetas
00X
OXX

Datos que se registran


516 tipo de archivo o dato digital - Nota

Campos de control

1XX

100
110
130
240

506

856 acceso y localizacin electrnica

Campos de datos codificados


Punto acceso principal. Autor personal

Los tres primeros campos (256, 538, 516) se aplican tanto a archivos
digitales locales como remotos.

Punto acceso principal. Autor corporativo


Punto acceso principal. Conferencia

El campo 856 "Acceso y localizacin electrnica" fue desarrollado en

Punto acceso principal. Ttulo uniforme


Ttulo uniforme

1992 especialmente para los recursos electrnicos disponibles en la Web o


a travs de redes. En l se incluyen los siguientes datos (MARC 21 Concise
Bibliographic Format, 2009):

245

246

250

256

260

1E111
4XX

270

300

Ttulo propiamente dicho y mencin de responsabilidad


Variante del ttulo
Mencin de edicin

Indicadores:

Caractersticas del archivo de computadora


Lugar, editor, fecha
Primero

Direccin ostal, etc. del editor


Descripcin fsica

II

530

534
538
540
545
562

6XX

8XX

MEN
856

9XX

Mtodo de acceso
No definido

Notas

5 16

Correo electrnico

FTP

Nota de restriccin de acceso

Acceso remoto (Telnet)

Nota de tipo de archivo o dato digital

Lnea telefnica (Dial-up)

HTTP

Nota de audiencia, a quin va dirigido el material


Nota de otros soportes adicionales disponibles
Nota de versin original

Mtodo de acceso provisto en subcampo $2

Segundo

Relacin

Nota de requerimientos del sistema y modo de acceso


Nota que determinan el uso y la reproduccin
Nota de datos biogrficos o histricos
Nota de ndice acumulativo

No definido

Recurso (indica que se provee la localizacin del recurso como un todo)

Versin del recurso (el recurso que se cataloga no es el electrnico, pero posee
una versin electrnica indicada aqu)

Nota de identificacin de la copia y versin


Puntos de acceso por materia

Recurso relacionado (la localizacin que se provee no es el recurso en s, sino


uno relacionado)

No se despliega constante.

Puntos de acceso secundarios, autores, ttulos


Puntos de acceso secundarios de serie. Otros
Acceso y localizacin electrnica
Campos locales

Cdigos de subcampo:

)5

41

El formato MARC se ha actualizado para incluir caractersticas propias de


recursos electrnicos con los siguientes campos:
538 requerimientos del sistema y modo de acceso - Nota
256 caractersticas del archivo digital

$a

Nombre del servidor

$b

Nmero de acceso

$c

Informacin sobre compresin

$d

Ruta

$f

Nombre del archivo electrnico

$h

Clave del usuario solicitante

42

METADATOS PARA LA DESCRIPCIN DE RECURSOS ELECTRNICOS EN LNEA

Instrucciones de procesamiento
Bits por segundo
Clave de acceso (Password)
Clave de conexin (Logon, login)
Contacto para obtener ayuda
Localizacin del servidor indicado en el subcampo $a
Sistema operativo
Puerto
Tipo de formato electrnico
Configuracin
Tamao del archivo

CAPTULO IV. ANLISIS DE LOS ESQUEMAS DE METADATOS

43

formato completo, que incluye los datos esenciales necesarios para la


descripcin bibliogrfica de los documentos.
CONTRIBUCIN A LA NORMALIZACIN INTERNACIONAL: es estndar de
hecho para la representacin de registros bibliogrficos. La estructura de
los registros MARC es una implementacin de normativas nacionales e internacionales: Information lnterchange Format (ANSI Z39.2) y Format for
Information Exchange (ISO 2709) respectivamente.
MARC utiliza adems, los siguientes estndares:
ISO 2108: International Standard Book Numbering (ISBN) (ANSI/NISO
739.210

Emulacin de la terminal

ISO 3901: International Standard Recording Code (ISRC)


o 150 3297: International Standard Serial Number (ISSN) (ANSI/NISO Z39.9)

Identificador Uniforme de Recursos (URI)

ISO 10324: Holdings Statements - Summary Level (ANSI/NISO Z39.71)

Horario de acceso
Nmero de control del registro relacionado
Nota sobre acceso restringido
Link al texto

SINTAXIS: se puede codificar en distintas sintaxis como HTML y XML.


Ejemplo de un registro MARC codificado en XML tomado de:
http://www.loc.gov/standards/marcxml/Sandburg/sandburg.xml

Nota sobre acceso pblico


$2

Otro mtodo de acceso especificado en $2

$3
$6

Material o parte especfica


Neiacin

$8

Campos relacionados y secuencia numrica

CONTENIDO: MARC es en s un estndar de estructura. El contenido de


la mayora de los elementos est definido por normativas fuera del formato en s mismo, por ejemplo:

<?xml version="to" encoding="UTF-8" ?>


- <collection xmlns="http://www.10c.gov/MARC 21/slim">
<remrci>
<leader>01142cam 2200301 a 4500</leader>
<controlfield tag="001">92005291</controlfield>
<controlfield tag="003">DLC</controlfield>
<controlfield tag="005">19930521155141.9</controlfield>
<controlfield tag="oo8">920219s1993 caua j 000 o eng</controlfield>

Anglo-American Cataloguing Rules, Library of


Congress Subject Headings, National Library of Medicine Oassitication.

<datafield tag="010"

NIVEL DE CATALOGACIN PERMITIDA: no es necesario decir mucho acerca de la conveniencia de MARC para codificar datos descriptivos, ya que es
bien conocido el nivel de detalle que permite, ubicndose en Nivel
3
(Dempsey & Heery, 1998). Estn previstos dos niveles definidos para los

<datafield tag="020" indt="" ind2="">

Estados Unidos: un nivel mnimo y el nivel completo o nacional que contie-

<datafield tag="o40" incli="" ind2= >

ne la suficiente informacin catalogrfica para ser utilizada por agencias de


catalogacin tanto nacionales como internacionales.

<subfield code="a">DLC</subfield>

ind2="">

<subfield code="a">92005291</subfield>
</datafield>

ACTUALIZACIN: la ltima actualizacin publicada es de octubre del


2009. En 2008 se actualiz la versin MARC
21 Lite, un subconjunto del

<subfield code="a">0152038655 :</subfield>


<subfield code="c">$15.95</subfield>
</datafield>

<subfield code="c">DLC</subfield>
<subfield code="d">DLC</subfield>
</datafield>
<datafield tag="042" incli="" ind2="">

44
METADATOS PARA LA DESCRIPCIN DE RECURSOS ELECTRNICOS EN LNEA
CAPTULO IV. ANLISIS DE LOS ESQUEMAS DE METADATOS

<subfield code="a">lcac</subfield>
</datafield>

</datafield>

<datafield tag="o5o" indi="o" indz="o")

:<datafield tag="65o" inda="" ind2="o">

<subfield code="a">PS3537.A618</subfield>
<subfield code="b">A88 1993</subfield>
</datafield>

<subfield code="a">Arithmetic</subfield>
<subfield code="x">Juvenite poetry.</subfield>
</datafield>
- <datafield tag="65o" incli="" ind2="o">
<subfield code="a">Children's poetry, American.</subfield>
</datafield>
<datafield tag="65o" incli="" indz="1">
<subfield code="a">Arithmetic</subfield>
<subfield code="x">Poetry.</subfield>
</datafield>
<datafield tag="65o" incli="" indz="1">
<subfield code="a">American poetry.</subfield>
</datafield>
<datafield tag="65o" incli="" incl2="1">
<subfield code="a">Visual perception.</subfield>
</datafield>
<datafield tag="no" incli="1" indz="">
<subfield code="a">Rand, Ted,</subfield>
<subfield code="e">ill.</subfield>
</datafield>
</record>
</collection>

<datafield tag="o82" indi="o" indz="0">


<subfield cod e="a">811
/.52</subfield> <subfield code="2">2o</subfield>
</datafield>
<datafield tag="loo" incli="1" indz="">
<subfield code="a">Sandburg, Carl,</subfield>
<subfield code="d">1878-1967.</subfield>
</datafield>
<datafield tag="245" incli="1" indz="o")
<subfield code="a">Arithmetic Nsubfield>
<subfield code="c">Carl Sandburg ; illustrated as an anamorphic adventure
by Ted Rand.</subfield>
</datafield>
<datafield tag="25o" incii="" indz="")
<subfield code="a">ist ed.</subfield>
</datafield>
<datafield tag="26o"
indz="">
<subfield code="a">San Diego :</subfield>
<subfield code="b">Harcourt Brace Jovanovich,</subfield>
<subfield code="c">c1993</subfield>
</datafield>
<datafield tag="3oo" inda="" indz="">
<subfield code="a">1 v. (unpaged) :</subfield>
<subfield code="b">ill. (some col.) ;</subfield>
<subfield code="c">26 cm.</subfield>
</datafield>

45

RESULTADOS OBTENIDOS HASTA EL PRESENTE: el formato MARC, en


cuanto a recursos electrnicos, es utilizado por las bibliotecas que participan o participaron de los diferentes proyectos de OCLC, como Intercat y
CORC, actualmente absorbidos por el servicio Connexion que alimenta el
catlogo WorlCat y por aquellas bibliotecas que incluyen recursos Web en
sus catlogos basados en MARC.

<datafield tag="5oo" inda="" ind2="">


<subfield code="a">One Mylar sheet included in pocket.</subfield>
</datafield>

Dubln Core

<datafield tag="52o" inda="" indz="5


<subfield code="a")A poem about numbers and their characteristics.
eatures anamorphic, or distorted, drawings which can be restored to
ormal by viewing from a particular angle or by viewing the image's
!flection in the provided Mylar cone.</subfield>

AO DE ORIGEN: 1995.
Dublin Core es la forma abreviada para el Dublin Core Metadata Element
Set (DCMES). Nace en 1994 por idea de Stuart Weibel, un investigador de
OCLC. En 1995, se lleva a cabo una reunin de trabajo realizada en Dublin
(Ohio. Estados Unidos). en la cual participaron bibliotecarios. investigadores

46

METADATOS PARA LA DESCRIPCIN DE RECURSOS ELECTRNICOS EN LINEA

en bibliotecas digitales, expertos en computacin y lenguajes de marcado de


texto electrnico, y acordaron un conjunto de elementos o datos que deberan proveer los creadores de documentos electrnicos sobre stos.

ORGANISMO CREADOR: Online Computer Library Center


(OCLC) y
National Center for Supercomputing Applications (NCSA).
MANTENIMIENTO: The Dublin Core Metadata Initiative
(DCMI).
Desde 1995, ao en que naci el proyecto, han tenido lugar distintos
seminarios de trabajo y conferencias internacionales para llegar a acuerdos
sobre el Dublin Core.

DOCUMENTACIN EXISTENTE: manuales en lnea en el sitio vveb oficial


de Dublin Core, que rene toda la informacin sobre la iniciativa.

OBJETIVOS/MISIN: Dublin Core (DC) ha sido creado


ad hoc para la catalogacin de documentos electrnicos con el objetivo de definir un conjunto de elementos bsicos para que los propios autores puedan describir sus recursos web,
de modo que puedan ser recuperados por los motores de bsqueda de Internet.
Entre los propsitos tambin est definir el marco para la interoperabilidad entre
conjuntos de metadatos y apoyar el desarrollo de elementos especficos para
ciertas disciplinas. DC naci como una forma muy simple de generar metadatos.
De esto ri.z,liera a idea fue apartarse de las estrictas normas bibliotecolgicas y
permitir una catalogacin mucho ms sencilla para el pblico en general.

DISCIPLINA/MBITO DE APLICACIN:

se utiliza para describir documentos en cualquier mbito o materia. DC es aplicado por diferentes comunidades fuera de la bibliotecologa tales como la educativa, la gubernamental, la dedicada a los archivos, y la que se ocupa de los museos.

CORRIENTE TERICA A LA QUE RESPONDE:


la comunidad bibliotecaria e informtica.

CAPITULO IV. ANLISIS DE LOS ESQUEMAS DE METADATOS

INTEROPERABILIDAD: puede ser exportado a distintos formatos bibliogrficos y de metadatos.

EXTENSIBILIDAD: permite incluir mayor nivel de detalle, si es necesario,


mediante los calificadores.
FLEXIBILIDAD: nada en DC es obligatorio, todos los elementos son opcionales; as el usuario elige ajustar la descripcin de acuerdo con sus necesidades.
ESTRUCTURA: el estndar Dublin Core incluye dos niveles: simple y calificado. El nivel simple contiene los qince elementos bsicos y el nivel calificado incluye tres elementos adicionales (Audiencia, Procedencia y Administrador
de los derechos), as como un grupo de calificadores que refinan la semntica de los elementos. Utiliza etiquetas basadas en palabras y no numricas.
Caractersticas generales de los elementos:

a. Opcin: todos los elementos son opcionales.


b. Repeticin: todos los elementos son repetibles.
c. Sucampos: no posee subcampos pero s calificadores.
d. Control: no requiere control de valores en los elementos.
Los

15

elementos bsicos pueden reunirse en 9, grupos relacionados con:

El contenido.
La propiedad intelectual.
Los datos referidos al uso, instalacin y manipulacin.
En el siguiente cuadro se presentan los 15 elementos:
CONTENIDO

PROPIEDAD INTELECTUAL

INSTALACIN/
MANIPULACIN

Ttulo

Creador

Fecha

Materia

Editor

Tipo

Descripcin

Colaborador

Formato

Derechos

Identificador

proviene de la interaccin de

SIMPLICIDAD/COMPLEJIDAD:

en su origen es simple; son slo 15 elementos bsicos y est pensado para que el autor pueda incluir los metadatos al
momento de crear el documento. Existen dos corrientes: los
minimalistas, que
bogan por mantener el nivel de simplicidad, y los
estructuralistas, que proponen un mayor nivel de distincin y extensibilidad. De all que surjan las posturas de utilizar DC con calificadores o sin calificadores. No requiere de catalogadores expertos; y debido a su sencillez presenta una alta productividad.

47

Fuente .
Idioma
Relacin
Cobertura

48
METADATOS PARA LA DESCRIPCIN DE RECURSOS ELECTRNICOS EN LNEA

A continuacin se detallan los elementos de Dublin Core (ANSI/NISO


Standard Z39.85-2007) presentados de la siguiente forma: primero el nombre del elemento en espaol, entre parntesis la etiqueta utilizada para la
marcacin de documentos, y luego una breve explicacin del significado. En
la explicacin que se proporciona, el nombre de los elementos aparece en
espaol para su mejor comprensin, pero en el marcado de los documentos las etiquetas se utilizan siempre en ingls.
Elementos relacionados con el contenido:

CAPITULO IV. ANLISIS DE LOS ESQUEMAS DE METADATOS

49

Elementos relacionados con la propiedad intelectual:


Propiedad intelectual
Creador (Creator)

Entidad primaria responsable de la creacin del contenido del


recurso, puede ser una persona, una organizacin o un servicio. Se
registra el nombre del creador.

Editor (Publisher)

Nombre del responsable de que el recurso est disponible para su


consulta, puede ser una persona, una organizacin o un servicio.

Contenido
Ttulo (Ttle)
Materia (Subject)

Nombre dado al recurso.


Palabras clave, frases o cdigos de clasificacin que describan

Colaborador (Contributor) Nombre del responsable que ha hecho contribuciones al


contenido del recurso; puede ser una persona, una organizacin
o un servicio.
Derechos (Rights)

los temas; se sugiere la utilizacin de vocabularios controlados


y sistemas de clasificacin formales.
Descripcin (Description)
Fuente (Source)

Idioma (Language)

referidos al servicio que provee la informacin. Si no est


detallado en el recurso, no deben asentarse suposiciones.

Resumen del contenido del recurso (abstract),


tabla de contenido,
representacin grfica del contenido, resea de texto libre.
Referencia a otro recurso del cual se deriva o proviene, en su
totalidad o en parte.

Elementos relacionados con el uso y manipulacin:


Uso y manipulacin

Idioma en el que est expresado el contenido. Se recomienda


usar la normativa RFC 3066, la cual en conjunto con ISO 639

Fecha (Date)

Cobertura (Coverage)

Referencia a un recurso relacionado.

Fecha de un evento en el ciclo de vida del recurso; asociada con


la creacin, modificacin o disponibilidad del recurso. Se
recomienda codificar la fecha segn la Norma ISO 8601

define cdigos de dos y tres letras para los idiomas. Ejemplos:


"en " o "eng " para el ingls y "en-GB " para ingls del Reino Unido.
Relacin (Relation)

Informacin sobre derechos de uso y propiedad intelectual,

[W3CDTFI, en el formato aaaa-mm-dd.


Tipo (Type)

La naturaleza o gnero del recurso en cuanto a su contenido,

Cobertura del contenido intelectual del recurso; incluye

incluye trminos que describen categoras, funciones, gneros,

ubicacin espacial (lugar o coordenadas geogrficas), perodo


de tiempo (fecha o rango de fechas), o jurisdiccin (para
entidades administrativas). Se recomienda el uso de
vocabulario controlado, por ejemplo Thesaurus
of Geographic Names (TGN).

en relacin con el contenido. Se recomienda tomar la tipologa


de acuerdo a un vocabulario controlado, por ejemplo el DCMI
Type Vocabulary (DCT).
Para describir manifestaciones fsicas o digitales del recurso, se
recomienda usar el elemento "Formato".
Formato (Formar)

Manifestacin fsica o digital del recurso. Incluye tipo de medio


y tamao o duracin del recurso. Se utiliza para identificar el
software, hardware u otros requerimientos necesarios para la
visualizacin y manipulacin del recurso. Se recomienda utilizar
vocabulario controlado, por ejemplo la lista Internet Media
Types (MIME).

50

METADATOS PARA LA DESCRIPCIN DE RECURSOS ELECTRNICOS EN LNEA

Identificador (Identifier)

Referencia unvoca del recurso en un contexto dado.


Se recomienda utilizar un identificador formal, por ejemplo
Uniform Resource Identifier (URI), Uniform Resource Locator
(URL), Digital Object Identifier (001), e International Standard
Book Number (ISBN).

51

CAPTULO IV. ANLISIS DE LOS ESQUEMAS DE METADATOS

Elemento

Calificadores/Refinamiento
del elemento

Ttulo (Title)

Alternativo (Alternative)

Esquemas de
codificacin
del elemento

Creador (Creador)
Para el caso de Dublin Core Calificado se agregan los siguientes elementos:
Audiencia (Audience)

LCSH

Materia (Subject)

MeSH
CDD

A quines est dirigido el recurso. La audiencia puede ser

LCC

determinada por el creador o editor del recurso o por terceros.


(Provenance)

Datos de cualquier cambio en la propiedad y custodia del


recurso desde su creacin, que sea significativo en cuanto
a autenticidad, integridad o interpretacin.

Administrador de los derechos


(Rights Holder)

Organizacin o persona que posee o administra


los derechos del recurso.

CDU
Descripcin (Description)

Tabla de Contenidos Jable


of Contents)
Resumen (Abstract)

Editor (Publisher)
Colaborador (Contributor)
Fecha (Date)

Calificadores (qualifiers)
Hay dos grandes categoras de calificadores (Using Dublin Core. Dublin
Core Qualifiers, 2005):

1. Refinamiento de elementos bsicos:


cado de un elemento.

ayudan a la forma de expresar el contenido. Incluyen vocabularios


controlados, reglas de catalogacin, normas de codificacin, esquemas de clasificacin. Por ejemplo: codificar la fecha del siguiente
modo: "2 002.12.01".
En el siguiente cuadro se presenta un sumario de los calificadores de
acuerdo con el documento citado.

DCMI Period
W3C-DTF

Aparicin/Publicacin (Issued)
Modificado (Modified)
Fecha de aceptacin (Date Accepted)
Fecha de Copyright (Date Copyrighted)
Fecha de envo (Date Submitted)

hacen ms especfico el signifi-

2. Esquemas de codificacin:
identifican los cdigos normalizados que

Creado (Created)
Vlido (Valid)
Disponible (Available)

DCMI Type

Tipo (Type)

Vocabulary
Formato (Format)

Extensin (Extent)
Medio (Mdium)

IMT

Identificador
URI

(identilier)
Cita bibliogrfica
(Bibliographic Citation)
Fuente (Source)

URI

Idioma (Language)

ISO 639-2
RFC 3066

52
METADATOS PARA LA DESCRIPCIN DE RECURSOS ELECTRNICOS EN LINEA
CAPITULO IV. ANLISIS DE LOS ESQUEMAS DE METADATOS

53
Es versin de (Is Version Of)
Tiene versin (Has Version)

Elemento

Calificadores/
Refinamiento del
elemento

Significado

Ttulo

Alternativo

Cualquier forma alternativa


del ttulo utilizada como

Es reemplazado por (Is Replaced By)


Reemplaza a (Replaces)
Es requerido por (Is Reguired By)
Requiere (Requires)
Es parte de (/5 Part 00

(Alternative)

Esquemas de
codificacin
del elemento

sustituto del ttulo formal

Tiene parte (Has Part)

de un recurso. Puede incluir

Es referenciado por (Is Referenced By)


Referencia a (References)

abreviaturas y traducciones.
Materias

LCSH

Es formato de (/5 Format Of)


Tiene formato (Has Format)

Encabezamientos de
Materias de la Library
of Congress (EE.UU.).

Conforme a (Conforms Te)

MeSH

DCMI Point
ISO 3166

Encabezamientos de
materias de la

DCMI Box
TGN

DCMI Period
W3C-DTF

National Library of
Medicine (EE.UU.).
DDC
Clasificacin Decimal
de Dewey .
LCC

Derechos de acceso (Access Rights)


Licencia (License)
Mediador (Mediator)
Nivel educativo (Education Level)

Clasificacin de la
Library of Congress
(EE.UU.).
UDC

Administrador
de derechos
(Rights Holder)

Clasificacin Decimal
Universal.
Descripcin

A continuacin se detallan los calificadores sugeridos para cada elemento, presentados de la siguiente forma: bajo cada elemento el nombre de los
calificadores, entre parntesis la etiqueta utilizada y debajo una nota con
explicacin del significado. Para los casos en que se sugiere la aplicacin
de una normativa para el registro del contenido, se enumeran debajo del
calificador correspondiente.

Tabla de contenidos
(table of contents)
Abstract o resumen
(abstract)

Fecha

Creado (created)

Fecha de creacin del


recurso.

Especificacin de los

Fecha (o rango de

intervalo de tiempo

Vlido (valid)

DCMI Period
lmites de un

fechas) de la

establecidos por

validez de un recurso.

DCMI.
W3C-DTF

54
METADATOS PARA LA DESCRIPCIN DE RECURSOS ELECTRNICOS EN LNEA

CAPTULO IV. ANLISIS DE LOS ESQUEMAS DE METADATOS

Disponible
(available)

Fecha o rango de fechas


en las que el recurso

Reglas de codificacin
para fechas y tiempo

estuvo o estar disponible.

del W3C, basado en


la norma ISO 8601.

Aparicin o

Fecha de aparicin formal


publicacin (issued) (publicacin) del recurso.

55

Assigned Numbers
Authority).
Identificador

Cita bibliogrfica

Referencia

URI

del recurso

(Bibliographic

bibliogrfica del recurso.

Identificador

Citation)

uniforme del recurso


(Uniform Resource

Fecha en que un recurso

Identifier)

cambia o es actualizado.
Idioma

Fecha de aceptacin Fecha en que fue aceptado


(Date ACCIEV30119
el recurso (Por ejemplo:

ISO 639-2
Cdigos ISO
de idiomas.
RFC 4646

una tesis, un artculo


de revista).
Fecha de Copyright
(Date Copyrighted)

Fecha de la declaracin
de copyright.

Fecha de envo
(Date Submitted)

Fecha en que fue enviado


o presentado para

Etiquetas para la
identificacin de
idioma, RFC es el
nombre que da la
IETF (Internet
Engineering Task

consideracin un recurso

Force)a sus
especificaciones.

(por ejemplo: tesis, artculo


de revista).
Relacin

Tipo de
DCMI Type
Vocabulary

recurso

Es versin de:
(is version of)

Listado de tipos de
recursos utilizado

cambio de versin implica

recurso establecido
por DCMI.
Formato

Extensin (extent)

Medio (mediato)

El tamao o duracin
de un recurso.

un mero cambio de formato.


Tiene versin:
(has version)

Tiene otra versin, edicin


o adaptacin, que se
referencia aqu.

Es reemplazado por:

Es suplantado,

(is replaced by)


Soporte fsico o material
del recurso.

IMT (Internet
Media Type)
Cdigos para
diferentes tipos de
medios definidos por
IANA (Internet

URI
Identificador
uniforme del
recurso (Uniform

modificaciones significativas Resource Identifier).


del contenido, ms all que

para categorizar la
naturaleza o gnero
del contenido de un

Es una versin, edicin


o adaptacin del recurso
referenciado aqu. El

desplazado o actualizado por


el recurso referenciado aqu.

Reemplaza a:
(replaces)

Suplanta, desplaza o actualiza


al recurso que se
referencia aqu.

56
METADATOS PARA LA DESCRIPCIN DE RECURSOS ELECTRNICOS EN LINEA

Es requerido por:
required by)

CAPITULO IV. ANLISIS DE LOS ESQUEMAS DE METADATOS

Es requerido, ya sea fsica


o lgicamente, por el
recurso referenciado aqu.

geogrficas definido
por DCMI.
ISO 3166
Cdigo ISO para la
representacin de los
nombres de pases.
DCMI Box
Cdigo que identifica
una regin del
espacio utilizando
lmites geogrficos.
TG N
Tesauro Getty de
Nombres
Geogrficos.

Requiere: (requires) Requiere del recurso


referenciado aqu para
funcionar, para ser
distribuido o para completar
su contenido.
Es parte de:
(is pan of)

Tiene parte:
(has pan)

Es una parte fsica


o lgica del recurso
referenciado aqu.
Incluye el recurso
referenciado aqu.

Es referenciado por: Es citado, referenciado


o apuntado por otro que
se nombra aqu.

Temporal

(is referenced by)

Referencia a:
(references)

Es formato de:
(s format of)

Tiene formato:
(has format)

Cobertura

Tiene el mismo contenido


intelectual que el citado
aqu, slo que es presentado
en otro formato.

Caractersticas
temporales del contenido
intelectual del recurso.

Perodo DCMI
Cdigo para
especificar los lmites
de un intervalo
de tiempo.
W3C-DTF
Cdigo W3C para
fechas y tiempo,
basado en la norma
ISO 8601.

Es anterior al recurso
referenciado aqu, este ltimo
constituye otro formato con el
mismo contenido intelectual.

Conforme a:

Hace referencia a

(confonns to)

alguna normativa a la que


se ajusta el recurso.

Espacial (spatial)

(temporal)

Cita o apunta a
otro nombrado aqu.

57

Cobertura geogrfica del


contenido intelectual
del recurso.

CONTENIDO: no est regido por reglas de contenido, sino que se sugiere la


normativa a aplicar en algunos elementos, como se vio en el apartado anterior.
NIVEL DE CATALOGACIN PERMITIDA: sencilla, concisa. Se lo ubica en
un Nivel 2 (Dempsey & Heery, 1998).

Punto DCMI
(point DCMI)

Cdigo que identifica


un punto en el
espacio utilizando
rnni-don-4

ACTUALIZACIN: la ltima actualizacin es la Versin ti. En enero de


2008, se definieron dominios formales y rangos en las definiciones de las
propiedades, consignados en el documento "DCMI Metadata Terms", que es
ms abarcativo que el "Dublin Core Metadata Element Set, Version 1.1".

58
METADATOS PARA LA DESCRIPCIN DE RECURSOS ELECTRNICOS EN LNEA
CAPTULO IV. ANLISIS DE LOS ESQUEMAS DE METADATOS
59

CONTRIBUCIN A LA NORMALIZACIN INTERNACIONAL:


es norma de
derecho desde octubre de 2001
(ANSI/NISO Standard Z39.85-2001). Las versiones actualizadas son:

<TITLE> Ejemplos</TITLE>
ISO Standard 15836-2003 (Febrero 2003).http://ww
w
national SC n 515 paf

Litr
it

ANSI/NISO Standard Z39.85-2007 (Mayo 2007): The Dublin Core


Metadata Element Set, htt : vvww.niso.or standards resources Z
8_5:
292z2of

<HTML>
< HEA D>

IETF RFC 5013 of August 2007 [RK5213]

<META NAME="DC.Title" CONTENT=" Arithmetic


<META NAME="DC.Creator" CONTENT="Sandburg, Carl, 1878-1967.">
<META NAME="DC.Creator" CONTENT=" Rand, Ted, ill.">
<META NAME="DC.Publisher" CONTENT="San Diego :Harcourt Brace
Jovanovich, ">
<META NAME="DC.Date" CONTENT=" c1993.">
<META NAME="DC.Type" CONTENT="Texto">

SINTAXIS: posee independencia sintctica. DC se puede codificar en distintas sintaxis tales como HTML, XML o RDF.

<META NAME="DC.Format" CONTENT="text/html")


<META NAME="DC.Language" CONTENT=" eng">
<META NAME="DC.Description" CONTENT="A poem about numbers and

Ejemplo de un registro DC codificado en XML tomado de:


htt : www.loc.ov standards marcxml Sandbur sandburdc.xml
<?xml version="1.0" ?>
- <dc xmlns="http://purl.org/dc/elementsh..1/
">
eitle>Arithmetic /</title>
<creator>Sandburg, Carl,
1878-19674creator>
<cteator>Rand, Ted, ill.gcreator>
<type />
<publisher>San

their characteristics. Features anamorphic, or distorted, drawings which can


be restored to normal by viewing from a particular angle or by viewing the
image's reflection in the provided Mylar cone. >
<META NAME="DC.Subject" CONTENT="Arithmetic">
<META NAN1E="DC.Subject" CONTENT="Children's poetry, American.">
<META NAME="DC.Subject" CONTENT=" American poetry.">
<META NAME="DC.Subject" CONTENT=" Visual perception.">
</H EAD>
<BODY>

Diego :Harcourt Brace Jovanovich,</publisher>

<date>ci993.</date>

<l anguage>eng</language>
<description>A

poem about numbers and their characteristics. Features


anamorphic, or distorted, drawings which can be restored to normal by
viewing from a particular angle or by viewing the image's reflection in
the provided Mylar
cone.</description>
<description>One
Mylar sheet included in pocket.</description>
<su bject>Arithmetic</subject>

<subject>Children's
poetry, American.</subject>
<s ubject>Arithmeticgsubject>
<subject>American poetry.</subject>
<subject>Visual perception.</subject>
</d c>

</BODY>
</HTML>
Y por ltimo, el mismo ejemplo de un registro DC codificado en RDF:

<RDF xmins="http://www.w3.org/1999/02/22-rdf-syntax-ns# "


xmins:dc---"http://puri.org/dc/elements/tir>
<Description about="Aritmetic">
<dc:title>Arithmetic /</dc:title>
<dc:creator>Sandburg, Carl, 1878-1967.</dc:creator>
<dc:creator>Rand, Ted, ill.</dc:creator>
<dc:publisher>San Diego :Harcourt Brace Jovanovich,</dc:publisher>
<dc:date>c1993.</dc:date>
<dc:language>eng</dc:language>

Ejemplo del mismo registro DC ahora codificado en HTML:

<dc:description>A poem about numbers and their characteristics.

Features anamorphic, or distorted, drawings which can be restored to

6o
METADATOS PARA LA DESCRIPCIN DE RECURSOS ELECTRNICOS EN LNEA
CAPTULO IV. ANLISIS DE LOS ESQUEMAS DE METADATOS

normal by viewing from a particular angle or by viewing the image's


reflection in the provided Mylar
cone.</dc:description>
<dc: description>One
Mylar sheet included
in pocket.</dc:description>
<dc:sub ject>Arithmeticadc:subject>

<dc:subject>Children's poetry,
American.adc:subject>
<dc:sub ject>Arithmeticadc:subject>
<dc:subject>American poetry.adc:subject>
<dc:subject>Visual perception.adc:subject>

</Description>
</RDF>

Como formato SRU (Search/Retrieval via URL), protocolo para bsquedas en Internet basado en XML.
Como una extensin de METS (Metadata Encoding and Transmission

Standard).

Para representar metadatos para cosecha automtica de datos.


Para realizar descripciones originales de recursos en sintaxis XML.
Para representar un registro MARC simplificado en XML.
Para crear metadatos embebidos en XML en un recurso electrnico.

DISCIPLINA: utilizado para distintos propsitos pero fundamentalmente


para aplicaciones bibliotecarias.

RESULTADOS OBTENIDOS HASTA EL


PRESENTE: son muchos los proyectos en marcha basados en DC en diversas reas del conocimiento y se han
desarrollado numerosas aplicaciones informticas para la asignacin automtica de metadatos en DC. Como ejemplo se puede mencionar el proyecto CORC
(Cooperative Online Resource Catalog)
de OCLC. Se inici como
proyecto en 1998 y pas a ser un servicio OCLC en 1999. CORC impuls la
creacin de una base de datos de recursos web alimentada en forma cooperativa, con registros tanto en formato MARC como en Dublin Core, que
luego son almacenados en XML y enviados o exportados al usuario final,
tanto en formato MARC como en DC. Desde
2002
forma parte del servicio
integrado de catalogacin OCLC Connexion.

MODS (Metadata Object Description Schema)


AO DE ORIGEN:

61

2002.

ORGANISMO CREADOR: Library of Congress.

CORRIENTE TERICA A LA QUE RESPONDE: proviene de la comunidad


bibliotecaria.

SIMPLICIDAD/COMPLEJIDAD: se puede decir que MODS posee una complejidad intermedia. Es ms rico y complejo que DC. Es ms simple y ms
orientado al usuario que MARC.
INTEROPERABILIDAD: puede ser exportado a distintos formatos bibliogrficos y de metadatos al igual que MARC. Mapeos disponibles: MARCXML
a MODS; MODS a MARCXML; Dublin Core a MODS; MODS a Dublin Core y
entre las distintas versiones de MODS.

EXTENSIBILIDAD: permite extender la descripcin conectando con descripciones alojadas fuera del registro, por ejemplo un resumen (abstract)
disponible en otra direccin web.
FLEXIBILIDAD: la flexibilidad est dada al ser opcionales todos sus

MANTENIMIENTO:
Library of Congress. Network Development and MARC Standards Office,

elementos.

ESTRUCTURA: incluye un subconjunto de campos de MARC

DOCUMENTACIN EXISTENTE:
lista de distribucin.

sitio web oficial con manuales en lnea y

OBJETIVOS/MISIN: es un subconjunto de MARC

21

bibliogrfico, creado
)ara permitir la extraccin de datos de manera selectiva de los registros
VlARC 21
existentes y crear registros originales. MODS puede ser utilizado
:on los siguientes propsitos:

21 bibliogrfico. La mayora de los elementos de MODS tiene su equivalente en MARC


21 aunque tambin tiene incorporado otros especficos para la descripcin
de recursos digitales. Consta de 20 elementos principales, subelementos y

atributos que pueden ser usados en uno o ms elementos. Utiliza etiquetas basadas en palabras y no numricas.
Caractersticas de los elementos:
a. Opcin: todos los elementos y atributos son opcionales.

62

METADATOS PARA LA DESCRIPCIN DE RECURSOS ELECTRNICOS EN LNEA

CAPTULO IV. ANLISIS DE LOS ESQUEMAS DE METADATOS

b.
Repeticin: los elementos son repetibles y los atributos no repetibles.
c. Subcampos: contiene subelementos y atributos.
d. Control: en ciertos elementos el atributo
"authority" permite registrar
con qu herramienta se realiza el control del valor.
Se listan, a continuacin,
los elementos principales presentados de la
siguiente manera: el nombre
del elemento entre parntesis la etiqueta y
debajo una breve explicacin
de su significado. Luego, se listan los subelementos y atributos con sus
correspondientes etiquetas entre parntesis y
una breve nota aclaratoria en
los casos en que se considera necesaria.
amantes de ?vi
1. Informacin de ttulo (title/nfo)

Una palabra, frase, carcter o grupo de caracteres que normalmente aparecen en el recurso y le
dan nombre a ste o a la obra contenida en l.
Subelementos:

Ttulo (title)
Subttulo (subtitle)
Nmero de parte (partNumber)
Nombre de parte (partName)
Texto a ignorar para clasificacin (nonSor t )

Atributos:

Tipo (type): este atributo se aplica cuando es necesario para

identificar el tipo de ttulo que se registra:


abreviado (abbreviated)
traducido (translated)
alternativo (alternative)
uniforme (uniform)

63

Alfabeto (script) especifica el alfabeto utilizado en los elementos,

utilizando los cdigos de la norma ISO 15924 (Code for the


representation of names of scripts).
Transliteracin (transliteration): especifica la tcnica de

transliteracin utilizada en el elemento.


2. Nombre (name)

Nombre de una persona, organizacin o evento (conferencia, reunin) asociada con el recurso.
Subelementos:

Parte de nombre (namePart ): incluye cada parte del nombre que

desea describirse por separado.


Atributos
Tipo:
Fecha (Date)
Familia (Family)
Nombre de pila (Given)
Trminos de tratamiento (termsOfAddress): utilizado para
anotar ttulos, nmeros asociados con un nombre; por
ejemplo: Jr., II, etc.
Nombre no formateado (displayForm): es utilizado para indicar la

forma no estructurada del nombre, tal como aparece en el recurso.


Filiacin (affiliation) contiene el nombre de una organizacin,

institucin etc., con la cual la persona o entidad registrada en


<name> estuvo asociada al tiempo de la creacin del recurso. Puede
contener tambin otros elementos que son parte de la filiacin, tal
como direccin de mail, direccin postal, cargo, etc.
Rol (role): trmino que designa la relacin de la entidad registrada

en <name> con el recurso.

Autoridad (authority):

se refiere al nombre de la lista autorizada de


donde se toma un valor controlado que se registra.

Subelemento:

Etiqueta de visualizacin (displayLabeI):

Trmino de rol (roleTerm): contiene la forma textual o codificada

cuando se necesita
desplegar un texto adicional asociado con el ttulo.
Link externo (xlink). se utiliza para referenciar un link externo
al recurso.
ID (ID) - : se utiliza para establecer un link interno.
Idioma (lang):
se utiliza para especificar el idioma utilizado en el

elemento, aplicando los cdigos ISO 639-2/b.


Idioma en XML (xml:lang):

se utiliza para especificar el idioma


utilizado en el elemento, de acuerdo al estndar XML aplicando la
especificacin RFC 3066.

que designa el rol.


Atributos:
Tipo (type):
Texto (text): rol expresado en palabras.
Cdigo (code). rol expresado a travs de un cdigo.
Autoridad (authority)
Descripcin (description): puede ser usado para agregar una

descripcin textual para el nombre cuando sea necesario; por


ejemplo: para distinguirlo de otros nombres.

64

Atributos:

METADATOS PARA LA DESCRIPCIN DE RECURSOS ELECTRNICOS EN LNEA

CAPTULO IV. ANLISIS DE LOS ESQUEMAS DE METADATOS

ID (ID)
Link externo (xlink)

Atributos:

Idioma (lang)
Idioma en XML (xml.lang)
Alfabeto (script)

Idioma en XML (xml:lang)


Alfabeto (script)
Transliteracin (transliteration)

Personal (personal)
Corporativo (corporate)
Conferencia (conference)
Autoridad (authority)
3. Tipo de recurso (typeOfResource)

5. Informacin de origen (OriginInfo)


Informacin sobre el origen del recurso, incluye lugar de origen o publicacin, editor original y
fechas asociadas.
Subelementos:

Trmino que especifica el tipo general de contenido y caractersticas de un recurso.


texto (text)
material cartogrfico (cartographic)
msica impresa (notated music)

Tipo (type): se utiliza si se desea distinguir entre diferentes


aspectos del gnero, como clase, tipo de trabajo o estilo.
Autoridad (authority)
Idioma (lang)

Transliteracin (transliteration)
Tipo (type):

Valores utilizados:

Lugar (place): nombre de un lugar asociado con la publicacin,


tirada, fabricacin, produccin u origen del recurso.
Trmino de lugar (placeTerm): utilizado para consignar el lugar
en forma codificada o normalizada.
Atributos:

grabacin sonora musical (sound recording-musical)

Tipo (type)

grabacin sonora no musical (sound recording-nonmusical)


grabacin sonora (sound recording)
imagen fija (still image)
imagen en movimiento (moving image)
objeto tridimensional (three dimensional object)
software, multimedia (software, multimedia)
material mixto (mixed material)
Subelementos:

No posee.

Atributos:

Coleccin (collection=yes):

se utiliza cuando el recurso es una


coleccin de tems agrupados no publicados en conjunto
originalmente.
Manuscrito (manuscript=yes):
para tems escritos a mano
o tipeados.
Los atributos "coleccin" y "manuscrito" se utilizan asociados a un
valor en particular utilizado en "Tipo de recurso".

Cdigo (Code)
Texto (Text)
Autoridad (authority)
Cdigo pases MARC
(Marccountry)
iso3166
Editor (publisher): el nombre de la entidad que publica, imprime,
distribuye, emite o produce el recurso.
Fecha de emisin (datelssued): fecha en que el recurso
fue publicado o emitido.
Atributos:
Codificacin (encoding)
w3cdtf. fecha codificada segn patron AAAA-MM-DD.
iso3601: AAAAMMDD (se pueden agregar horas, minutos
y segundos).

4. Gnero (Gene)

mara fecha codificada segn campo 008/07-14.

Trmino que designa una categora que caracteriza un estilo, forma o contenido particular, por
ejemplo: artstico, musical, literario. Ms especfico que "Tipo de recurso".
Subelementos:

65

No posee.

Punto (point):
Inicio(Start) indica que es la primera fecha de un rango.
Fin lend% indica que es la ltima fecha de un rango.

66

METADATOS PARA LA DESCRIPCIN DE RECURSOS ELECTRNICOS EN LNEA

CAPTULO IV. ANLISIS DE LOS ESQUEMAS DE METADATOS

67

Otra fecha (dateOther)

Fecha clave (keyDate)


Yes: para distinguir una fecha entre otras.

Atributos:
Codificacin (encoding)
Punto (point)
Fecha clave (keyDate)
Calificador (qualifier)
Tipo (type)

Calificador (qualifier)
Aproximada (aproxmate) fecha aproximada.
Inferida (inferred): no tomada del recurso en s.
Cuestionable (cuestionable) fecha probable.
Fecha de creacin (dateCreated)

Edicin (edition): edicin o versin a la que pertenece el recurso.

Atributos:

Emisin (issuance): indica cmo es emitido en recurso.

Codificacin (encoding)
Punto (point)
Fecha clave (keyDate)
Calificador (qualifier)

Continuo (continuing)
Monogrfico (monographic)
Frecuencia (frequency)

Fecha de captura (dateCaptured)


Atributo:
Autoridad (authority)

Atributos:
Codificacin (encoding)
Punto (point)

Atributos:

Fecha vlida (datel'alid)


Atributos:
Codificacin (encoding)
Punto (point)
Fecha clave (keyDate)
Calificador (qualifier)
Fecha de modificacin (dateModified)
Atributos:
Codificacin (encoding)
Punto (point)
Fecha clave (keyDate)
Calificador (qualifier)

6.Idioma (language)
Subelementos:

Codificacin (encoding)
Punto (point)
Fecha clave (keyDate)
Calificador (qualifier)

Trmino de idioma (languageTerm)


Atributos:
Tipo (type)
text: para expresar el idioma con palabras.
Code: para expresar el idioma codificado.
Autoridad (authority)
iso639-2b-- cdigo de idiomas ISO 639-2.
rfc3066 cdigo de idiomas RFC3066.

Atributos:

Fecha de copyright (copyrightDate)


Atributos:

Idioma (lang)
Idioma en XML (xml:Iang)
Alfabeto (script)
Transliteracin (transliferation)

Fecha clave (keyDate)


Calificador (qualifier)

Parte del objeto (objectPart): indica a qu parte del objeto


aplica el idioma consignado.

7.Descripcin fsica (physicalDescription)


Subelementos:

Forma (farm): designacin de una presentacin fsica en particular


del recurso.
Atributos:

fl
68

METADATOS PARA LA DESCRIPCIN DE RECURSOS ELECTRNICOS EN LNEA

Autoridad (authority)
Tipo (type)(Ejemplos: material, tcnica)

CAPITULO IV. ANLISIS DE LOS ESQUEMAS DE METADATOS

_
8.Resumen (abstract)
Subelementos:

No posee.

Atributos:

Link externo (xlink)


Idioma (lang)

Cualidades de reformateo (reformattingOuality): un trmino


que indica una evaluacin general de las cualidades fsicas de un
recurso electrnico en relacin con el uso que se pretenda dar.
Acceso (access): el recurso provee acceso
al tem original.
Preservacin (preservation): es un recurso creado va

Alfabeto (script)
Transliteracin (transliteration)
Etiqueta de visualizacin (displayLabel)

reformateo para preservacin del original.


Respaldo (replacement): el recurso es de calidad
suficiente para server como respaldo si el original se
pierde, se daa o se destruye.

Tipo de medio (internetMediaType): identificacin del tipo de


formato electrnico.

Tipo (type)
9.Tabla de contenidos (tableOfContents)
Subelementos:

No posee

Atributos:

Link externo (xlink)


Idioma (lang)
Idioma en XML (xml:lang)

Extensin (extent)

Alfabeto (script)
Origen digital (digitalOrigin):
Nacido digital (boro digital).
Digitalizado (reformatted digital). digitalizado a partir de
un original no digital.
Microfilm digitalizado (digitized microfilm): digitalizado a
partir de una microforma.
Digitalizado de otra forma no digital (digitized other
analog): ej. de una fotocopia.

Transliteracin (transliteration)
Etiqueta de visualizacin (dispalyLabel)
Tipo (type):
Ej. Contenido incompleto, contenido parcial.

10.Audiencia (targetAudience)
Subelementos:

No posee.

Atributos:

Idioma (lang)
Idioma en XML (xml:lang)
Alfabeto (script)

Nota(note): informacin adicional en forma de texto sobre


descripcin fsica.

.
Atributos:
Link externo (xlink)
Idioma (lang)
Idioma en XML (xml:lang)
Alfabeto (script)
Transliteracin (transliteration)
Etiqueta de visualizacin (dispalyLabel)
Tipo (type):
Atributos:

Transliteracin (transliteration)
Autoridad (authority): se sugiere Lista MARC 21 de audiencia.

11.Nota (note)
Subelementos:

No posee.

Atributos:

ID (ID)
Link externo (xlink)
Idioma (lang)
Idioma en XML (xml:Iang)

Idioma (lang)
Idioma en XML (xmi:Iang)
Alfabeto (script)

Alfabeto (script)

Transliteracin (transliteration)

Etiqueta de visualizacin (displayLabel)

Transliteracin (transliteration)

69

70

METADATOS PARA LA DESCRIPCIN DE RECURSOS ELECTRNICOS EN LNEA

CAPTULO IV. ANLISIS DE LOS ESQUEMAS DE METADATOS

71

Profesin u ocupacin (occupation)

Tipo (type): la mayora de las notas implementadas coinciden con

Si el contenido del recurso est relacionado con alguna

las de MARC 21.

profesin u ocupacin, no se utiliza para la ocupacin de


12. Materia (subject)

Subelementos:

los creadores del recurso.


Tpico (topic)

Atributos:

ID (ID)

Geogrfico (geographic)

Link externo (xlink)

Temporal (temporal)

Idioma (lang)

Atributos:

Idioma en XML (xml:lang)

Codificacin (encoding)

Alfabeto (script)

Punto (point)

Transliteracin (transliteration)

Fecha clave (keyDate)

Autoridad (authority): de acuerdo a cdigos de encabezamientos

Calificador (qualifier)

de materias mantenidos por MARC.

Ttulo (titlelnfo)
Nombre (neme)
Cdigo geogrfico (geographicCode)

Atributo:

13.Clasificacin (classification)

Subelementos:

No posee.

Atributos:

Idioma (lang)

Autoridad (authority)

Idioma en XML (xml:lang)

Cdigo pases MARC (Marccountry)

Alfabeto (script)

iso3166

Transliteracin (transliteration)

Gnero (genre)

Autoridad (authority): de acuerdo a cdigos de esquemas de

Jerarqua geogrfica (hiera rchicalGeographic)

Continente (continent)

clasificacin mantenidos por MARC.


Edicin (edition): edicin del esquema de clasificacin utilizado.

Pas (country)

Etiqueta de visualizacin (displayLabel)

Provincia (province)
Regin (region)

14.'tem relacionado (relatedltem)

Estado (state)

Informacin que identifica otro recurso relacionado con el que se est describiendo.

Territorio (territory)

Subelementos:

Condado, distrito (county)

Cualquier elemento de MODS puede ser tomado como

subelemento.

Ciudad (city)
Isla (island)
rea (area)
rea extraterreste (extraterrestrialArea)
Seccin de ciudad (citySection)

Atributos:

ID (ID)
Link externo (xlink)
Etiqueta de visualizacin (displayLabel)
Tipo (type): describe la relacin del recurso relacionado con el que

se est describiendo.
Valores:

Datos cartogrficos (cartographics)

Escala (scale)

Precedente (preceding)
Continuacin (succeeding)

Proyeccin (projection)

Original (original)

Coordenadas (coordinates)

Anfitrin (host)

72
METADATOS PARA LA DESCRIPCIN DE RECURSOS ELECTRNICOS EN LINEA
CAPITULO IV. ANLISIS DE LOS ESQUEMAS DE METADATOS

Componente (constituent)
Serie (series)
Otra versin (otherVersion)

Idioma (lang)
Idioma en XML (xml:lang)
Alfabeto (script)
Transliteracin (transliteration)
Etiqueta de visualizacin (displayLabel)

Otro formato (otherFormat)


Es referenciado por (isReferencedBy)
15. Identificador (identifier)

Autoridad (authority): si se utilizan


cdigos, pueden utilizarse los listados de

Atributos:

organizaciones mantenidos por MARC.


Tipo (type): utilizado para distinguir entre

Idioma (lang)
Idioma en XML (xml:lang)
Alfabeto (script)

diferentes tipos de ubicaciones, por


ejemplo: actual, anterior, de creacin.

Transliteracin (transliteration)
Tipo (type)
Valores sugeridos:
doi (Digital Objects identifier)
hdl (Handle)
isbn (International Standard Book Number)
ismn (International Standard Music Number)
isrc (International Standard Recording Code)
issn (International Standard Serials Number)
issue number

Ubicacin de estante (shelfLocator)


URL (un)
Atributos:
ltima fecha de acceso
(dateLastAccessed)
Etiqueta de visualizacin (displayLabel)
Nota (note)
Acceso (access)
Valores:

istc (International Standard Text Code)

Vista preliminar (preview)


Recurso en s (raw object): cuando el
objeto completo est en un nico archivo
Recurso en contexto (object in context)

lccn (Library of Congress Control Number)


local
matrix number
music plate

Uso (usage)

music publisher
sici (Serial !tem and Contribution Identifier)
stock number
upc (Universal Product Code)
uri (Uniform Resource Identifier)
videorecording identifier
Invalid (yes):
en el caso de un identificador invlido o cancelado.
16. Ubicacin (location)

Mantenimiento simple (holdingSimple)(no repetible)


Informacin sobre copia (copylnformation)
Forma (form)(no repetible)
Atributo:
Autoridad (authority)
Sububicacin (sublocation)
Ubicacin de estante (shelfLocator)

Se utiliza para nombrar la institucin que lo mantiene o aloja; pueden utilizarse texto o cdigos.

Ubicacin electrnica (electronicLocator)


Nota (note)

Subelementos:

Atributos:

Ubicacin fsica (physica/Location)


Atributos:
Link externo (xlink)

Etiqueta de visualizacin
(displayLabel)
Tipo (type)

74

METADATOS PARA LA DESCRIPCIN DE RECURSOS ELECTRNICOS EN LNEA

CAPTULO IV. ANLISIS DE LOS ESQUEMAS DE METADATOS

Enumeracin y cronologa

Fecha (date)

(enumerationAndChronolo0
Atributos:

Atributos:
Codificacin (encoding)

Tipo de unidad (unitType)

Punto (point)

Nota: 1=basic bibliographic unit; 2=supplement; 3=index

Calificador (qualifier)

Mantenimiento externo (holdingExternal)(no repetible)

Texto (text)

17. Condiciones de acceso (accessCondition)


Subelementos:

No posee.

Atributos:

Link externo (xlink)

75

Atributos:
Link externo (xlink)
Idioma (lang)
Idioma en XML (xmliang)

Idioma (lang)

Alfabeto (script)

Idioma en XML (xmklang)


Alfabeto (script)

Transliteracin (transliteration)

Transliteracin (transliteration)
Etiqueta de visualizacin (displayLabel)
Tipo (type):

Tipo (type)

Etiqueta de visualizacin (displayLabel

Atributos:

ID (ID)
Tipo (type)

Valores sugeridos: restriccin de acceso, uso y reproduccin.

Valores sugeridos: volumen, nmero, captulo, pargrafo, pista.

18.Parte (pan)

Orden (arder)

Designacin de partes fsicas de un recurso en forma detallada.

19. Extensin (extension)

Suhelementos:

Se utiliza para agregar otra informacin no cubierta por los elementos de MODS en texto libre.

Detalle (detall)
Nmero (number)
Encabezamiento de la parte (caption)
Ttulo (ti:de)
Atributos:

Subelementos:

No posee.

Atributos:

No posee.

20. Informacin del registro (recordlnfo)

Tipo (type)
Valores sugeridos: parte, volumen,

Contiene informacin sobre el registro de metadatos.

nmero, captulo, seccin, pargrafo,


pista.

Subelementos:

Creador del contenido registro (recordContentSource)


Atributos:

Nivel de la numeracin (levet)

Autoridad (authority): cdigo MARC de la organizacin.


Idioma (lang)

Extensin (extent)

Idioma en XML (xml lang)

Comienzo (start)

Alfabeto (script)

Fin (end)

Transliteracin (transliteration)

Total (totan
Abarque o lista (list)

Fecha de creacin del registro (recordCreationDate)


Atributos:

Atributo: Unidad (unit). Por ejemplo: Pginas, minutos.

Codificacin (encoding)
Punto (point)

76

METADATOS PARA LA DESCRIPCIN DE RECURSOS ELECTRNICOS EN LNEA

Fecha clave (keyDate)


Calificador (qualifier)

CAPITULO IV. ANLISIS DE LOS ESQUEMAS DE METADATOS

2.

77

Coleccin de registros MODS (modsCollection)

Para un conjunto de egistros MODS


Fecha de modificacin del registro (recordChangeDate)
Atributos:
Codificacin (encoding)

Subelementos:

MODS (mods)

Atributos:

No posee.

Punto (point)
Fecha clave (keyDate)
Calificador (qualifier)
Identificador del registro (recordldentifier)
Atributo:
Fuente (sourcet organizacin que le asigna el identificador.

CONTENIDO: es un estndar de estructura; el contenido de la mayora


de los elementos se anota de acuerdo con normativas externas (p. ej.:
AACR2) de manera anloga a MARC 21.

Idioma de la catalogacin (languageOfCataloging)


Trmino de idioma (languagererm)
Atributos:
Tipo (type)
text. para expresar el idioma con palabras.

NIVEL DE CATALOGACIN PERMITIDA: ms sencillo que MARC 21 y ms


orientado al usuario que MARCXML. Permite la conversin de los campos
centrales de un registro MARC 21, aunque pueden perderse algunos datos
especficos. En el caso de una descripcin original, permite crear un registro simple, en algunos casos usando mayor cantidad de etiquetas generales que las disponibles en un registro MARC. Atiende a la granularidad, se
puede describir el todo o una parte de un recurso.

code: para expresar el idioma codificado.


Autoridad (authority)
iso639-2h cdigo de idiomas ISO 639-2.

ACTUALIZACIN: la ltima versin es MODS 3.3 (2008). Durante 2009 se


han aprobado las modificaciones para incluir en la versin MODS 3.4

Origen del registro (recordOrigin)

rfc3066 cdigo de idiomas 6FC3066.


Esquema de catalogacin (descriptionStandard)
Atributos:

Idioma (lang)
Idioma en XML (xml:lang)
Alfabeto (script)
Transliteracin (transliteration)

CONTRIBUCIN A LA NORMALIZACIN INTERNACIONAL: en 2004 ha sido


registrado en NISO. Un aspecto importante a la hora de convertirse en
estndar es la total compatibilidad con MARC 21.
SINTAXIS: se codifica en XML.

Ejemplo de un registro MODS codificado en XML tomado de:


http://www.loc.gov/standards/marcxml/Sandburg/sandburgmods.xml

Elementos Raz (Root elements)


1. Registro MODS (mods)
Para un registro MODS simple
Subelementos:
Atributos:

Todos los elementos de MODS


ID (ID)
Versin de MODS (version)

<?xml version="1.o" ?>


<mods xmlns:xlink="http://www.w3.org/TR/xtink"
xmlns:xsi="http://www.w3.org/2ooi/XMLSchema-instance"
xmlns="http://www.loc.gov/modst
xsi:schemaLocation="http://www.loc.gov/mods/ http://www.loc.gov/standards/mods/mods.zsd5
<titlelnfo>
<title>Arithmetic
</titleInfo>

78

METADATOS PARA LA DESCRIPCIN DE RECURSOS ELECTRNICOS EN LNEA

<name type="personal">
<namePart>Sandburg, Carl</namePart>
<namePart type="date">0378-1967</namePart>
- <role>
<text>creator</text>
</role>
</narne>
<name type="personal">
<namePart>Rand, Ted</namePart>
- <role>
<text>ill.</text>
</ro le>
</name>
<typeOfResource>text</typeOfResource>
<originlnfo>
<place>
<code authority="marc">cau</code>
<text>San Diego</text>
</p la ce>
<publisher>Harcourt Brace Jovanovich</publisher>
<datelssued>c1993</datelssued>
<datelssued encoding="marc">1993</datelssued>
<editionnst ed.</edition>
<issuance>monographic</issuance>
</originlnfo>
<language authority="iso639-2b">eng</language>
<physicalDescription>
<form authority="marcform")print<Iform>
<extent>i v. (unpaged) : ill. (some col.) ; 26 cm.</extent>
</physicalDescription>
<abstract>A poem about numbers and their characteristics. Features
anamorphic, or distorted, drawings which can be restored to normal by
viewing from a particular angle or by viewing the image's reflection in
the provided Mylar cone.</abstract>
<targetAudience>juvenile</targetAudience>
<note type="statement of responsibility">Carl Sandburg ; illustrated as an
anamorphic adventure by Ted Rand.</note>
<note>One Mylar sheet included in pocket.</note>
<subject authority="lcsh">
<topic>Arithmetic</topic>

CAPTULO IV. ANLISIS DE LOS ESQUEMAS DE METADATOS

79

<topic>Juvenile poetry/topic>
</subject>
- <subject authority="k.sh">
<topic>Children's poetry, American</topic>
</subject>
<subject authority="lcshac">
dopic>Arithmetic</topic>
<topic>Poetry</topic>
</subject>
<subject authority="lcshac">
<topic>American poetry</topic>
</subject>
<subject authority="lcshac">
dopic>Visual perceptiongtopic>
</subject>
<classification authority="lcc">PS3537A618 A88 1993</classification>
<classification edition="2o" authority="ddc">811/.52</classification>
<identifier type="isbn">o152038655 :</identifier>
<identifier type="lccn">92o05291</identifier>

:<recordinfo>
<recordContentSource>DLC</recordContentSource>
<recordCreationDate encoding="marc">920219</recordCreationDate>
<recordChangeDate
encoding="iso86o1">1993o521155141.9</recordChangeDate >
<recordldentifier source="DLC">92o05291</recordIdentifier>
</recordlnfo>
</m ods>
RESULTADOS OBTENIDOS HASTA EL PRESENTE: en la web de la Library
of Congress, en diciembre de 2009, haba 3o proyectos listados de implementaciones de este esquema. Entre las instituciones figuran la LC, la
National Library of Australia, la Digital Library Federation, varias universidades de Estados Unidos y la Oxford University.

TEl (Text Encoding Initiative)


AO DE ORIGEN: el proyecto se inicia en 1987; en
y en diciembre
1994 se publican las Recomendaciones TEI (TE! Guidelines)
(TEl-O.
del 2000 se crea un consorcio para su mantenimiento

8o

METADATOS PARA LA DESCRIPCIN DE RECURSOS ELECTRNICOS EN LINEA

ORGANISMO CREADOR: el proyecto TEI surge de una investigacin cooperativa entre tres asociaciones:

Association of Computers in the Humanities


(ACH), Association for Computational Linguistics (ACL); y Association of
Literaty and Linguistic Computing (ALLC) y con fondos de:
U.S. National
Endowment for the Humanities (NEH), European Community, Mellon
Foundation y Social Science and Humanities Research Council of Canada.
Las recomendaciones TEI fueron publicadas en 1994
como resultado de
un proyecto de investigacin que comenz en el ao 1987.
TEI establece
que cualquier texto codificado segn TEI debe tener, antes que nada, una
cabecera que contenga la descripcin de dicho texto. Las especificaciones
de la cabecera fueron formuladas por el Comit de Documentacin del proyecto, el cual estaba integrado por bibliotecarios y archivistas de Europa y
Norteamrica, y estn inspiradas en la catalogacin tradicional. Esta cabecera incluye los metadatos.

MANTENIMIENTO: en el ao 2000
se establece una nueva corporacin sin
fines de lucro denominada TEl Consortium
para el desarrollo y mantenimiento del esquema, cuya oficina ejecutiva se ubica en Charlottesville, Virginia,
con sedes en Brown University, Oxford University y University of Virginia.
DOCUMENTACIN EXISTENTE: manuales y tutoriales en lnea en el sitio
web oficial, software, varios grupos de discusin, presentaciones para uso
educativo y una wiki.

OBJETIVOS/MISIN: TEI ha sido desarrollado como un estndar internado-

ial e interdisciplinario para bibliotecas, museos, editoriales corporativas y edit ores individuales a fin de representar una gran variedad de textos literarios y
ingsticos para la investigacin, preservacin y bsqueda en lnea. Se trata
le representar los materiales textuales en formato electrnico de tal forma que
)ermita, a los investigadores de cualquier disciplina, intercambiar y reutilizar
os recursos independientemente del hardware y software que utilicen.

DISCIPLINA/MBITO DE APLICACIN: se aplica especialmente en el


ampo de la lengua, la literatura, las humanidades y las ciencias sociales.
.e utiliza para describir textos literarios y lingsticos en bibliotecas, muses y editoriales. Sin embargo, puede aplicarse para la estructuracin de
formacin electrnica de todo tipo, incluso imgenes.

CORRIENTE TERICA A LA QUE RESPONDEN: proviene de la comunidad

e estudio de la lingstica.

CAPITULO IV. ANLISIS DE LOS ESQUEMAS DE METADATOS

81

SIMPLICIDAD/COMPLEJIDAD: la complejidad est asociada a la cantidad de informacin que se quiera incluir y el nivel de normalizacin que
se pretenda. Cada proyecto que utilice TEI debe tomar sus propias decisiones respecto a qu partes del esquema utilizar y el nivel de complejidad o sofisticacin a emplear. Requiere del conocimiento del modelo y
de las reglas bibliotecarias.

INTEROPERABILIDAD: ha sido concebido para intercambio, con independencia del software y hardware.
EXTENSIBILIDAD: permite un marcado semntico de textos muy detallado.

FLEXIBILIDAD: en los instructivos se sugiere que el usuario adecue TEI a


sus necesidades, para obtener la mxima prestacin.
ESTRUCTURA: se comenz en 1994 con la definicin de 600 elementos en SGML, luego surgieron las versiones TEI P3 (1998) ms operativa y modular, TEI P4 (2001) en XML y TEI Lite, orientada a bibliotecas
digitales; la versin actual es TEI P5 versin 1.5.0 (2009). Utiliza etiquetas basadas en palabras y no numricas. Uno de los componentes ms
significativos de TEI es la cabecera TEI (TEl Header), que permite una
descripcin hibli,Jgrfica detallada para cada texto codificado TEl corno
parte de su estructuracin original.
Caractersticas generales de los elementos:

a. Opcin: existen elementos obligatorios, opcionales y recomendados.


b. Repeticin: posee elementos repetibles y no repetibles.
c. Subcampos: no se utilizan subcampos, s atributos dentro de los campos.
d. Control: se sugiere establecer control para ciertos elementos (p. ej.: Series).
Los elementos de TEI pueden albergar diferentes tipos de contenidos:

Texto libre (free prose): los diferentes pargrafos se marcan con el


elemento <p.

Elementos- de conjunto (grouping elements): elementos cuyos nombres llevan el sufijo Stmt, usualmente agrupan una serie de elementos especializados. En el caso de los elementos bibliogrficos corresponden a las reas ISBD.

METADATOS PARA LA DESCRIPCIN DE RECURSOS ELECTRNICOS EN LINEA


CAPTULO IV. ANLISIS DE LOS ESQUEMAS DE METADATOS

Declaraciones (declarations):
elementos con el sufijo Decl, albergan

83

datos especficos sobre la codificacin del texto electrnico, usualmente registrados en forma codificada.

model.encodingPart: agrupa elementos que pueden ser utilizados


dentro del elemento <encodingDesc).

Descripciones (descriptions):
elementos con el sufijo Desc contienen

model.profileDescPart: agrupa elementos que pueden usarse en el


elemento (profileDesca.

una descripcin organizada bajo encabezamienos especficos de


acuerdo a los subelementos sugeridos.

model.headerPart: agrupa elementos de alto nivel que pueden apaA continuacin se listan los principales elementos de TEI Header de la
ersin TEI P5 (2009).

recer ms de una vez en la cabecera TEI.

Los elementos de la cabecera TE! estn estructurados en 4 secciones:

model.sourceDescPart: agrupa elementos que pueden ser utilizados


en el elemento (sQurceDeso.

Descripcin de archivo (fileDesc),


que contiene la descripcin biblio-

model.textDescPart: agrupa elementos que sirven para categorizar un

grfica completa del texto similar a AACR2R e ISBD.

Descripcin de codificacin
(encodingDesc), con elementos sobre
caractersticas especficas del archivo electrnico, relaciona el texto
electrnico con la fuente o fuentes de las cuales deriva.

Descripcin de perfil (profileDesc),


con informacin similar a los puntos de
acceso secundarios de AACR2R, datos de lengua, clasificacin, materias.

Descripcin de revisin (revisionDesc),


que contiene un registro de cada
cambio que se le ha hecho al texto y la fecha en que ha sido cambiado.
TEI posee un sistema de clases que permite adaptar el esquema a las
.cesidades del usuario. Por ejemplo: en la cabecera, para refinar la desipcin se pueden aplicar elementos agrupados en las siguientes clases:

model.applicationLike:

agrupa elementos usados para registrar un tipo


especfico de informacin acerca de un documento en la cabecera. Por
ejemplo: model.listLike (tipo lista); model.biblLike (bibliogrfica).

model.catDescPart:
agrupa elementos sobre las categoras de descripcin de la cabecera TEI.

model.editorialDeclPart:
agrupa elementos que pueden usarse dentro del elemento (editorialDec1).

texto, por ejemplo, en trminos de sus parmetros situacionales.


El elemento superior es la etiqueta de cabecera TEI cteiHeader,
El elemento descripcin de archivo <fileDesc) es obligatorio. Contiene a
su vez los siguientes elementos:

Ttulo (titleStmt) (title statement)


Ttulo (title): contiene el ttulo completo de una obra de cualquier tipo.
Autor (authod: contiene el nombre del (los) autor(es), personales o corporativos.
Patrocinante (sponsor)
Financiador (funder) (funding body)
Principal (principal) (principal researcher): nombre del investigador
principal responsable de la creacin del texto electrnico.
Mencin de responsabilidad (respStmt) (statement of responsibility):
se registra aqu una mencin de responsabilidad cuando otros elementos no son suficientes o no se aplican.
Responsabilidad (resp) (responsibility): frase que describe la naturaleza de la responsabilidad intelectual de una persona.
Nombre (name) (name, proper noun): contiene un nombre propio.

Edicin (editionStmt) (edition statement)


Edicin (edition)

84

METADATOS PARA LA DESCRIPCIN DE RECURSOS ELECTRNICOS EN LNEA


CAPTULO IV. ANLISIS DE LOS ESQUEMAS DE METADATOS
85

Mencin de responsabilidad (respStmt)


Nombre (name)
Responsabilidad (resp)
Extensin (extent)
Publicacin ffiublicationStmt)
(publication statement)
Editorial (publisher)
Distribuidor (distributor)
Autoridad de publicacin (authority)
(release authority)
Uno de estos tres elementos mencionados estar presente en la descripin y contendr alguno o todos los siguientes elementos:
Lugar de publicacin (pubPlace)
Direccin postal (address)
Nmero de identificacin (ideo)

(identifying number): se registra


el nmero estndar o no estndar utilizado por el editor para
identificar el tem.
Tipo (type): caracteriza el nmero, por ej.: ISBN.
Disponibilidad (availability):
informacin sobre condiciones de uso
de un texto, por ejemplo: alguna restriccin, copyright, etc.
Estado (status):
informacin sobre la disponibilidad actual
del texto.
Fecha (date)
Serie (seriesStmt) (series statement)
Ttulo (title)
Nmero de identificacin (idno) (identifying number)
Mencin de responsabilidad (respStmt)
Responsabilidad (resp)
Nombre (name)
Notas (notesStmt) (notes statement)
Nota (note): se utiliza para cada nota individual.
Fuente (sourceDesc)
(source description): es un elemento obligatorio que detalla la fuenteF
n .iipnfoc

electrnico. Puede ser un texto impreso o manuscrito, otro archivo electrnico, una grabacin de audio o video, o una combinacin de los nombrados. Puede no tener fuente, es decir, ser un
documento original creado electrnicamente. Puede contener una
declaracin simple o utilizar clases y elementos especficos provistos por TEI para una informacin detallada.
El elemento descripcin de codificacin (encodingDeso
especifica los
mtodos y principios editoriales que se utilizaron en la transcripcin del
texto. El uso es altamente recomendado.
Se puede incluir informacin en texto libre con la codificacin (p), o contener elementos especficos tomados de la clase modeLencodingPart.
Por
defecto dicha clase especifica los siguientes elementos:
Descripcin de proyecto (projectDesc):
describe en detalle el propsito para el cual fue codificado el archivo electrnico y otra informacin relevante concerniente al proceso de realizacin.
Declaracin de muestreo (samplingDecO:
describe la metodologa utilizada para la seleccin de los textos a incluir en el recurso.
Declaracin de prcticas editoriales (editoria/DecO:
detalla los principios y prcticas involucrados durante la edicin de un texto electrnico. Puede ser una aclaracin en texto libre o ampliarse segn los
elementos de la clase modeLeditorialDecIPart.
Declaracin de etiquetado (tagsDecO:
provee informacin detallada
acerca del etiquetado aplicado a un documento.
Declaracin del sistema de referencias (refsDecO:
especifica cmo funciona el sistema de referencias construido en la codificacin del texto.
Declaracin de clasificacin (classDech:
contiene elementos que definen los cdigos de clasificacin utilizados en cualquier parte del texto.
Informacin de aplicacin (appinfo):
registra informacin sobre la
aplicacin que se utiliz en la edicin del archivo TEI.

86
METADATOS PARA LA DESCRIPCIN DE RECURSOS ELECTRNICOS EN LNEA
CAPTULO IV. ANLISIS DE LOS ESQUEMAS DE METADATOS

87

La descripcin de perfil (profileDesc)

provee informacin que caracteriza


varios aspectos descriptivos no bibliogrficos de un texto. Es de uso opcional e incluye tres elementos opcionales:
Creacin (creation):

Los elementos bsicos son:


Descripcin de revisin (revisionDesc): rene el historial de cambios

contiene informacin acerca del origen de un texto.

Cambio (change): registra un cambio particular o correccin realizada a una versin del texto electrnico.

Uso de idioma
(langUsage):

describe los idiomas, subidiomas, registros y dialectos representados dentro del texto.

Como puede verse TEI es un esquema muy completo y permite una


gran extensibilidad.

Clasificacin de texto
(textClass):

agrupa informacin que describe la


naturaleza o los tpicos de un texto, en trminos de un esquema de
clasificacin estndar, tesauro, etc.
Dentro de (textClass)
se proveen los siguientes elementos:
Palabras clave (keywords)

CONTENIDO: es un estndar de estructura que en ciertos elementos


prescribe el contenido; est implcito el uso de AACR2 o ISBD. Permite adems informacin en texto libre.

Esquema (scheme):
identifica el vocabulario controlado utilizado.
Cdigo de clasificacin (classCode)
Esquema (scheme):
identifica el cdigo de clasificacin utilizado.
Referencia de categora (catReO:
especifica una o ms categoras
definidas dentro de una taxonoma o tipologa de texto.
Otros tres elementos que pueden aparecer dentro de

NIVEL DE CATALOGACIN PERMITIDA: formato rico, informacin descriptiva altamente estructurada; se ubica en un Nivel 3 (Dempsey & Heery,
1998). Permite realizar adaptaciones, segn las necesidades, a travs de su
estructuracin en clases, que, a su vez, agrupan elementos que permiten
incluir ms detalle en otros elementos.

(profileDesc) son:

ACTUALIZACIN: la versin actual de esquema es TEI P5 de noviembre de 2009.

Descripcin de texto (textDesc):


provee una descripcin del texto en
trminos de sus parmetros situacionales.

CONTRIBUCIN A LA NORMALIZACIN INTERNACIONAL: se puede considerar que actualmente es un estndar de hecho.


TEI hace referencia a los siguientes estndares:

Descripcin de participacin

(particDesc): se registran locutores,


voces u otros participantes en una interaccin lingstica.

Descripcin de contexto

ISO 646: Information technology ISO 7-bit coded character set for
information interchange.

El elemento descripcin de revisin

150 10646: Information technology Universal Multiple-Octet Coded


Character Set (UCS).

(settingDesd:
describe el marco dentro del
cual una interaccin lingstica tiene lugar.

(revisionDesc)
registra los cambios
va teniendo en texto. Es de uso opcional pero altamente recomendaLos cambios pueden registrarse como una secuencia de elementos
Inge)
que contengan una breve descripcin. Los atributos de fecha
e> y quin twho,
pueden utilizarse para identificar cundo se realiz el
bio y el agente responsable de la modificacin.

Unicode.
SINTAXIS: se codifica en SGML y XML.
Ejemplo de un registro TEI en sintaxis XML:
1

88
METADATOS PARA LA DESCRIPCIN DE RECURSOS ELECTRNICOS EN LINEA
CAPITULO IV. ANLISIS DE LOS ESQUEMAS DE METADATOS
89

<tei header>
<filedesc>

</encodingdesc>

<titlestmt>

<title>Arithmetic Ntitle>
<author>Sandburg, Carl, 1878-1967.</
author>
<respStmt>
<resp>

illustrated as an anmorphic adventure by </resp>

<name>Ted Rand</name>
</respStmt>
</titlestmt>

<publicationstmt>
<publisher> Harcourt Brace
Jovanovich,</publisher>
<pubPlace> San Diego</pubPlace>
<idn o type'1SBN5o152038655</idno>
<date>c1993</date>
</publicationstmt>
<sourcedesc>
<p> </p>

</sourcedesc>
</filedesc>
<profiledesc>
<langUsage>
<language id="en">english</language>
</langUsage>
<textClass>
(keywords scheme="lcsh")
:item>Arithmetic</item>

item>Children's poetry, American.</item>


item>Arithmefic</item>
item>American poetry.</item>
item>Visual perception.</item >
/list>
'keywords>
'textClass>

Profiledesc>
!ncodingdesc>

<revisiondesc>
</revisiondesc>
</tei header>
RESULTADOS OBTENIDOS HASTA EL PRESENTE: a diciembre de
existen

125

proyectos registrados en la pgina web de TEI.

2009

CAPTULO

LENGUAJES DE MARCADO

Los esquemas de metadatos analizados en este trabajo se codifican con los denominados lenguajes de marcas, como SGML,
HTML, XML o RDF. En este apartado se describen las caractersticas principales de estos ltimos.

SGML
El SGML, Standard Generalized Markup Language,
est definido por la norma ISO 8879 aprobada en 1986 y constituye un
modelo abierto para el diseo de documentos electrnicos. Es un metalenguaje o marco normativo que permite definir diferentes lenguajes de marcacin de textos compatibles entre s. Aplica el concepto de documento distribuido, es decir, la posibilidad de generar un documento distribuido en
distintos archivos que se pueden almacenar en diferentes servidores. Se
basa en .r marcado genrico del documento para identificar sus partes

92

METADATOS PARA LA DESCRIPCIN DE RECURSOS ELECTRNICOS EN LNEA

CAPITULO V. LENGUAJES DE MARCADO


93

constitutivas de manera jerrquica. La importancia del marcado textual reside en que posibilita que la indizacin no se separe del texto del documento, lo que asegura la persistencia en el tiempo y en la arquitectura distribuida de la Web. SGML ha sido la base de modelos de metadatos como TEI
y desarrollos posteriores como HTML y XML. Como es muy complejo y difcil de manejar, aplicar y visualizar en la Web, tiene una escasa aplicacin.

HTML
El HTML, Lenguaje de Marcacin de Hipertexto
(Hiper Text Mark-up Language), es un subconjunto simplificado o aplicacin
del SGML. Provee una forma simple de estructurar documentos de hipertexto y de realizar referencias desde un documento a otro. En esencia, los
documentos HTML son documentos de texto plano (ASCII). Sirve para mar:ado estructural (elementos del contenido) y para presentacin.
La estructura bsica de un archivo HTML es la siguiente:
HTML>
<HEAD>
<TITLE>
</TITLE>
</HEAD>
<BODY>
</BODY>

CONTENT: indica el valor de la propiedad.


Ejemplo:
<META NAME="Author" CONTENT="Umberto Eco">
Tambin puede incluir otros atributos tales como:
LANG: indica la lengua.
SCHEME: indica el esquema utilizado.
Ejemplos:
<META NAME="Author" LANG="es" CONTENT="Umberto Eco">
<META NAME="identifier" SCHEME="ISSN" CONTENT="1056-3456">
Como seala Mndez Rodrguez

es un lenguaje diseado especialmente para soportar una presentacin consistente, y se ha convertido predominantemente en un lenguaje de formato ms que en un cdigo semntico,
por lo que actualmente proporciona muy poca ayuda para la recuperacin de
informacin. Tiene un conjunto de etiquetas prefijado y finito, no se pueden
ampliar o crear nuevas etiquetas ms significativas (slo en Consorcio Web
es posible hacerlo). La ltima versin es HTML 4.01 de 1999.
La complejidad de SGML y las debilidades de HTML en materia de recuperacin de la informacin han propiciado el surgimiento de XML. El sucesor
es XHTML, Extensible HyperText Markup Language, que sucede y extiende
HTML reformulado en XML. Actualmente el W3C est trabajando en XHTML2.
(2002),

/HTML>
Dentro de esta estructura, el documento se divide en una cabecera y un
:uerpo. La cabecera, etiqueta <HEAD>, contiene informacin sobre la pgiia. Los datos aqu incluidos no se ven con la visualizacin del documento
travs del navegador. Dentro de la cabecera se encuentra la etiqueta
TITLE> que brinda informacin acerca del nombre del documento. Este
'cimbre aparece en la barra de estado del navegador. El cuerpo del doculento, etiqueta <BODY>, contiene toda la informacin que el usuario visuaza a travs del navegador.
Dentro de la etiqueta <HEAD>, el HTML permite incorporar metadatos
iediante el uso de la etiqueta META. Cada etiqueta META tiene mnimamendos atributos:
NAME: indica el tipo de propiedad.

XML
El XML, eXtensible Mark-up Language, es una aplicacin del SGML desarrollada por el Word Wide Web Consortium (W3C) como
un formato universal para documentos estructurados y datos en la Web. La
versin 1.0 de XML surge en 1998.
Mientras que HTML es una sintaxis no extensible, con etiquetas fijas;
XML, al ser extensible, permite definir localmente las etiquetas que se quieren crear y permite construir productos basados en el intercambio estructurado de datos entre aplicaciones y admite en s mismo la creacin de metadatos. Una ventaja del XML es su gran funcionalidad en la bsqueda.
Es un estndar de intercambio de documentos en la Web, que mejora la
recuperacin ya que permite el marcado segn el contenido semntico, a
travs de elementos y atributos.

94

METADATOS PARA LA DESCRIPCIN DE RECURSOS ELECTRNICOS EN LNEA

CAPTULO V. LENGUAJES DE MARCADO


95

Como sealan De la Rosa y Senso (1999), XML simplifica SGML, eliminando parte de sus operaciones sintcticas pero dotando a la informacin de una
estructura; XML permite la creacin de etiquetas propias dentro de cada documento, lo que aade precisin y detalle, y es vlido para la representacin
digital de documentos de cualquier tipo y con cualquier extensin.
Todos los documentos XML deben comenzar con una etiqueta <?XML 7>
indica que el tipo de documento es XML. Luego pueden tener varios
atributos, como por ejemplo la versin.
lue

Ejemplo de un archivo XML (De la Rosa y Senso, 1999, p. 493):


<?XML version="to"? >
<DOCUMENTO>

<libro fechalibro="19755
<!_ La primera edicin en 1970>
<ttulo>Organizacin de las bases de datos</ttulo>

<automapellido>Martin</apellidox/autor>
<autorxnombre>James</nombrex/autor>
<trad uctorxapellido>Marco</apellidox/traductor>
<traductorxnombre>Alfredo dignombrex/traductor>
</libro>
</DOCUMENTO>
Las perspectivas del XML para estructurar, intercambiar y recuperar
formacin eletrnica son muy promisorias, en tanto se generalice su
)licacin en la Web.

RDF

RDF, Resource Description Framework,


es una inicia'a del W3C que surge como primer borrador en el ao 1997. En 1999 se
iblica como recomendacin del W3C
"RDF Model and Syntax
)ecification". Las ltimas actualizaciones se realizaron en
2004. RDF es la

que intercambian informacin legible por mquina en la web. RDF puede


utilizarse en distintas reas de aplicacin, por ejemplo: en recuperacin
de recursos, para proporcionar mejores prestaciones a los motores de
bsqueda; en catalogacin, para describir el contenido y las relaciones
de contenido disponibles en un sitio web, una pgina web, o una biblioteca digital particular; por los agentes de software inteligentes, para

facilitar el intercambio y para compartir conocimiento; en la calificacin


de contenido; en la descripcin de colecciones de pginas que representan un "documento" lgico individual; para describir los derechos de
propiedad intelectual de las pginas web; y para expresar las preferencias de privacidad de un usuario, as como las polticas de privacidad
de un sitio web. RDF, junto con las firmas digitales, ser la clave para

construir la "Web de confianza" para el comercio electrnico, la cooperacin y otras aplicaciones.


RDF y XML son complementarios: RDF es un modelo de metadatos y
slo dirige por referencia muchos de los aspectos de codificacin que
requiere el almacenamiento y la transferencia de archivos (tales como internacionalizacin, conjuntos de caracteres, etc.). Para estos aspectos, RDF
cuenta con el soporte de XML. Es importante tambin entender que esta
sintaxis XML es slo una sintaxis posible para RDF y que pueden surgir formas alternativas para representar el mismo modelo de datos RDF.
El fundamento o base de RDF es un modelo para representar propiedades designadas y valores de propiedades. El modelo de datos bsico consiste en tres tipos de objetos:
Recursos: todas las cosas descritas por expresiones RDF se denominan
recursos. Un recurso puede ser una pgina web completa, o una parte de

una pgina web; por ejemplo, un elemento HTML o XML especfico dentro
del documento fuente. Un recurso puede ser tambin una coleccin completa de pginas, por ejemplo, un sitio web completo.
Propiedades: una propiedad es un aspecto especfico, caracterstica,
atributo o relacin utilizado para describir un recurso. Cada propiedad tiene
un significado especfico, define sus valores permitidos, los tipos de recursos que puede describir y sus relaciones con otras propiedades.

se para el actual proyecto de Web Semntica de W3C.


Segn la recomendacin del W3 Consortium (1999), RDF, o
raestructura para la Descripcin de Recursos, es una base para prosar metadatos que proporciona interoperabilidad entre aplicaciones

Sentencias: declaraciones o enunciados, un recurso especfico junto con


una propiedad denominada, ms el valor de dicha propiedad para ese
recurso es una sentencia RDF (RDF statement). Estas tres partes individuales de una sentencia se denominan, respectivamente, sujeto, predicado y

96

METADATOS PARA LA DESCRIPCIN DE RECURSOS ELECTRNICOS EN LINEA

objeto. El objeto de una sentencia (es decir, el valor de la propiedad) puede


ser otro recurso o puede ser un literal.

CAPTULO

RDF permite intercambiar metadatos de recursos web entre distintas


aplicaciones. Es decir que permite la codificacin e intercambio de metadatos generados, bajo cualquier formato de descripcin de metadatos (DC,
PICS, IAFA, etc.). El modelo es independiente de la sintaxis. A continuacin
se muestra un ejemplo simple de RDF tomado de la web del W3C
(http:// www.w3.org /Metadata /Activity)

VI

COMPARACIN DE LOS
ESQUEMAS DE METADATOS

<RDF xmlns="http://www.w3.org/1999/o2/22-rdf-syntax-ns#n
xmlns:dc="http://purl.org/dc/elements/tir>
cDescription about="http://www.w3.org/Press/99Folio.pdr>
cdc:title>The W3C Folio 1999</dc:title>
cdc:creator>W3C Communications Team</dc:creator>
cdc:date>1999-o3-1oc/dc:date>
:dc:subject>Web development, World Wide Web
:onsortium, Interoperability of the Webadc:subject>
/Description>
/RDF>

A continuacin se presenta el resultado de la comparacin de los metadatos analizados, segn los criterios propuestos.

CRITERIO

MARC 21

DC

TEI

MODS

Ao de creacin 1960
1992,
campo 856
2002, MARCXML

1995

1987
1994,
TEI Guidelines
2000,
TEI Consortium

2002

Organismo
creador

OCLC
NCSA (National
Center for

Association of
Computer in the
Humanities,

LC

Supercomputing

Association

LC

98

METADATOS PARA LA DESCRIPCIN DE RECURSOS ELECTRNICOS EN LNEA

CAPITULO VI. COMPARACIN DE LOS ESQUEMAS DE METADATOS


99

Applications)

Mantenimiento

Documentacin

Misin/
propsito

Disciplina de
Aplicacin
(actualmente)

DC Metadata
Initiatiye.

Inicialmente para
documentos
impresos, fue
incorporando
otros formatos.

Todas las
disciplinas.
Bibliotecas.

lormalizacin

2008.

Estndar
de hecho.
ISO 2709
ANSI Z39.2.

En cuanto a su origen, MARC, MODS y Dublin Core surgen de instituciones ligadas a la bibliotecologa como son LC y OCLC. TEI proviene del
mbito de la lingstica, pero para disear la descripcin de archivo se
interactu con bibliotecarios, entre otros profesionales. MARC es el formato ms antiguo (1960; TEI se inicia en 1987 y en 1994 se publican las primeras recomendaciones; posteriormente aparece Dublin Core (1995), y
finalmente MODS nace en 2002.

TEI Consortium.

Manuales en lnea, Manuales


varios idiomas,
en lnea.
lista de discusin.

Corriente terica De la
bibliotecologa.

ctualizacin

for Computational
Linguistics y
Association of
Literary and
Linguistic Computing.

Manuales en lnea,
tutoriales, software,
grupos de discusin,
wiki.

Ad-hoc para
recursos
electrnicos,
simplicidad,
interoperabilidad.

Para textos
electrnicos
literarios y
lingisticos,
intercambio de
recursos.

Manuales
en lnea
y lista de
discusin.
Para recursos
electrnicos,
subconjunto
de MARC,
totalmente
compatible
con MARC.

Todas las
disciplinas.
Bibliotecas,
museos,
educacin,
gobierno,
archivos, etc.

Se aplica en el
Especialmente
campo de la lengua, en bibliotecas.
la literatura,
las ciencias
sociales.
Bibliotecas, museos,
editoriales.

Interaccin
bibliotecologa
e informtica.

De la lingstica.

Versin 1.1
2008.

De la
bibliotecologa.

TEI P5

Versin 3.3

2009.

2008.

ISO 15863-2003 Estndar de


ANSI/NISO
hecho.
Z39.85-2007.

Proyecto
registrado
en NISO,
2004.

Se puede afirmar que se ha partido de formatos sumamente complejos


como MARC y TEI para luego pasar a un formato ms simple como DC, y,
finalmente, surge un formato intermedio como lo es MODS. Todos provienen de instituciones altamente reconocidas, est previsto su mantenimiento y desarrollo y cuentan con documentacin detallada en lnea.
En cuanto al propsito,
MARC ha sido creado para catalogacin de documentos impresos y se fue extendiendo para los nuevos soportes, para el
caso de recursos electrnicos se incorporaron nuevos campos, pero siempre respondiendo al mismo modelo. El ltimo avance ha sido la codificacin en XML para adaptarlo al ambiente web.
Dublin Core, TEI y MODS han sido creados ad hoc
para descripcin de
recursos electrnicos. Dublin Core y TEI priorizan la facilidad de recuperacin a travs de motores de bsqueda y el intercambio de informacin.
MODS apunta a una descripcin ms simple y flexible que MARC 21, pero a
la vez totalmente compatible con l.

Estructura, contenido, sintaxis


El formato MARC se estructura en campos y subcampos, algunos obligatorios y otros opcionales. Utiliza etiquetas numricas, lo
que lo independiza del lenguaje. Es un estndar de estructura, donde el contenido est regido por normas externas al formato. Se codifica en HTML y XML.
Dublin Core se estructura en elementos bsicos y calificadores, utiliza etiquetas basadas en palabras. Todos los elementos son opcionales y repetibles.
Es un estndar de estructura, que no est regido por reglas de contenido, sino
que se sugiere la normativa a aplicar. Se codifica en HTML, XML y RDF.
MODS consta de elementos principales, subelementos y atributos que
pueden ser usados en uno o ms elementos. Utiliza etiquetas basadas
en palabras. Todos los elementos y atributos son opcionales. Es un
estndar de estructura, el contenido de la mayora de los elementos se
anota de acuerdo a normativas externas de manera anloga a MARC. Se
codifica en XML.

100

METADATOS PARA LA DESCRIPCIN DE RECURSOS ELECTRNICOS EN LINEA

TEI se estructura en elementos y atributos, algunos obligatorios, otros


opcionales o recomendados. Utiliza etiquetas basada en palabras. Es un
estndar de estructura que en ciertos elementos prescribe el contenido. Se
codifica en SGML y XML.
Como puede apreciarse, todos son estndares de esctructura, utilizan
elementos principales que pueden refinarse de acuerdo a la necesidad
del usuario y pueden codificarse en XML. TEI en ciertos elementos prescribe el contenido. Dublin Core da un paso ms en cuanto a la sintaxis
y puede ser incluido en el marco RFD. Excepto MARC, se utilizan etiquetas en palabras en ingls.

CAPITULO VI. COMPARACIN DE LOS ESQUEMAS DE METADATOS

101

gatoria y TEI, si bien deja opcin, sugieren la aplicacin de las AACR2 e


ISBD en varios de sus elementos.
MODS estara en un intermedio, al tener menos elementos, pero se requiere el conocimiento de las normativas bibliotecarias, porque los elementos se
equiparan a MARC. La simplicidad relativa, la flexibilidad y la compatibilidad
con MARC, dan a MODS muchas posibilidades para las bibliotecas.
Todos son flexibles y extensibles a la hora de seleccionar los elementos
a incluir; el usuario decide el nivel de detalle de la descripcin, aunque
MARC tiene un nivel menor de flexibilidad.

Interoperabilidad
NIVEL DE CATALOGACIN PERMITIDA
MARC 21

DC

TEI

MODS

Nivel 1
Nivel 2
Nivela

En cuanto a esta caracterstica, MARC y TEI, segn la clasificacin de


se ubican en un nivel 3, son formatos ricos altamente estructurados. Dublin Core se ubica en la banda 2, con una descripcin sencilla. MODS estara movindose entre los niveles 2 y 3, dependiendo de si se incluyen o no todos los subelementos y atributos.
Dempsey y Heery (1998),

Simplicidad, extensibilidad, flexibilidad


En cuanto a la complejidad de creacin de los registros, DC es sin duda el ms sencillo, est pensado para que el propio autor
pueda asignar los metadatos en el momento de creacin del archivo digital. De todas maneras, se complejiza al aumentar el nivel de detalle de la
descripcin a travs del empleo de los calificadores.
MARC y TEI son complejos por el nivel de detalle, la cantidad y la alta
astructuracin de los elementos, y estn asociados a las normativas biblio:ecarias para registro del contenido de la descripcin. MARC de manera obli-

La interoperabilidad es un criterio con fuerte presencia en todos ellos; actualmente todos se pueden codificar en XML. DC adems es compatible con el modelo RDF.

CAPTULO

VI

METADATOS Y RECUPERACIN
DE LA INFORMACIN

Como seala Mndez Rodrguez (2002), las herramientas de bsqueda y recuperacin de informacin en Internet se fundamentan en la automatizacin de las tareas tradicionales de organizacin del conocimiento; se puede decir que un software clasifica y/o indiza automticamente los datos de Internet, sistematizando de alguna
manera la informacin digital existente. El tratamiento automtico se
presenta como la nica opcin real frente a la inmensa cantidad de
datos; sin embago, estas aplicaciones en general no identifican las
caractersticas de un documento de la forma detallada y precisa en que
lo hara un indizador humano.
Las herramientas generalizadas disponibles son: buscadores o motores
de bsqueda, metabuscadores e ndices o directorios.

METADATOS PARA LA DESCRIPCIN DE RECURSOS ELECTRNICOS EN LNEA

Buscadores o motores de bsqueda

Son sistemas poscoordinados de recuperacin de


formacin y se basan en la bsqueda por palabras clave. Un buscador es
base de datos que contiene pginas web indexadas, cuya funcin es
.cuperar y mostrar una lista de resultados que satisfacen una determinaa bsqueda. Generalmente proveen un rea de entrada (formulario) donde
escribe la expresin de bsqueda. Algunos ejemplos de buscadores son:
itavista, Google, Excite, Hotbot, Lycos, lnfoseek.
Existen bsicamente dos formas por medio de las cuales los buscadores
dexan pginas web; una de ellas es a travs del registro de los usuarios,
Je crean sus pginas y las incorporan a los distintos buscadores por medio
e las opciones: sugerir una pgina (suggest a page) o agregar un sitio (add
page). Este es un mtodo simple y generalmente contiene un formulario
)n campos para el ttulo, el Uniform Resource Locator (URL), la persona de
intacto, ubicacin geogrfica, comentario, etc. Luego, los catalogadores del
.rvicio seleccionan las categoras y agregan el sitio a la base de datos. Por
Itmo, se le enva Lin mail a la persona informndola sobre la inclusin o no
el sitio. Este mtodo es sencillo y fcil de usar, pero carece de normalizan. La otra forma es a travs de software automtico [denominados araas
;piders), agentes o robots] que capturan pginas web y crean ndices de
lgunos trminos del texto completo o parte del documento y los almacenan
n una base de datos. El software realiza el seguimiento automtico de los
nlaces de cada pgina para indexar nuevos recursos o para' actualizar los
xistentes. Este mtodo tambin carece de normalizacin.
Para la bsqueda, los buscadores utilizan expresiones que son combiaciones de palabras clave (keywords) que el usuario introduce en el
ampo de texto. La combinacin de estas palabras clave es enviada al
iotor de bsqueda, que se encarga de rastrear en la base de datos docuientos que las contengan.
Existen bsicamente tres formas de armar una expresin de bsqueda:

1. Palabras clave (keyword).


2. Preguntas en lenguaje natural (natural language search que ries).
Se rastrea cada trmino introducido, a excepcin de las palabras vacas
stop words) tales como: y (and), con (with).
Con el lenguaje natural el usuario puede introducir una expresin en
arma de pregunta tal como: Dnde puedo encontrar informacin acerca
le? ("Where can I find information on...?'9, o Qu es...? ("What is the...?'9,
Dnde hay...? ("Where is...?'9.

CAPTULO VII. METADATOS Y RECUPERACIN DE LA INFORMACIN

105

Los resultados de la interrogacin en lenguaje natural varan de un


tpico a otro.

3. Conceptos (concept searching, fuzzy searching, query by theme).


A veces el usuario no utiliza las palabras clave precisas para encontrar
toda la informacin que necesita, razn por la cual las bsquedas por conceptos permiten ampliar el espectro a travs de ciertos tpicos relacionados.
La mayora de los buscadores permite operaciones booleanas y/o relacionales, truncamiento y adyacencia.
Existen dos formas de realizar bsquedas:
A travs de una expresin de bsqueda construida por el usuario.
A travs de opciones que ofrece el buscador donde se limita la interrogacin a una parte especfica de la base de datos.
Cada buscador tiene su propio criterio para clasificar los resultados.
Dichos criterios se basan en mtodos de anlisis estadstico y/o ponderacin, y presentan los resultados organizados segn un ranking de relevancia. A continuacin, se citan algunos criterios:
De acuerdo con la cantidad de enlaces que tienen otros sitios web a
la pgina que contiene el trmino de bsqueda ingresado por el
usuario. Es decir, la cantidad de veces que una pgina es citada. Este
criterio, en cierta forma, excluye aquellos recursos nuevos y de muy
buena calidad que en un principio son poco citados por el slo
hecho de ser recientes y an pocos conocidos. En estos casos predomina la cantidad de enlaces en lugar de la calidad.

Frecuencia de aparicin de las palabras clave y frases en el documento recuperado.

Ubicacin de las palabras clave, generalmente los documentos que


las contienen en el ttulo tienen mayor relevancia que los que las
incluyen en el resto del texto o en el URL.

Ventajas:
Son fciles de usar.
Son rpidos.
Son automticos.

o6

METADATOS PARA LA DESCRIPCIN DE RECURSOS ELECTRNICOS EN LINEA


CAPITULO VII. METADATOS Y RECUPERACIN DE LA INFORMACIN

107

Desventajas:

Directorios (web directories)


Estn preparados para leer texto en ASCII, por lo tanto no pueden detectar el texto comprendido dentro de grficos. Si stos no
estn acompaados por un texto, o no contienen metadatos,
resultan inaccesibles.

Baja eficacia, muchas veces se recupera demasiada informacin no


pertinente. Una palabra clave puede aparecer en un texto que no
tiene ninguna relacin con la informacin que interesa.

En general, no permiten la bsqueda por varios campos especficos,


como por ejemplo: autor, ttulo, etc.
No manejan sinnimos ni homnimos.

No recuperan informacin de sitios a los cuales se accede con clave,


ni al contenido de bases de datos. A esta parte de la Web comnmente se la conoce como la "Web invisible".

Metabuscadores (metasearch engines)


En la actualidad, ningn buscador puede indexar
)da la World Wide Web; cuando no se encuentra material a travs de
no hay que recurrir a otros. Los metabuscadores ofrecen una solucin
este problema utilizando una nica interface de bsqueda para rastree en mltiples buscadores. No tienen una base de datos propia sino que
uscan simultneamente, recopilan y organizan los resultados que arroin otros. Algunos ofrecen un formulario nico a travs del cual se enva
expresin de bsqueda a cada uno de los buscadores incluidos, mienas que otros simplemente ofrecen un campo de texto para realizar el
istreo en uno de ellos en particular. Ejemplos de metabuscadores son:
ogpile, lxquick, Metacrawler.
La eficacia en la recuperacin de un metabuscador est supeditada al
incionamiento de cada buscador individual con el que trabaja. En general,
enen las mismas ventajas y desventajas de los buscadores. Algunas venjas con respecto a estos ltimos son que no muestran todos los resultas de cada buscador sino que hacen una seleccin de los ms relevantes,
celen ser muy rpidos y simplifican la bsqueda al usuario evitndole
petirla en varios buscadores.

Son tambin conocidos como catlogos web (web


catalogs). Se estructuran en forma de listas de categoras en un orden jerrquico, incluyen una limitada cantidad de sitios y se basan en la clasificacin humana. Se trata de sistemas precoordinados de recuperacin de informacin. Se basan en criterios semnticos de organizacin del conocimiento. Algunos ejemplos de directorios son: Google Directory, The Environment
Directory, Yahoo! Directory, LookSmart, Open Directory Project.
Ventajas:
Segn seala Callery (1997):
Los resultados de la bsqueda son ms relevantes.
El usuario no necesita conocer todos los sinnimos de un trmino de bsqueda.
Ofrecen la posibilidad de descubrir tems relacionados incluidos en
el mismo tpico ya que las categoras vinculadas actan como referencias de "vase adems" guiando al usuario.
Desventajas:
Tienen dos limitaciones:
a) Cantidad de informacin; abarcan en forma limitada cierta cantidad
de enlaces, el trabajo es realizado por personas y esto no permite asumir el crecimiento incesante de la Web.
b) Falta de estandarizacin en cuanto al nombre de las categoras
entre los distintos directorios.
Insumen mayor tiempo que una bsqueda a travs de un formulario de interrogacin.
Las desventajas reseadas en los sistemas de uso generalizado de recuperacin de informacin han impulsado el desarrollo de herramientas que
intentan mejorar los resultados; por ello algunos de los sistemas se basan
en metadatos y/o estructuracin de la informacin.
La mayora de los motores de bsqueda no registran metadatos, y en
el caso de que estn preparados para reconocerlos, la mayor parte de
los autores/editores de las pginas web no utilizan un modelo de meta-

METADATOS PARA LA DESCRIPCIN DE RECURSOS ELECTRNICOS EN LINEA

os

de forma generalizada que permita insertar en la cabecera del


umento esta informacin.

_os motores de bsqueda, si es que soportan metadatos, operan con


metadatos de banda 1 segn la clasificacin de Demspey y Heery (1998),
lo cual no existe una verdadera estructuracin previa de la informacin,
que los datos sobre los datos se extraen de manera automtica y sin
renciacin. Algunos buscadores pueden basar su recuperacin en meta)s como DC, tal es el caso de Ultraseek y MetaStar.
'or otra parte, ha surgido el concepto de Web semntica. Segn lo expliBerners Lee, Hendler y Lassila (2001), la Web semntica brindar una

CONCLUSIONES

ictura a los contenidos significativos de las pginas web, creando un


dente donde el software de rastreo pueda llevar a cabo rpidamente tareofisticadas para los usuarios. Para que la Web semntica funcione, las comedoras tienen que tener acceso a colecciones estructuradas de informacin.
:omo seala Mndez Rodrguez (2002), los metadatos sern un mtodo
tivo para la descripcin de informacin en la Web, si adems de convertirn estndares nacionales o internacionales, se aplican consistentemente por
:readores de los recursos y las aplicaciones de bsqueda se basan en ellos.

La catalogacin es una representacin que consiste en la especificacin de una serie de caractersticas del documento, y es el primer puente que media entre los documentos y el usuario. Estas
representaciones documentales han recibido diferentes nombres a
lo largo del tiempo: ficha catalogrfica, registro bibliogrfico; y en
la actualidad se las denomina con el trmino metadatos.
Acordamos con Gorman (2000) y con Pinto Molina (2002) en que,
en teora, catalogacin y metadatos son equivalentes, pero como
bien sintetiza Mndez Rodrguez (2002), la descripcin de los
recursos electrnicos en Internet, realizada manualmente por profesionales, slo puede abarcar un universo muy pequeo; si se
piensa en toda la Web, es ilusorio e impracticable, amn de excesivamente costoso. La estructuracin de la informacin a travs
de la inclusin de metadatos desde el nacimiento del recurso

METADATOS PARA LA DESCRIPCIN DE RECURSOS ELECTRNICOS EN LINEA

CONCLUSIONES

electrnico es por el momento la alternativa viable para la descripcin de contenidos en Internet.


A nuestro juicio, los diferentes esquemas de metadatos van a coexis-

contenido de los documentos, en estrecha vinculacin con informticos y bibliotecarios.

tir, se aplicarn unos u otros de acuerdo con las necesidades, por lo

nal, que tienda a la interoperabilidad en el escenario de la sociedad


global del conocimiento.

para posibilitar el intercambio entre los diferentes esquemas. En este


sentido, Resource Description Framework (RDF), que slo se menciona brevemente en este trabajo, es un marco adecuado para lograr la

En el mbito de las bibliotecas, MODS se perfila como una opcin viable, ya que es compatible con MARC, que es ampliamente utilizado.
Se pasara del catlogo nico y centralizado a uno distribuido, con
metadatos asociados a los documentos, registros adicionales creados por bibliotecas y centros de informacin, que puedan ser recuperados e interpretados por motores de bsqueda.
Consideramos muy importante la opcin de los metadatos embebidos, que nacen con el documento electrnico, como catalogacin en
fuente o "portada electrnica normalizada" a travs de una cabecera.
De todos modos, no ser tarea fcil conseguir que autores y editores
agreguen esta informacin y lo hagan de manera normalizada, pero
un documento en la red sin metadatos, tendr escasa o nula visibilidad. Tendr que surgir algn software de asistencia para la asignacin
de metadatos de manera gil.
Como se dijo anteriormente, los metadatos sern un mtodo efecti-yo para la descripcin de informacin en la Web, si los creadores de
los recursos los aplican consistentemente y los motores de bsqueda se basan en ellos.
Los bibliotecarios tienen un campo de accin destacado en este
mbito de estudio, al tener una larga tradicin en la metodologa de
estructuracin de sistemas de informacin.
La descripcin de recursos electrnicos disponibles en la Web requiere de un trabajo interdisciplinario entre los especialistas autores del

Los proyectos cooperativos jugarn un papel importante en la formalizacin de estndares de metadatos de reconocimiento internacio-

que el desarrollo deber ir por el camino de la interoperabilidad,

interoperabilidad de los diversos modelos de metadatos, en el


ambiente web basado en XML.

111

Resultara muy interesante para un estudio posterior investigar sobre


las iniciativas de Topic Maps, Web Ontology Language OWL, que surgen
como complemento de RDF para la construccin de la Web semntica.

BIBLIOGRAFA
CONSULTADA

Beall, J. (1997). Cataloging World Wide Web sites consisting mainly of links.
Journal of Internet Cataloging, 1 (1), 83- 92
Bemers Lee, T.; Hendler, J. & Lassita, 0. (mol). The Semantic Web.
Recuperado el 6 de junio de 2008, de http://www.personal.si.umich.edu
hrfrost/courses/SIno/readings /In Out and Beyond /Semantic Web.pdf
Bumett, K.; Bor Ng, K. & Park, S. (1999). A comparison of the two traditions
of metadata development. JASIS, 5o (13), 1209-1217
Catlery, A. & Tracy-Proutx, D. (1997). Yahoo! cataloging the web. Journal of
Intenet Cataloging., 1 (1), 57-64
Captan, P. (1997). To Hel(sinki) and back for the Dublin Core. Public Access
Computer Systems Review. 8 (4). Recuperado el lo de octubre de 2
009,
de http://info.lib.uh.edu/pr/v8/n4/capl8n4.html
Captan, P. (1995). You call it corn, we call it syntax-independent metadata for document - like objects. The public access computer systems
review , 6 (4),19-23

METADATOS PARA LA DESCRIPCIN DE RECURSOS ELECTRNICOS EN LNEA

BIBLIOGRAFA CONSULTADA
115

Rosa, A. & Senso, J. (1999). XML como medio de normalizacin y


sarrollo documental. Revista Espaola de Documentacin Cientfica,
( 4), 488-504.

sey, L. & Heery, R. (1998). Metadata: a current view of practice and


ues. loumal of Documentation, 54 (2 ), 145-172
M.J. (1999). "Stuff" about "Stuff" the different meanings of metadaVine, 116, 6-13

Core Metadata Initiative (2009). Recuperado el 22 de octubre de


09 del sitio web oficial del DCMI, http://dublincore.org/

Hsieh -Yee, 1. (200o). Organizing Internet resources: teaching cataloging


standards and beyond. OCLC Systems & Services, 16 (3), 130-145
'armella, R. & Waugh, A. (1997). Metadata. Enabling the Internet. Recuperado
el 23 de agosto de 2009, de http://ifla.queenslibrary.org/documents/libraries/cataloging/metadata/ianrtpdf

IFLA. Universal Bibliographic Control and International MARC Programme.


(1997) International standard bibliographic description for electronic
resources: ISBD(ER); revised from the ISBD(CF): International standard
bibliographic description for computer Piles. Mnchen: K.G. Saur.

S. (1999). Digital indigestion is there a cure? EN: International


taloguing and Bibliographic Control. 28(1), 3-7

run, R. (2008). Lenguajes de marcas para la gestin de recursos digi-

Jul, E. (1997). Cataloguing Internet resources: surveys and prospectus.

es: aproximacin tcnica, especificaciones y referencia. Gijn: Trea.


er, R. (2003). MODS: Metadata Object Description Schema.

se sets of metadata. D-Lib Magazine, July/August. Recuperado el 17 de


diciembre de 2009, de http://www.dlib.org/dlib/july96/lagoze/o7lagoze.html

cuperado el 20 de septiembre de 2009, de http://www.jisc.ac.uk/uploed documents/tsw o3-o6.pdf

Lazinger, S. (2001). Digital preservation and metadata: history, theory, prac-

o Montoro, M.J.; Barrueco Cruz, J.M. & Garcia Testal, C. Catalogacin de


ursos electrnicos accesibles en Internet: revisin de propuestas para
a normativa. FESABIB 98. VI Jornadas Espaolas de Documentacin.
-

cuperado el 3 de noviembre de 2009, de http://www.ciepi.org/fesai93y,,-;, .-:irncinnes/rnj gimeno.htm

In, M. (2000). Metadatos o catalogacin? Un cuestionario errneo.


F.F. Martnez Arellano & L. Escalona Ros (Comps.). Internet, metada-

; y acceso a la informacin en bibliotecas y redes en la era electrni(pp. 1-20). Mxico: Universidad Nacional Autnoma de Mxico.

Tom, M. & Montogomery, S. (1998). Digital preservation needs


d requirements in RLG members institutions. Mountain View,
iifornia: Research Library Group. Recuperado el

11 de agosto de
09, de http://www.ocic.org/research/activities/past/rIg/digpresnes/digpres.pdf

, R. (1996). Review of Metadata Formats. Program, 30 (4), 345373.


, R. (1998). What is
RDF? Ariadne, 14. Recuperado el lo de octubre
2009, de http://www.ariadne.ac.uk/issue14/what-is/

ns, J. (200o). USMARC como estructura de metadatos. En: F.F. Martnez


llano & L. Escalona Ros, L. (Comps.). Internet, metadatos y acceso a
informacin en bibliotecas y redes en la era electrnica (pp. 21-35).
xico: Universidad Nacional Autnoma de Mxico.

Bulletin of the American Society for Information Science, 24

(1),

6-9

Lagoze, C. (1996). The Warwick Framework: a container architecture for diver-

tice. Englewood, Colorado: Libraries Unlimited.

Law, D.G. (1996). Electronic data archiving and acces. Joint ICSU
Press/Unesco Expert Conference on Electronic Publishing In Science.
Unesco, Paris, 19-23 February 1996. Recuperado el 12 de agosto de
2009, de http://www.library.uiuc.edu/icsu/law.htm

Lyons, P. (1997). Managing access to digital information: some basic terminology issues. International Information & Library Review, 29 , 207-208

MARC Standards (2009). Recuperado el

16 de diciembre de 2009, del sitio


Web de la Library of Congress http://www.loc.gov/marc/

Martnez Arellano, F.F. & Escalona Ros, L. (Comps.) (2000). Internet, metadatos y acceso a la informacin en bibliotecas y redes en la era electrnica. Mxico: Universidad Nacional Autnoma de Mxico.

Mndez Rodrguez, E. (2002). Metadatos y recuperacin de informacin. Gijn: Trea.

Milstead, J. & Feldman, S. (1999). Metadata: cataloging by any other name.


Online, 23

(1),

24-31

MODS. Metadata Object Description Schema official Web site (2009).


Recuperado el 29 de octubre de 2009, del sitio web de la Library of
Congress: httP://www.loc.gov/standards/mods/

NISO Standard Z39.85-2007 (2007): The Dublin Core Metadata Element Set.
Recuperado el 15 de diciembre de 2009, del sitio web de NISO
http://www.niso.org/standards/resources/239-85-2oo7.pdf

ETADATOS PARA LA DESCRIPCIN DE RECURSOS ELECTRNICOS EN LINEA

Molina, M., Garca Marco, F.J. & Agustn Lacruz, M. (2002). Indizacin
esumen de docurnentos digitales y multimedia. Gijn: Trea.
Descripcin y acceso al recurso. (2009). Recuperado el 18 de diciembre
2009 del sitio web del Joint Steering Comit for Development of RDA
LL
: vvvvw.
ocs rdabrochure-spp
a. df
kcademia Espaola (1991). Diccionario de la lengua espaola (201 ed.).
idrid: Real Acadern la Espaola.
s de catalogacin angloamericanas (21 ed., rev. 2002, act. 2003)
)04), preparadas bajo la direccin de Joint Steering Committee for
vision of AACR. Bogot: Rojas Eberhard
J.T. (1995). Cataloguing Internet resources: the Library approach. The
ctronic Library, 13 (5), 467-476.
erg-McQueen, C.M- & Bumard, L. (eds.) (2004). TEl P4: Guidelines for
ctronic Text Encoding and lnterchange XML-compatible edition. The
Consortium. Recuperado el 31 de octubre de 2009 del sitio web ofi1 de TEI Consortiuni. http://www.tei - c.org/release/doc/tei-JD4-doc/html/
R. (2002). Metadata Activity Statement. Recuperado el 24 de enero de 2009
sitio web del W3 Consortium. http://www.w3.org/Metadata/Activity.html
/o y Tamayo (2001) . Metodologa formal de la investigacin cientfica.
xico, DF: Limusa, Noriega.
., A. (2004). The Organization of Information. (2nd ed.) Englewood, CO:
raries Unlimited.
)nsortium (eds.) (2009). TEl P5: Guidelines for Electronic Text Encoding
1 Interchange.Version 1.5.o. Recuperado el 17 de diciembre de 2009 del
o oficial de TEI Consortium. http://www.tei-c.org/release/doc/tei-p5-doc
/html/index.html
nsortium (eds.) (2009). The Text Encoding lnitiative. Recuperado el 25 de

ubre de 2009, del sitio web del TEI Consortium. http://www.tei-c.org/


nt, R. (1998). 21st century cataloguing. Library Journal, 123 (7), 30-31.
standing metadata (2004). Bethesda, MD: NISO.
Dublin Core. Dublin Core Qualifiers. (2005). Recuperado el 12 de noviemde 2009, de httplublincore.org/documents/usageguide/qualifiers.shtml
ci, S. (1998). Metadata. ......_.,
ARP IT 33, 187-222.
(eds.) (2004). RDF/XML Syntax Specification (Revised). W3C
: ommendation lo February 2004. Recuperado el 6 de junio de 2009
sitio official del W3C: h ttp://www.w3.org/TR/rdf-syntax-grammar/
yds..) (1999). Resource Description Framework (RDF) Mode! and Syntax
,cification W3C Recornmendation 22 February 1999. Recuperado el 12
de
-zo de 2009 del sitio oficial del W3C: http://www.w3.org/TR/1999/REC-rdftax-19990222/

BIBLIOGRAFA CONSULTADA

117

Waters, D.J. (1995). The social organization of archiving digital information.


Recuperado el 22 de diciembre de 2009, de http://ifla.queenslibrary.org/documents/libraries/net/waters2.htm
Weibel, S. (1997). The Dublin Core: a simple content description model for
electronic resources. Asis Bulletin, 24 (1). Recuperado el lo de septiembre de 2009, de http://www.asis.org/Bultetin/Oct-97/weibel.htm
Weibel, S. & Dekkers, M. (2002). Dublin Core Metadata Initiative Progress
Report and Workplan for 2002. D-Lib Magazine, 8 (2). Recuperado el 23
de octubre de 2009, de http://dx.doi.orgho.1045/february2oo2-weibel
Wendler, R. (2000). Diversificacin de actividades: habilidades y funciones catalogrficas en la era digital. En: F.F. Martnez Arellano & L.
Escalona Ros (Comps.). Internet, metadatos y acceso a la informacin
en bibliotecas y redes en la era electrnica (pp. 36-48). Mxico:
Universidad Nacional Autnoma de Mxico.
Woodward, J. (1996) Cataloging and classifying information resources on
the Internet. ARIST, 31 , 189-220.
Xu, A. (1997). Metadata conversion and the library OPAC. Recuperado el 12
de octubre de 2007, del sitio web de IFLA: http://www.ifla.org/documents/libraries/cataloging/metadata/xu.pdf
Younger, J. (1997). Resources description in the digital age. Library
trends 45, 462-81

Anda mungkin juga menyukai