Anda di halaman 1dari 6

Formatos de archivo sustentable para la preservacin

digital
Thiago Giordano de S. Siqueira
+54 11 6016-0428
thiago.giordano@gmail.com




RESUMEN
El uso y la creacin de documentos en el contexto digital es una
realidad. Parte de los datos producidos y almacenados
actualmente ya estn en ese medio. La preservacin de los
documentos digitales - sobre todo en el contexto archivstico, es
una pregunta que se plantea en la agenda de discusin en el
mbito de la Documentacin y de la Ciencia de la Informacin.
Combinando las teoras y principios de la preservacin digital de
archivo, el trabajo destaca la importancia de definir un formato de
archivo sustentable, que dentro de la preservacin digital, discute
la importancia de identificar y describir los formatos de archivo
para asegurarse de que sea accesibles despus un largo perodo de
tiempo.
Categoras y Descriptores temticos
D.4.3 File Systems Management (E.5)
Trmino General
Standardization.
Palabras-clave
Documentos digitales. Preservacin. Formatos de archivo.
1. INTRODUCIN
La sociedad actual sufre transformaciones y organizaciones
experimentado cambios culturales en los que, cada da, tener
acceso a un nmero y una mayor informacin y, en consecuencia,
producir ms y ms documentos, que aparecen ya en formato
digital. Adems, la preferencia por los objetos digitales ocupan
poco se produce en volumen desde el punto de vista de la
capacidad de almacenamiento de la informacin, en comparacin
con la forma analgica equivalente; adems permiten el acceso
simultneo de varias personas al mismo documento y son
fcilmente transferibles, replicable, editable y en algunos casos es
posible establecer vnculos entre los diversos contenidos a travs
de enlaces (links).
Varios instrumentos se utilizan para el control, la organizacin y
el mantenimiento de archivos, tanto los compuestos de los
documentos de archivo sobre un medio fsico y digital. Un
documento de archivo en un intento de justificar la importancia de
este tipo de enfoque, que debe quedar claro que el concepto de
Schellenberg (1956: 41) define los archivos como documentos de
cualquier institucin pblica o privada que se han considerado de
valor, mrito preservacin permanente con el propsito de
referencia e investigacin y que han sido depositados o
seleccionados para su depsito en un archivo de la custodia
permanente. Es decir, no hay importancia del acceso que se
produce ya sea en una perspectiva del archivo como una
institucin que permite a la organizacin de los documentos segn
una jerarqua funcional y sobre todo porque esos documentos
tienen un valor de prueba de alguna actividad o la informacin
histrica y cultural contenida en el mismo.
En este contexto, surge la necesidad de un nuevo tipo de
informacin de direccin, la informacin digital. Esto se debe a
que "Si bien las nuevas TIC estn cambiando los conceptos de
documentos y registros con respecto a la informacin digital, estos
documentos registrados en los medios digitales son ms frgiles
que los de papel y corren mayor riesgo de prdida a lo largo del
tiempo. Estas informaciones contienen un valor histrico para
muchos gobiernos, instituciones e individuos, y si no se tratan y
preservadas adecuadamente sern prdidas para las generaciones
futuras (Rothenberg, 1991: 1).
2. PRESERVACIN DIGITAL
De acuerdo con Ferreira (2006), la preservacin digital se define
como la capacidad de garantizar que la informacin digital
permanezca accesible y con calidad de autenticidad para que
pueda, en el futuro, ser interpretada en una diferente plataforma
de tecnologa que ya no es la misma utilizada en el momento de la
creacin. La preocupacin con la preservacin se debe a que, en
el caso de que los objetos digitales a pesar de que se les hayan
aplicadas las tcnicas de preservacin adecuadas, defectos
mnimos en su contenido pueden invalidar todos los archivos.
Esto se debe a las particularidades de la tecnologa utilizada para
crear los archivos y formar los grupos de bits. Es decir, que lo
conjunto de bits fijados en un archivo, conforman una estructura
que necesita ser respetada rigurosamente.
Considerando una serie de estrategias que deben ser diseadas
para garantizar la longevidad de la preservacin de un documento
digital, se limita aqu a los formatos de archivo. Primero hay que
entender que para cada formato de archivo generado por un
software en particular, hay una especificacin tcnica.
Posiblemente dentro de esta especificacin tcnica, habr una
versin de un formato en particular, que a su vez, tambin poseer
detalles tcnicos especficos. Y, dependiendo del formato de
archivo, la versin podr contener especificaciones tcnicas
diferenciadas para cada versin distinta del mismo formato.
La gran explosin de formatos de archivo se produjo con la
aparicin de los micros computadoras y las computadoras
personales. Actualmente hay una inmensa cantidad de
especificaciones tcnicas para estos formatos as como tambin
nuevos softwares ests sendo creados y puestos en el mercado

Se concede permiso para hacer copia digital o impresa de parte o la
totalidad de esta obra para uso personal o en el aula sin honorarios
proporcionado las dichas copias desde que no se realicen o se
distribuyan con fines de lucro o ventaja comercial y qu las copias
presenten este aviso y la cita completa en la primera pgina. Para copiar
de otro modo, o volver a publicar, para publicar en servidores o
redistribuir en listas, se requiere una autorizacin previa. .
Paper presentado como evaluacin al Seminario de Preservacin Digital,
Octubre de 2014, Ciudad Autnoma de Buenos Aires, Argentina.
diariamente. Las especificaciones de cada formato son de carcter
bastante tcnico y estn en el mbito de los desarrolladores de
software en general. Tales especificaciones tcnicas, tratan de
explicar, en detalle, como las secuencias de bits en el archivo
deben ser estructuradas y donde cada tipo de dato debe ser
registrado. Por supuesto, para cada tipo de archivo habr
diferencias en las especificaciones.
Con respecto a los problemas con la preservacin de los formatos
de archivo, se debe considerar el hecho de ser un formato
propietario o no. Los formatos abiertos de archivos, es decir,
aquellos en los que el pblico tiene acceso a los detalles tcnicos,
son ms adecuados para la preservacin futura porque las
posibilidades para comprender el significado de la estructura de
bits son mayores.
En consulta al artculo The bits and bites of data formats:
stainless design for digital endurance, Aschenbrenner (2004)
hace algunas consideraciones acerca de la variedad de formatos de
archivo existentes y cmo esto cambia rpidamente. Por lo tanto,
destaca que lo ideal sera disponer un formato estndar que
permita descifrar los objetos en el futuro. En este artculo el autor
sugiere una serie de criterios que son importantes al considerar la
definicin de un formato de archivo de datos, a saber: a) Debe
tenerse en cuenta que la razn de la definicin de un formato es
almacenar informacin; b) El formato es en realidad un
contenedor de informacin en diferentes niveles. Adems del
contenido real, tambin puede almacenar informacin que
controla funcionalidades especficas de una aplicacin de
software; c) El tamao del objeto de datos resultante. Debe
considerarse cunto deber invertir en un espacio para almacenar
y transmitir el objeto. Aunque la prdida de calidad pueda parecer
aceptable en el presente, en el futuro podr exigir la calidad
original. Para preservar los objetos digitales, la compresin debe,
por lo tanto aplicarse solamente despus de una cuidadosa
deliberacin; d) Pueden necesitar ser considerada implicaciones
para el desempeo de un sistema. Un formato de datos podra ser
necesario para facilitar el acceso eficiente a la manipulacin de la
informacin; e) En algunos casos, la extensibilidad y la
generalidad de un formato pueden ser altamente deseable; f) Otros
formatos pueden influir en la concepcin de un nuevo formato de
datos, con el objetivo de permitir la compatibilidad. Aunque sea
versiones anteriores o posteriores de compatibilidad; g) Se deben
tomar medidas especficas para garantizar la integridad de la
informacin. Por lo tanto es necesario incorporar medidas contra
la prdida de datos, la denegacin de acceso a la informacin a
personas no autorizadas, as como los criterios de seguridad y
confidencialidad.

Aschenbrenner (2004) pone de relieve al final que incluso con
todas estas preocupaciones siendo consideradas como criterios
estratgicos para definir los formatos de archivo sustentable, el
estndar establecido lo que sea, no va a sobrevivir para la
eternidad.

En el mismo artculo el autor afirma que el formato XML suele
ser y por buenas razones, promovido como un formato estndar
para fines de preservacin. Sin embargo, un formato de
preservacin basado en XML es inapropiado para algunos tipos
de datos, y en algunas circunstancias, porque este formato define
una sintaxis superficial para documentos estructurados - en
notacin y reglas estructurales bsicas, dejando deseado la
presencia de algunos elementos para describir la semntica, es
decir, el significado de un objeto digital; y as resulta inadecuado
para servir como un formato de datos completo.

Sumado a esto, afirma que el exceso del esquema perturba la
lectura y organizacin, as como, por supuesto, no es legible para
humanos. Todava, ms importante tener un concepto claro de
formato de archivo es pensar en el mbito prctico de las cosas, o
sea, la necesidad de crear un modelo de referencia para la
comparacin con los formatos de archivo en uso de manera
efectiva en una determinada organizacin para poder establecer
criterios de la creacin de una poltica que desarrolle procesos
sistemticos. Es decir, con la existencia de un modelo apropiado
sera posible diagnosticar si un formato de archivo en particular,
efectivamente en utilizacin por cierta organizacin se encuentra
cerca de lo deseable o no para la preservacin y la recuperacin
en el futuro.

Estructurar un formato de archivo sustentable ideal es complejo,
lo que implica la participacin de un equipo multidisciplinario y
es el producto de la ingeniera de software. Dependiendo de los
tipos de contenido del formato de archivo: imagen fija, Imagen en
movimiento, sonido texto o incluso una combinacin de estos y
otros tipos; el formato de archivo puede tener una especificacin
bastante extensa. Por lo tanto, tambin se puede disponer de
tecnologas relacionadas para comprimir el tamao de bytes de los
archivos o an se puede adoptar mecanismos para encriptar estos
archivos. Es decir que estos tipos de archivos se transforman a
partir de su forma original a otro ilegible, por lo que slo puede
ser conocido por su destinatario.

Un formato de archivo tiene caractersticas abstractas y son
compuestos por elementos con directrices generales con respecto
a las cuestiones de autenticidad y fiabilidad, as como la estructura
de los metadatos necesarios. Al pensar en un modelo de archivo
para la conservacin o archivo, tenga en cuenta que el objetivo
aqu no es para uso normal (administrativo).

3. CARACTERSTICAS DE UN FORMATO
DE ARCHIVO
Hay un proyecto creado por la Library of Congress en Estados
Unidos con el fin de apoyar las decisiones sobre la conservacin
digital en relacin con el uso de formatos de archivo. Este
proyecto tiene como objetivo "la elaboracin de un inventario de
informacin acerca de los formatos de archivo en ascenso" y
"identificar y describir las formas que son prometedoras para la
preservacin durante largos perodos y desarrollar estrategias para
apoyar a estos formatos incluyendo recomendaciones relacionadas
con las herramientas y la documentacin necesarias para su
gestin "(ARMS; FLEISHHAUER; MURRAY 2013).
En palabras de los autores son siete los factores de sostenibilidad
que se aplican a los formatos digitales para todas las categoras de
informacin. "Estos factores influyen en la viabilidad y el costo
probable de preservar el contenido de la informacin frente a los
futuros cambios en el ambiente tecnolgico en el que los usuarios
y las instituciones archivsticas operan" (ARMS;
FLEISHHAUER; MURRAY 2013).
Conocer estos factores podra significar el diseo de una
estrategia basada en las acciones de preservacin sean ellas la
migracin a nuevos formatos la emulacin de software actual en
las computadoras del futuro o de un enfoque hbrido. En realidad
esta medida va a contribuir a la definicin de los factores de
sustentabilidad sobre los formatos de archivo ms apropiadas para
la preservacin stos se aplican a todas las categoras de
informacin e influyen en la viabilidad y el costo de la
preservacin del contenido.
Los siete factores son: Apertura de la especificacin (Disclosure),
Adopcin (Adoption), Transparencia (Transparency), Auto-
documentacin (Self-documentation), Dependencias externas
(External Dependencies), Impacto de las patentes (Impact of
patents), Mecanismos tcnicos de proteccin (Technical
Protection Mecanisms). Describiendo lo que comprende cada uno
de estos elementos, de acuerdo con el nombramiento original
sealado y explicado en Arms; Fleishhauer; Murray (2013).
Se refiere Disclosure el grado en que hay especificaciones
completas e instrumentos para la validacin de la integridad
tcnica. Sobre todo que tales especificaciones estn accesibles a
los que crearn o seguirn con el mantenimiento del contenido
digital. Es decir, es necesario tener algn material que permita el
conocimiento y haga comprensible cmo se representa la
informacin (codificada) en bits y bytes en archivos digitales de
una determinada caracterstica. Este es un factor que determina la
eleccin de estndares abiertos, ya que estos suelen ser ms
documentados, o al menos estn ms ampliamente publicado que
los estndares propietarios. Sin embargo, es importante que exista
la documentacin y pueda someterse a evaluacin por expertos
externos para evaluar que las especificaciones sean adecuadas. La
barrera que se podra encontrar ocurre debido a las patentes que
bloquean la difusin de los detalles tcnicos para el pblico, por
lo tanto inhibe la adopcin de un formato u otro simplemente
porque no se puede acceder al cdigo fuente del software de
renderizacin asociado, herramientas de validacin, y kits de
desarrollo de software que tambin contribuyen a la publicacin.
Adoption, se refiere al grado que los el formato ya es utilizada por
los principales creadores o difusores de los recursos de
informacin. Esto incluye el uso de un formato master, para su
entrega al consumidor final, o que haya una comunidad que ya
usa como un medio de intercambio entre sistemas. Al ser
ampliamente adoptado, es menos probable que se convierta
rpidamente obsoleto, y las herramientas para la migracin y la
emulacin son ms propensas a salir de la propia industria sin la
necesidad de inversin por parte de las instituciones que adoptan
un dicho modelo.
Transparency corresponde al grado en el que la representacin
digital est abierta a anlisis directo, incluyendo una interfaz
legible por humanos usando slo un editor de texto. Se cree que
los formatos digitales en los que la informacin se representa de
una manera simple y directa sern ms fciles de migrar a nuevos
formatos y ms susceptibles a la arqueologa digital; desarrollo de
software de renderizacin (diseo fiel) para los nuevos entornos
tcnicos o an software de conversin. As, ocurre los aumentos
de transparencia y se hace ms evidente si el contenido textual
(incluyendo metadatos incrustados en archivos de contenido no
textual) se est codifica en la codificacin de caracteres por
estndares. Por esa cuestin que los formatos de archivo
comprimidos o encriptados son incompatibles con este criterio
puesto inhibe la lectura de un archivo. En resumen, este criterio se
refiere a los formatos utilizados para almacenar archivos y
contenido sin prdidas y para garantizar la transmisin eficiente.
El concepto de la arqueologa digital puede ser comprendido
como una estrategia de emergencia que intenta rescatar los
contenidos digitales que estaban almacenados en medios que han
sido daados fsicamente, o que pertenecan a entornos de
hardware y software obsoletos o daados. Para llevar a cabo esta
estrategia, es necesario aplicar tcnicas especializadas para
recuperar la informacin que aunque sigue estando almacenada,
no puede ser interpretada por los medios y por tanto, se ha
convertido en ilegible. (DANOSO, 2009:24).
Antes de describir los siguientes factores de sustentabilidad, es
necesario entender lo que son los metadatos y cul es su
importancia al considerar los formatos de archivo sustentables.
Primero se aclara que muchos de los procedimientos de
preservacin digital existente son posibles a travs de estos. El
hecho de conocerlos que son datos sobre datos no lo es
suficientemente claro. De acuerdo OCLC/RLG Working Group on
Preservation Metadata (2001:2) citan y consideran la idea de
Wendler (1999) para decir que en el contexto de los objetos
digitales, los metadatos estn asignados a una de tres categoras
funcionales:
Descriptiva: facilitar el descubrimiento y identificacin de las
fuentes;
Administrativa: apoyar la gestin de recursos dentro de una
coleccin;
Estructural: unir los componentes de los objetos de informacin
complejos
Los metadatos pueden, por ejemplo, registrar procedimientos
asociados con la preservacin, especificando los derechos de
acceso y establecer la autenticidad del contenido digital. Puede
unirse a los diversos componentes constituyentes de un objeto
complejo y tambin a las diferentes versiones de un mismo objeto.
En otras palabras, se puede atribuir la creacin de los metadatos
de preservacin a la caracterstica de ser un componente clave
para la mayora de las estrategias de preservacin digital siempre
y cuando disponga de una estructura genrica, amplia,
estructurada y aplicable a una amplia gama de objetos, actividades
e instituciones de preservacin.
Una vez aclarado esto, podemos continuar con el factor Self-
documentation implica considerar que los objetos digitales que
son auto-documentados tienden a sostenerse a largo plazo y sean
menos vulnerables a la catstrofe de los objetos de datos que se
almacenan por separado de todos los metadatos necesarios para
procesar los datos como informacin utilizable o an entender su
contexto. Un objeto digital que contiene metadatos descriptivos
bsicos y tambin incorpora los metadatos tcnicos y
administrativos a su creacin y etapas iniciales de su ciclo de vida
sern ms fciles de administrar y monitorear la integridad y la
usabilidad y la transferencia fiable de un sistema de archivos para
el sistema sucesor. Esto tambin contribuye a permitir el
entendimiento a los que estudian o manipular el documento tenga
como observar las relaciones entre el objeto visto y lo que se
utiliza en su ambiente tcnico original. La capacidad de un
formato digital para asegurarse (con transparencia) los metadatos
adems de lo necesarios para la prestacin de contenidos bsicos
en el entorno de tcnico actual es una ventaja para fines de
preservacin.
Algunos elementos de metadatos pueden ser extrados para su uso
en el catlogo de biblioteca y otros sistemas diseados como
repositorios especficos, para ayudar a los usuarios a encontrar los
recursos pertinentes. En realidad, muchos de los elementos que
sern necesarios para sostener los objetos digitales frente a los
cambios tecnolgicos no se guardan en los catlogos de
bibliotecas o registros de apoyo al descubrimiento. El modelo de
referencia llamado Sistema Abierto para Archivar la Informacin -
Open Archival Information System (OAIS) surge en el contexto
de la preservacin digital como una arquitectura para la
construccin de archivos digitales. Reconoce la necesidad de
apoyar las informaciones (metadatos) en varias categoras:
representacin (para permitir que los datos a sean prestados y
utilizados como informacin); de referencia (para identificar y
describir el contenido); contexto (por ejemplo, para documentar la
finalidad para la creacin del contenido); fijacin (para permitir la
verificacin de la integridad de los datos de contenido); y la
procedencia (para documentar la cadena de custodia y ningn
cambio desde que se cre originalmente el contenido). Estos
formatos se aplicarn tambin a los metadatos significativos a la
preservacin a grabarse en el momento adecuado, por lo general a
principios del ciclo de vida del objeto de contenido. Bsicamente,
el documento _ propone una estructura de requisitos de hardware
y trminos correspondientes, y para cada uno de ellos, las
definiciones en una clase y las relaciones con campos bsicos
(nombre, origen, definicin, propsito y ejemplo)
External Dependencies, se refiere al grado en el que un formato
en particular depende de hardware en particular sistema operativo
o software para renderizar o al uso y la complejidad esperada de
tratar con esas dependencias en entornos tcnicos futuros. Esta
preocupacin se debe a que algunas formas de contenido digital,
especialmente los contenidos interactivos, estn diseados para su
uso con hardware especfico, tal como un micrfono, joystick, o
cualquier otro accesorio.
I mpact of patentes, implica considerar las cosas que el formato
digital puede inhibir la capacidad de las instituciones archivsticas
para sostener el contenido en este formato. Aunque los costos de
licencias para decodificar los formatos actuales suelen ser bajos o
nulos, la existencia de patentes puede retardar el desarrollo de los
codificadores y decodificadores de cdigo abierto. Cuando los
trminos de la licencia incluyen royalties en funcin del uso (por
ejemplo, una tasa de royality cuando se codifica un archivo, o
cada vez que se lo utiliza), los costos pueden ser altos e
impredecibles. No es la existencia de patentes que es un problema
potencial, pero los trminos que los titulares de patentes pueden
optar por aplicar. El impacto de las patentes puede no ser lo
suficientemente significativo por s mismo para justificar el
tratamiento como factor independiente. Incluso porque el hecho
de que puede ser una elevada inversin pensando a corto plazo, es
interesante notar que las patentes requieren un nivel de
informacin que debe facilitar el desarrollo de herramientas una
vez que han expirado las patentes en cuestin.
Finalmente, se presenta Technical Protection Mecanisms, el cual
establece que los guardias deben ser capaces de replicar el
contenido en los nuevos medios, migrar y normalizarlo frente a de
la tecnologa cambiante, y difundirlas a los usuarios en una
resolucin compatible con las restricciones de ancho de banda de
la red. En este sentido, el contenido para los cuales un repositorio
confiable asume la responsabilidad de largo plazo no debe ser
protegido por mecanismos tcnicos como la encriptacin o la
compresin ya que la primera se implementa para evitar espas o
el acceso a la informacin por personas indeseables y la segunda
impide leer el documento tal y como la figura original
obstaculizando as hacerlo accesible para las generaciones futuras.
Otra propuesta de archivos sustentables a ser consideradas para
fines de preservacin es el formato de la Library of Congress la
que se ocupa en la adopcin de un Formato Universal de
Preservacin Universal Preservation Format (UPF), este
propuesto por un grupo americano llamado WGBH. Este grupo es
una organizacin de tipo Public Broading Service (PBS), es decir,
que se caracteriza por una red televisiva de carcter educativo y
cultural, en contraposicin a las grandes redes comerciales que
operan en el pas. Existe desde 1970 y maneja medios en distintos
formatos, por lo que se dio cuenta de la necesidad de archivar con
la necesaria buena conservacin, y despus de realizar estudios,
surgi el proyecto UPF.
El referido proyecto se define como Un formato que funciona
independientemente del sistema operativo desde el que esta
aplicacin cre a un determinado contenido e independiente del
medio fsico sobre el cual es almacenado el contenido. Incluye,
dentro de sus metadatos y dems especificaciones tcnicas
necesarias para construir y reconstruir los navegadores de medios
adecuados para acceder y contengan los materiales a lo largo del
tiempo. Agregada tambin dispone un identificador nico que
viaja con ese objeto en el tiempo. Cualquier modificacin
realizada en el contenido del objeto refleja su identificador
(SHEPARD & McCarn, 2001:2)
UPF propone dos tecnologas como formatos de preservacin
donde un formato de archivo contiene ms de un tipo de datos. La
primera, "Especificacin Bento" es la tecnologa que propone usar
el trmino en el sentido de los nombres nicos a nivel mundial
nico identificador, brinda un mecanismo de asignacin de
nombres que puede ser utilizado por un gran nmero de
desarrolladores sin registro. La ventaja es que los objetos bajo tal
especificacin tambin utilizan un identificador nico llamado ID
persistente, lo cual permite ser lo nico en el mbito de un
Archival Information Package - Paquete de Informacin del
Archivo (AIP), as permite acceder a los objetos.
Shepard & McCarn (2001:7) adoptan la definicin de AIP
establecido por el modelo de referencia OAIS y lo entienden
cmo: Concepto de un paquete de informacin que requiere la
presencia de informaciones del contenido y todo lo que est
asociado a informacin descriptiva para la preservacin, la cual es
necesaria para preservar el contenido de la informacin a largo
plazo.
La segunda tecnologa sera Open Media Framework Interchange
(OMFI), ahora un formato estndar para el intercambio de datos
entre diferentes plataformas de medios digitales, adopta el uso de
la especificacin de Bento para establecer un formato estndar
para el intercambio de datos de medios digitales entre diferentes
plataformas. Se encapsula en un solo archivo toda la informacin
que necesita para el transporte de los medios digitales entre
distintas plataformas. Adems, el formato OMFI encapsula toda la
informacin necesaria para el transporte de una variedad de
medios digitales como audio, vdeo, imgenes fijas y grficos, as
como las reglas para combinar y presentar los medios de
comunicacin. Un solo archivo OMFI puede encapsular toda la
informacin necesaria para crear, editar y reproducir
presentaciones de medio digital.
La innovacin en UPF est por romper el vnculo entre el formato
de grabacin y la mquina a travs del cual se accede al formato.
Es, en realidad, un dibujo de una forma de encapsulacin que
puede agregarse en un solo archivo varios archivos que no estn
necesariamente en el mismo formato. Y sigue la lgica de
Rothenberg (1999:8) cuando dice que "[...] Es una encapsulacin,
despus de todo, no ms que la agrupacin lgica de elementos".
As que es una propuesta vlida para ser aplicada como un mtodo
eficaz por el hecho de que un formato de archivo se puede utilizar
para dar cabida a otros tipos de contenido, incluyendo sonido y
archivos de imgenes en movimiento que son las tendencias en
crecimiento. Adems, los metadatos son utilizados ampliamente
se asemejan a las funciones propuestas de la UPF.
Otra consideracin que se pueden tener en cuenta para la toma de
decisiones en lo que respecta al formato de archivo sustentable
para la preservacin digital es la gua de National Archives of
United Kindom (2008) que establece las directrices para la
planificacin y la seleccin de los criterios de evaluacin de los
formatos de archivo. En total son 12 los criterios, a saber:
Ubiquity (Popularidad), Support (Soporte), Disclosure
(Divulgacin), Documentation Quality (Calidade de la
Documentacin), Stability (Estabilidad), Ease of identification
and validation (Facilidad de Identificin y Validacin),
Intellectual Property Rights (Derechos de Propiedad Intelectual),
Metadata Support (Metadata Soporte), Complexity
(Complejidad), Interoperability (Interoperabiblidad), Viability
(Viabilidad), Re-usability (Reutilizacin).
Ubiquity(Popularidad), corresponde a comprobar si el formato se
ha establecido en la comunidad a la que va destinado. Sin
embargo, se prefiere establecer formatos populares considerando
el amplio y duradero apoyo de los proveedores de software que ya
tienen un mercado consolidado
Support (Soporte), es tener un suministro de herramientas y
soporte, evitando as la dependencia exclusiva de un nico
proveedor.
Disclosure (Divulgacin), es la posibilidad de que los
responsables por la gestin y la preservacin a largo plazo tengan
acceso a los registros y dems informacin tcnica detallada sobre
los formatos de archivos utilizados. Se recomienda formas y
patrones que tengan especificaciones tcnicas disponibles en el
dominio pblico.
Documentation Quality (Calidade de la Documentacin), ese
tem considera que, adems de tener acceso a la documentacin
tcnica, la misma debe ser completa, exacta y comprensible, es
decir, que debe ser suficiente buena para permitir la interpretacin
de la calidad de los objetos.
Stability (Estabilidad), es considerar que la especificacin de
formato debe ser estable y no sujeto a constantes o grandes
cambios con el tiempo. Considerar an que las nuevas versiones
del formato tambin deben ser compatibles con los programas
utilizados anteriormente.
Ease of identification and validation (Facilidad de Identificin y
Validacin), es la capacidad de identificar con precisin el
formato de un archivo de datos y confirmar que es vlido para el
uso continuo. Esta identificacin deber ser facilitada por medio
de "nmeros mgicos" y la informacin sobre la versin dentro de
la estructura de archivos. La disponibilidad de herramientas para
validar el formato tambin debe ser considerada.
I ntellectual Property Rights (Derechos de Propiedad Intelectual),
es considerar que los formatos pueden disponer de tecnologas
protegidas por patentes u otros mecanismos de proteccin o de
restriccin de propiedad. Y as, la ocurrencia de patentes puede
limitar el uso de algunos de los objetos en este formato.
Metadata Support (Metadata Soporte), considera la
determinacin del grado de soporte ofrecido por un formato de
metadatos y tambin puede requerir una revisin de su
documentacin tcnica. Algunos formatos prevn la inclusin de
metadatos (cuando se genera automticamente o para permitir que
el usuario los inserte) dentro de las propiedades del documento.
Complexity (Complejidad), es entender que los formatos deben
ser seleccionados para ser utilizado en una base que soporta
caractersticas distintas y caractersticas necesarias para lograr su
propsito. De hecho, hay que buscar el equilibrio, por tanto, un
formato excesivamente complejo no es interesante, sobre todo
porque cunto ms complejo sea el formato ms grande ser el
costo de la gestin y preservacin de la misma.
I nteroperability (Interoperabiblidad), es la posibilidad de
intercambiar los registros electrnicos con otros usuarios y
sistemas de tecnologas de la informacin. Sustentable en el largo
plazo deben permitir una fcil migracin de un entorno
tecnolgico a otro.
Viability (Viabilidad), considera que algunos formatos deben
proporcionar facilidad para detectar errores de archivos
corrompidos o rotos, y por lo tanto, deben determinar algn
mecanismo para la correccin de errores.
Re-usability(Reutilizacin), es considerar la capacidad de ciertos
tipos de datos ser tratados, puesto que para que que se permita
reutilizarlos, esta caracterstica depende de esta funcionalidad.
Hay muchas cuestiones a considerar en la eleccin de los formatos
de archivo ms all de las necesidades inmediatas y obvias de la
situacin. Tal vez no sea posible elegir un determinado tipo de
formato que cumpla con todos los criterios. Todava que se tenga
en cuenta la existencia de un encuentro entre los criterios
descritos aqu, con mayor o menor especificacin que otros, pero
que pueden servir como base para las toma de decisiones.
4. CONSIDERACIONES
Es importante elaborar una estrategia de definicin de formatos de
archivos y de metadatos para la preservacin; sin embargo,
todava no existe un conjunto nico y ampliamente utilizado por
todas las organizaciones. Para que los formatos de archivo puedan
seguir siendo accedidos a lo largo del tiempo, se deben tomar
varias medidas. As que el enfoque aqu en este trabajo es
describir las caractersticas que pueden definir un formato de
archivo sustentable. Por consiguiente, el xito de las estrategias de
preservacin implica considerar acciones y a tener en cuenta que
ciertas informaciones se vuelven esenciales como el nombre del
formato de archivo original y su versin. Estas y otros tipos de
informacin que dependen del formato de archivo especfico, por
ejemplo, si es de audio o de vdeo (requiriendo as algoritmos de
compresin especficos), sern preservados a travs de los
metadatos.
Para lograr la interoperabilidad, todas las partes interesadas deben
presentar sus necesidades, y posteriormente un formato adecuado
puede ser elegido o diseado en un esfuerzo cooperativo. Cuando
se piensa en una estrategia de preservacin, se piensa a nivel
microambiental (el ambiente interno de una organizacin), pero
teniendo en cuenta el las recomendaciones de entorno
macroambiental (el ambiente externo), que ya cuenta con
recomendaciones las cuales para ser difundidas, fueron estudiadas
y otras incluso puestas en prctica para su validacin. Por lo tanto,
hay ganancia de tiempo y un ahorro de recursos al momento de la
definicin de una estrategia para la preservacin digital y
considerar los formatos de archivo sustentables es parte del
proceso.

5. REFERENCIAS
Arms, C., Fleishhauer, C., & Murray, K. (2013). Digital Formats:
factors for sustainability, functionality, and quality.
Washington: Office of Strategic Initiatives. Library of
Congress. Recuperado el 10 de Septiembre de 2014, de
http://www.digitalpreservation.gov/formats/intro/intro.s
html
Aschenbrenner, A. (Febrero de 2004). The bits and bites of data
formats: stainless design for digital endurance. RLG
Diginews, 8(1). Recuperado el 10 de Septiembre de
2014, de
http://worldcat.org/arcviewer/2/OCC/2009/08/11/H125
0010316214/viewer/file2.html
Brown, A. (Agosto de 2008). Digital Preservation Guidance Note
1: Selecting file formats for long-term preservation. (T.
N. Archive, Ed.) United Kindon. Recuperado el 10 de
Septiembre de 2014, de
http://www.nationalarchives.gov.uk/documents/selectin
g-file-formats.pdf
Danoso, M. . (Marzo de 2009). Directrices para la creacin de
un programa de preservacin digital. Serie
Bibliotecologa y Gestin de Informacin, 43.
Recuperado el 10 de Septiembre de 2014, de
http://eprints.rclis.org/12989/1/Serie_N%C2%B043_Pr
eservacion_digital.pdf
Ferreira, M. (2006). Introduo a preservao digital: conceitos,
estratgias e actuais consensos. Guimares, Portugal:
Escola de Engenharia da Universidade do Minho.
Recuperado el 10 de Septiembre de 2014, de
https://repositorium.sdum.uminho.pt/bitstream/1822/58
20/1/livro.pdf
OCLC/RLG Working Group on Preservation Metadata. (Janero de
2001). Preservation Metadata for Digital Objects: A
Review of the State of the Art. 49.
Rothenberg, J. (22 de Febrero de 1999). Ensuring the longevity of
digital information. 18. Santa Monica, California.
Recuperado el 10 de Septiembre de 2014, de
http://www.clir.org/pubs/archives/ensuring.pdf
Schellenberg, T. R. (2002). Arquivos modernos: princpios e
tcnicas (2 ed.). (N. T. Soares, Trad.) Rio de Janeiro:
FGV.
Shepard, T., & McCarn, D. (2001). The universal preservation
format:a recommended practice for archiving media
and electronic records. WGBH Educational
Foundation, Universal Preservation Format Project,
Boston. Recuperado el 10 de Septiembre de 2014, de
http://info.wgbh.org/upf/pdfs/20010818-UPF_RP.pdf

Anda mungkin juga menyukai