La importancia de los formatos libres para la preservación digital
¿Qué es un formato de preservación?
La preservación digital busca asegurar el acceso y uso futuro de los recursos digitales (que sean accesibles y utilizables) a largo plazo (Térmens, 2013). Al hablar de «conservación a largo plazo», no nos referimos a un periodo de tiempo específico, sino a un lapso suficiente durante el cual podamos acceder a la información que contiene el activo digital y que permita adaptar el formato (migrar, emular, etc.) en el momento en que aparezca otro que lo sustituya o mejore.
Un formato es una manera particular de codificar información para su posterior almacenamiento dentro de un fichero informático. Los formatos de archivo son convenciones o estándares, en ocasiones íntimamente vinculados a un software y hardware (entorno tecnológico), utilizadas para representar un contenido de carácter textual, gráfico, lógico, etc. en un medio informático. Al hablar de formatos podemos diferenciar entre formatos cerrados o propietarios, formatos publicados y formatos abiertos o libres.
Los formatos cerrados son propiedad de empresas y se caracterizan por no compartir (por lo menos en su totalidad) sus especificaciones técnicas. El hecho de no conocer sus especificaciones obliga a recurrir a programas específicos del mismo fabricante o propietario del formato para poder leerlo y escribirlo. También es posible recurrir a técnicas de ingeniería inversa para sacar a la luz el funcionamiento del formato, aunque generalmente estas técnicas no suelen ser del todo legales. Un buen ejemplo de formato cerrado es el formato .doc generado por el programa ofimático Microsoft Word. No todos los formatos cerrados van de la mano de un software comercial. Algunas aplicaciones gratuitas como Skype, también utilizan protocolos cuyas especificaciones para la voz sobre IP no son públicas.
Los formatos publicados o abiertos son aquellos cuyas especificaciones se encuentran totalmente publicadas y, por lo tanto, podemos estudiar como funcionan e incluso utilizarlos y crear tanto documentos, como programas capaces de leerlos y generarlos. Su principal diferencia con los formatos abiertos es que dependen de una iniciativa privada y de su voluntad de continuar evolucionándolos, pudiendo en ciertos casos restringir su implementación y uso bajo determinadas circunstancias. Un ejemplo destacado de formato publicado es el PDF de Adobe.
Aunque entre los términos «abierto» y «libre», existen importantes matices, especialmente en el ámbito de las licencias de software, al hablar de formatos con licencias libres y, por tanto, especificaciones abiertas, generalmente se utilizan ambos términos indistintamente, aunque el adjetivo «abierto» (open), acostumbra incluso a ser más habitual. Los formatos libres o, como acabamos de mencionar, también habitualmente denominados abiertos, son aquellos cuyas especificaciones no sólo se encuentran totalmente publicadas, sino que además no están sujetos a licencias restrictivas ni patentes. Generalmente, detrás de ellos encontramos organizaciones sin ánimo de lucro. Algunos ejemplos son los formato HTML y XML mantenidos por el W3C.
El objetivo fundamental de un formato de preservación es el de garantizar el acceso a la información que contienen los documentos a largo plazo.

¿Por qué son importantes los formatos libres para la preservación digital?
Los formatos libres o abiertos y los formatos de preservación, comparten los mismos objetivos. Ambos tienen como meta fundamental garantizar el acceso a largo plazo a los datos almacenados en los archivos, salvando la incertidumbre que generan o pueden generar, los derechos legales, tecnológicos o la disponibilidad misma de la tecnología bajo la cual se desarrollaron. La razón de ser de los formatos libres es la de facilitar el intercambio de información, valiéndose de la facilidad de acceso a sus especificaciones técnicas, de la interoperabilidad y de la perdurabilidad de la información. El uso de formatos libres, así como el uso de software libre en tareas de preservación digital, asegura la sostenibilidad a largo plazo de los sistemas y favorece la lucha contra la privatización del acceso a la información.
El uso de formatos cerrados hipoteca la independencia tecnológica las personas y entidades que escogen este modelo de licencias, así como la sostenibilidad de los sistemas al depender de software y hardware específico para poder continuar accediendo a la información contenida en los documentos. Por otro lado, la correcta aplicación de los diferentes procedimientos técnicos que aseguran la conservación y validez a largo plazo de los activos digitales, pasa ineludiblemente por conocer a la perfección los objetos de preservación (Térmens y Ribera, 2009).
Factores que tener en cuenta en la selección de formatos de preservación
Al considerar la idoneidad de determinados formatos digitales para preservar la información digital como un activo para las generaciones futuras, resulta útil articular la selección de los formatos a partir de factores o criterios objetivos que aseguren su sostenibilidad. Los siete factores de sostenibilidad promovidos desde hace muchos años por la Library of Congress (2025) y que se aplican a todos los formatos digitales y a todas las morfologías de información se enumeran a continuación.
- Apertura. El grado de independencia de un formato respecto de una patente y de derechos de autor.
- Adopción por parte de la industria, creadores, distribuidores y usuarios de contenidos digitales.
- Transparencia. Grado en el que las especificaciones técnicas de los formatos son accesibles.
- Autodocumentación. Capacidad del formato para incluir metadatos incrustados, lo cual lo convierte en un activo digital más robusto y menos vulnerable a catástrofes de datos asociadas a prácticas de almacenamiento de la información en la que los metadatos y los ficheros se conservan por separado.
- Dependencias externas. Ausencia de dependencias de un particular software, sistema operativo, hardware…
- Impacto de patentes. Costes de licencias asociados o incluso restricciones legales que pueden poner en cuestión la capacidad de los propietarios del contenido para mantener esa información a largo plazo.
- Mecanismos de protección técnica. Ausencia de mecanismos de encriptación, limitación de acceso, reproducción, copia…
Más allá de estos factores también puede ser importante considerar otros como:
- Interoperabilidad con otros formatos y entornos tecnológicos.
- Estabilidad/compatibilidad. Grado en el que un formato logra mantener su funcionalidad e integridad con versiones anteriores o posteriores.
- Estandarización. Adecuación de las especificaciones establecidas por un organismo de normalización internacional (W3C, ISO, NISO…).
- Calidad/Funcionalidad. Adecuación de las características del formato a las particularidades del contenido del documento para garantizar su calidad y funcionalidad (resolución, velocidad de reproducción, tamaño de archivo…)
Bibliografía
Fernández-i-Marin, Xavier (2013). Per què cal fer servir formats lliures?. <http://blog.xavier-fim.net/2013/01/per-qu%C3%A8-cal-fer-servir-formats-lliures>.
Library of Congress (2025). Sustainability of digital formats: planning for Library of Congress collections. <https://www.loc.gov/preservation/digital/formats/sustain/sustain.shtml>.
Pacheco, Jovanny (2011). «El peligro de los formatos privativos». Enter.co. <https://www.enter.co/productividad/el-peligro-de-los-formatos-privativos-software-freedom-day>.
Térmens, Miquel; Ribera, Mireia (2009). «El control de los formatos en la preservación digital». En: Actas Fesabid 2009, p. 139-146. <http://www.fesabid.org/zaragoza2009/actas-fesabid-2009/139-146.pdf>.
Térmens, Miquel (2013). Preservación digital. Barcelona: UOC.
Deja una respuesta