En el año 2013, la Biblioteca de Catalunya (BC), junto con el Consorci de Biblioteques Universitàries de Catalunya (CBUC) y el Col·legi Oficial de Bibliotecaris-Documentalistes de Catalunya (COBDC), publicaron la tercera revisión del documento Estándares de digitalización: requisitos mínimos (en catalán), publicado originalmente en el año 2000, como resultado de las conclusiones de un grupo de trabajo del CBUC creado con el objetivo establecer una serie de requisitos mínimos para la digitalización de diferentes tipos de documentos.
Se trata de un breve documento técnico en el que podemos encontrar las principales características técnicas mínimas que deberían tener las imágenes obtenidas como resultado de un proceso de digitalización. Las recomendaciones se limitan a los que seguramente son los dos usos principales: preservación y difusión a través de la Web.
Varios años de su publicación y, con la experiencia de haber participado en diversos proyectos de digitalización, en esta entrada intentaré ampliar algunas de las informaciones proporcionadas en el documento, así como dar mi opinión respecto a otras.
Usos y formatos
Lo primero que conviene destacar es que en el primer apartado del documento se avisa de que no se han analizado otros usos diferentes a los comentados anteriormente (preservación y difusión), considerados como subproductos. Entre éstos, se citan, a modo de ejemplo, el uso comercial, la reproducción (se entiende que se refieren a diferentes tipos de impresión como impresión offset o digital), la proyección en pantalla grande, la consulta en una red local, entre otros.
Si bien es cierto que no es necesario que el documento especifique en detalle las características que deberían tener todos estos otros posibles usos de las imágenes digitalizadas, sí que conviene destacar que la obtención de un derivado de calidad para cada uno de estos supuestos dependerá en gran medida del máster original. Este punto también se comenta pero, como veremos más adelante, los requisitos establecidos pueden no ser suficientes para algunos de estos propósitos.
TIF vs JPEG2000
En relación con los formatos de archivo, destaca el uso preferente del formato TIF, un estándar adoptado por la inmensa mayoría de las instituciones que digitalizan sus fondos y colecciones con este propósito. La segunda opción propuesta es el formato JPEG2000, un formato de archivo que admite diferentes algoritmos de compresión (con y sin pérdida) y que frente a TIF, permite obtener unos tamaños de archivo menos pesados y trabajar con un único formato que permite satisfacer tanto los requisitos de preservación, como los de acceso. Aunque esto es sumamente atractivo, tanto por lo que respecta a los costes de almacenamiento de grandes colecciones digitalizadas a alta resolución, como por lo que respecta a la complejidad de trabajar la preservación de diversos formatos de archivo, el formato JPEG2000 no se ha acabado de imponer en nuestro ámbito como estándar para la preservación de la imagen digital a pesar de estas ventajas técnicas.
En 2013, Chris Adams publicaba el artículo Is JPEG-2000 a preservation risk?, en el blog The signal de la Library of Congress, en el que detallaba algunos de los riesgos de la adopción de ese formato. El primero es precisamente la falta de adopción del formato no sólo en nuestro sector, sino en la industria en general, razón por la cual el formato es poco atractivo, ya que, en gran medida, la obsolescencia de un formato depende de su nivel de adopción y JPEG2000 es un riesgo en este sentido. La complejidad técnica del formato tampoco ayuda a que se asiente en el mercado, ni a asegurar la preservación de los archivos codificados de esta manera a largo plazo. Por otro lado, diferentes pruebas realizadas han mostrado diversos problemas en ciertos niveles de zoom como la generación de áreas en blanco, ruido aleatorio o fragmentos de la imagen desplazados. Todo ello, ciertamente inquietante si el objetivo es la preservación del documento. Finalmente, su pobre soporte por parte de los navegadores web, tampoco lo hace atractivo para el propósito de difusión.

Vídeo
En el caso de los archivos de vídeo (audiovisuales), se trata de la morfología de contenido de la que menos información se proporciona. Se recomienda MPEG2 para vídeo, MPEG1 para audio y AVI como segunda opción de vídeo. Lo primero que conviene destacar en relación con los formatos de vídeo es que se trata de los tipos de archivos más complejos, ya que en su creación debemos atender al formato de compresión, al de codificación y al contenedor. El formato de compresión es el que permite representar digitalmente un vídeo, reduciendo, además, la señal de imagen y sonido para disminuir su peso. El formato de codificación, trabaja a partir del formato de compresión seleccionado y lo prepara para un uso determinado. Finalmente, el formato contenedor, trabaja a partir del formato de codificación y lo empaqueta y sincroniza con el resto de morfologías que se presentarán al usuario (pistas de audio, subtítulos, audiodescripción, etc.). En este sentido, las recomendaciones se encuentran incompletas.
Entre los diferentes formatos de compresión existentes destacan tres: H.262/MPEG-2 Part 2. (el recomendado en el documento), H.263/MPEG-4 Part2 y H.264/MPEG-4 AVC. También Theora de código abierto (los formatos abiertos son algo muy interesante en preservación digital), pero con muy poco soporte (como JPEG2000). La recomendación es correcta, aunque conviene destacar el importante peso que presentan los archivos generados a partir de este formato de compresión frente, por ejemplo, a los que utilizan el estándar H.264, muy adoptado por la industria. La elección de H.262/MPEG-2 Part 2 puede suponer para pequeñas y medianas instituciones un riesgo en la sostenibilidad debido al coste de almacenar archivos tan grandes. En esos supuestos, H.264/MPEG-4 puede ser una alternativa interesante que, como en el caso de JPEG2000, permitiría unificar en un sólo formato con diferentes características la versión de preservación y difusión. La segunda opción preferida en el documento (AVI) no se trata de un formato de compresión, sino de un formato contenedor, por lo tanto no se debería valorar como alternativa a H.262 o H.264, sino en comparación a otros contenedores como MPEG-4 Part 14, WMV, FLV, OGG, etc. El formato de codificación dependerá del de compresión elegido. Por ejemplo, X264 para H.264/MPEG-4 o Libtheora para Theora, aunque existen varias alternativas para cada formato de compresión. Formatos sobre los que no se especifica nada en el documento.
Resolución de las imágenes
Por lo que respecta a la resolución de las imágenes, es importante tener en cuenta que la digitalización a más o menos resolución dependerá de diferentes factores. Entre estos, el documento destaca una resolución recomendada de 400 ppp para aquellos documentos sobre los que deba realizarse un proceso de reconocimiento óptico de caracteres (OCR). No tiene en cuenta, no obstante, un factor importante como es el tamaño del documento original. En este sentido, por un lado, el tamaño del original (10×15 cm, 20×30 cm…) y, por el otro, la resolución a la que se digitalice, determinarán las dimensiones del píxel del archivo digital obtenido, así como la posterior posibilidad de imprimirlos a un tamaño u otro y en buenas condiciones en diferentes sistemas como el offset o la impresión digital.
Para la impresión en offset son necesarios 300 ppp, mientras que para la impresión en digital, acostumbra a ser suficiente con 150 ppp. Valores, por lo tanto, alcanzables si seguimos lo indicado en el documento. No obstante, la digitalización de documentos originales pequeños como puede ser el caso de las diapositivas de 35 mm a tan sólo 500 ppp, generarán másters que si bien son suficientemente grandes para ver en pantalla (alrededor de 500 x 400 px) o imprimir en tamaños aproximados de 5 x 4 cm en offset o 10 x 7 cm en impresión digital, será imposible ampliarlos para imprimirlos en otros tamaños más grandes con suficiente calidad en cualquiera de estos dos sistemas de impresión.



Las imágenes anteriores, obtenidas de una diapositva de 35 mm y digitalizadas a 500 ppp, 2400 ppp y 3600 ppp, han dado como resultado tres másteres digitales con unas dimensiones en píxeles de 576 x 384 px, 2780 x 1842 px y 4142 x 2786 px, respectivamente. En este sentido, mi experiencia es que 2400 ppp o 3600 ppp según el caso, son resoluciones más adecuadas para las diapositivas y negativos fotográficos, ya que ofrecen tamaños con los que posteriormente podremos dar respuesta a una mayor variedad de usos.
Profundidad de bits, modos de color y fotogramas por segundo en imágenes, audio y vídeo
En la columna «Definició» se informa de la profundidad de bits y el modo de color, en el caso de las imágenes; de la profundidad de bits en el caso de los audios; y de la tasa de bits (bit rate), fotogramas por segundo y profundidad de bits en el caso de los documentos audiovisuales.
Poco que decir en el caso de las imágenes. En cambio, por lo que respecta a los archivos de audio, más allá del formato seleccionado como máster (WAV, o waveform audio file), un formato sin compresión ampliamente reconocido y aceptado con fines de preservación digital (Knight; McHugh, 2005), sí conviene prestar atención a las características técnicas recomendadas. En este sentido, si bien es cierto que la frecuencia de muestreo (resolución, según la tabla) y profundidad de bits (definición en la tabla) comúnmente aceptada con fines de preservación son los 96 kHz y 24 bits respectivamente, existen argumentos contra especificaciones superiores a la conocida como calidad CD (44,1 kHz/16 bits) que se fundamentan en que las grabaciones de voz analógicas no presentan información significativa en frecuencias más altas. Por otro lado, este argumento también se ve reforzado por el hecho de que la cifra máxima del espectro audible de un oído humano sano no llega a frecuencias superiores a los 20 kHz (Plichta; Kornbluh, 2002). No hay ningún problema en adoptar valores superiores a la calidad CD, no obstante, debemos tener en cuenta que también supondrá la necesidad de un espacio de almacenamiento mayor.
Por lo que respecta a los archivos audiovisuales, los 25 fotogramas por segundo también son suficientes, si tenemos en cuenta que la digitalización de originales analógicos corresponderá a cintas VHS o formatos más antiguos. El estándar PAL para los VHS tenía ese mismo número de fotogramas, por lo que no tiene demasiado sentido digitalizar a valores superiores. El estándar NTSC VHS sí presentaba valores superiores (29,97 fps), por lo que si se tratase de una de estas cintas, deberíamos subir a los 30 fps.
Versiones de consulta
En cuanto a las características de las imágenes derivadas con finalidades de acceso, sorprende la recomendación de resoluciones tan altas (150 ppp o 300 ppp) para la consulta por pantalla. Los puntos por pulgada (en ingles, dots per inch o dpi) son un valor que, como hemos visto anteriormente, son muy importantes a la hora de obtener los másteres digitales, ya que de ellos dependerán las dimensiones en píxeles del archivo y la posibilidad de imprimirlo a mejor o peor calidad. En cambio, para la consulta por pantalla, no tienen ningún impacto. Todas las imágenes podrían guardarse a 72 ppp (o incluso menos sin apreciar diferencia alguna), porque lo que realmente importa en la consulta por pantalla son las dimensiones (alto x ancho en píxeles) de la imagen.
A continuación, se muestra la imagen de un cartel disponible a 600 ppp en la colección de carteles del Pabellón de la República de la Universidad de Barcelona y diferentes versiones derivadas a 150, 72 y 1 ppp, en las cuales se ha mantenido las dimensiones del original (830 x 1181 px). Como se puede observar, modificar los puntos por pulgada no implica ningún cambio en la visualización por pantalla.
En cuanto a los audios, 96 kbps acostumbran a ser suficientes para los mp3 de consulta. Finalmente, respecto al formato para los audiovisuales, aquí sí, con toda seguridad, H.264/MPEG-4 (mp4) es más adecuado que los recomendados, por su menor tamaño y mayor compatibilidad.
Bibliografía
Adams, Chris (2013). «Is JPEG-2000 a Preservation Risk?». The signal. <https://blogs.loc.gov/thesignal/2013/01/is-jpeg-2000-a-preservation-risk/>. [Consulta: 12/10/2018].
Knight, Gareth; McHugh, John (2005). Preservation handbook: digital audio. London: Arts and Humanities Data Service. <http://www.ahds.ac.uk/preservation/audio-preservation-handbook.pdf>. [Consulta: 14/10/2018].
Plichta, Bartek; Kornbluh, Mark (2002). Digitizing speech recordings for archival purposes. Michign: Matrix, Michigan State University. <http://www.historicalvoices.org/papers/audio_digitization.pdf>. [Consulta: 14/10/2018].