The Theory and Craft of Digital Preservation

ReadAboutContentsHelp

Pages

page_0096
Complete

page_0096

parece transgredir nuestro sentido de objetividad. Por supuesto, a menudo queremos recopilar las imágenes que parecen estar dentro de los tweets, incluso cuando esas imágenes están funcionalmente incrustadas o enlazadas activamente al momento que son incorporadas en esos tweets en su navegador. Del mismo modo, uno podría pensar en cada tweet como una oración en un libro. ¿Tendría sentido recopilar y organizar cada oración en un libro por separado o deberían guardarse y organizarse como objetos discretos? En este contexto, como en tantos otros, decidir cómo recopilar el contenido y, en última instancia, organizarlo y describirlo requiere un nivel técnico significativo de comprensión de cómo funciona y ha sido diseñado el sistema de origen. Aquí nuevamente nos encontramos a la intención de preservación referida en el capítulo anterior. Estos ejemplos ilustran (entre otras cosas) cuán crítico es comprender cómo se produce el contenido y con qué fin se desea recopilarlo para que lo que se recopile se haga de manera coherente y ética.

En el fondo, las características de base de datos del nuevo medio, su inherente posibilidad de ser indexado, significan que este tipo de decisiones respecto a la estructura y el orden son mucho más claras que para los artefactos de objetos físicos. En este contexto, se necesita encontrar la mejor manera de agrupar y procesar estos datos para extraer la información significativa que los hace útiles y visibles ahora y en el futuro, y al mismo tiempo pensar qué datos deberían o no ser cosechados a partir de cómo quieren ser utilizados.

La buena noticia en este contexto es que cosas como los tweets que están llenos de metadatos extraíbles, se ajustan perfectamente a la idea de MPLP. Dese cuenta de que los medios digitales vienen con una estructura extensa y a menudo autodescriptiva. Sólo deje los tweets en el orden en que le llegan y explique ese orden para que usted y los demás puedan comprender el alcance y el contexto de lo que se tiene. Si desea comenzar y cosechar colecciones de tweets, debe establecer algunos delimitadores para determinar el alcance de la colección y luego el cómo obtener los datos. Si es relativamente pequeña, una vez que defina esto, puede avanzar creando un solo registro para ésta. Esto puede funcionar igual que el caso de la colección 4chan. Explique un poco de lo que es y cómo está estructurado y déjelos con lo que tienen. Esto deja abierta una amplia gama de modos potenciales de acceso que discutiremos más adelante en el próximo capítulo. Dicho esto, la parte desafiante se trata más de lo que uno debe hacer para cosechar o no colecciones y cómo dar acceso a ellas. Estos puntos se relacionan con asuntos discutido anteriormente acerca del desarrollo de colecciones que proyectos como Documenting the Now ahora lidian.

Ahora volveré a ejemplos aparentemente más banales. Sin embargo, a lo largo del resto del libro, considere cuántos de los ejemplos que analizo se desarrollarían de manera diferente si estos involucran a cualquier cantidad de personas cuya información digital pueda estar en riesgo por causa de los niveles interseccionales de opresión que estructuran y ordenan a la sociedad. Publicaciones en Facebook de una persona indocumentada bajo amenaza de deportación, fotos del teléfono de una persona LGBTQ que podrían usarse para acosarlas, o cualquier fragmento de información personal en la web que podría servir como base para cualquier cantidad de formas de acoso. Cada aspecto del trabajo de preservación; recopilar, gestionar, organizar, describir y proporcionar acceso a las colecciones debe abordar los problemas éticos que surgen de este tipo de consideración. Regresaré a más discusiones sobre estas cuestiones éticas en el próximo capítulo sobre acceso.

Multiplicidad de órdenes, variantes y copias

Cuando tomamos en serio la idea de que no hay una "primera fila" en la base de datos como un principio básico para comprender el medio digital, gran parte de lo que pensamos acerca de la secuencia

Last edit over 3 years ago by ac
page_0097
Complete

page_0097

y el orden en la planificación y organizador de colecciones se va por la borda. Si bien los sistemas de catalogación siempre han tenido que lidiar con ideas sobre el "orden de estantería" y la disposición y descripción de los archivos, se ha centrado durante mucho tiempo en ideas sobre el "orden original" como principio, estas ideas son, en un nivel básico, funcionalmente inapropiadas para trabajar con objetos digitales. Si bien siempre es cierto que en algunos medios inferiores hay una secuencia lineal de bits que constituye cualquier objeto dado, nuestras interacciones con esos objetos operan a través de una serie de abstracciones.

Los bibliotecarios, los archivistas y los profesionales en museografía aún no se han dado cuenta del potencial que esto les brinda. Por defecto, podemos comenzar desde la suposición de que hay una multiplicidad de pedidos y pedidos potencialmente disponibles para nosotros y nuestros usuarios. De la misma manera que puedes recurrir a todos los archivos y carpetas en su escritorio en cualquier momento basado cualquier campo de metadatos dado (alfabético, cronológico, tamaño de archivo, etc.) podemos trabajar para asegurarnos de que las herramientas y sistemas que desarrollamos para organizar y proporcionar acceso a las colecciones conservan esa capacidad de manipulación. Esto subraya la resonancia que se produce entre las funciones de los medios digitales y los objetos de un enfoque MPLP para la organización y la descripción. Tome lo que se le da en el orden que viene y luego cualquier serie de transformaciones y reorganización se pueden crear sin tener que mover los datos subyacentes o cadenas de bits.

Son liberadoras las maneras en que se puede manipular el contenido digital. Hasta cierto punto, podemos empoderar a los usuarios finales para ordenar y filtrar colecciones de la forma que tenga más sentido para ellos. Sin embargo, esto significa que las decisiones acerca de cómo agrupar y organizar el contenido en conjuntos de información razonables y coherentes son importantes. Volviendo a nuestros ejemplos de Twitter, si desarrolló una estrategia para coleccionar fragmentos de tweets basados en fragmentos el tiempo y almacenarlos basados en esos fragmentos en el tiempo, esto va a sugerir y a privilegiar esa forma de trabajar con ellos. En contraste, si cosechara todos los tweets de un usuario en particular a lo largo del tiempo y los almacenara como una colección, privilegiaría esa forma de fragmentar las cosas centrada en ese usuario. En cualquier caso, cualquier persona que esté usando esa colección es libre de ordenar su contenido cronológicamente, o filtrar por palabra clave, o cualquier otro medio, pero la decisión de qué hay dentro o fuera de cualquier forma de dividir la información tendrá un impacto importante sobre lo que se pueda hacer fácilmente con esta. Es decir, puede requerir que alguien extraiga algún subconjunto de datos de una serie de colecciones diferentes para luego juntarlo y poder verlo o interactuar de la manera que desee. Esta multiplicidad de órdenes es poderosa, pero también crea nuevos desafíos para dar sentido y relacionar las variantes de objetos digitales que surgen de la forma en que los usuarios llegan a hacer uso de las herramientas y sistemas digitales.

La distinción entre un original y una copia o entre un archivo maestro y copias derivadas desempeña un papel central al pensar en la gestión de colecciones. Las distinciones entre estas relaciones generalmente están ligadas a las diferencias entre las concepciones artísticas e informativas de la identidad de los objetos descritos en el capítulo sobre linajes de preservación. Si bien existen esas distinciones, para muchos objetos analógicos todavía existe, en general, un conjunto relativamente sencillo de relaciones entre originales, variantes, derivados y copias. Este no es necesariamente el caso de las formas en que gestionamos la información digital y tiene algunas implicaciones significativas sobre cómo abordamos la organización y la descripción de los objetos digitales.

A través de una extensa investigación sobre cómo las personas comunes manejan su información digital personal, la investigadora Cathy Marshall ha demostrado cómo la facilidad de crear copias y derivados del contenido digital ha resultado en una proliferación masiva de variantes de objetos, cada

Last edit over 3 years ago by ac
page_0098
Complete

page_0098

uno de los cuales tiene un significado distinto pero relacionado.89 Para ilustrarlo, considere las formas en que las personas administran y trabajan con sus propias colecciones de fotografías digitales.

La vida social de una fotografía digital

Tomo una foto digital con mi teléfono. Mi teléfono almacena una versión JPEG de la foto en la tableta NAND del dispositivo, también incorpora un conjunto de metadatos técnicos (fecha, código geográfico, datos de marca y el modelo de teléfono, si se tomó del frente o con la cámara trasera, nombra el archivo en función de la secuencia de fotos que han tomado con el teléfono). A partir de ahí, podría editar rápidamente la foto (cambiar el contraste, o recortarla o rotarla) directamente desde el teléfono, que podría guardarse como una copia adicional o sobrescribir el original.

Podría publicar la foto en Facebook, donde la describo y (usando las funciones de Facebook) podría etiquetar la cara de mi esposa y darle una descripción. También podría subirlo a Instragram donde la recortaría en un marco y elegiría un filtro que (por cualquier conjunto de razones extrañas) pensamos podría reflejar la noción ideal de cómo queremos que nos vean en nuestras fotos. También tengo mi teléfono configurado para hacer una copia de seguridad automática de todas mis fotos en Flickr, cuando la foto se carga en Flickr ese sitio crea automáticamente una serie completa de copias derivadas de la imagen en diferentes tamaños y resoluciones. A medida que las variantes de la imagen se publican rápidamente en estas diversas plataformas, cada una termina con diferentes títulos y subtítulos, fechas y horas de publicación, etiquetas y metadatos adicionales, y cada uno acumula sus propios metadatos sociales (me gusta, favoritos, comentarios, etc.). Muy rápidamente, a través de las prácticas cotidianas de trabajar con fotos en mi teléfono, ahora hay docenas de copias de esa imagen. ¿Cómo se podrían relacionar y administrar estas versiones de imágenes?

El resultado claro de esta situación es que nuestro mundo de objetos digitales implica una gran cantidad de derivados y variantes importantes y triviales. En la investigación de Marshall, ilustró situaciones en las que podrían existir variantes un video musical animado en una docena de sitios diferentes con metadatos diferentes y una gama de otras transformaciones (diferentes tipos de compresión, transcodificación, inicios, etc.) Llevando mi ejemplo de fotos personales más allá, a medida que los individuos manejan esta información y finalmente la exportan, respaldan y transfieren a otras organizaciones, estas variantes existirán en una diversidad de formas diferentes; un directorio de todas mis fotos que respaldo anualmente, una copia de mi archivo de Facebook, una copia de mi archivo de Flickr. Si bien es trivial identificar copias exactas mediante la comparación de la información de fijación de los archivos, es probable que la mayoría de estas variantes no se registren como idénticas de acuerdo con un control de fijeza, ya que son, al menos ligeramente, diferentes. Para ese fin, hay una gama de técnicas desarrolladas en otros campos computacionalmente para identificar copias cercanas y variantes (analizando visualmente fotos para detectar similitud con otras fotos, por ejemplo).

Si bien es posible gastar mucho tiempo y energía recogiendo y resolviendo estas relaciones y tomando decisiones sobre qué copias deben mantenerse, de acuerdo con los principios de MPLP, es probable que sea mejor aferrarse a muchas de estas variantes y permanecer abierto a explorar métodos computacionales para relacionarlas mejor y conectarlas en el futuro. La sugerencia de Marshall es que lleguemos a un acuerdo con el hecho de que vamos a tratar con una gama de copias, o copias contiguas, con una varianza significativa y que lo que probablemente queremos hacer en última instancia es comenzar a desarrollar enfoques para armonizar esas copias. Desde esta perspectiva, pasamos a una noción distribuida de estos objetos, centrándonos menos en qué versión es la mejor, sino más bien en desarrollar enfoques para automatizar las relaciones de mapeo entre copias y copias cercanas y crear métodos para describir estos clústeres agregados y relacionados de objetos. Hay una gama de técnicas emergentes para este tipo de coincidencias difusas basada en el análisis computacional de las propias imágenes renderizadas que son prometedoras en este sentido. Si bien la tecnología no está aquí para hacer esto en este momento, es suficiente para mantener ahora la incorporación de copias utilizar las formas que se tienen actualmente y esperar el desarrollo de estos métodos y técnicas en el futuro.

Si bien es posible gastar mucho tiempo y energía recogiendo y resolviendo estas relaciones y tomar decisiones sobre qué copias deben mantenerse, de acuerdo con los principios de MPLP, es probable que sea mejor aferrarse a muchas de estas variantes y permanecer abierto a explorar métodos computacionales en el futuro para relacionarlas mejor y conectarlas. La sugerencia de Marshall es que lleguemos a un acuerdo en el hecho de que vamos a tratar con una gama de copias, o copias contiguas, con una varianza significativa y que lo que probablemente queremos hacer en última instancia es comenzar a desarrollar enfoques

____________ 89 Marshall, " Copias digitales y una noción de referencia distribuida en archivos personales "

Last edit over 3 years ago by ac
page_0099
Complete

page_0099

para armonizar esas copias. Desde esta perspectiva, pasamos a una noción distribuida de estos objetos, centrándonos menos en qué versión es la mejor, sino más bien en desarrollar enfoques para automatizar las relaciones de mapeo entre copias y copias cercanas y crear métodos para describir estos clústeres agregados y relacionados de objetos. Hay una gama de técnicas emergentes para este tipo de coincidencias difusas basada en el análisis computacional de las propias imágenes renderizadas que son prometedoras en este sentido. Si bien la tecnología no está aquí para hacer esto en este momento, es suficiente para mantener ahora la incorporación de copias utilizar las formas que se tienen actualmente y esperar el desarrollo de estos métodos y técnicas en el futuro.

Con toda esta proliferación de contenidos interrelacionados y variados también han surgido nuevos métodos para dar un paso atrás y permitir que varias comunidades identifiquen e interfiera con sus propios materiales. Voy a considerar brevemente una serie de ejemplos de cómo esto puede funcionar y el impacto que puede tener en la organización y descripción del contenido.

Enviar la descripción a los interesados o comunidades de usuarios

Es cada vez más popular capacitar a los interesados y comunidades de usuarios para que sean los que describen y catalogan objetos. Tiene la ventaja de representar el contenido exactamente en los términos que un usuario lo utilizaría y también aligera el trabajo y las labores necesarias para describir las cantidades cada vez más crecientes de contenidos que las organizaciones quieren recopilar. Compartir tres ejemplos muy diferentes de cómo esto se ejecuta en sistemas de recolección relacionados pero muy distintos (identificación y descripción de GIF animados para una exhibición de museo, un repositorio institucional y una aplicación móvil para la recolectar historia oral) ayudará a demostrar algunas de las ventajas de esta técnica. A medida que los bibliotecarios, archivistas y curadores se trasladan a este tipo de trabajo, necesitan convertirse en practicantes reflexivos del diseño de la experiencia del usuario. En este proceso nos convertimos en menos los productores de la descripción y más los facilitadores de su producción.

Gifs en movimiento como una forma de gesticular

The Graphics Interchange Format, creado en 1987 por CompuServe, es una de las muchas formas de imagen. 90 Pero es uno de los pocos que ha llegado a tener un significado cultural muy específico. Los GIF permiten animaciones en bucle, lo que los coloca en un lugar extraño al permitirles actuar como una forma de imagen en movimiento. Como resultado de esta función, GIF se ha convertido culturalmente en un término que se aplica a estos bucles animados. En este contexto, el GIF en movimiento se ha convertido en una forma particular. Estos son generalmente GIF animados que muestran un cuerpo en movimiento, a menudo de una película o un programa de televisión, que las personas usan en el discurso en línea para expresar una reacción. Por lo tanto, podría tratarse de un corto bucle de la actriz Jennifer Lawrence asintiendo y sarcásticamente diciendo "OK" asintiendo y dando un pulgar hacia arriba. O de Michael Jackson de su video musical Thriller comiendo palomitas de maíz.

En 2014, Jason Eppink, un curador del Museo de la Imagen en Movimiento, hizo un proyecto para crear una colección de estos GIF para documentar la función cultural y su uso. 91 Su trabajo en la instalación y exposición en línea, The Reaction GIF: Moving Image as Gesture ofrece la oportunidad de pensar en un enfoque para organizar y describir contenidos digitales que es útil para esclarecer parte del potencial que este medio ofrece.

________________________ 90 Para obtener más información sobre la historia de los GIF animados relacionados con esta exposición, vea Eppink, "Una breve historia del GIF (hasta ahora)". 91 Para obtener más información sobre esta colección, véase Owens, " Exhibiting .gifs".

Last edit over 3 years ago by ac
page_0100
Complete

page_0100

Al observar cómo las personas usaban GIF en movimiento en el sitio de redes sociales Reddit, Jason se dio cuenta de que había una gran comprensión compartida del significado estos GIF en las comunidades en línea. Al ver estos GIF como un medio por el cual las personas insertaban un gesto en su discurso, decidió seguir adelante y desarrollar una colección de estos GIF y exhibirlos en el museo. Para decidir qué GIF usar, recurrió a la comunidad en línea de Redditors para ayudar a identificar qué, al menos en ese momento, establecía el lanzamiento del GIF y luego pedirle a la comunidad que describiera lo que significaban. El resultado de esto fue una colección de imágenes y descripciones del significado de las imágenes para los usuarios de esa comunidad. Esto en sí mismo sirve como documentación de un tipo de lenguaje vernáculo digital, hay una diversidad de variantes de GIF, pero el tipo de documentación generada a través de la discusión con Redditors también ofreció un medio para seleccionar a estos objetos y describirlos. Los Redditors identificaron los GIF en movimiento que consideraron eran los más utilizados y conocidos, y se involucraron en la discusión para definir a qué se referían cuando se usaron.

Eppink comenzó con un enfoque vernáculo / folklórico para estudiar estos GIF. En este contexto, no estaba interesado en quién fue el autor del GIF, sino en lo que el GIF significaba para las personas que todos los días lo usaban en línea. Del mismo modo que sería un poco extraño tratar de identificar al autor del símbolo OK que haces con tu mano, no sería particularmente extraño estudiar el significado contextual que existe en torno al uso de ese símbolo. Dada esta concepción vernácula de los objetos, no estaba particularmente interesado en su autoría o su historia. Entonces, si bien es posible rastrear a través del tiempo e identificar cuándo y dónde surgió el primer gif animado del Michael Jackson de Thriller comiendo palomitas de maíz, para el propósito de esta cosecha, importó más que en particular ese GIF de él comiendo palomitas de maíz es tan icónico en sí mismo. En este caso, es un ejemplo de "gifs comiendo palomitas de maíz", que a menudo se publican en hilos de discusión en donde el remitente comunica diversión al ver una discusión o algún drama que se desarrolla en una conversación.92 Entonces, recurrir a una comunidad para colaborar en la descripción y la selección es un tipo de herramienta poderosa para resolver algunos desafíos. También vale la pena subrayar que, si te enfocas en la documentación cultural, entonces muchos de los tipos de metadatos predeterminados (autor, fecha de creación, editor, etc.) pueden no ser las formas más útiles de abordar la creación o la organización de una colección. Además, este marco de significado cultural para comprender las colecciones encaja de manera bastante natural con una variedad de formas en que los sociólogos, antropólogos, folkloristas y académicos de comunicación abordan el estudio de las formas culturales. Con ese fin, es mejor adoptar ese tipo de enfoque académico cuando uno anticipa que los usuarios generarán probablemente una mejor alineación entre el rumbo de la organización y descripción y las formas en que los consumidores piensan respecto al contenido.

Un repositorio institucional

Cada vez más instituciones de educación superior mantienen repositorios institucionales. Si bien esto puede sonar como una función genérica de una organización, en este caso ha llegado a significar un conjunto muy específico de características para administrar, preservar y proporcionar acceso a los resultados académicos de la organización. Muchos de estos sistemas son administrados por la biblioteca de una institución. Por ejemplo, cuando terminé mi disertación la deposité en MARS (the Mason Archival Repository System, el repositorio institucional de la Universidad George Mason).

Depositar mi tesis aquí no fue diferente a subir una foto a Flickr. Me dieron una cuenta de usuario, inicié sesión, cargué el PDF de mi disertación, completé una serie de formularios web donde puse el título, elegí el departamento en el que me estaba graduando de un menú desplegable, coloqué

__________________________ 92 Para conocer el contexto de este fenómeno, consulte Know Your Meme, "GIF de palomitas de maíz".

Last edit over 3 years ago by ac
Displaying pages 96 - 100 of 138 in total