Microsoft Project Silica ofrece un almacenamiento robusto de miles de años

Microsoft Research almacenó una copia digital de 75,6 GB de la película de 1978

Jonathan Banks / Microsoft

Ars habló el martes con el Dr. Ant Rowstron, investigador principal de Microsoft Research en Cambridge, Reino Unido, sobre un innovador proyecto de almacenamiento refrigerado llamado Silica. El propósito de la sílice es reemplazar la cinta y los discos de archivo óptico como el medio preferido para el almacenamiento en frío a gran escala y (muy) a largo plazo. Microsoft Research se está asociando con el gigante de películas Warner Bros., que está directamente interesado en reducir costos y aumentar la confiabilidad en sus propios programas de almacenamiento en frío.

El medio en cuestión es un bloque de vidrio de alta pureza, que tiene vóxeles grabados con láseres de femtosegundos. Cada vóxel almacena varios bits en dos propiedades, retardo y ángulo, que a su vez se pueden leer con microscopio y con imágenes de luz polarizada. Los vóxeles se pueden escribir con 100 o más capas de profundidad en una pieza de vidrio de 2 mm de profundidad, enfocando el láser en la profundidad deseada dentro del bloque.

La velocidad de lectura y escritura de sílice actualmente deja algo que desear: tomó aproximadamente una semana registrar los casi 76 GB de datos de Superman el año pasado, y Rowstron estima que tomaría aproximadamente tres días volver a leer los datos, con los avances realizados desde The. La tecnología está todavía en su infancia, por supuesto, y en el futuro se esperan grandes disminuciones en el tiempo necesario para escribir y leer. Rowstron dice que todavía no espera que nadie intente interpretar a Superman directamente desde su disco de Silica, pero no es para eso.

El verdadero archivo de datos a largo plazo es una propuesta muy cara. Cuando estaba en la universidad, participé en un proyecto de investigación para el departamento de archivos de mi universidad: el departamento necesitaba una aplicación de base de datos para indexar y rastrear sus colecciones de medios digitales, en gran parte para poder presupuestar y realizar operaciones de renovación de archivos dentro de los ciclos de actualización esperados. Sus grabaciones de audio y video analógicas más antiguas debían digitalizarse, y sus grabaciones ópticas de CD y DVD debían ser leídas, verificadas para verificar su integridad y escritas en nuevos medios antes de que los discos originales fueran delaminados.

Publicidad

Este ciclo de actualización de archivos rápidamente se vuelve abrumador a cualquier escala significativa. Si adquiere una colección de 10,000 CD y un equipo de tres o cuatro estudiantes con unidades de CD-RW y una gran cantidad de discos, tendrá más de un año de trabajo a tiempo completo para actualizarlos. (Warner Bros., que tiene un presupuesto ligeramente superior al del departamento de colecciones raras de la biblioteca de mi alma mater, migra sus propios datos de archivo digital durante un estricto ciclo de tres años).

Para empeorar las cosas, la vida útil de los CD grabados suele ser muy corta; pueden comenzar a fallar fácilmente después de solo cinco años, por lo que al menos deben probarse con frecuencia, si no actualizarse, «lo necesiten o no». Es posible extender la vida útil de los discos ópticos significativamente almacenándolos a 5C / 41F y 30% de humedad relativa, pero esto agrega un gasto adicional significativo para el almacenamiento y mantenimiento.

Este es el problema que Project Silica está a punto de resolver. Aunque actualmente es muy lento para leer o escribir, el medio de sílice, ni más ni menos que el vidrio de alta pureza, no comparte ninguno de los modos de falla de la cinta, el disco óptico o incluso el papel. Un bloque de vidrio Project Silica no es un medio compuesto; no hay una cubierta de plástico externa que se desgaste como CD, DVD o Blu-Ray, y no hay ningún medio magnético para perderse físicamente de la superficie de una cinta o disco duro.

Se espera que la sílice sobreviva miles de años en casi cualquier temperatura, humedad y entorno químico; literalmente es solo vidrio, y las propiedades físicas y químicas del vidrio se comprenden muy bien. Solo podemos asumir las propiedades de materiales fabricados más complejos (cinta, disco, etc.) utilizando técnicas de envejecimiento acelerado, pero los artefactos de vidrio de miles de años están disponibles para su estudio.

Publicidad

Además de la ya impresionante resistencia a la degradación del medio (básicamente se puede esperar que ignore cualquier otra cosa que no sea golpearlo con un martillo), el proyecto utiliza un sistema de archivos real con corrección de errores hacia adelante para proteger aún más los datos almacenados contra la corrupción o pérdida. . Además, metadatos como título, índice, fecha, etc. se puede grabar en la superficie de cada bloque de Project Silica en texto legible.

Como ya saben los fanáticos de O Mote no Olho de Deus, una pregunta persistente debe ser respondida para cualquier método de almacenamiento de datos que debería durar milenios: ¿qué sucede cuando el contexto tecnológico y cultural que rodea a un medio de almacenamiento colapsa? La sílice también aborda este problema, utilizando pistas iniciales para «la verdad del suelo». El equipo está utilizando algoritmos de aprendizaje automático para volver a leer los datos de sílice y, en caso de que estos algoritmos entrenados se pierdan, los nuevos algoritmos pueden entrenarse muy rápidamente en los senderos de la «verdad del suelo», que les enseñan a interpretar el resto de los datos.

No pudimos resistirnos a preguntarle al Dr. Rowstron sobre cómo Niven y Pournelle Moties podrían haber lidiado con el Proyecto Silica después de una de sus rupturas cíclicas en la civilización. Incluso sin técnicas de aprendizaje automático, los investigadores que han descubierto datos almacenados utilizando las técnicas del Proyecto Silica deberían poder descubrir cómo leer sus datos armados con nada más que buenos microscopios y fuentes de luz polarizada, siguiendo el mismo camino de descubrimiento mientras se encuentran en el » verdadero suelo «rastrea las redes neuronales artificiales.