GitHub ha enterrado todos sus repositorios activos en el Ártico: una copia de seguridad para los próximos 1.000 años

Cristian Rus

Svalbard como tal probablemente no suena a muchos, la ‘Bóveda del Apocalipsis’ quizás sí. En el norte de Noruega, ya en el Ártico, se almacenaun inmenso banco de semillas para preservar la flora del planetaen caso de un desastre a nivel global. Algo parecido está haciendo GitHub, la plataforma de repositorios de Microsoft ha guardadouna copia de seguridad de todos sus repositorios activos y públicos. En caso de que pase algo, se preservarán durante al menos 1.000 años.

Esta ideafue anunciadaen noviembre del año pasado y la premisa es muy sencilla: una copia de seguridad en el Ártico de casi todo lo que hay en GitHub ahora mismo. ¿Para qué? Parapoder acceder de nuevo a toda la información en caso de que ocurra un desastretan malo como para que sea capaz de destruir todo GitHub.

La idea inicial era que una escolta de GitHub se encargase de depositar los archivos en la bóveda del Ártico. Sin embargo, debido a la pandemia actual, finalmente decidieronenviar los archivos a una organización local para que sean ellos quienes los guardenen Svalbard, un grupo de islas del norte de Noruega.

La ubicación concreta es una antigua mina de carbón ya desmantelada. Ahí, a cientos de metros en el interior del permafrost, se encuentra una cámara interior que guarda todos los archivos. En caso de un desastre esta cámaradebería poder preservar los archivos durante más de 1.000 años.

Analógico antes que digital

Quizás lo más interesante de todo este proyecto es cómo se han almacenado los datos. Cuando hablamos de archivos digitales uno se espera DVDs, SSDs y unidades de almacenamiento por el estilo. Pero no, debido a la inestabilidad de estos productos GitHub ha decididoapostar por algo más perdurable: film.

Con la ayuda de la empresa noruega Piql AShan grabado en rollos de cinta todo el códigopara que pueda ser leído tanto con un aparato como con una simple lupa. Cada cinta puede almacenar unos 120 GB de datos. Si bien inicialmente se calculaba que serían 24 TB de código fuente lo que GitHub tenía que guardar, finalmente han sido unos 21 TB en total. Esto corresponde a 168 rollos de cinta Piql.

¿Y qué hay en estos rollos? Principalmenteuna copia de todos los repositorios de GitHub activos y públicos(y algunos importantes que llevan tiempo sin actividad). Cada repositorio se ha comprimido en un archivo TAR y la mayoría de los datos se almacenan en forma de códigos QR. Aparte de esto, se ha añadido una guía fácil de entender por un humano para poder indexar los archivos y saber cómo recuperarlos.

Comodicen desde GitHub, esperemos no tener que usar nunca esta copia de seguridad.

Vía |ZDNetMás información |GitHub