Almacenamiento futuro: cuándo podremos guardar nuestros archivos en el ADN
Desde 2013 se viene investigando la posibilidad de usar el ADN para guardar información, en un espacio mucho menor y con un costo energético mucho menor al actual
- 7 minutos de lectura'
Son un alfabeto biológico y, a su vez, un código: A, T, G, y C o por sus nombres completos, adenina, timina, guanina y citosina. Conforman el ADN, la molécula doble hélice que almacena y condensa la información genética de los seres vivos, y que controla todos los procesos metabólicos que tienen lugar en las células. Sin embargo, el ADN se encamina a adquirir un rol distinto al que hoy tiene en los seres vivos: combinando ese mismo alfabeto, el ADN podría convertirse en un efectivo soporte para el inmenso volumen de información que hoy produce y busca preservar la humanidad… si llegan a superarse algunas pruebas decisivas.
Cada día en la Tierra se depositan en la “nube” 2,5 millones de gigabytes de información digital, que contribuyen a aumentar a los diez trillones de gigabytes ya almacenados. Pero cada video, audio, imagen o archivo publicados en redes sociales o guardados en servicios como Dropbox, Google Drive o OneDrive, entre otros, encuentra su “morada” no en una nube inmaterial sino en grandes centros de almacenamiento (los más grandes del mundo alcanzan superficies de cientos de miles de metros cuadrados), en donde los soportes magnéticos u ópticos deben ser mantenidos a bajas temperaturas, lo cual genera gastos siderales en consumo de energía y una gran cantidad de emisiones de dióxido de carbono. Se trata, en pocas palabras, de un almacenamiento finito y, a su vez, costoso en varios sentidos. Con este problema en el horizonte, y en busca de una posible solución a una demanda de almacenamiento de datos creciente, el ADN hoy se presenta como una solución al problema. Un hito al respecto se dio en 2013, cuando los científicos británicos Nick Goldman y Ewan Birney lograron codificar cinco archivos, incluidos un fragmento del más famoso discurso de Martin Luther King y 154 sonetos de Shakespeare, en una molécula de ADN. Desde entonces, en todo el mundo se trabaja con una meta en común: desarrollar el método que se perfila como el futuro del almacenamiento de la información.
Frente al tsunami de gastos energéticos y ampliación de las superficies para este “acopio” de datos, la molécula doble hélice ofrece una solución prácticamente ideal a la cuestión. “La densidad de información que puede guardar el ADN supera de manera enorme a la que hoy guardan los aparatos electrónicos. Una estimación bastante conservadora dice que toda la información generada por la humanidad en un año podría almacenarse aproximadamente en un cubo de un metro cuadrado. Hay otros que son todavía más optimistas y dicen que toda la información que hay en Facebook podría guardarse en un espacio como el de la mitad de una semilla de amapola”, comenta Yanina Petracca, directora de las carreras de Biotecnología y Bioinformática de la Universidad Argentina de la Empresa (UADE).
Sin embargo, no es esta una tecnología que ya esté a punto, lista para salir al mercado y que rápidamente vaya a reemplazar a las cintas magnéticas -una tecnología con más de 60 años-, utilizadas usualmente para el archivo de información (para almacenar información que no va a ser modificados), una de las primeras funciones para las que se piensa al ADN. Algunas de las limitaciones de la tecnología basada en ADN tienen que ver justamente con la densidad de información, que algún día estará grabada en la molécula, y con su identificación y lectura de lo guardado.
Una tecnología prometedora, pero con desafíos
“La tecnología de almacenamiento en ADN actual está pensada para guardar archivos que no van a ser modificados luego, como por ejemplo leyes o archivos documentales o fotográficos. Por este motivo es importante encontrar una forma de identificar cada documento y luego poder extraerlo, algo parecido a como se trabaja en una biblioteca”, explica el bioinformático Germán González, del Instituto de Diversidad y Ecología Animal (UNC-Conicet).
“Una de las tecnologías que se usan hoy para eso es la PCR (la misma que se usa en los tests de Covid-19), que extrae la información que buscamos, pero con el costo de ‘destruir’ el resto de los documentos de la biblioteca. Es decir que sería una biblioteca de un solo uso, algo que no tiene mucha utilidad. Por eso es importante encontrar mejores métodos para la extracción de datos”, agrega González.
En el enorme volumen de datos que el ADN podría guardar, para Mark Bather, bioingeniero del MIT, hallar algo en particular en la molécula hoy en día sería como “hallar una aguja en un pajar”. Recientemente, él y su equipo del MIT desarrollaron una técnica para superar esta barrera, consistente en el encapsulamiento de cada archivo transcrito al lenguaje del ADN en una partícula de sílice, que a su vez es “etiquetada” con un código de ADN monocatenario (de una sola cadena). La función de estas etiquetas fue la de informar sobre el contenido del archivo, con palabras claves como “gato” o “avión”. A partir de la introducción de primers específicos (secuencias cortas de ADN) para que se hibriden con cada etiqueta, pudieron extraer los archivos que buscaban. Se trató, sin embargo, solo de una prueba de concepto, realizada con 20 archivos y escalable, por el momento, a solo 1020, indicaron.
Pero otros desafíos también quedan por delante. Petracca explica que estos “tienen que ver con el tiempo que demanda traducir el código binario de las computadoras o nuestro propio alfabeto a este código del ADN. Escribir estas moléculas demanda bastante tiempo, o por lo menos demanda un tiempo que haría que fuera una limitante a la hora de traducir tanta información a este código. Y por otro lado, una vez que ya está traducido también se tarda en volver a traducir esta información de vuelta al lenguaje que estaba originalmente”.
Por su parte, González añade: “El almacenamiento en ADN implica codificar el documento y sintetizar el ADN para luego leerlo (lo que llamamos ‘secuenciar’) y decodificarlo cuando lo necesitemos. La síntesis y el secuenciamiento de ADN han bajado mucho de precio en las últimas décadas pero aún son muy caras como para utilizarlas en lo cotidiano. Además, el almacenamiento en ADN tiene un problema que otros métodos, como los magnéticos, no tienen: cuando se escribe y se lee el ADN suelen introducirse errores que modifican el contenido original. Y muchas veces no es trivial saber cómo deben corregirse estos errores”.
El costo actual de escribir sobre el ADN, finalmente, es otro obstáculo a superar: se estima que pasar un petabyte (un millón de gigabytes) a la molécula ascendería al trillón de dólares.
Por qué, de todos modos, el ADN reemplazará a los sistemas actuales
A pesar de estas limitaciones actuales, la investigación sobre el ADN como medio de almacenamiento avanza a paso firme en el campo de la bioinformática.
Más allá del espacio ahorrado que ofrecería el ADN, la energía requerida por las versiones futuristas de las grandes bibliotecas de la humanidad también representa hoy, en la teoría, un punto con el cual la biomolécula saldría ganando frente a los dispositivos actuales. Los datos podrían guardarse a temperatura ambiente, “que además de bajar los costos, también baja muchísimo el consumo energético, que hace que sea un almacenamiento ambientalmente mucho más sustentable”, señala Petracca.
También la vida útil de los soportes físicos sería ampliamente superada por el ácido nucleico. “Se estima que los soportes en los cuales hoy se basan los servidores que guardan esta información duran aproximadamente cien años”, dice Petracca. En cambio, se han podido secuenciar genomas de decenas de miles de años e incluso el de un caballo del Pleistoceno, del linaje Equus, de 700.000 años de antigüedad.
¿Puede pensarse en que algún día, en lugar de los actuales discos rígidos, las computadoras hogareñas vengan con un almacenamiento basado en la molécula que hace posible la vida? “Para que podamos usarlos para guardar nuestros archivos personales será necesario que se desarrollen tecnologías que permitan modificar los datos almacenados en el ADN”, explica González-. En una primera etapa es probable que se usen para almacenar grandes archivos documentales de gobiernos y empresas”. No obstante, que el ADN llegue a las computadoras personales, dice, “es cuestión de tiempo”.