ADN, el disco duro del futuro (II)… que durará dos millones de años

Esta es la gran paradoja de la información en la era digital: es imposible borrar nuestro rastro en internet, por mucho que nos empeñemos en lograrlo. Y sin embargo, podemos perder fácilmente nuestros archivos para siempre a causa de un error o una avería. Es más: ningún soporte físico digital está concebido para durar más de medio siglo. Ni discos duros, ni CD, ni DVD, ni memoria flash. Ninguno.

En cambio, conservamos códices medievales que han perdurado cientos de años, y que perdurarán cientos de años más. Tenemos manuscritos que han sobrevivido durante milenios. ¿De qué sirve digitalizar las pinturas de Altamira, si la versión digital deberá cambiarse de soporte sucesivamente para que no desaparezca, mientras el original pervivirá sin que nadie lo toque (especialmente si nadie lo toca)? ¿Acaso creemos que al digitalizar una obra antigua la estamos perpetuando?

De todo lo anterior podríamos llegar a deducir que el soporte del futuro no es otro que el papel. ¿Sorpresa? ¿Absurdo?

Pero el papel puede mojarse, quemarse o ser pasto de los bichos. Una pequeña trampa en el argumento anterior es que, en realidad, se supone que solo conservamos una pequeña parte de todo el papel que jamás se ha escrito o impreso. La inmensa mayoría se ha perdido.

Lo cierto es que, para descubrir mejores soportes de información que el papel y la electrónica, nada mejor que echar una mirada a nuestro entorno natural. La tecnología actual nos permite acceder a información que la naturaleza ha preservado durante cientos de miles de años, en forma de ADN en huesos fósiles. El investigador del Instituto Federal Suizo de Tecnología en Zúrich (ETH) Robert Grass lo explica así a Ciencias Mixtas: «Los libros más antiguos que conocemos tienen más de 1.000 años, y los jeroglíficos se han almacenado en la piedra durante varios miles de años. Este es un plazo largo, pero todavía corto si lo comparamos con los datos que podemos construir a partir del ADN de huesos arqueológicos, que llega hasta los 700.000 años de antigüedad». Grass se refiere al logro de un equipo de investigadores de la Universidad de Copenhague (Dinamarca), que en julio de 2013 publicó en Nature la secuenciación del genoma de un caballo del Pleistoceno a partir de un hueso conservado en el permafrost de Canadá durante más de medio millón de años.

Ilustración artística del uso de ADN fósil. Imagen de Philipp Stoussel / ETH Zurich.

Ilustración artística del uso de ADN fósil. Imagen de Philipp Stoussel / ETH Zurich.

Grass se planteó el reto de conseguir lo mismo por una técnica artificial; fabricar un fósil capaz de conservar ADN intacto durante tanto tiempo que los procedimientos actuales de almacenamiento de información a largo plazo quedaran ampliamente sobrepasados. La respuesta fue el cristal: encapsular el ADN en esferas de sílice de unos 150 nanómetros, 0,15 milésimas de milímetro. Una vez construidos estos fósiles, y para analizar su durabilidad, Grass y sus colaboradores incubaron las partículas durante un mes a 60 o 70 ºC, lo que simula la degradación química que sufrirían a lo largo de cientos de años. Una vez terminado el tratamiento, los investigadores extrajeron el ADN de su caparazón de arena empleando soluciones de fluoruro como las que se utilizan en el grabado químico, para finalmente leer las secuencias y comprobar su integridad.

A partir de sus resultados, y comparándolos con la dinámica de degradación del ADN en el hueso, los investigadores han estimado cuánto tiempo podrían sobrevivir las muestras siendo aún legibles. Según exponen en su estudio, publicado en la revista Angewandte Chemie, a las temperaturas de Zúrich el ADN se conservaría durante 2.000 años, que aumentarían hasta 100.000 en el lugar más frío de Suiza. Pero si las esferas de sílice se almacenaran en el Banco Mundial de Semillas de Svalbard, una instalación subterránea en Noruega que se mantiene a -18 ºC, el ADN podría durar «más de dos millones de años», escriben los científicos.

Claro que todo esto no tendría sentido si no fuera para conservar información que podamos codificar a voluntad en el ADN. En mi anterior post expliqué la aproximación más rudimentaria al uso del ADN como lenguaje, traducir la secuencia a proteína y utilizar los aminoácidos como alfabeto de 20 letras. Pero este método solo permite codificar textos; para ampliar sus aplicaciones a cualquier tipo de información, es esencial emplear código binario, el idioma en el que se escriben los archivos digitales. Como conté anteriormente, un grupo de jóvenes investigadores chinos presentó un sistema en 2010, pero no es el único. Ya en 1996 se publicó un método ideado por un interesante personaje llamado Joe Davis, conocido como el «científico loco» del Instituto Tecnológico de Massachusetts (MIT).

Davis ha desarrollado su carrera a caballo entre el arte y la ciencia, siempre en la frontera de la originalidad y la innovación. En la década de 1980, tuvo la idea de introducir en una bacteria una obra de arte digitalizada. Para ello creó Microvenus, un símbolo rúnico que es también una representación simplicada de los genitales femeninos. Lo que Davis hizo fue inspirarse en el sistema empleado por Carl Sagan y Frank Drake en el mensaje de Arecibo, una señal de radio lanzada al espacio en 1974: convertir el gráfico en un panel de ceros y unos, y luego encadenar las líneas para transformarlo en un código lineal. Para ello, era necesario que las dimensiones del gráfico original fueran el producto de dos números primos, con el fin de que su reconstrucción en 2D fuera unívoca. A continuación, Davis tradujo el código binario en bases de ADN empleando una equivalencia con un sistema de compresión y añadiendo la clave al comienzo del mensaje.

El icono Microvenus y su codificación en ADN. Nótese que su traducción gráfica a código binario se realiza en un panel de 5x7, ambos números primos. Imagen de Joe Davis / JSTOR Art Journal.

El icono Microvenus y su codificación en ADN. Nótese que su traducción gráfica a código binario se realiza en un panel de 5×7, ambos números primos. Imagen de Joe Davis / JSTOR Art Journal.

La segunda gran aportación del estudio de Grass es un nuevo sistema de codificación que extiende y mejora la idea de Davis. El investigador del ETH y sus colaboradores han creado un método que toma los caracteres de un texto de dos en dos, pero tratándolos como si cada uno fuera un byte (ocho bits), lo que permite aplicarlo a cualquier tipo de archivo digital. El siguiente paso es transformar el conjunto de dos bytes en base 256 (256²=65.536) en un triplete en base 47 (47³=103.823). ¿Y por qué en base 47? Muy sencillo: es necesario asignar a cada triplete de ADN (ver mi post anterior) un número distintivo para hacer la conversión. Como secuenciar y leer cadenas de ADN con muchas bases repetidas (como GGGGGGGGGG o TTTTTTTTTTT) aumenta las posibilidades de error, los científicos se quedaron solo con los tripletes en los que la segunda y la tercera base son distintas; así, AAC es válido, pero CAA no. De este modo, reducen las repeticiones a un máximo de tres: AAC CCG. Con esto, de los 64 tripletes posibles (variaciones con repetición de cuatro elementos tomados de tres en tres), se quedan solo con 48. Pero como el campo bidimensional de valores debe basarse en un número primo, eligieron el más próximo, 47.

Así, cada par de caracteres o bytes queda transformado en un trío de números del 0 al 46, los cuales a su vez se corresponden con tripletes de ADN. Pero para corregir los errores debidos a la degradación del ADN, la síntesis o la lectura, los investigadores introdujeron redundancias de datos mediante códigos de Reed-Solomon, herramientas muy utilizadas, por ejemplo, en comunicaciones espaciales y en la grabación de soportes digitales como discos duros y CD. Para entender cómo funcionan estos códigos, podemos pensar en los bits de paridad empleados antiguamente para transmitir código ASCII; un carácter ASCII se codifica en siete bits binarios (0/1), pero solía introducirse un octavo bit, llamado de paridad, que tomaba el valor de 0 o 1 según la suma del resto de bits iguales a 1 fuera par o impar. De este modo, se incorporaba un valor de comprobación para detectar errores en la transmisión. Otro ejemplo es el dígito de control de los números de las cuentas bancarias. Los códigos Reed-Solomon son más complejos, pero se inspiran en un principio similar.

Empleando este sistema, los científicos codificaron dos textos, la versión en latín del Pacto Federal de 1291 que daba forma a la primera confederación suiza, y la traducción inglesa de El Método de los teoremas mecánicos perteneciente al Palimpsesto de Arquímedes. Tras la síntesis del ADN codificado, su encapsulación en sílice y el tratamiento térmico, los investigadores encontraron cierto grado de degradación del ADN, pero los códigos Reed-Solomon funcionaron a la perfección para corregir los errores. «Por primera vez, mostramos en experimentos reales que formando fósiles artificiales alrededor de nuestra muestra de ADN, y añadiendo esquemas de corrección de errores a la información almacenada en el ADN, este almacenamiento a largo plazo es posible en la práctica», concluye Grass.

Los científicos están pensando ya en aplicar su sistema a gran escala. «Estamos concibiendo la creación de una biblioteca de información digital para almacenamiento a largo plazo, pero por el momento es todavía un sueño, y requerirá dinero», apunta Grass. Sin embargo, otras utilidades no resultan tan lejanas: los investigadores han ensayado el sistema para añadir cápsulas magnéticas fósiles de ADN a modo de marcas de agua genéticas o etiquetas de autenticidad en productos como gasolina, aceites cosméticos o aceite de oliva. Las partículas, que son inalterables y solo pueden retirarse mediante imanes en instalaciones especializadas, introducen un sistema de código de barras genético que sirve para evitar falsificaciones y perseguir el contrabando.

2 comentarios

  1. Dice ser gensusanh

    Hola. Es un placer conocerte. Mi nombre es Susan Helms. Soy oficial del ejército estadounidense. Me gustaría conocer con usted.
    Soy romántico y divertido estar con él. Soy cariñosa, Leí su perfil y me gustaría indicar mi interés, estoy en busca de relaciones íntimas genuinas y significativas con el amor, la pasión y el romance.
    por favor me alegraré si usted me envía el correo a mi dirección de correo electrónico (gensusanh@yahoo.com)
    Yo os envío mis fotos y le dirá más sobre mí mismo. espero tener noticias de usted pronto.
    gensusanh@yahoo.com
    Susan Helms

    21 febrero 2015 | 15:41

  2. Dice ser le pianiste

    Quiero invitarte a que visites mi blog:
    http://www.pianistasdelmundo.blogspot.com
    Está dedicado a los mejores pianistas de todos los tiempos, hay videos en directo y enlaces con su biografía.
    Si te gusta añadela a tus favoritos,o hazte seguidor, iré incluyendo muchos más.
    Muchas gracias.

    22 febrero 2015 | 18:00

Los comentarios están cerrados.