CORONAVIRUS

Te contamos cómo se descifra el código del SARS-CoV-2

Entrevistamos al investigador Guiseppe D'Auria, de FISABIO, quien han contribuido a descifrar el código genético del coronavirus con más de 4.000 muestras.

FISABIO

Desde el inicio de la pandemia de coronavirus, el Servicio de Secuenciación y Bioinformática de la Fundación Fisabio, en la Comunidad Valenciana, ha secuenciado cerca de 4.000 muestras del virus del SARS-CoV-2, lo que representa el 70% de las secuencias de virus obtenidas en España.

Este número de genomas secuenciados sitúa a España como el cuarto país del mundo en número de secuencias aportadas a la red GISAID (Global Public Sequence Repository). Esta secuenciación es clave para el conocimiento de la dispersión de los virus y el desarrollo de nuevos fármacos, tratamientos y vacunas. Entrevistamos a uno de los investigadores, el experto Giuseppe D'Auria, quien nos da las claves del coronavirus.

¿Cómo se descifra un código de un virus desconocido?

Puedo decir que el término "descifrar" corresponde a obtener la secuencia completa del genoma de un organismo. El "genoma" es la secuencia de las cuatro moléculas (que llamamos bases o nucleótidos) cuyo nombre químico es Adenina (A), Timina (T), Guanina (G) y Citosina (C), que componen, como si de un libro se tratara, las instrucciones para reconstruir un organismo, hacerlo funcionar y, lo que es más asombroso, copiar el mismo libro. En su conjunto, componen el ácido desoxirribonucleico, en inglés abreviado como DNA o ADN en castellano. Algunos virus llevan un código basado en ácido ribonucleico o ARN cuya diferencia en el lenguaje es que encontramos un Uracilo (U) en lugar de la Timina (T).

Los métodos para obtener estas secuencias se remontan a los años setenta. Estas técnicas eran, en sus comienzos, peligrosas, lentas y costosas. Alrededor de 2004, aparecen nuevos métodos que aceleraron de manera exponencial la lectura de estas secuencias al mismo ritmo al que se abarataron sus costes y los tiempos de análisis. Hoy en día hemos llegado al punto en el que podemos leer moléculas de ADN casi en tiempo real (un par de horas desde la obtención de las muestras) y usando nada menos que la potencia de cálculo de un teléfono móvil. Lo que se ha nombrado como la "democratización de la secuenciación de ADN".

Técnicamente, todos podríamos estar secuenciando cualquier cosa. Para ello, necesitamos de unas máquinas llamadas "secuenciadores de ADN" de los que hoy contamos con un abanico de costes y prestaciones muy amplio. Desde portátiles, accesibles por un coste que rodea los mil euros, hasta los más poderosos que cuestan hasta un millón, con todas las posibilidades intermedias.

Para obtener la secuencia de un organismo tendríamos que obtener una cantidad suficiente de ADN para que estas máquinas puedan leerlo y finalmente acabar en un documento de texto tipo "AGCTGCTAGTATCGGGAT...".

El problema de secuenciar un organismo o un virus desconocido es que empezamos sin saber nada sobre el. No tenemos información previa. Esto nos impide seleccionar el ADN a secuenciar. En el mejor de los casos nos encontramos con un ADN del organismo hospedador junto con "algo desconocido". En este caso, uno de los abordajes podría ser secuenciarlo todo en una única mezcla. Si el hospedador es humano, por ejemplo, podemos filtrar las secuencias humanas, de las que ya conocemos el genoma, y luego estudiar aparte todo lo que no se conoce. En el caso de virus con genoma de ARN los protocolos son un poco más complicados, ya que tenemos que traducir antes el ARN en ADN, para luego poder seguir con la secuenciación.

La secuencia de nucleótidos como tal podría no decirnos nada. Imaginaros una secuencia de 20.000 caracteres de un alfabeto de 4 letras, sin espacios y sin entender nada de lo que está escrito. Por suerte, contamos con bases de datos y programas bioinformáticos que nos permiten "detectar" las palabras y, por comparación acceder a los diccionarios que definen cada una de ellas. Siempre quedan cosas por descubrir, pero esto ya es una gran ayuda, o por lo menos un buen punto de partida.

El investigador Giuseppe D'Auria nos cuenta cómo fue descifrar la primera muestra de coronavirus en España. FISABIO

¿Es como el DNI del virus?

Exacto. Por comparación entre los genomas de los virus, así como de cualquier organismo, el genoma se pueden entender como la esencia última de cada ser. Un cambio de una letra puede ser la clave para describir la procedencia del organismo que se está estudiando. De todos los organismos conocidos, probablemente ya tenemos algún fragmento genómico ya secuenciado que nos permite, por comparación (que en jerga llamamos "alineamiento"), reconstruir su árbol genealógico (que llamamos "filogenético") y que nos permite distinguir un grupo de otro.

¿Nos puede permitir anticiparnos a posibles mutaciones?

El estudio de estos cambios, que podemos llamar mutaciones, nos indican el recorrido evolutivo de un virus (como de cualquier bacteria, levadura o un elefante). Por ejemplo, en el caso de brotes epidémicos, el estudio de las mutaciones de los genomas secuenciados nos permite seguir la evolución espacial y temporal del agente patógeno. Es decir, podemos conocer la región geográfica hacia la que se ha desplazado un subtipo específico del patógeno en estudio y/o los tiempos en los que se ha ido moviendo y cambiando (mutando).

Uno de los aspectos más interesante es, probablemente, encontrar eventuales relaciones entre los subtipos que hayan mutado y, si la hay, eventuales correlaciones con la clínica de los pacientes de los que procede el genoma viral. Es importante también tener en cuenta que cuando se encuentran mutaciones, en la mayoría de casos no se trata de hechos dramáticamente negativos. En la mayoría de los casos se trata de variaciones que no alteran la actividad del virus. Más bien se trata de cambios neutros. Otros cambios pueden no ser compatibles con la vida del virus y lo eliminarían de la línea evolutiva; por supuesto nunca llegaremos a conocer estos cambios.

Por contra, hay otras mutaciones que pueden dar una ventaja evolutiva. Estos "mutantes" vivirán conjuntamente con el resto de las poblaciones virales, pero puede que se adapten mejor o incluso que reemplacen al linaje original. Y es justo por este motivo que es tan importante hacer un seguimiento constante de las epidemias mediante la secuenciación de los genomas completos del virus. Como dijimos anteriormente, hoy en día es una herramienta rápida, relativamente barata y altamente informativa que nos permite identificar cambios en el genoma de forma temprana, adelantándonos a eventuales cambios de escenario.

¿Hay algo 'genético' en los españoles, o afecta a todas las nacionalidades, etnias, etc... de la misma manera?

Actualmente creo que más que con la etnia y la nacionalidad, los factores que más explican la incidencia tienen que ver con las oportunidades de acceder a sistemas sanitarios, con los modelos de comportamiento y culturales. Hay varios informes internacionales que apuntan en esta dirección. Por ejemplo, es importante transmitir y aplicar las mismas restricciones en España como en Inglaterra o Japón, posiblemente eligiendo las que han dado mejores resultados. Una ventaja es (o tendría que ser) el hecho de que ya tenemos estos datos. De momento parece que los subtipos virales encontrados no tienen preferencias de nacionalidad o etnia, pero sí que ha sido diferente la manera en la que cada nación se ha enfrentado a la pandemia.

¿Cómo fue analizar las 4.000 muestras?

Bueno, con las primeras decenas de secuencias empezamos guiándonos por protocolos que se iban actualizando a diario. Ha sido un momento bastante frenético. En febrero ya estaban algunos protocolos que se iban aplicando en varios sitios del mundo y cada mejora se iba propagando como la pólvora. Hay que dar gracias a internet, que en este caso representó un valioso instrumento de comunicación (creo que es una de la primeras veces que vimos el potencial de estar interconectados). A mediados de marzo conseguimos secuenciar y enviar las primeras secuencias de SARS-CoV-2 de España a las bases de datos a la que accede toda la comunidad científica.

Luego empezamos a ajustar los protocolos, reducir los tiempos y aumentamos el número de muestras semanales. Esta experiencia nos permitió entrar como el mayor grupo de secuenciación en el gran proyecto de genómica de SARS-CoV-2 de España, SeqCOVID, financiado por el Instituto de Salud Carlos III y el CSIC.

Hasta la fecha tenemos ya casi 4.000 muestras procesadas. Quiero resaltar que es un trabajo de equipo donde muchos laboratorios actúan desde la recogida y envío de las muestras, aplicación de los protocolos de biología molecular, secuenciación, análisis bioinformático y presentación de los datos. Hoy en día hemos alcanzado una media de procesamiento de unas 400 muestras por semana.

¿Más miedo, más curiosidad, más respeto, más emoción por hacer algo único en un momento único a nivel global?

En los primeros días, antes del confinamiento, sí estábamos un poco nerviosos. Más que por el virus, del que todavía no habíamos (o por lo menos yo) asimilado la peligrosidad, por el desafío de obtener la primera secuencia con protocolos que usábamos por primera vez.

Recuerdo el primer fichero que salió del secuenciador, copié la secuencia y la pegué en el buscador de la base de datos de secuencias y me devolvió la línea "Severe acute respiratory syndrome coronavirus 2...." Sí que me emocionó...

Por un lado, había sido un éxito y en ese momento piensas: "tengo otra docena de muestras más de pacientes que me están dando el mismo resultado". Por otro lado, te das cuenta de que son muestras procedentes de pacientes positivos que lo están pasando realmente mal. Entiendes que además de estar mal, probablemente están muy asustados, más que yo, que al fin y al cabo estoy delante de una pantalla de ordenador y sigo trabajando. Sabes que con más y más secuencias se va a dibujar un mapa y esto sí que servirá, probablemente no de manera instantánea, pero sí a medio y largo plazo.

Hoy tenemos un mapa bastante robusto del movimiento del virus por España que nos enseña cómo han ido cambiando los linajes a lo largo del territorio y nos permite saber el estado actual de la pandemia desde el punto de vista filogenético y por supuesto, ahora sí, podemos alertar en caso de que aparezcan nuevos linajes.

Coronavirus y gripe, ¿está nuestro cuerpo preparado?

El organismo básicamente no está preparado. No hay todavía una vacuna, y el coronavirus, a diferencia de la gripe (que no es de un solo tipo), está circulado desde hace pocos meses. Las coinfecciones entre SARS-CoV-2 y gripe, si bien todavía no se han dado muchos casos, pueden agravar el cuadro clínico del paciente.

En los primeros artículos que empiezan a llegar sobre coinfecciones, se extrema la importancia del personal sanitario para entender qué le está pasando al paciente y aplicar los tratamientos oportunos, ya que en muchos casos la sintomatología se solapa. Si bien no existe todavía la "cura" definitiva, es verdad que se conoce algo más sobre cómo abordar el SARS-CoV-2 y mejorar el pronóstico en cada caso, pero ahora habrá casos en los que se tendrá que actuar conjuntamente con los protocolos contra la gripe.

El mensaje que creo es importante transmitir es que la pandemia que estamos viviendo es algo serio. La gripe estacional ya convive con nosotros desde hace mucho tiempo y le restamos importancia si bien cada año llega con su carga de casos graves y decesos. Pero, los dos juntos, tanto si se trata de coinfecciones como de infecciones separadas, representarán una carga importante para los sistemas de salud que tendrán que amortiguar el impacto. Todos tenemos la responsabilidad de ayudar, si no directamente, intentando no ser un agravio por el personal sanitario que, al fin y al cabo, es el que está en primera línea.