Parálogos universales: Los genes que guardan memoria de un tiempo anterior al origen de la vida tal como la conocemos

Una investigación científica identifica familias genéticas raras que conservan información evolutiva de hace más de 4.000 millones de años, cuando aún no existía el ancestro común de todos los seres vivos

Por qué los centros de datos en el espacio de Elon Musk son una mala idea

El origen de la vida en la Tierra
El origen de la vida en la Tierra

Hay un límite en la historia de la vida en la Tierra más allá del cual, hasta ahora, la ciencia no podía mirar. Ese límite tiene nombre: LUCA, las siglas en inglés del "último ancestro común universal", un organismo celular que vivió hace aproximadamente 4.000 millones de años y del que descienden todos los seres vivos que hoy pueblan el planeta. Plantas, animales, hongos, bacterias, arqueas: todos compartimos ese origen común.

Sin embargo, un grupo de científicos de tres universidades estadounidenses acaba de publicar en la revista Cell Genomics un trabajo que abre una ventana hacia un pasado aún más remoto.

Aaron Goldman, del Oberlin College; Greg Fournier, del Instituto Tecnológico de Massachusetts (MIT), y Betül Kaçar, de la Universidad de Wisconsin-Madison, han identificado un tipo especial de familias genéticas -los llamados parálogos universales- que conservan información evolutiva de acontecimientos anteriores a LUCA. Es decir, de un tiempo en el que la vida tal como la conocemos todavía estaba tomando forma.

"Aunque el último ancestro común universal es el organismo más antiguo que podemos estudiar con métodos evolutivos", explica Goldman en la nota de prensa que acompaña al estudio, "algunos de los genes de su genoma eran mucho más antiguos". La clave está en comprender qué son estos parálogos y por qué son tan importantes.

Genes que se copian y evolucionan por separado

Para entender el concepto de parálogo, conviene recurrir a un ejemplo cercano. En el genoma humano existen ocho versiones distintas de los genes de la hemoglobina, esas proteínas que transportan el oxígeno a través de la sangre.

Todas ellas descienden de un único gen ancestral que existía hace unos 800 millones de años. A lo largo del tiempo evolutivo, ese gen original se duplicó repetidamente debido a errores en la copia del ADN. Cada copia heredada evolucionó después de forma independiente, adquiriendo funciones ligeramente diferentes pero relacionadas.

Este fenómeno -la duplicación génica- es habitual en la evolución y una fuente importante de innovación biológica. Se calcula que aproximadamente el 70% de los genes humanos tienen algún pariente en el mismo genoma.

En bacterias como Escherichia coli, ese porcentaje ronda el 46%. La duplicación permite que una copia del gen mantenga su función original mientras la otra puede experimentar y desarrollar nuevas capacidades sin comprometer la supervivencia del organismo.

Los parálogos universales, sin embargo, son una rareza dentro de esta rareza. Se trata de familias de genes que tienen al menos dos copias en los genomas de prácticamente todos los organismos vivos actuales, desde las bacterias más simples hasta los mamíferos más complejos. Esa presencia tan extendida solo puede explicarse si la duplicación del gen original ocurrió antes de LUCA, de modo que sus descendientes heredaron ya las múltiples copias, que se han conservado durante más de 4.000 millones de años de evolución.

Una ventana hacia lo desconocido

"La historia de estos parálogos universales es la única información que tendremos jamás sobre estos linajes celulares más tempranos", advierte Fournier, "por eso necesitamos extraer cuidadosamente todo el conocimiento que podamos de ellos".

El número de parálogos universales conocidos es reducido -apenas una docena-, pero cada uno aporta pistas valiosas. Según el estudio, estas familias genéticas ancestrales están todas relacionadas con dos funciones celulares fundamentales: la producción de proteínas y el transporte de moléculas a través de las membranas celulares. Esto sugiere que ambas características fueron de las primeras en evolucionar en la historia de la vida.

El equipo de Goldman ha trabajado recientemente en una de estas familias, responsable de insertar enzimas y otras proteínas en las membranas celulares. Mediante técnicas de biología evolutiva y computacional, reconstruyeron la secuencia de la proteína ancestral original. El resultado fue revelador: esa versión más simple y antigua era capaz de unirse a la membrana y al aparato de síntesis de proteínas, y podría haber ayudado a las proteínas primitivas a implantarse en las primeras membranas celulares.

La inteligencia artificial como aliada

Uno de los aspectos más prometedores de esta línea de investigación es el papel que pueden desempeñar las nuevas herramientas computacionales, especialmente aquellas basadas en inteligencia artificial.

Los autores destacan en su artículo que técnicas como el aprendizaje automático y el hardware optimizado para IA están mejorando drásticamente la capacidad de identificar nuevos parálogos universales y de reconstruir con mayor precisión las proteínas ancestrales.

"Al seguir la pista de los parálogos universales", señala Kaçar, "podemos conectar los primeros pasos de la vida en la Tierra con las herramientas de la ciencia moderna. Nos brindan la oportunidad de transformar las incógnitas más profundas de la evolución y la biología en descubrimientos que realmente podemos poner a prueba".

La mejora de los modelos de predicción de estructuras proteicas, como AlphaFold de DeepMind, o el desarrollo de algoritmos capaces de analizar enormes volúmenes de datos genómicos, están acelerando este campo de estudio. Lo que antes requería años de trabajo manual en laboratorio puede ahora abordarse computacionalmente en cuestión de semanas o meses.

Reconstruyendo el retrato de LUCA

Las investigaciones recientes sobre LUCA han permitido trazar un retrato cada vez más detallado de este ancestro común. Se trataba, según las reconstrucciones filogenéticas, de un organismo celular relativamente complejo, dotado de membrana funcional y muy probablemente de un genoma de ADN, aunque este último punto sigue siendo objeto de debate entre algunos investigadores.

LUCA ya poseía un sistema completo de traducción genética -incluido un ribosoma funcional-, el código genético canónico que utilizan todos los seres vivos actuales, y enzimas para procesar y reparar el ADN. También contaba con proteínas relacionadas con el metabolismo, capaz de sintetizar o interconvertir nucleótidos, aminoácidos y azúcares. Incluso disponía de una ATP sintasa, la maquinaria molecular que genera ATP, la moneda energética de las células, a partir de gradientes de protones.

En definitiva, LUCA era ya un organismo con un sistema genético tripartito completo (ADN, ARN y proteínas) y un metabolismo sofisticado. Por eso resulta tan importante poder estudiar las etapas evolutivas anteriores: fue en ese periodo previo cuando debieron surgir prácticamente todos los sistemas moleculares fundamentales que definen la vida celular.

Los límites del conocimiento filogenético

Los autores del estudio son conscientes de las limitaciones de su enfoque. La pérdida de genes en múltiples linajes evolutivos, los bajos niveles de conservación en algunas familias genéticas o las transferencias horizontales masivas de genes pueden oscurecer el origen antiguo de muchas familias proteicas. Es probable que muchos de los parálogos que existieron en LUCA ya no sean detectables mediante análisis filogenéticos.

Además, existe una barrera infranqueable: los periodos de evolución anteriores a la emergencia del propio sistema genético no pueden estudiarse con estas herramientas, que dependen de secuencias de genes conservadas. Para esos momentos aún más remotos, la ciencia debe recurrir a otros enfoques, como experimentos de química prebiótica o simulaciones por ordenador.

Aun así, los parálogos universales son una de las pocas evidencias directas disponibles sobre la evolución molecular más temprana. "Aunque hay muy pocos parálogos universales conocidos", resume Goldman, "pueden darnos mucha información sobre cómo era la vida antes de la época del último ancestro común universal".

Aplicaciones más allá de la historia evolutiva

La investigación en este campo no tiene únicamente interés histórico. La capacidad de examinar proteínas ancestrales profundas y reconstruir sus secuencias podría proporcionar nuevos recursos para la bioingeniería.

Al aprovechar las herramientas computacionales emergentes junto con la reconstrucción de secuencias ancestrales, los investigadores podrían acceder a un catálogo de proteínas y sus dominios funcionales que fueron capaces de llevar a cabo funciones catalíticas fundamentales, pero que ya no existen en la misma forma hoy día.

Esto ampliaría el repertorio funcional conocido de la vida y proporcionaría catalizadores novedosos para su uso en biotecnología y campos relacionados. Proteínas ancestrales más simples podrían resultar más estables, más fáciles de producir o más versátiles que sus equivalentes modernos, más especializados.

A medida que se consolida la comprensión científica sobre LUCA -gracias a estudios recientes cada vez más exhaustivos-, las familias de parálogos universales se perfilan como una herramienta indispensable para empujar el conocimiento sobre la historia evolutiva temprana aún más atrás en el tiempo.

Se trata, en definitiva, de describir los procesos fundacionales que dieron forma a la vida tal como la conocemos hoy, empleando como guía esos genes que, contra todo pronóstico, han conservado la memoria molecular de un mundo anterior al propio origen de la vida moderna.

stats