Unos ingenieros usaron la IA para simular 500 años de evolución y ya tenemos un resultado: una proteína fluorescente

Comunicacion
Sin comentarios Facebook Twitter Flipboard E-mail
luis-marquez

Luis Ángel Márquez Flores

Editor Jr
luis-marquez

Luis Ángel Márquez Flores

Editor Jr

Mediante el uso de un modelo generativo de lenguajes IA llamado ESM3 (EvolutionaryScale Model 3), una empresa estadounidense llamada EvolutionaryScale logró crear una proteína fluorescente que no existe en la naturaleza. Este es un hito importante de la ciencia dado que dicha molécula logró simular el equivalente a 500 millones de años de evolución natural.

La nueva creación de EvolutionaryScale, llamada esmGFP, pertenece a una "familia" llamada proteínas flourescentes verdes (Green flourescent protein o GFP, por sus siglas en inglés). Las GFP pueden encontrarse en ciertos organismos, por ejemplo, en algunas medusas. De hecho, el descubrimiento de estas proteínas ganó el Premio Nobel de Química en 2008.

Una proteína singular

A pesar de que comparte una porción de su estructura con las proteínas fluorescentes naturales, esmGFP no es una copia de estas. Esta molécula posee un diseño general distinto. Lo interesante es que no se trata de una diferencia caprichosa, la proteína fue diseñada por ESM3 como una evolución natural que tomó un rumbo distinto de las otras.

El equipo de EvolutionaryScale afirma que las diferencias entre esmGFP y sus parientes naturales equivale a 500 millones de años de evolución. Y es que, según ESM3, sus características son plausibles bajo las leyes de la biología, como si la naturaleza hubiera optado por ese camino en lugar del real. Los resultados fueron publicados en un artículo de la revista Science.

Evolucion Cientificos Imagen | EvolutionaryScale.

La IA que escribe proteínas

EvolutionaryScale Model 3 es un modelo de lenguaje que no genera texto. De hecho, esta IA fue entrenada específicamente para trabajar con proteínas. ESM3 tiene como objetivo predecir la secuencia, estructura tridimensional y función de las moléculas, incluso de aquellas que no se conocen actualmente.

Para lograrlo, el equipo entrenó al modelo con datos de 3,150 millones de secuencias de proteínas, 236 millones de estructuras  moleculares y 539 millones de funciones asociadas. En total, el modelo procesó 771,000 millones de bloques de información. Gracias a esto, ESM3 es capaz de comprender cómo se ordenan los aminoácidos, cómo se pliegan y las funciones que pueden estos pueden desempeñar en diferentes contextos.

Este nivel de precisión representa una mejora considerable con respecto a modelos anteriores que solo tomaban en cuenta la secuencia de secuencia de aminoácidos. En el mundo de las proteínas, la forma es tan importante como el contenido y una ligera variación en el plegamiento puede cambiar por completo la función de la molécula.

Dna 163466 1920

Más que historia-ficción

Desarrollar proteínas que pudieron ser permite a los científicos especular con realidades altenativas en las que la evolución tomó otros caminos. Aunque también puede dar resultados más prácticos, como posibles aplicaciones en la medicina. Por ejemplo, en el desarrollo de una proteína con funciones similares a las que nuestro nuestro cuerpo sintetiza de forma natural para luchar contra determinados trastornos.

En cuanto a ESM3, el sitio de EvolutionaryScale menciona que todos modelos están disponibles en una beta cerrada en Forge. Esto permite a los científicos diseñar proteínas mediante programación o mediante aplicaciones interactivas para navegadores. Los investigadores pueden usar la API a través del acceso académico gratuito o en AWS a través de Sagemarker.

Inicio
×

Utilizamos cookies de terceros para generar estadísticas de audiencia y mostrar publicidad personalizada analizando tu navegación. Si sigues navegando estarás aceptando su uso. Más información