Portada » La IA predice las formas de las moléculas que vendrán
Tecnología

La IA predice las formas de las moléculas que vendrán

La IA predice las formas de las moléculas que vendrán

Desde hace algunos años, John McGeehan, biólogo y director del Center for Enzyme Innovation en Portsmouth, Inglaterra, busca una molécula que pueda romper 150 millones de toneladas de botellas de refrescos y otros desechos plásticos en todo el mundo.

Trabajando con investigadores de ambos lados del Atlántico, encontró algunas buenas opciones. Pero su trabajo es el del cerrajero más exigente: localizar los compuestos químicos que se retuercen y se doblan por sí mismos en la forma microscópica que puede encajar perfectamente en las moléculas de una botella de plástico y separarlas, como una llave que abre una puerta. .

Determinar el contenido químico exacto de cualquier enzima es un desafío bastante simple en estos días. Pero identificar su forma tridimensional puede implicar años de experimentación bioquímica. El otoño pasado, después de leer que un laboratorio de inteligencia artificial en Londres llamado DeepMind había construido un sistema que predice automáticamente las formas de las enzimas y otras proteínas, el Dr. McGeehan le preguntó al laboratorio si podía ayudar con su proyecto.

Hacia el final de una semana de trabajo, envió a DeepMind una lista de siete enzimas. El lunes siguiente, el laboratorio devolvió los formularios de los siete. “Eso nos llevó un año por delante de donde estábamos, si no dos”, dijo McGeehan.

Ahora cualquier bioquímico puede acelerar su trabajo de la misma forma. El jueves, DeepMind dio a conocer las formas previstas de más de 350.000 proteínas, los mecanismos microscópicos que impulsan el comportamiento de las bacterias, los virus, el cuerpo humano y todos los demás seres vivos. Esta nueva base de datos incluye las estructuras tridimensionales de todas las proteínas expresadas por el genoma humano, así como las de proteínas que aparecen en otros 20 organismos, incluidos ratones, moscas de la fruta y bacterias E. coli.

Este vasto y detallado mapa biológico, que proporciona unas 250.000 formas que antes se desconocían, puede acelerar la capacidad de comprender enfermedades, desarrollar nuevos medicamentos y redirigir los existentes. También puede conducir a nuevos tipos de herramientas biológicas, como una enzima que descompone de manera eficiente las botellas de plástico y las convierte en materiales que se pueden reutilizar y reciclar fácilmente.

“Puede llevarlo hacia adelante en el tiempo, influir en su forma de pensar sobre los problemas y ayudarlo a resolverlos más rápidamente”, dijo Gira Bhabha, profesora asistente en el departamento de biología celular de la Universidad de Nueva York. “Ya sea que estudie neurociencia o inmunología, sea cual sea su campo de biología, esto puede ser útil”.

Este nuevo conocimiento es su propio tipo de clave: si los científicos pueden determinar la forma de una proteína, pueden determinar cómo otras moléculas se unirán a ella. Esto puede revelar, digamos, cómo las bacterias resisten a los antibióticos y cómo combatir esa resistencia. Las bacterias resisten a los antibióticos al expresar ciertas proteínas; si los científicos pudieran identificar las formas de estas proteínas, podrían desarrollar nuevos antibióticos o nuevos fármacos que las supriman.

En el pasado, localizar la forma de una proteína requería meses, años o incluso décadas de experimentos de prueba y error con rayos X, microscopios y otras herramientas en la mesa de laboratorio. Pero DeepMind puede reducir significativamente la línea de tiempo con su tecnología de inteligencia artificial, conocida como AlphaFold.

Cuando el Dr. McGeehan envió a DeepMind su lista de siete enzimas, le dijo al laboratorio que ya había identificado las formas de dos de ellas, pero no dijo cuáles eran. Esta fue una forma de probar el funcionamiento del sistema; AlphaFold pasó la prueba, prediciendo correctamente ambas formas.

Fue aún más notable, dijo McGeehan, que las predicciones llegaran a los pocos días. Más tarde se enteró de que AlphaFold había completado la tarea en solo unas pocas horas.

AlphaFold predice estructuras de proteínas utilizando lo que se llama red neuronal, un sistema matemático que puede aprender tareas analizando grandes cantidades de datos, en este caso, miles de proteínas conocidas y sus formas físicas, y extrapolando a lo desconocido.

Esta es la misma tecnología que identifica los comandos que grita en su teléfono inteligente, reconoce rostros en las fotos que publica en Facebook y traduce un idioma a otro usando Google Translate y otros servicios. Pero muchos expertos creen que AlphaFold es una de las aplicaciones más poderosas de la tecnología.

“Esto muestra que la IA puede hacer cosas útiles en medio de la complejidad del mundo real”, dijo Jack Clark, uno de los autores del Índice de IA, un esfuerzo por rastrear el progreso de la tecnología de inteligencia artificial en todo el mundo.

Como descubrió el Dr. McGeehan, puede ser extremadamente preciso. AlphaFold puede predecir la forma de una proteína con una precisión que compite con los experimentos físicos alrededor del 63 por ciento de las veces, según pruebas de referencia independientes que comparan sus predicciones con estructuras proteicas conocidas. La mayoría de los expertos asumieron que aún faltaban años para una tecnología tan poderosa.

“Pensé que tomaría otros 10 años”, dijo Randy Read, profesor de la Universidad de Cambridge. “Este fue un cambio completo”.

Pero la precisión del sistema varía, por lo que algunas de las predicciones en la base de datos de DeepMind serán menos útiles que otras. Cada predicción en la base de datos viene con una “puntuación de confianza” que indica qué tan precisa es probable que sea. Los investigadores de DeepMind estiman que el sistema proporciona una “buena” predicción alrededor del 95 por ciento de las veces.

Como resultado, el sistema no puede reemplazar completamente los experimentos físicos. Se utiliza junto con el trabajo de laboratorio, ayudando a los científicos a determinar qué experimentos realizar y llenando los vacíos cuando los experimentos no tienen éxito. Usando AlphaFold, investigadores de la Universidad de Colorado Boulder ayudaron recientemente a identificar una estructura de proteína que han luchado por identificar durante más de una década.

Los desarrolladores de DeepMind optaron por compartir libremente su base de datos de estructuras de proteínas en lugar de vender el acceso, con la esperanza de impulsar el progreso en las ciencias de la vida. “Estamos interesados ​​en el máximo impacto”, dijo Demis Hassabis, director ejecutivo y cofundador de DeepMind, que es propiedad de la misma empresa matriz que Google, pero opera más como un laboratorio de investigación que como una empresa comercial.

Algunos científicos han comparado la nueva base de datos de DeepMind con el Proyecto Genoma Humano. Completado en 2003, el Proyecto Genoma Humano proporcionó un mapa de todos los genes humanos. Ahora, DeepMind ha proporcionado un mapa de las aproximadamente 20.000 proteínas expresadas por el genoma humano, otro paso para comprender cómo funcionan nuestros cuerpos y cómo podemos responder cuando las cosas van mal.

También se espera que la tecnología continúe evolucionando. Un laboratorio de la Universidad de Washington construyó un sistema similar llamado RoseTTAFold y, al igual que DeepMind, compartió abiertamente el código informático que alimenta su sistema. Cualquiera puede utilizar la tecnología y trabajar para mejorarla.

Incluso antes de que DeepMind comenzara a compartir abiertamente su tecnología y datos, AlphaFold estaba impulsando una amplia gama de proyectos. Los investigadores de la Universidad de Colorado están utilizando la tecnología para comprender cómo las bacterias como E. coli y salmonella desarrollan resistencia a los antibióticos y para desarrollar formas de combatir esa resistencia. En la Universidad de California, San Francisco, los investigadores utilizaron la herramienta para mejorar su comprensión del coronavirus.

El coronavirus causa estragos en el cuerpo a través de 26 proteínas diferentes. Con la ayuda de AlphaFold, los investigadores han mejorado su comprensión de una proteína clave y esperan que la tecnología pueda ayudar a aumentar su comprensión de las otras 25.

Si esto llega demasiado tarde para tener un impacto en la pandemia actual, podría ayudar a prepararse para la próxima. “Una mejor comprensión de estas proteínas nos ayudará no solo a apuntar a este virus, sino también a otros virus”, dijo Kliment Verba, uno de los investigadores en San Francisco.

Las posibilidades son infinitas. Después de que DeepMind le dio al Dr. McGeehan formas para siete enzimas que potencialmente podrían librar al mundo de los desechos plásticos, envió al laboratorio una lista de otras 93. “Están trabajando en eso ahora”, dijo.

¡Haz clic para puntuar esta entrada!
(Votos: 0 Promedio: 0)

Añadir un comentario

Haz clic para publicar un comentario