Subscribe Us

CIENCIA. DeepMind publica una imagen precisa del proteoma humano

 

Estructuras de proteínas para representar los datos obtenidos a través de AlphaFold. Fuente: Karen Arnott / EMBL-EBI

DeepMind y EMBL publican la base de datos más completa de estructuras 3D predichas de proteínas humanas.

Los socios utilizan AlphaFold, el sistema de inteligencia artificial reconocido el año pasado como una solución al problema de predicción de la estructura de la proteína, para publicar más de 350.000 predicciones de la estructura de la proteína, incluido todo el proteoma humano, a la comunidad científica.

DeepMind ha anunciado su asociación con el Laboratorio Europeo de Biología Molecular (EMBL), el laboratorio insignia de Europa para las ciencias de la vida, para crear la base de datos más completa y precisa hasta ahora de modelos de estructura de proteínas pronosticados para el proteoma humano. Esto cubrirá las ~ 20.000 proteínas expresadas por el genoma humano, y los datos estarán disponibles de forma libre y abierta para la comunidad científica. 

La base de datos y el sistema de inteligencia artificial brindan a los biólogos estructurales nuevas y poderosas herramientas para examinar la estructura tridimensional de una proteína, y ofrecen un tesoro de datos que podrían desbloquear futuros avances y presagiar una nueva era para la biología habilitada por IA.

El reconocimiento de AlphaFold en diciembre de 2020 por parte de los organizadores de la evaluación comparativa Critical Assessment of Protein Structure Prediction (CASP) como una solución al gran desafío de 50 años de predicción de la estructura de proteínas fue un avance sorprendente para el campo. La base de datos de estructura de proteínas AlphaFold se basa en esta innovación y en los descubrimientos de generaciones de científicos, desde los primeros pioneros de la imagenología de proteínas y la cristalografía, hasta los miles de especialistas en predicción y biólogos estructurales que han pasado años experimentando con proteínas desde entonces. 

La base de datos amplía drásticamente el conocimiento acumulado de las estructuras de proteínas, más del doble de la cantidad de estructuras de proteínas humanas de alta precisión disponibles para los investigadores. Avanzando en la comprensión de estos componentes básicos de la vida,

La semana pasada, la metodología detrás de la última versión altamente innovadora de AlphaFold, el sofisticado sistema de inteligencia artificial anunciado en diciembre pasado que impulsa estas predicciones de estructura, y su código fuente abierto se publicaron en  Nature . El anuncio  coincide con un segundo artículo de Nature que proporciona la imagen más completa de las proteínas que componen el proteoma humano y la liberación de 20 organismos adicionales que son importantes para la investigación biológica.

El complejo de mediadores humanos ha sido durante mucho tiempo uno de los sistemas de proteínas múltiples más difíciles de entender para los biólogos estructurales. Fuente: Yuan He


El objetivo en DeepMind siempre ha sido construir IA (Inteligencia Artificial) y luego usarla como una herramienta para ayudar a acelerar el ritmo del descubrimiento científico en sí, mejorando así nuestra comprensión del mundo que nos rodea. Los científicos usaron la herramienta AlphaFold para generar la imagen más completa y precisa del proteoma humano. Esto representa la contribución más significativa que ha hecho la IA al avance del conocimiento científico hasta la fecha, y es un gran ejemplo de los tipos de beneficios que la IA puede aportar a la sociedad.

AlphaFold ya está ayudando a los científicos a acelerar el descubrimiento

La capacidad de predecir computacionalmente la forma de una proteína a partir de su secuencia de aminoácidos, en lugar de determinarla experimentalmente a través de años de técnicas minuciosas, laboriosas y, a menudo, costosas, ya está ayudando a los científicos a lograr en meses lo que antes tomaba años.

AlphaFold fue capacitado utilizando datos de recursos públicos creados por la comunidad científica, por lo que tiene sentido que sus predicciones sean públicas. Compartir las predicciones de AlphaFold de forma abierta y gratuita permitirá a los investigadores de todo el mundo obtener nuevos conocimientos e impulsar el descubrimiento. AlphaFold es verdaderamente una revolución para las ciencias de la vida, al igual que lo fue la genómica hace varias décadas.

AlphaFold ya está siendo utilizado por socios como la Iniciativa de Medicamentos para Enfermedades Desatendidas (DNDi), que ha avanzado en su investigación sobre curas que salvan vidas para enfermedades que afectan de manera desproporcionada a las partes más pobres del mundo, y el Centro de Innovación Enzimática (CEI) utiliza AlphaFold para ayudar a diseñar enzimas más rápidas para reciclar algunos de nuestros plásticos de un solo uso más contaminantes. 

Para aquellos científicos que confían en la determinación experimental de la estructura de las proteínas, las predicciones de AlphaFold han ayudado a acelerar su investigación. Por ejemplo, un equipo de la Universidad de Colorado en Boulder se encuentra prometedor en el uso de las predicciones AlphaFold para estudiar la resistencia a los antibióticos, mientras que un grupo de la Universidad de California en San Francisco las ha utilizado para aumentar su comprensión de la biología del SARS-CoV-2.

Predicción de estructuras de proteínas con AlphaFold para diferentes especies. Fuente: EMBL – EBI y https://swissmodel.expasy.org/repository


La base de datos de estructura de proteínas AlphaFold

La base de datos de estructura de proteínas AlphaFold se basa en muchas contribuciones de la comunidad científica internacional, así como en las sofisticadas innovaciones algorítmicas de AlphaFold y las décadas de experiencia de EMBL-EBI en el intercambio de datos biológicos del mundo. DeepMind y el Instituto Europeo de Bioinformática de EMBL (EMBL-EBI) están proporcionando acceso a las predicciones de AlphaFold para que otros puedan usar el sistema como una herramienta para permitir y acelerar la investigación y abrir vías completamente nuevas de descubrimiento científico.

Este será uno de los conjuntos de datos más importantes desde el mapeo del Genoma Humano. Hacer que las predicciones de AlphaFold sean accesibles a la comunidad científica internacional abre muchas nuevas vías de investigación, desde enfermedades desatendidas hasta nuevas enzimas para la biotecnología. Esta es una gran herramienta científica nueva, que complementa las tecnologías existentes.

Para el proteoma humano, el 58% de sus predicciones para las ubicaciones de los aminoácidos individuales fueron lo suficientemente buenas como para confiar en la forma de los pliegues de la proteína. Un subconjunto de esas predicciones, el 36% del total, son potencialmente lo suficientemente precisas como para detallar las características atómicas útiles para el diseño de fármacos, como el sitio activo de una enzima.

Además del proteoma humano, la base de datos se lanza con ~ 350.000 estructuras que incluyen 20 organismos biológicamente significativos como E. coli, mosca de la fruta, ratón, pez cebra, parásito de la malaria y bacterias de la tuberculosis. La investigación de estos organismos ha sido objeto de innumerables trabajos de investigación y numerosos avances importantes. Estas estructuras permitirán a los investigadores de una gran variedad de campos, desde la neurociencia hasta la medicina, acelerar su trabajo.

El futuro de AlphaFold

La base de datos y el sistema se actualizarán periódicamente a medida que se siga invirtiendo en mejoras futuras de AlphaFold. En los próximos meses está previsto expandir la cobertura a casi todas las proteínas secuenciadas conocidas por la ciencia: más de 100 millones de estructuras que cubren la mayor parte de la referencia de la base de datos UniProt

Para obtener más información, consulte los artículos de Nature que describen el método completo y el proteoma humano. Consulte el código de fuente abierta de AlphaFold si desea ver el funcionamiento del sistema y el cuaderno Colab  para ejecutar secuencias individuales. Para explorar las estructuras, visite la base de datos de búsqueda * de EMBL-EBI que está abierta y es gratuita para todos.

Fuentes:

“Highly accurate protein structure prediction for the human proteome” by Kathryn Tunyasuvunakool, Jonas Adler, Zachary Wu, Tim Green, Michal Zielinski, Augustin Žídek, Alex Bridgland, Andrew Cowie, Clemens Meyer, Agata Laydon, Sameer Velankar, Gerard J. Kleywegt, Alex Bateman, Richard Evans, Alexander Pritzel, Michael Figurnov, Olaf Ronneberger, Russ Bates, Simon A. A. Kohl, Anna Potapenko, Andrew J. Ballard, Bernardino Romera-Paredes, Stanislav Nikolov, Rishub Jain, Ellen Clancy, David Reiman, Stig Petersen, Andrew W. Senior, Koray Kavukcuoglu, Ewan Birney, Pushmeet Kohli, John Jumper and Demis Hassabis, 22 July 2021, NatureDOI: 10.1038/s41586-021-03828-1

“Highly accurate protein structure prediction with AlphaFold” by John Jumper, Richard Evans, Alexander Pritzel, Tim Green, Michael Figurnov, Olaf Ronneberger, Kathryn Tunyasuvunakool, Russ Bates, Augustin Žídek, Anna Potapenko, Alex Bridgland, Clemens Meyer, Simon A. A. Kohl, Andrew J. Ballard, Andrew Cowie, Bernardino Romera-Paredes, Stanislav Nikolov, Rishub Jain, Jonas Adler, Trevor Back, Stig Petersen, David Reiman, Ellen Clancy, Michal Zielinski, Martin Steinegger, Michalina Pacholska, Tamas Berghammer, Sebastian Bodenstein, David Silver, Oriol Vinyals, Andrew W. Senior, Koray Kavukcuoglu, Pushmeet Kohli and Demis Hassabis, 15 July 2021, Nature.
DOI: 10.1038/s41586-021-03819-2

Publicar un comentario

0 Comentarios