Recherche
Apprenez-en davantage sur la résolution du repliement des protéines sur deepmind.com/AlphaFold et consultez une chronologie de notre percée ici.
Cela fait un an que nous avons publié et open source AlphaFoldnotre système d'IA pour prédire la structure 3D d'une protéine uniquement à partir de sa séquence d'acides aminés 1D, et a créé le Base de données sur la structure des protéines AlphaFold (AlphaFold DB) pour partager librement ces connaissances scientifiques avec le monde. Les protéines sont les éléments constitutifs de la vie, elles sont à la base de tous les processus biologiques de chaque être vivant. Et comme la forme d’une protéine est étroitement liée à sa fonction, connaître sa structure permet de mieux comprendre ce qu’elle fait et comment elle fonctionne. Nous espérions que cette ressource révolutionnaire contribuerait à accélérer la recherche et la découverte scientifiques à l’échelle mondiale, et que d’autres équipes pourraient tirer des leçons et s’appuyer sur les progrès que nous avons réalisés avec AlphaFold pour créer de nouvelles percées. Cet espoir est devenu réalité bien plus rapidement que nous n’avions osé le rêver. À peine douze mois plus tard, AlphaFold a été consulté par plus d'un demi-million de chercheurs et utilisé pour accélérer les progrès sur d'importants problèmes concrets allant de pollution plastique à résistance aux antibiotiques.
Aujourd'hui, je suis incroyablement excité de partager la prochaine étape de ce voyage. En partenariat avec l'EMBL Institut européen de bioinformatique (EMBL-EBI)nous publions maintenant les structures prédites pour presque toutes les protéines cataloguées connues de la science, ce qui élargira la Base de données AlphaFold par plus de 200x – de près de 1 million de structures à plus de 200 millions de structures – avec le potentiel d'améliorer considérablement notre compréhension de la biologie.
Cette mise à jour inclut les structures prévues pour les plantes, les bactéries, les animaux et d'autres organismes, ouvrant ainsi de nombreuses nouvelles opportunités aux chercheurs d'utiliser AlphaFold pour faire progresser leurs travaux sur des questions importantes, notamment la durabilité, l'insécurité alimentaire et les maladies négligées.
La mise à jour d'aujourd'hui signifie que la plupart des pages de la base de données principale sur les protéines UniProt viendra avec une structure prévue. Les plus de 200 millions de structures seront également disponibles en téléchargement groupé via Ensembles de données publics Google Cloudrendant AlphaFold encore plus accessible aux scientifiques du monde entier.
L'impact d'AlphaFold jusqu'à présent
Douze mois après la sortie initiale d'AlphaFold, il a été étonnant de réfléchir à l'incroyable impact qu'AlphaFold a déjà eu et à notre long voyage pour atteindre l'étape d'aujourd'hui.
Pour notre équipe, le succès d'AlphaFold a été particulièrement gratifiant, à la fois parce qu'il s'agissait du système d'IA le plus complexe que nous ayons jamais construit, nécessitant de nombreuses innovations critiques, et parce qu'il a eu l'impact en aval le plus significatif. En démontrant que l'IA pouvait prédire avec précision la forme d'une protéine jusqu'à la précision atomique, à l'échelle et en quelques minutes, AlphaFold a non seulement fourni une solution à un grand défi de 50 ans, mais est également devenu le premier grand point de preuve de notre thèse fondatrice : que l’intelligence artificielle peut considérablement accélérer la découverte scientifique et, à son tour, faire progresser l’humanité.
Nous avons ouvert le code d'AlphaFold et publié deux articles approfondis dans Nature (1, 2), qui ont déjà été cités plus de 4 000 fois. Nous collaboré étroitement avec l'EMBL-EBI, leader mondial, pour concevoir un outil qui aiderait au mieux les biologistes à accéder et à utiliser AlphaFold, et ensemble, ils ont publié AlphaFold DB, une base de données consultable ouverte et gratuite pour tous. Avant de publier AlphaFold, conformément à notre approche prudente de être pionnier de manière responsablenous avons sollicité l'avis de plus de 30 experts dans les domaines de la recherche en biologie, de la sécurité, de l'éthique et de la sûreté pour nous aider à comprendre comment partager les avantages d'AlphaFold avec le monde, d'une manière qui maximiserait les avantages potentiels et minimiserait les risques potentiels.
À ce jour, plus de 500 000 chercheurs de 190 pays ont accédé à la base de données AlphaFold pour visualiser plus de 2 millions de structures. Nos structures disponibles gratuitement ont également été intégrées à d'autres ensembles de données publics, tels que Ensembl, UniProt et OpenTargets, où des millions d'utilisateurs y accèdent dans le cadre de leurs flux de travail quotidiens.
Nous avons été étonnés par la rapidité avec laquelle AlphaFold est déjà devenu un outil essentiel pour des centaines de milliers de scientifiques dans les laboratoires et les universités du monde entier, afin de les aider dans leur travail important. Quant à notre propre travail avec AlphaFold, nous avons donné la priorité aux applications qui, selon nous, auraient les avantages sociaux les plus positifs, en mettant l'accent sur les initiatives historiquement sous-financées ou négligées. Par exemple, nous nous sommes associés avec le Initiative Médicaments contre les maladies négligées (DNDi) pour les aider à faire progresser leurs recherches, les rapprochant ainsi de la découverte de remèdes salvateurs pour des maladies comme Leishmaniose et La maladie de Chagas qui touchent de manière disproportionnée les populations des régions les plus pauvres du monde. Nous avons également soutenu Journée mondiale des maladies tropicales négligées en créant des prédictions de structure pour les organismes identifiés par le Organisation mondiale de la santé comme une priorité élevée pour leur recherche, contribuant ainsi à faire progresser l'étude de maladies comme Lèpre et Schistosomiasequi dévastent la vie de plus d’un milliard de personnes dans le monde.
Cela a été très inspirant de voir la myriade de façons dont la communauté des chercheurs a utilisé AlphaFold, en l'utilisant pour tout, depuis comprendre les maladiesà protéger les abeillesà déchiffrer des énigmes biologiquesà en approfondissant les origines de la vie elle-même.
D'autres exemples impressionnants, choisis par les membres de notre équipe AlphaFold, incluent :
Un puzzle biologique, choisi par Kathryn Tunyasuvunakool
Dans un récent numéro spécial de Science, plusieurs groupes ont décrit comment AlphaFold les avait aidés à reconstituer le complexe des pores nucléaires, l'un des puzzles les plus diaboliques de la biologie. La structure géante se compose de centaines de parties protéiques et contrôle tout ce qui entre et sort du noyau cellulaire. Sa structure délicate a finalement été révélée en utilisant des méthodes expérimentales existantes pour révéler ses contours et des prédictions AlphaFold pour compléter et interpréter toutes les zones qui n'étaient pas claires. Cette puissante combinaison devient désormais courante dans les laboratoires, ouvrant la voie à de nouvelles connaissances scientifiques et montrant comment les techniques expérimentales et informatiques peuvent fonctionner ensemble.
Un nouveau monde de bioinformatique, choisi par Richard Evans
Des outils de recherche structurelle comme Recherche de plis et Dalí permettent aux utilisateurs de rechercher très rapidement des entrées similaires à une protéine donnée. Cela pourrait constituer une première étape vers l’exploitation de grands ensembles de données de séquences pour des protéines pratiquement utiles, telles que celles qui décomposent le plastique, et cela pourrait fournir des indices sur la fonction des protéines. La mise à jour de la base de données pour inclure plus de 200 millions de structures prévues amplifiera encore cet impact.
Impact direct sur la santé humaine, choisi par John Jumper
AlphaFold a déjà un impact direct et significatif sur la santé humaine. Rencontre avec des chercheurs du Société européenne de génétique humaine a révélé l’importance des structures AlphaFold pour les biologistes et les cliniciens qui tentent de découvrir les causes des maladies génétiques rares. De plus, AlphaFold est accélérer la découverte de médicaments en permettant une meilleure compréhension des protéines nouvellement identifiées qui pourraient être des cibles médicamenteuses et en aidant les scientifiques à trouver plus rapidement des médicaments potentiels qui s'y lient.
Juste le commencement
AlphaFold a propulsé la biologie dans une ère d’abondance structurelle, ouvrant ainsi la voie à l’exploration scientifique à la vitesse du numérique. La base de données AlphaFold sert de « recherche Google » pour les structures protéiques, offrant aux chercheurs un accès instantané aux modèles prédits des protéines qu'ils étudient, leur permettant ainsi de concentrer leurs efforts et d'accélérer le travail expérimental. Depuis combattre la maladie à développer des vaccins, AlphaFold a déjà permis des avancées incroyables sur certains de nos plus grands défis mondiaux, et ce n'est que le début de l'impact que nous commencerons à constater au cours des prochaines années. Nous espérons que cette base de données élargie aidera d’innombrables autres scientifiques dans leur travail et ouvrira de toutes nouvelles voies d’exploration scientifique, comme la métaprotéomique.
Chez DeepMind, nous travaillons dur pour exploiter tout ce potentiel avec des investissements importants dans de nombreux domaines, notamment en nous associant à notre nouvelle société sœur Alphabet. Laboratoires isomorphes réinventer l’ensemble du processus de découverte de médicaments à partir des principes premiers avec une approche axée sur l’IA ; création d'un laboratoire humide au célèbre Institut Francis Crick renforcer le lien entre l’IA et les techniques expérimentales pour faire progresser la compréhension de la biologie, y compris la conception des protéines et la génomique ; et élargir notre L'IA pour la science équipe pour accélérer les progrès de notre recherche en biologie fondamentale et appliquer l’IA à d’autres défis scientifiques fascinants et importants, tels que science du climat, chimie quantiqueet la fusion.
AlphaFold est un aperçu de l'avenir et de ce qui pourrait être possible avec les méthodes informatiques et d'IA appliquées à la biologie. À son niveau le plus fondamental, la biologie peut être considérée comme un système de traitement de l’information, même s’il est extraordinairement complexe et émergent. Tout comme les mathématiques constituent le langage de description idéal pour la physique, nous pensons que l’IA pourrait s’avérer être la technique idéale pour faire face à la complexité dynamique de la biologie. AlphaFold est une première preuve importante de cela, et le signe de bien d’autres choses à venir. En tant que pionniers dans le domaine émergent de la « biologie numérique », nous sommes ravis de voir l’énorme potentiel de l’IA commencer à se concrétiser en tant que l’un des outils les plus utiles de l’humanité pour faire progresser la découverte scientifique et comprendre les mécanismes fondamentaux de la vie.