Recherche
En juillet 2022, nous avons publié les prédictions de la structure des protéines AlphaFold pour presque toutes les protéines cataloguées connues de la science. Lire le dernier blog ici.
Aujourd'hui, je suis incroyablement fier et excité d'annoncer que DeepMind apporte une contribution significative à la compréhension de la biologie par l'humanité.
Lorsque nous a annoncé AlphaFold 2 En décembre dernier, il a été salué comme une solution au problème du repliement des protéines vieux de 50 ans. La semaine dernière, nous avons publié le article scientifique et code source expliquant comment nous avons créé ce système très innovant, et aujourd'hui nous partageons prédictions de haute qualité pour la forme de chaque protéine du corps humain, ainsi que pour les protéines de 20 autres organismes sur lesquels les scientifiques s'appuient pour leurs recherches.
Alors que les chercheurs cherchent des remèdes aux maladies et recherchent des solutions à d’autres problèmes majeurs auxquels l’humanité est confrontée – notamment la résistance aux antibiotiques, la pollution microplastique et le changement climatique – ils bénéficieront de nouvelles connaissances sur la structure des protéines. Les protéines sont comme de minuscules machines biologiques exquises. De la même manière que la structure d’une machine vous indique ce qu’elle fait, la structure d’une protéine nous aide à comprendre sa fonction. Aujourd'hui, nous partageons une mine d'informations ça double la compréhension que l'humanité a du protéome humainet révèle les structures protéiques trouvées dans 20 autres organismes biologiquement importants, de E. coli à la levure, et de la mouche des fruits à la souris.
En tant qu’outil puissant qui soutient les efforts des chercheurs, nous pensons qu’il s’agit de la contribution la plus significative que l’IA ait apportée à l’avancement des connaissances scientifiques à ce jour, et qu’elle constitue un excellent exemple des avantages que l’IA peut apporter à l’humanité. Ces connaissances sous-tendront de nombreuses avancées futures passionnantes dans notre compréhension de la biologie et de la médecine. Grâce à cinq années de travail inlassable et à beaucoup d'ingéniosité de la part de l'équipe AlphaFold, et à la collaboration étroite ces derniers mois avec nos partenaires de Institut européen de bioinformatique de l'EMBL (EMBL-EBI)nous sommes en mesure de partager cette ressource énorme et précieuse avec le monde.
Ce dernier travail s'appuie sur annonces Nous l'avons fait en décembre dernier, lors de la conférence CASP14, lorsque DeepMind a dévoilé une nouvelle version radicale de notre système AlphaFold, qui a été reconnue par les organisateurs de l'évaluation comme une solution au grand défi vieux de 50 ans consistant à comprendre la structure 3D des protéines. Déterminer expérimentalement les structures des protéines est une tâche longue et minutieuse, mais AlphaFold a démontré que l'IA pouvait prédire avec précision la forme d'une protéine, à l'échelle et en quelques minutes, jusqu'à une précision atomique. À CASPnous nous sommes engagés à partager nos méthodes et à offrir un large accès à cet ensemble de connaissances.
Ce mois-ci, nous avons terminé l'énorme travail acharné pour tenir cet engagement. Nous avons publié deux articles évalués par des pairs dans Nature (1,2) et code open source d'AlphaFold. Aujourd'hui, en partenariat avec EMBL-EBInous sommes incroyablement fiers de lancer le Base de données sur la structure des protéines AlphaFoldqui offre l’image la plus complète et la plus précise du protéome humain à ce jour, faisant plus que doubler les connaissances accumulées par l’humanité sur les structures protéiques humaines de haute précision.
En plus du protéome humain (l'ensemble des ~20 000 protéines exprimées par le génome humain), nous offrons un accès libre aux protéomes de 20 autres organismes biologiquement importants, totalisant plus de 350 000 structures protéiques. La recherche sur ces organismes a fait l’objet d’innombrables articles de recherche et de nombreuses avancées majeures, et a abouti à une compréhension plus approfondie de la vie elle-même. Dans les mois à venir, nous prévoyons d'étendre considérablement la couverture à presque toutes les protéines séquencées connues de la science – plus de 100 millions d'ouvrages couvrant la majeure partie du Base de données de référence UniProt. C'est un véritable almanach protéique du monde. Et le système et la base de données seront périodiquement mis à jour à mesure que nous continuons à investir dans les améliorations futures d'AlphaFold.
Plus intéressant encore, entre les mains de scientifiques du monde entier, ce nouvel almanach des protéines permettra et accélérera la recherche qui fera progresser notre compréhension de ces éléments constitutifs de la vie. Déjà, grâce à nos premières collaborations, nous avons constaté des signaux prometteurs de la part de chercheurs utilisant AlphaFold dans leurs propres travaux. Par exemple, le Initiative sur les médicaments contre les maladies négligées (DNDi) a fait progresser ses recherches sur des remèdes salvateurs pour les maladies qui touchent de manière disproportionnée les régions les plus pauvres du monde, et le Centre d'innovation enzymatique de l'Université de Portsmouth (CEI) utilise AlphaFold pour aider à concevoir des enzymes plus rapides afin de recycler certains de nos plastiques à usage unique les plus polluants. Pour les scientifiques qui s'appuient sur la détermination expérimentale de la structure des protéines, les prédictions d'AlphaFold ont contribué à accélérer leurs recherches. Comme autre exemple, une équipe du Université du Colorado à Boulder est prometteur dans l’utilisation des prédictions d’AlphaFold pour étudier la résistance aux antibiotiques, tandis qu’un groupe du Université de Californie à San Francisco les a utilisés pour accroître leur compréhension de la biologie du SRAS-CoV-2. Et ce n’est que le début de ce que nous espérons être une révolution dans la bioinformatique structurale. Avec AlphaFold dans le monde, il existe désormais un trésor de données qui attendent d’être transformées en avancées futures.
Pour l’équipe AlphaFold de DeepMind, ce travail représente l’aboutissement de cinq années d’efforts énormes, y compris la nécessité de surmonter de nombreux revers de manière créative, ce qui a abouti à une multitude de nouvelles innovations algorithmiques sophistiquées qui étaient toutes nécessaires pour enfin résoudre le problème. Il s'appuie sur les découvertes de générations de scientifiques, depuis les premiers pionniers de l'imagerie et de la cristallographie des protéines jusqu'aux milliers de spécialistes de la prédiction et de biologistes structurels qui ont depuis passé des années à expérimenter les protéines. Notre rêve est qu’AlphaFold, en fournissant cette compréhension fondamentale, aide d’innombrables autres scientifiques dans leur travail et ouvre de toutes nouvelles voies de découverte scientifique.
Chez DeepMind, notre thèse a toujours été que l’intelligence artificielle peut accélérer considérablement les percées dans de nombreux domaines scientifiques et, par conséquent, faire progresser l’humanité. Nous avons construit AlphaFold et le Base de données sur la structure des protéines AlphaFold soutenir et élever les efforts des scientifiques du monde entier dans le travail important qu’ils accomplissent. Nous pensons que l’IA a le potentiel de révolutionner la façon dont la science est réalisée au 21e siècle, et nous attendons avec impatience les découvertes qu’AlphaFold pourrait aider la communauté scientifique à débloquer ensuite.
Pour en savoir plus, rendez-vous sur Nature pour lire nos articles évalués par des pairs décrivant notre méthode complèteet le protéome humain. Vous pouvez en savoir plus à leur sujet dans notre blog technique. Si vous souhaitez explorer notre système, voici le code open source pour AlphaFold et Carnet Colab pour exécuter des séquences individuelles. Pour explorer nos structures, l'EMBL-EBI, leader mondial des données biologiques, les héberge dans une base de données consultable qui est ouvert et gratuit à tous.
Nous serions ravis d’entendre vos commentaires et de comprendre comment AlphaFold a été utile dans vos recherches. Partagez vos histoires sur alphafold@deepmind.com.