Recherche
Mise à jour des progrès : notre dernier modèle AlphaFold montre une précision considérablement améliorée et étend la couverture au-delà des protéines à d'autres molécules biologiques, y compris les ligands.
Depuis sa sortie en 2020, AlphaFold a révolutionné la façon dont les protéines et leurs interactions sont comprises. Google DeepMind et Laboratoires isomorphes ont travaillé ensemble pour jeter les bases d’un modèle d’IA plus puissant qui étend la couverture au-delà des seules protéines à la gamme complète de molécules biologiquement pertinentes.
Aujourd'hui, nous sommes partager une mise à jour sur les progrès vers la prochaine génération d’AlphaFold. Notre dernier modèle peut désormais générer des prédictions pour presque toutes les molécules du Banque de données sur les protéines (PDB), atteignant fréquemment la précision atomique.
Il ouvre la voie à de nouvelles connaissances et améliore considérablement la précision de plusieurs classes de biomolécules clés, notamment les ligands (petites molécules), les protéines, les acides nucléiques (ADN et ARN) et ceux contenant des modifications post-traductionnelles (PTM). Ces différents types et complexes de structures sont essentiels à la compréhension des mécanismes biologiques au sein de la cellule et sont difficiles à prédire avec une grande précision.
Les capacités et les performances étendues du modèle peuvent contribuer à accélérer les percées biomédicales et à réaliser la prochaine ère de la « biologie numérique » — en donnant de nouvelles informations sur le fonctionnement des voies de transmission des maladies, la génomique, les matériaux biorenouvelables, l'immunité des plantes, les cibles thérapeutiques potentielles, les mécanismes de conception de médicaments et de nouvelles plates-formes permettant l’ingénierie des protéines et la biologie synthétique.
Au-delà du repliement des protéines
AlphaFold a constitué une avancée fondamentale pour la prédiction des protéines à chaîne unique. AlphaFold-Multimère puis étendu aux complexes comportant plusieurs chaînes protéiques, suivi par AlphaFold2.3, qui a amélioré les performances et étendu la couverture à des complexes plus grands.
En 2022, les prévisions de structure d'AlphaFold pour près de toutes les protéines cataloguées connues de la science ont été mis gratuitement à disposition via le Base de données sur la structure des protéines AlphaFolden partenariat avec l'Institut européen de bioinformatique de l'EMBL (EMBL-EBI).
À ce jour, 1,4 million d'utilisateurs dans plus de 190 pays ont accédé à la base de données AlphaFold, et des scientifiques du monde entier ont utilisé les prédictions d'AlphaFold pour faire progresser la recherche dans tous les domaines, depuis l'accélération de nouveaux vaccins contre le paludisme et avancer découverte de médicaments contre le cancer développer enzymes mangeuses de plastique pour lutter contre la pollution.
Nous montrons ici les capacités remarquables d'AlphaFold à prédire des structures précises au-delà du repliement des protéines, en générant des prédictions de structure très précises pour les ligands, les protéines, les acides nucléiques et les modifications post-traductionnelles.
Accélérer la découverte de médicaments
Les premières analyses montrent également que notre modèle surpasse largement AlphaFold2.3 sur certains problèmes de prédiction de la structure des protéines pertinents pour la découverte de médicaments, comme la liaison des anticorps. De plus, prédire avec précision les structures protéine-ligand est un outil extrêmement précieux pour la découverte de médicaments, car il peut aider les scientifiques à identifier et à concevoir de nouvelles molécules qui pourraient devenir des médicaments.
La norme industrielle actuelle consiste à utiliser des « méthodes d’amarrage » pour déterminer les interactions entre les ligands et les protéines. Ces méthodes d’amarrage nécessitent une structure protéique de référence rigide et une position suggérée à laquelle le ligand doit se lier.
Notre dernier modèle place une nouvelle barre pour la prédiction de la structure protéine-ligand en surpassant les meilleures méthodes d'amarrage rapportées, sans nécessiter une structure protéique de référence ni l'emplacement de la poche du ligand, ce qui permet de prédire des protéines complètement nouvelles qui n'ont pas été structurellement caractérisées auparavant.
Il peut également modéliser conjointement les positions de tous les atomes, ce qui lui permet de représenter toute la flexibilité inhérente des protéines et des acides nucléiques lorsqu’ils interagissent avec d’autres molécules – ce qui n’est pas possible avec les méthodes d’amarrage.
Voici, par exemple, trois cas thérapeutiquement pertinents récemment publiés où les structures prédites par notre dernier modèle (représentées en couleur) correspondent étroitement aux structures déterminées expérimentalement (représentées en gris) :
- PORCN: Molécule anticancéreuse au stade clinique liée à sa cible, conjointement avec une autre protéine.
- KRAS: Complexe ternaire avec un ligand covalent (une colle moléculaire) d'une cible cancéreuse importante.
- PI5P4Kγ: Inhibiteur allostérique sélectif d'une lipide kinase, avec de multiples implications pathologiques, notamment le cancer et les troubles immunologiques.
Isomorphic Labs applique ce modèle AlphaFold de nouvelle génération à la conception de médicaments thérapeutiques, aidant ainsi à caractériser rapidement et avec précision de nombreux types de structures macromoléculaires importantes pour le traitement des maladies.
Nouvelle compréhension de la biologie
En ouvrant la modélisation des structures de protéines et de ligands ainsi que des acides nucléiques et de celles contenant des modifications post-traductionnelles, notre modèle fournit un outil plus rapide et plus précis pour examiner la biologie fondamentale.
Un exemple concerne la structure de CasLambda lié au crRNA et à l'ADNpartie de la Famille CRISPR. CasLambda partage la capacité d'édition du génome du Système CRISPR-Cas9, communément appelés « ciseaux génétiques », que les chercheurs peuvent utiliser pour modifier l'ADN des animaux, des plantes et des micro-organismes. La taille plus petite de CasLambda pourrait permettre une utilisation plus efficace dans l'édition du génome.
La dernière version de la capacité d'AlphaFold à modéliser des systèmes aussi complexes nous montre que l'IA peut nous aider à mieux comprendre ces types de mécanismes et à accélérer leur utilisation pour des applications thérapeutiques. D'autres exemples sont disponible dans notre mise à jour des progrès.
Faire progresser l’exploration scientifique
L’augmentation spectaculaire des performances de notre modèle montre le potentiel de l’IA pour améliorer considérablement la compréhension scientifique des machines moléculaires qui composent le corps humain – et du monde naturel au sens large.
AlphaFold a déjà catalysé des avancées scientifiques majeures dans le monde entier. Désormais, la prochaine génération d’AlphaFold a le potentiel de contribuer à faire progresser l’exploration scientifique à la vitesse du numérique.
Nos équipes dédiées au sein de Google DeepMind et d'Isomorphic Labs ont fait de grands progrès dans ce travail critique et nous sommes impatients de partager nos progrès continus.