AlphaFold aide les chercheurs à découvrir comment les mutations protéiques provoquent des maladies et comment les prévenir
Luigi Vitagliano est directeur de recherche à l'Institut des biostructures et de la bioimagerie de Naples, en Italie. Il partage son histoire AlphaFold.
Être biologiste structural à l’ère d’AlphaFold, c’est comme les débuts de l’exploitation aurifère. Avant cette technologie, tout le monde effectuait un travail minutieux pour trouver des pépites d’or individuelles, les nettoyer et les examiner une par une. Et puis, tout d’un coup, une mine d’or est apparue. Nous ne pouvions pas croire à notre chance.
Depuis 30 ans, j'étudie les protéines codées dans notre ADN. Dans la plupart des cellules humaines, il existe entre 20 000 et 100 000 protéines différentes. Dans certains cas, la façon dont la chaîne d'acides aminés d'une protéine prend sa forme, également connue sous le nom de « repliement des protéines », peut être pleine d'irrégularités, et celles-ci sont liées à de nombreuses maladies.
Récemment, j'ai étudié une famille de protéines humaines, connues sous le nom de protéines du domaine de tétramérisation des canaux potassiques (KCTD), qui sont particulièrement mal comprises. Ce qui est particulièrement intéressant dans les mutations de ces protéines – causées par des mutations génétiques – est la gamme de maladies auxquelles elles sont liées : de la schizophrénie à l'autisme, de la leucémie aux cancers colorectaux, en passant par les troubles du cerveau et du mouvement.
Comme de nouvelles protéines sont constamment produites à l’intérieur des cellules, les protéines anciennes ou défectueuses doivent être éliminées. Il existe 25 types de protéines KCTD chez l’homme, et quatre cinquièmes d’entre elles recherchent d’autres protéines et les marquent en vue de leur dégradation et de leur destruction. Ce processus est appelé ubiquitination et il est essentiel pour maintenir les cellules en bonne santé et contribuer à prévenir les maladies.
Lorsque les protéines KCTD ne fonctionnent pas correctement, les conséquences peuvent être débilitantes pour notre santé. Mais il y a aussi beaucoup de choses que nous ne comprenons pas à leur sujet. Environ un cinquième des protéines KCTD présentes dans les cellules étaient un mystère pour les scientifiques comme moi : nous n'avions aucune idée de ce qu'elles faisaient, et donc de la manière de les empêcher de muter et de provoquer des maladies. Jusqu'à présent, nous disposions de très peu d'informations structurelles à leur sujet, ce qui constituait un obstacle majeur à la recherche sur le KCTD.
Les structures prédites par AlphaFold ont révélé qu’au cours de l’évolution, leurs structures sont restées très similaires malgré des codes génétiques très différents. Il s’agissait d’une avancée majeure. Auparavant, nous nous appuyions sur la génétique pour évaluer les similitudes ou les différences entre les protéines. En nous basant uniquement sur les gènes, nous pensions que ces protéines seraient très différentes.
Grâce à AlphaFold, nous avons pu construire un nouvel arbre généalogique évolutif basé sur la forme de ces protéines plutôt que sur leur séquence génétique. Les arbres évolutifs sont généralement construits à partir d’informations génétiques, mais ils ne tiennent pas compte des similitudes structurelles. La structure est liée à la fonction, donc utiliser cette approche est passionnant – elle pourrait révéler toutes sortes de mystères sur les protéines KCTD qui ont des fonctions similaires et comment ces fonctions ont évolué au fil du temps.
J'ai utilisé AlphaFold pour examiner et comparer la structure des 25 protéines KCTD à la recherche de similitudes et de différences, afin d'identifier quelles parties de ces protéines sont importantes. Pour notre plus grand plaisir, les structures prédites par AlphaFold semblaient très précises.
Par exemple, nous savions déjà qu’une section des protéines KCTD – le domaine BTB – était similaire parmi tous les membres de la famille, et nous avons donc supposé qu’il s’agissait de la partie la plus importante. AlphaFold a révélé de nombreuses autres similitudes structurelles supplémentaires entre ces protéines et a ouvert un tout nouveau domaine d'exploration.
Depuis 60 ans – dont les 30 ans que je travaille dans ce domaine – nous avons essayé, sans succès, de trouver le lien entre séquences et structures. Des générations entières d’éminents scientifiques ont été incapables de résoudre ce problème. Puis, presque miraculeusement, cette solution est apparue. Toutes nos données, les informations structurelles pour tous les membres de la famille KCTD, proviennent d'AlphaFold. Sans cela, cette étude n’aurait pas pu être réalisée du tout.
Mon sentiment était qu’AlphaFold était un rêve. Si quelqu'un m'avait dit que dans deux ans nous aurons plus de 200 millions de structures protéiques, je ne l'aurais pas cru. Il s’agira désormais, dans les décennies à venir, de découvrir exactement le rôle de ces protéines. Il y a encore beaucoup d'excitation et de découvertes à venir.