Résoudre certains des défis majeurs du XXIe siècle, comme la production d’électricité propre ou le développement de supraconducteurs à haute température, nécessitera de concevoir de nouveaux matériaux dotés de propriétés spécifiques. Pour ce faire, sur un ordinateur, il faut simuler les électrons, les particules subatomiques qui régissent la façon dont les atomes se lient pour former des molécules et sont également responsables du flux d'électricité dans les solides. Malgré des décennies d’efforts et plusieurs avancées significatives, la modélisation précise du comportement mécanique quantique des électrons reste un défi ouvert. Maintenant, dans un papier (PDF en libre accès) publié dans Science, nous proposons DM21, un réseau de neurones atteignant une précision de pointe sur de grandes parties de la chimie. Pour accélérer le progrès scientifique, nous rendons également open source nos code pour que quiconque puisse l'utiliser.
Il y a près d'un siècle, Erwin Schrödinger proposait sa fameuse équation régissant le comportement des particules de mécanique quantique. Appliquer cette équation aux électrons des molécules est un défi car tous les électrons se repoussent. Cela semblerait nécessiter de suivre la probabilité de la position de chaque électron – une tâche remarquablement complexe, même pour un petit nombre d'électrons. Une avancée majeure a eu lieu dans les années 1960, lorsque Pierre Hohenberg et Walter Kohn ont réalisé qu'il n'était pas nécessaire de suivre chaque électron individuellement. Au lieu de cela, connaissant la probabilité de n'importe lequel La présence d'un électron à chaque position (c'est-à-dire la densité électronique) est suffisante pour calculer exactement toutes les interactions. Kohn a reçu un Prix Nobel de chimie après l'avoir prouvé, fondant ainsi la théorie fonctionnelle de la densité (DFT).
Bien que la DFT prouve qu’une cartographie existe, depuis plus de 50 ans, la nature exacte de cette cartographie entre la densité électronique et l’énergie d’interaction – ce qu’on appelle la fonctionnelle de densité – est restée inconnue et doit être approximée. Bien que la DFT implique intrinsèquement un niveau d’approximation, elle constitue la seule méthode pratique permettant d’étudier comment et pourquoi la matière se comporte d’une certaine manière au niveau microscopique et est donc devenue l’une des techniques les plus largement utilisées dans toute la science. Au fil des années, les chercheurs ont proposé de nombreuses approximations de la fonctionnalité exacte avec différents niveaux de précision. Malgré leur popularité, toutes ces approximations souffrent d’erreurs systématiques car elles ne parviennent pas à capturer certaines propriétés mathématiques cruciales de la fonctionnelle exacte.
En exprimant la fonctionnelle sous forme de réseau neuronal et en incorporant ces propriétés exactes dans les données d'entraînement, nous apprenons des fonctionnelles exemptes d'erreurs systématiques importantes, ce qui permet une meilleure description d'une large classe de réactions chimiques.
Nous abordons spécifiquement deux problèmes de longue date liés aux fonctionnalités traditionnelles :
- L'erreur de délocalisation: Dans un calcul DFT, la fonctionnelle détermine la densité de charge d'une molécule en trouvant la configuration des électrons qui minimise l'énergie. Ainsi, des erreurs dans la fonctionnalité peuvent conduire à des erreurs dans la densité électronique calculée. La plupart des approximations fonctionnelles de densité existantes préfèrent les densités électroniques qui sont réparties de manière irréaliste sur plusieurs atomes ou molécules plutôt que d'être correctement localisées autour d'une seule molécule ou atome (voir Fig 2).
- Rupture de symétrie de spin: Lorsqu'elles décrivent la rupture de liaisons chimiques, les fonctionnelles existantes ont tendance à préférer de manière irréaliste les configurations dans lesquelles une symétrie fondamentale connue sous le nom de symétrie de spin est rompue. Puisque les symétries jouent un rôle vital dans notre compréhension de la physique et de la chimie, cette brisure artificielle de la symétrie révèle une déficience majeure des fonctionnelles existantes.
En principe, tout processus physico-chimique impliquant un mouvement de charge est susceptible de souffrir d'une erreur de délocalisation, et tout processus impliquant la rupture de liaisons est susceptible de souffrir d'une rupture de symétrie de spin. Le mouvement des charges et la rupture des liaisons sont au cœur de nombreuses applications technologiques importantes, mais ces problèmes peuvent également conduire à un échec qualitatif massif des fonctionnelles pour décrire les molécules les plus simples, telles que l'hydrogène. Étant donné que la DFT est une technologie cruciale, il est important de concevoir des fonctionnalités qui corrigent cette chimie simple avant de leur demander d'expliquer des interactions moléculaires beaucoup plus complexes, telles que celles qui peuvent se produire dans une batterie ou une cellule solaire.
Ces défis de longue date sont tous deux liés à la façon dont les fonctionnelles se comportent lorsqu'elles sont présentées avec un système qui présente un « caractère électronique fractionnaire ». En utilisant un réseau neuronal pour représenter la fonctionnelle et en adaptant notre ensemble de données d'entraînement pour capturer le comportement électronique fractionnaire attendu pour la fonctionnelle exacte, nous avons découvert que nous pouvions résoudre les problèmes de délocalisation et de rupture de symétrie de spin. Notre fonctionnelle s'est également révélée très précise sur des benchmarks larges et à grande échelle, ce qui suggère que cette approche basée sur les données peut capturer des aspects de la fonctionnelle exacte qui étaient jusqu'à présent insaisissables.
Depuis des années, les simulations informatiques jouent un rôle central dans l’ingénierie moderne, permettant de fournir des réponses fiables à des questions telles que « ce pont restera-t-il en place ? à « cette fusée parviendra-t-elle dans l’espace ? Alors que la technologie se tourne de plus en plus vers l’échelle quantique pour explorer des questions sur les matériaux, les médicaments et les catalyseurs, y compris ceux que nous n’avons jamais vus ni même imaginés, l’apprentissage profond promet de simuler avec précision la matière à ce niveau de mécanique quantique.