Dans des domaines tels que la physique et l'ingénierie, les équations aux dérivées partielles (EDP) sont utilisées pour modéliser des processus physiques complexes afin de mieux comprendre le fonctionnement de certains des systèmes physiques et naturels les plus compliqués au monde.
Pour résoudre ces équations difficiles, les chercheurs utilisent des solveurs numériques haute fidélité, dont l’exécution peut prendre beaucoup de temps et être coûteuse en termes de calcul. Les modèles de substitution alternatifs simplifiés actuels, basés sur les données, calculent la propriété d'objectif d'une solution aux PDE plutôt que la solution entière. Ceux-ci sont formés sur un ensemble de données générées par le solveur haute fidélité, pour prédire la sortie des PDE pour les nouvelles entrées. Cela nécessite beaucoup de données et est coûteux, car les systèmes physiques complexes nécessitent un grand nombre de simulations pour générer suffisamment de données.
Dans un nouveau journal, «Substituts profonds améliorés par la physique pour les équations aux dérivées partielles», publié en décembre dans Intelligence des machines naturellesune nouvelle méthode est proposée pour développer des modèles de substitution basés sur des données pour des systèmes physiques complexes dans des domaines tels que la mécanique, l'optique, le transport thermique, la dynamique des fluides, la chimie physique et les modèles climatiques.
L'article a été rédigé par le professeur de mathématiques appliquées du MIT. Steven G.Johnson avec Payel Das et Youssef Mroueh du MIT-IBM Watson AI Lab et IBM Research ; Chris Rackauckas de Laboratoire de Julia; et Raphaël Pestourie, un ancien postdoctorant du MIT qui travaille maintenant à Georgia Tech. Les auteurs appellent leur méthode « substitut profond amélioré par la physique » (PEDS), qui combine un simulateur physique explicable basse fidélité avec un générateur de réseau neuronal. Le générateur de réseau neuronal est entraîné de bout en bout pour correspondre à la sortie du solveur numérique haute fidélité.
«Mon aspiration est de remplacer le processus inefficace d'essais et d'erreurs par une simulation et une optimisation systématiques et assistées par ordinateur», explique Pestourie. « Les avancées récentes dans le domaine de l'IA, comme le grand modèle linguistique de ChatGPT, reposent sur des centaines de milliards de paramètres et nécessitent de grandes quantités de ressources pour la formation et l'évaluation. En revanche, le PEDS est abordable pour tous car il est incroyablement efficace en termes de ressources informatiques et présente une très faible barrière en termes d’infrastructure nécessaire pour son utilisation.
Dans l'article, ils montrent que les substituts PEDS peuvent être jusqu'à trois fois plus précis qu'un ensemble de réseaux neuronaux à action directe avec des données limitées (environ 1 000 points d'entraînement) et réduire les données d'entraînement nécessaires d'au moins un facteur 100 pour atteindre un objectif. erreur cible de 5 pour cent. Développé à l'aide du logiciel conçu par le MIT Langage de programmation Juliacette méthode scientifique d’apprentissage automatique est ainsi efficace tant en informatique qu’en données.
Les auteurs rapportent également que PEDS fournit une stratégie générale basée sur les données pour combler le fossé entre une vaste gamme de modèles physiques simplifiés et les solveurs numériques par force brute correspondants modélisant des systèmes complexes. Cette technique offre précision, rapidité, efficacité des données et informations physiques sur le processus.
Selon Pestourie, « depuis les années 2000, à mesure que les capacités informatiques se sont améliorées, la tendance des modèles scientifiques a été d'augmenter le nombre de paramètres pour mieux s'adapter aux données, parfois au prix d'une précision prédictive moindre. PEDS fait le contraire en choisissant intelligemment ses paramètres. Il exploite la technologie de différenciation automatique pour former un réseau neuronal qui rend précis un modèle avec peu de paramètres.
« Le principal défi qui empêche l'utilisation plus large des modèles de substitution en ingénierie est la malédiction de la dimensionnalité : le fait que les données nécessaires à la formation d'un modèle augmentent de façon exponentielle avec le nombre de variables du modèle », explique Pestourie. « PEDS réduit cette malédiction en incorporant les informations issues des données et des connaissances du terrain sous la forme d'un solveur de modèle basse fidélité. »
Les chercheurs affirment que le PEDS a le potentiel de faire revivre tout un corpus de littérature d’avant 2000 consacré aux modèles minimaux – des modèles intuitifs que le PEDS pourrait rendre plus précis tout en étant également prédictifs pour les applications de modèles de substitution.
« L'application du cadre PEDS va au-delà de ce que nous avons montré dans cette étude », déclare Das. « Les systèmes physiques complexes régis par les PDE sont omniprésents, de la modélisation climatique à la modélisation sismique et au-delà. Nos modèles de substitution rapides et explicables inspirés par la physique seront d'une grande utilité dans ces applications, et jouent un rôle complémentaire à d'autres techniques émergentes, comme les modèles de fondation.
La recherche a été soutenue par le laboratoire d'IA Watson du MIT-IBM et le bureau de recherche de l'armée américaine par l'intermédiaire de l'Institute for Soldier Nanotechnologies.