Les artistes qui donnent vie à des héros et des méchants dans des films d'animation et des jeux vidéo pourraient avoir plus de contrôle sur leurs animations, grâce à une nouvelle technique introduite par les chercheurs du MIT.
Leur méthode génère des fonctions mathématiques appelées coordonnées barycentriques, qui définissent la manière dont les formes 2D et 3D peuvent se plier, s'étirer et se déplacer dans l'espace. Par exemple, un artiste utilisant son outil pourrait choisir des fonctions qui font que les mouvements de la queue d'un chat en 3D correspondent à sa vision du « look » du félin animé.
De nombreuses autres techniques pour résoudre ce problème sont inflexibles, ne fournissant qu'une seule option pour les fonctions de coordonnées barycentriques pour un certain personnage animé. Chaque fonction peut être ou non la meilleure pour une animation particulière. L'artiste devrait repartir de zéro avec une nouvelle approche à chaque fois qu'il souhaite essayer un look légèrement différent.
« En tant que chercheurs, nous pouvons parfois nous retrouver coincés dans une boucle consistant à résoudre des problèmes artistiques sans consulter les artistes. Ce qui importe aux artistes, c'est la flexibilité et le « look » de leur produit final. Ils ne se soucient pas des équations aux dérivées partielles que votre algorithme résout en coulisses », explique Ana Dodik, auteur principal d'un article sur cette technique.
Au-delà de ses applications artistiques, cette technique pourrait être utilisée dans des domaines tels que l’imagerie médicale, l’architecture, la réalité virtuelle et même la vision par ordinateur pour aider les robots à comprendre comment les objets se déplacent dans le monde réel.
Dodik, étudiant diplômé en génie électrique et informatique (EECS), a rédigé l'article avec Oded Stein, professeur adjoint à la Viterbi School of Engineering de l'Université de Californie du Sud ; Vincent Sitzmann, professeur adjoint de l'EECS qui dirige le Scene Representation Group du Laboratoire d'informatique et d'intelligence artificielle du MIT (CSAIL) ; et l'auteur principal Justin Solomon, professeur agrégé à l'EECS et chef du groupe de traitement des données géométriques CSAIL. La recherche a été récemment présentée au SIGGRAPH Asia.
Une approche généralisée
Lorsqu'un artiste anime un personnage 2D ou 3D, une technique courante consiste à entourer la forme complexe du personnage avec un ensemble plus simple de points reliés par des segments de ligne ou des triangles, appelés cage. L'animateur fait glisser ces points pour déplacer et déformer le personnage à l'intérieur de la cage. Le problème technique clé est de déterminer comment le personnage se déplace lorsque la cage est modifiée ; ce mouvement est déterminé par la conception d'une fonction de coordonnées barycentriques particulière.
Les approches traditionnelles utilisent des équations complexes pour trouver des mouvements basés sur une cage extrêmement fluides, évitant ainsi les plis qui pourraient se développer dans une forme lorsqu'elle est étirée ou pliée à l'extrême. Mais il existe de nombreuses notions sur la façon dont l’idée artistique de « douceur » se traduit en mathématiques, chacune conduisant à un ensemble différent de fonctions de coordonnées barycentriques.
Les chercheurs du MIT ont recherché une approche générale permettant aux artistes d'avoir leur mot à dire dans la conception ou le choix parmi les énergies de douceur pour n'importe quelle forme. L'artiste peut alors prévisualiser la déformation et choisir l'énergie de douceur qui lui convient le mieux.
Bien que la conception flexible des coordonnées barycentriques soit une idée moderne, la construction mathématique de base des coordonnées barycentriques remonte à plusieurs siècles. Introduites par le mathématicien allemand August Möbius en 1827, les coordonnées barycentriques dictent la manière dont chaque coin d'une forme exerce une influence sur l'intérieur de la forme.
Dans un triangle, qui est la forme utilisée par Möbius dans ses calculs, les coordonnées barycentriques sont faciles à concevoir, mais lorsque la cage n'est pas un triangle, les calculs deviennent compliqués. Créer des coordonnées barycentriques pour une cage compliquée est particulièrement difficile car, pour les formes complexes, chaque coordonnée barycentrique doit répondre à un ensemble de contraintes tout en étant aussi lisse que possible.
S'écartant des travaux antérieurs, l'équipe a utilisé un type spécial de réseau neuronal pour modéliser les fonctions de coordonnées barycentriques inconnues. Un réseau neuronal, vaguement basé sur le cerveau humain, traite une entrée en utilisant de nombreuses couches de nœuds interconnectés.
Alors que les réseaux de neurones sont souvent utilisés dans des applications d'IA qui imitent la pensée humaine, dans ce projet, les réseaux de neurones sont utilisés pour une raison mathématique. L'architecture de réseau des chercheurs sait produire des fonctions de coordonnées barycentriques qui satisfont exactement à toutes les contraintes. Ils intègrent les contraintes directement dans le réseau, donc lorsqu'il génère des solutions, elles sont toujours valables. Cette construction aide les artistes à concevoir des coordonnées barycentriques intéressantes sans avoir à se soucier des aspects mathématiques du problème.
« La partie la plus délicate a été d’intégrer les contraintes. Les outils standards ne nous ont pas permis d'y parvenir, nous avons donc vraiment dû sortir des sentiers battus », explique Dodik.
Triangles virtuels
Les chercheurs se sont appuyés sur les coordonnées barycentriques triangulaires introduites par Möbius il y a près de 200 ans. Ces coordonnées triangulaires sont simples à calculer et satisfont à toutes les contraintes nécessaires, mais les cages modernes sont bien plus complexes que les triangles.
Pour combler le fossé, la méthode des chercheurs couvre une forme composée de triangles virtuels superposés qui relient des triplets de points à l'extérieur de la cage.
« Chaque triangle virtuel définit une fonction de coordonnées barycentriques valide. Nous avons juste besoin d’un moyen de les combiner », dit-elle.
C'est là qu'intervient le réseau neuronal. Il prédit comment combiner les coordonnées barycentriques des triangles virtuels pour créer une fonction plus compliquée mais plus fluide.
En utilisant leur méthode, un artiste pourrait essayer une fonction, regarder l'animation finale, puis modifier les coordonnées pour générer différents mouvements jusqu'à ce qu'il arrive à une animation qui ressemble à ce qu'il souhaite.
« D'un point de vue pratique, je pense que le plus grand impact est que les réseaux de neurones vous offrent une grande flexibilité que vous n'aviez pas auparavant », explique Dodik.
Les chercheurs ont démontré comment leur méthode pouvait générer des animations plus naturelles que d'autres approches, comme la queue d'un chat qui se courbe doucement lorsqu'il se déplace au lieu de se replier de manière rigide près des sommets de la cage.
À l’avenir, ils souhaitent essayer différentes stratégies pour accélérer le réseau neuronal. Ils souhaitent également intégrer cette méthode dans une interface interactive qui permettrait à un artiste de parcourir facilement les animations en temps réel.
Cette recherche a été financée, en partie, par le Bureau de recherche de l'armée américaine, le Bureau de recherche scientifique de l'US Air Force, la National Science Foundation des États-Unis, le CSAIL Systems that Learn Program, le MIT-IBM Watson AI Lab, le Toyota-CSAIL Joint Research Center, Adobe Systems, un Google Research Award, la Singapore Defence Science and Technology Agency et l'Amazon Science Hub.