Ouvrir la voie à des systèmes généralisés avec une IA plus efficace et efficiente
À partir de ce week-end, la trente-neuvième Conférence internationale sur l'apprentissage automatique (CIML 2022) se réunira du 17 au 23 juillet 2022 au Baltimore Convention Center dans le Maryland, aux États-Unis, et se déroulera comme un événement hybride.
Des chercheurs travaillant dans les domaines de l’intelligence artificielle, de la science des données, de la vision industrielle, de la biologie computationnelle, de la reconnaissance vocale, etc. présentent et publient leurs travaux de pointe en matière d’apprentissage automatique.
En plus de parrainer la conférence et de soutenir des ateliers et des activités sociales organisés par nos partenaires de longue date LatinX, Le noir dans l’IA, Queer dans l’IAet Les femmes dans l’apprentissage automatique, nos équipes de recherche présentent 30 articles, dont 17 collaborations externes. Voici une brève introduction à nos prochaines présentations orales et phares :
Apprentissage par renforcement efficace
Rendre les algorithmes d’apprentissage par renforcement (RL) plus efficaces est essentiel à la création de systèmes d’IA généralisés. Cela inclut l’augmentation de la précision et de la vitesse des performances, l’amélioration du transfert et de l’apprentissage sans tir, et la réduction des coûts de calcul.
Dans l'une de nos présentations orales sélectionnées, nous montrons un nouvelle façon d’appliquer l’amélioration politique généralisée (GPI) sur les compositions de politiques, ce qui le rend encore plus efficace pour améliorer les performances d'un agent. Une autre présentation orale a proposé une nouvelle façon fondée et évolutive de explorez efficacement sans avoir besoin de bonus. En parallèle, nous proposons une méthode pour augmenter un agent RL avec un processus de récupération basé sur la mémoireréduisant la dépendance de l'agent à l'égard de sa capacité de modèle et permettant une utilisation rapide et flexible des expériences passées.
Progrès dans les modèles de langage
La langue est un élément fondamental de l’être humain. Cela donne aux gens la capacité de communiquer des pensées et des concepts, de créer des souvenirs et de développer une compréhension mutuelle. L’étude des aspects du langage est essentielle pour comprendre le fonctionnement de l’intelligence, tant dans les systèmes d’IA que chez les humains.
Notre présentation orale sur lois d'échelle unifiées et notre article sur récupération les deux explorent la manière dont nous pourrions créer plus efficacement des modèles de langage plus grands. En cherchant des moyens de créer des modèles de langage plus efficaces, nous introduisons un nouvel ensemble de données et une nouvelle référence avec StreamingQA qui évalue la manière dont les modèles s'adaptent et oublient les nouvelles connaissances au fil du temps, tandis que notre article sur génération narrative montre comment les modèles linguistiques pré-entraînés actuels ont encore du mal à créer des textes plus longs en raison de limitations de mémoire à court terme.
Raisonnement algorithmique
Le raisonnement algorithmique neuronal est l’art de construire des réseaux de neurones capables d’effectuer des calculs algorithmiques. Ce domaine de recherche en pleine croissance recèle un grand potentiel pour aider à adapter les algorithmes connus aux problèmes du monde réel.
Nous introduisons le Benchmark CLRS pour le raisonnement algorithmique, qui évalue les réseaux de neurones en fonction de l'exécution d'un ensemble diversifié de trente algorithmes classiques du manuel Introductions to Algorithms. De même, nous proposons un algorithme d'apprentissage incrémental général qui adapte la répétition de l'expérience rétrospective à la preuve automatisée de théorèmes, un outil important pour aider les mathématiciens à prouver des théorèmes complexes. De plus, nous présentons un cadre pour la simulation apprise basée sur les contraintesmontrant comment la simulation traditionnelle et les méthodes numériques peuvent être utilisées dans les simulateurs d'apprentissage automatique – une nouvelle direction importante pour résoudre des problèmes de simulation complexes en science et en ingénierie.
Découvrez l’ensemble de nos travaux à l’ICML 2022 ici.