Pour l'émission « Cinq minutes avec » d'aujourd'hui, nous avons rencontré Gemma Jennings, chef de produit de l'équipe Applied, qui a dirigé une session sur les modèles de langage de vision au Sommet sur l'IA – l'un des plus grands événements mondiaux d'IA pour les entreprises.
Chez DeepMind…
Je fais partie de l'équipe Applied, qui contribue à faire connaître la technologie DeepMind au monde extérieur via les produits et solutions Alphabet et Google, comme avec WaveNet et Google Assistant, Maps et Search. En tant que chef de produit, j'agis comme un pont entre les deux organisations, travaillant en étroite collaboration avec les deux équipes pour comprendre la recherche et comment les gens peuvent l'utiliser. En fin de compte, nous voulons être en mesure de répondre à la question : comment pouvons-nous utiliser cette technologie pour améliorer la vie des gens dans le monde ?
Je suis particulièrement enthousiasmé par notre portefeuille de travaux en matière de développement durable. Nous avons déjà contribué à réduire la quantité d'énergie nécessaire au refroidissement des centres de données de Google, mais nous pouvons faire bien davantage pour avoir un impact transformateur plus important en matière de développement durable.
Avant DeepMind…
J'ai travaillé chez John Lewis Partnership, un grand magasin britannique dont l'ADN est profondément ancré dans son ADN. J'ai toujours aimé faire partie d'une entreprise ayant un sens sociétal, c'est pourquoi la mission de DeepMind consistant à résoudre les problèmes d'intelligence pour faire progresser la science et bénéficier à l'humanité m'a vraiment interpellé. J’ai été intrigué d’apprendre comment cette philosophie se manifesterait au sein d’une organisation axée sur la recherche – et au sein de Google, l’une des plus grandes entreprises au monde. En ajoutant cela à ma formation universitaire en psychologie expérimentale, en neurosciences et en statistiques, DeepMind a coché toutes les cases.
Le Sommet de l'IA…
C'est ma première conférence en personne depuis près de trois ans, j'ai donc vraiment hâte de rencontrer des gens du même secteur que moi et d'entendre sur quoi travaillent d'autres organisations.
J'ai hâte d'assister à quelques conférences sur la filière informatique quantique pour en savoir plus. Elle a le potentiel de conduire au prochain grand changement de paradigme en matière de puissance de calcul, en ouvrant de nouveaux cas d’utilisation pour l’application de l’IA dans le monde et en nous permettant de travailler sur des problèmes plus vastes et plus complexes.
Mon travail implique de nombreuses méthodes d'apprentissage profond et c'est toujours passionnant d'entendre parler des différentes manières dont les gens utilisent cette technologie. À l’heure actuelle, ces types de modèles nécessitent une formation sur de grandes quantités de données, ce qui peut s’avérer coûteux, long et gourmand en ressources compte tenu de la quantité de calcul nécessaire. Alors, où allons-nous partir d'ici? Et à quoi ressemble l’avenir du deep learning ? C’est le genre de questions auxquelles je cherche à répondre.
J'ai présenté…
Reconnaissance d'images à l'aide de réseaux de neurones profonds, notre récente recherche publiée sur les modèles de langage de vision (VLM). Pour ma présentation, j'ai discuté des progrès récents dans la fusion de grands modèles de langage (LLM) avec des représentations visuelles puissantes pour faire progresser l'état de l'art en matière de reconnaissance d'images.
Cette recherche fascinante a de nombreuses utilisations potentielles dans le monde réel. Il pourrait, un jour, servir d’assistant pour soutenir l’apprentissage en classe et informel dans les écoles, ou aider les personnes aveugles ou malvoyantes à voir le monde qui les entoure, transformant ainsi leur vie quotidienne.
Je veux que les gens quittent la séance…
Avec une meilleure compréhension de ce qui se passe après l’annonce de la percée de la recherche. Il y a tellement de recherches étonnantes en cours, mais nous devons réfléchir à ce qui va suivre, par exemple, quels problèmes mondiaux pourrions-nous aider à résoudre ? Et comment pouvons-nous utiliser nos recherches pour créer des produits et des services qui ont un but ?
L'avenir est prometteur et je suis impatient de découvrir de nouvelles façons d'appliquer nos recherches révolutionnaires au bénéfice de millions de personnes dans le monde.