Un des chiffres emblématiques de l'IA a récemment donné son avis en ce qui concerne Sora, l'IA génératrice de vidéo d'OpenAI. Selon lui, le projet d'OpenAI est une cause perdue.
La technologie de génération de vidéos par intelligence artificielle ne cesse de progresser à pas de géant, pour le meilleur et pour le pire. récemment, OpenAI a dévoilé Sora, capable de des vidéos bluffantes assez réalistes produisent à partir d'une simple description textuelle. Mais du côté des experts de l'IA, on émet quelques réserves.
Trop d'efforts pour des résultats peu pertinents
Yann LeCun, éminent spécialiste français de l'IA et responsable de ce domaine chez Meta, vient de formuler des critiques incisives sur l'approche technologique employé par OpenAI. Selon lui, l'ambition affichée par l'éditeur de ChatGPT de modéliser finement la complexité du monde réel est vouée à l'échec.
Dans un post Twitter, LeCun affirme que la méthode de génération pixel par pixel à partir de variables latentes est fondamentalement inefficace. Les modèles comme Sora d'OpenAI déployer trop d'efforts pour déduire des détails peu pertinents. Cette débauche d'énergie peut produire des résultats bluffants pour générer des vidéos artificielles, mais s'avère inefficace pour capturer fidèlement la réalité dans sa richesse infinie.
Alors que le débat fait rage entre experts pour déterminer les approches d'IA les plus prometteuses, une certitude demeure. Des progrès spectaculaires mais aussi des dangers émergents de ces IA génératrices de vidéos. À nous de veiller à ce que l'IA de demain soit développée de façon éthique, pour le bénéfice de tous.
La solution proposée par LeCun pour tirer Sora vers le haut et sortir OpenAI du gouffre
Avec 30 ans d'expérience en apprentissage machine et deep learning, Yann LeCun fait figure d'autorité dans le domaine de l'IA. De son côté, le responsable de ce secteur chez Meta met en garde contre certaines limites des approches génératives à la ChatGPT.
Selon lui, modéliser finement le monde réel est bien plus ardu que de générer du texte. Là où ce dernier ne mobilise qu'un ensemble fini de symboles, simuler fidèlement la complexité du réel nécessite de capturer une variété infiniment plus vaste de concepts.
Pourtant, les travaux de Meta sur l'IA restent largement éclipsés par l'aura des outils révolutionnaires d'OpenAI. Dans l'ombre, Facebook planche sur sa propre technologie de génération de vidéos baptisée V-JEPA. Cette architecture se distingue radicalement par sa volonté de se concentrer sur l'essentiel plutôt que de déduire chaque pixel.
D'après LeCun, cette approche offrirait des gains d'efficacité de 1,5 à 6 fois supérieurs à la concurrence. Reste à savoir si ses critiques et cette alternative technologique sauront infléchir les orientations des géants de la technologie en matière d'IA génératrice.
Notre blog est alimenté par les lecteurs. Lorsque vous achetez via des liens sur notre site, nous pouvons percevoir une commission d'affiliation.