Le successeur de GPT-4 se profile à l'horizon. GPT-5, le nouveau modèle de langage d'OpenAI, GPT-5, promet des capacités accrues. En attendant sa sortie officielle, quelques informations distillées par OpenAI nourrissent l'impatience du grand public. Voici tout ce que l'on sait pour le moment sur cette nouvelle mise à jour majeure de la start-up de Sam Altman.
Comprendre GPT-5 en quelques lignes
GPT ou Generative Pre-trained Transformer est un modèle de langage développé par la start-up californienne OpenAI. La prochaine version, très attendue, GPT-5 est la cinquième itération de ce modèle.
Depuis son lancement initial en 2018, GPT est connu une évolution constante. GPT-2 a été publié en 2019, suivi de GPT-3 en 2020. Fin 2023, OpenAI et ChatGPT lancé, une IA générative basée sur GPT-3.5. Cette technologie a rapidement gagné en popularité pour sa capacité à comprendre le langage naturel et à répondre aux requêtes de manière fluide et cohérente. C'est d'ailleurs à partir du lancement de cette grande nouveauté de la start-up que l'IA n'a plus arrêté de faire parler d'elle.
L'entreprise a effectué une nouvelle mise à jour de son modèle et lancé en avril 2023 GPT-4. Cette nouvelle version se distingue par l'intégration de Vision GPTlui permettant de comprendre et interpréter les images. OpenAI n'a pas arrêté de perfectionner ce modèle. Fr novembre, GPT-4 Turbo a propulsé la technologie à un niveau supérieur. Multimodal, il s'agit actuellement du LLM le plus puissant du secteur.
D'autres acteurs du secteur ont développé leurs propres LLM pour rivaliser GPT-4. Google, entre autres, a relevé le défi en lançant Gémeaux en décembre. Suite à des améliorations proposées par le géant américain, son modèle a pu surpasser GPT-4 d'OpenAI. En revanche, le modèle Turbo d'OpenAI reste pour le moment en tête du classement.
L'avenir s'annonce encore plus radieux avec l'arrivée prochaine de GPT-5. Ce modèle s'appuie sur les bases de ses avancées et promet des capacités encore plus impressionnantes. Entraîné sur un vaste ensemble de données textuelles et visuelles telles que des articles, livres et publications sur les réseaux sociaux, GPT-5 sera en mesure de répondre aux requêtes des utilisateurs avec des performances encore accumulées. Comme les versions précédentes, ce système d'intelligence artificielle repose sur l'architecture des réseaux de neurones à transformateurs.
Quelles innovations majeures pouvons-nous attendre de ce modèle ?
Lors du Sommet mondial des gouvernements qui s'est déroulé à Dubaï, Sam Altman a indiqué quelques innovations qui distingueront GPT-5.
Un LLM avec moins d'hallucinations
L'un des points forts de GPT-5 réside dans sa capacité à réduire les hallucinations. Ce problème, fréquent chez les LLM, se traduit par des réponses inventées de toutes piècessouvent erronées ou trompeuses.
GPT-5 s'annonce plus précis et fiable que ses précédentes. Il aura la capacité de vérifier la véracité des informations générées en s'appuyant sur des sources externes. Lorsqu'il aura un doute sur une réponse, GPT-5 sera également en mesure de reconnaître son incertitude et de l'indiquer à l'utilisateur. Cet effort accumulé pour contrôler la justesse des réponses fournies permettra de faire plus confiance au modèle. On peut donc s'attendre à une IA plus performante, générant des réponses certifiées.
La prise en charge des vidéos
GPT-4 a déjà ouvert la voie à l'interaction multimodale en gérant les textes, les images et les fils. Vous pouvez par exemple lui montrer une photo et poser des questions concernant celle-ci et l'IA vous répondra. GPT-4 dispose également d'une fonctionnalité de commande vocale. Si vous ne voulez pas écrire votre prompt, vous pouvez tout simplement le dicter. Mais, il manque encore une pièce maîtresse à ce puzzle : la vidéo. C'est là que GPT-5 promet de révolutionner l'IA. Ce modèle offre une prise en charge complète de ce format. Il s'agit donc d'un LLM entièrement multimodal.
Mais cette nouvelle capacité de GPT-5 suscite des interrogations. En fait, on ne sait pas encore si le modèle aura la capacité d'analyser des vidéos, d'en générer ou les deux. Versez des informations, OpenAI a lancé récemment Sora, une IA génératrice de vidéos. Cette innovation pourrait laisser penser que GPT-5 serait capable de générer des vidéos.
Modularité et personnalisation
GPT-4 a déjà marqué une avancée significative en matière de personnalisation avec l'introduction des GPT personnalisé vers la fin de l'année 2023. Cette nouvelle fonctionnalité vous permet créer un GPT sur-mesure dans le domaine de votre choix : cuisine, voyage, mode, création graphique, en codage, etc.
GPT-5 devrait pousser plus loin encore ce concept de personnalisation. Et, en plus de celale modèle sera modulaire. Les utilisateurs devront pouvoir sélectionner les modules qu’ils souhaitent utiliser. « Nous voulons rendre possible l'utilisation de vos propres données. La capacité de vous connaître, de connaître votre courrier électronique, votre calendrier, la façon dont vous souhaitez prendre vos rendez-vous, la connexion à d'autres sources de données externes, tout cela constitue quelques-uns des domaines d'amélioration les plus important »a annoncé le patron d'OpenAI.
GPT-5, la première AGI ?
Atteindre l'AGI ou l'intelligence artificielle générale forte est l'ambition des chercheurs de l'IA. Cette forme d'IA forte rivaliser avec le cerveau humain. En d'autres termes, elle a la capacité d'effectuer n'importe quelle tâche qu'un être humain peut réaliser.
Le GPT-5 d'OpenAI Pourrait-il être le premier modèle à atteindre cette suprématie ? Rappelons que l'entreprise californienne a connu une crise interne en novembre engendrant le licenciement de Sam Altman. En fait, le conseil d'administration a licencié le PDG de l'entreprise pour manque de transparence. En cause, un projet secret baptisé Q*, jugé trop proche de l'AGI et donc potentiellement dangereux. Les rumeurs circulaient alors que le prochain LLM de la start-up, c'est-à-dire que le GPT-5 se rapprochera d'une AGI.
Ce qui est déjà sûr est que GPT-5 surpassera GPT-4 dans tous les domaines. Selon Sam Altman, le modèle connaîtra des améliorations dans quasiment toutes les tâches que le modèle entreprend. Il a ajouté que « ce n'est pas d'un simple mis à niveau, mais d'une nouvelle frontière dans la capacité de l'IA à comprendre, interagir et aider ».
Il compare notamment l'avènement de GPT-5 à l'arrivée des premiers téléphones portables. À leurs débuts, ils servaient uniquement à passer des appels, et ce stade est déjà dépassé. Aujourd'hui, les smartphones intègrent des technologies d'IA révolutionnaires qui transforment notre façon de vivre et de travailler. De même, GPT-5 promet de dépasser les limitations de ses précédents.
Le nombre de paramètres de GPT-5 n'a pas encore été communiqué par OpenAI, mais il pourrait dépasser le billion selon les rumeurs. Un lien spectaculaire par rapport aux 175 milliards de GPT-4. Pour permettre l'entraînement efficace d'un modèle aussi vaste, les équipes travailleraient également sur des méthodes de parallélisation et d'optimisation poussées des calculs. L'objectif est de réduire les coûts et les temps de traitement.
Quelles seront les utilisations de GPT-5 ?
GPT-5 conservera toutes les fonctionnalités de GPT-4, mais avec des performances accrues. Par exemple, pour la conversation, il sera capable d'échanges plus pertinents et naturels, aussi bien à l'écrit qu'à l'oral. Ce modèle polyvalent peut endosser de nombreux rôles : coach personnel, professeur particulier, assistant virtuel, etc.
Côté rédaction de contenus, GPT-5 reflète des textes de meilleure qualité, en respectant vos consignes de longueur, de style et de ton. Vous pourrez l'utiliser pour rédiger des articles de blog, des publications sur les réseaux, des synthèses… avec une écriture créative. En entreprise, GPT-5 trouvera de multiples usages : production de rapportsrédaction de contrats juridiques, génération de nouveaux concepts créatifs, etc.
Outre les textes, ce modèle générera également des contenus multimédias comme des sons, des images, voire des vidéos réalistes. Un atout précieux si vous travaillez dans le marketing. Dans l'éducation, GPT-5 personnalisera l'apprentissage en fournissant des tutoriels adaptés à chaque élève. Il les accompagnera pour développer leur esprit critique et d'autres compétences essentielles.
Et pour les codeurs, ce modèle vous permettra de générer du code complet, sans avoir à vous creuser la tête. GPT-5 est également capable de corriger les erreurs de code. Plus besoin de passer des heures à rechercher la source d'un problème. Il suffit de prendre une photo du code erroné et de le soumettre à GPT-5.Le modèle identifier les erreurs et vous proposera des solutions de correction.
Les possibilités qu'offriront par GPT-5 semblent infinies. Ce modèle de langage révolutionnaire se présente comme un véritable assistant du quotidiencapable de vous assister dans une multitude de tâches.
Quand sortira alors GPT-5 ?
La communauté de l’intelligence artificielle attend avec impatience la sortie de GPT-5. Initialement prévu pour fin 2023, OpenAI n'a toujours pas officialisé la date de sortie du modèle. GPT-4 avait été présenté en mars 2023. Son successeur sera-t-il dévoilé avant ou après cette date ? La question reste pour le moment sans réponse. Pour rappel, la start-up californienne a déposé la marque GPT-5 auprès de l'United States Patent and Trademark Office au cours de l'été dernier.
Pendant ce temps, la pression monte côté concurrence, Google en tête. Après le lancement de Gemini 1.0 en décembre 2023, le géant américain s'est rapidement enchaîné avec Gemini Ultra, réputé supérieur à GPT-4, suivi de Gemini 1.5 une semaine après. Face à ce rythme effréné d'innovations, OpenAI semble se retrouver sous pression pour dévoiler sa nouvelle avancée en matière de grand modèle de langage.
Notre blog est alimenté par les lecteurs. Lorsque vous achetez via des liens sur notre site, nous pouvons percevoir une commission d'affiliation.