26 juillet 2023
2 minutes de lecture
Par Cogito Tech.
364 vues
Le cannibalisme de l’IA est le dilemme du nouvel âge qui menace les performances et la viabilité à long terme des grands modèles de langage (LLM). Examinons en profondeur et explorons les solutions possibles.
Le cannibalisme de l'IA se produit lorsque les LLM parcourent Internet pour produire des réponses qui sont principalement du contenu généré par l'IA qui a déjà été produit par d'autres systèmes d'IA. Cela se traduit par une sortie de mauvaise qualité.
Récemment, il a été observé un changement croissant dans les sentiments des utilisateurs payants de GPT-4. Plusieurs utilisateurs ont exprimé leur déception sur les plateformes de médias sociaux concernant la baisse de la qualité des résultats des LLM. La réponse du chatbot a été qualifiée de « plus stupide » et de « plus paresseuse » par rapport aux versions précédentes, ce qui a suscité des inquiétudes concernant l'expérience utilisateur globale. Cela a déclenché des discussions au sein de la communauté de l’IA concernant les facteurs ayant conduit à son déclin.
Les données de nature générique ne sont plus viables pour améliorer les performances des modèles d'IA selon les développeurs. Selon Aidan Gomez, directeur général de Cohere, une start-up LLM de 2 milliards de dollars, « Si vous pouviez obtenir toutes les données dont vous avez besoin sur le Web, ce serait fantastique. En réalité, le Web est tellement bruyant et désordonné qu'il n'est pas vraiment représentatif des données que vous souhaitez. Le Web ne fait tout simplement pas tout ce dont nous avons besoin.
Concentrons-nous maintenant sur les solutions possibles pour résoudre ce problème.
- Recherche & Développement: Les modèles d’IA nécessiteront des ensembles de données uniques et sophistiqués pour améliorer les performances et relever les défis scientifiques, médicaux ou commerciaux. Les ensembles de données devront être créés par des experts tels que des scientifiques, des médecins, des auteurs, des acteurs ou des ingénieurs, ou acquis auprès de grandes entreprises telles que des sociétés pharmaceutiques, des banques et des établissements de vente au détail. Il existe un besoin croissant de produire des ensembles de données générés et conservés par des humains sans aucune aide. LLM de fondation. Cela garantira la fourniture d’entrées par des modèles d’IA qui sont précis et fiables.
- Réduire le modèle : Les LLM exposés aux données générées par l'IA sur une période donnée sont affectés par un processus dégénératif appelé « effondrement du modèle ». Cela leur fait oublier la distribution des données qui la sous-tend. Cela a également un effet primordial sur l’avenir de la technologie de l’IA générative.
- Augmentation du volume de contenu généré par l'IA : Il doit y avoir un mécanisme pour garantir qu’il existe un moyen clair de faire la différence entre les informations réelles créées par des humains et le matériel produit par l’IA. Ne pas résoudre ce problème peut entraîner un déclin de la fonctionnalité et de l'efficacité des outils d'IA comme ChatGPT, qui dépendent de plus en plus des données générées par l'homme pour la formation et la génération de contenu.
En résumé
Le cannibalisme de l’IA soulève des doutes dans l’esprit des gens quant à la pérennité des systèmes d’IA et à leur capacité à progresser d’une manière qui correspond à l’intellect humain. Il souligne la nécessité d'une recherche et d'un développement approfondis pour atténuer les risques liés à la cannibalisation afin de garantir que les modèles d'IA sont cohérents et offrent des résultats précis, fiables et intelligents.
Chez Cogito, nous nous efforçons de relever le défi ci-dessus en :
Engager nos experts en la matière qui effectuent des recherches sur Internet pour acquérir une compréhension approfondie des sujets. Cela garantira que les données de formation sont bien recherchées et créées manuellement sans l'aide de modèles de base.
Veiller à ce que notre équipe travaille dans un environnement supervisé sur site afin qu'elle puisse accéder uniquement aux ressources propices à une recherche et un développement appropriés.