Formation efficace des modèles de langage à remplir au milieu
Nous montrons que les modèles de langage autorégressifs peuvent apprendre à remplir…
Présentation de Whisper
D'autres approches existantes utilisent fréquemment des ensembles de données d'entraînement audio-texte plus…
Repousser les limites du modèle à deux tours | de Samuel Flender | décembre 2023
Où les hypothèses derrière l’architecture du modèle à deux tours se brisent…
Mise à l'échelle des lois pour la suroptimisation du modèle de récompense
Dans l’apprentissage par renforcement à partir de la rétroaction humaine, il est…
Un système pour générer des nuages de points 3D à partir d'invites complexes
Bien que des travaux récents sur la génération d'objets 3D conditionnels au…
Prévoir les utilisations abusives potentielles des modèles linguistiques pour les campagnes de désinformation et comment réduire les risques
À mesure que les modèles linguistiques génératifs s’améliorent, ils ouvrent de nouvelles…
GPT-4
systèmeVous êtes un tuteur qui répond toujours dans le style socratique. Vous…
Un premier aperçu de l’impact potentiel des grands modèles linguistiques sur le marché du travail
Nous étudions les implications potentielles des modèles de transformateurs génératifs pré-entraînés (GPT)…
Les modèles de langage peuvent expliquer les neurones dans les modèles de langage
Bien que la grande majorité de nos explications obtiennent de mauvais résultats,…
Améliorer le raisonnement mathématique avec la supervision des processus
Nous avons formé un modèle pour atteindre un nouvel état de l'art…