Les critiques écrites par l'IA aident les humains à remarquer les défauts
Nous avons formé des modèles de « rédaction critique » pour décrire…
Evolution à travers de grands modèles
Cet article poursuit l'idée selon laquelle les grands modèles de langage (LLM)…
Apprendre à jouer à Minecraft avec le pré-entraînement vidéo
Internet contient une énorme quantité de vidéos accessibles au public dont nous…
Atténuations préalables à la formation DALL·E 2
Nous avons observé que nos prédécesseurs internes de DALL·E 2 reproduisaient parfois…
Un cadre d'analyse des risques pour les grands modèles de langage de synthèse de code
Codex, un grand modèle de langage (LLM) formé sur une variété de…
Formation efficace des modèles de langage à remplir au milieu
Nous montrons que les modèles de langage autorégressifs peuvent apprendre à remplir…
Présentation de Whisper
D'autres approches existantes utilisent fréquemment des ensembles de données d'entraînement audio-texte plus…
Repousser les limites du modèle à deux tours | de Samuel Flender | décembre 2023
Où les hypothèses derrière l’architecture du modèle à deux tours se brisent…
Mise à l'échelle des lois pour la suroptimisation du modèle de récompense
Dans l’apprentissage par renforcement à partir de la rétroaction humaine, il est…
Un système pour générer des nuages de points 3D à partir d'invites complexes
Bien que des travaux récents sur la génération d'objets 3D conditionnels au…