Nous avons formé des modèles de « rédaction critique » pour décrire les défauts des résumés. Les évaluateurs humains trouvent beaucoup plus souvent des défauts dans les résumés lorsqu’on leur présente les critiques de notre modèle. Les modèles plus grands sont plus efficaces en matière d’autocritique, leur échelle améliorant davantage la rédaction de critiques que la rédaction de résumés. Cela semble prometteur pour l’utilisation des systèmes d’IA pour assister la supervision humaine des systèmes d’IA sur des tâches difficiles.
Les critiques écrites par l'IA aident les humains à remarquer les défauts
Partagez cet article
laissez un commentaire