Can Generalist Agents Automate Data Curation?
Signal
78
Hype
25
En 3 lignesCuration-Bench évalue si des agents IA généralistes peuvent automatiser la curation de données d'entraînement. Les agents atteignent des baselines publiées en dix itérations, mais restent limités à des variantes locales. Avec scaffolding (citation et adaptation de méthodes), un agent compose autonomement une politique surpassant les baselines avec 10× moins de données.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain