← Retour au feed
Hugging Face Blog·

Our Transformers Code Agent beats the GAIA benchmark 🏅

Signal
78
Hype
35
En 3 lignesL'agent de code Transformers de Hugging Face atteint 92% de précision sur le benchmark GAIA, surpassant Claude 3.5 Sonnet (92%) et GPT-4o (87.9%). L'agent combine recherche web, exécution de code et raisonnement multi-étapes pour résoudre des tùches complexes.
Lire la source
Ton avis ?
Agents IAGénération de codeBenchmarksOpen source

RĂ©sumĂ© gĂ©nĂ©rĂ© par Claude — vĂ©rifiĂ© par l'humain