Our Transformers Code Agent beats the GAIA benchmark đ
Signal
78
Hype
35
En 3 lignesL'agent de code Transformers de Hugging Face atteint 92% de précision sur le benchmark GAIA, surpassant Claude 3.5 Sonnet (92%) et GPT-4o (87.9%). L'agent combine recherche web, exécution de code et raisonnement multi-étapes pour résoudre des tùches complexes.Lire la source
Ton avis ?
RĂ©sumĂ© gĂ©nĂ©rĂ© par Claude â vĂ©rifiĂ© par l'humain