Retour au feed
Hugging Face Blog·

TextQuests: How Good are LLMs at Text-Based Video Games?

Signal
65
Hype
25
En 3 lignesHugging Face évalue les capacités des LLM sur des jeux vidéo textuels via TextQuests. L'étude mesure la performance de modèles comme GPT-4, Claude et Gemini sur des environnements interactifs nécessitant compréhension, planification et adaptation.
Lire la source
Ton avis ?
BenchmarksRaisonnementGPTClaudeGemini

Résumé généré par Claude — vérifié par l'humain