Retour au feed
arXiv cs.AI·

Why We Need World Models for AGI: Where LLMs Fail and How World Models May Outperform

Signal
72
Hype
35
En 3 lignesArticle arXiv argumentant que les LLM échouent en raisonnement causal et planification long-horizon faute de modèles du monde. Les auteurs introduisent Latent Dynamics Inference (LDI) et Flux, un environnement de raisonnement séquentiel en langage naturel. Agents RL avec accès à l'espace latent atteignent 79% de taux de victoire vs 11% pour LLM, révélant des défaillances en suivi d'état persistant.
Lire la source
Ton avis ?
RaisonnementReinforcement learningPapersBenchmarks

Résumé généré par Claude — vérifié par l'humain