arXiv cs.AI·26 mai 2026

Why We Need World Models for AGI: Where LLMs Fail and How World Models May Outperform

Signal

Hype

En 3 lignesArticle arXiv argumentant que les LLM échouent en raisonnement causal et planification long-horizon faute de modèles du monde. Les auteurs introduisent Latent Dynamics Inference (LDI) et Flux, un environnement de raisonnement séquentiel en langage naturel. Agents RL avec accès à l'espace latent atteignent 79% de taux de victoire vs 11% pour LLM, révélant des défaillances en suivi d'état persistant.

Lire la source

Ton avis ?

Raisonnement Reinforcement learning Papers Benchmarks

Résumé généré par Claude — vérifié par l'humain

Why We Need World Models for AGI: Where LLMs Fail and How World Models May Outperform

Autres angles sur ce sujet