HalluWorld: A Controlled Benchmark for Hallucination via Reference World Models
Signal
78
Hype
15
En 3 lignesHalluWorld est un benchmark contrôlé pour évaluer les hallucinations des LLM via des mondes de référence explicites (gridworlds, échecs, tâches terminales). Les modèles frontier résolvent bien les hallucinations perceptuelles directes, mais échouent sur le suivi d'état multi-étapes et la simulation causale, même avec extended thinking.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain