arXiv cs.CL·20 mai 2026

HalluWorld: A Controlled Benchmark for Hallucination via Reference World Models

Signal

Hype

En 3 lignesHalluWorld est un benchmark contrôlé pour évaluer les hallucinations des LLM via des mondes de référence explicites (gridworlds, échecs, tâches terminales). Les modèles frontier résolvent bien les hallucinations perceptuelles directes, mais échouent sur le suivi d'état multi-étapes et la simulation causale, même avec extended thinking.

Lire la source

Ton avis ?

Benchmarks Raisonnement Sécurité IA

Résumé généré par Claude — vérifié par l'humain

HalluWorld: A Controlled Benchmark for Hallucination via Reference World Models

Autres angles sur ce sujet