Retour au feed
arXiv cs.CL·

Error as a Lens: Probing LLM Reasoning through Synthetic Misconception Generation

Signal
72
Hype
18
En 3 lignesFramework pour générer des erreurs synthétiques ciblées avec LLM selon une taxonomie cognitive (Bloom révisée). Un Generation Agent produit des solutions erronées, un Examination Agent valide leur cohérence avec le mode d'erreur spécifié. Testé sur TheoremQA, révèle que générer des erreurs authentiques est bien plus difficile que produire des réponses fausses arbitraires.
Lire la source
Ton avis ?
Agents IAMulti-agentsRaisonnementÉvaluationsPapers

Résumé généré par Claude — vérifié par l'humain