arXiv cs.CL·26 mai 2026

Guarded Repair for Harm-Aware Post-hoc Replacement of LLM Mathematical Reasoning

Signal

Hype

En 3 lignesGuardedRepair est un framework de réparation post-hoc pour le raisonnement mathématique des LLM qui sélectivement corrige les traces erronées sans casser les réponses correctes. Sur GSM8K (95.60% → 96.89%), il fixe 17 erreurs sans cas broken-correct mesurés. Sur ASDiv faible, 78.40% → 87.60%.

Lire la source

Ton avis ?

Raisonnement Évaluations Sécurité IA

Résumé généré par Claude — vérifié par l'humain

Guarded Repair for Harm-Aware Post-hoc Replacement of LLM Mathematical Reasoning

Autres angles sur ce sujet