Retour au feed
arXiv cs.CL·

Guarded Repair for Harm-Aware Post-hoc Replacement of LLM Mathematical Reasoning

Signal
72
Hype
25
En 3 lignesGuardedRepair est un framework de réparation post-hoc pour le raisonnement mathématique des LLM qui sélectivement corrige les traces erronées sans casser les réponses correctes. Sur GSM8K (95.60% → 96.89%), il fixe 17 erreurs sans cas broken-correct mesurés. Sur ASDiv faible, 78.40% → 87.60%.
Lire la source
Ton avis ?
RaisonnementÉvaluationsSécurité IA

Résumé généré par Claude — vérifié par l'humain