Guarded Repair for Harm-Aware Post-hoc Replacement of LLM Mathematical Reasoning
GuardedRepair est un framework de réparation post-hoc pour le raisonnement mathématique des LLM qui sélectivement corrige les traces erronées sans casser les réponses correctes. Sur GSM8K (95.60% → 96.89%), il fixe 17 erreurs sans cas broken-correct mesurés. Sur ASDiv faible, 78.40% → 87.60%.