Retour au feed
arXiv cs.CL·

Stage-Audit: Auditable Source-Frontier Discovery for Cross-Wiki Tables

Signal
72
Hype
15
En 3 lignesStage-Audit détecte les hallucinations dans les tables curées par LLM en imposant une séparation curator-auditor et des vérifications au niveau des lignes. Sur 51 instances Seed2Frontier, la précision passe de 0.356 à 0.505 (+42%) et le F1 de 0.334 à 0.451 (+35%), avec traçabilité source explicite par ligne.
Lire la source
Ton avis ?
PapersRAGÉvaluationsSécurité IA

Résumé généré par Claude — vérifié par l'humain