Retour au feed
arXiv cs.LG·

FLaG: Fine-Grained Latent Grouping for Hallucination Detection

Signal
78
Hype
15
En 3 lignesFLaG est un framework léger de détection d'hallucinations dans les LLM qui modélise la fiabilité via des groupes de preuves latentes. Utilisant un mécanisme de routage basé sur l'énergie et une agrégation log-marginale, il capture des patterns hétérogènes d'hallucinations sans modifier le modèle sous-jacent. Résultats SOTA sur plusieurs benchmarks avec transfert robuste entre datasets.
Lire la source
Ton avis ?
Sécurité IAÉvaluationsRaisonnement

Résumé généré par Claude — vérifié par l'humain