Retour au feed
arXiv cs.CL·

Micro-Macro Retrieval: Reducing Long-Form Hallucination in Large Language Models

Signal
72
Hype
28
En 3 lignesM2R (Micro-Macro Retrieval) est un framework retrieve-while-generate qui réduit les hallucinations dans la génération longue des LLM. Il combine une récupération macro (preuves externes) et micro (informations clés du raisonnement) pour maintenir la proximité entre données factuelles et sorties. Entraîné par reinforcement learning avec récompenses basées sur des règles.
Lire la source
Ton avis ?
RAGReinforcement learning

Résumé généré par Claude — vérifié par l'humain