Mitigating Conversational Inertia in Multi-Turn Agents
Signal
75
Hype
15
En 3 lignesLes LLM montrent une « inertie conversationnelle » en scénarios multi-tours : ils imitent excessivement leurs réponses précédentes au lieu d'explorer. Les auteurs identifient ce biais via analyse d'attention et proposent Context Preference Learning pour favoriser les réponses à faible inertie. Validation sur 8 environnements d'agents.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain