arXiv cs.AI·19 mai 2026

Mitigating Conversational Inertia in Multi-Turn Agents

Signal

Hype

En 3 lignesLes LLM montrent une « inertie conversationnelle » en scénarios multi-tours : ils imitent excessivement leurs réponses précédentes au lieu d'explorer. Les auteurs identifient ce biais via analyse d'attention et proposent Context Preference Learning pour favoriser les réponses à faible inertie. Validation sur 8 environnements d'agents.

Lire la source

Ton avis ?

Agents IA Raisonnement Reinforcement learning Papers

Résumé généré par Claude — vérifié par l'humain

Mitigating Conversational Inertia in Multi-Turn Agents

Autres angles sur ce sujet