arXiv cs.AI·20 mai 2026

Learning to Hand Off: Provably Convergent Workflow Learning under Interface Constraints

Signal

Hype

En 3 lignesAlgorithme IC-Q pour l'apprentissage décentralisé de workflows multi-agents avec contraintes d'interface. Chaque agent observe seulement une fonction locale de l'artefact partagé et son état privé, sans accès centralisé aux trajectoires jointes. Garantie de convergence en nombre fini d'échantillons pour Q-learning neuronal avec observabilité partielle décentralisée.

Lire la source

Ton avis ?

Multi-agents Reinforcement learning Agents IA Papers

Résumé généré par Claude — vérifié par l'humain

Learning to Hand Off: Provably Convergent Workflow Learning under Interface Constraints

Autres angles sur ce sujet