arXiv cs.AI·19 mai 2026

QuickLAP: Quick Language-Action Preference Learning for Semi-Autonomous Agents

Signal

Hype

En 3 lignesQuickLAP fusionne retours physiques et linguistiques pour apprendre les fonctions de récompense de robots en temps réel. Le framework bayésien utilise des LLM pour extraire des masques d'attention et des préférences du langage libre, intégrés aux corrections physiques via une règle de mise à jour fermée. Réduction d'erreur de 70% vs baselines en simulation de conduite autonome.

Lire la source

Ton avis ?

Agents IA Reinforcement learning Raisonnement Robotique

Résumé généré par Claude — vérifié par l'humain

QuickLAP: Quick Language-Action Preference Learning for Semi-Autonomous Agents

Autres angles sur ce sujet