Retour au feed
arXiv cs.AI·

QuickLAP: Quick Language-Action Preference Learning for Semi-Autonomous Agents

Signal
78
Hype
25
En 3 lignesQuickLAP fusionne retours physiques et linguistiques pour apprendre les fonctions de récompense de robots en temps réel. Le framework bayésien utilise des LLM pour extraire des masques d'attention et des préférences du langage libre, intégrés aux corrections physiques via une règle de mise à jour fermée. Réduction d'erreur de 70% vs baselines en simulation de conduite autonome.
Lire la source
Ton avis ?
Agents IAReinforcement learningRaisonnementRobotique

Résumé généré par Claude — vérifié par l'humain