Efficient Emotion-Aware Iconic Gesture Prediction for Robot Co-Speech
Signal
72
Hype
25
En 3 lignesUn transformer léger prédit les gestes iconiques co-verbaux des robots à partir du texte et de l'émotion, sans audio à l'inférence. Le modèle surpasse GPT-4o sur la classification de placement et la régression d'intensité sur BEAT2, tout en restant compact pour le déploiement temps réel.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain