Hugging Face Blog·3 juin 2025

SmolVLA: Efficient Vision-Language-Action Model trained on Lerobot Community Data

Signal

Hype

En 3 lignesHugging Face présente SmolVLA, un modèle vision-langage-action efficace entraîné sur les données communautaires Lerobot. Le modèle combine perception visuelle et compréhension du langage pour générer des actions robotiques, optimisé pour l'inférence sur ressources limitées.

Lire la source

Ton avis ?

Vision Robotique Open source Outils

Résumé généré par Claude — vérifié par l'humain

SmolVLA: Efficient Vision-Language-Action Model trained on Lerobot Community Data

Autres angles sur ce sujet