We now support VLMs in smolagents!
Signal
75
Hype
25
En 3 lignesHugging Face intègre les modèles de vision-langage (VLM) dans smolagents. Les agents peuvent désormais traiter images et texte simultanément pour des tâches multimodales complexes.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain