Retour au feed
Hugging Face Blog·

SmolVLM - small yet mighty Vision Language Model

Signal
65
Hype
35
En 3 lignesHugging Face présente SmolVLM, un modèle de vision-langage compact et performant. Le modèle combine efficacité computationnelle et capacités multimodales avancées pour des tâches de compréhension d'images et de texte.
Lire la source
Ton avis ?
VisionOpen sourceBenchmarks

Résumé généré par Claude — vérifié par l'humain