Retour au feed
Hugging Face Blog·

A Deepdive into Aya Vision: Advancing the Frontier of Multilingual Multimodality

Signal
75
Hype
25
En 3 lignesCohere présente Aya Vision, un modèle multimodal multilingue capable de traiter images et texte dans 119 langues. Le modèle combine vision et compréhension linguistique pour des tâches de description d'images, réponses à questions visuelles et analyse de documents dans des langues peu dotées en ressources.
Lire la source
Ton avis ?
VisionMulti-agentsBenchmarksOpen source

Résumé généré par Claude — vérifié par l'humain