PaliGemma – Google's Cutting-Edge Open Vision Language Model
Signal
75
Hype
25
En 3 lignesGoogle lance PaliGemma, un modèle de vision-langage open-source basé sur Gemma 2B. Le modèle combine un encodeur d'images et un décodeur texte pour des tâches de compréhension visuelle multilingues. Poids disponibles sur Hugging Face.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain