Retour au feed
Hugging Face Blog·

PaliGemma – Google's Cutting-Edge Open Vision Language Model

Signal
75
Hype
25
En 3 lignesGoogle lance PaliGemma, un modèle de vision-langage open-source basé sur Gemma 2B. Le modèle combine un encodeur d'images et un décodeur texte pour des tâches de compréhension visuelle multilingues. Poids disponibles sur Hugging Face.
Lire la source
Ton avis ?
GeminiVisionOpen sourceOutils

Résumé généré par Claude — vérifié par l'humain