Retour au feed
Reddit r/LocalLLaMA·

Introducing Gemma 4 12B: a unified, encoder-free multimodal model

Signal
45
Hype
35
En 3 lignesGoogle annonce Gemma 4 12B, un modèle multimodal unifié sans encodeur séparé. Le modèle traite texte, image et audio dans une architecture unique, optimisé pour l'inférence sur appareils locaux.
Lire la source
Ton avis ?
GeminiVisionVoixOpen source

Résumé généré par Claude — vérifié par l'humain