Retour au feed
Hugging Face Blog·

Introducing NVIDIA Nemotron 3 Nano Omni: Long-Context Multimodal Intelligence for Documents, Audio and Video Agents

Signal
75
Hype
35
En 3 lignesNVIDIA lance Nemotron 3 Nano Omni, un modèle multimodal capable de traiter documents, audio et vidéo avec contexte long. Optimisé pour les agents, il combine vision, voix et traitement textuel dans une architecture unifiée.
Lire la source
Ton avis ?
Agents IAVisionVoixMulti-agentsOpen source

Résumé généré par Claude — vérifié par l'humain