Hugging Face Blog·28 avril 2026

Introducing NVIDIA Nemotron 3 Nano Omni: Long-Context Multimodal Intelligence for Documents, Audio and Video Agents

Signal

Hype

En 3 lignesNVIDIA lance Nemotron 3 Nano Omni, un modèle multimodal capable de traiter documents, audio et vidéo avec contexte long. Optimisé pour les agents, il combine vision, voix et traitement textuel dans une architecture unifiée.

Lire la source

Ton avis ?

Agents IA Vision Voix Multi-agents Open source

Résumé généré par Claude — vérifié par l'humain

Introducing NVIDIA Nemotron 3 Nano Omni: Long-Context Multimodal Intelligence for Documents, Audio and Video Agents

Autres angles sur ce sujet