Announcing Replicate's remote MCP server
Replicate lance un serveur MCP (Model Context Protocol) permettant de découvrir, comparer et exécuter des modèles directement depuis Claude, Cursor et VS Code.
Replicate lance un serveur MCP (Model Context Protocol) permettant de découvrir, comparer et exécuter des modèles directement depuis Claude, Cursor et VS Code.
OpenAI publie une system card pour GPT-5 décrivant un système de routage unifié utilisant gpt-5-main, gpt-5-thinking et gpt-5-thinking-nano, optimisés pour différentes tâches et cas d'usage développeurs.
OpenAI et la GSA lancent un partenariat pour fournir ChatGPT Enterprise gratuitement à l'ensemble des 2+ millions d'employés de la branche exécutive fédérale américaine pendant un an. Initiative visant à moderniser les opérations gouvernementales et tester l'adoption de l'IA à grande échelle.
OpenAI lance GPT OSS, une nouvelle famille de modèles open-source. Les modèles sont disponibles sur Hugging Face avec des poids publics et une licence permissive, marquant un changement de stratégie pour OpenAI vers l'open-source.
OpenAI lance gpt-oss-120b et gpt-oss-20b, deux modèles open-weight sous licence Apache 2.0. Ils surpassent les modèles ouverts comparables en raisonnement et utilisation d'outils, optimisés pour du matériel grand public.
OpenAI lance gpt-oss-120b et gpt-oss-20b, deux modèles open-weight sous licence Apache 2.0 avec capacités de raisonnement. Disponibles publiquement avec une politique d'usage spécifique.
Hugging Face publie 3LM, un benchmark évaluant les LLMs arabes sur les tâches STEM et code. Le dataset couvre mathématiques, physique, chimie et programmation en arabe, permettant de mesurer les capacités des modèles dans ces domaines spécialisés.
Hugging Face migre son Hub de Git LFS vers Xet pour améliorer les performances de téléchargement et réduire les coûts d'infrastructure. Xet offre une meilleure gestion des fichiers volumineux avec compression et déduplication, bénéficiant à des millions d'utilisateurs.
Kimina-Prover applique la recherche par renforcement au moment de l'inférence sur des modèles de raisonnement formel. La méthode améliore les performances sur les preuves mathématiques en explorant dynamiquement l'espace de recherche sans réentraînement.
Hugging Face lance un serveur MCP (Model Context Protocol) permettant aux applications d'accéder directement à ses modèles et datasets via une interface standardisée. Le serveur intègre recherche de modèles, téléchargement et exécution d'inférence sans configuration supplémentaire.
NVIDIA lance Llama Nemotron Nano VLM sur Hugging Face Hub. Ce modèle de vision-langage léger optimise l'inférence sur appareils edge et offre des performances compétitives pour les tâches multimodales avec empreinte mémoire réduite.
Google déploie Gemma 3n en open-source via Hugging Face. Le modèle est intégré dans les frameworks majeurs (Transformers, vLLM, Ollama) et disponible sur le Hub avec cartes modèles et guides d'inférence.
Google DeepMind présente AlphaGenome, un modèle unifié d'IA pour les séquences ADN. L'outil prédit les effets des variantes régulatrices et améliore la compréhension des fonctions génomiques. Disponible via API.
Google DeepMind déploie Gemini Robotics On-Device, un modèle IA léger pour robots locaux offrant dextérité généraliste et adaptation rapide aux tâches sans connexion cloud.
Hugging Face démontre le fine-tuning de FLUX.1-dev sur matériel grand public via LoRA. La technique réduit les besoins en VRAM et permet l'adaptation du modèle de génération d'images sans GPU haute-gamme.
Google DeepMind déploie Gemini 2.5 Flash et Pro en disponibilité générale, et introduit 2.5 Flash-Lite, le modèle 2.5 le plus rapide et économe en coûts.
Google DeepMind lance Gemini 2.5 avec trois variantes : Pro en version stable, Flash en disponibilité générale, et Flash-Lite en preview. Les modèles affichent des performances et une précision améliorées.
Hugging Face et NVIDIA lancent Training Cluster as a Service, une plateforme d'entraînement d'IA managée. Le service offre accès à l'infrastructure GPU NVIDIA pour former des modèles de langage et de vision à grande échelle, avec facturation à l'usage.
Hugging Face présente Holo1, une famille de modèles de vision pour l'automatisation d'interfaces graphiques. Ces VLMs alimentent l'agent GUI Surfer-H, capable d'interpréter et d'interagir avec des éléments d'écran pour automatiser des tâches.
Hugging Face présente Tiny Agents, un framework minimaliste pour créer des agents IA en ~70 lignes de Python utilisant le protocole MCP. L'approche privilégie la simplicité et la reproductibilité sans dépendances lourdes.
Hugging Face publie nanoVLM, un dépôt minimal pour entraîner des modèles de vision-langage en PyTorch pur. L'outil simplifie l'accès à l'entraînement VLM sans dépendances complexes.
Google DeepMind annonce Gemma 3n, un modèle open multimodal optimisé pour l'inférence sur appareil. Le modèle 2-en-1 supporte audio, vision et texte avec performance accélérée pour applications interactives temps réel.
Google DeepMind lance Veo 3 et Imagen 4, deux modèles de génération média, ainsi que Flow, un nouvel outil dédié à la production cinématographique.
OpenAI lance Codex, un agent de codage cloud basé sur codex-1 (version d'o3 optimisée pour l'ingénierie logicielle). Entraîné par RL sur des tâches réelles, il génère du code au style humain, respecte les instructions précises et itère sur les tests jusqu'au succès.
Google DeepMind présente AlphaEvolve, un agent de codage alimenté par Gemini qui évolue automatiquement des algorithmes pour les mathématiques et l'informatique. Le système combine la créativité des LLM avec des évaluateurs automatisés pour concevoir des solutions avancées.
Google DeepMind lance Gemini 2.5 Pro Preview en avant-première, quelques semaines plus tôt que prévu, pour améliorer les performances en codage. La version bénéficie des retours de développeurs utilisant déjà le modèle.
Meta déploie Llama Guard 4 sur Hugging Face Hub. Ce modèle de sécurité évalue les risques dans les entrées et sorties d'IA, améliorant la détection des contenus nuisibles pour les applications d'IA générative.
Hugging Face présente Tiny Agents, un agent IA fonctionnel implémenté en 50 lignes de code utilisant le protocole MCP (Model Context Protocol). Cet exemple minimaliste démontre comment construire des agents autonomes avec une architecture épurée.
Google DeepMind lance Gemini 2.5 Flash, son premier modèle de raisonnement hybride permettant aux développeurs d'activer ou désactiver le mode réflexion selon les besoins.
OpenAI déploie o3 et o4-mini, deux modèles combinant raisonnement avancé et capacités complètes (navigation web, Python, analyse d'images/fichiers, génération d'images, canvas, automations, recherche de fichiers, mémoire).
Hugging Face présente HELMET, un benchmark pour évaluer les modèles de langage sur contextes longs. L'outil mesure la capacité des LLM à traiter et comprendre des documents étendus, comblant un manque dans les évaluations existantes.
Google DeepMind intègre Veo 2 dans Gemini Advanced et Whisk pour générer des vidéos de 8 secondes à partir de texte ou d'images. Les utilisateurs peuvent créer des clips animés haute résolution directement via ces interfaces.
OpenAI déploie GPT-4.1 dans son API avec améliorations transversales en codage, suivi d'instructions et compréhension long-contexte. Lancement immédiat pour les développeurs mondiaux, incluant un premier modèle nano.
Hugging Face acquiert Pollen Robotics pour commercialiser des robots open-source. L'acquisition renforce la position de Hugging Face dans l'écosystème robotique et combine expertise en IA avec matériel robotique.
Protect AI et Hugging Face ont scanné 4 millions de modèles en 6 mois pour détecter les malwares et contenus dangereux. Initiative de sécurité collaborative visant à protéger l'écosystème open-source des risques liés aux modèles d'IA.
OpenAI présente PaperBench, un benchmark mesurant la capacité des agents IA à reproduire des recherches IA de pointe. Le test évalue si les modèles peuvent implémenter des papiers scientifiques complexes de manière autonome.
Google DeepMind annonce Gemini 2.5, son modèle IA le plus performant, intégrant des capacités de raisonnement avancé (thinking).
OpenAI déploie une nouvelle capacité de génération d'images intégrée à GPT-4o, surpassant DALL·E 3 avec sortie photorealiste et transformation d'images en entrée.
OpenAI déploie des modèles audio nouvelle génération dans son API, permettant aux développeurs de contrôler le style de parole en texte-vers-parole (ex: "parler comme un agent de service client sympathique"). Nouvelle capacité de personnalisation pour les agents vocaux.
Google DeepMind présente Gemini Robotics et Gemini Robotics-ER, des modèles IA conçus pour permettre aux robots de comprendre, agir et réagir dans le monde physique.