Page 50 sur 192

ToutHaut signalRécent

7679 articles

The Open Evaluation Standard: Benchmarking NVIDIA Nemotron 3 Nano with NeMo Evaluator

NVIDIA publie Nemotron 3 Nano, un modèle de langage optimisé pour l'inférence, évalué via NeMo Evaluator, un framework open-source de benchmarking. L'outil standardise les évaluations de modèles LLM sur des tâches de raisonnement, génération et suivi d'instructions.

Benchmarks Open source Évaluations

SIG

HYP

Google DeepMind·16 déc.

Gemma Scope 2: helping the AI safety community deepen understanding of complex language model behavior

Google DeepMind publie Gemma Scope 2, des outils d'interprétabilité open-source pour toute la famille Gemma 3. Ces ressources permettent à la communauté de sécurité IA d'analyser en profondeur le comportement des modèles de langage.

DeepMind Gemini Sécurité IA

SIG

HYP

OpenAI Blog·16 déc.

The new ChatGPT Images is here

OpenAI déploie un nouveau modèle de génération d'images pour ChatGPT avec éditions plus précises, détails cohérents et génération 4× plus rapide. Le modèle GPT-Image-1.5 est disponible pour tous les utilisateurs et via l'API.

OpenAI Génération d'images

SIG

HYP

OpenAI Blog·11 déc.

Introducing GPT-5.2

OpenAI lance GPT-5.2, son modèle frontier le plus avancé pour le travail professionnel, avec capacités de raisonnement, compréhension long-contexte, code et vision améliorées. Disponible via ChatGPT et l'API OpenAI pour des workflows d'agents plus rapides et fiables.

GPT OpenAI Agents IA

SIG

HYP

Google DeepMind·9 déc.

FACTS Benchmark Suite: Systematically evaluating the factuality of large language models

Google DeepMind publie FACTS, une suite de benchmarks pour évaluer systématiquement la factualité des grands modèles de langage. Cet outil standardisé mesure la capacité des LLM à produire des informations exactes et vérifiables.

DeepMind Benchmarks Évaluations

SIG

HYP

Hugging Face Blog·5 déc.

Introducing swift-huggingface: The Complete Swift Client for Hugging Face

Hugging Face lance swift-huggingface, un client Swift complet pour accéder à ses API et modèles. La bibliothèque offre une intégration native pour les développeurs iOS/macOS et supporte l'inférence, les embeddings et les tâches de vision.

Outils Embeddings Vision

SIG

HYP

OpenAI Blog·3 déc.

OpenAI to acquire Neptune

OpenAI acquiert Neptune pour améliorer la visibilité sur le comportement des modèles et renforcer les outils de suivi des expériences et de monitoring de l'entraînement.

OpenAI Outils Infrastructure

SIG

HYP

Hugging Face Blog·1 déc.

Transformers v5: Simple model definitions powering the AI ecosystem

Hugging Face lance Transformers v5 avec des définitions de modèles simplifiées. La nouvelle version améliore la compatibilité, réduit la complexité du code et renforce l'intégration avec l'écosystème IA. Focus sur l'accessibilité et la maintenabilité des modèles.

Open source Outils Infrastructure

SIG

HYP

Google DeepMind·25 nov.

Revealing a key protein behind heart disease

AlphaFold a révélé la structure d'une protéine clé impliquée dans les maladies cardiaques. Cette découverte ouvre des perspectives pour le développement de nouveaux traitements.

DeepMind Papers

SIG

HYP

OpenAI Blog·18 nov.

Intuit and OpenAI join forces on new AI-powered experiences

OpenAI et Intuit signent un partenariat multi-année de plus de 100 millions de dollars pour intégrer les applications Intuit dans ChatGPT et déployer les modèles frontier d'OpenAI dans les outils financiers personnalisés d'Intuit.

OpenAI Business Agents IA

SIG

HYP

Google DeepMind·17 nov.

WeatherNext 2: Our most advanced weather forecasting model

Google DeepMind lance WeatherNext 2, un modèle IA de prévision météorologique offrant des prédictions globales plus précises, efficaces et à plus haute résolution que la génération précédente.

DeepMind Benchmarks

SIG

HYP

Google DeepMind·13 nov.

SIMA 2: An Agent that Plays, Reasons, and Learns With You in Virtual 3D Worlds

Google DeepMind présente SIMA 2, un agent IA basé sur Gemini capable de penser, comprendre et agir dans des environnements interactifs 3D. L'agent combine raisonnement et apprentissage pour interagir avec l'utilisateur dans des mondes virtuels.

DeepMind Gemini Agents IA

SIG

HYP

OpenAI Blog·29 oct.

gpt-oss-safeguard technical report

OpenAI publie deux modèles open-weight de raisonnement : gpt-oss-safeguard-120b et gpt-oss-safeguard-20b, post-entraînés pour labéliser du contenu selon une politique donnée. Le rapport technique détaille leurs capacités et évaluations de sécurité par rapport aux modèles gpt-oss de base.

OpenAI GPT Open source

SIG

HYP

Hugging Face Blog·28 oct.

Granite 4.0 Nano: Just how small can you go?

IBM et Hugging Face lancent Granite 4.0 Nano, un modèle ultra-léger optimisé pour l'inférence sur appareil. Le modèle réduit drastiquement la taille tout en maintenant les capacités de raisonnement et de génération de code.

Open source Génération de code Benchmarks

SIG

HYP

Hugging Face Blog·27 oct.

Streaming datasets: 100x More Efficient

Hugging Face introduit le streaming de datasets, réduisant la consommation mémoire de 100x. Les données sont chargées à la demande sans téléchargement préalable, accélérant l'entraînement et l'expérimentation sur de grands corpus.

Outils Infrastructure Open source

SIG

HYP

Hugging Face Blog·27 oct.

huggingface_hub v1.0: Five Years of Building the Foundation of Open Machine Learning

Hugging Face annonce la version 1.0 de huggingface_hub après 5 ans de développement. La bibliothèque Python est devenue l'infrastructure centrale pour partager et accéder aux modèles, datasets et espaces open-source. Cette release marque la stabilité de l'API et consolide le rôle de Hugging Face comme plateforme collaborative majeure du ML open-source.

Open source Infrastructure Outils

SIG

HYP

Google DeepMind·25 oct.

T5Gemma: A new collection of encoder-decoder Gemma models

Google DeepMind présente T5Gemma, une nouvelle collection de modèles Gemma encoder-decoder. Ces LLMs combinent l'architecture T5 avec la base Gemma pour des tâches de traduction, résumé et génération de texte.

DeepMind Gemini Génération de code

SIG

HYP

Google DeepMind·25 oct.

MedGemma: Our most capable open models for health AI development

Google DeepMind lance MedGemma, une collection de modèles multimodaux open-source spécialisés dans l'IA santé. Ces modèles constituent l'offre la plus performante de DeepMind pour le développement d'applications médicales.

DeepMind Open source Vision

SIG

HYP

Google DeepMind·25 oct.

Gemini 2.5 Flash-Lite is now ready for scaled production use

Gemini 2.5 Flash-Lite sort de preview et devient disponible en production. Ce modèle léger offre haute qualité à faible coût, avec fenêtre contextuelle d'1 million de tokens et multimodalité.

Gemini

SIG

HYP

Google DeepMind·24 oct.

Advanced version of Gemini with Deep Think officially achieves gold-medal standard at the International Mathematical Olympiad

Gemini avec Deep Think atteint le niveau médaille d'or à l'Olympiade Internationale de Mathématiques. Le modèle résout les six problèmes exceptionnels de la compétition annuelle prestigieuse depuis 1959.

Gemini Raisonnement Benchmarks

SIG

HYP

Google DeepMind·24 oct.

Genie 3: A new frontier for world models

Google DeepMind présente Genie 3, un modèle de monde capable de générer des environnements dynamiques navigables en temps réel à 24 fps en 720p, avec cohérence maintenue plusieurs minutes.

DeepMind Génération de vidéos Raisonnement

SIG

HYP

Google DeepMind·23 oct.

Gemini Robotics 1.5 brings AI agents into the physical world

Google DeepMind lance Gemini Robotics 1.5, un modèle d'IA pour robots capable de percevoir, planifier, raisonner, utiliser des outils et agir. Le système vise à résoudre des tâches complexes multi-étapes dans le monde physique.

DeepMind Agents IA Robotique

SIG

HYP

Google DeepMind·23 oct.

Introducing CodeMender: an AI agent for code security

Google DeepMind présente CodeMender, un agent IA capable de détecter et corriger automatiquement les vulnérabilités critiques dans le code logiciel. L'outil utilise des techniques avancées d'IA pour identifier les failles de sécurité et proposer des patches.

DeepMind Agents IA Génération de code

SIG

HYP

Google DeepMind·23 oct.

Try Deep Think in the Gemini app

Google DeepMind déploie Deep Think dans l'app Gemini pour les abonnés Google AI Ultra. Des mathématiciens sélectionnés accèdent à la version complète de Gemini 2.5 Deep Think, le modèle entré en compétition aux IMO.

Gemini Raisonnement Benchmarks

SIG

HYP

Google DeepMind·23 oct.

Introducing Gemma 3 270M: The compact model for hyper-efficient AI

Google DeepMind lance Gemma 3 270M, un modèle compact de 270 millions de paramètres conçu pour l'IA hyper-efficace. Cet ajout élargit la gamme Gemma 3 avec une option légère optimisée pour les déploiements à ressources limitées.

DeepMind Gemini Open source

SIG

HYP

Google DeepMind·23 oct.

VaultGemma: The world's most capable differentially private LLM

Google DeepMind présente VaultGemma, un modèle de langage entraîné à partir de zéro avec confidentialité différentielle. Il s'agit du modèle le plus performant jamais créé avec cette contrainte de sécurité.

DeepMind Sécurité IA

SIG

HYP

Google DeepMind·23 oct.

Introducing the Gemini 2.5 Computer Use model

Google DeepMind lance Gemini 2.5 Computer Use, un modèle spécialisé basé sur Gemini 2.5 Pro capable de piloter des agents interagissant avec les interfaces utilisateur. Disponible en preview via API.

Gemini Agents IA Outils

SIG

HYP

Google DeepMind·23 oct.

How a Gemma model helped discover a new potential cancer therapy pathway

Google DeepMind lance un modèle Gemma de 27 milliards de paramètres spécialisé dans l'analyse de cellules uniques. Ce modèle a contribué à identifier une nouvelle voie thérapeutique potentielle contre le cancer.

Gemini Benchmarks Génération de code

SIG

HYP

Hugging Face Blog·22 oct.

Sentence Transformers is joining Hugging Face!

Sentence Transformers, la bibliothèque open-source pour générer des embeddings textuels, rejoint officiellement Hugging Face. L'équipe de développement intègre la plateforme pour accélérer l'innovation en représentations sémantiques et améliorer l'accessibilité des modèles d'embeddings.

Embeddings Open source Outils

SIG

HYP

Hugging Face Blog·16 oct.

Google Cloud C4 Brings a 70% TCO improvement on GPT OSS with Intel and Hugging Face

Google Cloud C4 offre une réduction de 70% du coût total de possession (TCO) pour les modèles GPT open-source, en partenariat avec Intel et Hugging Face. L'optimisation combine l'infrastructure C4 de Google Cloud avec les processeurs Intel pour réduire significativement les coûts d'inférence et de déploiement.

Open source Infrastructure Business

SIG

HYP

Hugging Face Blog·13 oct.

Nemotron-Personas-India: Synthesized Data for Sovereign AI

Nvidia publie Nemotron-Personas-India, un dataset synthétique pour entraîner des modèles IA souverains en Inde. Le dataset contient des personas et données générées pour refléter le contexte culturel et linguistique indien, permettant aux organisations locales de développer des modèles adaptés sans dépendre d'infrastructures externes.

Open source Benchmarks Fine-tuning

SIG

HYP

OpenAI Blog·13 oct.

OpenAI and Broadcom announce strategic collaboration to deploy 10 gigawatts of OpenAI-designed AI accelerators

OpenAI et Broadcom annoncent un partenariat pluriannuel pour déployer 10 gigawatts d'accélérateurs IA conçus par OpenAI d'ici 2029. Les deux entreprises co-développeront des systèmes et solutions Ethernet de nouvelle génération pour une infrastructure IA scalable et économe en énergie.

OpenAI Infrastructure Business

SIG

HYP

Hugging Face Blog·7 oct.

BigCodeArena: Judging code generations end to end with code executions

Hugging Face lance BigCodeArena, une plateforme d'évaluation des modèles de génération de code basée sur l'exécution réelle du code. Elle mesure la performance end-to-end plutôt que par comparaison textuelle, permettant un jugement objectif de la qualité des générations.

Génération de code Benchmarks Évaluations

SIG

HYP

OpenAI Blog·6 oct.

Introducing apps in ChatGPT and the new Apps SDK

OpenAI lance les Apps, une nouvelle catégorie d'applications conversationnelles intégrées directement dans ChatGPT. Un SDK public en preview permet aux développeurs de commencer la construction dès maintenant.

OpenAI Agents IA Outils

SIG

HYP

OpenAI Blog·6 oct.

AMD and OpenAI announce strategic partnership to deploy 6 gigawatts of AMD GPUs

AMD et OpenAI annoncent un partenariat pluriannuel pour déployer 6 gigawatts de GPU Instinct, avec 1 GW dès 2026, afin d'alimenter l'infrastructure IA de nouvelle génération d'OpenAI et accélérer l'innovation IA mondiale.

OpenAI Infrastructure Business

SIG

HYP

Hugging Face Blog·2 oct.

SOTA OCR with Core ML and dots.ocr

Hugging Face présente dots.ocr, un modèle OCR state-of-the-art optimisé pour Core ML. Le modèle fonctionne sur appareil iOS/macOS avec haute précision et faible latence, sans dépendre de serveurs externes.

Vision Open source Outils

SIG

HYP

Hugging Face Blog·1 oct.

Introducing RTEB: A New Standard for Retrieval Evaluation

Hugging Face présente RTEB, un nouveau standard d'évaluation pour les systèmes de retrieval. RTEB fournit des benchmarks standardisés et reproductibles pour mesurer la performance des modèles d'embedding et des pipelines RAG.

RAG Embeddings Benchmarks

SIG

HYP

OpenAI Blog·30 sept.

Sora 2 is here

OpenAI lance Sora 2, son nouveau modèle de génération vidéo avec meilleure précision physique, réalisme et contrôlabilité. Intègre dialogue synchronisé et effets sonores. Disponible dans la nouvelle app Sora.

OpenAI Génération de vidéos

SIG

HYP

OpenAI Blog·25 sept.

Measuring the performance of our models on real-world tasks

OpenAI lance GDPval, une nouvelle évaluation mesurant la performance des modèles sur des tâches économiquement utiles dans 44 métiers. Le benchmark teste les capacités réelles sur des cas d'usage professionnels concrets plutôt que sur des benchmarks académiques classiques.

OpenAI Benchmarks Évaluations

SIG

HYP

OpenAI Blog·23 sept.

OpenAI, Oracle, and SoftBank expand Stargate with five new AI datacenter sites

OpenAI, Oracle et SoftBank annoncent cinq nouveaux sites de datacenters Stargate pour accélérer un investissement de 500 Md$ et 10 gigawatts d'infrastructure IA aux États-Unis, créant des dizaines de milliers d'emplois.

OpenAI Infrastructure Business

SIG

HYP