1,000 Scientist AI Jam Session
OpenAI et neuf laboratoires nationaux organisent un événement inédit réunissant 1 000 scientifiques pour explorer les applications de l'IA. Aucun détail technique ou résultat concret n'est fourni dans l'annonce.
37 articles
OpenAI et neuf laboratoires nationaux organisent un événement inédit réunissant 1 000 scientifiques pour explorer les applications de l'IA. Aucun détail technique ou résultat concret n'est fourni dans l'annonce.
Arize Phoenix permet de tracer et évaluer les agents IA. L'outil offre une visibilité sur les appels d'API, les décisions d'agent et les performances. Intégration avec les frameworks populaires pour le monitoring en production.
Mercari intègre GPT-4o mini et GPT-4 pour améliorer les annonces produits et assister les vendeurs. Les nouvelles fonctionnalités incluent AI Listing Support et Mercari AI Assistant, visant à augmenter les ventes sur la plateforme.
OpenAI annonce GPT-4.5 en preview recherche, présenté comme son plus grand modèle et le plus compétent à ce jour. Aucun détail technique, benchmark ou date de disponibilité générale fourni dans l'extrait.
Endex construit un analyste financier autonome utilisant o1 et o3-mini d'OpenAI. Les modèles de raisonnement permettent une analyse financière avancée sans intervention manuelle.
Hugging Face et l'Indian Institute of Science (IISc) collaborent pour améliorer le développement de modèles IA sur les langues indiennes. Le partenariat vise à créer des ressources et des outils adaptés à la diversité linguistique de l'Inde.
Google DeepMind rend Gemini 2.0 Flash-Lite disponible en production via l'API Gemini, dans Google AI Studio et Vertex AI pour les clients enterprise.
OpenAI publie un System Card pour "deep research", détaillant les tests de sécurité (red teaming externe, évaluations de risques selon le Preparedness Framework) et les mesures d'atténuation mises en place avant le lancement.
Hugging Face lance FastRTC, une bibliothèque Python pour la communication en temps réel. Elle simplifie la création d'applications audio/vidéo avec support WebRTC natif et intégration aux modèles IA.
Hugging Face intègre les VAE (autoencodeurs variationnels) distants dans Inference Endpoints pour le décodage. Cette fonctionnalité permet d'utiliser des modèles VAE hébergés à distance sans les charger localement, optimisant les ressources et la latence.
OpenAI publie des mesures contre les usages malveillants de l'IA, incluant détection de deepfakes, filtrage d'abus et collaboration avec les autorités. Absence de détails techniques ou chiffres d'impact dans l'extrait fourni.
Hugging Face présente SigLIP 2, un encodeur vision-langage multilingue amélioré. Le modèle offre de meilleures performances sur les tâches de vision et de compréhension multilingue par rapport à la version précédente.
Hugging Face lance SmolVLM2, un modèle de vision multimodal léger capable de traiter vidéos et images. Optimisé pour fonctionner sur appareils mobiles et edge, il offre une alternative accessible aux grands modèles de vision.
Google lance PaliGemma 2 Mix, une famille de modèles de vision-langage instruction-tuned basés sur Gemma 2. Trois variantes (3B, 10B, 28B) combinent capacités visuelles et textuelles pour des tâches multimodales. Disponibles en open-source sur Hugging Face.
OpenAI présente SWE-Lancer, un benchmark mesurant la capacité des LLMs frontier à accomplir des tâches réelles de freelance software engineering et générer des revenus. Le test évalue si les modèles peuvent gagner $1 million sur des projets réels.
Hugging Face ajoute trois nouveaux fournisseurs d'inférence serverless : Hyperbolic, Nebius AI Studio et Novita. Ces intégrations élargissent les options de déploiement de modèles via la plateforme Hugging Face.
OpenAI et Guardian Media Group annoncent un partenariat de contenu pour intégrer les articles du Guardian dans ChatGPT. Les utilisateurs auront accès aux informations journalistiques du Guardian directement dans l'interface de ChatGPT.
Fireworks.ai rejoint Hugging Face Hub. La plateforme d'inférence spécialisée dans les modèles open-source intègre l'écosystème pour faciliter le déploiement et l'accès aux modèles.
Hugging Face corrige son classement Open LLM en intégrant Math-Verify, une méthode de vérification mathématique pour évaluer plus précisément les capacités de raisonnement des modèles de langage. Cette amélioration adresse les limitations des métriques précédentes.
Fanatics Betting and Gaming utilise l'IA pour optimiser sa stratégie financière et opérationnelle. Andrea Ellis, CFO, explique comment l'entreprise déploie des outils IA pour analyser les données massives du secteur des paris et jeux en ligne, améliorant la prise de décision stratégique.
Rogo utilise OpenAI o1 pour automatiser l'analyse financière et la recherche. Le modèle de raisonnement d'OpenAI permet une analyse plus profonde des données financières complexes. Cas d'usage en production montrant l'adoption de o1 dans le secteur fintech.
Hugging Face annonce le franchissement du milliard de classifications sur sa plateforme. Ce jalon reflète l'adoption croissante des modèles d'IA pour des tâches de classification en production.
OpenAI publie une mise à jour de sa Model Spec, le document définissant les comportements attendus de ses modèles. Cette spécification guide le développement et l'évaluation des capacités et des limites de sécurité.
Hugging Face publie un guide pour construire des datasets de haute qualité destinés à l'entraînement de modèles de génération vidéo. L'article couvre les bonnes pratiques de curation, annotation et organisation des données.
Hugging Face optimise les uploads et downloads sur le Hub en remplaçant le système de chunks par des blocks. Cette architecture réduit la latence et améliore la stabilité des transferts de fichiers volumineux.
Hugging Face publie la mise à jour #2 d'Open R1, son modèle de raisonnement open-source. L'update apporte des améliorations de performance et de capacités de reasoning sur des tâches complexes.
OpenAI s'associe à Schibsted Media Group pour intégrer le contenu du Guardian et ses archives dans ChatGPT. Partenariat de distribution de contenu médiatique.
Hugging Face lance le Open Arabic LLM Leaderboard 2, un classement évaluant les modèles de langage arabes sur des benchmarks standardisés. L'initiative mesure les performances en compréhension, génération et raisonnement en arabe.
OpenAI introduit la résidence des données en Europe, renforçant ses programmes de confidentialité, sécurité et conformité pour les clients d'entreprise.
OpenAI et le système CSU déploient ChatGPT auprès de 500 000 étudiants et enseignants. Le plus grand déploiement de ChatGPT à ce jour vise à renforcer l'utilisation de l'IA dans l'éducation et préparer une main-d'œuvre compétente en IA aux États-Unis.
Hugging Face présente π0 et π0-FAST, modèles vision-langage-action pour le contrôle robotique général. Ces modèles unifient perception visuelle, compréhension du langage naturel et génération d'actions, entraînés sur des données robotiques diversifiées pour exécuter des tâches complexes sans fine-tuning spécifique.
OpenAI présente un tuteur mathématique personnalisé construit avec ChatGPT. L'application démontre comment adapter le modèle pour l'éducation via des prompts spécialisés et des interactions conversationnelles. Aucun chiffre de performance ou benchmark fourni dans l'extrait.
Hugging Face lance DeepResearch open-source, un agent de recherche autonome capable de mener des investigations approfondies sur des sujets complexes. L'outil intègre recherche web, synthèse d'informations et raisonnement multi-étapes pour produire des rapports détaillés sans intervention humaine.
Hugging Face présente DABStep, un benchmark pour évaluer les agents IA sur le raisonnement multi-étapes. L'outil mesure la capacité des modèles à décomposer des tâches complexes et à utiliser des outils de manière itérative pour résoudre des problèmes.
OpenAI lance Deep Research, un agent utilisant le raisonnement pour synthétiser des informations en ligne et accomplir des tâches de recherche multi-étapes. Disponible pour les utilisateurs Pro dès aujourd'hui, puis Plus et Team.
OpenAI présente un cas d'usage de sa fonctionnalité "deep research" avec Bain & Company pour analyser des tendances sectorielles complexes. Aucun détail technique, benchmark ou résultat quantifié n'est fourni dans l'extrait.
Hugging Face publie une mise à jour sur Open-R1, un projet open-source de modèle de raisonnement. L'update détaille les progrès et les directions futures du projet.