Scaling AI for everyone
OpenAI annonce $110B de nouveaux investissements à une valorisation de $730B : $30B de SoftBank, $30B de NVIDIA, $50B d'Amazon. Financement majeur pour accélérer le déploiement d'IA à grande échelle.
Chaque article scoré par Claude sur deux axes indépendants : signal (info utile) et hype (clickbait). Articles filtrés en amont.
OpenAI annonce $110B de nouveaux investissements à une valorisation de $730B : $30B de SoftBank, $30B de NVIDIA, $50B d'Amazon. Financement majeur pour accélérer le déploiement d'IA à grande échelle.
Vercel publie un correctif de sécurité coordonné pour Next.js traitant 13 vulnérabilités : contournement d'authentification via App Router, injection de paramètres dynamiques, empoisonnement de cache, DoS dans React Server Components (CVE-2026-23870), et XSS. Mise à jour immédiate obligatoire pour tous les utilisateurs affectés.
Anthropic lève 965 milliards de dollars en série H et lance Opus 4.8 avec Dynamic Workflows et ultracode. Expansion majeure du financement et nouvelles capacités de modèle.
Sortie de llm-anthropic 0.25.1 : ajout du modèle Claude Opus 4.8, option -o fast 1 pour le mode rapide (organisations activées), et max_tokens par défaut aligné sur le maximum de chaque modèle au lieu de 8192.
Anthropic lève 65 milliards de dollars en Series H à une valorisation de 965 milliards de dollars. Le chiffre d'affaires annualisé atteint 47 milliards de dollars selon le CFO Krishna Rao. L'entreprise investira dans la recherche en sécurité, la capacité de calcul et l'expansion de sa gamme Claude.
ITBench-AA, nouveau benchmark créé par Artificial Analysis et IBM, évalue les capacités des modèles frontier sur des tâches IT d'entreprise agentic. Les meilleurs modèles (Claude, GPT-4, Gemini) obtiennent moins de 50% de réussite, révélant des lacunes significatives dans l'automatisation des workflows IT complexes.
Meta publie le code et les checkpoints de SAM 3 (Segment Anything Model 3). Le repo inclut l'inférence, le fine-tuning et des notebooks d'exemple pour la segmentation d'images.
Théorème d'impossibilité : aucun classement de features ne peut être simultanément fidèle, stable et complet sous colinéarité. Les auteurs quantifient ce résultat pour 4 classes de modèles, proposent DASH (agrégation d'ensembles SHAP) comme solution, et vérifient formellement 305 théorèmes Lean 4. Conséquence : 68% des datasets publics montrent une instabilité d'attribution.
Un modèle de raisonnement d'OpenAI a réfuté une conjecture d'Erdős en géométrie des distances unitaires (ouverte depuis 1946) en utilisant des outils de théorie algébrique des nombres inattendus. Tim Gowers (médaillé Fields) qualifie cela de « jalon en mathématiques IA ».
OpenAI Whisper est un modèle de reconnaissance vocale entraîné sur 680 000 heures de données multilingues faiblement supervisées. Le repo GitHub contient le code, les modèles pré-entraînés et les benchmarks de performance sur plusieurs langues et conditions acoustiques.
SpaceX a signé un accord avec Anthropic pour fournir de la capacité de calcul sur COLOSSUS et COLOSSUS II. Anthropic paiera 1,25 milliard de dollars par mois jusqu'à mai 2029, avec montée en charge réduite en mai-juin 2026. SpaceX utilise aussi ces ressources pour entraîner Grok 5.
Un modèle OpenAI a réfuté une conjecture majeure en géométrie discrète en résolvant le problème de la distance unitaire, vieux de 80 ans. Cette avancée marque un jalon dans les mathématiques assistées par IA.
Analyse systématique de 40 benchmarks de sécurité pour agents IA (2023-2026). Les benchmarks présentent des modèles de menace incompatibles, des métriques fragmentées et une couverture de risques incohérente. Test de concordance (Kendall's W = 0.10, p = 0.94) révèle l'absence d'alignement entre évaluations. Publication de métadonnées structurées et standards minimaux de reporting.
Google DeepMind présente Gemini Omni, un modèle multimodal capable de traiter texte, audio, vidéo et images en entrée et sortie natives. Le modèle offre latence ultra-basse et performances améliorées sur les benchmarks de raisonnement et vision.
OpenAI lève 122 milliards de dollars pour accélérer le développement de l'IA frontière, augmenter sa capacité de calcul et répondre à la demande croissante de ChatGPT, Codex et solutions d'IA d'entreprise.
OpenAI lance GPT-5.4, son modèle frontier le plus capable et efficace pour le travail professionnel, avec des performances SOTA en coding, computer use, tool search et contexte 1M-token.
OpenAI et AWS annoncent un partenariat stratégique pluriannuel de 38 milliards de dollars. AWS fournira l'infrastructure et la capacité de calcul pour les prochaines générations de modèles OpenAI.
Gemini 2.5 Deep Think atteint le niveau médaille d'or aux finales mondiales de l'International Collegiate Programming Contest (ICPC), marquant une avancée majeure en résolution de problèmes abstraits complexes.
OpenAI annonce o3 et o4-mini, ses modèles les plus puissants à ce jour avec accès complet aux outils. o3 représente un saut en capacité de raisonnement et de résolution de problèmes complexes. o4-mini offre une alternative plus légère et accessible.
OpenAI annonce 40 milliards de dollars de financement à une valorisation post-money de 300 milliards, pour accélérer la recherche en IA, augmenter l'infrastructure de calcul et servir 500 millions d'utilisateurs ChatGPT hebdomadaires.
OpenAI lance o3-mini, un modèle de raisonnement compact et efficace. Conçu pour les tâches complexes avec latence réduite et coûts optimisés, il offre des performances proches d'o3 sur les benchmarks de code et mathématiques.
Hugging Face reproduit DeepSeek-R1, un modèle de raisonnement open-source. Open-R1 offre une alternative entièrement ouverte aux modèles propriétaires, avec code, données et poids disponibles publiquement pour la recherche et le déploiement.
Sora, le modèle de génération vidéo d'OpenAI, est désormais accessible sur sora.com. Il produit des vidéos jusqu'à 1080p, 20 secondes maximum, en formats paysage, portrait ou carré. Les utilisateurs peuvent générer du contenu à partir de texte ou remixer des assets existants.
OpenAI lance l'API Realtime pour permettre aux développeurs de construire des expériences vocales rapides et bidirectionnelles. L'API supporte la parole en entrée/sortie avec latence faible et intégration native des fonctions.
OpenAI présente o1, un modèle de raisonnement capable de résoudre des problèmes complexes en mathématiques, codage et sciences. Le modèle utilise un processus de réflexion interne avant de répondre, améliorant les performances sur les benchmarks difficiles.
OpenAI lance o1-mini, un modèle de raisonnement plus petit et moins coûteux que o1. Conçu pour les tâches de raisonnement complexe avec un meilleur rapport coût-performance.
OpenAI rend le fine-tuning disponible pour GPT-4o. Les utilisateurs peuvent désormais adapter le modèle à leurs cas d'usage spécifiques via l'API.
OpenAI introduit les Structured Outputs dans son API. Les modèles produisent désormais des sorties JSON conformes aux schémas fournis par les développeurs, éliminant les erreurs de parsing et améliorant la fiabilité des applications.
Meta lance Llama 3.1 en trois tailles (405B, 70B, 8B) avec support multilingue et contexte étendu. Les modèles supportent 128k tokens et couvrent 8 langues. Disponibles en open-source via Hugging Face.
OpenAI lance GPT-4o mini, un modèle plus petit et moins coûteux que GPT-4o. Il offre des performances comparables sur de nombreuses tâches tout en réduisant les coûts d'inférence. Le modèle supporte texte, vision et audio.
OpenAI annonce GPT-4o, son nouveau modèle phare capable de raisonner en temps réel sur l'audio, la vision et le texte.
OpenAI rend GPT-4o accessible aux utilisateurs gratuits de ChatGPT, aux côtés de nouvelles fonctionnalités. Le modèle phare devient disponible sans abonnement payant.
OpenAI lance GPT-4o et élargit l'accès gratuit à ChatGPT avec davantage de capacités. Le modèle améliore les performances multimodales et la vitesse de traitement.
OpenAI lance les APIs ChatGPT et Whisper, permettant aux développeurs d'intégrer le modèle de conversation et la reconnaissance vocale dans leurs applications. Les APIs offrent un accès programmatique aux capacités de ChatGPT et de transcription audio de Whisper.
Google lance CodeGemma, une famille de modèles de langage spécialisés dans la génération de code, basée sur Gemma. Disponible en versions 7B et 2B avec poids ouverts, CodeGemma inclut des variantes pré-entraînées et instruction-tuned optimisées pour les tâches de codage.
OpenAI présente Sora, un modèle de diffusion texte-conditionnel entraîné sur vidéos et images de durées, résolutions et formats variables. Basé sur une architecture transformer opérant sur des patches spacetime, Sora génère jusqu'à une minute de vidéo haute fidélité. OpenAI propose que l'échelle des modèles de génération vidéo soit un chemin vers des simulateurs génériques du monde physique.
OpenAI annonce GPT-4 Turbo avec contexte 128K et tarifs réduits, l'API Assistants, GPT-4 Turbo Vision, et l'API DALL·E 3. Plusieurs produits pour développeurs lancés simultanément.
OpenAI lance les GPTs, des versions personnalisées de ChatGPT combinant instructions, connaissances additionnelles et compétences variées, sans nécessiter de code.
Hugging Face annonce le lancement de Falcon 180B, un grand modèle de langage open-source avec 180 milliards de paramètres. Le modèle est disponible en versions base et instruction-tuned, conçu pour des tâches de génération de texte et de raisonnement complexe.
Meta lance Llama 2, un modèle de langage open-source disponible sur Hugging Face. Le modèle est proposé en plusieurs tailles et peut être utilisé gratuitement pour la recherche et les applications commerciales.