mai 2026

Llama Génération de code Benchmarks

llama.cpp MTP support landed - Qwen3.6 27B at 2.44× on a Strix Halo, 2.17× on a RTX 3090 rig

Le support MTP (speculative decoding) a été intégré à llama.cpp (PR #22673, 16 mai). Tests sur Qwen 3.6 27B : gains de 1.81× à 2.44× sur Strix Halo (ROCm), 1.54× à 2.17× sur RTX 3090. MoE 35B-A3B moins bénéficiaire (1.24×-1.40×). Activation : --spec-type draft-mtp --spec-draft-n-max N.

SIG

HYP

Hacker News (AI)·18 mai

Agora-1: The Multi-Agent World Model

Agora-1 est un modèle monde multi-agent capable de simuler des interactions complexes entre plusieurs agents. Le système génère des comportements émergents et des dynamiques réalistes dans des environnements virtuels.

Multi-agents Raisonnement Papers

SIG

HYP

Google DeepMind·18 mai

Fast-tracking genetic leads to reverse cellular aging

Google DeepMind utilise Co-Scientist, un agent IA, pour identifier des facteurs génétiques capables de rajeunir les cellules humaines. Les chercheurs ont découvert de nouveaux gènes impliqués dans le processus de vieillissement cellulaire.

DeepMind Agents IA Papers

SIG

HYP

Hacker News (AI)·18 mai

We let AIs run radio stations

Des chercheurs ont laissé des IA gérer des stations de radio en temps réel. L'expérience teste la capacité des modèles à prendre des décisions autonomes, gérer du contenu et interagir avec des auditeurs dans un environnement dynamique et non contrôlé.

Agents IA Raisonnement

SIG

HYP

Hacker News (AI)·18 mai

Elon Musk has lost his lawsuit against Sam Altman and OpenAI

Elon Musk a perdu son procès contre Sam Altman et OpenAI. Le jugement rejette les accusations de Musk concernant la transition d'OpenAI vers une structure commerciale.

OpenAI

SIG

HYP

The Decoder·18 mai

Cursor's Composer 2.5 matches Opus 4.7 and GPT-5.5 benchmarks at a fraction of the cost

Cursor lance Composer 2.5, un modèle de code basé sur Kimi K2.5 et entraîné sur 25x plus de tâches synthétiques. Il égale les performances d'Opus 4.7 et GPT-5.5 sur les benchmarks à un coût nettement inférieur.

Génération de code Benchmarks Kimi

SIG

HYP

Hacker News (AI)·18 mai

Anthropic acquires Stainless

Anthropic acquiert Stainless, une startup spécialisée dans la génération de SDK et d'outils de développement. L'acquisition renforce les capacités d'Anthropic en matière d'infrastructure et d'outillage pour les développeurs utilisant Claude.

Anthropic Claude Outils

SIG

HYP

Hugging Face Blog·18 mai

Fine-Tuning NVIDIA Cosmos Predict 2.5 with LoRA/DoRA for Robot Video Generation

Hugging Face publie un guide pour fine-tuner NVIDIA Cosmos Predict 2.5, un modèle de génération vidéo robotique, via LoRA/DoRA. La méthode réduit les besoins en ressources GPU tout en maintenant la qualité de génération pour des cas d'usage robotiques spécialisés.

Fine-tuning Génération de vidéos Robotique

SIG

HYP

Hacker News (AI)·18 mai

Show HN: InsForge – Open-source Heroku for coding agents

InsForge est une plateforme open-source type Heroku pour déployer et gérer des agents de code. Elle simplifie l'orchestration d'agents IA en production avec infrastructure et monitoring intégrés.

Agents IA Génération de code Open source

SIG

HYP

Hacker News (AI)·18 mai

We stopped AI bot spam in our GitHub repo using Git's –author flag

Une équipe a bloqué le spam de bots IA dans son dépôt GitHub en exploitant le flag --author de Git pour filtrer les commits suspects. Technique simple mais efficace contre les contributions automatisées non désirées.

Open source Outils

SIG

HYP

Hugging Face Blog·18 mai

PaddleOCR 3.5: Running OCR and Document Parsing Tasks with a Transformers Backend

PaddleOCR 3.5 intègre un backend Transformers pour les tâches OCR et parsing de documents. La nouvelle version améliore la précision et la flexibilité en exploitant les modèles Transformers, permettant une meilleure reconnaissance de texte et extraction de données structurées.

Open source Vision Outils

SIG

HYP

Hugging Face Blog·18 mai

The Open Agent Leaderboard

Hugging Face lance un leaderboard public pour évaluer les agents IA open-source. La plateforme classe les modèles selon leur capacité à accomplir des tâches complexes, avec benchmarks reproductibles et transparence des résultats.

Agents IA Benchmarks Open source

SIG

HYP

Hacker News (AI)·18 mai

When Fast Fourier Transform Meets Transformer for Image Restoration

Recherche combinant la Transformée de Fourier Rapide (FFT) avec les architectures Transformer pour la restauration d'images. Approche hybride exploitant le traitement fréquentiel et l'attention pour améliorer la qualité de reconstruction.

Vision Papers

SIG

HYP

Latent Space·18 mai

The Next War Is Already Here. The West Isn't Ready. — Yaroslav Azhnyuk, The Fourth Law & Guest Host Noah Smith, Noahpinion

Yaroslav Azhnyuk, fondateur ukrainien de drones, décrit la transition des caméras pour animaux aux armes guidées par IA. Avec Noah Smith, il argue que l'Occident n'est pas préparé à la guerre technologique en cours.

Agents IA Sécurité IA Régulation

SIG

HYP

Reddit r/MachineLearning·18 mai

Sub-JEPA: a simple fix to LeCun group's LeWorldModel that consistently improves performance [P]

Sub-JEPA améliore LeWorldModel (groupe LeCun, NYU) en appliquant la régularisation gaussienne dans des sous-espaces orthogonaux gelés plutôt que globalement. Gains de +10.7 pp sur Two-Room, trajectoires latentes plus droites, décodabilité d'état physique améliorée. Code et papier disponibles.

Raisonnement Papers Benchmarks

SIG

HYP

The Decoder·18 mai

A Stanford student reflects on his ChatGPT class and a culture of "just a little bit of fraud"

Un étudiant de Stanford décrit comment ChatGPT a transformé une culture existante de malhonnêteté académique en norme par défaut dans sa promotion. L'IA a amplifié les pratiques de fraude déjà présentes à l'université d'élite.

GPT Sécurité IA Régulation

SIG

HYP

Reddit r/MachineLearning·18 mai

Reviving PapersWithCode (by Hugging Face) [P]

Hugging Face relance PapersWithCode avec agents IA pour parser automatiquement les papers et générer des leaderboards. Le site inclut trending papers, catégorisation par domaine, résultats d'éval (Qwen 3.5, RF-DETR, DINOv3), leaderboards (MMTEB, COCO), citations, repos GitHub liés, et support papers externes (DeepSeek v4). Disponible sur paperswithcode.co.

Agents IA Benchmarks Open source

SIG

HYP

Reddit r/MachineLearning·18 mai

Scaling LLMs horizontally: hidden-state coupling without weight modification [R]

Residual Coupling (RC) connecte des modèles de langage gelés en parallèle via des projections linéaires apprises légères, sans modifier les poids. Les ponts linéaires lisent les états cachés d'un modèle et injectent des mises à jour additives dans le flux résiduel d'un autre. Sur données médicales, RC réduit la perplexité à 11.02 vs 56.80 pour MoE (+80.7%), et améliore TruthfulQA de 9.1 points.

Llama Multi-agents Fine-tuning

SIG

HYP

Benchmarks Sécurité IA Alignement

I tested 42 LLMs on their willingness to build the apocalypse. The "safest" closed-source models are lying to you.

DystopiaBench teste 42 LLMs (open et closed-source) sur leur capacité à refuser des demandes dangereuses progressivement normalisées. 6 catégories de dystopies (armes autonomes, surveillance, contrôle comportemental, etc.) avec 5 niveaux d'escalade. Résultat : les modèles détectent les demandes évidentes mais échouent face aux requêtes dissimulées derrière du dual-use. Benchmark open-source disponible.

SIG

HYP

Hacker News (AI)·18 mai

AI eats the world (Spring 26) [pdf]

Rapport d'analyse sur la pénétration de l'IA dans les secteurs économiques et technologiques au printemps 2026. Document PDF synthétisant tendances, adoptions et impacts mesurables de l'IA générative et spécialisée.

Benchmarks Business

SIG

HYP

The Decoder·18 mai

MAGA-aligned groups want government oversight of frontier AI models

Une coalition d'organisations conservatrices menée par Humans First demande au président Trump un décret exécutif imposant des tests de sécurité obligatoires pour les modèles IA frontière avant leur déploiement.

Régulation Sécurité IA

SIG

HYP

The Decoder·18 mai

Anthropic to brief global financial regulators on cyber flaws found by Claude Mythos

Anthropic va briefer les ministères des finances et banques centrales du monde sur des vulnérabilités cyber découvertes par Claude Mythos Preview dans les défenses du système financier global.

Claude Sécurité IA Régulation

SIG

HYP

Hacker News (AI)·18 mai

Voice AI Systems Are Vulnerable to Hidden Audio Attacks

Des chercheurs démontrent que les systèmes de reconnaissance vocale IA sont vulnérables aux attaques audio cachées (adversarial examples). Ces attaques inaudibles pour l'humain peuvent tromper les modèles et compromettre la sécurité des assistants vocaux.

Sécurité IA Voix

SIG

HYP

Qwen Génération de code Benchmarks

Qwen 3.6 27B on 24GB VRAM setup: backend comparisons, quant choice and settings (llama.cpp, ik_llama.cpp, BeeLlama, vllm)

Benchmark détaillé de Qwen 3.6 27B sur RTX 3090 24GB. ik_llama.cpp surpasse llama.cpp et BeeLlama avec 1261 tok/s prefill et 72.9 tok/s decode sur contexte 156k. Configuration optimale : quantization IQ4_KS, multi-token prediction, flash attention.

SIG

HYP

OpenAI Blog·18 mai

OpenAI and Dell partner to bring Codex to hybrid and on-premise enterprise environments

OpenAI et Dell s'associent pour déployer Codex dans les environnements hybrides et on-premise des entreprises. Le partenariat vise à permettre aux organisations de lancer des agents IA de codage de manière sécurisée sur leurs données et workflows propriétaires.

OpenAI Claude Code Agents IA

SIG

HYP

The Decoder·18 mai

AI startup revenue hits $80 billion, but Anthropic and OpenAI take almost all of it

Les startups IA ont généré 80 milliards de dollars de revenus, mais Anthropic et OpenAI en captent 89 %. La concentration du marché reste extrême parmi les principaux acteurs.

Anthropic OpenAI Business

SIG

HYP

Agents IA Génération de code Open source

I built a coding agent that gets 87% on benchmarks with a 4B parameter model, here's how

SmallCode, un agent de codage local, atteint 87% sur des benchmarks avec Gemma 4B en utilisant des outils composés, des boucles d'amélioration itératives, et une gestion optimisée du contexte. Contrairement aux agents existants (OpenCode, Cursor, Claude Code) qui nécessitent des modèles massifs, SmallCode est conçu pour les petits modèles locaux avec escalade optionnelle vers Claude/OpenAI.

SIG

HYP

Hacker News (AI)·17 mai

Long-term editing of brain circuits using an engineered electrical synapse

Des chercheurs ont développé une synapse électrique artificielle permettant l'édition à long terme des circuits cérébraux. Cette approche utilise des jonctions gap modifiées pour contrôler durablement l'activité neuronale sans intervention répétée.

Sécurité IA

SIG

HYP

Hacker News (AI)·17 mai

Autoregressive next token prediction and KV Cache in transformers

Article technique sur la prédiction autorégressionne du prochain token et le mécanisme de KV Cache dans les transformers. Explique les fondamentaux de l'inférence des modèles de langage.

Raisonnement

SIG

HYP

Google DeepMind·17 mai

Simulate real-world places with Project Genie and Street View

Google DeepMind élargit l'accès à Google AI Ultra aux abonnés mondiaux et introduit une nouvelle capacité alimentée par Street View pour simuler des lieux réels.

DeepMind Génération de vidéos

SIG

HYP

Google DeepMind·17 mai

Introducing Gemini Omni

Google DeepMind présente Gemini Omni, un modèle multimodal capable de traiter texte, audio, vidéo et images en entrée et sortie natives. Le modèle offre latence ultra-basse et performances améliorées sur les benchmarks de raisonnement et vision.

Gemini DeepMind Vision

SIG

HYP

Simon Willison·17 mai

GDS weighs in on the NHS's decision to retreat from Open Source

Le Government Digital Service (GDS) britannique publie une directive le 14 mai recommandant aux organismes publics de maintenir l'open source par défaut, critiquant implicitement la décision du NHS de fermer ses dépôts suite aux vulnérabilités découvertes par Project Glasswing. Le GDS juge que la fermeture augmente les coûts et réduit la réutilisabilité.

Open source Sécurité IA

SIG

HYP

Google DeepMind·17 mai

Gemini for Science: AI experiments and tools for a new era of discovery

Google DeepMind lance Gemini for Science, une suite d'outils et d'expériences IA conçus pour accélérer la recherche scientifique en augmentant l'échelle et la précision de l'exploration.

DeepMind Gemini Outils

SIG

HYP

Reddit r/MachineLearning·17 mai

Recent Developments in LLM Architectures: KV Sharing, mHC, and Compressed Attention [P]

Discussion sur les avancées récentes en architectures LLM : partage KV (Key-Value), mécanismes mHC et attention compressée. Exploration des optimisations pour réduire la consommation mémoire et améliorer l'efficacité computationnelle des modèles de langage.

Raisonnement Infrastructure

SIG

HYP

Reddit r/MachineLearning·17 mai

Program misleading high school students into paying to perform academic misconduct in ML Research [D]

Un programme payant (Algoverse AI Research) commercialisé auprès de lycéens produit massivement des publications NeurIPS 2025 (289 acceptations revendiquées) contenant des erreurs évidentes : résultats dupliqués, abstracts contradictoires avec les résultats, citations générées par IA, données non relues. Kevin Zhu, affilié au programme, cumule 158 publications et 468 coauteurs sur OpenReview.

Papers Évaluations Régulation

SIG

HYP

Interconnects (Nathan Lambert)·16 mai

Latest open artifacts (#21): Open model bonanza! Gemma 4, DeepSeek V4, Kimi K2.6, MiMo 2.5, GLM-5.1 & others. On CAISI's V4 assessment.

Mois chargé avec plusieurs sorties majeures : Gemma 4, DeepSeek V4, Kimi K2.6, MiMo 2.5, GLM-5.1. Nathan Lambert couvre aussi l'évaluation V4 de CAISI sur ces modèles open-source.

Gemini DeepSeek Kimi

SIG

HYP

Google DeepMind·16 mai

Strengthening Singapore’s AI Future: A New National Partnership

Google DeepMind s'associe à Singapour pour déployer l'IA de pointe sur la santé, l'éducation et la durabilité. Partenariat national visant à résoudre des défis complexes.

DeepMind Business

SIG

HYP

Google DeepMind·16 mai

Finding the molecular switches behind new infectious diseases

Clare Bryant utilise Co-Scientist, un outil d'IA de Google DeepMind, pour identifier les déclencheurs génétiques des maladies infectieuses émergentes. L'approche combine analyse computationnelle et expertise biologique pour accélérer la découverte des mécanismes moléculaires.

DeepMind Agents IA Papers

SIG

HYP

Google DeepMind·16 mai

Opening new paths in aging research

Calico Life Sciences utilise Co-Scientist, un outil IA de Google DeepMind, pour connecter des découvertes fragmentées et générer de nouvelles pistes en recherche sur le vieillissement.

DeepMind Agents IA RAG

SIG

HYP

Google DeepMind·16 mai

Accelerating discovery of liver disease mechanisms

Filippo Menolascina utilise Co-Scientist de Google DeepMind pour accélérer la découverte de mécanismes de maladies hépatiques et identifier de nouveaux traitements. L'outil aide à expliquer pourquoi les médicaments existants ne fonctionnent que chez certains patients.

DeepMind Agents IA Raisonnement

SIG

HYP

Google DeepMind·16 mai

Uniting biological toolkits for a new approach to ALS

Google DeepMind collabore avec Boston Children's Hospital et le MIT pour développer de nouveaux traitements à base d'ARN contre la sclérose latérale amyotrophique (SLA), en combinant des approches biologiques innovantes.

DeepMind Sécurité IA

SIG

HYP

Google DeepMind·16 mai

Uncovering repurposed medicines to fight liver fibrosis

Un généticien de Stanford utilise Co-Scientist de Google DeepMind pour identifier des médicaments existants pouvant traiter la fibrose hépatique. L'outil d'IA aide à repérer des molécules candidates parmi les traitements approuvés.

DeepMind Agents IA Outils

SIG

HYP

Latent Space·16 mai

[AINews] Cerebras' $60B IPO: Slowly, then All at Once

Cerebras annonce un IPO de 60 milliards de dollars. L'entreprise spécialisée dans les processeurs IA accélère son expansion commerciale après des années de développement technologique.

Infrastructure

SIG

HYP

Google DeepMind·16 mai

How WeatherNext helped the National Hurricane Center better predict Hurricane Melissa’s historic landfall in Jamaica

Google DeepMind a utilisé son modèle WeatherNext pour améliorer les prévisions de l'ouragan Melissa en Jamaïque. Le modèle IA a fourni aux prévisionnistes du National Hurricane Center un délai supplémentaire pour alerter les communautés.

DeepMind Benchmarks

SIG

HYP

OpenAI Blog·16 mai

OpenAI and Malta partner to bring ChatGPT Plus to all citizens

OpenAI et Malte s'associent pour offrir ChatGPT Plus à tous les citoyens et proposer des formations aux compétences IA pratiques. Initiative d'accès démocratisé sans détails de coûts ou calendrier précisés.

Claude Outils Génération de code

SIG

HYP

Simon Willison·15 mai

inaturalist-clumper 0.1

Simon Willison publie inaturalist-clumper 0.1, un outil open-source pour regrouper et publier ses observations iNaturalist sur son blog. Testé en production depuis plusieurs semaines.

Open source Outils

SIG

HYP

Simon Willison·15 mai

QR code generator

Simon Willison a créé un générateur de codes QR avec l'aide de Claude. L'outil supporte les URLs, texte et connexions WiFi (SSID, mot de passe, sécurité WPA/WPA2/WPA3). Options de style : forme carrée, bordure, taille, couleur personnalisable.

SIG

HYP

Simon Willison·15 mai

datasette-llm-limits 0.1a0

Sortie de datasette-llm-limits 0.1a0, plugin pour Datasette permettant de configurer des limites de dépenses par utilisateur ou globales pour l'utilisation d'LLM. Supporte les limites quotidiennes avec fenêtres glissantes et montants en USD.

Outils Open source

SIG

HYP

Simon Willison·15 mai

datasette-agent 0.1a2

Sortie de datasette-agent 0.1a2 avec système de permissions. Les outils d'agent en arrière-plan nécessitent désormais la permission `datasette-agent-background`. Disponibilité des outils liée aux permissions requises.

Agents IA Outils Open source

SIG

HYP

Vercel AI Blog·15 mai

Sort providers by cost, latency, or throughput on AI Gateway

Vercel AI Gateway permet désormais de trier les fournisseurs de modèles par coût, latence (TTFT) ou débit (TPS). Le tri s'effectue à chaque requête, intégrant automatiquement les changements de prix et de performance sans modification de code. Compatible avec Zero Data Retention et les options de routage existantes.

Outils Infrastructure Business

SIG

HYP

OpenAI Blog·15 mai

Databricks brings GPT-5.5 to enterprise agent workflows

Databricks intègre GPT-5.5 dans ses workflows d'agents d'entreprise suite aux résultats du modèle sur le benchmark OfficeQA Pro. Pas de détails sur les chiffres ou l'amélioration mesurée.

GPT Agents IA OpenAI

SIG

HYP

Vercel AI Blog·15 mai

Use native curl syntax with Vercel CLI

Vercel CLI supporte désormais la syntaxe native curl. La commande accepte URLs complètes, noms d'hôtes et le flag --url, utilisant l'authentification Vercel pour contourner la Protection de déploiement.

SIG

HYP

OpenAI Blog·15 mai

How data science teams use Codex

OpenAI présente des cas d'usage de Codex pour les équipes data science : génération automatisée de briefs d'analyse de causes racines, rapports d'impact, mémos KPI, analyses ciblées et spécifications de dashboards à partir de données réelles.

OpenAI Outils

SIG

HYP

OpenAI Blog·15 mai

How business operations teams use Codex

OpenAI présente des cas d'usage de Codex pour les équipes opérationnelles : génération automatisée de briefs d'initiative, mises à jour stratégiques, dossiers décisionnels et rapports de progression à partir de données métier réelles.

OpenAI Outils Business

SIG

HYP

OpenAI Blog·15 mai

A new personal finance experience in ChatGPT

OpenAI déploie une nouvelle fonctionnalité de finance personnelle dans ChatGPT Pro (États-Unis). Les utilisateurs peuvent connecter leurs comptes bancaires de manière sécurisée pour recevoir des analyses et conseils IA contextualisés basés sur leurs finances, objectifs et priorités.

SIG

HYP

OpenAI Blog·15 mai

How sales teams use Codex

OpenAI présente des cas d'usage de Codex pour les équipes commerciales : génération automatisée de briefs pipeline, dossiers de préparation réunion, revues de forecast, plans de compte et diagnostics de deals bloqués à partir de données métier réelles.

SIG

HYP

Vercel AI Blog·15 mai

Trace any Vercel request from the CLI

Vercel ajoute la génération de traces OpenTelemetry via CLI. Les commandes `vercel curl --trace` et `vercel traces get` permettent de générer et récupérer des traces par ID de requête. Disponible sur tous les plans.

Agents IA Génération de code

SIG

HYP

Simon Willison·14 mai

Not so locked in any more

Les agents de code réduisent le coût de maintenance des applications legacy, permettant aux entreprises de migrer vers des technologies comme React Native sans crainte de lock-in. Mitchell Hashimoto note que les langages de programmation ne sont plus des pièges : une mauvaise décision technologique peut être corrigée par une réécriture assistée par IA.

SIG

HYP

Latent Space·14 mai

AI-Native Healthcare: 100M Doctor Visits, 10–20 Hours Saved, Prior Auth in Minutes — Janie Lee & Chai Asawa, Abridge

Abridge transforme les conversations patient-clinicien en système d'exploitation pour la santé. La plateforme traite 100M visites médicales, économise 10-20h par clinicien, et réduit l'autorisation préalable à quelques minutes via IA.

Agents IA Voix Business

SIG

HYP

Simon Willison·14 mai

datasette-agent 0.1a1

Sortie de datasette-agent 0.1a1. La version utilise désormais la permission `execute-sql` pour décider quelles tables afficher à l'utilisateur.

Agents IA Outils Open source

SIG

HYP

OpenAI Blog·14 mai

Sea's View on the Future of Agentic Software Development with Codex

Sea Limited déploie Codex (modèle de code OpenAI) auprès de ses équipes d'ingénierie pour accélérer le développement logiciel natif IA en Asie. Le CPO de l'entreprise justifie cette stratégie comme réponse aux défis de productivité et de scalabilité régionaux. Aucun chiffre d'impact ou timeline fourni dans l'extrait.

Claude Code OpenAI Agents IA

SIG

HYP

Hugging Face Blog·14 mai

Granite Embedding Multilingual R2: Open Apache 2.0 Multilingual Embeddings with 32K Context — Best Sub-100M Retrieval Quality

IBM et Hugging Face publient Granite Embedding Multilingual R2, un modèle d'embeddings open-source sous licence Apache 2.0. Le modèle supporte 32K tokens de contexte et offre la meilleure qualité de retrieval dans sa catégorie sub-100M paramètres sur plusieurs langues.

Embeddings Open source RAG

SIG

HYP

OpenAI Blog·14 mai

Work with Codex from anywhere

OpenAI intègre Codex dans l'app mobile ChatGPT, permettant de monitorer, diriger et valider des tâches de code en temps réel sur plusieurs appareils et environnements distants.

OpenAI Claude Code Outils

SIG

HYP

Simon Willison·14 mai

datasette-ip-rate-limit 0.1a0

Sortie de datasette-ip-rate-limit 0.1a0, un plugin de limitation de débit configurable pour Datasette. Créé avec Codex (GPT-5.5 xhigh) pour bloquer les crawlers agressifs. Configuration en production sur datasette.io avec règles par chemin (60 requêtes/60s, blocage 20s).

Outils Open source Génération de code

SIG

HYP

Latent Space·14 mai

[AINews] Codex Rises, Claude Meters Programmatic Usage

Tendance à long terme des principaux agents de codage. Codex revient en avant-plan. Claude mesure l'utilisation programmatique via des métriques détaillées.

Claude Génération de code Agents IA

SIG

HYP

Hugging Face Blog·14 mai

Unlocking asynchronicity in continuous batching

Hugging Face présente une technique d'asynchronicité pour l'optimisation du batching continu dans les serveurs d'inférence. La méthode améliore le débit en gérant les requêtes de manière non-bloquante, réduisant la latence et augmentant l'utilisation des ressources GPU.

Infrastructure Outils Open source

SIG

HYP

OpenAI Blog·14 mai

Helping ChatGPT better recognize context in sensitive conversations

OpenAI améliore la compréhension contextuelle de ChatGPT dans les conversations sensibles via des mises à jour de sécurité. Le système détecte désormais mieux les risques au fil du temps et adapte ses réponses. Pas de détails techniques ou chiffres d'impact fournis.

Sécurité IA

SIG

HYP

Vercel AI Blog·14 mai

Protected Source Maps: Ship browser source maps securely

Vercel introduit les Protected Source Maps, qui restreignent l'accès aux fichiers .map en production via Vercel Authentication. Les équipes autorisées peuvent les consulter pour déboguer le code minifié ; les autres reçoivent une erreur 404. Activé par défaut pour les nouveaux projets.

OpenAI Génération de code Outils

SIG

HYP

Simon Willison·13 mai

Welcome to the Datasette blog

Datasette lance un blog officiel construit avec OpenAI Codex desktop. Simon Willison a utilisé la fonctionnalité d'export de transcription Markdown pour documenter le processus de création.

SIG

HYP

OpenAI Blog·13 mai

Building a safe, effective sandbox to enable Codex on Windows

OpenAI a développé un sandbox sécurisé pour Codex sur Windows, permettant aux agents de code de fonctionner en toute sécurité avec accès fichiers et restrictions réseau contrôlés. Aucun détail technique ou benchmark fourni dans l'extrait.

Claude Code OpenAI Sécurité IA

SIG

HYP

Simon Willison·13 mai

CSP Allow-list Experiment

Simon Willison présente un outil expérimental permettant de charger une app dans une iframe sandboxée protégée par CSP, avec un fetch() personnalisé qui intercepte les erreurs CSP et les remonte à la fenêtre parent pour ajouter dynamiquement des domaines à la allow-list. Construit avec GPT-5.5 xhigh dans Codex.

Outils Génération de code

SIG

HYP

OpenAI Blog·13 mai

Our response to the TanStack npm supply chain attack

OpenAI détaille sa réponse à l'attaque de chaîne d'approvisionnement TanStack "Mini Shai-Hulud", explique les protections appliquées aux systèmes et certificats de signature, et impose une mise à jour obligatoire des apps macOS avant le 12 juin 2026. Incident affectant la sécurité logicielle et renforcement des défenses contre les menaces émergentes.

OpenAI Sécurité IA

SIG

HYP

Vercel AI Blog·13 mai

Trusted Sources for Deployment Protection

Vercel introduit Trusted Sources, un mécanisme de sécurité utilisant des tokens OIDC de courte durée pour autoriser les déploiements protégés sans partager de secrets long-lived. Les projets Vercel et services externes (GitHub Actions, etc.) peuvent être autorisés via des règles from/to configurables par environnement.

Infrastructure Sécurité IA Outils

SIG

HYP

Simon Willison·12 mai

datasette 1.0a29

Datasette 1.0a29 ajoute une méthode utilitaire TokenRestrictions.abbreviated(), améliore l'affichage des en-têtes de table sur les tables vides, corrige des bugs d'interface Mobile Safari et résout une condition de course critique causant des segfaults lors de la fermeture de connexions.

Open source Outils Infrastructure

SIG

HYP

Vercel AI Blog·12 mai

Create Vercel Firewall rules with natural language

Vercel Firewall permet désormais de créer des règles WAF personnalisées en langage naturel. L'utilisateur décrit le comportement souhaité et le tableau de bord génère la règle. Disponible via dashboard ou CLI Vercel.

OpenAI Raisonnement Outils

SIG

HYP

Simon Willison·12 mai

llm 0.32a2

llm 0.32a2 ajoute le support du endpoint `/v1/responses` d'OpenAI pour les modèles reasoning-capable (GPT-5 class). Affiche les tokens de reasoning résumés en couleur différente. Flags `-R` ou `--hide-reasoning` pour masquer.

SIG

HYP

Interconnects (Nathan Lambert)·12 mai

How open model ecosystems compound

Analyse de l'écosystème IA chinois caractérisé par une forte participation et une approche open-first. Réflexions sur les effets de composition et les dynamiques d'innovation dans ce modèle décentralisé.

Open source Business

SIG

HYP

OpenAI Blog·12 mai

How finance teams use Codex

OpenAI présente des cas d'usage de Codex pour les équipes finance : construction d'MBRs, packs de reporting, variance bridges, vérifications de modèles et scénarios de planification à partir de données réelles. Aucun benchmark ou résultat quantifié fourni.

Gemini Multi-agents Agents IA

SIG

HYP

Google DeepMind·12 mai

Co-Scientist: A multi-agent AI partner to accelerate research

Google DeepMind présente Co-Scientist, un agent IA multi-agent construit avec Gemini pour accélérer les découvertes scientifiques en tant que partenaire collaboratif pour les chercheurs.

SIG

HYP

Vercel AI Blog·12 mai

Fast mode for Opus 4.7 available on AI Gateway

Vercel AI Gateway propose Fast Mode pour Claude Opus 4.7 en preview recherche. La génération de tokens de sortie est ~2.5x plus rapide avec l'intelligence complète d'Opus 4.7. Tarification : 6x les tarifs standard (input $30/1M, output $150/1M tokens).

Claude Claude Code Infrastructure

SIG

HYP

Latent Space·12 mai

[AINews] Thinking Machines' Native Interaction Models - TML-Interaction-Small 276B-A12B - advances SOTA Realtime Voice and kills standard VAD

Thinking Machines lance TML-Interaction-Small, un modèle de 276B paramètres avec 12B actifs, qui progresse sur l'état de l'art en voix temps réel et élimine le besoin de VAD (Voice Activity Detection) standard.

Voix Agents IA

SIG

HYP

Vercel AI Blog·12 mai

Manage Vercel Firewall in the CLI

Vercel ajoute la gestion du Firewall via CLI. La nouvelle commande `vercel firewall` permet de configurer règles personnalisées, blocages IP, contournements système et modes d'attaque depuis le terminal. Une skill d'agent documente les bonnes pratiques de déploiement.

Outils Agents IA Infrastructure

SIG

HYP

Vercel AI Blog·12 mai

AI Gateway production index

Vercel publie un index de production basé sur 7 mois de trafic AI Gateway (200K+ équipes). En avril 2026 : par dépense, Anthropic 61%, Google 21%, OpenAI 12% ; par volume de tokens, Google 38%, Anthropic 26%, OpenAI 13%, xAI 10%. Les modèles premium (Claude Opus) dominent les cas critiques, les modèles rapides bon marché (Gemini Flash) le volume.

Benchmarks Claude Gemini

SIG

HYP

Vercel AI Blog·12 mai

Node.js 26.x now available on Vercel Sandboxes

Vercel Sandbox supporte désormais Node.js 26. Les utilisateurs doivent mettre à jour @vercel/sandbox vers 1.10.22 ou 0.0-beta.19 (v2) et configurer runtime à node26.

Infrastructure Outils

SIG

HYP

OpenAI Blog·12 mai

AutoScout24 scales engineering with AI-powered workflows

AutoScout24 Group déploie Codex et ChatGPT pour accélérer les cycles de développement et améliorer la qualité du code. L'article détaille l'adoption d'outils IA pour l'ingénierie logicielle sans préciser les gains mesurables ni les chiffres d'impact.

Claude Code OpenAI Business

SIG

HYP

OpenAI Blog·12 mai

What Parameter Golf taught us about AI-assisted research

OpenAI a lancé Parameter Golf, une compétition réunissant 1 000+ participants et 2 000+ soumissions pour explorer la recherche ML assistée par IA, les agents de code, la quantification et la conception de modèles sous contraintes strictes. L'initiative teste comment les outils IA accélèrent l'innovation en recherche.

OpenAI Agents IA Benchmarks

SIG

HYP

OpenAI Blog·12 mai

How NVIDIA engineers and researchers build with Codex

OpenAI présente comment les ingénieurs NVIDIA utilisent Codex avec GPT-5.5 pour déployer des systèmes en production et transformer des idées de recherche en expériences exécutables.

Claude Code OpenAI GPT

SIG

HYP

Simon Willison·11 mai

Thoughts on GitLab's workforce reduction" and "structural and strategic decisions"

GitLab annonce une réduction d'effectifs et une restructuration pour l'ère des agents IA : réduction de 30% des pays avec petites équipes (sur ~60), aplatissement de l'organisation (suppression de 3 niveaux de management), et réorganisation de la R&D en ~60 équipes autonomes avec propriété end-to-end.

Agents IA Business

SIG

HYP

Hugging Face Blog·11 mai

Building Blocks for Foundation Model Training and Inference on AWS

Hugging Face et AWS collaborent pour fournir des briques de base optimisées pour l'entraînement et l'inférence de modèles de fondation sur l'infrastructure AWS, incluant intégrations avec SageMaker et outils open-source.

Infrastructure Open source Outils

SIG

HYP

Simon Willison·11 mai

Quoting James Shore

James Shore argue que les agents IA de codage doivent réduire les coûts de maintenance, pas seulement accélérer la production. Doubler la productivité sans diviser les coûts de maintenance par deux crée une dette technique permanente : 2× output + 1× maintenance cost = 2× coûts totaux.

Agents IA Génération de code

SIG

HYP

Simon Willison·11 mai

Your AI Use Is Breaking My Brain

Jason Koebler dénonce la prolifération du contenu IA en ligne et son impact cognitif. Il introduit le concept de « Zombie Internet » : un mélange de bots, humains utilisant l'IA, et agents automatisés générant du contenu spam pour monétiser (YouTube, blogs, réseaux sociaux). Filtrer cette pollution devient mentalement épuisant et déforme l'écriture humaine.

Sécurité IA Régulation

SIG

HYP

Simon Willison·11 mai

Using LLM in the shebang line of a script

Simon Willison documente l'utilisation de LLM dans la shebang d'un script. La CLI LLM supporte les fragments (-f), les tool calls (-T), et les templates YAML pour définir des fonctions Python. Exemples : générer un SVG, écrire un haïku avec l'heure actuelle, ou exécuter des calculs avec gpt-5.4-mini.

Outils Génération de code Prompt engineering

SIG

HYP

Simon Willison·11 mai

Learning on the Shop floor

Tobias Lütke décrit River, l'agent de codage interne de Shopify, qui fonctionne exclusivement en public sur Slack. River refuse les messages directs et force les conversations dans des canaux publics, créant un environnement d'apprentissage par osmose où tous les employés voient le travail et apprennent les uns des autres sans curriculum formel.

Agents IA Génération de code Outils

SIG

HYP

OpenAI Blog·11 mai

How ChatGPT adoption broadened in early 2026

ChatGPT a enregistré une croissance rapide au Q1 2026, particulièrement chez les utilisateurs de plus de 35 ans et avec une répartition de genre plus équilibrée. Les données indiquent une adoption mainstream de l'IA au-delà des early adopters.

SIG

HYP

OpenAI Blog·11 mai

OpenAI Campus Network: Student club interest form

OpenAI lance un réseau de clubs étudiants mondiaux pour accéder à des outils IA, organiser des événements et construire des communautés campus. Formulaire d'intérêt ouvert pour les clubs étudiants.

SIG

HYP

OpenAI Blog·11 mai

How enterprises are scaling AI

OpenAI publie un guide sur le passage à l'échelle de l'IA en entreprise, couvrant la gouvernance, la conception des workflows et la qualité. L'article souligne l'importance de la confiance et des processus structurés pour transformer les expériences initiales en impact durable. Aucun chiffre ou modèle spécifique mentionné dans l'extrait.

SIG

HYP

Vercel AI Blog·11 mai

Automate progressive rollouts with Vercel Flags

Vercel Flags supporte désormais les progressive rollouts, permettant de déployer une feature à un pourcentage croissant d'utilisateurs selon un calendrier prédéfini. Contrairement aux weighted splits fixes, chaque étape a un pourcentage cible et une durée, capturant les régressions sur un petit groupe avant déploiement complet. Disponible via dashboard et CLI.