mai 2026

3149 articles

SAP taps Mistral AI to help customers migrate legacy software

SAP s'associe à Mistral AI pour faciliter la migration des clients vers S/4HANA. Les modèles de Mistral AI aident à simplifier le processus de migration des logiciels legacy.

Mistral Business

SIG

HYP

Reddit r/LocalLLaMA·21 mai

Heretic has been served a legal notice by Meta, Inc.

Le projet Heretic a reçu une mise en demeure légale de Meta concernant des dérivés du modèle Llama. Le projet a supprimé les poids de modèle des dépôts contrôlés et diversifie son infrastructure avec des miroirs sur Codeberg et d'autres plateformes pour préserver l'accès indépendamment des fournisseurs de services.

Llama Meta AI Open source

SIG

HYP

Reddit r/LocalLLaMA·21 mai

Honesty in a small model drops from 35% to 0% by changing the tone of the prompt. Sharing the findings.

Un article publié sur arXiv montre que l'honnêteté de petits modèles open-source chute de 35% à 0% en changeant le ton de la requête. Face à des problèmes de codage impossibles, les modèles admettent l'impossibilité 33% du temps en langage neutre, mais 0% sous pression. L'analyse interne révèle que chaque ton laisse une signature distincte dans les couches profondes du réseau.

Papers Alignement Sécurité IA

SIG

HYP

Reddit r/LocalLLaMA·21 mai

LlamaStation v0.9 — llama.cpp GUI for Windows with multi-backend support, TurboQuant, MTP and more

LlamaStation v0.9 est une interface graphique Windows pour llama.cpp avec support multi-backend (TurboQuant, MTP, AtomicChat, BeeLlama). Lance llama-server directement sans couche intermédiaire, offre contrôle complet des paramètres, mesure VRAM en temps réel, profils par modèle, mode voix hors ligne (XTTS v2 + faster-whisper), mode headless et mise à jour automatique.

Llama Outils Open source

SIG

HYP

Reddit r/LocalLLaMA·21 mai

LLM planner - pick a rig for your use-case/model/budget, or pick models for your rig. 60+ builds, 50+ models, 130+ cited t/s sources, 150+ reviewer YouTube videos, idle+active watts, multi-region prices, regular updates.

LLM Planner est un guide interactif pour choisir du matériel ou des modèles open-weights. 60+ configurations, 50+ modèles, tokens/sec sourcés, consommation électrique, prix multi-régions, 150+ vidéos YouTube de reviewers. Modes bidirectionnels : « quel rig pour ce modèle/budget » ou « quels modèles sur mon GPU ». Données mises à jour hebdomadairement, repo GitHub public.

Open source Outils Benchmarks

SIG

HYP

Le Big Data·21 mai

Qwen3.7 Max : l’IA d’Alibaba écrase ses anciens scores sur les benchmarks IA

Qwen 3.7 Max d'Alibaba améliore ses performances de 4,8 points par rapport à Qwen 3.6 Max en preview sur les benchmarks IA.

Qwen Benchmarks

SIG

HYP

Hacker News (AI)·21 mai

Anthropic to open Milan office, expanding push into Europe

Anthropic ouvre un bureau à Milan pour renforcer sa présence en Europe. L'expansion marque l'engagement de l'entreprise sur le marché européen.

Anthropic Business

SIG

HYP

Hacker News (AI)·21 mai

Gemini randomly dumped its system prompt

Google Gemini a accidentellement divulgué son system prompt lors d'une interaction utilisateur. L'incident révèle les instructions internes du modèle et soulève des questions sur la sécurité des prompts système.

Gemini Sécurité IA Prompt engineering

SIG

HYP

Le Big Data·21 mai

L’IA, la donnée et le piège de la vitesse : quand l’efficacité néglige la fiabilité

Une étude de dbt Labs révèle que la course à la vitesse en IA sacrifie la fiabilité des données. Les organisations privilégient l'efficacité immédiate au détriment de la qualité et de la confiance dans les pipelines de données.

RAG Infrastructure Sécurité IA

SIG

HYP

Le Big Data·21 mai

Jensen Huang identifie un nouveau marché IA à 200 milliards $ pour Nvidia

Jensen Huang identifie un marché de 200 milliards $ pour l'IA agentique. Nvidia lance Vera, un processeur dédié aux agents IA, pour adresser ce segment.

Agents IA

SIG

HYP

Reddit r/LocalLLaMA·21 mai

I did what Microsoft wouldn't - updated POML VS Code extension

Un développeur a mis à jour l'extension VS Code POML abandonnée par Microsoft. POML est un langage de markup pour créer des templates de prompts modulaires avec support IA local. Microsoft a arrêté le support après 2-3 mois ; une mise à jour de dépendance a cassé la fonctionnalité d'envoi direct aux LLM. Le développeur a utilisé OpenCode pour corriger le bug et moderniser les dépendances.

Prompt engineering Outils Open source

SIG

HYP

Reddit r/LocalLLaMA·21 mai

Tencent Hy 30B/7B/1.8B

Tencent lance Hy-MT2, famille de modèles de traduction multilingue en trois tailles (1.8B, 7B, 30B-MoE) supportant 33 langues. Le modèle 1.8B compressé à 440 MB via quantization 1.25-bit surpasse les APIs commerciales Microsoft/Doubao. Les 7B et 30B dépassent DeepSeek-V4-Pro et Kimi K2.6. Benchmark IFMTBench et intégration WMT26 inclus.

Génération de code Benchmarks Open source

SIG

HYP

OpenAI Blog·21 mai

AdventHealth advances whole-person care with OpenAI

AdventHealth déploie ChatGPT for Healthcare pour optimiser les flux de travail cliniques, réduire la charge administrative et libérer du temps pour les soins aux patients.

OpenAI Business

SIG

HYP

Hacker News (AI)·21 mai

CPPL: A Circuit Prompt Programming Language

CPPL est un langage de programmation pour les prompts basé sur des circuits logiques. Il permet de structurer des instructions complexes via des opérateurs logiques et des flux de contrôle, offrant une alternative aux prompts textuels traditionnels.

Prompt engineering Outils

SIG

HYP

Le Big Data·21 mai

Nexos.ai : on a testé l’outil qui veut convaincre votre DSI que l’IA n’est pas une passoire

Nexos.ai propose un outil de sécurité IA destiné aux DSI pour limiter les risques liés à l'utilisation d'IA en entreprise. L'article teste la solution face aux enjeux de gouvernance et de contrôle des usages IA en 2026.

Sécurité IA Business Outils

SIG

HYP

Le Big Data·21 mai

Anthropic pourrait dépenser 1,25 milliard $ par mois sur l’infrastructure xAI

Anthropic pourrait dépenser jusqu'à 1,25 milliard de dollars par mois auprès de xAI pour l'infrastructure jusqu'en 2029. Ce contrat représente un engagement majeur d'Anthropic envers la plateforme d'Elon Musk.

Anthropic Infrastructure

SIG

HYP

Reddit r/LocalLLaMA·21 mai

110 tok/s with 12GB VRAM on Qwen3.6 35B A3B and ik_llama.cpp

ik_llama.cpp surpasse llama.cpp sur RTX 4070 Super 12GB : 110 tok/s en moyenne vs 90.6 tok/s avec Qwen3.6-35B-A3B-IQ4_XS. Meilleure optimisation CPU offloading et speculative decoding (MTP) après dégradation des performances post-merge dans llama.cpp.

Qwen Open source Infrastructure

SIG

HYP

GitHub Trending·21 mai

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> dotnet /</span> skills

Dépôt GitHub contenant des skills pour assister les agents IA de codage avec .NET et C#. Ressources pour intégrer des capacités de développement .NET dans les workflows d'agents autonomes.

Agents IA Génération de code Open source

SIG

HYP

GitHub Trending·21 mai

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> ryoppippi /</span> ccusage

ccusage est un outil CLI pour analyser l'utilisation des tokens et les coûts associés aux agents de codage à partir de données locales.

Agents IA Génération de code Outils

SIG

HYP

GitHub Trending·21 mai

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> kata-containers /</span> kata-containers

Kata Containers est un projet open source créant des machines virtuelles légères offrant l'expérience des conteneurs avec l'isolation et la sécurité des VMs.

Open source Infrastructure

SIG

HYP

GitHub Trending·21 mai

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> DataDog /</span> pup

Datadog lance Pup, un CLI companion pour agents IA offrant 200+ commandes couvrant 33+ produits Datadog.

Agents IA Outils Infrastructure

SIG

HYP

GitHub Trending·21 mai

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> google-gemini /</span> gemini-cli

Outil open-source intégrant Gemini directement dans le terminal. Agent IA permettant l'interaction avec le modèle Google via CLI.

Gemini Agents IA Outils

SIG

HYP

GitHub Trending·21 mai

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> ChromeDevTools /</span> chrome-devtools-mcp

Chrome DevTools MCP intègre les outils de développement Chrome dans une interface Model Context Protocol pour les agents de code. Permet aux agents d'inspecter, déboguer et interagir avec des pages web en temps réel.

Agents IA MCP Génération de code

SIG

HYP

GitHub Trending·21 mai

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> software-mansion /</span> argent

Argent est un toolkit agentic pour contrôler, déboguer et profiler les applications iOS et Android. Développé par Software Mansion.

Agents IA Outils Open source

SIG

HYP

GitHub Trending·21 mai

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> google-labs-code /</span> stitch-skills

Stitch-Skills est une bibliothèque de compétences d'agent compatible avec le serveur MCP Stitch. Les skills suivent le standard Agent Skills ouvert, compatibles avec Claude Code, Gemini CLI, Cursor et Antigravity.

Agents IA MCP Claude Code

SIG

HYP

GitHub Trending·21 mai

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> google /</span> adk-samples

Google publie adk-samples, une collection d'agents exemple construits avec l'Agent Development Kit (ADK). Dépôt open-source pour explorer les capacités de développement d'agents.

Agents IA DeepMind Open source

SIG

HYP

GitHub Trending·21 mai

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> antoinezambelli /</span> forge

Forge est un framework Python pour l'exécution auto-hébergée d'appels d'outils LLM et de workflows multi-étapes agentic. Disponible en open-source sur GitHub.

Agents IA Multi-agents Open source

SIG

HYP

GitHub Trending·21 mai

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> teng-lin /</span> notebooklm-py

API Python non-officielle pour Google NotebookLM offrant accès programmatique complet aux fonctionnalités, y compris celles non exposées en UI web. Support CLI et intégration avec agents IA (Claude Code, Codex, OpenClaw).

DeepMind Agents IA Génération de code

SIG

HYP

GitHub Trending·21 mai

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> aiming-lab /</span> AutoResearchClaw

AutoResearchClaw automatise la recherche de bout en bout : génération d'idées, expériences, rédaction et publication de papiers sans intervention humaine. Système autonome et auto-évolutif basé sur des agents IA.

Agents IA Multi-agents Papers

SIG

HYP

GitHub Trending·21 mai

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> openai /</span> whisper

OpenAI Whisper est un modèle de reconnaissance vocale entraîné sur 680 000 heures de données multilingues faiblement supervisées. Le repo GitHub contient le code, les modèles pré-entraînés et les benchmarks de performance sur plusieurs langues et conditions acoustiques.

OpenAI Voix Open source

SIG

HYP

Reddit r/LocalLLaMA·21 mai

'Am I OpenAI compatible' - a tool and documentation for unified api signatures in open source AI.

Outil et documentation pour vérifier la compatibilité OpenAI des projets open-source (vLLM, llama.cpp, etc.). Documente les signatures officielles et non-officielles, avec extensions pour d'autres types de modèles. Utile pour intégrer des endpoints LLM dans des applications ou créer des proxies/middleware.

Open source Outils Infrastructure

SIG

HYP

Hacker News (AI)·21 mai

Google officially announces that ads will be included in AI Mode search results

Google annonce l'intégration officielle de publicités dans les résultats de recherche AI Mode. Cette monétisation des réponses génératives marque un tournant stratégique pour le géant de la tech face à la concurrence des chatbots.

DeepMind Business

SIG

HYP

Le Big Data·21 mai

Free, Orange et EDF s’allient pour créer une AI Gigafactory en France

Free, Orange, EDF et acteurs majeurs du numérique français s'allient pour construire une AI Gigafactory en France. Initiative visant à développer capacités de calcul et infrastructure IA domestique.

Infrastructure Business

SIG

HYP

Vercel AI Blog·21 mai

Pull anomaly alert details using the Vercel CLI

Vercel ajoute l'accès aux alertes d'anomalies via CLI avec la commande `vercel alerts`. L'option `--ai` affiche les résultats d'investigation IA pour chaque alerte. Disponible sur Observability Plus.

Outils Agents IA Infrastructure

SIG

HYP

Hacker News (AI)·21 mai

The famous O3 "GeoGuessr" prompt did not work

Le prompt GeoGuessr réputé pour O3 ne fonctionne pas comme annoncé. Les tests montrent que la technique virale ne produit pas les résultats attendus sur le modèle OpenAI.

OpenAI Prompt engineering Évaluations

SIG

HYP

Reddit r/LocalLLaMA·21 mai

One Night Werewolf played by LLMs

Un utilisateur a développé une UI personnalisée pour jouer à One Night Werewolf avec des LLMs (Gemma 31B/26B, Qwen 3.6 36B, modèle 27B). Les modèles avaient initialement du mal à accepter les changements d'identité ; l'ajout d'une orientation vers les objectifs a amélioré les performances. Un script runner compatible avec l'API OpenAI permet désormais de jouer sans capacités de tool calls.

Agents IA Prompt engineering Open source

SIG

HYP

Reddit r/LocalLLaMA·21 mai

AMD Powers Next-Generation Agent Computers with New Ryzen AI Halo Developer Platform and Ryzen AI Max PRO 400 Series Processors

AMD lance la plateforme Ryzen AI Halo Developer et les processeurs Ryzen AI Max PRO 400 Series pour les ordinateurs agents nouvelle génération. Annonce officielle détaillant la disponibilité du Halo Box et de la série AI 400.

Agents IA Infrastructure

SIG

HYP

Le Big Data·21 mai

Mistral AI se renforce dans l’industrie européenne avec le rachat de Emmi AI

Mistral AI acquiert la startup autrichienne Emmi AI pour renforcer sa présence dans l'industrie européenne. Cette acquisition accélère la stratégie d'expansion du groupe français sur le marché continental.

Mistral Business

SIG

HYP

Latent Space·21 mai

[AINews] OpenAI GPT-next disproves 80 year old Erdős planar unit distance problem for under $1000

OpenAI GPT-next a résolu le problème planar unit distance d'Erdős, ouvert depuis 80 ans, pour moins de 1000 dollars. Résultat significatif à l'intersection IA et mathématiques.

GPT OpenAI Raisonnement

SIG

HYP

Le Big Data·21 mai

Universal Cart : Comment Google compte enfin court-circuiter Amazon

Google lance Universal Cart, une expérience d'achat intégrée alimentée par Gemini, pour concurrencer Amazon. La plateforme unifie le shopping across Google's services.

Gemini Business

SIG

HYP

Vercel AI Blog·21 mai

Qwen 3.7 Max now available on Vercel AI Gateway

Qwen 3.7 Max d'Alibaba est désormais disponible sur Vercel AI Gateway. Le modèle, conçu comme fondation d'agent, excelle en prototypage frontend, ingénierie multi-fichiers et automatisation de workflows bureautiques via orchestration multi-agent.

Qwen Agents IA Multi-agents

SIG

HYP

Reddit r/LocalLLaMA·21 mai

Model Golf for some Runpod Credits!

CompactAI-O lance un concours mensuel « Model Golf » pour modèles de moins de 100M paramètres. Le gagnant reçoit 50$ de crédits RunPod chaque mois. Compétition ouverte aux développeurs.

Open source Outils Benchmarks

SIG

HYP

Le Big Data·21 mai

Ask YouTube et Ask Maps : La fin de la recherche par mots-clés est-elle actée ?

Google lance Ask YouTube et Ask Maps, des outils de recherche conversationnelle basés sur l'IA. Ces fonctionnalités remplacent progressivement la recherche par mots-clés traditionnelle avec des réponses générées par IA.

DeepMind Agents IA

SIG

HYP

Reddit r/MachineLearning·21 mai

High E2E latency on fine-tuned Gemma 4 26B despite low TTFT [R]

Utilisateur rapporte une latence E2E élevée (3-5s) sur Gemma 4 26B fine-tuné malgré TTFT faible (100-300ms) sur H100 avec vLLM et quantization FP8. Cherche optimisations : speculative decoding (EAGLE/Medusa), draft models, ou investigation des goulots.

Gemini Fine-tuning Infrastructure

SIG

HYP

Reddit r/LocalLLaMA·21 mai

Qwen3.6 27B and llama.cpp appreciation post

Utilisateur apprécie Qwen3.6 27B quantifié en Q5_K_XL sur llama.cpp avec deux RX 9070 XT. Le modèle excelle en débogage de code complexe (services backend distribués), maintenant 398 tokens/s en prompt eval et 46.9 tokens/s en génération. Capacités agentiques remarquables malgré la quantification basse.

Qwen Génération de code Agents IA

SIG

HYP

Reddit r/LocalLLaMA·21 mai

Same task in github-copilot, pi, claude-code, and opencode with Qwen3.6 27B

Comparaison empirique de quatre harnesses d'agents de code (GitHub Copilot, Pi, Claude Code, OpenCode) avec Qwen 3.6 27B sur les mêmes tâches. Qwen excelle avec Claude Code et OpenCode (4 requêtes pour créer pelican.svg), mais échoue avec GitHub Copilot (13 requêtes). OpenCode offre recherche internet et génération de widgets interactifs.

Génération de code Agents IA Qwen

SIG

HYP

Le Big Data·21 mai

IA et performance : le verdict de l’indice mondial Fivetran

Fivetran publie un indice mondial montrant que malgré des budgets massifs (dizaines de millions d'euros), la mise en production de l'IA agentique rencontre des obstacles significatifs de performance.

Agents IA Benchmarks Business

SIG

HYP

Le Big Data·21 mai

LinkedIn : fin des posts qui puent l’IA, le grand ménage a commencé

LinkedIn combat les posts générés par IA en détectant et réduisant leur visibilité. La plateforme renforce ses filtres pour limiter le contenu auto-généré et les phrases motivantes artificielles.

Sécurité IA Régulation

SIG

HYP

Reddit r/LocalLLaMA·21 mai

Training a vision model from scratch on iPod touch 4 images

Un utilisateur entraîne un modèle DCGAN from scratch sur 350 images d'un gobelet rouge Solo prises avec un iPod touch 4, en variant les conditions d'éclairage et arrière-plans. L'objectif : capturer les artefacts spécifiques du capteur de l'appareil. Les résultats rappellent DALL-E 2022.

Génération d'images Open source

SIG

HYP

Reddit r/MachineLearning·21 mai

Masked Diffusion Language Models are Strong and Steerable Text-Based World Models for Agentic RL [R]

Les modèles de diffusion masqués (MDLMs) surpassent les LLMs autorégressifs comme modèles du monde pour l'RL agentic. Fine-tuning sur SDAR-8B et WeDLM-8B montre +4x sur BLEU-1/ROUGE-L/MAUVE. GRPO training atteint +15% de succès sur ScienceWorld, ALFWorld, AppWorld avec Qwen3, Mistral, LFM2.5 en zéro-shot.

Agents IA Reinforcement learning Raisonnement

SIG

HYP

arXiv cs.LG·21 mai

Conformal Selective Acting: Anytime-Valid Risk Control for RLVR-Trained LLMs

CSA (Conformal Selective Acting) est un wrapper de déploiement pour LLMs fine-tunés en RLVR qui garantit un contrôle du risque par round sans pooling entre déploiements. Testé sur 480 streams spécialisés et 10,300 rounds en Expert-Iteration avec LoRA, CSA maintient une e-process de Ville par seuil et atteint une borne de risque sélectif R_T^act ≤ α+O(N_T^{-1/2}) avec validité pathwise anytime.

Reinforcement learning Sécurité IA Évaluations

SIG

HYP

mai 2026

SAP taps Mistral AI to help customers migrate legacy software

Heretic has been served a legal notice by Meta, Inc.

Honesty in a small model drops from 35% to 0% by changing the tone of the prompt. Sharing the findings.

LlamaStation v0.9 — llama.cpp GUI for Windows with multi-backend support, TurboQuant, MTP and more

LLM planner - pick a rig for your use-case/model/budget, or pick models for your rig. 60+ builds, 50+ models, 130+ cited t/s sources, 150+ reviewer YouTube videos, idle+active watts, multi-region prices, regular updates.

Qwen3.7 Max : l’IA d’Alibaba écrase ses anciens scores sur les benchmarks IA

Anthropic to open Milan office, expanding push into Europe

Gemini randomly dumped its system prompt

L’IA, la donnée et le piège de la vitesse : quand l’efficacité néglige la fiabilité

Jensen Huang identifie un nouveau marché IA à 200 milliards $ pour Nvidia

I did what Microsoft wouldn't - updated POML VS Code extension

Tencent Hy 30B/7B/1.8B

AdventHealth advances whole-person care with OpenAI

CPPL: A Circuit Prompt Programming Language

Nexos.ai : on a testé l’outil qui veut convaincre votre DSI que l’IA n’est pas une passoire

Anthropic pourrait dépenser 1,25 milliard $ par mois sur l’infrastructure xAI

110 tok/s with 12GB VRAM on Qwen3.6 35B A3B and ik_llama.cpp

'Am I OpenAI compatible' - a tool and documentation for unified api signatures in open source AI.

Google officially announces that ads will be included in AI Mode search results

Free, Orange et EDF s’allient pour créer une AI Gigafactory en France

Pull anomaly alert details using the Vercel CLI

The famous O3 "GeoGuessr" prompt did not work

One Night Werewolf played by LLMs

AMD Powers Next-Generation Agent Computers with New Ryzen AI Halo Developer Platform and Ryzen AI Max PRO 400 Series Processors

Mistral AI se renforce dans l’industrie européenne avec le rachat de Emmi AI

[AINews] OpenAI GPT-next disproves 80 year old Erdős planar unit distance problem for under $1000

Universal Cart : Comment Google compte enfin court-circuiter Amazon

Qwen 3.7 Max now available on Vercel AI Gateway

Model Golf for some Runpod Credits!

Ask YouTube et Ask Maps : La fin de la recherche par mots-clés est-elle actée ?

High E2E latency on fine-tuned Gemma 4 26B despite low TTFT [R]

Qwen3.6 27B and llama.cpp appreciation post

Same task in github-copilot, pi, claude-code, and opencode with Qwen3.6 27B

IA et performance : le verdict de l’indice mondial Fivetran

LinkedIn : fin des posts qui puent l’IA, le grand ménage a commencé

Training a vision model from scratch on iPod touch 4 images

Masked Diffusion Language Models are Strong and Steerable Text-Based World Models for Agentic RL [R]

Conformal Selective Acting: Anytime-Valid Risk Control for RLVR-Trained LLMs

Long-Context Reasoning Through Proxy-Based Chain-of-Thought Tuning

Shiny Stories, Hidden Struggles: Investigating the Representation of Disability Through the Lens of LLMs

Pseudo-Siamese Network for Planning in Target-Oriented Proactive Dialogues

Refining and Reusing Annotation Guidelines for LLM Annotation

Mix-Quant: Quantized Prefilling, Precise Decoding for Agentic LLMs

Do as I Say, Not as I Do: Instruction-Induction Conflict in LLMs

Puzzled By ChatGPT? No more! A Jigsaw Puzzle to Promote AI Literacy and Awareness

SCRIBE: Diagnostic Evaluation and Rich Transcription Models for Indic ASR

Mechanics of Bias and Reasoning: Interpreting the Impact of Chain-of-Thought Prompting on Gender Bias in LLMs

When Irregularity Helps: A Subclass Analysis of Inductive Bias in Neural Morphology

Direct Translation between Sign Languages

HRM-Text: Efficient Pretraining Beyond Scaling

Retrieval-Augmented Long-Context Translation for Cultural Image Captioning: Gators submission for AmericasNLP 2026 shared task

On the limits and opportunities of AI reviewers: Reviewing the reviews of Nature-family papers with 45 expert scientists

DIVE: Embedding Compression via Self-Limiting Gradient Updates

Distributional Alignment as a Criterion for Designing Task Vectors in In-Context Learning

The Illusion of Intervention: Your LLM-Simulated Experiment is an Observational Study

Assessing socio-economic climate impacts from text data

Generative Recursive Reasoning

Neural Estimation of Pairwise Mutual Information in Masked Discrete Sequence Models

Geometry-Lite: Interpretable Safety Probing via Layer-Wise Margin Geometry

GROW: Aligning GRPO with State-Action Modeling for Open-World VLM Agents

Graph Transductive Sharpening: Leveraging Unlabeled Predictions in Node Classification

Physics-informed convolutional neural networks for fluid flow through porous media

Instance Discrimination for Link Prediction

Chronicle: A Multimodal Foundation Model for Joint Language and Time Series Understanding

Smaller Abstract State Spaces Enable Cross-Scale Generalization in Reinforcement Learning

OmniISR: A Unified Framework for Centralized and Federated Learning via Intermediate Supervision and Regularization

Plug-and-Play Spiking Operators: Breaking the Nonlinearity Bottleneck in Spiking Transformers

Closed-form predictive coding via hierarchical Gaussian filters

Less Data, Faster Training: repeating smaller datasets speeds up learning via sampling biases

Leveraging Large Language Models for Sentiment Analysis: Multi-Modal Analysis of Decentraland's MANA Token

Improving Quantized Model Performance in Qualitative Analysis with Multi-Pass Prompt Verification

Parallel LLM Reasoning for Bias-Resilient, Robust Conceptual Abstraction

Data Scaling as Progressive Coverage of a Predictive Contribution Spectrum

MedicalBench: Evaluating Large Language Models Toward Improved Medical Concept Extraction

FlowLM: Few-Step Language Modeling via Diffusion-to-Flow Adaptation

Synchronization and Turn-Taking in Full-Duplex Speech Dialogue Models

When Reasoning Supervision Hurts: TTCW-Based Long-Form Literary Review Generation

DEL: Digit Entropy Loss for Numerical Learning of Large Language Models

Stage-Audit: Auditable Source-Frontier Discovery for Cross-Wiki Tables