mai 2026

3149 articles

How small can the orchestration model in an agent be? (separating it from code-gen — that obviously wants a big model)

Un développeur teste la taille minimale d'un modèle pour orchestrer une boucle ReAct locale. Qwen3.6-35B-A3B (MoE, ~3B actifs) est son seuil : en dessous, le modèle invente des paramètres d'outils ou généralise mal les appels. Il améliore la précision en exposant les signatures exactes dans le prompt système.

Agents IA Qwen Prompt engineering

SIG

HYP

Reddit r/LocalLLaMA·22 mai

BeeLlama v0.2.0 – major DFlash update. Single RTX 3090: Qwen 3.6 27B up to 164 tps (4.40x), Gemma 4 31B up to 177.8 tps (4.93x). Prompt processing speed near baseline.

BeeLlama v0.2.0 améliore significativement les performances avec DFlash. Sur RTX 3090 : Qwen 3.6 27B atteint 164 tps (4.40x speedup), Gemma 4 31B 177.8 tps (4.93x). Support complet Gemma 4 31B, réduction overhead DFlash, meilleure gestion prefill et validation draft/target.

Qwen Open source Génération de code

SIG

HYP

Hacker News (AI)·22 mai

Microsoft Drops Claude Code After Budget Overrun

Microsoft abandonne Claude Code suite à un dépassement budgétaire. Le service, intégré à Copilot, n'a pas atteint les objectifs de rentabilité fixés par l'entreprise.

Claude Génération de code Business

SIG

HYP

The Decoder·22 mai

Deepseek reportedly prioritizes AGI research over quick profits despite billions in funding

DeepSeek lève environ 10 milliards de dollars, valorisant la startup chinoise à 45 milliards. Le fondateur Liang Wenfeng déclare aux investisseurs que la recherche AGI prime sur les profits à court terme.

DeepSeek Financements Raisonnement

SIG

HYP

The Decoder·22 mai

OpenAI Appshots turn any Mac window into context for Codex

OpenAI lance Appshots, une fonctionnalité macOS permettant d'envoyer le contenu de n'importe quelle fenêtre d'application à Codex en un clic. Codex reçoit ainsi le contexte nécessaire pour accomplir des tâches de programmation.

OpenAI Génération de code Outils

SIG

HYP

Reddit r/LocalLLaMA·22 mai

trained a prompt injection detector using ml-intern and DeepSeek v4 Flash, runs in the browser

Entraînement d'un détecteur d'injection de prompt avec ml-intern et DeepSeek v4 Flash. DistilBERT atteint F1 99%, compressé en ONNX int8 (~65 MB), exécutable en navigateur via Transformers.js v3. Coût total <$5 via API DeepSeek.

DeepSeek Agents IA Sécurité IA

SIG

HYP

Le Big Data·22 mai

Meta lance Forum, son nouveau Reddit avec, évidemment, une couche d’IA

Meta lance Forum, une application de discussions communautaires rivale de Reddit, intégrant des réponses générées par IA pour revitaliser les groupes Facebook.

Meta AI Outils

SIG

HYP

Reddit r/LocalLLaMA·22 mai

ByteShape Qwen3.6-35B-A3B: 30% faster than Unsloth IQ on 6GB VRAM laptop

ByteShape propose une quantification CPU-5 pour Qwen3.6-35B-A3B offrant 30% plus rapide en génération de texte que Unsloth UD-IQ4_XS sur GPU laptop 6GB VRAM, avec légère perte en vitesse de pré-remplissage. Test sur RTX 3060 avec contexte 65536 tokens.

Qwen Open source Outils

SIG

HYP

Reddit r/LocalLLaMA·22 mai

Experts first llama.cpp

Fork expérimental de llama.cpp optimisant les MoE pour GPU 12GB VRAM. L'auteur charge sélectivement les experts en VRAM plutôt que des couches complètes, atteignant 26 tk/s sur RTX 2060 (vs 19 tk/s standard) avec taux de hit de 62%. Cherche testeurs sur 3060/4060.

Llama Open source Infrastructure

SIG

HYP

Reddit r/LocalLLaMA·22 mai

I ran a quantization shootout on Qwen3-Coder and the results are... interesting

Benchmark de quantization sur Qwen3-Coder-Next avec 3× R9700 PRO. UD-Q5_K_M surpasse MXFP4_MOE sur tous les métriques qualité (94% vs 89.4% top-1 accuracy, KL divergence 0.0217 vs 0.0746) avec pénalité vitesse négligeable (~10% en decode). L'approche de précision dynamique d'Unsloth réduit exponentiellement les erreurs cumulatives sur sorties longues.

Qwen Génération de code Fine-tuning

SIG

HYP

Reddit r/LocalLLaMA·22 mai

Qwen-27B-IQ4_KS for ik_llama.cpp, especially for NVIDIA with 16GB VRAM

Nouvelle quantization Qwen-27B-IQ4_KS optimisée pour GPU NVIDIA 16GB via ik_llama.cpp. Modèle de 14.1GB offrant performances comparables à IQ4_XS précédent, 1.5-1.75x plus rapide, fenêtre contexte 105k tokens. Tests: Needle In Haystack 100k réussi, perplexité 71.10.

Qwen Open source Outils

SIG

HYP

Hugging Face Blog·22 mai

Specialization Beats Scale: A Strategic Variable Most AI Procurement Decisions Overlook

Hugging Face argue que la spécialisation des modèles IA surpasse l'échelle brute dans les décisions d'achat. Les organisations privilégient souvent les grands modèles généralistes, ignorant que des modèles spécialisés plus petits offrent meilleure performance et coûts réduits pour des tâches spécifiques.

Open source Business Benchmarks

SIG

HYP

Reddit r/LocalLLaMA·22 mai

Some tests with qwen3.6 27b + 35b a3b about MTP vs ngram-mod

Utilisateur teste Qwen 3.6 27B et 35B avec différentes techniques d'optimisation (MTP vs ngram-mod). Résultat : MTP dégrade les performances sur sa tâche de génération de code React, tandis que ngram-mod maintient la qualité. Configuration : Qwen 27B Q6_K + Qwen 35B Q8 sur dual GPU 16GB+12GB.

Qwen Génération de code Benchmarks

SIG

HYP

Reddit r/LocalLLaMA·22 mai

Open source: cloned Rocky's voice from Project Hail Mary in two days, full pipeline + 2:10 of training audio + trained RVC v2 model

Clonage de la voix de Rocky (Project Hail Mary) en deux jours via pipeline open-source. Extraction audio (ffmpeg + demucs), transcription (Whisper), diarization (pyannote), puis entraînement RVC v2 sur 2:10 min audio. Modèle .pth (55MB) et code publics. Comparaison XTTS v2 / YourTTS / RVC v2 / OpenVoice v2.

Voix Open source Génération de code

SIG

HYP

The Decoder·22 mai

OpenAI burned through $1.22 per dollar earned even after stripping out stock-based compensation

OpenAI a généré 5,7 milliards de dollars de revenus au Q1 2026 mais a perdu 1,22 dollar par dollar gagné, avec une marge opérationnelle ajustée de -122%.

OpenAI Business

SIG

HYP

Reddit r/LocalLLaMA·22 mai

OpenBMB presents the model BitCPM-CANN 1.58 bit

OpenBMB présente BitCPM-CANN, un modèle quantifié à 1,58 bit. Tests en cours sur accélérateurs Huawei Ascend 910B.

Open source Benchmarks

SIG

HYP

The Decoder·22 mai

California governor signs first US executive order to protect workers from AI job loss

Le gouverneur de Californie a signé le premier décret exécutif d'un gouverneur américain visant à protéger les travailleurs contre les pertes d'emploi liées à l'IA.

Régulation

SIG

HYP

Reddit r/LocalLLaMA·22 mai

[llama.cpp] Asymmetric KV q8/q4 cache: current caveats and discussion in GGML repo

llama.cpp supporte les caches KV asymétriques (q8/q4) mais génère actuellement du traitement CPU au lieu de GPU avec CUDA pour certaines combinaisons. Une évaluation utilisateur montre que q8_0/q4_0 coûte seulement 1,3% de précision tout en réduisant la mémoire de plus de 50% vs f16/f16.

Llama Open source Infrastructure

SIG

HYP

Le Big Data·22 mai

Spotify et Universal Music Group préparent des remixes IA officiels

Spotify et Universal Music Group officialisent les remixes et reprises générés par IA sur leurs plateformes de streaming musical.

Business Outils

SIG

HYP

Hacker News (AI)·22 mai

Valve removes free game from Steam after players discover it contains malware

Valve a retiré un jeu gratuit de Steam après la découverte de malware par les joueurs. L'incident soulève des questions sur les contrôles de sécurité de la plateforme.

Sécurité IA

SIG

HYP

Reddit r/LocalLLaMA·22 mai

[NEW] Supra-50M Released!

SupraLabs publie Supra-50M, un modèle de 50M paramètres entraîné sur 20B tokens de texte éducatif haute qualité. Architecture Llama-style avec vocab 32k. Surpasse GPT-2 (124M) et SmolLM-135M sur plusieurs benchmarks (BLiMP 76.3%, SciQ 77.2%, ARC-Easy 52.2%). Roadmap : Supra-124M et Supra-350M prévus.

Open source Benchmarks Génération de code

SIG

HYP

Le Big Data·22 mai

Microsoft et EY investissent 1 milliard de dollars pour accélérer l’industrialisation de l’IA

Microsoft et EY annoncent un investissement de 1 milliard de dollars sur 5 ans pour accélérer le déploiement industriel de l'IA en entreprise.

Business Infrastructure

SIG

HYP

The Decoder·22 mai

Trump pulls AI safety order after last-minute calls from Musk, Zuckerberg, and Sacks

Trump annule un décret sur la sécurité de l'IA après des appels de Musk, Zuckerberg et Sacks. L'ordre aurait créé un système d'examen volontaire pour les modèles frontière avec une fenêtre de 90 jours avant la publication.

Régulation Sécurité IA Business

SIG

HYP

Reddit r/LocalLLaMA·22 mai

DeepSeek is pushing forward with $10.29 billion financing round, with Liang Wenfeng committing to continue developing open-source AI models rather than pursuing short-term commercialization goals

DeepSeek lève 10,29 milliards de dollars. Liang Wenfeng s'engage à poursuivre le développement de modèles open-source plutôt que la commercialisation court-termiste. L'entreprise vise l'AGI.

DeepSeek Open source Financements

SIG

HYP

GitHub Trending·22 mai

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> Lum1104 /</span> Understand-Anything

Outil open-source convertissant du code en graphe de connaissances interactif explorable et interrogeable. Compatible Claude Code, Cursor, Copilot, Gemini CLI et autres éditeurs.

Génération de code Outils Open source

SIG

HYP

GitHub Trending·22 mai

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> can1357 /</span> oh-my-pi

Oh-my-pi est un agent IA de codage pour terminal avec édits ancrés par hash, intégration LSP, support Python et navigateur, ainsi que des sous-agents.

Agents IA Génération de code Outils

SIG

HYP

GitHub Trending·22 mai

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> github /</span> copilot-sdk

GitHub publie un SDK multi-plateforme pour intégrer l'agent Copilot dans des applications et services tiers. Permet aux développeurs d'accéder aux capacités d'IA de Copilot via API standardisée.

Agents IA Génération de code Outils

SIG

HYP

GitHub Trending·22 mai

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> raine /</span> workmux

Workmux combine les git worktrees et les fenêtres tmux pour faciliter le développement parallèle sans friction. Outil open-source permettant de gérer plusieurs branches de travail simultanément avec une intégration tmux native.

Outils Open source

SIG

HYP

GitHub Trending·22 mai

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> yamadashy /</span> repomix

Repomix est un outil qui compresse un dépôt entier en un fichier unique optimisé pour les LLM. Compatible avec Claude, ChatGPT, DeepSeek, Perplexity, Gemini et autres modèles d'IA.

Génération de code Outils Open source

SIG

HYP

GitHub Trending·22 mai

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> abhigyanpatwari /</span> GitNexus

GitNexus est un moteur d'intelligence de code côté client qui fonctionne entièrement dans le navigateur. Il crée un graphe de connaissances à partir d'un dépôt GitHub ou d'un fichier ZIP, avec un agent Graph RAG intégré pour l'exploration de code.

RAG Agents IA Génération de code

SIG

HYP

GitHub Trending·22 mai

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> MemTensor /</span> MemOS

MemOS est un système d'exploitation mémoire auto-évolutif pour LLM et agents IA. Offre mémoire ultra-persistante, récupération hybride et réutilisation de compétences cross-task avec 35,24% d'économies de tokens.

Agents IA RAG Open source

SIG

HYP

GitHub Trending·22 mai

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> anomalyco /</span> opencode

OpenCode est un agent de codage open-source disponible sur GitHub. Le projet propose une solution automatisée pour la génération et l'assistance au code.

Génération de code Agents IA Open source

SIG

HYP

GitHub Trending·22 mai

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> phodal /</span> routa

Routa est une plateforme de coordination multi-agent orientée workspace pour le développement IA. Elle intègre des Specs partagées, une orchestration Kanban, et supporte MCP/ACP/A2A sur web et desktop.

Multi-agents MCP Agents IA

SIG

HYP

GitHub Trending·22 mai

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> awslabs /</span> aidlc-workflows

AWS Labs publie aidlc-workflows, un framework de règles de steering adaptatif pour diriger les agents IA de codage. Le projet fournit des workflows basés sur des règles de cycle de vie piloté par l'IA pour améliorer la qualité et la fiabilité des agents de code.

Agents IA Génération de code Open source

SIG

HYP

GitHub Trending·22 mai

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> langchain-ai /</span> langchain

LangChain reste en tête des tendances GitHub. Plateforme d'ingénierie d'agents IA, elle facilite la construction d'applications avec LLM et orchestration multi-composants.

Agents IA Outils Open source

SIG

HYP

GitHub Trending·22 mai

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> google-research /</span> timesfm

TimesFM est un modèle fondation préentraîné développé par Google Research pour la prévision de séries temporelles. Le repo GitHub propose une implémentation open-source de ce modèle spécialisé.

DeepMind Open source Benchmarks

SIG

HYP

GitHub Trending·22 mai

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> Tracer-Cloud /</span> opensre

Tracer-Cloud/opensre est un toolkit open-source pour construire des agents IA SRE (Site Reliability Engineering). Permet l'automatisation des tâches d'infrastructure et de fiabilité via des agents intelligents.

Agents IA Open source Outils

SIG

HYP

GitHub Trending·22 mai

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> facebookresearch /</span> sam3

Meta publie le code et les checkpoints de SAM 3 (Segment Anything Model 3). Le repo inclut l'inférence, le fine-tuning et des notebooks d'exemple pour la segmentation d'images.

Meta AI Vision Open source

SIG

HYP

GitHub Trending·22 mai

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> microsoft /</span> agent-governance-toolkit

Microsoft publie un toolkit de gouvernance pour agents IA autonomes. Inclut application de politiques, identité zero-trust, sandboxing d'exécution et ingénierie de fiabilité. Couvre les 10/10 risques OWASP Agentic Top 10.

Agents IA Sécurité IA Outils

SIG

HYP

GitHub Trending·22 mai

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> plastic-labs /</span> honcho

Honcho est une bibliothèque mémoire pour construire des agents avec état. Elle permet de gérer la persistance et l'historique des interactions dans des systèmes multi-agents.

Agents IA Open source Outils

SIG

HYP

Reddit r/LocalLLaMA·22 mai

Quick note on sudden performance loss when running GGUFs

Utilisateur rapporte une perte de performance soudaine sur des GGUFs (Qwen3.5-35B et modèle Unsloth) : passage de 20+ tg/s à 5 tg/s. Cause identifiée : corruption de fichiers lors de modifications manuelles de couches MTP. Solution : vérifier l'intégrité sha256sum des modèles téléchargés.

Qwen Open source Outils

SIG

HYP

Hacker News (AI)·22 mai

Antigravity 2.0 Tops the OpenSCAD Architectural 3D LLM Benchmark

Antigravity 2.0 atteint le meilleur score du benchmark OpenSCAD Architectural 3D LLM, qui évalue la capacité des modèles à générer du code 3D pour l'architecture.

Benchmarks Génération de code

SIG

HYP

Reddit r/MachineLearning·22 mai

NuExtract3 released: open-weight 4B VLM for Markdown, OCR and structured extraction (self-hostable) [P]

Numind publie NuExtract3, un VLM open-weight de 4B paramètres basé sur Qwen3.5-4B sous licence Apache-2.0. Le modèle extrait des données structurées de documents complexes (PDFs, formulaires, tableaux, factures) en Markdown ou JSON. Entraîné 3 jours sur 8xH100, il supporte plusieurs quantizations (GPTQ, W8A8, FP8, Q4, Q6) et fonctionne avec 4GB VRAM minimum.

Vision Open source Génération de code

SIG

HYP

ActuIA·22 mai

France, 2e en maturité IA déclarée : 49% au stade pilote, 80% sans ROI mesuré

La France se classe 2e en maturité IA déclarée en Europe, mais 49% des projets restent au stade pilote et 80% n'ont pas de ROI mesuré. Écart révélateur entre adoption affichée et impact réel.

Benchmarks

SIG

HYP

Le Big Data·22 mai

Hark obtient 700 millions de dollars pour son projet d’assistant IA universel

Hark lève 700 millions de dollars pour développer un assistant IA universel, atteignant une valorisation de 6 milliards de dollars.

Agents IA

SIG

HYP

Reddit r/LocalLLaMA·22 mai

ztok — a fast multithreaded tokenizer in Zig that loads tiktoken / HF / SentencePiece and is 2–5× faster

ztok est une bibliothèque de tokenization multithreadée écrite en Zig, 2–5× plus rapide que tiktoken/HF/SentencePiece. Charge formats tiktoken, HF tokenizer.json, SentencePiece, TokenMonster, Mistral Tekken. Bit-identique aux implémentations de référence, 8 bindings de langages, optimisée pour RAG et tokenization dataset.

Outils RAG Open source

SIG

HYP

Le Big Data·22 mai

Spotify lance « Reserved » : l’appli va (enfin) vous choper des places aux concerts

Spotify lance « Reserved », une fonctionnalité de réservation de places de concert intégrée à l'application. Le système permet aux utilisateurs d'accéder directement à des billets depuis la plateforme musicale.

Business

SIG

HYP

Hacker News (AI)·22 mai

Moss: Self-Evolution Through Source-Level Rewriting in Autonomous Agent Systems

Moss est un système d'agent autonome capable d'auto-évolution via réécriture de code source. Le système modifie son propre code pour améliorer ses performances sans intervention externe.

Agents IA Génération de code Raisonnement

SIG

HYP

Reddit r/LocalLLaMA·22 mai

New Release of ROCm based MLX LLM Engine - lemon-mlx-engine

Lemon-mlx-engine intègre ROCm 7.13 pour exécuter des LLM localement sur GPU AMD. La mise à jour inclut des corrections de bugs et de kernels pour Qwen3, 3.5 et 3.6 MoE.

Open source Infrastructure Qwen

SIG

HYP

Le Big Data·22 mai

IA prédictive : Traquer l’invisible dans les flux de données pour devancer les cybercriminels

L'IA prédictive analyse les flux de données en temps réel pour détecter les anomalies comportementales et anticiper les attaques cybercriminelles avant qu'elles ne se produisent.

Sécurité IA Business

SIG

HYP

Reddit r/MachineLearning·22 mai

One thing that's been bothering me lately: benchmark performance often tells me almost nothing about whether a workflow will survive production usage.[D]

Discussion sur le fossé entre performances en benchmark et robustesse en production. Les systèmes performants échouent face à l'ambiguïté utilisateur, contextes réels complexes et instructions contradictoires. Appel à des méthodes d'évaluation au-delà des pipelines standards.

Évaluations Benchmarks

SIG

HYP

Latent Space·22 mai

[AINews] New AI Infra unicorns: Exa, Modal, TurboPuffer

Trois startups d'infrastructure IA atteignent le statut de licorne : Exa (recherche vectorielle), Modal (plateforme cloud) et TurboPuffer (cache distribué). Levées de fonds majeures confirmant la consolidation du marché de l'infra IA.

Infrastructure Financements Recherche vectorielle

SIG

HYP

Reddit r/LocalLLaMA·22 mai

Low-level coding dataset

Projet communautaire de dataset de codage pour fine-tuning de modèles LLM, axé sur C++ et programmation système. L'auteur envisage de fine-tuner Qwen 3.6-27b pour améliorer la compréhension de concepts comme la gestion mémoire, la thread-safety et l'optimisation. Dataset structuré en catégories JSONL : génération, optimisation, debugging, organisation, tool-calling.

Fine-tuning Qwen Génération de code

SIG

HYP

Hacker News (AI)·22 mai

CODA: Rewriting Transformer Blocks as GEMM-Epilogue Programs

CODA reformule les blocs transformer en programmes GEMM-Epilogue pour optimiser l'inférence. La technique fusionne les opérations matricielles et post-traitements en une seule primitive GPU, réduisant la latence et la bande passante mémoire.

Raisonnement Infrastructure Benchmarks

SIG

HYP

Simon Willison·22 mai

FTC to Require Cox Media Group, Two Other Firms to Pay Nearly $1 Million to Settle Charges They Deceived Customers About “Active Listening” AI-Powered Marketing Service

La FTC condamne Cox Media Group et deux autres entreprises à payer près d'1 million de dollars pour avoir trompé les clients sur un service marketing IA appelé « Active Listening ». Le service prétendait écouter les conversations via les appareils intelligents pour cibler les publicités, mais n'utilisait en réalité aucune donnée vocale.

Régulation Sécurité IA Business

SIG

HYP

Reddit r/MachineLearning·22 mai

Live Human Detector on Outbound Phone Calls [R]

Projet de détecteur ML pour identifier si un appel téléphonique a atteint un agent humain (vs file d'attente/RVA). Classification audio en fenêtre 1-2s sur flux G711a 8kHz. Défis : distinguer RVA professionnelle de voix humaine, silence de transition, répondeurs, TTS sophistiqué.

Génération de code Évaluations

SIG

HYP

mai 2026

How small can the orchestration model in an agent be? (separating it from code-gen — that obviously wants a big model)

BeeLlama v0.2.0 – major DFlash update. Single RTX 3090: Qwen 3.6 27B up to 164 tps (4.40x), Gemma 4 31B up to 177.8 tps (4.93x). Prompt processing speed near baseline.

Microsoft Drops Claude Code After Budget Overrun

Deepseek reportedly prioritizes AGI research over quick profits despite billions in funding

OpenAI Appshots turn any Mac window into context for Codex

trained a prompt injection detector using ml-intern and DeepSeek v4 Flash, runs in the browser

Meta lance Forum, son nouveau Reddit avec, évidemment, une couche d’IA

ByteShape Qwen3.6-35B-A3B: 30% faster than Unsloth IQ on 6GB VRAM laptop

Experts first llama.cpp

I ran a quantization shootout on Qwen3-Coder and the results are... interesting

Qwen-27B-IQ4_KS for ik_llama.cpp, especially for NVIDIA with 16GB VRAM

Specialization Beats Scale: A Strategic Variable Most AI Procurement Decisions Overlook

Some tests with qwen3.6 27b + 35b a3b about MTP vs ngram-mod

Open source: cloned Rocky's voice from Project Hail Mary in two days, full pipeline + 2:10 of training audio + trained RVC v2 model

OpenAI burned through $1.22 per dollar earned even after stripping out stock-based compensation

OpenBMB presents the model BitCPM-CANN 1.58 bit

California governor signs first US executive order to protect workers from AI job loss

[llama.cpp] Asymmetric KV q8/q4 cache: current caveats and discussion in GGML repo

Spotify et Universal Music Group préparent des remixes IA officiels

Valve removes free game from Steam after players discover it contains malware

[NEW] Supra-50M Released!

Microsoft et EY investissent 1 milliard de dollars pour accélérer l’industrialisation de l’IA

Trump pulls AI safety order after last-minute calls from Musk, Zuckerberg, and Sacks

DeepSeek is pushing forward with $10.29 billion financing round, with Liang Wenfeng committing to continue developing open-source AI models rather than pursuing short-term commercialization goals

Quick note on sudden performance loss when running GGUFs

Antigravity 2.0 Tops the OpenSCAD Architectural 3D LLM Benchmark

NuExtract3 released: open-weight 4B VLM for Markdown, OCR and structured extraction (self-hostable) [P]

France, 2e en maturité IA déclarée : 49% au stade pilote, 80% sans ROI mesuré

Hark obtient 700 millions de dollars pour son projet d’assistant IA universel

ztok — a fast multithreaded tokenizer in Zig that loads tiktoken / HF / SentencePiece and is 2–5× faster

Spotify lance « Reserved » : l’appli va (enfin) vous choper des places aux concerts

Moss: Self-Evolution Through Source-Level Rewriting in Autonomous Agent Systems

New Release of ROCm based MLX LLM Engine - lemon-mlx-engine

IA prédictive : Traquer l’invisible dans les flux de données pour devancer les cybercriminels

One thing that's been bothering me lately: benchmark performance often tells me almost nothing about whether a workflow will survive production usage.[D]

[AINews] New AI Infra unicorns: Exa, Modal, TurboPuffer

Low-level coding dataset

CODA: Rewriting Transformer Blocks as GEMM-Epilogue Programs

FTC to Require Cox Media Group, Two Other Firms to Pay Nearly $1 Million to Settle Charges They Deceived Customers About “Active Listening” AI-Powered Marketing Service

Live Human Detector on Outbound Phone Calls [R]

Unified Data Selection for LLM Reasoning

Evaluation of Chunking Strategies for Effective Text Embedding in Low-Resource Language on Agricultural Documents

A Comparative Study of Language Models for Khmer Retrieval-Augmented Question Answering

Ishigaki-IDS-Bench: A Benchmark for Generating Information Delivery Specification from BIM Information Requirements

FlyRoute: Self-Evolving Agent Profiling via Data Flywheel for Adaptive Task Routing

SpecHop: Continuous Speculation for Accelerating Multi-Hop Retrieval Agents

Hypergraph as Language

Residual Skill Optimization for Text-to-SQL Ensembles

Broadening Access to Transportation Safety Data with Generative AI: A Schema-Grounded Framework for Spatial Natural Language Queries

Harder to Defend: Towards Chinese Toxicity Attacks via Implicit Enhancement and Obfuscation Rewriting

Pseudo-Siamese Network for Planning in Target-Oriented Proactive Dialogues

Improving Quantized Model Performance in Qualitative Analysis with Multi-Pass Prompt Verification

Neural Estimation of Pairwise Mutual Information in Masked Discrete Sequence Models

AiraXiv: An AI-Driven Open-Access Platform for Human and AI Scientists

PALS: Power-Aware LLM Serving for Mixture-of-Experts Models

Insights Generator: Systematic Corpus-Level Trace Diagnostics for LLM Agents

AutoRPA: Efficient GUI Automation through LLM-Driven Code Synthesis from Interactions

Playing Devil's Advocate: Off-the-Shelf Persona Vectors Rival Targeted Steering for Sycophancy

VBFDD-Agent for Electric Vehicle Battery Fault Detection and Diagnosis: Descriptive Text Modeling of Battery Digital Signals

Evaluating Temporal Semantic Caching and Workflow Optimization in Agentic Plan-Execute Pipelines

Mahjax: A GPU-Accelerated Mahjong Simulator for Reinforcement Learning in JAX

AgentAtlas: Beyond Outcome Leaderboards for LLM Agents

$ECUAS_n$: A family of metrics for principled evaluation of uncertainty-augmented systems

AgentCo-op: Retrieval-Based Synthesis of Interoperable Multi-Agent Workflows

Tool-Augmented Agent for Closed-loop Optimization,Simulation,and Modeling Orchestration

Quantitative coronary calcification analysis for prediction of myocardial ischemia using non-contrast CT calcium scoring

Leveraging Self-Paced Curriculum Learning for Enhanced Modality Balance in Multimodal Conversational Emotion Recognition

TBP-mHC: full expressivity for manifold-constrained hyper connections through transportation polytopes

Embedding-Based Federated Learning with Runtime Governance for Iron Deficiency Prediction

Calibration, Uncertainty Communication, and Deployment Readiness in CKD Risk Prediction: A Framework Evaluation Study

TransitLM: A Large-Scale Dataset and Benchmark for Map-Free Transit Route Generation

IdioLink: Retrieving Meaning Beyond Words Across Idiomatic and Literal Expressions

Multi-Stage Training for Abusive Comment Detection in Indic Languages

Representation Gap: Explaining the Unreasonable Effectiveness of Neural Networks from a Geometric Perspective

Audience Engagement with Arabic Women's Social Empowerment and Wellbeing: A Decadal Corpus

GHI: Graphormer over Conditioned Hypergraph Incidence for Aspect-Based Sentiment Analysis

Pattern-and-root inflectional morphology: the Arabic broken plural

Cross-Lingual Consensus: Aligning Multilingual Cultural Knowledge via Multilingual Self-Consistency

Psy-Chronicle:A Structured Pipeline for Synthesizing Long-Horizon Campus Psychological Counseling Dialogues