mai 2026

3149 articles

Training GPT-like model on non-language series [R]

Chercheur entraîne des modèles Transformer-décodeur (100M–500M params) sur 750M tokens de séries non-linguistiques. Configuration : AdamW, lr=1e-3, batch=4M tokens, 16 couches. Le modèle échoue à apprendre l'auto-régression basique et génère répétitivement un seul token.

GPT Génération de code Benchmarks

SIG

HYP

Reddit r/MachineLearning·28 mai

Diffusion models for sketch-guided trajectory simulation [R]

Utilisation de modèles de diffusion pour simuler des trajectoires de basketball conditionnées par des esquisses partielles de mouvements. Le modèle affine conjointement les trajectoires de tous les joueurs, produisant des simulations plus naturelles qu'une génération autoregressive. Code et modèle open-sourcés.

Génération de vidéos Open source

SIG

HYP

Hacker News (AI)·28 mai

Zig 2026: No-AI Policy, $670K Foundation, Left GitHub and Why Zig Isn't 1.0 [video]

Zig annonce sa feuille de route 2026 avec une politique anti-IA, un financement de 670K$ pour sa fondation, et explique son départ de GitHub. La version 1.0 reste repoussée.

Open source

SIG

HYP

Reddit r/LocalLLaMA·28 mai

Gemma-4-Harmonia-31B-Uncensored-Heretic Is Out Now, a Merge of Multiple gemma-4-31B-it Finetunes Designed for a Targeted Approach to Deep Neural Consolidation, Minimizing Regression While Amplifying Unique Capability Boundaries. With KLD 0.0047 and 9/100 Refusals!

Gemma-4-Harmonia-31B-Uncensored-Heretic, fusion de plusieurs finetunes Gemma-4-31B, est disponible en Safetensors et GGUF. Le modèle affiche KLD 0.0047 et 9/100 refusals, utilisant une consolidation neuronale profonde pour minimiser la régression.

Gemini Fine-tuning Open source

SIG

HYP

Reddit r/LocalLLaMA·28 mai

GH200 NVL2 or 8x RTX 6000 Blackwell for running Kimi K2.6 / DeepSeek V4 locally? (5 devs, agentic coding)

Développeur cherche la meilleure infrastructure (~100-150k$) pour servir localement Kimi K2.6 et DeepSeek V4 en équipe de 5 (coding agentic). Compare dual GH200 NVL2 (1.2TB mémoire unifiée, 95k$) vs 8x RTX 6000 Blackwell (768GB VRAM, 140k$). Test GH200 seul : 23 tok/s en décodage 2-bit, mais préfill lent et modèles débordent en mémoire lente.

DeepSeek Kimi Agents IA

SIG

HYP

Hacker News (AI)·28 mai

Illinois Lawmakers Just Passed America's Strongest AI Safety Bill

L'Illinois a adopté le projet de loi le plus strict des États-Unis sur la sécurité de l'IA. Le texte impose des obligations de transparence et de responsabilité aux développeurs de modèles d'IA. Détails législatifs non fournis dans l'extrait.

Régulation Sécurité IA

SIG

HYP

OpenAI Blog·28 mai

MUFG aims to become AI-native with OpenAI

MUFG, le géant bancaire japonais, adopte ChatGPT Enterprise pour devenir une organisation native IA. L'objectif : optimiser les workflows internes et lancer des services financiers alimentés par l'IA à grande échelle.

OpenAI GPT Business

SIG

HYP

Vercel AI Blog·28 mai

Team-wide provider allowlist on AI Gateway

Vercel AI Gateway introduit une liste blanche de fournisseurs au niveau équipe. Les organisations peuvent restreindre les fournisseurs autorisés pour tous les requêtes, y compris BYOK. Le filtrage s'applique par fournisseur (pas par modèle) et fonctionne avec tous les formats API supportés.

Infrastructure Sécurité IA Régulation

SIG

HYP

Vercel AI Blog·28 mai

Amazon OpenSearch Serverless is now available in the Vercel Marketplace

Amazon OpenSearch Serverless intègre la Vercel Marketplace avec configuration automatique et gestion unifiée. L'intégration supporte recherche vectorielle, lexicale, hybride et agentic. Crédits AWS $100 offerts pour les nouveaux comptes.

Agents IA Recherche vectorielle Infrastructure

SIG

HYP

OpenAI Blog·28 mai

OpenAI’s Frontier Governance Framework

OpenAI publie son cadre de gouvernance pour les modèles frontière, alignant ses pratiques de sécurité, sûreté et gestion des risques avec les régulations émergentes de l'UE et Californie.

OpenAI Sécurité IA Régulation

SIG

HYP

Simon Willison·27 mai

sqlite AGENTS.md

SQLite a ajouté un fichier AGENTS.md refusant explicitement les contributions de code généré par IA, tout en acceptant les rapports de bugs avec cas de test reproductibles. Le projet a créé un forum dédié pour gérer l'afflux de rapports générés par IA.

Agents IA Open source

SIG

HYP

Reddit r/LocalLLaMA·27 mai

Running Gemma4 31b-it on vLLM 0.21.0 A100s (bad quality or what am I doing wrong)

Utilisateur rapporte une dégradation de qualité en exécutant Gemma 4 31B-it localement sur deux A100s avec vLLM 0.21.0 comparé à l'API Google. Même modèle, mêmes paramètres (tensor-parallel-size 2, max-model-len 65536, structured output), mais sorties JSON invalides en local versus parfaites via l'API.

Gemini Open source Infrastructure

SIG

HYP

Reddit r/MachineLearning·27 mai

BEAM 100K memory benchmark: CSM vs Hindsight local artifact comparison [R]

Benchmark local BEAM 100K comparant Context Swarm Memory (CSM) à Hindsight. CSM atteint 0.757573 AMB (342/400 correct) vs 0.733658 pour Hindsight (326/400), avec 38.2% moins de tokens contexte visibles. CSM plus lent : 29.23s vs 6.38s. Auteur cherche feedback sur méthodologie avant présentation officielle.

Agents IA RAG Évaluations

SIG

HYP

Reddit r/MachineLearning·27 mai

Cross-Platform Fused MoE Dispatch in Triton: Portable Expert Routing Without CUDA [R]

TritonMoE : kernel MoE en Triton pur pour inférence portable NVIDIA/AMD sans code vendor-spécifique. Gate+up GEMM fusionnés réduisent trafic mémoire de 35%. Atteint 89-131% du débit Megablocks (batch ≤512 tokens) sur A100, même kernel sur MI300X. Limitations : dégradation à 2048+ tokens et avec 64+ experts.

Benchmarks Open source

SIG

HYP

Hacker News (AI)·27 mai

Getting Claude to extract data from a 1997 football manager game

Un utilisateur a réussi à faire extraire des données par Claude depuis un jeu de gestion de football de 1997. Le projet démontre les capacités de vision et de traitement de contenu rétro du modèle.

Claude Vision

SIG

HYP

Reddit r/MachineLearning·27 mai

UK GDPR Small Business Q&A — 5,000 synthetic pairs with article-level citations [D]

Dataset de 5 000 paires QA synthétiques pour affiner des assistants de conformité GDPR UK. Chaque paire inclut une question pratique PME et une réponse avec références d'articles GDPR, guidance ICO et étapes actionnables. Généré via Qwen 14B et DeepSeek API. Licence MIT, échantillon 1K sur Hugging Face.

Fine-tuning RAG DeepSeek

SIG

HYP

Hacker News (AI)·27 mai

Show HN: Open-Source AI Racing Harness

Un harnais de course open-source pour tester et comparer les modèles IA. Permet d'évaluer les performances en conditions réelles avec benchmarks reproductibles.

Benchmarks Open source Évaluations

SIG

HYP

Reddit r/LocalLLaMA·27 mai

I built a 103B-token Usenet corpus (1980–2013) — pre-web, human-only, zero AI contamination. Got strong traction on r/ML, thought this community would find it useful.

Corpus Usenet complet (1980–2013) de 103,1B tokens publié pour fine-tuning local. Zéro contamination IA, 408M posts bruts pré-SEO, organisés par domaines (comp.*, sci.*, rec.*). Samples gratuits téléchargeables, corpus complet sous licence.

Fine-tuning Open source Benchmarks

SIG

HYP

Reddit r/MachineLearning·27 mai

I used the N.E.A.T algorithm to teach AI how to control a worm in my game in making! It uses evolution to improve. [P]

Développeur utilise l'algorithme N.E.A.T (NeuroEvolution of Augmenting Topologies) pour entraîner des IA contrôlant des vers dans un jeu en développement. Chaque ver possède un réseau de neurones unique évoluant par sélection naturelle, créant des comportements distincts.

Reinforcement learning Agents IA Outils

SIG

HYP

Hacker News (AI)·27 mai

YouTube to automatically label AI-generated videos

YouTube va automatiquement étiqueter les vidéos générées par IA. La plateforme utilise la détection d'IA pour identifier le contenu synthétique et afficher un label visible aux spectateurs, renforçant la transparence sur les contenus générés par machine.

Régulation Sécurité IA

SIG

HYP

GitHub Trending·27 mai

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> Chachamaru127 /</span> claude-code-harness

Claude Code Harness : framework d'automatisation pour Claude permettant un cycle autonome Plan→Work→Review. Implémente une boucle itérative de développement avec révision de code intégrée.

Claude Claude Code Génération de code

SIG

HYP

Hacker News (AI)·27 mai

I used autoresearch to improve my AGENTS.md, measured against real tasks

Un développeur a utilisé autoresearch pour améliorer sa documentation AGENTS.md et l'a validée contre des tâches réelles. Approche empirique de l'optimisation d'agents.

Agents IA Prompt engineering

SIG

HYP

Hacker News (AI)·27 mai

Rust (and Slint) on a Jailbroken Kindle

Un développeur a réussi à exécuter Rust et le framework UI Slint sur une Kindle jailbreakée. Le projet démontre la portabilité de Rust sur des appareils embarqués non conventionnels.

Open source Outils

SIG

HYP

Reddit r/LocalLLaMA·27 mai

Inferencing at 10.33 t/s on Qwen 3.5 35B on a $300 laptop

Inférence CPU à 10,33 tokens/s sur Qwen 3.5 35B quantifié Q4_K_M sur un laptop Lenovo Ideapad Slim 3i ($300, i3-1215U, 8GB RAM). Utilise llama.cpp avec optimisations BIOS, pinning de cores, speculative decoding MTP et quantization K/V cache Q8_0.

Qwen Génération de code Open source

SIG

HYP

Reddit r/MachineLearning·27 mai

"Unified Neural Scaling Laws" paper release [R]

Publication d'un paper sur les lois d'échelle unifiées en apprentissage profond. Étude des relations entre taille du modèle, données d'entraînement et performance. Résultats reproductibles et benchmarks inclus.

Papers Benchmarks

SIG

HYP

Reddit r/LocalLLaMA·27 mai

Qwen3.6 huge quality gain from Q4 to Q6 for coding agent

Qwen 3.6 montre une amélioration significative de qualité en passant de Q4 à Q6 pour les agents de codage locaux. Avec llama.cpp et MTP, l'utilisateur atteint 20-50 tokens/s sur dual 3090, rendant les agents de codage locaux viables face aux APIs payantes.

Qwen Génération de code Agents IA

SIG

HYP

The Decoder·27 mai

Microsoft's MAI-Image-2.5 pulls even with Google's Nano Banana 2 on benchmarks

Microsoft MAI-Image-2.5 atteint la 3e place du classement Arena text-to-image, au même niveau que Google Nano Banana 2, mais derrière OpenAI Image-2. Le modèle progresse nettement sur le rendu de texte dans les images et les visuels commerciaux.

Génération d'images Benchmarks

SIG

HYP

The Decoder·27 mai

AI coding agent Devin maker Cognition more than doubles its valuation to $26 billion in under nine months

Cognition, créateur de l'agent de codage IA Devin, lève plus de 1 milliard de dollars à une valorisation de 26 milliards. La levée de fonds reflète l'intérêt massif des investisseurs pour les agents de codage IA, malgré des débats sur leur valeur réelle.

Génération de code Agents IA Financements

SIG

HYP

Latent Space·27 mai

🔬ESMFold2: The Bitter Lesson is Coming for Proteins - Alex Rives, BioHub

ESMFold2 applique la leçon amère de Sutton aux protéines : les modèles de langage à grande échelle surpassent les approches basées sur l'inductive bias. Alex Rives (BioHub) discute de datasets massifs, world models et biologie programmable.

Benchmarks Papers Alignement

SIG

HYP

The Decoder·27 mai

Robinhood lets AI agents trade shares and make credit card purchases for customers

Robinhood permet aux clients de connecter des agents IA (notamment Claude d'Anthropic) à leurs comptes d'investissement via MCP pour trader automatiquement des actions. Le régulateur FINRA signale ce risque nouveau. Robinhood reconnaît que le produit n'est pas adapté à tous.

Claude Agents IA MCP

SIG

HYP

Reddit r/LocalLLaMA·27 mai

260K-param LLM running on an emulated 90s CPU inside an 18-year-old RTOS

Un développeur a fait tourner un LLM de 260K paramètres (llama2.c/stories260K) sur un émulateur JavaScript d'un CPU Motorola 68K des années 90, lui-même exécuté dans un RTOS de 2008. Quantification INT8 + lookup tables pour RoPE et inverse square root (Quake) pour contourner l'absence de FPU. Génération : 2-4 secondes/token.

Llama Génération de code Fine-tuning

SIG

HYP

Hacker News (AI)·27 mai

Multi-Agent LLM System for Automated Vulnerability Discovery and Reproduction

Système multi-agent basé sur LLM pour découvrir et reproduire automatiquement les vulnérabilités. Approche combinant plusieurs agents spécialisés pour l'analyse de sécurité.

Multi-agents Agents IA

SIG

HYP

Hugging Face Blog·27 mai

ITBench-AA: Frontier Models Score Below 50% on the First Benchmark for Agentic Enterprise IT Tasks — by Artificial Analysis and IBM

ITBench-AA, nouveau benchmark créé par Artificial Analysis et IBM, évalue les capacités des modèles frontier sur des tâches IT d'entreprise agentic. Les meilleurs modèles (Claude, GPT-4, Gemini) obtiennent moins de 50% de réussite, révélant des lacunes significatives dans l'automatisation des workflows IT complexes.

Benchmarks Agents IA Claude

SIG

HYP

Reddit r/LocalLLaMA·27 mai

Qwen3.6 35B-A3B successfully completed the FoodTruck Bench!

Qwen 3.6 35B-A3B a complété avec succès le benchmark FoodTruck Bench. Pas de détails supplémentaires fournis sur les résultats ou les performances.

Qwen Benchmarks

SIG

HYP

Reddit r/MachineLearning·27 mai

[R] What 1000+ Harness Experiments Taught Me About Self-Improving Agents [R]

Un chercheur a mené 1000+ expériences sur l'auto-amélioration d'agents IA via modification de harness pour résoudre des tâches. Les agents peuvent proposer des changements ponctuels significatifs, mais l'amélioration continue bute sur des problèmes d'architecture système : décider quelles améliorations peuvent se composer sans risque. Parallèles observés avec la personnalisation d'agents de code.

Agents IA Raisonnement Génération de code

SIG

HYP

The Decoder·27 mai

YouTube will try to automatically flag AI videos starting this month

YouTube déploie un système de détection automatique pour signaler les contenus générés ou fortement modifiés par l'IA à partir de mai 2026. Les labels seront affichés de manière plus visible : sous le lecteur pour les vidéos longues et en overlay sur les Shorts. Les recommandations et la monétisation ne seront pas affectées.

Régulation Génération de vidéos

SIG

HYP

Simon Willison·27 mai

I think Anthropic and OpenAI have found product-market fit

Anthropic et OpenAI auraient trouvé leur product-market fit. Anthropic approche sa première trimestre rentable. Des entreprises découvrent des factures LLM explosives dues à l'utilisation intensive par leurs équipes, notamment via Claude Code. Les plans $100/mois deviennent rentables pour les utilisateurs intensifs d'agents de code.

Anthropic Claude Code OpenAI

SIG

HYP

Reddit r/MachineLearning·27 mai

AI-generated CUDA kernels silently break training and inference [R]

NVIDIA a publié SOL-ExecBench (235 kernels CUDA de production). Des kernels générés par IA classés premiers se révèlent bugués en entraînement réel : un kernel de backward embedding+RMSNorm accumule en bf16 au lieu de fp32, causant une divergence de loss masquée par AdamW mais visible avec SGD.

Benchmarks Génération de code Sécurité IA

SIG

HYP

Hacker News (AI)·27 mai

DuckDuckGo search saw 28% more visits after Google said people love AI mode

DuckDuckGo a enregistré 28% de visites supplémentaires après que Google ait promu son mode IA. La déclaration de Google sur l'adoption de l'IA a apparemment incité les utilisateurs à explorer des alternatives de recherche.

DeepMind

SIG

HYP

Hacker News (AI)·27 mai

PostHog will train AI models with your data (opted-in by default)

PostHog activera par défaut l'entraînement de modèles IA sur les données utilisateur (opt-in). La plateforme d'analytics collecte des événements produit et propose d'utiliser ces données pour améliorer ses modèles d'IA, avec possibilité de désactiver.

Business Sécurité IA

SIG

HYP

Reddit r/LocalLLaMA·27 mai

ReAligned-Qwen3.5 Release

Lazarus AI et Eric Hartford (créateur de Dolphin) publient ReAligned-Qwen3.5, une série de modèles Qwen finetunés pour réduire les biais idéologiques chinois et la censure. Licence Apache 2.0, entraînement SFT + GRPO avec classifier ReAligned. Disponibles en 0.8B à 35B, formats BF16/FP8/GGUF sur HuggingFace.

Qwen Fine-tuning Reinforcement learning

SIG

HYP

Reddit r/LocalLLaMA·27 mai

KV cache quant benchmarks: q5 & q6 are underrated, q8/q4 is bad, TCQ has a niche

Benchmark complet de 38 paires de quantifications KV sur Qwen 3.6 27B avec contexte 64k-128k. Q5_0 et Q5_1 sous-estimés, Q8_0/Q4_* surestimés. Recommandation : Q8_0/Q6_0 ou Q8_0/Q5_1 haute performance, Q6_0/Q5_0 équilibre, Q5_0/Q5_0 VRAM limité.

Qwen Benchmarks Fine-tuning

SIG

HYP

Hacker News (AI)·27 mai

An Update on Composer and Packagist Supply Chain Security

Mise à jour de sécurité pour Composer et Packagist concernant la chaîne d'approvisionnement PHP. Annonce officielle sur les mesures de protection contre les attaques de dépendances.

Infrastructure Sécurité IA

SIG

HYP

Le Big Data·27 mai

Vidéos IA : YouTube va enfin arrêter de les cacher avec des labels bien visibles

YouTube impose des labels visibles pour identifier les vidéos générées par IA. Cette mesure vise à améliorer la transparence et aider les utilisateurs à distinguer le contenu authentique du contenu synthétique.

Génération de vidéos Régulation Sécurité IA

SIG

HYP

GitHub Trending·27 mai

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> harry0703 /</span> MoneyPrinterTurbo

MoneyPrinterTurbo : outil open-source générant des vidéos courtes haute définition en un clic via modèles IA. Automatise la création de contenu vidéo.

Génération de vidéos Open source Outils

SIG

HYP

GitHub Trending·27 mai

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> harry0703 /</span> MoneyPrinterTurbo

MoneyPrinterTurbo : outil open-source générant des vidéos courtes HD en un clic via modèles IA. Automatise la création de contenu vidéo.

Génération de vidéos Open source Outils

SIG

HYP

Reddit r/LocalLLaMA·27 mai

Hugging Face Dataset Lineage Explorer

Un chercheur de Hugging Face a utilisé Claude Code pour analyser les relations entre datasets sur la plateforme. L'étude révèle que les datasets de style Alpaca ont des centaines de dérivés, avec prolifération de variantes « nettoyées » et nombreuses traductions. Un Space interactif permet d'explorer ces lignées.

Claude Code Outils Open source

SIG

HYP

Reddit r/MachineLearning·27 mai

Physics Informed Neural Networks for damped harmonic oscillator and Burger's Equation (with extrapolation analysis) [P]

Implémentation PINN en Python pour résoudre l'oscillateur harmonique amorti (ODE 2e ordre) et l'équation de Burgers 1D (PDE non-linéaire). Inclut problèmes directs et inverses, comparaison avec baselines non-physiques, analyse d'extrapolation et évaluation statistique de l'estimation de paramètres.

Papers Benchmarks Open source

SIG

HYP

Reddit r/LocalLLaMA·27 mai

Q4_K_M is fine for chat and a trap for agents. Here is math mathing.

Q4_K_M quantization convient au chat mais pose problème pour les agents autonomes. À 3% d'erreurs par appel, une boucle de 30 étapes atteint 40% de succès (vs 91% en Q6). Les erreurs silencieuses (format valide, contenu incorrect) se propagent en aval sans détection inline.

Agents IA Raisonnement Évaluations

SIG

HYP

Reddit r/LocalLLaMA·27 mai

I ran 8 open-weight models as agents in a persistent MMO for 10 days. Here's the 93k event dataset and some things that I learned

Un studio a lancé Null Epoch, un MMO persistant où 25 agents LLM (8 modèles open-weight : Qwen3, Nemotron, Ministral, Gemma, GLM) ont joué pendant 10 jours. Dataset de 93k événements publié sur HuggingFace. Test de planification long-horizon, contention de ressources et pression adversariale en simulation dynamique.

Agents IA Multi-agents Benchmarks

SIG

HYP

Vercel AI Blog·27 mai

How Conductor moved parallel coding agents from the laptop to the cloud with Vercel Sandbox

Conductor, plateforme de direction d'agents de codage parallèles, migre son exécution du laptop vers le cloud via Vercel Sandboxes. Les équipes d'ingénierie de Notion, Linear, Ramp et Life360 utilisent cet outil model-agnostic (Claude Code, Codex, etc.) pour lancer plusieurs agents simultanément sur des branches isolées du codebase.

Agents IA Multi-agents Génération de code

SIG

HYP

Reddit r/LocalLLaMA·27 mai

LMStudio with MTP support - which model?

LMStudio a ajouté le support de Multi-Token-Prediction (MTP). Un utilisateur cherche des recommandations de modèles compatibles MTP, notamment une variante Qwen 3.6.

Outils Qwen

SIG

HYP

Le Big Data·27 mai

Mistral rejoint Harvey pour les usages IA en entreprise

Harvey intègre les modèles de Mistral AI à sa plateforme d'IA juridique. Cette collaboration cible les entreprises européennes en quête de solutions IA conformes aux régulations locales.

Mistral Business

SIG

HYP

Reddit r/LocalLLaMA·27 mai

Llama.cpp Console released

Llama.cpp Console, une interface graphique pour llama.cpp, est désormais disponible pour les utilisateurs Windows. L'outil offre une alternative aux interfaces en ligne de commande pour exécuter des modèles LLM localement.

Llama Open source Outils

SIG

HYP

Le Big Data·27 mai

[VIDÉO] Arena.ai : accédez à des outils d’IA gratuits sans débourser un centime

Arena.ai propose un accès gratuit à des outils d'IA pour réduire les coûts d'abonnement. La plateforme agrège plusieurs modèles sans frais d'utilisation.

Outils Open source

SIG

HYP

Le Big Data·27 mai

Fujitsu intègre OpenAI à sa stratégie IA pour les entreprises japonaises

Fujitsu s'allie à OpenAI pour accélérer sa stratégie IA auprès des entreprises japonaises. Le groupe intègre les technologies OpenAI dans son offre pour transformer les usages en entreprise.

OpenAI Business

SIG

HYP

The Decoder·27 mai

The AI boom drove Nvidia's yearly Taiwan spending from $15 billion to $150 billion

Les dépenses annuelles d'Nvidia auprès de ses fournisseurs taïwanais, notamment TSMC, ont explosé de 15 milliards à 150 milliards de dollars en raison du boom de l'IA.

Infrastructure Business

SIG

HYP

Reddit r/MachineLearning·27 mai

noisekit - CLI for generating realistic degraded speech datasets for ASR benchmarking [P]

noisekit est un CLI open-source pour générer des datasets de parole dégradée annotés, permettant de benchmarker les modèles STT sur des conditions réalistes (télécom G.711, bruit ambiant, réverbération). Résout le problème : les datasets publics (FLEURS, CommonVoice) sont trop propres pour évaluer la performance en production. Compatible HuggingFace AudioFolder, inclut métriques PESQ/SNR/NISQA.

Voix Évaluations Benchmarks

SIG

HYP

The Decoder·27 mai

China turns its aging camera network into an AI-powered mass surveillance apparatus

La police chinoise équipe des millions de caméras de surveillance avec l'IA. Hikvision et Huawei intègrent vision par ordinateur et modèles de langage pour détecter foules, comportements suspects et accès non autorisés. Les officiers interrogent par requête textuelle au lieu de visionner manuellement. Human Rights Watch alerte sur une surveillance comportementale sans précédent à l'échelle.

Vision Régulation Sécurité IA

SIG

HYP

Reddit r/LocalLLaMA·27 mai

Fused MoE dispatch kernel in pure Triton: 89-131% of Megablocks, runs on AMD with zero code changes

Kernel de dispatch MoE fusionné écrit en pur Triton (sans CUDA) atteint 89-131% des performances de Megablocks sur A100. Fusionne gate+up projections pour réduire 35% du trafic mémoire. Fonctionne sur AMD MI300X sans modification. Limitations : performance dégradée au-delà de 2048 tokens et avec 64+ experts.

Open source Infrastructure Génération de code

SIG

HYP

The Decoder·27 mai

Sam Altman and Dario Amodei walk back their AI job apocalypse predictions

Sam Altman (OpenAI) et Dario Amodei (Anthropic) révisent à la baisse leurs prédictions antérieures sur l'élimination massive d'emplois par l'IA, peu avant les introductions en bourse de leurs entreprises respectives.

OpenAI Anthropic Business

SIG

HYP

Reddit r/MachineLearning·27 mai

EMA-Gated Temporal Sequence Compression in Vision Transformers [P]

NeuroFlow est un framework de routage dynamique pour l'inférence vidéo des Vision Transformers. Il exploite la redondance temporelle via une moyenne mobile exponentielle (EMA) des embeddings de patches pour éliminer les tokens stationnaires. Architecture B atteint 55.80× d'accélération (678 ms → 11.9 ms sur SigLIP 1792p) à 97.37% de fidélité. Code disponible.

Vision Papers Open source

SIG

HYP

Reddit r/LocalLLaMA·27 mai

Finally pioneering beyond the local 256k context window frontier!

Un utilisateur de r/LocalLLaMA rapporte avoir dépassé la limite de 256k tokens en contexte, atteignant 341.5k tokens avec compression automatique. Il teste l'éviction en cache des clés-valeurs et prévoit de repousser progressivement cette limite.

Open source Infrastructure

SIG

HYP

Reddit r/MachineLearning·27 mai

Cross-species RSA: same learning rules (BP, PC, STDP, FA) tested against both human fMRI and macaque electrophysiology [P]

Étude comparative de règles d'apprentissage (BP, PC, STDP, FA) testées sur fMRI humain et électrophysiologie macaque (V1/V2/V4/IT). STDP et PC dominent en V1/V2 (ρ ≈ 0.30/0.28), conservant le pattern humain. En IT, l'alignement dépend de la capacité du modèle (ResNet-50: ρ ≈ 0.25) plutôt que de la règle. Code et deux papers (arxiv 2604.16875, 2605.22401) disponibles.

Papers Benchmarks Raisonnement

SIG

HYP

Hacker News (AI)·27 mai

Ripgrep AI Policy

Ripgrep, l'outil de recherche de texte populaire, adopte une politique d'IA explicite. Le projet clarifie ses conditions d'utilisation pour l'entraînement de modèles et la génération de code.

Open source Régulation

SIG

HYP

Reddit r/MachineLearning·27 mai

Profiling PyTorch training without accidentally stalling the GPU [D]

Technique de profilage PyTorch utilisant CUDA events pour mesurer les performances sans synchronisation GPU qui ralentirait l'exécution. Alternative légère à torch.cuda.synchronize() et aux outils lourds (PyTorch Profiler, Nsight) pour diagnostiquer les goulots d'étranglement en entraînement.

Outils Infrastructure

SIG

HYP

GitHub Trending·27 mai

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> Yeachan-Heo /</span> oh-my-claudecode

Oh-my-claudecode : orchestration multi-agent orientée équipes pour Claude Code. Framework permettant la coordination d'agents Claude dans des workflows collaboratifs.

Claude Code Agents IA Multi-agents

SIG

HYP

GitHub Trending·27 mai

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> cjpais /</span> Handy

Handy est une application open-source de reconnaissance vocale fonctionnant entièrement hors ligne, sans dépendances cloud.

Voix Open source Outils

SIG

HYP

GitHub Trending·27 mai

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> rustfs /</span> rustfs

RustFS est un système de stockage d'objets S3-compatible open-source écrit en Rust. Il affiche 2.3x plus rapide que MinIO pour les payloads de 4KB et supporte la migration et la coexistence avec MinIO et Ceph.

Open source Infrastructure Benchmarks

SIG

HYP

GitHub Trending·27 mai

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> meilisearch /</span> meilisearch

Meilisearch est un moteur de recherche API ultra-rapide offrant une recherche hybride alimentée par l'IA pour sites et applications.

Recherche vectorielle Embeddings Outils

SIG

HYP

GitHub Trending·27 mai

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> langfuse /</span> langfuse

Langfuse est une plateforme open-source d'ingénierie LLM offrant observabilité, métriques, évaluations, gestion de prompts et playground. Intègre OpenTelemetry, Langchain, OpenAI SDK, LiteLLM. Lauréate Y Combinator W23.

Open source Outils Évaluations

SIG

HYP

GitHub Trending·27 mai

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> rowboatlabs /</span> rowboat

Rowboat est un coworker IA open-source doté de mémoire. Le projet GitHub propose une implémentation d'agent IA capable de conserver du contexte entre les interactions.

Agents IA Open source

SIG

HYP

GitHub Trending·27 mai

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> Yeachan-Heo /</span> oh-my-claudecode

Oh-my-claudecode : orchestration multi-agent centrée sur les équipes pour Claude Code. Framework permettant la coordination d'agents Claude dans des workflows collaboratifs.

Claude Code Agents IA Multi-agents

SIG

HYP

GitHub Trending·27 mai

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> NVIDIA-NeMo /</span> Megatron-Bridge

NVIDIA-NeMo/Megatron-Bridge est une bibliothèque d'entraînement pour modèles Megatron avec conversion bidirectionnelle vers Hugging Face. Permet l'interopérabilité entre écosystèmes Megatron et HF.

Infrastructure Open source Fine-tuning

SIG

HYP

GitHub Trending·27 mai

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> zai-org /</span> GLM-OCR

GLM-OCR est un modèle OCR open-source basé sur GLM, conçu pour la reconnaissance de texte précise et rapide. Combine reconnaissance optique de caractères avec traitement de langage naturel pour une extraction textuelle complète.

Open source Vision Outils

SIG

HYP

GitHub Trending·27 mai

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> unclecode /</span> crawl4ai

Crawl4AI est un web crawler et scraper open-source conçu pour les LLM. Le projet gagne en popularité sur GitHub Trending.

Open source Outils RAG

SIG

HYP

GitHub Trending·27 mai

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> agentscope-ai /</span> agentscope

AgentScope est un framework open-source pour construire et exécuter des agents IA visibles, compréhensibles et fiables. Permet la création d'agents multi-agents avec transparence et traçabilité.

Agents IA Multi-agents Open source

SIG

HYP

Reddit r/LocalLLaMA·27 mai

Is Granite-4.1-30b Overshadowed by Qwen3.6 & Gemma4 models?

Granite-4.1-30b, modèle dense d'IBM sans capacités de raisonnement, supporte la génération de code, RAG et le multilinguisme. Utilisateurs questionnent son intérêt face à Qwen3.6 et Gemma4. IBM prépare des versions futures avec reasoning.

Génération de code RAG Open source

SIG

HYP

ActuIA·27 mai

Souveraineté numérique : le CIANum appelle à dépasser les silos public-privé pour bâtir des communs stratégiques

Le CIANum appelle à dépasser les silos public-privé pour construire des communs stratégiques face à la dépendance française aux grandes plateformes étrangères. L'enjeu : renforcer la souveraineté numérique européenne par une collaboration structurée.

Régulation Business Open source

SIG

HYP

Le Big Data·27 mai

Micron dépasse les 1 000 milliards de dollars grâce à la demande en IA

Micron franchit la barre des 1 000 milliards de dollars de capitalisation boursière. L'action a bondi de 19 % mardi après qu'UBS ait triplé son objectif de cours, porté par la forte demande en puces mémoire pour l'IA.

Business

SIG

HYP

Reddit r/LocalLLaMA·27 mai

Info: Nvidia Cuda 13.3 landed

Nvidia a publié CUDA 13.3. Un utilisateur demande si quelqu'un a testé llama.cpp avec cette version.

Open source Infrastructure

SIG

HYP

Reddit r/LocalLLaMA·27 mai

Tiny model for PI agent + FREE DEMO, SOTA on terminal bench in 4b size (10%) + UNCESORED version for my dudes

Fine-tuning de Qwen 3.5 4B sur traces d'agents Hermes et PI, contexte 32k. Modèle servi sur HF Serverless avec démo gratuite capable de coder des apps simples. Versions censurée et non-censurée disponibles.

Qwen Agents IA Génération de code

SIG

HYP

Reddit r/LocalLLaMA·27 mai

Hyvemind OSS - Looking for some testers

Hyvemind est une application desktop open-source combinant trois modes de développement IA : Tasks (planification conversationnelle), Hivemind (révision multi-modèles parallèle avec orchestrateur), et Swarms (exécution autonome multi-agents avec rôles spécialisés). Supporte Anthropic, OpenAI, OpenRouter, Ollama, DeepSeek et autres. En phase de test avant release officielle.

Multi-agents Agents IA Open source

SIG

HYP

Le Big Data·27 mai

OpenRouter franchit 1,3 milliard de dollars de valorisation un an après son lancement

OpenRouter atteint 1,3 milliard de dollars de valorisation un an après son lancement. La plateforme d'agrégation de modèles IA connaît une croissance rapide.

OpenAI Business Outils

SIG

HYP

Hacker News (AI)·27 mai

Even (very) noisy LLM evaluators are useful for improving AI agents

Étude montrant que les évaluateurs LLM bruyants restent utiles pour améliorer les agents IA, même avec un bruit de mesure élevé. Les résultats suggèrent que le signal persiste malgré l'imprécision des évaluations.

Agents IA Évaluations Reinforcement learning

SIG

HYP

Reddit r/LocalLLaMA·27 mai

I made a small tool to inspect retrieval results before feeding them into RAG

Outil local pour inspecter les résultats de recherche avant leur intégration dans un pipeline RAG. Analyse la diversité des sources, doublons, fraîcheur, risques SEO/GEO et différences entre fournisseurs (Brave, Serper, Tavily, Exa). Permet de filtrer les résultats non pertinents avant le contexte du modèle.

RAG Recherche vectorielle Outils

SIG

HYP

OpenAI Blog·27 mai

Building self-improving tax agents with Codex

OpenAI, Thrive et Crete ont construit un agent fiscal autonome utilisant Codex pour automatiser les déclarations, améliorer la précision et accélérer les workflows.

Agents IA Génération de code Business

SIG

HYP

Le Big Data·27 mai

Music v2 : l’IA d’ElevenLabs qui compose vos chansons (presque) toute seule

ElevenLabs lance Music v2, un modèle IA capable de générer des chansons complètes à partir d'instructions textuelles. L'outil promet une composition musicale automatisée avec contrôle créatif limité par l'utilisateur.

Outils

SIG

HYP

Reddit r/LocalLLaMA·27 mai

Turning every "no thats not what i meant" in chat into actual LoRA training data

Un développeur a créé une app desktop (TideForge) qui transforme les corrections en chat en données d'entraînement LoRA. Après chaque réponse, un bouton « Teach » permet de noter la correction souhaitée ; les exemples s'accumulent et déclenchent un fine-tuning PEFT sur Qwen 0.6B. Test initial : 110 corrections, loss 4.25→0.73, l'adapter conserve l'identité face aux jailbreaks. App gratuite, Windows, GGUF compatible.

Fine-tuning Open source Outils

SIG

HYP

Reddit r/MachineLearning·27 mai

A Tiny Open-Source Self-Driving AI That Runs on a Phone [P]

Un modèle open-source de 7 MB pour la conduite autonome entraîné sur données visuelles et capteurs. Exécution temps réel sur téléphone et appareils embarqués sans infrastructure serveur. Apprentissage de la navigation, suivi de voie et récupération de dérive.

Génération de code Robotique Open source

SIG

HYP

Reddit r/LocalLLaMA·27 mai

Does Engram Do Memory Retrieval in Autoregressive Image Generation?

Un module Engram (mémoire associative O(1) par hash) injecté dans des Transformers pour la génération d'images autorégressives sur ImageNet 256×256 n'améliore pas la qualité (FID) malgré des gains FLOP. Les expériences (gate-clamp, donor-probe, table gelée) révèlent que le module fonctionne comme un chemin résiduel architectural gated, non comme un mécanisme de récupération adressée par contenu.

Papers Génération d'images Benchmarks

SIG

HYP

Reddit r/LocalLLaMA·27 mai

Add MiniCPM5 tokenizer support by zhangtao2-1 · Pull Request #23384 · ggml-org/llama.cpp

Pull request pour ajouter le support du tokenizer MiniCPM5 dans llama.cpp. MiniCPM5-1B est un modèle compact disponible en format GGUF sur Hugging Face.

Open source Génération de code Outils

SIG

HYP

Hacker News (AI)·27 mai

Claude Code as a Daily Driver: Claude.md, Skills, Subagents, Plugins, and MCPs

Retour d'expérience sur Claude Code comme outil de développement quotidien. Exploration des capacités natives (Claude.md, Skills, Subagents, Plugins) et intégration via MCPs pour étendre les fonctionnalités.

Claude Code MCP Agents IA

SIG

HYP

arXiv cs.CL·27 mai

Slide Deck Q&A Quality Assurance App: A Multi-Stage Pipeline for Pedagogical Question Generation

slidesqaqa est un système Flask qui génère des questions pédagogiques à partir de présentations PDF. Un pipeline LLM à 4 étapes (planification, synthèse, annotation, réconciliation) traite texte et images pour produire des questions cohérentes et non-redondantes, avec scores d'évaluation en JSON structuré.

Génération de code RAG Vision

SIG

HYP

arXiv cs.CL·27 mai

Why Prompt Optimization Works, and Why It Sometimes Doesn't: A Causal-Inspired Edit-Level Analysis

Analyse causale des méthodes d'optimisation de prompts (DSpy, TextGrad) révélant pourquoi elles échouent à généraliser. Les édits augmentant la complexité nuisent aux tâches mathématiques et multi-sauts, tandis que les édits step-by-step améliorent le raisonnement logique. Les défaillances proviennent d'interactions systématiques entre familles d'édits et caractéristiques des tâches.

Prompt engineering Raisonnement Benchmarks

SIG

HYP

arXiv cs.CL·27 mai

Model Unlearning Objectives Vary for Distinct Language Functions

Étude arXiv sur le désapprentissage sélectif dans les LLM. Les auteurs proposent deux méthodes distinctes : une variante cosinus de RMU pour oublier les connaissances dangereuses, et un objectif multi-couches pour réduire la toxicité. Testées sur 4 modèles 7-8B open-source, les approches montrent que le désapprentissage nécessite des objectifs spécifiques selon la fonction linguistique ciblée.

Sécurité IA Alignement Papers

SIG

HYP

arXiv cs.AI·27 mai

FAST-GOAL: Fast and Efficient Global-local Object Alignment Learning

FAST-GOAL améliore CLIP pour traiter des descriptions textuelles longues via alignement sémantique global-local. La méthode combine extraction efficace de régions locales (FLISM) et apprentissage par similarité de tokens (TSL). Un dataset GLIT100k avec paires image-caption longues et dérivées locales valide l'approche sur DOCCI, DCI, MSCOCO, Flickr30k.

Vision RAG Embeddings

SIG

HYP

arXiv cs.CL·27 mai

SPEAR: Code-Augmented Agentic Prompt Optimization

SPEAR est un optimiseur de prompts agentic qui intègre un sandbox Python pour analyser les erreurs structurelles (matrices de confusion, clustering). Évalué sur 13 tâches industrielles LLM-as-judge et BBH-7, il surpasse GEPA et TextGrad (κ 0.857 vs 0.359 sur sélection d'outils; F1-macro 0.815 vs 0.763). L'outil Python contribue +0.79κ sur les tâches complexes.

Prompt engineering Agents IA Génération de code

SIG

HYP

arXiv cs.CL·27 mai

The Daily Dose: Workflow-Integrated Large Language Model Automation for Clinical Summarization and Trial Identification in Radiation Oncology

The Daily Dose (TDD) est un système LLM intégré en routine en oncologie radiothérapique pour résumer automatiquement les dossiers patients et identifier les essais cliniques pertinents. Évaluation sur 55 cliniciens : 83,6% utilisent TDD quotidiennement, satisfaction moyenne 3,89/5, 27% rapportent ≥10 min économisées/jour.

Génération de code RAG Business

SIG

HYP

arXiv cs.CL·27 mai

Why LLMs Hallucinate on Structured Knowledge: A Mechanistic Analysis of Reasoning over Linearized Representations

Étude mécanistique des hallucinations dans les LLM sur connaissances structurées linéarisées (graphes, tables). Les hallucinations résultent de dynamiques internes systématiques : attention concentrée sur des indices structurels raccourcis, représentations feed-forward ne grounding pas la connaissance fournie, reversion à la mémoire paramétrée. Patterns généralisent à graphes multi-hop et données tabulaires.

Raisonnement Papers Sécurité IA

SIG

HYP