mai 2026

3149 articles

A successful Japanese trial of a ramjet engine designed for Mach‑5 aircraft

Le Japon a réussi un essai de moteur statoréacteur conçu pour des aéronefs volant à Mach 5. Ce test valide une technologie de propulsion hypersonique, étape clé vers les avions supersoniques de nouvelle génération.

Infrastructure

SIG

HYP

Reddit r/MachineLearning·25 mai

The famous METR AI time horizons graph contains numerous severe errors [D]

Nathan Witkin (NYU Stern) critique sévèrement le graphique METR sur les horizons temporels de l'IA. Les erreurs incluent : baselines humaines non mesurées mais estimées, benchmarkers payés à l'heure (incitation à traîner), échantillon biaisé vers les pairs des auteurs, et ignorance de l'avantage de familiarité (5-18x plus rapide). Witkin conclut que le graphique contient trop d'erreurs cumulatives pour être sauvé.

Benchmarks Évaluations Sécurité IA

SIG

HYP

Reddit r/MachineLearning·25 mai

DCGAN inference on a microcontroller: 12.6M parameters, 512KB SRAM, 26-second generation, pure C [P]

DCGAN 12.6M paramètres exécuté sur microcontrôleur RISC-V CH32H417 (512KB SRAM). Génération 64×64 visages de chats en 26 secondes, moteur C pur avec quantization int8. Poids streamés depuis carte SD via double buffering. Vecteur z seeded par 200 bytes de données quantiques (ANU QRNG). Aucun framework existant (TFLite, CMSIS NN) — implémentation from scratch.

Génération de code Benchmarks Open source

SIG

HYP

Reddit r/MachineLearning·25 mai

We gave an LLM a structural graph of a codebase before exploring. It used 54% MORE context than without one. Paper + explanation inside [R]

Étude contrôlée sur codebase TypeScript (25 sections, 3,250 fichiers) : un LLM (Kimi K2.6) équipé d'un graphe structurel (Blueprint : Universal Ctags + ast-grep + BM25) a consommé 54% plus de tokens d'entrée (63,541 vs 41,327) mais a exploré plus profondément (6 tours vs 5). Le graphe coûte ~6,500 tokens et augmente la confiance de navigation du modèle.

Génération de code RAG Benchmarks

SIG

HYP

Reddit r/LocalLLaMA·25 mai

AI content detector based on Qwen 0.8b fine-tuned on Pangram dataset

Fine-tuning de Qwen 3.5 0.8B sur le dataset Pangram (EditLens) pour détecter le contenu généré par IA. Extension Chrome « Slop Hammer » disponible, inférence locale (~1s sur M1), modèle 400MB. Entraînement 20h sur RTX 3090. Limitation : dataset créé avec anciens LLM, confusion sur GPT-5.5.

Qwen Fine-tuning Évaluations

SIG

HYP

Hacker News (AI)·25 mai

I just sequenced a human genome to 30× coverage at home

Un utilisateur a séquencé un génome humain complet à 30× de couverture depuis son domicile, utilisant des outils open-source et du matériel accessible. Démonstration de démocratisation du séquençage génomique hors laboratoires professionnels.

Open source Outils

SIG

HYP

Reddit r/MachineLearning·25 mai

Reconstructing the agent methodology: Decoupling decision-making and execution - open source [P]

Spice est un projet open-source qui ajoute une couche de décision explicite au-dessus des agents IA. Il documente les observations, options considérées, raisons du choix et trade-offs rejetés avant l'exécution, rendant le comportement des agents moins opaque. Compatible avec Claude Code, Codex et autres agents.

Agents IA MCP Open source

SIG

HYP

Reddit r/LocalLLaMA·25 mai

CUDA: add fast walsh-hadamard transform by am17an · Pull Request #23615 · ggml-org/llama.cpp

Implémentation CUDA de la transformée de Walsh-Hadamard rapide (FWHT) pour llama.cpp optimisant la quantification du KV-cache. Gains de 1-2% en prefill et 7-9% en token generation sur RTX 5090 avec quantification q8_0.

Open source Infrastructure Génération de code

SIG

HYP

Reddit r/LocalLLaMA·25 mai

Can you jailbreak Llama 3.1 8B? (Red-Teaming Challenge)

Un chercheur propose un défi de red-teaming sur Llama 3.1 8B pour tester SAFi, un moteur de gouvernance runtime censé forcer l'alignement des agents autonomes. 10 prompts pour faire dévier un tuteur socratique de ses directives (donner réponses directes ou sortir du sujet science/math). Code open-source disponible.

Llama Agents IA Alignement

SIG

HYP

Hacker News (AI)·25 mai

Ubers COO says its getting harder to justify the money spent on AI tokenmaxxing

Le COO d'Uber déclare qu'il devient difficile de justifier les dépenses massives en IA. L'entreprise questionne le ROI du « token maxxing » — l'accumulation de capacités de calcul sans cas d'usage clair.

Business

SIG

HYP

Reddit r/LocalLLaMA·25 mai

Llama.cpp : Split Mode Tensor Fix Incoming?

Llama.cpp préparerait un correctif pour les crashes en mode split tensor sur multi-GPU. Le mode split tensor offre ~35% de gain de débit (TG) par rapport au mode layer, mais provoque des plantages tous les 90-120 minutes dus à l'épuisement de la VRAM.

Open source Infrastructure

SIG

HYP

Reddit r/MachineLearning·25 mai

𝐃𝐞𝐥𝐭𝐚 𝐀𝐭𝐭𝐞𝐧𝐭𝐢𝐨𝐧 𝐑𝐞𝐬𝐢𝐝𝐮𝐚𝐥𝐬 [R]

Delta Attention Residuals améliore les connexions résiduelles en routant sur les différences entre couches (deltas) plutôt que sur les états cachés cumulatifs. Résultats : −8.2% PPL à 7.6B, routing 1.8× plus net (max weight 0.2→0.6), <0.01% overhead paramétrique. Code et paper disponibles.

Papers Benchmarks Open source

SIG

HYP

Reddit r/MachineLearning·25 mai

I’m building an open-source decision layer above AI agents [P]

Spice est un projet open-source créant une couche de décision au-dessus des agents IA. Elle explicite le processus décisionnel (observations, options, justifications, trade-offs) avant l'exécution, plutôt que de traiter les agents comme des boîtes noires. Compatible avec Claude Code, Codex et autres exécuteurs.

Agents IA Open source Outils

SIG

HYP

Reddit r/MachineLearning·25 mai

Call for Papers - Workshop on Efficient Reasoning at COLM 2026 [R]

Appel à contributions pour le 2e Workshop on Efficient Reasoning à COLM 2026 (9 octobre). Deadline : 12 juillet 2026. Thèmes : raisonnement multimodal sous contraintes, datasets, optimisations algorithmiques, inférence rapide (pruning, compression, KV-cache), benchmarks, déploiement on-device, sécurité, applications temps réel (santé, robotique).

Raisonnement Benchmarks Robotique

SIG

HYP

Reddit r/LocalLLaMA·25 mai

(Yet Another) KV cache calculator - kvanta.vcerny.cz

KVANTA, un calculateur web de cache KV open-source (Apache 2.0) pour LLM/VLM de Hugging Face. L'outil vise à surpasser les calculateurs existants avec une interface améliorée.

Outils Open source Infrastructure

SIG

HYP

Reddit r/LocalLLaMA·25 mai

Is Qwen3.6 current king for local agentic use?

Un utilisateur de r/LocalLLaMA rapporte que Qwen 3.6 35B A3B surpasse d'autres modèles locaux (Gemma 4, GLM 4.7 Flash) pour les tâches agentic, avec moins de boucles infinies et d'appels d'outils cassés. Testé sur Hermes Agent et Pi en quantification IQ4_NL.

Qwen Agents IA Open source

SIG

HYP

Reddit r/LocalLLaMA·25 mai

Full Attention Strikes Back: Transferring Full Attention into Sparse within Hundred Training Steps

RTPurbo transforme les LLMs full-attention en modèles sparse en quelques centaines d'étapes d'entraînement. La méthode exploite trois observations : seuls certains heads nécessitent l'attention complète, la récupération long-range utilise un sous-espace 16D, et la sélection de tokens est query-dépendante. Résultats : 9.36x speedup prefill à 1M contexte, 2.01x speedup decode, précision préservée.

Raisonnement Benchmarks Infrastructure

SIG

HYP

Le Big Data·25 mai

Ce sénateur vote pour les data centers de Meta… et empoche le jackpot

Un sénateur républicain de Louisiane a voté en faveur d'un projet de data center Meta et aurait bénéficié financièrement de cette décision. L'article révèle un conflit d'intérêts potentiel sur deux ans.

Business Régulation

SIG

HYP

Reddit r/LocalLLaMA·25 mai

Sharing my 'Local-LLM-Toolkit' repo

Partage d'un repo GitHub 'Local-LLM-Toolkit' documentant techniques d'optimisation pour LLM locaux sur Mac Studio M4 Max 128GB. Inclut code C et Swift pour améliorer les performances.

Open source Infrastructure Outils

SIG

HYP

Reddit r/LocalLLaMA·25 mai

The Financial Times has published an article about Heretic

Le Financial Times rapporte que Heretic, un outil GitHub, permet de retirer les garde-fous de Llama 3.3 en moins de 10 minutes. Son créateur Philipp Emanuel Weidmann confirme 3 500 modèles « décensurés » créés et 13 millions de téléchargements depuis le lancement.

Llama Open source Sécurité IA

SIG

HYP

Vercel AI Blog·25 mai

Building a real-time power outage map with Next.js on Vercel

Endeavour Energy, distributeur électrique australien, a migré son application de carte des pannes vers Next.js et Vercel. Résultats : chargements sub-1s en pic de trafic, cycles de sync 5 min, déploiements 38% plus rapides. Supabase gère la couche données temps réel.

Infrastructure Outils Business

SIG

HYP

Reddit r/LocalLLaMA·25 mai

The reason small-model agent stacks aren't the default has nothing to do with whether they work

Les petits modèles spécialisés (Gemma 4 31B à 86.4% sur tau2-bench, Qwen 27B surpassant des modèles 397B) dominent désormais les benchmarks d'agents. Pourtant l'industrie continue d'utiliser des modèles frontière coûteux : les labs de frontier gagnent à la facturation par token, créant un désalignement économique entre performance technique et adoption.

Agents IA Benchmarks Qwen

SIG

HYP

Reddit r/LocalLLaMA·25 mai

NuExtract3 released: open-weight 4B VLM for Markdown, OCR and structured extraction (self-hostable)

Numind publie NuExtract3, un VLM open-weight de 4B paramètres basé sur Qwen3.5-4B (licence Apache-2.0). Le modèle extrait des données structurées et convertit documents/images en Markdown. Entraîné 3 jours sur 8xH100, il supporte PDFs, formulaires, tableaux avec quantifications multiples (GPTQ, W8A8, FP8, Q4, Q6) pour auto-hébergement à partir de 4GB VRAM.

Qwen Vision Open source

SIG

HYP

Hacker News (AI)·25 mai

Pope Leo: opaque AI run by few firms risks "New Forms of Dehumanization"

Le Pape Léon exprime des préoccupations sur les risques de déshumanisation liés aux systèmes IA opaques contrôlés par quelques entreprises. Il appelle à une plus grande transparence et à une gouvernance responsable de l'IA.

Régulation Sécurité IA Alignement

SIG

HYP

Reddit r/LocalLLaMA·25 mai

Old Mac Pro still proving its worth

Un Mac Pro 2013 équipé de GPU D700 (12 Go VRAM) exécute désormais des LLM via Vulkan après support driver récent. Qwen 3.5 9B atteint 11 t/s, Qwen 2.5 Coder 22 t/s à contexte 70k. L'utilisateur rapporte que Qwen 3.5 surpasse Claude Sonnet 4.6 sur tâches de planification C#/.NET.

Qwen Claude Llama

SIG

HYP

Reddit r/LocalLLaMA·25 mai

llama.cpp oom issue

Utilisateur signale une fuite mémoire système dans llama.cpp avec Qwen3.6-27B-MTP-GGUF après 20-40 minutes d'utilisation active. Le processus consomme progressivement plus de RAM malgré diverses tentatives de configuration (--no-mmap, --cache-ram 0, sans MTP). Problème persiste sur plusieurs builds et images Docker.

Llama Open source Infrastructure

SIG

HYP

Reddit r/LocalLLaMA·25 mai

OSCAR RotationZoo - Offline Spectral Covariance-Aware Rotation for 2-bit KV Cache Quantization

OSCAR RotationZoo fournit des matrices de rotation pré-calculées pour la quantification INT2 du cache KV. La méthode compresse la mémoire KV d'un facteur ~7× avec une perte de précision inférieure à 1 chiffre sur GPQA pour modèles de raisonnement dense (Qwen3-4B, Qwen3-8B, GLM-4.7). Code et rotations disponibles sur HuggingFace.

Benchmarks Open source Qwen

SIG

HYP

Le Big Data·25 mai

Vidéo : ils ont filmé un système immunitaire en train de dévorer un cancer

Des chercheurs ont filmé en direct un système immunitaire détruisant des cellules cancéreuses de mélanome. Les inhibiteurs de points de contrôle immunitaire, utilisés depuis 15 ans en médecine, permettent cette action thérapeutique visualisée pour la première fois.

Vision

SIG

HYP

Reddit r/MachineLearning·25 mai

Call for Papers - Workshop on Unlearning and Model Editing U&ME at ECCV 2026 [R]

Appel à contributions pour l'atelier U&ME (Unlearning & Model Editing) à ECCV 2026. Les organisateurs recherchent des soumissions sur le désapprentissage, l'édition de modèles, la fusion de modèles, la compression et l'apprentissage continu. Bienvenue aux travaux en cours et aux idées exploratoires.

Sécurité IA Alignement

SIG

HYP

GitHub Trending·25 mai

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> hardikpandya /</span> stop-slop

Stop-slop est un fichier de compétences pour détecter et supprimer les marqueurs typiques du texte généré par IA dans la prose (tournures répétitives, formulations génériques).

Prompt engineering Outils

SIG

HYP

GitHub Trending·25 mai

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> garrytan /</span> gstack

Gstack : suite de 23 outils Claude Code configurés selon le setup de Garry Tan, couvrant les rôles de CEO, designer, manager d'ingénierie, release manager, ingénieur doc et QA.

Claude Code Agents IA Outils

SIG

HYP

GitHub Trending·25 mai

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> affaan-m /</span> ECC

Système d'optimisation de performance pour agents IA. Intègre compétences, instincts, mémoire, sécurité et développement orienté recherche pour Claude Code, Codex, Opencode et Cursor.

Agents IA Claude Code Génération de code

SIG

HYP

GitHub Trending·25 mai

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> anthropics /</span> claude-cookbooks

Anthropic publie claude-cookbooks, une collection de notebooks et recettes montrant des usages pratiques et créatifs de Claude.

Claude Prompt engineering

SIG

HYP

GitHub Trending·25 mai

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> moeru-ai /</span> airi

Airi est un compagnon IA auto-hébergé open-source capable de conversation vocale temps réel, jeu Minecraft et Factorio. Supporte Web, macOS et Windows. Inspiré par Neuro-sama.

Agents IA Voix Open source

SIG

HYP

GitHub Trending·25 mai

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> AlexsJones /</span> llmfit

llmfit : outil CLI pour tester des centaines de modèles LLM et providers sur son matériel. Une commande pour identifier ce qui fonctionne localement.

Outils Open source Infrastructure

SIG

HYP

GitHub Trending·25 mai

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> Zackriya-Solutions /</span> meetily

Meetily est un assistant de réunion open-source, auto-hébergé, basé sur Rust. Transcription 4x plus rapide que Whisper/Parakeet, diarisation des locuteurs, résumé via Ollama. Traitement 100% local, zéro cloud.

Open source Voix Outils

SIG

HYP

GitHub Trending·25 mai

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> nearai /</span> ironclaw

IronClaw est un système d'exploitation pour agents IA mettant l'accent sur la confidentialité, la sécurité et l'extensibilité. Projet open-source hébergé sur GitHub.

Agents IA Open source Sécurité IA

SIG

HYP

GitHub Trending·25 mai

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> NateBJones-Projects /</span> OB1

OB1 (Open Brain) propose une couche infrastructure unifiée : une base de données, une passerelle IA et un canal chat. Compatible avec n'importe quel modèle IA, sans middleware ni SaaS.

Infrastructure Agents IA Open source

SIG

HYP

GitHub Trending·25 mai

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> CodebuffAI /</span> codebuff

CodebuffAI : outil de génération de code en ligne de commande. Permet de créer du code directement depuis le terminal.

Génération de code Outils

SIG

HYP

GitHub Trending·25 mai

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> garrytan /</span> gstack

Gstack : configuration Claude Code de Garry Tan avec 23 outils spécialisés pour automatiser les rôles de CEO, designer, manager d'ingénierie, release manager, ingénieur doc et QA.

Claude Code Agents IA Génération de code

SIG

HYP

GitHub Trending·25 mai

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> moeru-ai /</span> airi

Airi est un compagnon IA auto-hébergé capable de conversation vocale en temps réel, de jeu Minecraft et Factorio. Supporte Web, macOS et Windows. Projet open-source inspiré par Grok et Neuro-sama.

Open source Voix Agents IA

SIG

HYP

GitHub Trending·25 mai

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> OpenBB-finance /</span> OpenBB

OpenBB est une plateforme de données financières destinée aux analystes, quants et agents IA. Disponible en open-source sur GitHub, elle offre un accès unifié aux données de marché.

Open source Agents IA Outils

SIG

HYP

GitHub Trending·25 mai

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> sansan0 /</span> TrendRadar

TrendRadar est un agrégateur de tendances IA qui agrège les actualités multi-plateformes via RSS avec alertes intelligentes. Filtre par mots-clés, traduit et analyse les articles via IA, supporte MCP pour dialogues en langage naturel, déploiement Docker avec données locales/cloud, intégrations WeChat/Feishu/DingTalk/Telegram/Slack.

Agents IA MCP RAG

SIG

HYP

The Decoder·25 mai

Google Deepmind's AlphaProof Nexus solves decades-old math problems for a few hundred dollars

AlphaProof Nexus de Google DeepMind a résolu autonomement neuf problèmes ouverts d'Erdős, dont deux non résolus depuis 56 ans, pour quelques centaines de dollars par problème. Le système utilise le compilateur Lean pour vérifier automatiquement chaque étape de preuve, avec un taux de succès de 2,5%.

DeepMind Raisonnement Benchmarks

SIG

HYP

Reddit r/LocalLLaMA·25 mai

numind/NuExtract3 · Hugging Face

NuExtract3 est un modèle vision-langage 4B pour la compréhension documentaire. Il combine extraction structurée (texte/images + template JSON → JSON) et conversion image-to-Markdown, avec support multilingue et modes reasoning/non-reasoning. Disponible en GGUF, NVFP4, MLX, VLLM.

Vision RAG Génération de code

SIG

HYP

The Decoder·25 mai

George Hotz says coding agents will be "one of the most costly mistakes" in software development

George Hotz avertit que les agents de codage IA seront « l'une des erreurs les plus coûteuses » du développement logiciel. Après six mois de tests, il conclut que les LLM produisent des prototypes rapides mais génèrent des bugs difficiles à détecter. Son positionnement reflète les divergences profondes dans la communauté IA sur le rôle des LLM.

Génération de code Agents IA Sécurité IA

SIG

HYP

Reddit r/LocalLLaMA·25 mai

I built a computer use sandbox framework for codex on headless linux. GPU passthrough, computer use, and sudo access for codex all work. It's the perfect dev sandbox to allow full auto work while minimizing the "rm -rf /" risk

Développeur crée un framework sandbox pour agents IA sur Linux headless avec GPU passthrough, accès sudo et isolation du système hôte. Basé sur des VM configurables, permet navigation web autonome, exécution Docker et sessions parallèles. Code disponible sur GitHub.

Agents IA Génération de code Infrastructure

SIG

HYP

Reddit r/LocalLLaMA·25 mai

MiMo-V2.5-coder

Sortie de MiMo-V2.5-coder, modèle de codage optimisé pour machines avec 128 GB RAM. Présenté comme alternative à Qwen 3.6 et DeepSeek-4, avec appels d'outils fiables et performances rapides.

Génération de code Open source Outils

SIG

HYP

Reddit r/LocalLLaMA·25 mai

We added W8A8 activation quantization to MLX — prefill went from 2.84s to 2.52s on M5 Pro

Mininglamp AI a ajouté la quantization W8A8 (poids et activations en INT8) à MLX via Cider, un SDK avec kernels Metal custom. Sur M5 Pro, prefill passe de 2.84s à 2.52s pour un VLM 4B. Compatible avec tout modèle MLX, mais INT8 TensorOps nécessite M5+.

Open source Infrastructure Outils

SIG

HYP

The Decoder·25 mai

AI models often give the right answers but point to the wrong sources

Les modèles IA comme GPT et Gemini citent souvent des passages textuels qui ne soutiennent pas leurs réponses, même quand la réponse est correcte. Des chercheurs de l'Université de Pékin appellent ce phénomène « attribution hallucination » et proposent le benchmark CiteVQA pour le tester systématiquement.

GPT Gemini Benchmarks

SIG

HYP

Reddit r/LocalLLaMA·25 mai

I made a local-first MCP tutorial repo with node-llama-cpp and a custom agent loop

Un dépôt pédagogique « MCP from Scratch » enseigne le Model Context Protocol en Node.js pur, du JSON-RPC brut jusqu'à une boucle agent locale (plan → agir → observer) avec node-llama-cpp et modèles GGUF. Conçu pour comprendre les mécaniques sous-jacentes sans abstractions.

MCP Agents IA Open source

SIG

HYP

Reddit r/LocalLLaMA·25 mai

Qwen 3.6 benchmarks on 2x RTX PRO 6000

Benchmarks de Qwen 3.6 sur 2x RTX PRO 6000 avec vLLM. Qwen 3.6 27B BF16 atteint 1800 tps (64 concurrency, MTP-2). Qwen 3.6 35B BF16 atteint 3500 tps en génération (128 concurrency, MTP-Off) avec 30k tps en traitement de prompts.

Qwen Benchmarks Infrastructure

SIG

HYP

Reddit r/LocalLLaMA·25 mai

server: fix checkpoints creation by jacekpoplawski · Pull Request #22929 · ggml-org/llama.cpp

PR llama.cpp #22929 optimise le traitement des checkpoints pour éviter la re-processing complète du contexte lors d'éditions. Cas d'usage : coding agentic avec 70k tokens. Améliore la réactivité en ne retraitant que les portions modifiées, testé 2 semaines.

Llama Agents IA Génération de code

SIG

HYP

Reddit r/LocalLLaMA·25 mai

1000 tps generation on Qwen3.6 27B with V100s

Utilisateur rapporte 1000 tokens/s en génération sur Qwen 3.6 27B avec V100s en batch 128, et 80 t/s en single-user (batch 1) sans MTP. Throughput de traitement atteint 3000 t/s.

Qwen Benchmarks Infrastructure

SIG

HYP

Reddit r/LocalLLaMA·25 mai

Wrote a custom C++ engine for MiniCPM-V 4.6 on Orange Pi AIPro (Ascend 310B) to bypass framework overhead

Développeur crée un moteur d'inférence C++ custom pour MiniCPM-V 4.6 sur Orange Pi AIPro (Ascend 310B NPU, 149$). Contourne les frameworks lourds avec kernels AscendC optimisés, passant de 2.88 à 5.90 tokens/s (170ms par étape). Code open-source sur GitHub.

Open source Génération de code Infrastructure

SIG

HYP

arXiv cs.CL·25 mai

A Survey of Text and Speech Resources for Hausa and Fongbe: Availability, Quality, and Gaps for NLP Development

Inventaire des ressources texte et vocales pour le hausa (80-100M locuteurs) et le fongbé (2M locuteurs). Le hausa dispose de corpus parallèles et textes variés (news, encyclopédie, éducation). Le fongbé manque de données textuelles mais bénéficie d'initiatives récentes de collecte vocale. Deux langues présentes dans les benchmarks Masakhane (NER, POS tagging).

Benchmarks Papers

SIG

HYP

arXiv cs.AI·25 mai

BOHM: Zero-Cost Hierarchical Attribution for Compound AI Systems

BOHM est une méthode d'attribution hiérarchique pour systèmes IA composés qui extrait directement les contributions des composants à partir des poids de routage, sans évaluer les sous-ensembles. Coût marginal zéro, compatible avec APIs tierces opaques. Sur 18 LLMs (880 problèmes LiveCodeBench), Kendall tau=0.928 vs SHAP tau=0.980 avec 9000x plus d'évaluations.

Agents IA Évaluations Raisonnement

SIG

HYP

arXiv cs.CL·25 mai

How Far Will They Go? Red-Teaming Online Influence with Large Language Models

Étude de red-teaming sur 30+ LLMs open-source (10 familles, 5 pays) mesurant leur capacité à générer du contenu politique biaisé via des jailbreaks. Résultats : asymétries systématiques (biais gauche), contraction des Overton Windows avec la taille du modèle, variations régionales marquées, efficacité variable des jailbreaks selon les familles.

Sécurité IA Alignement Open source

SIG

HYP

mai 2026

A successful Japanese trial of a ramjet engine designed for Mach‑5 aircraft

The famous METR AI time horizons graph contains numerous severe errors [D]

DCGAN inference on a microcontroller: 12.6M parameters, 512KB SRAM, 26-second generation, pure C [P]

We gave an LLM a structural graph of a codebase before exploring. It used 54% MORE context than without one. Paper + explanation inside [R]

AI content detector based on Qwen 0.8b fine-tuned on Pangram dataset

I just sequenced a human genome to 30× coverage at home

Reconstructing the agent methodology: Decoupling decision-making and execution - open source [P]

CUDA: add fast walsh-hadamard transform by am17an · Pull Request #23615 · ggml-org/llama.cpp

Can you jailbreak Llama 3.1 8B? (Red-Teaming Challenge)

Ubers COO says its getting harder to justify the money spent on AI tokenmaxxing

Llama.cpp : Split Mode Tensor Fix Incoming?

𝐃𝐞𝐥𝐭𝐚 𝐀𝐭𝐭𝐞𝐧𝐭𝐢𝐨𝐧 𝐑𝐞𝐬𝐢𝐝𝐮𝐚𝐥𝐬 [R]

I’m building an open-source decision layer above AI agents [P]

Call for Papers - Workshop on Efficient Reasoning at COLM 2026 [R]

(Yet Another) KV cache calculator - kvanta.vcerny.cz

Is Qwen3.6 current king for local agentic use?

Full Attention Strikes Back: Transferring Full Attention into Sparse within Hundred Training Steps

Ce sénateur vote pour les data centers de Meta… et empoche le jackpot

Sharing my 'Local-LLM-Toolkit' repo

The Financial Times has published an article about Heretic

Building a real-time power outage map with Next.js on Vercel

The reason small-model agent stacks aren't the default has nothing to do with whether they work

NuExtract3 released: open-weight 4B VLM for Markdown, OCR and structured extraction (self-hostable)

Pope Leo: opaque AI run by few firms risks "New Forms of Dehumanization"

Old Mac Pro still proving its worth

llama.cpp oom issue

OSCAR RotationZoo - Offline Spectral Covariance-Aware Rotation for 2-bit KV Cache Quantization

Vidéo : ils ont filmé un système immunitaire en train de dévorer un cancer

Call for Papers - Workshop on Unlearning and Model Editing U&ME at ECCV 2026 [R]

Google Deepmind's AlphaProof Nexus solves decades-old math problems for a few hundred dollars

numind/NuExtract3 · Hugging Face

George Hotz says coding agents will be "one of the most costly mistakes" in software development

I built a computer use sandbox framework for codex on headless linux. GPU passthrough, computer use, and sudo access for codex all work. It's the perfect dev sandbox to allow full auto work while minimizing the "rm -rf /" risk

MiMo-V2.5-coder

We added W8A8 activation quantization to MLX — prefill went from 2.84s to 2.52s on M5 Pro

AI models often give the right answers but point to the wrong sources

I made a local-first MCP tutorial repo with node-llama-cpp and a custom agent loop

Qwen 3.6 benchmarks on 2x RTX PRO 6000

server: fix checkpoints creation by jacekpoplawski · Pull Request #22929 · ggml-org/llama.cpp

1000 tps generation on Qwen3.6 27B with V100s

Wrote a custom C++ engine for MiniCPM-V 4.6 on Orange Pi AIPro (Ascend 310B) to bypass framework overhead

A Survey of Text and Speech Resources for Hausa and Fongbe: Availability, Quality, and Gaps for NLP Development

BOHM: Zero-Cost Hierarchical Attribution for Compound AI Systems

How Far Will They Go? Red-Teaming Online Influence with Large Language Models

When Determinants Are Not Enough: Private Rare Switching

Learnability-Informed Fine-Tuning of Diffusion Language Models

Computable Fairness: Boltzmann-Softmax Control for AI Resource Allocation

LFRAG: Layout-oriented Fine-grained Retrieval-Augmented Generation on Multimodal Document Understanding

KPI2KVI: A Multi Agent Workflow for Calculating Key Value Indicators from Service Descriptions

The Cognitive Kardashev Scale: Quantifying the Material Envelope of Civilisational Computation

Co-ReAct: Rubrics as Step-Level Collaborators for ReAct Agents

EDGE-OPD: Internalizing Privileged Context with Evidence Guided On-Policy Distillation

Ontological Knowledge Blocks: Executable Compliance and Profile-Based Validation for Trustworthy AI Systems

When Planning Fails Despite Correct Execution: On Epistemic Calibration for LLM-Based Multi-Agent Systems

SPACENUM: Revisiting Spatial Numerical Understanding in VLMs

GENSTRAT: Toward a Science of Strategic Reasoning in Large Language Models

ImProver 2: Iteratively Self-Improving LMs for Neurosymbolic Proof Optimization

When AI Takes Sides on Questions of Faith: Persistent Asymmetries in AI-Mediated Faith Guidance

GEMQ: Global Expert-Level Mixed-Precision Quantization for MoE LLMs

The Implicit Bias of Depth: From Neural Collapse to Softmax Codes

Anytime Training with Schedule-Free Spectral Optimization

Robust OT-Guided Generative Residual Domain Adaptation for Bike-Sharing Demand Prediction under Temporal Domain Shift

DFKI-MLT at SemEval-2026 TASK 7: Steering Multilingual Models Towards Cultural Knowledge

Uncovering the Latent Potential of Deep Intermediate Representations

World Machine: Towards Generative World Modeling for Time-Series

Smoothed Elicitation Complexity for Approximate $\Gamma$-calibration of Discrete Classification Tasks

HawkesLLM: Semantic Uncertainty Propagation in Agentic Text Simulation

Worse than Random: The Importance of a Baseline for Unsupervised Feature Selection

Steered Generation via Gradient-Based Optimization on Sparse Query Features

Learned Relay Representations for Forward-Thinking Discrete Diffusion Models

A mathematical theory of balancing relational generalization and memorization

Building a privacy-preserving Federated Recommender system for mobile devices

Tensor Cache: Eviction-conditioned Associative Memory for Transformers

The Readout Shortcut: Positional Number Copying Dominates Arithmetic CoT Readout in Small Language Models

Reading Calibrated Uncertainty from Language Model Trajectories

DreamerNLplus: Interpretable Modeling of Mental Health Dynamics from Social Media Timelines using Hybrid Rule-Based and RAG Methods

When Do LLMs Reason? A Dynamical Systems View via Entropy Phase Transitions

A Reproducible Universal Dependencies-Style Pipeline for Katharevousa Greek Parliamentary Text

Cultural Adaptation in Large Language Models for Political Discourse