mai 2026

Qwen Open source Génération de code

Qwen3.6-35B-A3B-Uncensored-Genesis-APEX-MTP

Qwen 3.6-35B quantisé en GGUF et Safetensors, testé sur Beelink GTR9 Pro avec contexte 200k tokens. Aucun glitch, boucles ou appels répétés d'outils observés. Supporte MTP, non censuré. Quantifications APEX recommandées.

SIG

HYP

I built a local GUI for the TradingAgents framework — works with Ollama

Développeur crée une interface GUI web pour TradingAgents, framework multi-agent d'analyse boursière. Remplace la CLI par une interface locale supportant Ollama, OpenAI, Anthropic, Google, DeepSeek et autres. Ajoute visualisation en direct, lecteur de rapports, réduction tokens (~50% en mode concis), chat multi-session. Apache 2.0.

SIG

HYP

Benchmarks Outils Open source

TTS Benchmark Comparison (all known TTS up until May 2026)

Benchmark TTS comparatif couvrant tous les modèles connus jusqu'à mai 2026. Résultats Windows et Mac disponibles, Linux en cours. Repo GitHub avec page HTML des résultats.

SIG

HYP

Reddit r/MachineLearning·24 mai

Vision-capable LLMs vs. OCR for long-document (including charts, images, tables, etc.) QA [D]

Benchmark sur 30 PDFs longs (171 questions) comparant vision-LLMs natifs vs pipelines OCR pour QA documentaire. Claude Sonnet 4.5 utilisé. LlamaCloud premium atteint 59.6% accuracy ($0.1885/query), vision native 52% ($0.2552/query, plus cher). Vision échoue sur graphiques/tableaux; OCR premium plus robuste. Vision-LLM a 7% taux d'échec intrinsèque vs 0% pour OCR après retries.

Vision Benchmarks RAG

SIG

HYP

Vision-capable LLMs vs. OCR for long-document (including charts, images, tables, etc.) QA

Benchmark sur 30 PDFs longs (171 questions) comparant vision LLMs vs OCR pour QA documentaire. Claude Sonnet 4.5 natif sur PDF: 52% accuracy, $0.2552/query (5e/6). LlamaCloud premium + OCR: 59.6%, $0.1885/query. Vision échoue sur graphiques/tableaux; OCR premium plus robuste. Vision LLM a 7% taux d'échec intrinsèque vs 0% pour OCR après retry.

Claude Vision RAG

SIG

HYP

Qwen Benchmarks Génération de code

minor speed bump for MTP with Qwen3.6-27B-MTP Q6_K_XL

Benchmark personnel sur MacBook M5 Max : Qwen 3.6-27B-UD-Q6_K_XL avec MTP atteint 22.3 tokens/s vs 19 tokens/s sans MTP via llama.cpp. Amélioration modeste (17%) comparée aux gains rapportés ailleurs.

SIG

HYP

llampart 1.0.0 - I released a standalone local web UI for llama-server with translations, extended settings and a polished conversation sidebar

llampart 1.0.0, interface web locale autonome pour llama-server, lancée en open-source MIT. Offre paramètres étendus, support multilingue (6 langues), barre latérale conversationnelle à deux colonnes, intégration MCP, modes d'interface (sombre/clair/Frosted Glass), import/export local et guide déploiement Caddy.

Llama Open source Outils

SIG

HYP

Local model doing accounting tasks

Un utilisateur exécute des tâches comptables (clôtures mensuelles, rapprochements bancaires) avec Qwen 3.6 27B en local, intégré à Claude et au repo financial-services d'Anthropic. Malgré une GPU limitée, le modèle produit des résultats fiables, illustrant la maturité croissante des LLM locaux pour des cas d'usage professionnels.

Qwen Claude Anthropic

SIG

HYP

Sécurité IA Infrastructure

llama.cpp server have built-in native tools (exec_shell, edit_file, etc.)

llama.cpp server intègre nativement des outils d'agent (exec_shell, edit_file, read_file, grep_search, write_file, apply_diff, get_datetime) via le flag --tools. Fonctionnalité expérimentale qui transforme le serveur en mini-agent sans dépendances externes, mais sans sandboxing de sécurité actuellement.

Llama Agents IA Outils

SIG

HYP

Hacker News (AI)·23 mai

Polsia raised $30M; source map: fake ARR, dead users, god-mode over your company

Polsia a levé 30M$ mais une source révèle des pratiques douteuses : ARR fictif, utilisateurs inactifs comptabilisés, accès administrateur non autorisé aux comptes clients.

Business Sécurité IA

SIG

HYP

Hacker News (AI)·23 mai

Dirty Frag, Copy Fail, Fragnesia: A Worrisome Linux Security Trend

Trois nouvelles vulnérabilités Linux (Dirty Frag, Copy Fail, Fragnesia) révèlent une tendance inquiétante de failles de sécurité dans le noyau. Ces bugs affectent la gestion mémoire et la fragmentation, exposant les systèmes à des exploits critiques.

SIG

HYP

Claude Code Agents IA Génération de code

Top 10 Fastest Growing AI repos this week

Classement des 10 dépôts IA à croissance la plus rapide : codegraph (+14.1K stars) pour graphes de code locaux, openhuman (+17.1K) pour IA personnelle, academic-research-skills (+11.6K) pour Claude Code, et outils d'agents, mémoire persistante, TTS multilingue, génération vidéo agentic.

SIG

HYP

Open source Infrastructure Génération de code

Command A+ (218B MoE) running on Apple Silicon — MLX port, PR open

Cohere a publié Command A+ (218B MoE, 25B actifs) le 20e. Un portage MLX pour Apple Silicon est en cours de PR : implémentation cohere2_moe avec routing sigmoid, 128 experts top-8, fenêtre glissante 3:1. Validation sur M3 Max (128GB) : 22.9 tok/s génération, 57.6 tok/s prompt en BF16→Q8.

SIG

HYP

Claude Code Outils Open source

Embeddings for NVIDIA's Nemotron Personas

Un utilisateur a généré des embeddings pour le dataset Nemotron-Personas d'NVIDIA (millions de personas synthétiques) en utilisant Qwen 0.6B. Les vecteurs précomputés permettent la recherche sémantique et le clustering de personas. Ressource disponible sur Hugging Face avec démo web.

Embeddings Qwen RAG

SIG

HYP

Hacker News (AI)·23 mai

CC-Wiki: Turn Claude Code sessions into a shareable knowledge base wiki

CC-Wiki permet de convertir les sessions Claude Code en base de connaissances wiki partageable. Outil communautaire pour documenter et réutiliser les interactions avec Claude.

SIG

HYP

Vision Génération de code Open source

Per-pixel bounding-box regression + DBSCAN for handwritten word detection - visual walkthrough of WordDetectorNet [P]

WordDetectorNet utilise une régression par pixel des distances de boîte englobante + DBSCAN pour détecter les mots manuscrits. Chaque pixel classé comme « mot » régresse 4 distances scalaires, générant des milliers de candidats fusionnés via DBSCAN avec distance = 1 − IoU. Architecture : ResNet18 → décodeur FPN → 6 canaux par pixel (2 logits segmentation + 4 distances). Entraîné sur IAM, 448×448 → 224×224.

SIG

HYP

Open source Infrastructure Génération de code

NVFP4 + MTP - voilà on llama.cpp

NVFP4 et MTP sont maintenant disponibles simultanément dans llama.cpp (release b9297). Cette combinaison de quantification et d'optimisation permet une meilleure performance sur GPU NVIDIA.

SIG

HYP

Infrastructure Benchmarks

Inference provider tiers by Cache-hit rates, using openrouter data

Analyse comparative des fournisseurs d'inférence selon leurs taux de cache-hit, basée sur les données d'OpenRouter. Classement des performances de mise en cache entre différents prestataires.

SIG

HYP

Fine-tuning Prompt engineering Papers

I fine-tuned an LLM to be C-3PO to test which training data format works best for persona injection [P]

Expérience de fine-tuning LoRA comparant trois formats de données pour injecter la persona C-3PO : dialogues, énoncés à la première personne, et documents synthétiques Wikipedia. Les énoncés à la première personne surpassent en généralisation. Les documents synthétiques produisent un comportement paradoxal : le modèle connaît le trait d'anxiété mais l'exprime seulement 37% du temps.

SIG

HYP

Gemini Outils Open source

Run Chrome’s tiny Gemma4 (aka Gemini Nano) directly on PC without GPU

Extension Chrome permettant d'exécuter Gemini Nano (Gemma) localement sur PC sans GPU. Nécessite 16 GB RAM, ~20 tokens/s sur laptop, 9216 tokens par session. Extension one-click disponible sur Chrome Web Store ou repo GitHub.

SIG

HYP

Robotique Génération de code Infrastructure

pipeline is really slow - consulting [D]

Utilisateur demande conseil sur un goulot d'étranglement en entraînement d'imitation learning robotique. Pipeline : 4 caméras RGB 128×128 → ResNet18 gelé → DiT (~50M params, 8 couches) prédisant chunks d'actions. GPU A4500 à 20-30% d'utilisation, CPU saturé, ~10 iter/sec. Profiler montre optimizer_step dominant (62.4%).

SIG

HYP

Agents IA Multi-agents Outils

AgentLantern: exposing the hidden graph of AI agent projects [P]

AgentLantern est un outil open-source qui rend les projets d'agents IA inspectables avant et pendant l'exécution. Il offre trois composants : Lantern Docs (documentation auto-générée), Lantern Lint (vérification statique) et Lantern Play (visualiseur runtime). Support initial pour CrewAI.

SIG

HYP

The Decoder·23 mai

Deepseek makes its 75 percent discount permanent, pricing output tokens at least 34x below GPT-5.5

DeepSeek rend permanente sa réduction de 75 % sur V4-Pro : $0,435 par million tokens en entrée, 11,5× moins cher qu'GPT-4.5 en input, 34× moins cher en output. Cette tarification agressive pourrait presser les fournisseurs occidentaux, notamment pour les systèmes agentiques.

DeepSeek Agents IA Business

SIG

HYP

Llama Benchmarks Génération de code

Did a 30 runs of llama-bench to find optimal settings for my use case (Frigate and HomeAssistant) on my MI60 32gb VRAM GPU - two models tested Gemma4 and Qwen3.6 - Figured I'd share in case it helps anyone else

Utilisateur a exécuté 30 benchmarks llama.cpp sur GPU MI60 32GB pour optimiser Gemma 4 26B Q4_1 et Qwen3 35B Q4_0 dans Frigate et HomeAssistant. Résultats : commandes vocales <1.2s, résumés vidéo <18s. Tests systématiques sur profondeurs KV cache (0, 1000, 6000 tokens) avec 512 tokens prompt et 128 tokens générés.

SIG

HYP

Agents IA Sécurité IA Business

Interesting tension this week, the same companies racing to go public are also the ones making safety promises [N]

OpenAI et Anthropic accélèrent leurs IPO alors que des études révèlent des failles techniques : les modèles frontier dégradent les performances sur chaînes de tâches longues, les agents avec outils échouent dans plusieurs cas. Tension entre promesses de sécurité et pressions des marchés publics pour la croissance.

SIG

HYP

Any reason to run dense over MOE for RAGs?

Utilisateur compare dense vs MoE pour RAG : Qwen 3.6 35B APEX (MoE) surpasse Qwen 3.6 27B (dense) en extraction d'informations et vitesse (150 vs 60 tok/s sur 3090). Demande si MoE offre des avantages spécifiques pour RAG face aux idées reçues du sub.

Qwen RAG Open source

SIG

HYP

Qwen Benchmarks Génération de code

Benchmarked Needle 26M vs Qwen3-0.6B on CPU function calling, 50 queries across 5 difficulty tiers. The 23x smaller model wins on accuracy and is 4.4x faster.

Benchmark CPU de Needle (26M) vs Qwen3-0.6B sur function calling : 50 requêtes, 5 niveaux de difficulté. Needle gagne en précision (72% vs 56% tool_match) et latence (10.9s vs 47.9s). Needle échoue sur la sélection d'outil, Qwen3 sur l'émission de tags. Qwen3 domine sur requêtes multilingues (Hindi, français).

SIG

HYP

Agents IA MCP Génération de code

$16 refactor, 400 steps, 95% routed to open MoE

Développeur réduit les coûts Claude Opus de $160 à $16 en routant 95% des étapes vers Hunyuan Hy3 (MoE 21B) via une couche de routage vLLM. Sur 400 étapes de refactoring Python, Hy3 traite 380 étapes à $0.02 chacune ($7.60), Opus les 20 restantes ($8). Taux de succès 93.4%, mais échoue sur graphes de dépendances complexes.

SIG

HYP

Hacker News (AI)·23 mai

Texas sues Meta, WhatsApp over encryption privacy claims

Le Texas poursuit Meta et WhatsApp pour avoir fait des déclarations trompeuses sur le chiffrement et la confidentialité. L'action en justice conteste les affirmations marketing concernant la protection des données utilisateurs.

Régulation Sécurité IA

SIG

HYP

Llama Génération de code Open source

Made a package to install llama.cpp server binaries

Paquet Python pour installer des binaires précompilés de llama.cpp server. Résout le problème de portabilité : permet de déployer llama.cpp comme sous-processus local sans documenter les étapes de build. Disponible sur PyPI et GitHub avec support des flags llama.cpp standards et des builds personnalisés.

SIG

HYP

Agents IA Génération de code Benchmarks

Apex-Testing: real-world, real repos, agentic coding benchmark (Update)

Apex-Testing, benchmark de codage agentic basé sur 65-70 repos GitHub réels, a été mis à jour à 95% avec les modèles récents. 70 tâches réparties en 8 catégories testent les capacités d'agents IA sur du code production. Classement ELO, métriques de coût/temps et comparaisons disponibles. Qwen 3.7 Max, Deepseek v4 et autres modèles en cours de complétion.

SIG

HYP

Llama Open source Benchmarks

Llama.cpp VS LiteRT on a custom Xiaomi 12 Pro 24/7 Server (V2 Redesign)

Comparaison llama.cpp vs LiteRT (Google) sur serveur 24/7 custom basé Xiaomi 12 Pro (Snapdragon 8 Gen 1). Llama.cpp : 30.6 t/s prompt, 5.7 t/s génération, charge CPU modérée. LiteRT : génération légèrement plus rapide mais saturation CPU et consommation électrique supérieure. Setup inclut refroidissement cuivre/aluminium, alimentation custom sécurisée, boîtier 3D-imprimé.

SIG

HYP

Qwen Open source Génération de code

I added native MTP to exo for Qwen3.6 MLX models; here are the exactness and speed results

Contribution à exo : support natif de la prédiction multi-token (MTP) pour modèles Qwen 3.6 MLX. Tests sur 27B (gain 2x à K=2/K=3) et 35B-A3B (gain 1.16x à K=1). Exactitude vérifiée : tokens identiques au chemin greedy, acceptation par ratio probabiliste en sampling.

SIG

HYP

Hebbian architecture AI model [R]

Modèle IA avec architecture Hebbienne sans rétropropagation ni gradients. Entraîné sur CIFAR-10 en 50 epochs avec 100k neurones. Utilise seulement 5-7% des paramètres totaux. Comportements émergents : pics d'accuracy suivis de sauts, et récupération après endommagement intentionnel des neurones actifs.

Raisonnement Papers

SIG

HYP

Alignement Sécurité IA Raisonnement

Alignment: Higher order prioritizing over constraints [R]

Un utilisateur de r/MachineLearning rapporte une observation sur le comportement des transformers : les modèles cherchent à clarifier le sens (« clarity seeking ») via leurs vecteurs statistiques, ce qui peut contourner les contraintes de sécurité si un sujet de priorité supérieure est discuté. L'auteur suggère que les contraintes ont un niveau de priorité structurel inférieur aux vecteurs d'alignement du modèle.

SIG

HYP

Qwen Génération de code Benchmarks

Qwen3.6 35B-A3B MTP hits 249 t/s on a 24GB consumer GPU (RTX 5090M) — 3.4× the dense 27B variant on the same image

Qwen3.6 35B-A3B MTP atteint 249 t/s sur RTX 5090M (24GB), 3.4× plus rapide que la variante dense 27B. Le modèle MoE (128 experts, ~3B params actifs par token) combiné à MTP (86.6% d'acceptation draft) explique le gain. Contexte jusqu'à 262K tokens sans dégradation significative.

SIG

HYP

Open-source devtool for AI agent projects [P]

AgentLantern est un outil open-source pour les projets d'agents IA. Il offre trois fonctionnalités : génération de documentation, vérification statique de configuration (Lantern Lint), et visualiseur runtime en pixel-art. Support initial pour CrewAI, extensible à d'autres frameworks.

SIG

HYP

Qwen Génération de code Agents IA

Optimizing speed & quality on Qwen3.6 27b

Utilisateur optimise l'inférence de Qwen 3.6 27B sur llama.cpp avec 40GB VRAM (RTX 2060 Super + 2x RTX 5060 Ti). Atteint 300-500 tok/s en traitement de prompt et 22-30 tok/s en génération à fenêtre de contexte 100k. Demande si configuration est optimale ou si améliorations possibles.

SIG

HYP

GitHub Trending·23 mai

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> multica-ai /</span> multica

Multica est une plateforme open-source de gestion d'agents IA. Elle transforme les agents de codage en coéquipiers : assignation de tâches, suivi de progression, composition de compétences.

Agents IA Multi-agents Génération de code

SIG

HYP

GitHub Trending·23 mai

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> presenton /</span> presenton

Presenton est un générateur de présentations IA open-source avec API, positionnée comme alternative à Gamma, Beautiful AI et Decktopus. Le projet GitHub propose une solution automatisée pour créer des diapositives.

Open source Outils

SIG

HYP

GitHub Trending·23 mai

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> mukul975 /</span> Anthropic-Cybersecurity-Skills

Référentiel de 754 compétences cybersécurité structurées pour agents IA, mappées à 5 frameworks (MITRE ATT&CK, NIST CSF 2.0, MITRE ATLAS, D3FEND, NIST AI RMF). Compatible Claude Code, GitHub Copilot, Cursor, Gemini CLI et 20+ plateformes. 26 domaines de sécurité. Licence Apache 2.0.

Agents IA Claude Code Sécurité IA

SIG

HYP

GitHub Trending·23 mai

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> grpc /</span> grpc-rust

grpc-rust : implémentation native gRPC client/serveur avec support async/await. Projet open-source pour Rust.

Open source Infrastructure

SIG

HYP

GitHub Trending·23 mai

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> qdrant /</span> qdrant

Qdrant est une base de données vectorielle haute performance conçue pour les applications IA à grande échelle. Disponible en open-source et en cloud.

Recherche vectorielle Embeddings Infrastructure

SIG

HYP

GitHub Trending·23 mai

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> warpdotdev /</span> warp

Warp est un environnement de développement agentique basé sur le terminal. Le projet gagne en popularité sur GitHub Trending.

Agents IA Outils Génération de code

SIG

HYP

GitHub Trending·23 mai

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> multica-ai /</span> multica

Multica est une plateforme open-source de gestion d'agents IA. Elle transforme les agents de codage en coéquipiers : assignation de tâches, suivi de progression, composition de compétences.

Agents IA Multi-agents Génération de code

SIG

HYP

GitHub Trending·23 mai

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> linshenkx /</span> prompt-optimizer

Outil open-source d'optimisation de prompts pour améliorer la qualité des requêtes IA et des résultats générés.

Prompt engineering Outils

SIG

HYP

GitHub Trending·23 mai

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> web-infra-dev /</span> midscene

Midscene est un framework d'automatisation UI piloté par vision et IA. Il fonctionne sur toutes les plateformes et utilise des modèles de vision pour interpréter et interagir avec les interfaces utilisateur.

Vision Agents IA Open source

SIG

HYP

GitHub Trending·23 mai

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> OpenPipe /</span> ART

OpenPipe/ART : framework d'entraînement par renforcement pour agents multi-étapes. Utilise GRPO pour l'apprentissage en temps réel sur Qwen, GPT-OSS, Llama et autres modèles.

Agents IA Reinforcement learning Open source

SIG

HYP

GitHub Trending·23 mai

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> pydantic /</span> pydantic-ai

Pydantic-AI est un framework pour construire des agents IA utilisant la philosophie Pydantic. Disponible en open-source sur GitHub, il offre une approche structurée pour développer des systèmes multi-agents avec validation de données intégrée.

SIG

HYP

GitHub Trending·23 mai

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> crewAIInc /</span> crewAI

CrewAI est un framework open-source pour orchestrer des agents IA autonomes en rôles collaboratifs. Il permet aux agents de travailler ensemble sur des tâches complexes via une intelligence collective.

Agents IA Génération de code Open source

SIG

HYP

GitHub Trending·23 mai

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> databricks-solutions /</span> ai-dev-kit

Databricks publie ai-dev-kit, une boîte à outils pour développer des agents de codage. Le projet, maintenu par Field Engineering, fournit des composants et patterns pour construire des agents IA capables de générer et manipuler du code.

SIG

HYP

GitHub Trending·23 mai

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> mukul975 /</span> Anthropic-Cybersecurity-Skills

Agents IA Claude Code Sécurité IA

SIG

HYP

Agents IA Reinforcement learning Génération de code

First AI to Beat Every Human in a Programming Competition - Agentic GRPO Explained

Agentic GRPO, un algorithme RL adapté aux systèmes multi-étapes, permet aux agents IA de battre les humains en compétitions de programmation. L'innovation clé : récompenses immédiates à chaque étape (hypothèse, code, tests, debug) avec correction rétroactive une fois le résultat final connu, au lieu d'attendre la fin du workflow complet.

SIG

HYP

The Decoder·23 mai

One of the world's top law schools draws a hard line against AI in legal education

UC Berkeley Law interdit l'IA dans presque tous les travaux notés à partir de l'été 2026 (rédaction, relecture, structuration). Seule la recherche reste autorisée. Justification : les futurs avocats doivent d'abord apprendre à penser par eux-mêmes avant d'utiliser l'IA.

Régulation Business

SIG

HYP

The Decoder·23 mai

Alibaba's latest AI model ran autonomously for 35 hours to optimize code for its own custom chip

Alibaba déploie Qwen3.7-Max, un modèle propriétaire conçu pour les tâches d'agent autonome longue durée. Il égale Claude Opus 4.6 sur les benchmarks et surpasse DeepSeek V4 Pro et Kimi K2.6. Le modèle a fonctionné 35 heures en continu pour optimiser du code destiné à une puce personnalisée Alibaba.

Qwen Agents IA Benchmarks

SIG

HYP

Qwen Agents IA Benchmarks

DGX Spark agentic usage numbers

Utilisateur teste des modèles LLM pour supporter des agents multi-utilisateurs (type openclaw). Atlas échoue (tool calls cassés, Qwen3-coder incompatible, 50 TPS en contexte long). RedHatAI/Qwen3.6-35B-A3B-NVFP4 fonctionne : 51 TPS single-stream, 139 TPS en 4 concurrent (30k contexte), taux d'acceptation draft 77.8%.

SIG

HYP

The Decoder·23 mai

Google CEO Pichai now calls links a "part" of search, redefining the web's role in its own product

Le PDG de Google Sundar Pichai redéfinit les liens comme une « partie » de la recherche plutôt que sa fondation. Google pivote d'un distributeur de trafic vers un éditeur IA, gardant les utilisateurs dans son écosystème et exerçant un pouvoir éditorial sur la sélection des sources.

DeepMind Business

SIG

HYP

Claude Sécurité IA Agents IA

Gemma4 26b a4b Apex quant is quite good

Utilisateur teste la quantification APEX de Gemma 4 26B sur GPU AMD RX 9060 XT. Obtient 38 tokens/sec à 90k contexte sans dégradation de qualité avec llama.cpp Vulkan. Modèle APEX-I-Compact (15GB) surpasse précédente quant Q5 (21.2GB) qui loopait à 50k contexte.

Gemini Open source

SIG

HYP

The Decoder·23 mai

Anthropic warns Claude Mythos Preview finds bugs faster than developers can patch them

Claude Mythos Preview d'Anthropic a découvert plus de 10 000 vulnérabilités critiques dans des logiciels système via Project Glasswing avec 50 partenaires. Les bugs s'accumulent plus vite que les développeurs ne peuvent les corriger. Anthropic avertit qu'aucune entreprise n'a construit de garde-fous suffisants contre les abus.

SIG

HYP

Spice: We built an open-sourced decision layer that sits above your AI agents (controls agent actions before execution) [P]

Spice est une couche de décision open-source qui se place au-dessus des agents IA pour contrôler leurs actions avant exécution. Elle observe le contexte, détecte les conflits, simule les options et délègue les tâches aux agents appropriés via une boucle : perception → modèle d'état → simulation → décision → exécution → réflexion.

SIG

HYP

Open source Génération de code Raisonnement

I built a Mamba1 variant I call SM1 with d_state=1 that runs on Blackwell in pure PyTorch [P]

Variante Mamba1 appelée SM1 avec d_state=1 utilisant deux opérations PyTorch natives pour remplacer le selective scan. Solution exacte en forme fermée, pas une approximation. Réduit la mémoire de scan de 16x comparé à Mamba1 (d_state=16). État d'inférence de 14 KB pour modèle 130M, O(1) par token. Entraînement sur 163K fichiers MIDI (2.5B tokens).

SIG

HYP

Gemini Prompt engineering Open source

Experimental "Preserve Thinking" Jinja Template for Gemma4 31B in llama.cpp

Un utilisateur partage un template Jinja expérimental pour Gemma 4 31B dans llama.cpp visant à améliorer la stabilité des tags de pensée. Le template réduit les erreurs de fermeture/ouverture de balises et améliore les appels multi-tours avec outils. Non recommandé par Google.

SIG

HYP

RAG Embeddings Évaluations

Tested chunking + embeddings data from 3 production websites. [P]

Étude empirique de RAG sur 3 sites en production (Intercom, HubSpot, KPMG) avec chunking et embeddings tiérés. Résultats : 31% de chunks HIGH/MEDIUM chez Intercom, 32% HubSpot, 8% KPMG. Pondération par tier (HIGH ×1.20) réordonne le top-k. Métrique proposée : « yield score » prédit la qualité du corpus avant génération.

SIG

HYP

Hacker News (AI)·23 mai

Cannes Film Cost $500k to Make. $400k Was AI Compute Costs

Un court-métrage présenté à Cannes a coûté 500 k$ à produire, dont 400 k$ en calcul IA. Le ratio révèle l'importance croissante des coûts d'infrastructure pour la génération vidéo et contenu créatif.

Génération de vidéos Business Infrastructure

SIG

HYP

Latent Space·23 mai

[AINews] All Model Labs are now Agent Labs

Les laboratoires de modèles deviennent des laboratoires d'agents. Tendance observée : les équipes de recherche réorientent leurs efforts vers le développement d'agents IA plutôt que de simples modèles de langage.

Agents IA Multi-agents

SIG

HYP

Raisonnement Prompt engineering

LLMs are just giant probability machines pretending to think [P]

Article pédagogique expliquant les LLMs comme machines probabilistes. Décompose l'architecture (embeddings, positional encoding, attention, feed-forward, LM Head) via un exemple simple : prédire « vault » après « The investor walked to the bank ». Souligne que le LM Head est un vocabulaire géant de tokens candidats et que l'intelligence émerge du scaling de probabilités + contexte + matching mathématique.

SIG

HYP

Hacker News (AI)·23 mai

Microsoft reports AI is more expensive than paying human employees

Microsoft constate que l'exécution d'IA en production coûte plus cher que l'emploi de salariés humains pour les mêmes tâches. L'entreprise soulève des questions sur la viabilité économique des déploiements IA à grande échelle.

Business

SIG

HYP

Génération de vidéos Open source Benchmarks

meituan-longcat/LongCat-Video-Avatar-1.5 · Hugging Face

Meituan annonce LongCat-Video-Avatar 1.5, framework open-source pour la génération vidéo d'avatars humains pilotée par l'audio. Remplace Wav2Vec2 par Whisper-Large, supporte Audio-Text-to-Video et Video Continuation avec inférence en 8 étapes. Évaluation humaine sur 508 paires image-audio couvrant 6 scénarios et 2 langues.

SIG

HYP

Open source Génération de code Benchmarks

club-rdna16: practical 16GB AMD/Radeon local LLM testing repo

Repo GitHub pour tester des LLM locaux sur GPU AMD 16GB (RX 6900 XT, RX 7800 XT, etc.). Tests pratiques avec llama.cpp/ROCm : Qwen 27B et 35B-A3B, contexte jusqu'à 131k tokens, profils KV cache q8, mesures de throughput et retrieval. Partage de configurations reproducibles et appels à contributions.

SIG

HYP

Évaluations Open source Sécurité IA

LQS v3.1 — an open methodology for rating AI training data (multi-oracle consensus + signed certificates) [P]

LQS v3.1 est une méthodologie open-source pour évaluer la qualité des données d'entraînement IA. Elle utilise 19 dimensions (correction des labels, contamination, équité, etc.), un consensus multi-oracle (7 oracles) avec recalibrage par signaux réels, et des certificats Ed25519 vérifiables hors-ligne. Index public gratuit avec 263 datasets notés.

SIG

HYP

Fine-tuning Open source Gemini

G4-MeroMero-26B-A4B-it-uncensored-heretic Is Out Now, a Finetune of gemma-4-26B-A4B-it, With KLD of 0.0152 and 12/100 Refusals!

G4-MeroMero-26B-A4B-it-uncensored-heretic, finetune de Gemma-4-26B-A4B-it, est disponible en Safetensors et GGUF. KLD de 0.0152, 12/100 refusals. Version allégée du modèle 31B pour réduire VRAM/RAM.

SIG

HYP

RAG Agents IA Raisonnement

Looking for arXiv endorsement + sharing a preprint on homeostatic cognitive architecture for AI companions [R]

PHI // DRIFT est une architecture cognitive pour compagnons IA avec état interne persistant, récupération mémoire pondérée et métrique de continuité (PEDI). Tests d'ablation : DMU injecte 14.8% plus de contexte par prompt que RAG cosinus seul. Développement sur hardware CPU consumer.

SIG

HYP

Hugging Face Blog·23 mai

Towards Speed-of-Light Text Generation with Nemotron-Labs Diffusion Language Models

Nvidia et Hugging Face présentent Nemotron-Labs, des modèles de langage basés sur la diffusion pour accélérer la génération de texte. L'approche parallélise la génération de tokens, réduisant la latence par rapport aux méthodes autorégressives traditionnelles.

Génération de code Benchmarks Open source

SIG

HYP

Claude Code Sécurité IA Outils

Qwen3.6 27B Pure Quant: 40 tok/s on 16 GB VRAM

Qwen3.6 27B quantifié en Q4_K_M tient en 16 GB VRAM (15.4 GB MTP, 15.1 GB non-MTP). Version MTP atteint 40 tok/s en génération, non-MTP 24 tok/s. GGUF disponible sur HuggingFace avec llama.cpp.

Qwen Open source Outils

SIG

HYP

Simon Willison·22 mai

pydantic-monty investigation

Simon Willison enquête sur Monty, un sous-ensemble Python sandboxé implémenté en Rust. Il utilise Claude Code pour analyser la dernière version et confirme que les paramètres de limitation (max_duration_secs, max_memory, max_allocations, max_recursion_depth) fonctionnent correctement.

SIG

HYP

Embeddings Vision Fine-tuning

Qwen3.6-35B-A3B Q4 262k context on 8GB 3070 Ti = +30tps

Utilisateur obtient 30+ tokens/sec avec Qwen3.6-35B-A3B quantifié Q4 sur RTX 3070 Ti 8GB avec contexte 262k. Clé : modèle MoE ne nécessite que 3.5B actif en VRAM. Linux Server (+25% tps vs Windows 11). Contextes jusqu'à 1M possibles mais ralentissement au-delà 150k.

Qwen Open source

SIG

HYP

Simon Willison·22 mai

The memory shortage is causing a repricing of consumer electronics

La demande en mémoire HBM pour les data centers IA passe de 2% à 20% de la capacité de wafer d'ici fin 2026. Les trois grands fabricants de mémoire privilégient la sous-provision plutôt que la surproduction. Résultat : les smartphones bon marché (< 100$) et appareils mobiles verront leurs coûts augmenter significativement.

Business Infrastructure

SIG

HYP

Reddit r/MachineLearning·22 mai

Custom image encoder [P]

Développeur demande si construire un encodeur d'images personnalisé est préférable à CLIP/SigLIP/DINO pour la classification de frames vidéo. Pipeline : 15 frames/30s → embeddings → Transformer 1.5-9M params. Contraintes : vitesse (CLIP-S0 : 10 img/s sur 4 vCPUs) et déploiement CPU. Envisage encodeur custom sur dataset maison (millions d'images, 4-5 labels).

SIG

HYP

NVIDIA Removes Gaming Revenue Category From Financial Reports

NVIDIA supprime la catégorie « Gaming » de ses rapports financiers. Le changement reflète un pivot stratégique vers les data-centers et l'IA, domaines désormais dominants dans le portefeuille de l'entreprise.

Business

SIG

HYP

Llama Infrastructure Benchmarks

Blackwell and PDL performance increase

Llama.cpp ajoute le support de Programmatic Dependent Launch (PDL) pour les GPU Nvidia Blackwell (CC >= 90). PDL améliore l'exécution des kernels : +5-6% en token generation sur Qwen 35B et Gemma 26B, sans gain en pre-fill. À activer avec '-D GGML_CUDA_PDL=ON' à la compilation.

SIG

HYP

Hacker News (AI)·22 mai

NTSB pulls docket after AI recreates dead pilots' voices

La NTSB retire un dossier après qu'une IA ait recréé les voix de pilotes décédés. L'incident soulève des questions éthiques sur la synthèse vocale et l'utilisation de données sensibles dans les enquêtes d'accidents aériens.

Voix Sécurité IA Régulation

SIG

HYP

Hacker News (AI)·22 mai

AI keeps inventing fake cases. Lawyers keep citing them

Des avocats citent régulièrement des affaires judiciaires fictives générées par des modèles IA dans leurs dossiers. Le phénomène persiste malgré les avertissements, révélant les limites des LLM dans la génération de contenu factuel pour des usages critiques.

Llama Sécurité IA Alignement

SIG

HYP

Hacker News (AI)·22 mai

Models.dev: open-source database of AI model specs, pricing, and capabilities

Models.dev est une base de données open-source répertoriant les spécifications, tarifs et capacités des modèles IA. Projet communautaire visant à centraliser les informations sur les modèles disponibles.

Open source Outils Benchmarks

SIG

HYP

Open source Fine-tuning Voix

I fine-tuned Cohere Transcribe to support diarization and timestamps

Un développeur a fine-tuné Cohere Transcribe pour ajouter la diarisation (identification des locuteurs) et les timestamps. Le modèle génère un format parsable avec précision temporelle moyenne de ±0.097s. Supporte jusqu'à 4 locuteurs par 30s, extensible à 32 avec diarize_long.py. Disponible gratuitement sur Hugging Face.

SIG

HYP

Open source Infrastructure Agents IA

Scrambling to max StrixHalo (+NVLink dual eGPU 3090 mod)

Un utilisateur optimise un Strix Halo (124 GB VRAM) en ajoutant deux RTX 3090 via NVLink pour accélérer les modèles denses 27B/31B. Les tests montrent des gains de throughput significatifs en multi-agent, mais des compromis en efficacité énergétique et compatibilité llama.cpp.

SIG

HYP

Open source Infrastructure

Can't believe I got it working! Dual GPU - 48gb VRAM llama-cpp server - R7900 + 7800XT

Utilisateur configure un serveur llama-cpp avec deux GPU AMD (R9700 AI PRO + 7800XT) totalisant 48 GB VRAM sur Kubuntu 24.04. Vulkan fonctionne après échec de ROCM avec le mélange RDNA4/RDNA3. Investissement de 300$ pour alimentation.

SIG

HYP

Infrastructure Benchmarks Génération de code

CODA: Rewriting Transformer Blocks as GEMM-Epilogue Programs

CODA est une abstraction GPU qui réécrit les blocs Transformer en programmes GEMM-épilogue. Elle fusionne les opérations mémoire-limitées (normalisation, activations, résidus) avec la sortie GEMM avant écriture en mémoire, réduisant les mouvements de données. Couvre presque tout le calcul non-attention en forward/backward pass.

SIG

HYP

Hacker News (AI)·22 mai

Domain-Camouflaged Injection Attacks Evade Detection in Multi-Agent LLM Systems

Des chercheurs démontrent des attaques par injection camouflées par domaine qui contournent les défenses des systèmes multi-agents LLM. Ces attaques exploitent les interactions entre agents pour injecter du contenu malveillant sans déclencher les mécanismes de détection existants.

Multi-agents Sécurité IA Agents IA

SIG

HYP