Archives

mai 2026

3147 articles

arXiv cs.AI·

When Planning Fails Despite Correct Execution: On Epistemic Calibration for LLM-Based Multi-Agent Systems

Les systèmes multi-agents basés sur LLM échouent parfois malgré une exécution correcte des plans, car les agents mal évaluent leurs connaissances (« epistemic miscalibration »). Les auteurs proposent EPC-AW, un workflow qui sélectionne les plans stables entre agents et affine l'état épistémique au fil du temps. Amélioration de 9,75% du succès système.

Multi-agentsAgents IARaisonnement
SIG
72
HYP
15
arXiv cs.AI·

KPI2KVI: A Multi Agent Workflow for Calculating Key Value Indicators from Service Descriptions

KPI2KVI est un outil qui transforme des descriptions de services en langage naturel en estimations de Key Value Indicators (KVIs) via un workflow multi-agent déterministe avec LLMs. Le système élicite le contexte manquant, extrait les catégories KVI pertinentes, génère des KPIs spécifiques au service, collecte les valeurs via dialogue interactif, et calcule des KVIs avec explications traçables.

Agents IAMulti-agentsPrompt engineering
SIG
72
HYP
25
arXiv cs.AI·

Inductive Deductive Synthesis: Enabling AI to Generate Formally Verified Systems

IDS (Inductive Deductive Synthesis) est un système multi-agent LLM qui synthétise conjointement implémentation et preuve formelle pour les systèmes distribués. Sur 7 spécifications de key-value stores, IDS atteint 7/7 en 6.8h/$106, contre 2/7 pour GPT-5.4 et Claude Opus 4.6. Résultat 200x plus rapide que l'effort expert, 17% moins cher que les agents SOTA.

Agents IAMulti-agentsGénération de code
SIG
82
HYP
28
arXiv cs.AI·

SciAtlas: A Large-Scale Knowledge Graph for Automated Scientific Research

SciAtlas est un graphe de connaissances académique à grande échelle intégrant 43M articles de 26 disciplines, 157M entités et 3B triplets. Il propose un algorithme de récupération neuro-symbolique avec rappel tri-chemin et réclassement graphique pour améliorer la recherche sémantique et réduire les coûts d'inférence des agents IA en recherche scientifique automatisée.

Agents IARAGBenchmarks
SIG
78
HYP
25
arXiv cs.LG·

Robust OT-Guided Generative Residual Domain Adaptation for Bike-Sharing Demand Prediction under Temporal Domain Shift

Gen-ROTDA, une méthode de transport optimal robuste, adapte les modèles de prédiction de demande Citi Bike à travers les années (2021-2026). Elle transfère les résidus plutôt que les demandes brutes et utilise un générateur de caractéristiques préservant les labels. Gen-ROTDA atteint le MAE le plus bas sur la tâche 2025-2026 et surpasse les variantes OT non-robustes sous données anormales.

BenchmarksPapers
SIG
72
HYP
15
arXiv cs.LG·

The Implicit Bias of Depth: From Neural Collapse to Softmax Codes

Étude théorique montrant que la profondeur des réseaux de neurones induit un biais implicite vers des solutions de faible rang, alternatives au neural collapse. Analyse des dynamiques d'entraînement du modèle UFM (unconstrained feature model) sans régularisation, révélant comment la profondeur favorise les softmax codes plutôt que les géométries structurées classiques.

PapersRaisonnementBenchmarks
SIG
75
HYP
15
arXiv cs.LG·

Uncovering the Latent Potential of Deep Intermediate Representations

Étude sur la distribution non-monotone d'informations pertinentes aux tâches dans les couches intermédiaires des modèles fondamentaux. Propose LOES (Layer-wise Optimal Embedding Selection), méthode spectrale identifiant les sous-espaces discriminants, et GeoReg, régularisation géométrique stabilisant les représentations lors du fine-tuning. Gains croissants avec la profondeur du modèle.

Fine-tuningEmbeddingsPapers
SIG
72
HYP
15
arXiv cs.CL·

HawkesLLM: Semantic Uncertainty Propagation in Agentic Text Simulation

HawkesLLM modélise la propagation d'incertitude sémantique dans les systèmes de simulation textuelle multi-agents. Un processus de Hawkes multivariable capture les dépendances temporelles entre agents générateurs de texte, tandis qu'un LLM génère chaque nouvel événement à partir d'une mémoire compacte. Évaluation sur GDELT montre une meilleure alignement sémantique en fin de cascade.

Agents IAMulti-agentsRaisonnement
SIG
72
HYP
15
arXiv cs.LG·

Steered Generation via Gradient-Based Optimization on Sparse Query Features

Prototype-Based Sparse Steering applique des Sparse Autoencoders aux activations d'attention query des LLMs pour décomposer les représentations en features interprétables. L'optimisation par gradient pendant l'inférence aligne ces représentations avec des prototypes de comportements cibles. Validé sur Textualized Gridworld (contraintes de planification) et domaine éducatif (complexité cognitive via Bloom's Taxonomy).

RaisonnementFine-tuningPapers
SIG
72
HYP
18
arXiv cs.LG·

A mathematical theory of balancing relational generalization and memorization

Étude théorique sur l'équilibre entre généralisation relationnelle et mémorisation dans les systèmes d'apprentissage. Les auteurs introduisent une tâche d'inférence transitive avec exceptions et caractérisent analytiquement le comportement de modèles de régression ridge à noyau. Validation sur des modèles de langage préentraînés montrant que la généralisation réussie dépend de la géométrie représentationnelle.

PapersRaisonnementÉvaluations
SIG
72
HYP
15
arXiv cs.LG·

The Readout Shortcut: Positional Number Copying Dominates Arithmetic CoT Readout in Small Language Models

Sur des modèles 1-3B, le CoT en arithmétique repose sur un raccourci positionnel : le modèle copie simplement le nombre en dernière position avant le délimiteur de réponse, indépendamment du raisonnement intermédiaire. Cette stratégie explique 54-92 pp de précision sur GSM8K. Remplacer ce nombre par une valeur incorrecte effondre la performance même avec des étapes correctes.

RaisonnementÉvaluationsBenchmarks
SIG
78
HYP
15
arXiv cs.LG·

When Do LLMs Reason? A Dynamical Systems View via Entropy Phase Transitions

Étude montrant que le raisonnement explicite (CoT) n'est bénéfique que sur certaines tâches. Les auteurs proposent EDRM, un framework sans entraînement qui utilise la dynamique d'entropie en début de génération pour router adaptivement vers CoT ou inférence directe. Sur 15 benchmarks et 4 LLMs, EDRM réduit les tokens de 41–55% tout en améliorant la précision jusqu'à 4,7%.

RaisonnementÉvaluationsBenchmarks
SIG
78
HYP
25
arXiv cs.CL·

Cultural Adaptation in Large Language Models for Political Discourse

Article proposant un cadre de « cultural adaptation » pour les LLM en analyse politique. Identifie les biais anglais et les défaillances systématiques sur données multilingues. Propose une matrice d'évaluation (fidélité culturelle, calibration, sécurité démocratique) et des méthodes : datasets participatifs, transfer learning culturellement conscient, benchmarks adaptés.

BenchmarksÉvaluationsSécurité IA
SIG
72
HYP
25
arXiv cs.CL·

ClimateChat-300K: A Multi-Modal Facebook Dataset for Understanding Diverse Perspectives in Climate Communication

ClimateChat-300K : dataset de 299 329 posts Facebook publics sur le changement climatique (mai 2020 - mai 2024), collectés via CrowdTangle. 41 features de métadonnées, 26 000+ pages globales. Analyse thématique (10 thèmes, 5 domaines) et sentiment révèlent que contenu émotionnel et visuel génère plus d'engagement. Ressource ouverte pour étudier polarisation et désinformation.

BenchmarksPapersOpen source
SIG
72
HYP
25
arXiv cs.CL·

Metacognition as Reward: Reinforcing LLM Reasoning via Knowledge and Regulation Signals

MaR (Metacognition-as-Reward) est un framework RL qui améliore le raisonnement des LLM via deux dimensions : la connaissance métacognitive (identification d'infos pertinentes) et la régulation métacognitive (planification du processus). Testé sur 22 benchmarks, Qwen3.5-9B + MaR gagne jusqu'à 7.7% vs modèle de base et 11.0% vs DAPO vanilla, surpassant GPT-OSS-120B en moyenne.

Reinforcement learningRaisonnementQwen
SIG
78
HYP
25
arXiv cs.CL·

Same Model, Different Weakness: How Language and Modality Reshape the Jailbreak Attack Surface in Frontier MLLMs

Étude de red-teaming multilingue sur quatre MLLMs (Claude Sonnet 4.5, GPT-5, Pixtral Large, Qwen Omni) révélant que la vulnérabilité aux jailbreaks varie selon la langue. Les attaques par rôle-play sont moins efficaces en espagnol mexicain, tandis que les attaques visuelles le deviennent plus. Les classements de sécurité ne se conservent pas entre langues.

Sécurité IAAlignementÉvaluations
SIG
78
HYP
25
arXiv cs.CL·

When Symptoms Are Not Enough: Evidence-Weighting Patterns in Large Language Model Psychiatric Screening

Benchmark SCID de 555 entretiens semi-structurés évalue 5 LLMs (GPT-4.1 Mini, GPT-5 Mini) sur dépistage psychiatrique (anxiété, dépression, PTSD). Précision 0.49–0.86, MCC 0.16–0.38. Les faux négatifs révèlent que les modèles sous-pondèrent les symptômes face à un fonctionnement préservé ou un soutien social, nécessitant validation clinique avant déploiement.

BenchmarksGPTSécurité IA
SIG
72
HYP
25
arXiv cs.CL·

Positional Failures in Long-Context LLMs: A Blind Spot in Reasoning Benchmarks

Audit de 11 benchmarks de raisonnement long-contexte : aucun ne contrôle la position de la tâche cible, le contenu de remplissage et la longueur du contexte. Évaluation de 9 LLMs avec Context Rot Evaluation (CRE) révèle des chutes drastiques de précision quand la tâche passe de fin à milieu (ex: Mimo-v2-Flash -88pp à 64K). Les modèles plus récents montrent moins de vulnérabilité positionnelle.

BenchmarksRaisonnementÉvaluations
SIG
78
HYP
15
arXiv cs.CL·

A Comparative Evaluation of Structural Topic Models and BERTopic for Short, Open-Ended Survey Responses

Comparaison de Structural Topic Models (STM) et BERTopic pour analyser des réponses courtes à des enquêtes ouvertes. BERTopic produit une cohérence thématique supérieure, renforcée par l'augmentation contextuelle (stratégie introduite pour enrichir les réponses très courtes). STM offre meilleure support pour l'analyse inférentielle des covariables, BERTopic pour l'interprétabilité.

EmbeddingsBenchmarksPapers
SIG
72
HYP
15
arXiv cs.CL·

The Efficiency Frontier: A Unified Framework for Cost-Performance Optimization in LLM Context Management

Cadre unifié pour optimiser le coût-performance de la gestion du contexte dans les LLM. Évalue conjointement performance, coût en tokens et réutilisation du prétraitement sur 5000 instances HotpotQA. Réduit l'usage de tokens de 25% à performance comparable (F1≈0.78) et atteint 50% de réduction de coût avec compression mémoire.

RAGBenchmarksInfrastructure
SIG
72
HYP
18
arXiv cs.CL·

What Training Data Teaches RL Memory Agents: An Empirical Study of Curriculum Effects in Memory-Augmented QA

Étude empirique sur l'effet du curriculum d'entraînement sur les agents RL avec mémoire externe en dialogue multi-session. Trois conditions testées (LoCoMo seul, LoCoMo + LongMemEval, LongMemEval seul) montrent que la composition des données façonne les compétences spécialisées plutôt que la performance globale. Le curriculum mixte obtient le meilleur F1 global.

Reinforcement learningAgents IARaisonnement
SIG
72
HYP
15
arXiv cs.CL·

Hidden Human-Like Nature of Machine-Generated Texts: Theory and Detection Enhancement

Des chercheurs révèlent que les textes générés par LLM contiennent des spans « humain-like » cachés qui compliquent leur détection. Ils proposent un framework stacked model-agnostic utilisant une procédure hard-EM pour filtrer itérativement les sous-séquences humaines et améliorer les détecteurs existants, fonctionnant aussi sans entraînement.

ÉvaluationsSécurité IAPapers
SIG
72
HYP
28
arXiv cs.CL·

RAS: Reflection-Augmented Scaling with In-Context Learning for Executable Cypher Query Generation

RAS (Reflection-Augmented Scaling) améliore la génération de requêtes Cypher en exploitant les messages d'erreur du système via apprentissage en contexte. Sur trois datasets Neo4j et cinq modèles spécialisés en code, RAS réduit le taux d'erreur d'exécution de 41–50% (n=5), surpassant l'échantillonnage indépendant (32–38%).

Génération de codeRaisonnementBenchmarks
SIG
78
HYP
15
arXiv cs.CL·

Query-Adaptive Semantic Chunking for Retrieval-Augmented Generation: A Dynamic Strategy with Contextual Window Expansion

QASC (Query-Adaptive Semantic Chunking) améliore la segmentation de documents pour RAG en intégrant les requêtes utilisateur au moment du chunking. Via scoring de similarité cosinus, expansion contextuelle et agrégation de scores, QASC atteint F1=0.85, soit +18-27% vs chunking fixe et +8-12% vs méthodes sémantiques/agentic sur 100 documents techniques et 200 requêtes.

RAGBenchmarksPapers
SIG
78
HYP
15
arXiv cs.CL·

Knowledge Distillation for Low-Resource Open-source Text-to-SQL Model

Framework de distillation de connaissances pour Text-to-SQL en contexte low-resource. Construit une base de connaissances (sémantique schéma, abréviations, logique métier) injectée en entraînement et inférence. Génère données synthétiques contextualisées. Évalué sur 7 benchmarks : améliore LLMs open-source et fermés, notamment sur données domain-specific.

Génération de codeFine-tuningRAG
SIG
72
HYP
25
arXiv cs.CL·

A Proactive Multi-Agent Dialogue Framework for Assessing Social Language Disorder Traits in Autism

TPA (Think, Plan, Ask) est un framework multi-agent qui guide les LLM à sélectionner proactivement des stratégies de questionnement pour évaluer les troubles du langage social (SLD) dans l'autisme. Testé sur 484 épisodes cliniques (ADOS-2), TPA atteint 82,1% de couverture des traits SLD vs 65,5% pour les cliniciens, avec une efficacité diagnostique supérieure (AUCC: 0,628 vs 0,458).

Agents IAMulti-agentsRaisonnement
SIG
78
HYP
25
arXiv cs.CL·

Convergence Without Understanding: When Language Models Agree on Representations but Disagree on Reasoning

Étude de 16 modèles de langage (1.5B–72B paramètres) révélant que leur convergence représentationnelle ne s'étend pas au raisonnement. Les modèles s'alignent davantage sur les problèmes qu'ils échouent collectivement (CKA=0.897) que sur ceux résolus (CKA=0.830). Les représentations post-décision divergent fortement (CKA=0.274), et l'information partagée exerce une influence causale minimale (1.5–5.5% flip rate).

PapersRaisonnementÉvaluations
SIG
78
HYP
15
arXiv cs.CL·

A Fine-Tuned BERT Classifier for Personal-Letter Titles in Late-Ming and Early-Qing Collected Works

Lepton, un classificateur BERT fine-tuné sur bert-base-chinese, prédit si un titre dans une table des matières de wenji (recueils classiques chinois) correspond à une lettre personnelle ou à une préface. Entraîné sur 5438 titres annotés manuellement de littérateurs Ming-Qing, le modèle a identifié ~55 000 lettres pour la Ming Letter Platform.

Fine-tuningBenchmarks
SIG
72
HYP
15
Reddit r/LocalLLaMA·

I shipped a windows desktop app for running local LLMs with a button that turns your "no thats wrong" into actual LoRA training data

SEELS, une app desktop Windows pour LLMs locaux, permet de corriger les réponses du modèle via un bouton « Teach » qui accumule les corrections en corpus JSONL, puis lance un fine-tuning LoRA sans terminal. Inclut STT/TTS locaux (Whisper/Piper), dashboard matériel, modèle 0.6B pré-entraîné sur 110 exemples. Version gratuite stable ; tiers pro (génération image/vidéo, MCP) et max (workflows, multi-GPU) en roadmap.

Fine-tuningOpen sourceOutils
SIG
72
HYP
35
Reddit r/MachineLearning·

How do ML practitioners select hyperparameters, architectures, etc for self-supervised representation learning when the loss is non-monotonic? [D]

Un chercheur interroge les pratiques de sélection d'hyperparamètres pour l'apprentissage auto-supervisé non-contrastif (BYOL, JEPA, data2vec). Il soulève le problème que les pertes non-monotones rendent difficile l'évaluation réelle de ce qui est appris, et que des critères comme RankMe (basés sur le rang effectif des embeddings) deviennent inefficaces une fois intégrés à la fonction de perte.

RAGFine-tuningÉvaluations
SIG
35
HYP
15
The Decoder·

Deepmind's Hassabis sees humanity "in the foothills of the singularity" while LeCun says current AI isn't intelligent

Demis Hassabis (DeepMind) estime que l'humanité est « aux portes de la singularité », tandis que Yann LeCun affirme que les systèmes IA actuels ne sont pas véritablement intelligents. Oriol Vinyals (co-lead Gemini) propose une position intermédiaire : les modèles actuels auraient semblé être de l'AGI il y a sept ans, mais ils ne peuvent pas apprendre de l'expérience ni produire de véritables percées.

DeepMindGeminiRaisonnement
SIG
35
HYP
72
Reddit r/LocalLLaMA·

Qwen Plays ̶p̶̶o̶̶k̶̶e̶̶m̶̶o̶̶n̶ ? / QWEN PLAYS DCSS! - qwen3.6-35b-a3b@q4_k_xl plays open source roguelike adventure DCSS (and does a decent job)

Qwen 3.6-35B en version non-MTP joue correctement à DCSS (roguelike open-source). Test pratique sur LM Studio avec RTX 5090 : personnage Minotaure niveau 5, 47 HP, plusieurs ennemis vaincus. Version MTP produit des appels d'outils mal formés. Benchmark alternatif aux scores officiels.

QwenBenchmarksOpen source
SIG
45
HYP
35
Reddit r/LocalLLaMA·

How I do use the recent llama.cpp native tools to do web rag a.k.a. web_fetch (or anything else for the matter) directly from inside the llama-server's webui

Un utilisateur de llama.cpp implémente un workflow de RAG web sécurisé en activant les outils natifs du serveur (exec_shell_command) avec multi-sandboxing : firejail + utilisateur Linux dédié + conteneur OCI Alpine. Permet au modèle Qwen 3.6-35B d'exécuter des commandes wget directement depuis l'interface web pour récupérer et analyser du contenu.

LlamaRAGOutils
SIG
65
HYP
25
GitHub Trending·

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> manaflow-ai /</span> cmux

cmux est un terminal macOS basé sur Ghostty avec onglets verticaux et notifications, conçu pour les agents de codage IA.

Agents IAGénération de codeOutils
SIG
35
HYP
45
GitHub Trending·

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> earendil-works /</span> pi

Pi est un toolkit d'agents IA offrant une CLI d'agent de codage, une API LLM unifiée, des bibliothèques TUI/web UI, un bot Slack et support vLLM pods.

Agents IAGénération de codeOutils
SIG
45
HYP
35
GitHub Trending·

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> anthropics /</span> knowledge-work-plugins

Anthropic publie un dépôt open-source de plugins pour Claude destinés aux travailleurs du savoir. Les plugins facilitent l'intégration de Claude dans des workflows professionnels.

ClaudeOutilsOpen source
SIG
65
HYP
20
GitHub Trending·

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> farion1231 /</span> cc-switch

cc-switch est un assistant de bureau multiplateforme intégrant Claude Code, Codex, OpenCode, OpenClaw, Gemini CLI et Hermes Agent. Outil d'agrégation d'interfaces pour plusieurs modèles et agents IA.

Claude CodeAgents IAOutils
SIG
35
HYP
55
GitHub Trending·

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> modrinth /</span> code

Modrinth publie son monorepo complet sur GitHub. Le dépôt contient l'intégralité du code source de la plateforme de distribution de mods.

Open sourceInfrastructure
SIG
45
HYP
15
GitHub Trending·

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> lakehq /</span> sail

Sail est un remplaçant Apache Spark écrit en Rust, unifiant le traitement batch, le streaming et les workloads IA intensifs en calcul.

InfrastructureOpen source
SIG
45
HYP
35
GitHub Trending·

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> katanemo /</span> plano

Plano est un proxy et data plane natif IA pour applications multi-agents, intégrant orchestration, sécurité, observabilité et routage LLM intelligent.

Agents IAMulti-agentsInfrastructure
SIG
45
HYP
55
GitHub Trending·

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> BloopAI /</span> vibe-kanban

Vibe-Kanban est un outil open-source qui amplifie la productivité des agents de code comme Claude Code et Codex via une interface Kanban. Permet de gérer les tâches de développement avec des agents IA.

Claude CodeAgents IAGénération de code
SIG
45
HYP
65
GitHub Trending·

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> virattt /</span> dexter

Dexter est un agent autonome pour la recherche financière approfondie. Le projet, publié sur GitHub Trending, propose une automatisation des analyses financières via un système multi-agent.

Agents IAMulti-agents
SIG
35
HYP
45
GitHub Trending·

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> twentyhq /</span> twenty

Twenty est une alternative open-source à Salesforce conçue pour l'IA. Le projet gagne en popularité sur GitHub Trending, positionnant les CRM open-source comme concurrent viable aux solutions propriétaires.

Open sourceOutilsBusiness
SIG
45
HYP
55
GitHub Trending·

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> presenton /</span> presenton

Presenton est un générateur de présentations IA open-source avec API, positionnée comme alternative à Gamma, Beautiful AI et Decktopus. Le projet GitHub propose une solution automatisée pour créer des diaporamas.

Open sourceOutils
SIG
45
HYP
55
GitHub Trending·

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> superset-sh /</span> superset

Superset est un éditeur de code conçu pour l'ère des agents IA. Il permet d'exécuter plusieurs instances de Claude Code et autres modèles de codage sur sa machine locale.

Agents IAGénération de codeClaude Code
SIG
35
HYP
65
GitHub Trending·

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> triggerdotdev /</span> trigger.dev

Trigger.dev est une plateforme pour construire et déployer des agents IA et workflows entièrement gérés. Le projet GitHub trending propose une infrastructure complète pour orchestrer des agents autonomes en production.

Agents IAInfrastructureOpen source
SIG
45
HYP
35
GitHub Trending·

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> gitroomhq /</span> postiz-app

Postiz est un outil de planification de contenu social media basé sur des agents IA. Le projet GitHub trending propose une solution automatisée pour gérer la publication sur plusieurs plateformes.

Agents IAOutils
SIG
35
HYP
65
GitHub Trending·

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> earendil-works /</span> pi

Pi est une boîte à outils pour agents IA incluant un CLI d'agent de codage, une API LLM unifiée, des bibliothèques TUI et web UI, un bot Slack et support vLLM pods.

Agents IAGénération de codeOutils
SIG
45
HYP
35