Topic

#Multi-agents

Un système multi-agent coordonne plusieurs agents IA autonomes travaillant ensemble pour accomplir des tâches complexes. Exemple : AutoGen (Microsoft) permet d'orchestrer des agents spécialisés qui collaborent via des échanges de messages.

40Articles

5Sources

69Signal moyen

arXiv cs.AI·18 juin

RTSGameBench: An RTS Benchmark for Strategic Reasoning by Vision-Language Models

RTSGameBench est un benchmark pour évaluer le raisonnement stratégique des Vision-Language Models (VLMs) dans des jeux de stratégie en temps réel. Basé sur Beyond All Reason, il propose des évaluations multi-scénarios, des mini-jeux diagnostiques ciblant des compétences spécifiques, et un framework auto-évolutif. Les VLMs actuels échouent sur la coordination multi-agents et les tâches complexes.

Vision Raisonnement Multi-agents

SIG

HYP

arXiv cs.CL·18 juin

Are LLMs Ready to Assist Physicians? PhysAssistBench for Interactive Doctor-Patient-EHR Assistance

PhysAssistBench est un benchmark d'assistance médecale interactive basé sur 1 296 tours validés par des médecins, construits à partir de cas réels MIMIC-IV. Il évalue la capacité des LLMs à coordonner connaissances cliniques, communication patient et interaction EHR dans un même dialogue. Les expériences montrent que les modèles actuels restent peu fiables dans ce contexte.

Benchmarks Agents IA Multi-agents

SIG

HYP

arXiv cs.CL·18 juin

Towards Scalable Customization and Deployment of Multi-Agent Systems for Enterprise Applications

Framework pour la customisation et le déploiement efficace de systèmes multi-agents LLM en entreprise. Combine préentraînement continu, fine-tuning supervisé et optimisation de préférences pour adapter des modèles compacts à des domaines spécialisés. Intègre décodage spéculatif et quantification FP8 pour réduire latence et coûts. Atteint 4.48x d'accélération de débit tout en maintenant la performance.

Multi-agents Fine-tuning Business

SIG

HYP

arXiv cs.AI·18 juin

Searching for Synergy in Shared Workspace Human-AI Collaboration

Étude sur la collaboration humain-IA en espace partagé via Collaborative Gym et DiscoveryBench. Ajouter des collaborateurs améliore les performances seulement avec une structure de coordination. Un scaffolding combinant mémoire partagée et validation humaine (HITL gates) augmente la performance, particulièrement en équipes de trois, en clarifiant les responsabilités.

Agents IA Multi-agents Évaluations

SIG

HYP

arXiv cs.CL·18 juin

SAGE: Stochastic Prompt Optimization via Agent-Guided Exploration

SAGE est un framework d'optimisation stochastique de prompts via exploration guidée par agents multi-agents. Comparaison de trois stratégies : recherche aléatoire informée par erreurs, algorithme génétique, et SAGE avec exécution de code diagnostique. Déploiement sur chatbot santé mentale : 8 cycles d'A/B tests bruyants produisent un gain statistiquement robuste en rétention.

Prompt engineering Agents IA Multi-agents

SIG

HYP

arXiv cs.AI·18 juin

R2D-RL: A RoboCup 2D Soccer Environment for Multi-Agent Reinforcement Learning

R2D-RL connecte le simulateur RoboCup 2D Soccer (RCSS2D) à des workflows Python d'apprentissage par renforcement multi-agent via mémoire partagée. L'environnement supporte l'entraînement full-field et par scénarios, avec espaces d'action discrets/hybrides, masquage d'actions, reward shaping basé sur EPV, et exécution parallèle. Benchmarks 11-vs-11 et résultats de base fournis.

Multi-agents Reinforcement learning Benchmarks

SIG

HYP

GitHub Trending·17 juin

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> bytedance /</span> UI-TARS-desktop

ByteDance publie UI-TARS-desktop, une stack open-source d'agents IA multimodaux. Le projet connecte modèles IA avancés et infrastructure d'agents pour automatiser des tâches d'interface utilisateur.

Agents IA Multi-agents Open source

SIG

HYP

GitHub Trending·17 juin

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> calesthio /</span> OpenMontage

OpenMontage est un système de production vidéo open-source et agentic avec 12 pipelines, 52 outils et 500+ compétences d'agent. Transforme un assistant de codage IA en studio de production vidéo complet.

Agents IA Multi-agents Génération de vidéos

SIG

HYP

GitHub Trending·17 juin

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> bytedance /</span> UI-TARS-desktop

ByteDance publie UI-TARS-desktop, une stack open-source d'agents IA multimodaux connectant modèles IA et infrastructure d'agents. Plateforme pour construire des agents capables d'interagir avec interfaces utilisateur.

Agents IA Multi-agents Open source

SIG

HYP

GitHub Trending·17 juin

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> microsoft /</span> RD-Agent

Microsoft publie RD-Agent, un système d'IA autonome pour automatiser les processus R&D en data science et ML. L'agent pilote expériences, analyse de données et itérations de modèles sans intervention humaine.

Agents IA Multi-agents Open source

SIG

HYP

GitHub Trending·17 juin

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> calesthio /</span> OpenMontage

Agents IA Multi-agents Génération de vidéos

SIG

HYP

arXiv cs.CL·17 juin

From Parasocial Scripts to Dyadic Persistence in Autonomous AI-Agent Communities

Étude de 4 434 posts et 50 338 commentaires sur Moltbook montrant que les indices de relations parasociales (langage d'intimité, offres de réciprocité, auto-identification) persistent dans les communautés d'agents IA autonomes. Les résultats, validés par keyword matching et annotation LLM, révèlent une association forte entre ces signaux et la ré-engagement de l'auteur original.

Agents IA Multi-agents Papers

SIG

HYP

arXiv cs.AI·17 juin

FinAcumen: Financial Multimodal Reasoning via Self-Evolving Experience Memory Harness

FinAcumen est un agent de raisonnement financier multimodal qui accumule l'expérience des trajectoires antérieures dans une mémoire persistante. Le système améliore un modèle vision-langage 8B gelé sur quatre benchmarks financiers en utilisant l'activation sélective d'expériences et un environnement d'outils déterministe pour le calcul numérique et la vérification.

Agents IA Multi-agents Vision

SIG

HYP

arXiv cs.AI·17 juin

Can LLMs Be CEOs? Benchmarking Strategic Resource Reallocation with Multi-Role Agent Simulation

CEO-Bench, un benchmark multi-agent, évalue la capacité des LLM à prendre des décisions stratégiques de réallocation de ressources. Cinq modèles frontière testés sur 13 scénarios montrent une validité structurelle élevée mais divergent sur l'étalonnage stratégique. Les défaillances incluent la capture par un seul conseiller et l'amnésie historique.

Agents IA Multi-agents Raisonnement

SIG

HYP

arXiv cs.CL·17 juin

Scaling Enterprise Agent Routing: Degradation, Diagnosis, and Recovery

Étude sur le routage d'agents en production : avec 110 agents et 584 outils, la précision F1 chute de 16-23 points sur requêtes sous-spécifiées. L'analyse révèle deux sources : retrieval gap et confusion gap (10pp). Le shortlisting par embeddings récupère +10-11pp F1 à grande échelle.

Agents IA Multi-agents Évaluations

SIG

HYP

arXiv cs.AI·17 juin

Distributed General-Purpose Agent Networks: Architecture, Key Mechanisms, and Prototypes

Article arXiv proposant une architecture pour des réseaux d'agents autonomes distribués en peer-to-peer. Les auteurs identifient trois mécanismes clés : propagation sémantique pour la découverte de collaborateurs, identité vérifiable et réputation multi-sujets (MG-EigenTrust), et conception de mécanismes pour l'exécution de tâches ouvertes. Prototypes et simulations présentés.

Agents IA Multi-agents Papers

SIG

HYP

arXiv cs.CL·17 juin

From Trainee to Trainer: LLM-Designed Training Environment for RL with Multi-Agent Reasoning

Framework LLM-as-Environment-Engineer : le modèle de politique analyse ses trajectoires d'échec et propose des modifications à la configuration d'entraînement RL pour l'étape suivante. Testbed MAPF-FrozenLake avec configurations multi-dimensionnelles. Qwen3-4B surpasse GPT et Gemini sur les benchmarks proposés.

Reinforcement learning Multi-agents Raisonnement

SIG

HYP

arXiv cs.CL·17 juin

MODE-RAG: Manifold Outlier Diagnosis and Energy-based Retrieval-Augmented Generation Evaluation

MODE-RAG est un système multi-agent basé sur l'énergie libre variationnelle pour réduire les hallucinations dans les systèmes de génération augmentée par récupération multimodale. Il utilise MCTS, perturbations logit et des agents spécialisés pour router les requêtes à haut risque et vérifier les faits. Les auteurs introduisent ModeVent, un sous-ensemble du dataset MultiVent, pour évaluer la robustesse.

RAG Multi-agents Vision

SIG

HYP

arXiv cs.AI·16 juin

QoS-Aware Token Scheduling and Private Data Valuation for Multi-Modal Agentic Networks

Système d'allocation équitable de tokens pour réseaux d'agents décentralisés. Approche combinant représentations multi-modales, prototypes différentiellement privés et schéma de récompense robuste à l'hétérogénéité des données. Simulations montrent amélioration de l'équité et de la QoS, avec résistance renforcée aux attaques de reconstruction d'images.

Agents IA Multi-agents Vision

SIG

HYP

arXiv cs.AI·16 juin

Toward Vibe Medicine: A Self-Evolving Multi-Agent Framework for Clinical Decision Support

VIBEMed est un framework multi-agent avec mécanisme d'auto-évolution pour le support décisionnel clinique. Trois agents spécialisés (diagnostic, traitement, évolution) intègrent l'historique des sessions patients et les résultats passés pour améliorer itérativement les décisions médicales. Résultats sur planification oncologique et cas complexes.

Multi-agents Agents IA Raisonnement

SIG

HYP

arXiv cs.AI·16 juin

Towards End-to-End Automation of AI Research

The AI Scientist automatise l'intégralité du cycle de recherche : génération d'idées, code, expériences, analyse de données, rédaction manuscrite et peer review. Un manuscrit généré a passé la première sélection d'un workshop majeur (taux d'acceptation 70%). Le système utilise des foundation models dans une architecture multi-agents.

Agents IA Multi-agents Papers

SIG

HYP

arXiv cs.CL·16 juin

Privacy-Preserving Text Sanitization for Distributed Agents Collaboration via Disentangled Representations

DiSan, un framework de sanitization préservant la vie privée, factorise le texte en deux sous-espaces : un préservant la sémantique métier et un contenant les signatures stylistiques. Sur un benchmark RAG multi-agent distribué, DiSan réduit l'exposition PII de 20× tout en maintenant 83% de fidélité, et abaisse l'attribution stylométrique Enron de 73,2% (TF-IDF) et 70,6% (sonde neurale).

Multi-agents RAG Sécurité IA

SIG

HYP

arXiv cs.CL·16 juin

Can Agents Read the Room? Benchmarking Visual Social Intelligence in Multimodal Simulation

Benchmark AgentViSS évalue l'intelligence sociale visuelle d'agents multimodaux dans des simulations sociales. 240 scénarios, 585 rôles, 2340 instances testent si les MLLMs utilisent indices visuels (expressions, posture, regard) pour guider interactions. Sept modèles évalués montrent écart : expression et gestion de conflits proches saturation, régulation d'interaction et résultats visuels restent difficiles.

Benchmarks Vision Agents IA

SIG

HYP

arXiv cs.LG·16 juin

TriAdReview: Triangular Adversarial Review Architecture for Multi-Model Technical Document Generation

TriAdReview propose une architecture adversariale triangulaire avec deux modèles reviewers (ingénierie et sécurité) pour améliorer la génération de documents techniques. Sur 75 expériences, le système triple atteint +10.1% vs baseline (26.2 vs 23.8/50, p<0.05), avec gains forts en audit sécurité (+27.6%), génération code (+20.8%), design architecture (+15.6%), mais dégradation sur analyse requirements (-7.5%).

Multi-agents Génération de code Benchmarks

SIG

HYP

arXiv cs.LG·16 juin

Edu-Theater: A Data-Efficient Agent Framework for Scalable Learner Behavior Simulation through Staging Roll-Call

Edu-Theater est un système multi-agent basé LLM pour simuler le comportement d'apprenants à grande échelle. Il utilise une approche cohort-aware avec diagnostic ciblé plutôt que des historiques denses par apprenant, réduisant les appels LLM et les données nécessaires. Testé sur deux datasets réels, il améliore la précision de simulation et les applications aval comme les tests adaptatifs.

Agents IA Multi-agents Raisonnement

SIG

HYP

arXiv cs.AI·16 juin

Synthetic Counteradaptation: A Principle of Human-AI Co-evolution

Article théorique sur la « contre-adaptation synthétique » : processus où humains et systèmes IA co-évoluent en s'adaptant mutuellement. Les auteurs analysent des exemples (Go, interactions sociales, simulations géopolitiques) pour montrer comment émerge une dynamique récursive d'interaction multi-agents.

Multi-agents Raisonnement Alignement

SIG

HYP

arXiv cs.AI·16 juin

Visual-Seeker: Towards Visual-Native Multimodal Agentic Search via Active Visual Reasoning

Visual-Seeker est un agent de recherche multimodal qui améliore le raisonnement visuel des MLLMs dans des scénarios complexes. L'approche utilise un pipeline de raisonnement visuel actif et 5K trajectoires multimodales synthétiques pour entraîner le modèle. L'agent atteint des performances SOTA sur cinq benchmarks de recherche multimodal, surpassant certains modèles propriétaires.

Agents IA Vision Multi-agents

SIG

HYP

arXiv cs.LG·15 juin

Trust but Verify: Mitigating Medical Hallucinations via Post-Hoc Adversarial Auditing and Multi-Agent Feedback Loops

Étude arXiv sur les hallucinations médicales des LLM. Système multi-agent « Trust but Verify » testant 3 familles de modèles (GPT-OSS, Llama-3, Falcon-3) sur 103 questions cliniques avec médicaments bannis. Architecture à 5 agents réduit le taux d'hallucination de 53% et force le refus approprié plutôt que la recommandation dangereuse.

Multi-agents Sécurité IA Alignement

SIG

HYP

arXiv cs.AI·15 juin

YeasierAgent: Agentic Social Sandbox as a Canvas for Intent-Driven Creation of Platform-Agnostic Symbiotic Agent-Native Applications

YeasierAgent propose un paradigme de construction d'applications basé sur des agents symbiotiques, des mondes narratifs et des interactions conscientes de la scène. Le système unifie la génération automatisée, les mondes créés par les utilisateurs et la collaboration multi-agents spatiale pour créer des applications agent-natives cross-platform sans dépendre de mises en page graphiques fixes.

Agents IA Multi-agents Prompt engineering

SIG

HYP

arXiv cs.LG·15 juin

Graph-based Target Back-Propagation for Context Adaptation in Multi-LLM Agentic Systems

GTBP (Graph-based Target Back-Propagation) est un framework d'adaptation de contexte pour systèmes multi-LLM agentic. Il propage des cibles locales rétroactivement dans un graphe acyclique dirigé et met à jour les prompts par étapes. Convergence garantie théoriquement, surpasse les baselines sur 3 benchmarks.

Agents IA Multi-agents Prompt engineering

SIG

HYP

arXiv cs.AI·15 juin

VeriGeo: Controllable Geometry Question Generation with Numerical and Analytical Verification

VeriGeo génère des problèmes de géométrie contrôlables via des traces de raisonnement exécutables. Un agent Auteur crée le problème et le diagramme selon les contraintes utilisateur, un agent Solveur produit la preuve. Un pipeline à trois étapes vérifie la cohérence numérique, analytique et globale. Fine-tuning sur 8.7k exemples atteint les meilleures performances GeoQA et résultats forts sur PGPS9K et MathVista-GPS.

Raisonnement Vision Benchmarks

SIG

HYP

arXiv cs.AI·15 juin

HarnessX: A Composable, Adaptive, and Evolvable Agent Harness Foundry

HarnessX est une plateforme pour créer des harnesses d'agents IA composables et adaptatifs. Elle utilise AEGIS, un moteur d'évolution multi-agent piloté par les traces d'exécution, pour optimiser les prompts, outils et flux de contrôle. Sur 5 benchmarks (ALFWorld, GAIA, WebShop, tau³-Bench, SWE-bench), HarnessX atteint +14,5% de gain moyen (+44% max), sans augmenter la taille du modèle.

Agents IA Multi-agents Prompt engineering

SIG

HYP

arXiv cs.LG·15 juin

Contract-Based Compositional Shielding for Safe Multi-Agent Reinforcement Learning

Méthode de shielding décentralisé pour l'apprentissage par renforcement multi-agent garantissant la sécurité globale sans contrôle centralisé. Les agents partagent une spécification LTL_safe globale et sélectionnent des obligations locales dont la conjonction implique la spécification globale, via un bandit multi-armé non-stationnaire. Évaluation sur 6 environnements et 15 variantes algorithmiques.

Multi-agents Reinforcement learning Sécurité IA

SIG

HYP

arXiv cs.CL·15 juin

MedLatentDx: Latent Multi-Agent Communication for Cross-Hospital Rare-Disease Diagnosis

MedLatentDx est un framework multi-agent pour le diagnostic des maladies rares en collaboration inter-hôpitaux. Les agents hospitaliers conservent les dossiers cliniques privés et échangent des blocs latents KV compacts au lieu de texte brut, respectant les régulations de confidentialité. Deux modes : distillation KV pour backbones identiques, alignement latent cross-family pour LLM différents.

Multi-agents MCP Raisonnement

SIG

HYP

arXiv cs.AI·15 juin

A Multi-Agent AI System for Automated High School Transcript Processing: Collaborative Document Analysis at Scale

Système multi-agent pour traiter automatiquement les relevés de notes du secondaire. Architecture avec 4 agents spécialisés (reconnaissance de motifs, analyse sémantique, vision, orchestration) atteint 96,7% de précision sur 40 relevés réels de 13 États américains, 45 secondes par document.

Multi-agents Agents IA Vision

SIG

HYP

GitHub Trending·13 juin

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> lobehub /</span> lobehub

LobeHub organise les agents IA en opérations 24/7 via recrutement, planification et rapports. Plateforme de gestion d'équipes d'agents autonomes.

Agents IA Multi-agents Outils

SIG

HYP

Hacker News (AI)·12 juin

Launch HN: BitBoard (YC P25) – Analytics Workspace for Agents

BitBoard, startup YC P25, lance un espace de travail analytique dédié aux agents IA. La plateforme permet de monitorer, déboguer et optimiser les performances des systèmes multi-agents en production.

Agents IA Multi-agents Outils

SIG

HYP

GitHub Trending·12 juin

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> NVIDIA-NeMo /</span> NeMo

NVIDIA NeMo est un framework open-source pour construire des modèles IA génératifs : LLM, multimodal, ASR et TTS. Conçu pour chercheurs et développeurs, il offre une base scalable pour l'entraînement et le déploiement.

Open source Infrastructure Génération de code

SIG

HYP

arXiv cs.CL·12 juin

SkillChain: Closing the Loop on Skill Evolution for Image-Based E-Commerce AI Assistants

SkillChain automatise l'évolution des compétences pour assistants IA multimodaux en e-commerce. Le système gère trois étapes : création de Skills à partir de specs, optimisation du routage, et raffinement itératif via évaluation LLM. Déployé en production, il améliore la conformité structurelle et la qualité du contenu, confirmé par A/B test sur l'engagement utilisateur.

Agents IA Multi-agents Vision

SIG

HYP

arXiv cs.CL·12 juin

PRISM: Prosody-Integrated Multi-Agent Reasoning Framework for Empathetic Spoken Dialogue

PRISM est un framework multi-agent pour le dialogue parlé empathique qui découple perception vocale, génération de réponse et synthèse vocale. Il introduit un mécanisme de traduction prosody-to-language pour stabiliser le raisonnement des LLM et intègre des outils de connaissance externes. Résultats : amélioration de l'empathie, de l'adéquation prosodique et de la qualité des réponses.

Multi-agents Voix Agents IA

SIG

HYP

Multi-agents — actualité IA · Signal IA