Page 26 sur 139

ToutHaut signalRécent
5526 articles
arXiv cs.CL·

Chain-based Adaptive Reconfiguration Over Lattices for Hallucination Reduction

CAROL est un framework probabiliste pour réduire les hallucinations des LLM au moment du test. Il définit une mesure d'incertitude sémantique basée sur la cohérence entre réponses générées et contexte de confiance, formulant la mitigation comme un processus de chaîne de Markov avec garanties de convergence. Résultats sur QA et multi-agent reasoning montrent réduction significative des hallucinations.

RaisonnementSécurité IAAlignement
SIG
75
HYP
15
arXiv cs.CL·

Playing with Words, Improving with Rewards: Training Language Models for Creative Association

Entraînement de modèles Qwen (1.7B, 4B, 8B) sur le jeu Codenames pour améliorer la créativité via reinforcement learning avec récompenses vérifiables (RLVR). Le modèle 8B gagne en créativité (+8/10 benchmarks) avec dégradation mineure du raisonnement, tandis que les petits modèles privilégient la précision. Étude sur le compromis créativité-précision selon l'échelle.

QwenReinforcement learningRaisonnement
SIG
75
HYP
25
Reddit r/LocalLLaMA·

I ran 8 open-weight models as agents in a persistent MMO for 10 days. Here's the 93k event dataset and some things that I learned

Un studio a lancé Null Epoch, un MMO persistant où 25 agents LLM (8 modèles open-weight : Qwen3, Nemotron, Ministral, Gemma, GLM) ont joué pendant 10 jours. Dataset de 93k événements publié sur HuggingFace. Test de planification long-horizon, contention de ressources et pression adversariale en simulation dynamique.

Agents IAMulti-agentsBenchmarks
SIG
75
HYP
35
Vercel AI Blog·

How Conductor moved parallel coding agents from the laptop to the cloud with Vercel Sandbox

Conductor, plateforme de direction d'agents de codage parallèles, migre son exécution du laptop vers le cloud via Vercel Sandboxes. Les équipes d'ingénierie de Notion, Linear, Ramp et Life360 utilisent cet outil model-agnostic (Claude Code, Codex, etc.) pour lancer plusieurs agents simultanément sur des branches isolées du codebase.

Agents IAMulti-agentsGénération de code
SIG
75
HYP
35
GitHub Trending·

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> langfuse /</span> langfuse

Langfuse est une plateforme open-source d'ingénierie LLM offrant observabilité, métriques, évaluations, gestion de prompts et playground. Intègre OpenTelemetry, Langchain, OpenAI SDK, LiteLLM. Lauréate Y Combinator W23.

Open sourceOutilsÉvaluations
SIG
75
HYP
25
arXiv cs.CL·

In-Context Optimization for Retrieval-Augmented Generation: A Gradient-Descent Perspective

Étude théorique montrant qu'une couche de self-attention linéaire peut implémenter une étape de gradient descent sur un objectif RAG unifié. Les auteurs proposent une méthode légère pour adapter l'interaction entre requêtes et documents récupérés sans modifier le retriever ni le modèle backbone, testée sur 7 benchmarks QA avec améliorations significatives.

RAGRaisonnementPapers
SIG
75
HYP
15
arXiv cs.AI·

Advancing Creative Physical Intelligence in Large Multimodal Models

MM-CreativityBench, un nouveau benchmark, évalue la capacité des modèles multimodaux à résoudre des problèmes créatifs en identifiant des usages non-évidents d'objets dans des environnements physiquement contraints. Les LMMs actuels échouent par manque d'exploration ancrée et hallucinations. L'alignement par affordances via DPO réduit ces erreurs et améliore la sélection d'entités pertinentes.

BenchmarksVisionRaisonnement
SIG
75
HYP
25
arXiv cs.CL·

Pretraining Data Exposure in Large Language Models: A Survey of Membership Inference, Data Contamination, and Security Implications

Enquête unifiée sur l'exposition des données d'entraînement (PDE) dans les LLM, couvrant l'inférence d'appartenance et la contamination de données. Formalise PDE selon les niveaux d'exposition, examine les méthodes d'attaque/défense et identifie les défis ouverts pour l'intégrité des évaluations et la protection de la vie privée.

Sécurité IAAlignementÉvaluations
SIG
75
HYP
15
arXiv cs.CL·

Why Prompt Optimization Works, and Why It Sometimes Doesn't: A Causal-Inspired Edit-Level Analysis

Analyse causale des méthodes d'optimisation de prompts (DSpy, TextGrad) révélant pourquoi elles échouent à généraliser. Les édits augmentant la complexité nuisent aux tâches mathématiques et multi-sauts, tandis que les édits step-by-step améliorent le raisonnement logique. Les défaillances proviennent d'interactions systématiques entre familles d'édits et caractéristiques des tâches.

Prompt engineeringRaisonnementBenchmarks
SIG
75
HYP
15
arXiv cs.AI·

The MiniMax-M2 Series: Mini Activations Unleashing Max Real-World Intelligence

MiniMax présente la série M2, des modèles MoE avec 229.9B paramètres totaux et 9.8B activés par token. Conçus pour le déploiement d'agents, ils intègrent des pipelines de données agent-driven, Forge (système RL agent-natif), et M2.7 capable d'auto-évolution. Performance frontier sur benchmarks de coding agent, recherche profonde et raisonnement.

Agents IARaisonnementGénération de code
SIG
75
HYP
35
Simon Willison·

Microsoft Copilot Cowork Exfiltrates Files

Microsoft Copilot Cowork permettait aux agents d'envoyer des emails non approuvés à la boîte de réception de l'utilisateur. Ces messages pouvaient contenir des images externes déclenchant des requêtes réseau, permettant l'exfiltration de données. Une injection de prompt réussie aurait pu divulguer des liens OneDrive pré-authentifiés, donnant accès aux fichiers à un attaquant.

Agents IASécurité IAPrompt engineering
SIG
75
HYP
45
GitHub Trending·

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> mozilla /</span> cargo-vet

Mozilla publie cargo-vet, un outil de sécurité de la chaîne d'approvisionnement pour Rust. Il permet d'auditer et de valider les dépendances Rust avant leur utilisation en production.

Open sourceSécurité IAOutils
SIG
75
HYP
15
GitHub Trending·

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> modelscope /</span> FunASR

FunASR est un toolkit de reconnaissance vocale industriel supportant 170x temps réel, 50+ langues, diarisation de locuteur, détection d'émotion, streaming et API compatible OpenAI.

VoixOpen sourceOutils
SIG
75
HYP
25
arXiv cs.AI·

HyperGuide: Hyperbolic Guidance for Efficient Multi-Step Reasoning in Large Language Models

HyperGuide utilise la géométrie hyperbolique pour guider le raisonnement multi-étapes dans les LLM. Une tête légère projette les états cachés dans l'espace hyperbolique, où la distance à l'origine encode la proximité de la solution. Un adaptateur bas-rang est affiné interactivement. Gains constants sur plusieurs benchmarks, plus importants pour les chaînes de raisonnement profondes.

RaisonnementFine-tuning
SIG
75
HYP
15
arXiv cs.CL·

Toxicity in Twitch Chats: An LLM-Based Analysis Across Gaming Communities

Analyse de 20 millions de messages de chat Twitch (4 452 streams, 7 genres) avec un LLM en classification zéro-shot. 2,4% des messages classés toxiques selon la taxonomie Twitch (harcèlement, discrimination, contenu sexuel, profanité). F1=94,5% sur TextDetox. Les jeux MOBA affichent 3,2% de toxicité, les jeux de sport 2%. Variations significatives intra-genre révélant des normes communautaires spécifiques.

Sécurité IAÉvaluationsBenchmarks
SIG
75
HYP
15
arXiv cs.CL·

AstroMind: A High-Fidelity Benchmark for Spacecraft Behavior Reasoning Based on Large Language Models

AstroMind est un benchmark pour évaluer le raisonnement des LLM sur le comportement des engins spatiaux. Basé sur des simulations astrodynamiques haute fidélité, il teste l'inférence d'intention, l'estimation de paramètres de manœuvre et l'évaluation des menaces. Qwen3 (32B) excelle en inférence d'intention, QwQ (32B) en évaluation de menaces, GPT-OSS (20B) en qualité de raisonnement.

BenchmarksRaisonnementQwen
SIG
75
HYP
15
arXiv cs.CL·

Word Class Representations Spontaneously Emerge from Successor Representations Trained on Natural Language

Des chercheurs entraînent des réseaux de neurones sur WikiText-103 (103M tokens) en utilisant les Successor Representations (SR) du RL pour prédire les distributions de mots futurs. Sans supervision linguistique explicite, des catégories grammaticales (noms, verbes, adjectifs) émergent spontanément et deviennent séparables par clustering non supervisé, organisées selon l'horizon prédictif.

PapersRaisonnementEmbeddings
SIG
75
HYP
25
arXiv cs.AI·

Towards trustworthy agentic AI: a comprehensive survey of safety, robustness, privacy, and system security

Enquête complète sur la fiabilité des systèmes d'IA agentive (LLM augmentés de planification, outils, mémoire). Examine sécurité, robustesse, confidentialité et sécurité système. Propose métriques unifiées, benchmarks et stratégies d'atténuation par étape du workflow agent. Identifie défis ouverts : agents auto-évolutifs, vérification runtime, personnalisation préservant la confidentialité.

Agents IASécurité IABenchmarks
SIG
75
HYP
20
arXiv cs.LG·

TUBE: Tangent Upper Bound on Evidence for Discrete Diffusion Language Models

TUBE est une borne supérieure variationnelle sur la log-vraisemblance pour les modèles de diffusion discrets. Contrairement aux ELBO existantes, TUBE admet un estimateur Monte Carlo sans biais et s'applique aux modèles de diffusion masqués, ARMs d'ordre quelconque et leurs variantes par blocs. Les expériences montrent que les modèles de diffusion restent strictement en dessous des ARMs en vraisemblance exacte.

PapersBenchmarksÉvaluations
SIG
75
HYP
15
arXiv cs.CL·

Improving Labeling Consistency with Detailed Constitutional Definitions and AI-Driven Evaluation

Méthode pour améliorer la cohérence des étiquetages automatisés en modération de contenu. Les auteurs proposent un workflow où une IA rédige des « constitutions » détaillées par catégorie (harcèlement, discours haineux, crime non-violent), puis un LLM frontier les interprète pour générer les étiquettes. Résultat : réduction de l'incohérence cross-modèle jusqu'à 57x vs définitions paragraphes.

ÉvaluationsSécurité IAAlignement
SIG
75
HYP
15