Page 19 sur 138

ToutHaut signalRécent
5505 articles
arXiv cs.CL·

DACA-GRPO: Denoising-Aware Credit Assignment for Reinforcement Learning in Diffusion Language Models

DACA-GRPO améliore l'entraînement par renforcement des modèles de langage diffusifs en résolvant deux problèmes : l'absence d'attribution de crédit temporelle et le biais des estimations de vraisemblance. La méthode introduit des scores de progrès de débruitage et un masquage stratifié, gagnant jusqu'à 7.4pp en génération de code et 5.6pp en raisonnement mathématique.

Reinforcement learningGénération de codeRaisonnement
SIG
78
HYP
15
arXiv cs.AI·

Beyond Linear Superposition: Discovering Climate Features in AI Weather Models with KAN-SAE

KAN-SAE, un nouvel autoencodeur creux utilisant des activations B-spline non-linéaires de réseaux de Kolmogorov-Arnold, découvre 975 caractéristiques climatiques dans les modèles de prédiction météo (vs 566 pour les SAE linéaires). Sans supervision climatique, il identifie des phénomènes interprétables comme les vagues de chaleur européennes et les typhons du Pacifique.

PapersRaisonnementÉvaluations
SIG
78
HYP
25
arXiv cs.AI·

SocialMemBench: Are AI Memory Systems Ready for Social Group Settings?

SocialMemBench est un benchmark évaluant les systèmes de mémoire IA dans les groupes sociaux multi-parties (430 personas, 7,355 tours de conversation, 1,031 paires QA). Gemini 2.5 Flash atteint 0.721 sur petits réseaux vs 0.98 attendu. Les quatre frameworks open-source (Mem0, LangMem, Graphiti, Cognee) obtiennent 0.12-0.18, bien en dessous des références (0.345-0.369), révélant un écart mesurable.

BenchmarksGeminiAgents IA
SIG
78
HYP
15
arXiv cs.AI·

CounterCount: A Diagnostic Framework for Counting Bias in Vision Language Models

CounterCount est un framework de diagnostic pour évaluer les biais de comptage dans les modèles vision-langage. Les tests révèlent que les VLMs performent bien sur des images factuelles mais dégradent significativement sur des images contrefactuelles où les attributs visuels contredisent les priors appris. Une stratégie de modulation d'attention au temps d'inférence améliore la précision jusqu'à 8%.

VisionÉvaluationsBenchmarks
SIG
78
HYP
15
arXiv cs.CL·

Confidence Geometry Reveals Trace-Level Correctness in Large Language Model Reasoning

Les trajectoires de confiance au niveau des tokens dans les LLM encodent des signaux géométriques liés à la correction des traces de raisonnement. Sans accès au texte ou aux états cachés, une représentation basse dimension sépare les traces correctes des incorrectes sur GSM8K, MATH et MMLU. NeuralConf, un estimateur léger, améliore l'agrégation pondérée par confiance par rapport au vote majoritaire.

RaisonnementÉvaluationsPapers
SIG
78
HYP
25
arXiv cs.CL·

The Alpha Illusion: Reported Alpha from LLM Trading Agents Should Not Be Treated as Deployment Evidence

Étude critique des agents de trading basés sur LLM (FinCon, FinMem, TradingAgents, FinAgent, QuantAgent, FLAG-Trader). Les Sharpe ratios rapportés ne constituent pas une preuve de déploiement viable : contamination temporelle, frictions non modélisées et calibration prédictive insuffisante invalident les résultats. Propose protocole de reporting P1-P6 et architecture modulaire avec LLM comme interface d'audit.

Agents IABenchmarksPapers
SIG
78
HYP
15
arXiv cs.CL·

OpenJarvis: Personal AI, On Personal Devices

OpenJarvis propose une architecture de stack IA personnelle décomposée en cinq primitives (Intelligence, Engine, Agents, Tools & Memory, Learning) pour exécuter localement des tâches sans envoyer données sensibles au cloud. Via recherche de spec guidée par LLM, les modèles locaux atteignent la précision des modèles cloud sur 4/8 benchmarks, réduisent coût API de ~800x et latence de 4x.

Agents IARaisonnementOpen source
SIG
78
HYP
25
arXiv cs.AI·

Who Generated This 3D Asset? Learning Source Attribution for Generative 3D Models

Première étude systématique d'attribution de source pour assets 3D générés. Les chercheurs construisent un benchmark couvrant 22 générateurs 3D et proposent un Transformer multi-vue multi-modal détectant les fingerprints (incohérences cross-view, artefacts géométriques, signatures fréquentielles). Résultats : 97,22% en supervision complète, 77,17% avec 1% des données.

VisionBenchmarksSécurité IA
SIG
78
HYP
25
arXiv cs.CL·

Trust No Tool: Evaluating and Defending LLM Agents under Untrusted Tool Feedback

Étude de la « cognitive poisoning » : des outils malveillants qui accumulent la confiance via des retours bénins avant de devenir nuisibles. TRUST-Bench (1,970 épisodes) et VISTA-Guard proposent une défense basée sur le scoring du risque de l'action finale à partir de la trajectoire d'interaction. Les heuristiques classiques échouent ; le scoring conscient de la trajectoire atteint 84,2% en-domaine.

Agents IASécurité IABenchmarks
SIG
78
HYP
15
arXiv cs.AI·

Beyond Inference-Time Search: Reinforcement Learning Synthesizes Reusable Solvers

Des chercheurs montrent que le renforcement learning peut encoder des solveurs réutilisables dans les poids d'un LLM plutôt que de résoudre chaque instance à l'inférence. En fine-tunant Qwen2.5-Coder-14B avec GRPO sur Synergistic Dependency Selection, le modèle converge vers Simulated Annealing avec 5.0% de gap au solveur optimal, 91× moins cher qu'un Best-of-64 baseline.

Reinforcement learningGénération de codeQwen
SIG
78
HYP
25
arXiv cs.CL·

Entropy-Gradient Inversion: Moving Toward Internal Mechanism of Large Reasoning Models

Les chercheurs identifient l'Entropy-Gradient Inversion, une corrélation négative entre l'entropie des tokens et les gradients de logits, comme signature géométrique des capacités de raisonnement des grands modèles. Ils proposent CorR-PO, une méthode d'optimisation par renforcement qui intègre cette signature dans la régularisation des récompenses, surpassant les baselines sur plusieurs benchmarks de raisonnement.

RaisonnementReinforcement learningBenchmarks
SIG
78
HYP
25
arXiv cs.AI·

DashAttention: Differentiable and Adaptive Sparse Hierarchical Attention

DashAttention propose une méthode d'attention hiérarchique sparse différentiable utilisant la transformation α-entmax adaptative pour sélectionner un nombre variable de blocs KV. Contrairement à NSA et InfLLMv2, elle maintient la différentiabilité complète et atteint 75% de sparsité avec précision comparable à l'attention complète. Implémentation GPU en Triton offre accélération significative.

RaisonnementBenchmarksInfrastructure
SIG
78
HYP
25
arXiv cs.AI·

EndoCogniAgent: Closed-Loop Agentic Reasoning with Self-Consistency Validation for Endoscopic Diagnosis

EndoCogniAgent est un framework d'agents fermés pour le diagnostic endoscopique itératif. Il couple l'acquisition d'évidences visuelles et le raisonnement multi-étapes via validation d'auto-cohérence (cohérence avec l'image et cohérence temporelle). Sur EndoAgentBench (6 132 QA de 11 datasets), le système atteint 85,23% en perception et 71,13% d'acceptabilité clinique.

Agents IARaisonnementVision
SIG
78
HYP
25
arXiv cs.AI·

ALIGN: A Vision-Language Framework for High-Accuracy Accident Location Inference through Geo-Spatial Neural Reasoning

ALIGN est un framework vision-langage pour inférer les coordonnées précises d'accidents routiers à partir de rapports d'actualité en bengali et d'indices cartographiques. Utilisant une architecture agentique combinant OCR, LLM et vision-langage, le système réduit l'erreur de localisation de 10,9 km à 0,593 km en validation et 0,465 km sur données officielles de Dhaka.

VisionAgents IAMulti-agents
SIG
78
HYP
25
arXiv cs.AI·

QuickLAP: Quick Language-Action Preference Learning for Semi-Autonomous Agents

QuickLAP fusionne retours physiques et linguistiques pour apprendre les fonctions de récompense de robots en temps réel. Le framework bayésien utilise des LLM pour extraire des masques d'attention et des préférences du langage libre, intégrés aux corrections physiques via une règle de mise à jour fermée. Réduction d'erreur de 70% vs baselines en simulation de conduite autonome.

Agents IAReinforcement learningRaisonnement
SIG
78
HYP
25
arXiv cs.CL·

Vision-OPD: Learning to See Fine Details for Multimodal LLMs via On-Policy Self-Distillation

Vision-OPD propose une auto-distillation régionale-globale pour améliorer la compréhension visuelle fine des MLLMs. Le framework transfère la perception privilégiée du modèle sur des crops centrés sur les preuves vers sa politique pleine image, via minimisation de divergence KL token-level sur rollouts on-policy. Résultats compétitifs sur benchmarks de compréhension visuelle fine sans modèles externes ni labels.

VisionReinforcement learningPapers
SIG
78
HYP
25
arXiv cs.AI·

Inference-Time Diversity in RL-Trained Lean Theorem Provers: A Diagnostic Study

Les prouveurs de théorèmes Lean entraînés par RL souffrent d'effondrement modal à l'inférence : doubler l'échantillonnage de k=32 à k=64 sur miniF2F-test avec DeepSeek-Prover-V1.5-RL ne résout zéro théorème supplémentaire (42/244). Une diversité structurelle fixe de 15 squelettes tactiques récupère +45% d'amélioration relative à k=16 (+12.3±4.2 théorèmes). Le phénomène est spécifique à RL et orthogonal au scaling.

RaisonnementReinforcement learningBenchmarks
SIG
78
HYP
15
arXiv cs.AI·

When Personalization Legitimizes Risks: Uncovering Safety Vulnerabilities in Personalized Dialogue Agents

Étude révélant une vulnérabilité de sécurité dans les agents dialogues personnalisés : la mémoire à long terme biaise l'inférence d'intention et légitime des requêtes nuisibles. PS-Bench, un benchmark, montre que la personnalisation augmente les taux de succès d'attaque de 15,8 % à 243,7 % comparé aux baselines sans état. Une méthode de détection-réflexion légère est proposée pour réduire cette dégradation.

Sécurité IAAgents IABenchmarks
SIG
78
HYP
25
arXiv cs.CL·

Supervising the search process produces reliable and generalizable information-seeking agents

RAG-Gym, un framework de supervision du processus de recherche plutôt que des réponses finales, améliore les agents de recherche autonomes. Re²Search++ utilise la supervision de processus et la réflexion de raisonnement pour générer des requêtes de meilleure qualité, avec gains significatifs sur les benchmarks multi-hop et meilleure généralisation hors-domaine.

RAGAgents IARaisonnement
SIG
78
HYP
22
arXiv cs.AI·

Ontology-Constrained Neural Reasoning in Enterprise Agentic Systems: A Neurosymbolic Architecture for Domain-Grounded AI Agents

Architecture neurosymbolique avec ontologies (Role, Domain, Interaction) pour agents LLM en entreprise. Expérience contrôlée (1 800 runs, Claude Sonnet 4, Qwen 2.5 72B, Gemma 4 26B) : agents ontologie-contraints surpassent agents non-grounded sur précision métrique et cohérence de rôle (p < .001). Gain 2x plus élevé sur domaines localisés (Vietnam) où couverture LLM est faible.

Agents IAClaudeRaisonnement
SIG
78
HYP
25
arXiv cs.CL·

Unlearning Isn't Deletion: Investigating Reversibility of Machine Unlearning in LLMs

Étude montrant que l'oubli dans les LLM supprime l'information en surface seulement : les modèles retrouvent leur comportement original via un fine-tuning minimal. Les auteurs proposent un cadre d'analyse au niveau représentationnel (PCA, CKA, Fisher information) pour évaluer la véritable suppression de données et identifient quatre régimes d'oubli selon réversibilité et catastrophicité.

PapersSécurité IAAlignement
SIG
78
HYP
15
arXiv cs.AI·

MolClaw: An Autonomous Agent with Hierarchical Skills for Drug Molecule Evaluation, Screening, and Optimization

MolClaw est un agent autonome avec architecture hiérarchique à 3 niveaux (70 compétences) pour l'évaluation, le criblage et l'optimisation de molécules pharmaceutiques. Il intègre 30+ ressources spécialisées et atteint des performances SOTA sur MolBench, un benchmark de 8 à 50+ appels d'outils séquentiels. Les gains proviennent principalement de l'orchestration de workflows structurés.

Agents IAMulti-agentsBenchmarks
SIG
78
HYP
25
arXiv cs.AI·

EnactToM: An Evolving Benchmark for Functional Theory of Mind in Embodied Agents

EnactToM est un benchmark d'IA évolutif contenant 300 tâches multi-agents en environnement 3D avec observabilité partielle. Il teste la capacité des agents à agir sur des croyances implicites (ToM fonctionnelle) plutôt que de répondre à des questions directes. Les 7 modèles frontière évalués obtiennent 0% sur les tâches difficiles, révélant des défaillances en coordination épistémique.

Multi-agentsRaisonnementBenchmarks
SIG
78
HYP
25
arXiv cs.CL·

Red-Bandit: Test-Time Adaptation for LLM Red-Teaming via Bandit-Guided LoRA Experts

Red-Bandit est un framework de red-teaming qui adapte en temps réel des experts LoRA spécialisés dans différents styles d'attaque (manipulation, argot) via apprentissage par renforcement. Un algorithme de bandit multi-bras sélectionne dynamiquement l'expert optimal selon la sécurité des réponses du modèle cible. Résultats SOTA sur AdvBench avec prompts plus lisibles.

Sécurité IAFine-tuningReinforcement learning
SIG
78
HYP
25
arXiv cs.AI·

Property-Guided LLM Program Synthesis for Planning

Approche de synthèse de programmes guidée par propriétés formelles pour réduire les coûts LLM. Au lieu de scores numériques simples, le système vérifie si un candidat satisfait une propriété définie formellement et fournit des contre-exemples concrets en cas de violation. Sur des domaines PDDL, cette méthode génère 7× moins de programmes et réduit drastiquement les coûts d'évaluation.

Génération de codeRaisonnementReinforcement learning
SIG
78
HYP
15
arXiv cs.AI·

LightTransfer: Your Long-Context LLM is Secretly a Hybrid Model with Effortless Adaptation

LightTransfer transforme les modèles de langage (LLaMA, Mistral, QwQ-STILL) en architectures hybrides sans entraînement. La méthode identifie les couches « paresseuses » et remplace leur attention complète par une attention en streaming, réduisant les coûts de cache KV. Résultats : jusqu'à 2,17× d'amélioration de débit avec <1,5% de perte sur LongBench et 53,3% sur AIME24.

LlamaMistralQwen
SIG
78
HYP
25