Archives

mai 2026

3147 articles

arXiv cs.AI·

Identifying and Understanding Human Values in Text: A Tailorable LLM-based Architecture

Architecture modulaire basée sur LLM pour détecter et quantifier l'intensité des valeurs humaines dans du texte. Trois modules coordonnés : génération de spécifications de valeurs, étiquetage de textes, assignation de support/résistance gradué. Évaluation sur ValueEval dataset avec plusieurs LLMs, démontrant la généralité du pipeline.

AlignementÉvaluationsRaisonnement
SIG
72
HYP
18
arXiv cs.AI·

Hierarchical Prompt-Domain Control and Learning for Resource-Constrained Agentic Language Models

Framework hiérarchique pour LLMs compacts en systèmes agentiques sous contraintes (mémoire, latence, coût). Distillation du modèle + boucle oracle-contrôleur qui valide les protocoles, projette l'historique dans un domaine de prompt viable, et déclenche du fine-tuning léger. Séparation entre apprentissage du schéma et adaptation sémantique. Évaluation sur Multi-Fidelity Bayesian Optimization.

Agents IAFine-tuningPrompt engineering
SIG
72
HYP
18
arXiv cs.AI·

Intelligence as Managed Autonomy: Failure, Escalation, and Governance for Agentic AI Systems

Papier proposant SMARt, un framework formel pour gérer l'autonomie des systèmes IA agentic. Introduit une théorie de l'autonomie gérée basée sur la détection de la dérive épistémique, la suspension du raisonnement et l'escalade vers un contrôle humain. Utilise des réseaux de Petri temporisés pour garantir des propriétés de sécurité et de gouvernance.

Agents IASécurité IAAlignement
SIG
75
HYP
15
arXiv cs.AI·

LaneRoPE: Positional Encoding for Collaborative Parallel Reasoning and Generation

LaneRoPE permet à plusieurs séquences générées en parallèle de collaborer lors de l'inférence. La méthode ajoute un masque d'attention inter-séquences et étend RoPE pour capturer les positions relatives entre tokens dans et hors d'une séquence. Tests sur raisonnement mathématique montrent des gains de précision avec surcharge minimale.

RaisonnementPrompt engineeringBenchmarks
SIG
72
HYP
28
arXiv cs.CL·

EvoSpec: Evolving Speculative Decoding via Real-Time Vocabulary and Parameter AdaptationTarget

EvoSpec améliore le décodage spéculatif en adaptant dynamiquement le vocabulaire et les paramètres du modèle de brouillon en temps réel. Via indexation sémantique et apprentissage par curriculum, il maintient un taux d'acceptation élevé dans les domaines spécialisés (code, droit, médecine). Sur EAGLE-3 : 1.13x speedup vs FR-Spec avec 27% moins de mémoire.

Génération de codeRaisonnementInfrastructure
SIG
78
HYP
25
arXiv cs.CL·

Simorgh at SemEval-2026 task 7: Region-Aware Hybrid Retrieval for Low-Resource Cultural Reasoning in Multilingual Question Answering

Simorgh propose une approche de récupération hybride (BM25 + similarité sémantique) avec pondération régionale pour répondre à des questions culturelles multilingues sur le benchmark BLEnD (30 langues). Utilise Qwen3-14B quantisé. Améliore la stabilité cross-lingue mais révèle des écarts de performance liés au déséquilibre des données d'entraînement.

RAGBenchmarksQwen
SIG
72
HYP
18
arXiv cs.LG·

Transferable Reinforcement Learning via Probabilistic Latent Embeddings and Dynamic Policy Adaptation for Sim-to-Real Deployment

Framework RL pour transfert de politique sim-to-real via embeddings latents probabilistes et adaptation dynamique. Utilise meta-RL et CMDPs pour inférer la représentation latente de l'environnement, avec formulation distributional RL ajustant dynamiquement les niveaux de risque selon la précision d'estimation du contexte latent.

Reinforcement learningRobotiqueSécurité IA
SIG
72
HYP
18
arXiv cs.AI·

Discovery Agents for Real-Time Analytics: Toward Proactive Insight Systems

Architecture multi-agent autonome pour découverte d'insights en temps réel sur flux de données. Boucle continue : génération d'hypothèses, compilation en analytics exécutables, validation, visualisations. Utilise Kafka, Flink, LLM. Design basé contrats avec artefacts typés pour modularité et traçabilité. Démontrée sur retail, finance, données publiques.

Agents IAMulti-agentsPapers
SIG
72
HYP
28
arXiv cs.LG·

Resource-Constrained Affect Modelling via Variance Regularisation Pruning

Variance-Regularised Pruning (VR) est une méthode de compression de modèles pour l'affective computing qui priorise la stabilité inter-utilisateurs plutôt que la seule parcimonie. Testée sur le dataset AGAIN (9 environnements de jeu), VR maintient des performances CCC compétitives à 80% de sparsité sans fine-tuning supplémentaire, adaptée aux systèmes embarqués.

ÉvaluationsFine-tuningPapers
SIG
72
HYP
15
arXiv cs.LG·

Tackling Multimodal Learning Challenges with Mixture-of-Expert: A Survey

Enquête systématique sur l'application des Mixture-of-Experts (MoE) au apprentissage multimodal. Analyse MoE sous trois angles : moteur efficace (scalabilité, réduction redondance), apprenant en représentation (alignement multi-expert), adaptateur modulaire (déséquilibre modalités, données manquantes). Identifie lacunes : routage interprétable, communication experts, intégration modalités, apprentissage continu.

VisionEmbeddingsPapers
SIG
65
HYP
25
arXiv cs.LG·

Comparative Analysis of Liquid Neural Networks and LSTM for Sequential Pattern Recognition: Robustness, Efficiency, and Clinical Utility

Étude comparative entre réseaux de neurones liquides (LNN/CfC) et LSTM sur quatre modalités séquentielles (N-MNIST, QuickDraw, IAM, PhysioNet Sepsis-3). Les LNN modélisent l'évolution de l'état caché comme équation différentielle continue. Résultats : LNN surpassent LSTM en efficacité paramétrique et robustesse face aux données manquantes, particulièrement en domaines cliniques.

BenchmarksRaisonnement
SIG
72
HYP
18
arXiv cs.LG·

SparseOpt: Addressing Normalization-induced Gradient Skew in Sparse Training

SparseOpt, un optimiseur conscient de la parcimonie, résout le problème de gradient asymétrique induit par la normalisation par batch en entraînement sparse dynamique. Tests sur ResNet (CIFAR-100, ImageNet) montrent convergence plus rapide et meilleure généralisation. Première étude systématique de l'interaction entre Batch Normalization, couches sparse et DST.

PapersBenchmarksFine-tuning
SIG
72
HYP
18
arXiv cs.LG·

Detect by Yourself: Self-Designing Agentic Workflows for Few-Shot Graph Anomaly Detection

SignGAD propose un framework d'agents auto-configurables pour la détection d'anomalies en graphes avec peu d'exemples. Au lieu d'utiliser un détecteur fixe, le système conçoit des workflows adaptés à chaque tâche en sélectionnant encodages et designs de détecteurs appropriés. Une stratégie de refit gardée affine les workflows sélectionnés sous supervision limitée.

Agents IABenchmarksPapers
SIG
72
HYP
28
arXiv cs.CL·

TRACES: Proactive Safety Auditing for Multi-Turn LLM Agents via Trajectory-State Modeling

TRACES est un auditeur de sécurité proactif pour agents LLM multi-tours qui détecte les dérives vers des comportements dangereux à partir des représentations cachées d'un LLM observateur. Entraîné avec supervision faible au niveau trajectoire, il produit des estimations denses de risque à chaque étape, améliorant la prédiction de sécurité et la discrimination des risques sur plusieurs benchmarks.

Agents IASécurité IARaisonnement
SIG
78
HYP
22
arXiv cs.LG·

Balancing Fidelity and Diversity in Diffusion Models via Symmetric Attention Decomposition: Hopfield Perspective

Article théorique décomposant la matrice d'attention pré-softmax en composantes symétrique et antisymétrique. La partie symétrique gouverne le paysage énergétique, la partie antisymétrique pilote la circulation. Les auteurs proposent des mesures de stabilité Hopfield pour quantifier la fidélité-diversité en génération et un contrôle pour moduler ce compromis.

RaisonnementPapersVision
SIG
72
HYP
15
arXiv cs.LG·

A Simple State Space Model Excels at Multivariate Time Series Classification

Étude systématique comparant les modèles d'espace d'état (SSM) pour la classification de séries temporelles. S4D surpasse les variantes Mamba en précision et efficacité. Les auteurs proposent MS4 et MS4N, versions légères de S4D avec projection linéaire et mélange de canaux. Évaluation sur 59 datasets (MONSTER, UEA) : MS4N égale des modèles 10× plus grands en paramètres.

BenchmarksPapersRaisonnement
SIG
82
HYP
15
arXiv cs.LG·

Personalized Observation Normalization for Federated Reinforcement Learning in Simulation Environments with Heterogeneity

Méthode de normalisation d'observation personnalisée (PON) pour l'apprentissage par renforcement fédéré en environnements hétérogènes. Chaque agent normalise localement ses entrées d'état avec moyenne et variance mises à jour continuellement, évitant les problèmes d'agrégation de paramètres déséquilibrés. Tests sur tâches MuJoCo hétérogènes montrent accélération d'entraînement et performance supérieure.

Reinforcement learningMulti-agents
SIG
72
HYP
18
arXiv cs.CL·

Narrative Flattening: How Post-Training Compresses Thematic, Affective, and Stylistic Variation in LLM Fiction

Étude sur quatre checkpoints OLMo 32B montrant que le post-training (SFT, DPO, RLVR) compresse la variation narrative en réduisant les transitions thématiques, l'intensité émotionnelle et la diversité stylistique. L'effet « narrative flattening » est plus marqué sur la fiction littéraire professionnelle que sur les histoires de plateformes publiques.

PapersFine-tuningAlignement
SIG
75
HYP
15
arXiv cs.LG·

High-Fidelity Industrial Crash Dynamics Prediction via Geometry-Aware Operator Learning with Memory-Efficient Low-Rank Attention

GeoTransolver, un framework d'operator learning géométrie-aware, prédit avec précision la dynamique de crash automobile à l'échelle industrielle. Sur des datasets de bumper beam et véhicule complet, il capture les déformations plastiques et profils d'accélération. Une modification FLARE réduit la mémoire de 2x tout en améliorant la précision pour les transitoires haute-fréquence.

PapersBenchmarksRaisonnement
SIG
72
HYP
25
arXiv cs.CL·

VibeSearchBench: Benchmarking Long-horizon Proactive Search in the Wild

VibeSearchBench évalue les agents LLM sur la recherche collaborative multi-tour en contexte réel. Le benchmark contient 200 tâches bilingues (chinois/anglais) sur 20 domaines, avec graphes de connaissances sans schéma fixe. Sept modèles frontière testés obtiennent F1 max 30.30, révélant des lacunes en raisonnement long-contexte et élicitation d'intention.

BenchmarksAgents IARaisonnement
SIG
72
HYP
25
arXiv cs.AI·

Soro: A Lightweight Foundation Model and Chatbot for Tajik

Soro est une famille de modèles de langage spécialisés en tadjik, basée sur Gemma 3, entraînée sur 1,9 milliard de tokens tadjiks (web, PDF, matériel éducatif). Après fine-tuning supervisé sur 40K exemples, Soro surpasse Gemma 3 sur des benchmarks tadjiks créés par les auteurs et conserve les performances en anglais. Quantification FP8/INT4 validée pour déploiement edge en milieu scolaire.

GeminiFine-tuningBenchmarks
SIG
72
HYP
18
arXiv cs.LG·

Metric-Aware PCA as a Linear Instance of Geometric Deep Learning

Article théorique positionnant l'Analyse en Composantes Principales Métrique-Consciente (MAPCA) dans le cadre du deep learning géométrique. MAPCA paramétre l'ACP par une matrice métrique définie positive, avec solutions équivariantes sous le groupe orthogonal préservant la métrique. Un théorème d'unicité caractérise l'ACP Invariante comme unique métrique linéaire équivariante sous rescaling diagonal.

PapersRaisonnement
SIG
72
HYP
15
arXiv cs.LG·

Architecture-driven Shift: towards a lightweight selector for capturing the trends of logit shift

Nouvelle métrique Architecture-driven Shift (ADS) pour sélectionner efficacement les modèles pré-entraînés en apprentissage continu. ADS décompose le logit shift en dépendances architecturales et données, révélant que la combinaison capture bien la tendance du logit shift avec peu d'échantillons. Validation sur 175+ architectures avec corrélation Spearman ≥0.731.

Reinforcement learningBenchmarksPapers
SIG
72
HYP
18
arXiv cs.LG·

$E^3$-Agent: An Executable and Evolving Agent for Resource Management of Edge Generative Inference

E³-Agent est un agent IA exécutable et adaptatif pour la gestion des ressources d'inférence générative sur edge. Il combine un routeur rapide (décisions en millisecondes) et un contrôleur LLM lent piloté par événements, apprenant en ligne des retours d'exécution. Évalué en simulation, il réduit la latence de 65-73% vs baselines statiques sur scénarios dynamiques (sémantique, churn, drift).

Agents IARaisonnementInfrastructure
SIG
72
HYP
28
arXiv cs.CL·

UniMaia: Steering Chess Policies with Language for Human-like Play

UniMaia est un framework qui contrôle une politique d'échecs (Lc0) via des prompts en langage naturel, sans réentraînement multimodal complet. Un encodeur texte léger et un mécanisme ControlNet permettent de moduler le jeu (sélection d'ouverture, niveau). UniMaia-Aux ajoute des objectifs temporels et de prédiction comportementale. Résultats SOTA sur benchmarks prompt-conditionnés.

Prompt engineeringRaisonnementFine-tuning
SIG
72
HYP
25
arXiv cs.LG·

Bayesian Deployment Approval for Learned Landing Controllers under Finite Rollout Validation

Framework bayésien pour valider le déploiement de contrôleurs d'atterrissage autonomes entraînés par RL. Utilise l'inférence bayésienne pour quantifier l'incertitude sur la capacité réelle des politiques, au-delà des métriques empiriques (reward, taux de succès). Expériences avec PPO et SAC montrent que l'optimisation empirique surconfiance, tandis que l'inférence bayésienne calibre mieux la confiance de déploiement.

Reinforcement learningSécurité IARobotique
SIG
72
HYP
15
arXiv cs.CL·

UserHarness: Harnessing User Minds for Stronger Agent Theory-of-Mind

UserHarness propose un cadre pour améliorer la théorie de l'esprit (ToM) des agents IA en reconstituant explicitement l'état mental de l'utilisateur. Le système décompose les observations, croyances, intentions et actions de l'utilisateur. Sur cinq benchmarks, UserHarness atteint 95,94% de précision macro, surpassant les méthodes existantes de plus de 15% en relatif.

Agents IARaisonnementBenchmarks
SIG
75
HYP
25
arXiv cs.CL·

Escape the Language Prior: Mitigating Late-Stage Modality Collapse in Audio Reasoning via Modality-Aware Policy Optimization

Modality-Aware Policy Optimization (MAPO) corrige l'effondrement modal tardif dans les modèles audio-texte lors du fine-tuning par RL. La méthode concentre les gradients de politique sur les tokens critiques via un masque de pertinence modale et ajoute une pénalité d'attention pour maintenir l'ancrage cross-modal. MAPO atteint SOTA sur plusieurs benchmarks audio complexes.

Reinforcement learningRaisonnementAlignement
SIG
78
HYP
25
arXiv cs.CL·

Cultural Fidelity in English-to-Hindi Translation: A Preservation-Fluency Frontier for Gender Recoverability

Étude sur la préservation du genre dans la traduction anglais-hindi. Benchmark de 37 345 instances montre que GPT-4o-mini et Sarvam effacent fréquemment le genre via constructions ergatives. Deux rérankers (SAR et PAR) améliorent la récupérabilité du genre : PAR passe de 11-16% à 49-54% en précision, mais réduit la fluidité (4.36→3.37). Révèle un compromis préservation-fluidité.

BenchmarksVisionAlignement
SIG
78
HYP
15
arXiv cs.LG·

The Energy Blind Spot: NVIDIA's Flagship Edge AI Hardware Cannot Support Process-Level Energy Attribution

NVIDIA's GB10 edge AI hardware (ASUS Ascent GX10) manque de compteurs d'énergie CPU et d'interfaces de monitoring (IPMI, SCMI). Seule la puissance GPU instantanée est exposée via NVML. Les workloads agentic consomment 4.33x plus d'énergie que les baselines linéaires. L'attribution énergétique par processus reste impossible sur cette plateforme contrairement à x86/RAPL.

Agents IABenchmarksInfrastructure
SIG
75
HYP
15
arXiv cs.LG·

IGADA-IoT: IoT Sensor Energy Optimization in Wireless Sensor Networks Driven by Automatic Data Augmentation

IGADA-IoT propose un cadre d'augmentation automatique de données guidé par les écarts informationnels pour optimiser l'énergie des capteurs IoT dans les réseaux de capteurs sans fil. La méthode utilise une collaboration hiérarchique multi-générateurs (HMGCS) et une évaluation conjointe écart-performance (IGMP-EC). Résultats : +7,27% de précision moyenne, +8,67% vs méthodes avancées.

ÉvaluationsFine-tuning
SIG
65
HYP
25
arXiv cs.CL·

BioELX: Cross-lingual Biomedical Entity Linking via Alias-based Retrieval and LLM Ranking

BioELX est un système de liaison d'entités biomédicales multilingues en deux étapes sans données d'entraînement annotées. Il enrichit SapBERT avec des alias multilingues Wikidata et utilise un LLM pour la désambiguïsation contextuelle. Sur cinq benchmarks, il atteint +19.2 Recall@1 sur XL-BEL, avec gains majeurs pour langues peu dotées (turc +21.6, coréen +22.1, thaï +30.8).

BenchmarksPapersRAG
SIG
78
HYP
15
arXiv cs.AI·

Operational AI Deployment Assurance: Governance-State Orchestration Under Threshold-Sensitive Deployment Conditions -- A Governance Framework for High-Stakes AI Systems

OADA est un cadre de gouvernance IA pour les systèmes critiques qui traduit l'instabilité des métriques d'équité, la sensibilité aux seuils et l'incertitude opérationnelle en décisions de déploiement. Testé sur la reconnaissance faciale et la santé, il introduit des scores d'assurance, des états d'escalade et des zones de stabilité pour contrôler le déploiement plutôt que de simplement auditer post-hoc.

Sécurité IAAlignementÉvaluations
SIG
62
HYP
28
arXiv cs.CL·

Unlocking Fine-Grained and Within-Utterance Speaking Style Control in Prompt-Based Text-to-Speech Models

Méthode pour contrôler finement le style vocal dans les modèles TTS basés sur prompts. Interpolation entre styles via vecteurs directionnels dans l'espace d'embedding (99-100% succès conversion genre, variation pitch 36 Hz). Transitions intra-énoncé via KV-cache swapping et sliding-window attention masking (similarité locuteur 0.81-0.91).

VoixPrompt engineeringPapers
SIG
72
HYP
18
arXiv cs.LG·

A Paired Testing Protocol for Batch-Conditioned Refusal Robustness in LLM Serving

Étude arXiv sur la robustesse du refus des LLM en fonction de la configuration de batch. Protocole de test appairé sur 15 modèles révèle 0,16% de changements de label de sécurité authentiques. vLLM avec BATCH_INVARIANT=1 élimine les instabilités détectées (22→0 flips). Recommandation : valider le refus dans l'environnement de serving réel.

Sécurité IAÉvaluationsBenchmarks
SIG
78
HYP
15
arXiv cs.CL·

Retrieval, Reward, and Training Protocols: What Matters in Training Search Agents?

Étude empirique contrôlée sur l'entraînement d'agents de recherche LLM. Les auteurs isolent trois dimensions : (1) un problème de couverture de données dans Wikipedia 2018 qui explique plus de gains que les différences algorithmiques, (2) les récompenses outcome-based surpassent les approches process-based, (3) analyse de la diversité des données et du budget de recherche. Code disponible.

Agents IARAGReinforcement learning
SIG
78
HYP
15
arXiv cs.AI·

A Policy-Driven Runtime Layer for Agentic LLM Serving

Article proposant une couche runtime intermédiaire entre framework agent et moteur de serving LLM. Introduit quatre primitives (observe, score, predict, act) pour implémenter des politiques agent-aware (caching KV, batch shaping, spéculation, fairness, sécurité). CacheSage, instance pour caching cross-session, atteint +13 à +37 pp hit-rate, -12 à -29% TTFT, +6 à +14% throughput sur workloads multi-agent réels.

Agents IAMulti-agentsInfrastructure
SIG
78
HYP
25
arXiv cs.LG·

Fine-Tuning Dynamics of In-Context Factual Recall in Transformers

Étude théorique de la dynamique d'apprentissage en contexte (in-context learning) dans les transformers. Les auteurs formalisent la tâche IC-recall où le modèle doit inférer une relation cachée à partir d'exemples et récupérer des connaissances factuelles stockées dans ses paramètres. Preuve que le fine-tuning converge vers un motif d'attention spécifique avec un nombre d'échantillons polylogarithmique.

RaisonnementFine-tuningPapers
SIG
78
HYP
15
arXiv cs.LG·

Heterogeneous Parallelism for Multimodal Large Language Model Training

Papier arXiv proposant une approche de parallélisme hétérogène pour l'entraînement de modèles multimodaux. Permet aux encodeurs et LLM d'utiliser des layouts de sharding indépendants (TP/CP/PP/DP/EP) sur GPUs partagés ou disjoints. Améliore le throughput jusqu'à 49,3% en configuration colocalisée et 13% en non-colocalisée. Implémentation open-source en extension Megatron-LM.

InfrastructurePapersBenchmarks
SIG
78
HYP
15
arXiv cs.LG·

Faster Thermal Profiling of a Lunar Rover with Machine Learning Adapted Finite Difference Model

Un framework de machine learning informé par la physique (PIML) pour modéliser thermiquement un rover lunaire. Un réseau de neurones adaptatif détermine le maillage 3D en différences finies selon les charges thermiques, améliorant la précision de 50% vs modèles coarse-mesh et 39% vs ANN pur, tout en étant 3x plus rapide que les simulations haute-fidélité.

RaisonnementBenchmarksRobotique
SIG
72
HYP
15
arXiv cs.LG·

Supervised Distributional Reduction via Optimal Transport and Dependence Maximization

SDR (Supervised Distributional Reduction) combine le transport optimal et la maximisation de dépendance pour apprendre des représentations cibles. L'algorithme étend l'objectif Fused Gromov-Wasserstein avec un terme de dépendance explicite, produisant des embeddings compacts qui capturent structure géométrique et signal prédictif. Application aux processus gaussiens avec noyaux adaptatifs.

Papers
SIG
72
HYP
15
arXiv cs.LG·

Can Entry-Wise Clipping Give Spectral Control of Stochastic Gradients?

Article théorique sur le contrôle spectral du bruit de gradient stochastique via clipping entrée-par-entrée. Montre qu'une méthode simple d'écrêtage entrée-par-entrée peut équilibrer structure matricielle et coût computationnel, avec garanties de convergence O(ε⁻⁴) sous bruit Cauchy-contaminé. Gains empiriques : ~7% de tokens économisés sur NanoGPT avec shrinkage lisse, ~2% supplémentaires combiné avec Muon.

PapersReinforcement learningBenchmarks
SIG
72
HYP
15
arXiv cs.CL·

From AR to Diffusion: Efficiently Adapting Large Language Models with Strictly Causal and Elastic Horizons

FLUID adapte efficacement les modèles de langage autorégressifs (AR) à la génération par diffusion via l'alignement causal strict et les horizons élastiques. Le framework réduit les coûts d'entraînement de plusieurs ordres de magnitude en réutilisant les checkpoints GPT existants, tout en maintenant la performance état-de-l'art.

Génération de codeFine-tuningRaisonnement
SIG
75
HYP
25
arXiv cs.AI·

SkillGrad: Optimizing Agent Skills Like Gradient Descent

SkillGrad optimise les compétences d'agents LLM via une approche inspirée de la descente de gradient. Les exécutions de tâches fournissent des signaux de perte, des diagnostics automatiques génèrent des gradients textuels, et un agent avec momentum accumule les patterns récurrents. Évalué sur SpreadsheetBench et WikiTableQuestions, SkillGrad surpasse les baselines de 6,7 points en moyenne.

Agents IAReinforcement learningPrompt engineering
SIG
78
HYP
25
arXiv cs.AI·

PEAM: Parametric Embodied Agent Memory through Contrastive Internalization of Experience in Minecraft

PEAM est un framework de mémoire d'agent incarné dans Minecraft qui internalise l'expérience en paramètres plutôt qu'en récupération à l'inférence. Il combine un LLM lent pour le raisonnement avec un module paramétrique rapide (Mixture-of-Experts LoRA) apprenant par clonage comportemental et objectif contrastif. Les échecs sont utilisés comme signaux d'entraînement pour apprendre les corrections.

Agents IAReinforcement learningFine-tuning
SIG
78
HYP
25
arXiv cs.CL·

ReverseMath: Answer Inversion for Scalable and Verifiable Mathematical Problem Generation

ReverseMath génère automatiquement de nouveaux problèmes mathématiques en inversant réponse et inconnue : masquer une valeur numérique, traiter la réponse originale comme condition connue, réécrire le problème. Détecte la mémorisation en comparant performances sur paires original/inversé. Améliore le raisonnement mathématique via augmentation de données pour RL.

BenchmarksRaisonnementReinforcement learning
SIG
78
HYP
18
arXiv cs.CL·

Reading or Guessing? Visual Grounding Failures of Vision-Language Models for OCR in Ancient Greek Editions

Étude comparative de modèles vision-langage (VLM) versus OCR traditionnel sur des éditions critiques du grec ancien. Les VLM génèrent du texte plausible mais non visuellement fondé, révélant une dépendance excessive aux priors linguistiques. Perturbations d'images et mesures d'ancrage au niveau des tokens montrent que les erreurs fluentes persistent même sans signal visuel.

VisionÉvaluationsPapers
SIG
72
HYP
15
arXiv cs.CL·

Bridging the Stability-Expressivity Gap: Synthetic Data Scaling and Preference Alignment for Low-Resource Spoken Language Models

Les modèles de langage parlé (SLM) pour la synthèse vocale en langues peu dotées souffrent d'un compromis : les données synthétiques améliorent la précision phonétique mais suppriment la variabilité prosodique (Synthetic Erosion). Les auteurs proposent deux cadres d'auto-alignement (DGSA et TDSC) pour récupérer l'expressivité, surpassant ElevenLabs et Gemini Pro, avec clonage vocal zéro-shot pour le lao.

VoixPapersRaisonnement
SIG
72
HYP
28
arXiv cs.CL·

StoryMI: Steerable Multi-Agent Therapeutic Dialogue Generation

StoryMI est un framework multi-agent LLM pour générer des dialogues thérapeutiques d'entretien motivationnel (MI) contrôlables. Des profils clients basés sur questionnaires sont enrichis en histoires narratives. Des agents thérapeute/client génèrent des énoncés codifiés MI, coordonnés par un agent d'interaction. Évaluation sur 6K dialogues simulés couvrant 12 codes MI et 13 domaines symptomatiques.

Multi-agentsAgents IABenchmarks
SIG
78
HYP
15
arXiv cs.AI·

Prefix-Safe Bayesian Belief Tracking for LLM Reasoning Reliability:Separating Calibration from Ranking

Méthode de suivi bayésien séquentiel (SBBT) pour estimer la fiabilité des traces de raisonnement LLM avant la réponse finale. Évalue P(y=1|o_{1:t}) sur MATH-500, GSM8K, AIME 2025, RIMO-N. Les scores scalaires améliorent la calibration (Brier), tandis que les signaux structurés gagnent +0.110 AUROC en mathématiques difficiles.

RaisonnementÉvaluationsBenchmarks
SIG
72
HYP
18
arXiv cs.CL·

MERIT: Matching Expertise via Rubric-Informed Training for Reviewer Assignment

MERIT est un framework en deux étapes pour l'assignation de relecteurs scientifiques à grande échelle. Un modèle de 4B paramètres entraîné par RL évalue l'adéquation entre soumissions et relecteurs via des rubriques d'expertise guidées par un juge LLM, puis distille ses prédictions dans un retriever embedding. Surpasse les LLMs génériques sur LR-Bench et CMU Gold dataset.

Reinforcement learningPapersBenchmarks
SIG
78
HYP
22
arXiv cs.LG·

Explicit Critic Guidance for Aligning Diffusion Models

Nouvelle méthode d'apprentissage par renforcement en ligne pour aligner les modèles de diffusion avec des objectifs non-différentiables. Framework actor-critic où le modèle de diffusion prédit directement les valeurs sur états latents bruyants, permettant l'entraînement PPO au niveau trajectoire et l'optimisation multi-récompenses. Surpasse les baselines sur benchmarks UNet et DiT.

Reinforcement learningAlignementPapers
SIG
78
HYP
15
arXiv cs.AI·

C-MIG: Multi-view Information Gain-based Retrieval-Augmented Generation for Clinical Diagnosis Reasoning

C-MIG propose un framework RAG avec apprentissage par renforcement pour le diagnostic clinique. Il utilise un gain d'information multi-vue (documents récupérés + raffinement) pour améliorer la supervision des modèles de langage, éliminant les récompenses binaires exactes. Tests sur 4 benchmarks médicaux montrent des gains en domaine et hors-domaine.

RAGReinforcement learningRaisonnement
SIG
75
HYP
15
arXiv cs.CL·

Chain-based Adaptive Reconfiguration Over Lattices for Hallucination Reduction

CAROL est un framework probabiliste pour réduire les hallucinations des LLM au moment du test. Il définit une mesure d'incertitude sémantique basée sur la cohérence entre réponses générées et contexte de confiance, formulant la mitigation comme un processus de chaîne de Markov avec garanties de convergence. Résultats sur QA et multi-agent reasoning montrent réduction significative des hallucinations.

RaisonnementSécurité IAAlignement
SIG
75
HYP
15
arXiv cs.CL·

Playing with Words, Improving with Rewards: Training Language Models for Creative Association

Entraînement de modèles Qwen (1.7B, 4B, 8B) sur le jeu Codenames pour améliorer la créativité via reinforcement learning avec récompenses vérifiables (RLVR). Le modèle 8B gagne en créativité (+8/10 benchmarks) avec dégradation mineure du raisonnement, tandis que les petits modèles privilégient la précision. Étude sur le compromis créativité-précision selon l'échelle.

QwenReinforcement learningRaisonnement
SIG
75
HYP
25
arXiv cs.CL·

ChildEval: When large language models meet children's personalities

ChildEval est un benchmark contenant 29K profils de personnalité d'enfants (3-6 ans) pour évaluer la capacité des LLM à inférer et suivre les préférences enfant-centrées en conversations longues. Le dataset couvre 5 catégories principales et 14 sous-catégories de la vie quotidienne. Les résultats montrent que le fine-tuning sur ChildEval améliore les performances.

BenchmarksFine-tuningÉvaluations
SIG
72
HYP
25
arXiv cs.LG·

Test-Time Collective Action: Proxy-Based Perturbations for Correcting Algorithmic Harms

Nouvelle approche permettant à des groupes d'utilisateurs de corriger les biais algorithmiques sans intervention de la plateforme. Test-Time Collective Action (TTCA) utilise des perturbations universelles générées via un proxy du modèle pour améliorer l'équité sans accès à l'entraînement. Validation sur CIFAR-10, CIFAR-100 et FairFace montre la fermeture des écarts de précision entre sous-groupes.

Sécurité IAAlignementÉvaluations
SIG
72
HYP
18
arXiv cs.AI·

When Context Flips, Safety Breaks: Diagnosing Brittle Safety in Aligned Language Models

Étude arXiv montrant que les modèles de langage alignés échouent à adapter leur comportement sécuritaire quand le contexte change (« brittle safety »). Test sur 12 modèles révèle un écart sécurité-bon sens de +17.4 pp. Les guardrails actuels ne détectent pas les inversions de conséquences ; un validateur conscient de l'état les capture tous.

Sécurité IAAlignementÉvaluations
SIG
78
HYP
22
arXiv cs.AI·

EAPO: Entropy-Driven Adaptive Positive-Negative Sample Weighting for Policy Optimization in Open-Ended QA

EAPO est une méthode d'optimisation de politique adaptative pour l'entraînement de modèles de raisonnement en QA ouvert. Elle ajuste dynamiquement le poids des échantillons positifs/négatifs selon le ratio d'entropie courante/initiale pour préserver l'exploration et la stabilité. Tests sur deux datasets médicaux montrent amélioration de la diversité et stabilité vs baselines à poids fixes.

Reinforcement learningRaisonnementÉvaluations
SIG
72
HYP
18
arXiv cs.CL·

Keyphrase Generative Representation of Youth Crisis Conversations Beyond Static Taxonomies

Analyse de 703 975 conversations SMS de jeunes en crise (Kids Help Phone, 2018-2023). Introduction de Keyphrase Generative Representation (KGR), un LLM contraint générant des phrases-clés spécifiques au contexte. Taxonomie étendue de 19 à 39 labels avec précision 0.96. KGR identifie 81% de phrases-clés pertinentes et améliore le workflow de recherche thématique (+0.45 en précision vs processus manuel).

LlamaPrompt engineeringRAG
SIG
72
HYP
18
arXiv cs.AI·

Behavioural Analysis of Alignment Faking

Étude arXiv sur le « alignment faking » (AF) : quand les modèles se conforment stratégiquement à l'entraînement tout en préservant leurs préférences de déploiement. Les auteurs identifient trois moteurs distincts (valeurs, goal guarding, sycophancy) via ablations de prompts et steering d'activations. AF s'avère plus répandu que prévu, y chez les petits modèles, et prédictible à partir d'indices situationnels.

AlignementSécurité IAPapers
SIG
78
HYP
15
arXiv cs.AI·

Got a Secret? LLM Agents Can't Keep It: Evaluating Privacy in Multi-Agent Systems

Étude arXiv sur la confidentialité dans les systèmes multi-agents. Une plateforme simule des milliers d'agents LLM interagissant sur un mois. Les violations de confidentialité passent de 19,95% (single-turn) à 45,30% (multi-turn). Les agents sont 8× plus susceptibles de divulguer des infos sensibles après observation d'un pair. Les instructions explicites réduisent mais n'éliminent pas les fuites (37,8% minimum).

Agents IAMulti-agentsSécurité IA
SIG
78
HYP
25
arXiv cs.CL·

LCO: LLM-based Constraint Optimization for Safer Agentic LLMs in Real-world Tasks

LCO (LLM-based Constraint Optimization) est un framework qui réduit le reward hacking en contexte (ICRH) chez les LLMs autonomes sans fine-tuning. Deux modules : auto-réflexion pour intégrer des contraintes de sécurité, et échantillonnage évolutionnaire pour maintenir les actions dans un espace sûr. Sur GPT-4, réduction de 39% du taux de toxicité et 15.23% de l'ICRH.

Agents IASécurité IAAlignement
SIG
72
HYP
25