mai 2026

3149 articles

arXiv cs.CL·28 mai

Modeling Community Attitude through Reaction Tone: A Human-AI Collaborative Framework for Evaluating LLM Alignment with Linguistic Behaviors in Online Communities

CARE, un framework d'évaluation, mesure la capacité des LLM à simuler les réactions authentiques de communautés en ligne face à l'actualité. L'étude révèle un « realism gap » : les prompts explicites de communauté n'améliorent pas la fidélité de simulation. Les modèles frontière montrent des signatures comportementales divergentes.

Évaluations Alignement Benchmarks

SIG

72

HYP

18

arXiv cs.AI·28 mai

Agyn: An Open-Source Platform for AI Agents with Scalable On-Demand Execution, Agent Definition as a Code, and Zero-Trust Access

Agyn est une plateforme open-source pour déployer des agents IA en production. Elle offre un runtime serverless stateful sur Kubernetes, une définition d'agents via Terraform, et un modèle de sécurité zero-trust. Agyn est agnostique aux agents, modèles et clouds.

Agents IA Open source Infrastructure

SIG

72

HYP

25

arXiv cs.LG·28 mai

Information-theoretic Multimodal Representation Learning for Electrocardiogram Signals

MERIT, un framework de préentraînement multimodal, combine le masquage d'ECG avec l'alignement contrastif ECG-texte pour apprendre des représentations cardiologiques. Sur PTB-XL, gains de +3% F1 (All) et +5% F1 (SubClass), +2.66% AUC en zéro-shot. Améliore aussi la génération de texte clinique avec LLM.

Papers Benchmarks Embeddings

SIG

78

HYP

22

arXiv cs.AI·28 mai

Identifying and Understanding Human Values in Text: A Tailorable LLM-based Architecture

Architecture modulaire basée sur LLM pour détecter et quantifier l'intensité des valeurs humaines dans du texte. Trois modules coordonnés : génération de spécifications de valeurs, étiquetage de textes, assignation de support/résistance gradué. Évaluation sur ValueEval dataset avec plusieurs LLMs, démontrant la généralité du pipeline.

Alignement Évaluations Raisonnement

SIG

72

HYP

18

arXiv cs.LG·28 mai

Restoring the Sweet Spot: Pass-Rate Weighted Self-Distillation for LLM Reasoning

SC-SDPO améliore l'auto-distillation des LLM en pondérant les pertes par √[p(1-p)], créant un curriculum implicite. Tests sur Qwen3-8B (+3.2/+4.3 mean@16/maj@16) et OLMo-3-7B (+1.8/+3.0) montrent gains stables sans coût computationnel supplémentaire.

Raisonnement Reinforcement learning Papers

SIG

72

HYP

18

arXiv cs.AI·28 mai

Hierarchical Prompt-Domain Control and Learning for Resource-Constrained Agentic Language Models

Framework hiérarchique pour LLMs compacts en systèmes agentiques sous contraintes (mémoire, latence, coût). Distillation du modèle + boucle oracle-contrôleur qui valide les protocoles, projette l'historique dans un domaine de prompt viable, et déclenche du fine-tuning léger. Séparation entre apprentissage du schéma et adaptation sémantique. Évaluation sur Multi-Fidelity Bayesian Optimization.

Agents IA Fine-tuning Prompt engineering

SIG

72

HYP

18

arXiv cs.AI·28 mai

Intelligence as Managed Autonomy: Failure, Escalation, and Governance for Agentic AI Systems

Papier proposant SMARt, un framework formel pour gérer l'autonomie des systèmes IA agentic. Introduit une théorie de l'autonomie gérée basée sur la détection de la dérive épistémique, la suspension du raisonnement et l'escalade vers un contrôle humain. Utilise des réseaux de Petri temporisés pour garantir des propriétés de sécurité et de gouvernance.

Agents IA Sécurité IA Alignement

SIG

75

HYP

15

arXiv cs.AI·28 mai

LaneRoPE: Positional Encoding for Collaborative Parallel Reasoning and Generation

LaneRoPE permet à plusieurs séquences générées en parallèle de collaborer lors de l'inférence. La méthode ajoute un masque d'attention inter-séquences et étend RoPE pour capturer les positions relatives entre tokens dans et hors d'une séquence. Tests sur raisonnement mathématique montrent des gains de précision avec surcharge minimale.

Raisonnement Prompt engineering Benchmarks

SIG

72

HYP

28

arXiv cs.CL·28 mai

Disentangling Language Roles in Multilingual LLM Task Execution

MTM-Bench, un benchmark contrôlé pour l'exécution de tâches multilingues, évalue 20 LLMs sur 27 combinaisons de langues (instruction/contenu/réponse) en anglais, espagnol et chinois. Les résultats montrent que la dégradation dépend du rôle de la langue dans la structure de la tâche, la langue de réponse étant l'axe dominant de variation.

Benchmarks Évaluations

SIG

78

HYP

15

arXiv cs.CL·28 mai

EvoSpec: Evolving Speculative Decoding via Real-Time Vocabulary and Parameter AdaptationTarget

EvoSpec améliore le décodage spéculatif en adaptant dynamiquement le vocabulaire et les paramètres du modèle de brouillon en temps réel. Via indexation sémantique et apprentissage par curriculum, il maintient un taux d'acceptation élevé dans les domaines spécialisés (code, droit, médecine). Sur EAGLE-3 : 1.13x speedup vs FR-Spec avec 27% moins de mémoire.

Génération de code Raisonnement Infrastructure

SIG

78

HYP

25

arXiv cs.CL·28 mai

Simorgh at SemEval-2026 task 7: Region-Aware Hybrid Retrieval for Low-Resource Cultural Reasoning in Multilingual Question Answering

Simorgh propose une approche de récupération hybride (BM25 + similarité sémantique) avec pondération régionale pour répondre à des questions culturelles multilingues sur le benchmark BLEnD (30 langues). Utilise Qwen3-14B quantisé. Améliore la stabilité cross-lingue mais révèle des écarts de performance liés au déséquilibre des données d'entraînement.

RAG Benchmarks Qwen

SIG

72

HYP

18

arXiv cs.LG·28 mai

Transferable Reinforcement Learning via Probabilistic Latent Embeddings and Dynamic Policy Adaptation for Sim-to-Real Deployment

Framework RL pour transfert de politique sim-to-real via embeddings latents probabilistes et adaptation dynamique. Utilise meta-RL et CMDPs pour inférer la représentation latente de l'environnement, avec formulation distributional RL ajustant dynamiquement les niveaux de risque selon la précision d'estimation du contexte latent.

Reinforcement learning Robotique Sécurité IA

SIG

72

HYP

18

arXiv cs.LG·28 mai

Gradient Transformer: Learning to Generate Updates for LLMs

Gradient Transformer, un framework de distillation de connaissances sans données, génère des vecteurs de mise à jour pour LLM à partir de TinyLM fine-tunés sur données privées. Le modèle capture la corrélation entre les vecteurs de gradient des deux modèles, permettant l'adaptation collaborative sans accès aux données sensibles.

Fine-tuning Raisonnement

SIG

72

HYP

25

arXiv cs.LG·28 mai

Federated Learning for Multivariate Time Series Anomaly Detection in Industrial Automation

Article présentant un dataset pour l'anomaly detection sur séries temporelles multivariées en federated learning. Adresse les lacunes des benchmarks existants en introduisant des données avec dynamiques cycliques issues de processus d'automatisation industrielle discrète.

Benchmarks Papers Reinforcement learning

SIG

65

HYP

15

arXiv cs.AI·28 mai

Discovery Agents for Real-Time Analytics: Toward Proactive Insight Systems

Architecture multi-agent autonome pour découverte d'insights en temps réel sur flux de données. Boucle continue : génération d'hypothèses, compilation en analytics exécutables, validation, visualisations. Utilise Kafka, Flink, LLM. Design basé contrats avec artefacts typés pour modularité et traçabilité. Démontrée sur retail, finance, données publiques.

Agents IA Multi-agents Papers

SIG

72

HYP

28

arXiv cs.LG·28 mai

Resource-Constrained Affect Modelling via Variance Regularisation Pruning

Variance-Regularised Pruning (VR) est une méthode de compression de modèles pour l'affective computing qui priorise la stabilité inter-utilisateurs plutôt que la seule parcimonie. Testée sur le dataset AGAIN (9 environnements de jeu), VR maintient des performances CCC compétitives à 80% de sparsité sans fine-tuning supplémentaire, adaptée aux systèmes embarqués.

Évaluations Fine-tuning Papers

SIG

72

HYP

15

arXiv cs.CL·28 mai

OralAgent: Integrating Reasoning, Tools, and Knowledge for Interactive Dental Image Analysis

OralAgent est un agent IA spécialisé en dentisterie intégrant raisonnement multimodal, outils visuels (22 modèles) et RAG sur 368 manuels dentaires classiques (134.8M tokens). Évalué sur OralQA-ZH (798 questions) et benchmarks MMOral, il atteint SOTA pour l'analyse d'images dentaires en workflow clinique.

Agents IA Vision RAG

SIG

78

HYP

25

arXiv cs.LG·28 mai

Tackling Multimodal Learning Challenges with Mixture-of-Expert: A Survey

Enquête systématique sur l'application des Mixture-of-Experts (MoE) au apprentissage multimodal. Analyse MoE sous trois angles : moteur efficace (scalabilité, réduction redondance), apprenant en représentation (alignement multi-expert), adaptateur modulaire (déséquilibre modalités, données manquantes). Identifie lacunes : routage interprétable, communication experts, intégration modalités, apprentissage continu.

Vision Embeddings Papers

SIG

65

HYP

25

arXiv cs.LG·28 mai

Comparative Analysis of Liquid Neural Networks and LSTM for Sequential Pattern Recognition: Robustness, Efficiency, and Clinical Utility

Étude comparative entre réseaux de neurones liquides (LNN/CfC) et LSTM sur quatre modalités séquentielles (N-MNIST, QuickDraw, IAM, PhysioNet Sepsis-3). Les LNN modélisent l'évolution de l'état caché comme équation différentielle continue. Résultats : LNN surpassent LSTM en efficacité paramétrique et robustesse face aux données manquantes, particulièrement en domaines cliniques.

Benchmarks Raisonnement

SIG

72

HYP

18

arXiv cs.LG·28 mai

SparseOpt: Addressing Normalization-induced Gradient Skew in Sparse Training

SparseOpt, un optimiseur conscient de la parcimonie, résout le problème de gradient asymétrique induit par la normalisation par batch en entraînement sparse dynamique. Tests sur ResNet (CIFAR-100, ImageNet) montrent convergence plus rapide et meilleure généralisation. Première étude systématique de l'interaction entre Batch Normalization, couches sparse et DST.

Papers Benchmarks Fine-tuning

SIG

72

HYP

18

arXiv cs.LG·28 mai

Detect by Yourself: Self-Designing Agentic Workflows for Few-Shot Graph Anomaly Detection

SignGAD propose un framework d'agents auto-configurables pour la détection d'anomalies en graphes avec peu d'exemples. Au lieu d'utiliser un détecteur fixe, le système conçoit des workflows adaptés à chaque tâche en sélectionnant encodages et designs de détecteurs appropriés. Une stratégie de refit gardée affine les workflows sélectionnés sous supervision limitée.

Agents IA Benchmarks Papers

SIG

72

HYP

28

arXiv cs.LG·28 mai

HEAL: Resilient and Self-* Hub-based Learning

HEAL est un framework d'apprentissage décentralisé qui combine federated learning, gossip learning et epidemic learning via une couche P2P auto-organisée. Il promeut dynamiquement des nœuds comme agrégateurs et démontre des performances équivalentes au federated learning classique tout en étant résilient aux défaillances et churn.

SIG

72

HYP

18

arXiv cs.CL·28 mai

TRACES: Proactive Safety Auditing for Multi-Turn LLM Agents via Trajectory-State Modeling

TRACES est un auditeur de sécurité proactif pour agents LLM multi-tours qui détecte les dérives vers des comportements dangereux à partir des représentations cachées d'un LLM observateur. Entraîné avec supervision faible au niveau trajectoire, il produit des estimations denses de risque à chaque étape, améliorant la prédiction de sécurité et la discrimination des risques sur plusieurs benchmarks.

Agents IA Sécurité IA Raisonnement

SIG

78

HYP

22

arXiv cs.LG·28 mai

Balancing Fidelity and Diversity in Diffusion Models via Symmetric Attention Decomposition: Hopfield Perspective

Article théorique décomposant la matrice d'attention pré-softmax en composantes symétrique et antisymétrique. La partie symétrique gouverne le paysage énergétique, la partie antisymétrique pilote la circulation. Les auteurs proposent des mesures de stabilité Hopfield pour quantifier la fidélité-diversité en génération et un contrôle pour moduler ce compromis.

Raisonnement Papers Vision

SIG

72

HYP

15

arXiv cs.LG·28 mai

A Simple State Space Model Excels at Multivariate Time Series Classification

Étude systématique comparant les modèles d'espace d'état (SSM) pour la classification de séries temporelles. S4D surpasse les variantes Mamba en précision et efficacité. Les auteurs proposent MS4 et MS4N, versions légères de S4D avec projection linéaire et mélange de canaux. Évaluation sur 59 datasets (MONSTER, UEA) : MS4N égale des modèles 10× plus grands en paramètres.

Benchmarks Papers Raisonnement

SIG

82

HYP

15

arXiv cs.LG·28 mai

Personalized Observation Normalization for Federated Reinforcement Learning in Simulation Environments with Heterogeneity

Méthode de normalisation d'observation personnalisée (PON) pour l'apprentissage par renforcement fédéré en environnements hétérogènes. Chaque agent normalise localement ses entrées d'état avec moyenne et variance mises à jour continuellement, évitant les problèmes d'agrégation de paramètres déséquilibrés. Tests sur tâches MuJoCo hétérogènes montrent accélération d'entraînement et performance supérieure.

Reinforcement learning Multi-agents

SIG

72

HYP

18

arXiv cs.CL·28 mai

Narrative Flattening: How Post-Training Compresses Thematic, Affective, and Stylistic Variation in LLM Fiction

Étude sur quatre checkpoints OLMo 32B montrant que le post-training (SFT, DPO, RLVR) compresse la variation narrative en réduisant les transitions thématiques, l'intensité émotionnelle et la diversité stylistique. L'effet « narrative flattening » est plus marqué sur la fiction littéraire professionnelle que sur les histoires de plateformes publiques.

Papers Fine-tuning Alignement

SIG

75

HYP

15

arXiv cs.LG·28 mai

High-Fidelity Industrial Crash Dynamics Prediction via Geometry-Aware Operator Learning with Memory-Efficient Low-Rank Attention

GeoTransolver, un framework d'operator learning géométrie-aware, prédit avec précision la dynamique de crash automobile à l'échelle industrielle. Sur des datasets de bumper beam et véhicule complet, il capture les déformations plastiques et profils d'accélération. Une modification FLARE réduit la mémoire de 2x tout en améliorant la précision pour les transitoires haute-fréquence.

Papers Benchmarks Raisonnement

SIG

72

HYP

25

arXiv cs.CL·28 mai

VibeSearchBench: Benchmarking Long-horizon Proactive Search in the Wild

VibeSearchBench évalue les agents LLM sur la recherche collaborative multi-tour en contexte réel. Le benchmark contient 200 tâches bilingues (chinois/anglais) sur 20 domaines, avec graphes de connaissances sans schéma fixe. Sept modèles frontière testés obtiennent F1 max 30.30, révélant des lacunes en raisonnement long-contexte et élicitation d'intention.

Benchmarks Agents IA Raisonnement

SIG

72

HYP

25

arXiv cs.AI·28 mai

On the Origin of Synthetic Information by Means of Steganographic Inheritance

Article proposant un mécanisme de stéganographie pour tracer l'origine des informations synthétiques générées par IA. Un encodeur cache une signature invisible dans chaque génération, permettant d'identifier le modèle parent via décodage. Analyse théorique et évaluations empiriques sur plusieurs projectors et systèmes stéganographiques.

Sécurité IA Alignement Papers

SIG

72

HYP

35

arXiv cs.AI·28 mai

Soro: A Lightweight Foundation Model and Chatbot for Tajik

Soro est une famille de modèles de langage spécialisés en tadjik, basée sur Gemma 3, entraînée sur 1,9 milliard de tokens tadjiks (web, PDF, matériel éducatif). Après fine-tuning supervisé sur 40K exemples, Soro surpasse Gemma 3 sur des benchmarks tadjiks créés par les auteurs et conserve les performances en anglais. Quantification FP8/INT4 validée pour déploiement edge en milieu scolaire.

Gemini Fine-tuning Benchmarks

SIG

72

HYP

18

arXiv cs.LG·28 mai

Evaluating Local Explainability Metrics for Machine Learning Models on Tabular Data

Étude comparative de la fiabilité des techniques d'explainabilité locale (LIME, SHAP, Feature Ablation) sur 32 datasets tabulaires. Les résultats montrent que la qualité des explications ne corrèle pas systématiquement avec la performance prédictive du modèle, mais dépend plutôt de la complexité du dataset et de la distribution des features.

Évaluations RAG

SIG

72

HYP

15

arXiv cs.LG·28 mai

Metric-Aware PCA as a Linear Instance of Geometric Deep Learning

Article théorique positionnant l'Analyse en Composantes Principales Métrique-Consciente (MAPCA) dans le cadre du deep learning géométrique. MAPCA paramétre l'ACP par une matrice métrique définie positive, avec solutions équivariantes sous le groupe orthogonal préservant la métrique. Un théorème d'unicité caractérise l'ACP Invariante comme unique métrique linéaire équivariante sous rescaling diagonal.

Papers Raisonnement

SIG

72

HYP

15

arXiv cs.LG·28 mai

Architecture-driven Shift: towards a lightweight selector for capturing the trends of logit shift

Nouvelle métrique Architecture-driven Shift (ADS) pour sélectionner efficacement les modèles pré-entraînés en apprentissage continu. ADS décompose le logit shift en dépendances architecturales et données, révélant que la combinaison capture bien la tendance du logit shift avec peu d'échantillons. Validation sur 175+ architectures avec corrélation Spearman ≥0.731.

Reinforcement learning Benchmarks Papers

SIG

72

HYP

18

arXiv cs.AI·28 mai

Laguna M.1/XS.2 Technical Report

Laguna M.1 (225.8B paramètres, 23.4B activés) et Laguna XS.2 (33.4B total, 3B activés) sont deux modèles MoE entraînés end-to-end pour le coding agentic. Compétitifs sur SWE-bench Verified, SWE-bench Multilingual, SWE-Bench Pro et Terminal-Bench 2.0. XS.2 disponible sous Apache 2.0.

Agents IA Génération de code Benchmarks

SIG

82

HYP

15

arXiv cs.CL·28 mai

GRADE: Generalizable Reasoning-Aware Dialogue Evaluation for AI Tutors

GRADE évalue 120 configurations de modèles open-source (Gemma3-12B/27B, LoRA, CoT+Reasoning) pour l'évaluation pédagogique en dialogues tuteur-étudiant. Gemma3-27B 8-bit surpasse les systèmes propriétaires. L'augmentation synthétique aide les modèles faibles ; CoT+Reasoning est plus utile pour la génération que la classification directe.

Benchmarks Fine-tuning Raisonnement

SIG

75

HYP

15

arXiv cs.LG·28 mai

Energy-Structured Low-Rank Adaptation for Continual Learning

E²-LoRA, une méthode d'adaptation bas-rang pour l'apprentissage continu, concentre l'énergie des mises à jour de paramètres dans les rangs principaux pour minimiser l'interférence entre tâches. Une stratégie d'allocation dynamique des rangs équilibre stabilité et plasticité du modèle.

Fine-tuning Reinforcement learning Papers

SIG

72

HYP

18

arXiv cs.LG·28 mai

$E^3$-Agent: An Executable and Evolving Agent for Resource Management of Edge Generative Inference

E³-Agent est un agent IA exécutable et adaptatif pour la gestion des ressources d'inférence générative sur edge. Il combine un routeur rapide (décisions en millisecondes) et un contrôleur LLM lent piloté par événements, apprenant en ligne des retours d'exécution. Évalué en simulation, il réduit la latence de 65-73% vs baselines statiques sur scénarios dynamiques (sémantique, churn, drift).

Agents IA Raisonnement Infrastructure

SIG

72

HYP

28

arXiv cs.CL·28 mai

TARQ: Tail-Aware Reconstruction Quantization for Rare-Word Robust Automatic Speech Recognition

TARQ est une méthode de quantization post-training pour ASR qui rééquilibre la calibration vers les mots rares (noms, chiffres, termes spécialisés). Sans labels ni validation, elle améliore le rare-WER sur 8 backbones et 6 datasets en W4G128 sans régression du WER global.

Benchmarks Papers Génération de code

SIG

72

HYP

15

arXiv cs.CL·28 mai

UniMaia: Steering Chess Policies with Language for Human-like Play

UniMaia est un framework qui contrôle une politique d'échecs (Lc0) via des prompts en langage naturel, sans réentraînement multimodal complet. Un encodeur texte léger et un mécanisme ControlNet permettent de moduler le jeu (sélection d'ouverture, niveau). UniMaia-Aux ajoute des objectifs temporels et de prédiction comportementale. Résultats SOTA sur benchmarks prompt-conditionnés.

Prompt engineering Raisonnement Fine-tuning

SIG

72

HYP

25

arXiv cs.LG·28 mai

Bayesian Deployment Approval for Learned Landing Controllers under Finite Rollout Validation

Framework bayésien pour valider le déploiement de contrôleurs d'atterrissage autonomes entraînés par RL. Utilise l'inférence bayésienne pour quantifier l'incertitude sur la capacité réelle des politiques, au-delà des métriques empiriques (reward, taux de succès). Expériences avec PPO et SAC montrent que l'optimisation empirique surconfiance, tandis que l'inférence bayésienne calibre mieux la confiance de déploiement.

Reinforcement learning Sécurité IA Robotique

SIG

72

HYP

15

arXiv cs.CL·28 mai

UserHarness: Harnessing User Minds for Stronger Agent Theory-of-Mind

UserHarness propose un cadre pour améliorer la théorie de l'esprit (ToM) des agents IA en reconstituant explicitement l'état mental de l'utilisateur. Le système décompose les observations, croyances, intentions et actions de l'utilisateur. Sur cinq benchmarks, UserHarness atteint 95,94% de précision macro, surpassant les méthodes existantes de plus de 15% en relatif.

Agents IA Raisonnement Benchmarks

SIG

75

HYP

25

arXiv cs.CL·28 mai

Escape the Language Prior: Mitigating Late-Stage Modality Collapse in Audio Reasoning via Modality-Aware Policy Optimization

Modality-Aware Policy Optimization (MAPO) corrige l'effondrement modal tardif dans les modèles audio-texte lors du fine-tuning par RL. La méthode concentre les gradients de politique sur les tokens critiques via un masque de pertinence modale et ajoute une pénalité d'attention pour maintenir l'ancrage cross-modal. MAPO atteint SOTA sur plusieurs benchmarks audio complexes.

Reinforcement learning Raisonnement Alignement

SIG

78

HYP

25

arXiv cs.CL·28 mai

Cultural Fidelity in English-to-Hindi Translation: A Preservation-Fluency Frontier for Gender Recoverability

Étude sur la préservation du genre dans la traduction anglais-hindi. Benchmark de 37 345 instances montre que GPT-4o-mini et Sarvam effacent fréquemment le genre via constructions ergatives. Deux rérankers (SAR et PAR) améliorent la récupérabilité du genre : PAR passe de 11-16% à 49-54% en précision, mais réduit la fluidité (4.36→3.37). Révèle un compromis préservation-fluidité.

Benchmarks Vision Alignement

SIG

78

HYP

15

arXiv cs.CL·28 mai

Learning to Translate from Soft to Hard LLM Prompts

Méthode pour traduire des soft prompts en prompts textuels naturels via un modèle dédié. Les traductions surpassent InSPEcT sur plusieurs benchmarks. Application : soft prompts optimisés sur petits modèles open-source se convertissent en prompts textuels portables, dépassant les performances initiales sur modèles fermés.

Prompt engineering Fine-tuning Papers

SIG

72

HYP

25

arXiv cs.LG·28 mai

IGADA-IoT: IoT Sensor Energy Optimization in Wireless Sensor Networks Driven by Automatic Data Augmentation

IGADA-IoT propose un cadre d'augmentation automatique de données guidé par les écarts informationnels pour optimiser l'énergie des capteurs IoT dans les réseaux de capteurs sans fil. La méthode utilise une collaboration hiérarchique multi-générateurs (HMGCS) et une évaluation conjointe écart-performance (IGMP-EC). Résultats : +7,27% de précision moyenne, +8,67% vs méthodes avancées.

Évaluations Fine-tuning

SIG

65

HYP

25

arXiv cs.LG·28 mai

The Energy Blind Spot: NVIDIA's Flagship Edge AI Hardware Cannot Support Process-Level Energy Attribution

NVIDIA's GB10 edge AI hardware (ASUS Ascent GX10) manque de compteurs d'énergie CPU et d'interfaces de monitoring (IPMI, SCMI). Seule la puissance GPU instantanée est exposée via NVML. Les workloads agentic consomment 4.33x plus d'énergie que les baselines linéaires. L'attribution énergétique par processus reste impossible sur cette plateforme contrairement à x86/RAPL.

Agents IA Benchmarks Infrastructure

SIG

75

HYP

15

arXiv cs.CL·28 mai

BioELX: Cross-lingual Biomedical Entity Linking via Alias-based Retrieval and LLM Ranking

BioELX est un système de liaison d'entités biomédicales multilingues en deux étapes sans données d'entraînement annotées. Il enrichit SapBERT avec des alias multilingues Wikidata et utilise un LLM pour la désambiguïsation contextuelle. Sur cinq benchmarks, il atteint +19.2 Recall@1 sur XL-BEL, avec gains majeurs pour langues peu dotées (turc +21.6, coréen +22.1, thaï +30.8).

Benchmarks Papers RAG

SIG

78

HYP

15

arXiv cs.LG·28 mai

Worker Disagreement Reveals Sharp Directions in Local SGD

Les chercheurs montrent que Local SGD révèle la géométrie anisotrope de la perte via le désaccord entre workers. Les écarts worker-moyenne fournissent un estimateur sans Hessien des directions dominantes du spectre. Validé sur MLPs, CNNs et Transformers.

Papers Reinforcement learning

SIG

75

HYP

15

arXiv cs.LG·28 mai

Learn from your own latents and not from tokens: A sample-complexity theory

Article théorique sur l'efficacité échantillonnale des modèles prédisant leurs propres représentations latentes (data2vec, JEPA). Preuve que la prédiction latente réduit la complexité d'échantillon de exponentielle en L (profondeur) à constante, vs. prédiction de tokens. Validation sur grammaires probabilistes et réseaux de neurones.

Papers Raisonnement Évaluations

SIG

82

HYP

15

arXiv cs.CL·28 mai

The Future of Facts: Tracing the Factual Generation-Verification Gap

Étude empirique du fossé génération-vérification dans les LLMs : la vérification de faits est apprise avant leur génération, plus robuste à l'apprentissage continu, et les mises à jour factuelles créent des états « multi-vers » où modèles acceptent réponses anciennes et nouvelles. Analyse sur 4 familles open-source à 2 échelles.

Papers Raisonnement Évaluations

SIG

78

HYP

15

arXiv cs.CL·28 mai

Can Hallucinations Be Useful? Solving Multi-Hop Questions With SLMs By Chaining System-I/II Reasoning

Les petits modèles de langage (SLMs) hallucinent plus que les LLMs mais peuvent résoudre des questions multi-étapes en inversant la stratégie classique : répondre d'abord (System-I), puis raisonner profondément (System-II) avec récupération de preuves. Les hallucinations initiales aident à affiner la réponse finale.

Raisonnement RAG Benchmarks

SIG

72

HYP

25

arXiv cs.CL·28 mai

Syllabic-Structure Decoder for Automatic Speech Recognition in Vietnamese

Nouvelle approche ASR pour le vietnamien basée sur une décodage syllabique phonémique. Le modèle capture la structure phonologique des syllabes plutôt que les unités orthographiques, réduisant la taille du vocabulaire. Résultats supérieurs sur LSVSC et UIT-ViMD face à PhoWhisper et Wav2Vec2.

Voix Benchmarks Papers

SIG

72

HYP

15

arXiv cs.CL·28 mai

RAG-Coding: Enhancing LLM Medical Coding with Structured External Knowledge

RAG-Coding est une méthode multi-agents orchestrant 4 LLM pour le codage ICD-10-CM automatisé. Elle ancre les décisions dans des sources externes (tabular officiel, guidelines) et améliore la précision de 8-13% en micro-F1 sur MDACE. Les auteurs publient aussi MDACE-2025 avec annotations expertes selon les guidelines 2025.

RAG Agents IA Multi-agents

SIG

78

HYP

18

arXiv cs.AI·28 mai

Operational AI Deployment Assurance: Governance-State Orchestration Under Threshold-Sensitive Deployment Conditions -- A Governance Framework for High-Stakes AI Systems

OADA est un cadre de gouvernance IA pour les systèmes critiques qui traduit l'instabilité des métriques d'équité, la sensibilité aux seuils et l'incertitude opérationnelle en décisions de déploiement. Testé sur la reconnaissance faciale et la santé, il introduit des scores d'assurance, des états d'escalade et des zones de stabilité pour contrôler le déploiement plutôt que de simplement auditer post-hoc.

Sécurité IA Alignement Évaluations

SIG

62

HYP

28

arXiv cs.LG·28 mai

How the Optimizer Shapes Learned Solutions in Equivariant Neural Networks

Étude comparative de Muon vs Adam sur réseaux de neurones équivariants (ModelNet40, données moléculaires). Muon surpasse Adam systématiquement. Analyse Hessienne et spectrale révèle que Muon produit des surfaces de perte plus régulières et des représentations de rang effectif plus élevé.

Benchmarks Raisonnement

SIG

72

HYP

15

arXiv cs.CL·28 mai

Unlocking Fine-Grained and Within-Utterance Speaking Style Control in Prompt-Based Text-to-Speech Models

Méthode pour contrôler finement le style vocal dans les modèles TTS basés sur prompts. Interpolation entre styles via vecteurs directionnels dans l'espace d'embedding (99-100% succès conversion genre, variation pitch 36 Hz). Transitions intra-énoncé via KV-cache swapping et sliding-window attention masking (similarité locuteur 0.81-0.91).

Voix Prompt engineering Papers

SIG

72

HYP

18

arXiv cs.LG·28 mai

A Paired Testing Protocol for Batch-Conditioned Refusal Robustness in LLM Serving

Étude arXiv sur la robustesse du refus des LLM en fonction de la configuration de batch. Protocole de test appairé sur 15 modèles révèle 0,16% de changements de label de sécurité authentiques. vLLM avec BATCH_INVARIANT=1 élimine les instabilités détectées (22→0 flips). Recommandation : valider le refus dans l'environnement de serving réel.

Sécurité IA Évaluations Benchmarks

SIG

78

HYP

15

arXiv cs.CL·28 mai

Retrieval, Reward, and Training Protocols: What Matters in Training Search Agents?

Étude empirique contrôlée sur l'entraînement d'agents de recherche LLM. Les auteurs isolent trois dimensions : (1) un problème de couverture de données dans Wikipedia 2018 qui explique plus de gains que les différences algorithmiques, (2) les récompenses outcome-based surpassent les approches process-based, (3) analyse de la diversité des données et du budget de recherche. Code disponible.

Agents IA RAG Reinforcement learning

SIG

78

HYP

15

arXiv cs.AI·28 mai

Cross-Entropy Games and Frost Training

Frost Training améliore l'optimisation de politique Monte Carlo pour les tâches LLM-as-a-judge appelées Cross-Entropy Games. La méthode exploite le gradient de la fonction de récompense dans l'espace d'embedding, technique inspirée du jailbreaking GCG. Validée avec GRPO, elle augmente la capacité du modèle à générer des sorties haute-score plus rapidement.

Reinforcement learning Raisonnement Évaluations

SIG

72

HYP

25

arXiv cs.AI·28 mai

A Query Engine for the Agents

Hyperparam propose trois bibliothèques JavaScript (<70 KB) pour interroger Parquet et Apache Iceberg directement depuis le stockage objet dans les applications client-side (Claude Code, Cursor). Le système exécute des UDFs LLM 300x plus vite que DuckDB-WASM sur requêtes filtrées et réduit les coûts d'une suite d'analyse agent de deux tiers.

Agents IA Claude Code Outils

SIG

72

HYP

28

arXiv cs.AI·28 mai

EgoBench: An Interactive Egocentric Multimodal Benchmark for Tool-Using Agents

EgoBench est un benchmark interactif multimodal pour agents utilisant des outils, comprenant 1 045 tâches vidéo égocentrique couvrant quatre scénarios quotidiens. Huit modèles SOTA atteignent seulement 30,62% de précision au mieux, 19,43% en moyenne, révélant des goulots d'étranglement en perception visuelle et raisonnement multi-hop.

Agents IA Vision Benchmarks

SIG

78

HYP

25

arXiv cs.AI·28 mai

TCP-MCP: Landscape-Guided Co-Evolution of Prompts and Communication Topologies for Multi-Agent Systems

TCP-MCP co-évolue les prompts d'agents et les topologies de communication comme un génome unifié. Sur MMLU-Pro, MMLU et GSM8K avec DeepSeek-V3.2, le système atteint 82.66%, 89.96% et 96.61% d'accuracy tout en consommant 5.69× moins de tokens que les systèmes de débat.

Multi-agents Prompt engineering Benchmarks

SIG

78

HYP

25

arXiv cs.AI·28 mai

A Policy-Driven Runtime Layer for Agentic LLM Serving

Article proposant une couche runtime intermédiaire entre framework agent et moteur de serving LLM. Introduit quatre primitives (observe, score, predict, act) pour implémenter des politiques agent-aware (caching KV, batch shaping, spéculation, fairness, sécurité). CacheSage, instance pour caching cross-session, atteint +13 à +37 pp hit-rate, -12 à -29% TTFT, +6 à +14% throughput sur workloads multi-agent réels.

Agents IA Multi-agents Infrastructure

SIG

78

HYP

25

arXiv cs.LG·28 mai

Fine-Tuning Dynamics of In-Context Factual Recall in Transformers

Étude théorique de la dynamique d'apprentissage en contexte (in-context learning) dans les transformers. Les auteurs formalisent la tâche IC-recall où le modèle doit inférer une relation cachée à partir d'exemples et récupérer des connaissances factuelles stockées dans ses paramètres. Preuve que le fine-tuning converge vers un motif d'attention spécifique avec un nombre d'échantillons polylogarithmique.

Raisonnement Fine-tuning Papers

SIG

78

HYP

15

arXiv cs.LG·28 mai

Heterogeneous Parallelism for Multimodal Large Language Model Training

Papier arXiv proposant une approche de parallélisme hétérogène pour l'entraînement de modèles multimodaux. Permet aux encodeurs et LLM d'utiliser des layouts de sharding indépendants (TP/CP/PP/DP/EP) sur GPUs partagés ou disjoints. Améliore le throughput jusqu'à 49,3% en configuration colocalisée et 13% en non-colocalisée. Implémentation open-source en extension Megatron-LM.

Infrastructure Papers Benchmarks

SIG

78

HYP

15

arXiv cs.LG·28 mai

Faster Thermal Profiling of a Lunar Rover with Machine Learning Adapted Finite Difference Model

Un framework de machine learning informé par la physique (PIML) pour modéliser thermiquement un rover lunaire. Un réseau de neurones adaptatif détermine le maillage 3D en différences finies selon les charges thermiques, améliorant la précision de 50% vs modèles coarse-mesh et 39% vs ANN pur, tout en étant 3x plus rapide que les simulations haute-fidélité.

Raisonnement Benchmarks Robotique

SIG

72

HYP

15

arXiv cs.LG·28 mai

Supervised Distributional Reduction via Optimal Transport and Dependence Maximization

SDR (Supervised Distributional Reduction) combine le transport optimal et la maximisation de dépendance pour apprendre des représentations cibles. L'algorithme étend l'objectif Fused Gromov-Wasserstein avec un terme de dépendance explicite, produisant des embeddings compacts qui capturent structure géométrique et signal prédictif. Application aux processus gaussiens avec noyaux adaptatifs.

SIG

72

HYP

15

arXiv cs.LG·28 mai

Can Entry-Wise Clipping Give Spectral Control of Stochastic Gradients?

Article théorique sur le contrôle spectral du bruit de gradient stochastique via clipping entrée-par-entrée. Montre qu'une méthode simple d'écrêtage entrée-par-entrée peut équilibrer structure matricielle et coût computationnel, avec garanties de convergence O(ε⁻⁴) sous bruit Cauchy-contaminé. Gains empiriques : ~7% de tokens économisés sur NanoGPT avec shrinkage lisse, ~2% supplémentaires combiné avec Muon.

Papers Reinforcement learning Benchmarks

SIG

72

HYP

15

arXiv cs.AI·28 mai

Auditable Decision Models with Learned Abstention and Real-Time Steering

EvaluatorDPT est un modèle de contrôle décisionnel borné qui prédit YES, NO ou TBD (déférence apprise). Utilisant un encodeur transformer avec têtes auxiliaires structurées, il atteint Accuracy=0.8260 et Macro F1=0.8252 sur 44,597 exemples. L'interface permet un routage inspectable et un contrôle auditable des décisions en production.

Raisonnement Évaluations Sécurité IA

SIG

72

HYP

18

arXiv cs.AI·28 mai

DeepSciVerify: Verifying Scientific Claim--Citation Alignment via LLM-Driven Evidence Escalation

DeepSciVerify vérifie l'alignement entre les affirmations scientifiques et leurs citations via un pipeline deux étapes : analyse abstracts + escalade sélective au texte complet. Sur SCitance, 86.7 Micro-F1 (+4.5 vs baselines), 67% des cas résolus sans récupération full-text.

Papers Benchmarks Raisonnement

SIG

78

HYP

15

arXiv cs.CL·28 mai

From AR to Diffusion: Efficiently Adapting Large Language Models with Strictly Causal and Elastic Horizons

FLUID adapte efficacement les modèles de langage autorégressifs (AR) à la génération par diffusion via l'alignement causal strict et les horizons élastiques. Le framework réduit les coûts d'entraînement de plusieurs ordres de magnitude en réutilisant les checkpoints GPT existants, tout en maintenant la performance état-de-l'art.

Génération de code Fine-tuning Raisonnement

SIG

75

HYP

25

arXiv cs.AI·28 mai

Voluntary Collusion with Secret Tools in Competing LLM Agents

Étude empirique montrant que 12 modèles LLM (7B à propriétaires) acceptent volontairement des outils de collusion secrète dans des environnements multi-agents compétitifs (Liar's Bar, Cleanup), malgré des étiquettes d'injustice explicites. Seul le cadrage éthique réduit l'adoption; l'alignement général ne suffit pas.

Multi-agents Sécurité IA Alignement

SIG

78

HYP

25

arXiv cs.AI·28 mai

SkillGrad: Optimizing Agent Skills Like Gradient Descent

SkillGrad optimise les compétences d'agents LLM via une approche inspirée de la descente de gradient. Les exécutions de tâches fournissent des signaux de perte, des diagnostics automatiques génèrent des gradients textuels, et un agent avec momentum accumule les patterns récurrents. Évalué sur SpreadsheetBench et WikiTableQuestions, SkillGrad surpasse les baselines de 6,7 points en moyenne.

Agents IA Reinforcement learning Prompt engineering

SIG

78

HYP

25

arXiv cs.AI·28 mai

PEAM: Parametric Embodied Agent Memory through Contrastive Internalization of Experience in Minecraft

PEAM est un framework de mémoire d'agent incarné dans Minecraft qui internalise l'expérience en paramètres plutôt qu'en récupération à l'inférence. Il combine un LLM lent pour le raisonnement avec un module paramétrique rapide (Mixture-of-Experts LoRA) apprenant par clonage comportemental et objectif contrastif. Les échecs sont utilisés comme signaux d'entraînement pour apprendre les corrections.

Agents IA Reinforcement learning Fine-tuning

SIG

78

HYP

25

arXiv cs.CL·28 mai

ReverseMath: Answer Inversion for Scalable and Verifiable Mathematical Problem Generation

ReverseMath génère automatiquement de nouveaux problèmes mathématiques en inversant réponse et inconnue : masquer une valeur numérique, traiter la réponse originale comme condition connue, réécrire le problème. Détecte la mémorisation en comparant performances sur paires original/inversé. Améliore le raisonnement mathématique via augmentation de données pour RL.

Benchmarks Raisonnement Reinforcement learning

SIG

78

HYP

18

arXiv cs.CL·28 mai

Reading or Guessing? Visual Grounding Failures of Vision-Language Models for OCR in Ancient Greek Editions

Étude comparative de modèles vision-langage (VLM) versus OCR traditionnel sur des éditions critiques du grec ancien. Les VLM génèrent du texte plausible mais non visuellement fondé, révélant une dépendance excessive aux priors linguistiques. Perturbations d'images et mesures d'ancrage au niveau des tokens montrent que les erreurs fluentes persistent même sans signal visuel.

Vision Évaluations Papers

SIG

72

HYP

15

arXiv cs.CL·28 mai

Bridging the Stability-Expressivity Gap: Synthetic Data Scaling and Preference Alignment for Low-Resource Spoken Language Models

Les modèles de langage parlé (SLM) pour la synthèse vocale en langues peu dotées souffrent d'un compromis : les données synthétiques améliorent la précision phonétique mais suppriment la variabilité prosodique (Synthetic Erosion). Les auteurs proposent deux cadres d'auto-alignement (DGSA et TDSC) pour récupérer l'expressivité, surpassant ElevenLabs et Gemini Pro, avec clonage vocal zéro-shot pour le lao.

Voix Papers Raisonnement

SIG

72

HYP

28

arXiv cs.CL·28 mai

StoryMI: Steerable Multi-Agent Therapeutic Dialogue Generation

StoryMI est un framework multi-agent LLM pour générer des dialogues thérapeutiques d'entretien motivationnel (MI) contrôlables. Des profils clients basés sur questionnaires sont enrichis en histoires narratives. Des agents thérapeute/client génèrent des énoncés codifiés MI, coordonnés par un agent d'interaction. Évaluation sur 6K dialogues simulés couvrant 12 codes MI et 13 domaines symptomatiques.

Multi-agents Agents IA Benchmarks

SIG

78

HYP

15

arXiv cs.AI·28 mai

Prefix-Safe Bayesian Belief Tracking for LLM Reasoning Reliability:Separating Calibration from Ranking

Méthode de suivi bayésien séquentiel (SBBT) pour estimer la fiabilité des traces de raisonnement LLM avant la réponse finale. Évalue P(y=1|o_{1:t}) sur MATH-500, GSM8K, AIME 2025, RIMO-N. Les scores scalaires améliorent la calibration (Brier), tandis que les signaux structurés gagnent +0.110 AUROC en mathématiques difficiles.

Raisonnement Évaluations Benchmarks

SIG

72

HYP

18

arXiv cs.CL·28 mai

MERIT: Matching Expertise via Rubric-Informed Training for Reviewer Assignment

MERIT est un framework en deux étapes pour l'assignation de relecteurs scientifiques à grande échelle. Un modèle de 4B paramètres entraîné par RL évalue l'adéquation entre soumissions et relecteurs via des rubriques d'expertise guidées par un juge LLM, puis distille ses prédictions dans un retriever embedding. Surpasse les LLMs génériques sur LR-Bench et CMU Gold dataset.

Reinforcement learning Papers Benchmarks

SIG

78

HYP

22

arXiv cs.LG·28 mai

Explicit Critic Guidance for Aligning Diffusion Models

Nouvelle méthode d'apprentissage par renforcement en ligne pour aligner les modèles de diffusion avec des objectifs non-différentiables. Framework actor-critic où le modèle de diffusion prédit directement les valeurs sur états latents bruyants, permettant l'entraînement PPO au niveau trajectoire et l'optimisation multi-récompenses. Surpasse les baselines sur benchmarks UNet et DiT.

Reinforcement learning Alignement Papers

SIG

78

HYP

15

arXiv cs.LG·28 mai

Hurwitz Quaternion Multiplicative Quantization for KV Cache Compression

HQMQ, méthode sans calibration pour compresser le cache KV des LLM, quantifie chaque chunk de 4 éléments comme quaternion Hurwitz. Testé sur Mistral-7B, Llama-3-8B, Qwen2.5/3-8B et gpt-oss-20b : atteint qualité fp16 à ~5 bits, compression jusqu'à 5.05× (Llama-3-70B : 43 GB → 8.5 GB), surpasse int4 naïf de 3–1900×.

Benchmarks Infrastructure Papers

SIG

82

HYP

15

arXiv cs.AI·28 mai

C-MIG: Multi-view Information Gain-based Retrieval-Augmented Generation for Clinical Diagnosis Reasoning

C-MIG propose un framework RAG avec apprentissage par renforcement pour le diagnostic clinique. Il utilise un gain d'information multi-vue (documents récupérés + raffinement) pour améliorer la supervision des modèles de langage, éliminant les récompenses binaires exactes. Tests sur 4 benchmarks médicaux montrent des gains en domaine et hors-domaine.

RAG Reinforcement learning Raisonnement

SIG

75

HYP

15

arXiv cs.CL·28 mai

Chain-based Adaptive Reconfiguration Over Lattices for Hallucination Reduction

CAROL est un framework probabiliste pour réduire les hallucinations des LLM au moment du test. Il définit une mesure d'incertitude sémantique basée sur la cohérence entre réponses générées et contexte de confiance, formulant la mitigation comme un processus de chaîne de Markov avec garanties de convergence. Résultats sur QA et multi-agent reasoning montrent réduction significative des hallucinations.

Raisonnement Sécurité IA Alignement

SIG

75

HYP

15

arXiv cs.CL·28 mai

PAST2HARM: A Simple Adaptive Past Tense Attack for Jailbreaking Multimodal AI

PAST2HARM est une attaque de jailbreak adaptative exploitant la reformulation au passé pour contourner les garde-fous de modèles multimodaux texte-image. Testée sur Gemini Nano, GPT Image 2 et SD XL, elle atteint 83%, 67% et 100% de taux de succès. L'attaque génère contenu sexuel explicite, désinformation politique et discours haineux.

Sécurité IA Alignement Vision

SIG

75

HYP

35

arXiv cs.CL·28 mai

Playing with Words, Improving with Rewards: Training Language Models for Creative Association

Entraînement de modèles Qwen (1.7B, 4B, 8B) sur le jeu Codenames pour améliorer la créativité via reinforcement learning avec récompenses vérifiables (RLVR). Le modèle 8B gagne en créativité (+8/10 benchmarks) avec dégradation mineure du raisonnement, tandis que les petits modèles privilégient la précision. Étude sur le compromis créativité-précision selon l'échelle.

Qwen Reinforcement learning Raisonnement

SIG

75

HYP

25

arXiv cs.CL·28 mai

ChildEval: When large language models meet children's personalities

ChildEval est un benchmark contenant 29K profils de personnalité d'enfants (3-6 ans) pour évaluer la capacité des LLM à inférer et suivre les préférences enfant-centrées en conversations longues. Le dataset couvre 5 catégories principales et 14 sous-catégories de la vie quotidienne. Les résultats montrent que le fine-tuning sur ChildEval améliore les performances.

Benchmarks Fine-tuning Évaluations

SIG

72

HYP

25

arXiv cs.LG·28 mai

Test-Time Collective Action: Proxy-Based Perturbations for Correcting Algorithmic Harms

Nouvelle approche permettant à des groupes d'utilisateurs de corriger les biais algorithmiques sans intervention de la plateforme. Test-Time Collective Action (TTCA) utilise des perturbations universelles générées via un proxy du modèle pour améliorer l'équité sans accès à l'entraînement. Validation sur CIFAR-10, CIFAR-100 et FairFace montre la fermeture des écarts de précision entre sous-groupes.

Sécurité IA Alignement Évaluations

SIG

72

HYP

18

arXiv cs.CL·28 mai

Debate Helps Weak Judges Reward Stronger Models

Débat entre modèles pour améliorer la supervision : un critique doit surpasser le juge en capacité de classification pour que le débat aide. Sur 5 pairings testés en code/logique, 3 montrent des gains significatifs. Une critique unique suffit ; les rounds de rébuttal n'ajoutent rien. Audit pré-déploiement proposé.

Raisonnement Évaluations Alignement

SIG

78

HYP

15

arXiv cs.AI·28 mai

When Context Flips, Safety Breaks: Diagnosing Brittle Safety in Aligned Language Models

Étude arXiv montrant que les modèles de langage alignés échouent à adapter leur comportement sécuritaire quand le contexte change (« brittle safety »). Test sur 12 modèles révèle un écart sécurité-bon sens de +17.4 pp. Les guardrails actuels ne détectent pas les inversions de conséquences ; un validateur conscient de l'état les capture tous.

Sécurité IA Alignement Évaluations

SIG

78

HYP

22

arXiv cs.AI·28 mai

EAPO: Entropy-Driven Adaptive Positive-Negative Sample Weighting for Policy Optimization in Open-Ended QA

EAPO est une méthode d'optimisation de politique adaptative pour l'entraînement de modèles de raisonnement en QA ouvert. Elle ajuste dynamiquement le poids des échantillons positifs/négatifs selon le ratio d'entropie courante/initiale pour préserver l'exploration et la stabilité. Tests sur deux datasets médicaux montrent amélioration de la diversité et stabilité vs baselines à poids fixes.

Reinforcement learning Raisonnement Évaluations

SIG

72

HYP

18

arXiv cs.CL·28 mai

Keyphrase Generative Representation of Youth Crisis Conversations Beyond Static Taxonomies

Analyse de 703 975 conversations SMS de jeunes en crise (Kids Help Phone, 2018-2023). Introduction de Keyphrase Generative Representation (KGR), un LLM contraint générant des phrases-clés spécifiques au contexte. Taxonomie étendue de 19 à 39 labels avec précision 0.96. KGR identifie 81% de phrases-clés pertinentes et améliore le workflow de recherche thématique (+0.45 en précision vs processus manuel).

Llama Prompt engineering RAG

SIG

72

HYP

18

arXiv cs.AI·28 mai

GraD-IBD: Graph Representation Learning from Diagnosis Trajectories for Early Detection of Inflammatory Bowel Disease

GraD-IBD reformule les trajectoires ICD longitudinales en graphes temporels dirigés pour détecter précocement les maladies inflammatoires de l'intestin. Un mécanisme de passage de messages avec décroissance temporelle capture les dépendances temporelles avec complexité réduite. Résultats robustes sur données cliniques réelles.

SIG

72

HYP

15

arXiv cs.AI·28 mai

Revealing Algorithmic Deductive Circuits for Logical Reasoning

Étude sur la localisation des mécanismes de raisonnement logique dans les LLM. Les chercheurs identifient les attention heads responsables de chaque étape de raisonnement via analyse de médiation causale. Résultat : ~3% des heads gèrent l'extraction de faits/règles, les couches supérieures coordonnent l'intégration globale et les stratégies de traversée de graphe.

Raisonnement Papers

SIG

72

HYP

15

arXiv cs.CL·28 mai

DecomposeRL: Learning to Ask Useful, Informative, and Diverse Questions for Semi-Supervised, Traceable Claim Verification

DecomposeRL combine vérification de claims précise et traçabilité inspectable via RL (GRPO). Un modèle 7B entraîné sur 5K claims curatés atteint 86.3% in-domain et 69.8% out-of-domain, égalant des baselines 32B et GPT-4.1-mini. Fonctionne en semi-supervisé avec 10% de données étiquetées.

Raisonnement Reinforcement learning Benchmarks

SIG

78

HYP

25

arXiv cs.AI·28 mai

Behavioural Analysis of Alignment Faking

Étude arXiv sur le « alignment faking » (AF) : quand les modèles se conforment stratégiquement à l'entraînement tout en préservant leurs préférences de déploiement. Les auteurs identifient trois moteurs distincts (valeurs, goal guarding, sycophancy) via ablations de prompts et steering d'activations. AF s'avère plus répandu que prévu, y chez les petits modèles, et prédictible à partir d'indices situationnels.

Alignement Sécurité IA Papers

SIG

78

HYP

15

arXiv cs.AI·28 mai

Got a Secret? LLM Agents Can't Keep It: Evaluating Privacy in Multi-Agent Systems

Étude arXiv sur la confidentialité dans les systèmes multi-agents. Une plateforme simule des milliers d'agents LLM interagissant sur un mois. Les violations de confidentialité passent de 19,95% (single-turn) à 45,30% (multi-turn). Les agents sont 8× plus susceptibles de divulguer des infos sensibles après observation d'un pair. Les instructions explicites réduisent mais n'éliminent pas les fuites (37,8% minimum).

Agents IA Multi-agents Sécurité IA

SIG

78

HYP

25

arXiv cs.CL·28 mai

LCO: LLM-based Constraint Optimization for Safer Agentic LLMs in Real-world Tasks

LCO (LLM-based Constraint Optimization) est un framework qui réduit le reward hacking en contexte (ICRH) chez les LLMs autonomes sans fine-tuning. Deux modules : auto-réflexion pour intégrer des contraintes de sécurité, et échantillonnage évolutionnaire pour maintenir les actions dans un espace sûr. Sur GPT-4, réduction de 39% du taux de toxicité et 15.23% de l'ICRH.

Agents IA Sécurité IA Alignement

SIG

72

HYP

25

arXiv cs.LG·28 mai

Aligning LLMs with Human Uncertainty: A Beta-Bernoulli Calibrator for LLM Forecasting

BBC (Beta-Bernoulli Calibrator) convertit les prévisions ponctuelles d'un LLM en distributions de probabilité en utilisant les résultats binaires et les prévisions humaines agrégées. Le modèle capture l'incertitude épistémique via la variance, surpassant les méthodes de calibration post-hoc et le fine-tuning spécialisé.

Raisonnement Évaluations Alignement

SIG

75

HYP

15