Archives

mai 2026

3147 articles

arXiv cs.LG·

Max-Window Scale Estimation for Near-Lossless HiF8 W8A8 Quantization-Aware Training

Étude systématique du QAT en HiF8 W8A8 sur OpenPangu-Embedded-1B. Identifie deux modes de défaillance : saturation amax (corruption silencieuse via clipping) et oubli catastrophique (surapprentissage du taux d'apprentissage). Solutions : fenêtre d'historique 64-step pour DTS et warmup BF16 500-step. Résultat : 0.43% drop MMLU, 0.58% HellaSwag, 0.22% ARC-Challenge vs baseline.

Fine-tuningBenchmarksPapers
SIG
72
HYP
15
arXiv cs.LG·

Dynamic Link Prediction with Temporally Enhanced Signed Graph Neural Networks

Framework modulaire pour améliorer les GNN signés avec contexte temporel. Introduit HCIM (Historical Context Integration Module) combinant pondération temporelle, LSTM et attention multi-tête pour prédire les liens dans les réseaux temporels signés. Testé sur Bitcoin OTC, Bitcoin Alpha, Reddit avec améliorations statistiquement significatives vs baseline statique.

PapersBenchmarksRaisonnement
SIG
72
HYP
15
arXiv cs.LG·

Two-Parameter Flows for Learning Population Dynamics of Physical Systems

Nouvelle méthode pour apprendre la dynamique de densités de probabilité haute-dimension sans trajectoires labellisées. Les flux à deux paramètres apprennent les transports de temps d'échantillonnage vers les marginales, puis extraient la dynamique physique par régression sur trajectoires synthétiques couplées. Approche scalable en haute dimension, compatible avec les phénomènes rotationnels.

PapersRaisonnement
SIG
72
HYP
15
arXiv cs.LG·

InfoQuant: Shaping Activation Distributions for Low-Bit LLM Quantization

InfoQuant propose une méthode de quantification post-entraînement (PTQ) sans entraînement pour les LLM. Elle utilise Peak Suppression Orthogonal Transformation (PSOT) pour transformer les activations en distributions plus faciles à quantifier. Sur LLaMA-2 13B en W4A4KV4, elle préserve 97% de la précision et réduit l'écart de performance de 42% par rapport à l'état de l'art.

LlamaPapersBenchmarks
SIG
82
HYP
15
arXiv cs.LG·

AirCast-SR: A Foundation Model for Kilometer-Scale Atmospheric Super-Resolution via Latent Consistency Diffusion

AirCast-SR est un modèle de super-résolution atmosphérique qui affine les prévisions météorologiques IA globales de 28 km à 1 km de résolution horizontale. Basé sur un U-Net 3D conditionné par diffusion LCM, entraîné sur les prévisions GraphCast et les données NOAA, il produit des prévisions de 67 heures sans biais et démontre une transférabilité zéro-shot sur l'Inde et l'Allemagne.

PapersBenchmarksOpen source
SIG
78
HYP
25
arXiv cs.AI·

Tail-Aware HiFloat4: W4A4 Post-Training Quantization for Wan2.2

Tail-Aware HiFloat4 applique la quantification post-entraînement W4A4 au modèle Wan2.2 de génération vidéo texte. La méthode adapte ViDiT-Q en utilisant le format HiFloat4, quantifie les couches linéaires du transformer, préserve les modules sensibles en haute précision, et introduit un calibrage percentile conscient des queues d'activation pour réduire l'impact des valeurs aberrantes.

Génération de vidéosFine-tuningBenchmarks
SIG
72
HYP
15
arXiv cs.LG·

On the Role of Inductive Bias in Time-Series Pretraining: A Case Study in Learning Generalizable Representations for Clinical Time Series

PathoFM, un transformer encodeur préentraîné sur des séries temporelles cliniques (analyse de marche en lésion médullaire), combine trois objectifs : Local Completion, Temporal Continuity et Unsupervised In-Context Dynamics. L'étude montre que les objectifs centrés sur la dynamique produisent les meilleures représentations transférables entre tâches de classification et régression.

PapersRaisonnementFine-tuning
SIG
72
HYP
18
arXiv cs.CL·

The Daily Dose: Workflow-Integrated Large Language Model Automation for Clinical Summarization and Trial Identification in Radiation Oncology

The Daily Dose (TDD) est un système LLM intégré en routine en oncologie radiothérapique pour résumer automatiquement les dossiers patients et identifier les essais cliniques pertinents. Évaluation sur 55 cliniciens : 83,6% utilisent TDD quotidiennement, satisfaction moyenne 3,89/5, 27% rapportent ≥10 min économisées/jour.

Génération de codeRAGBusiness
SIG
72
HYP
25
arXiv cs.CL·

Pretraining Data Exposure in Large Language Models: A Survey of Membership Inference, Data Contamination, and Security Implications

Enquête unifiée sur l'exposition des données d'entraînement (PDE) dans les LLM, couvrant l'inférence d'appartenance et la contamination de données. Formalise PDE selon les niveaux d'exposition, examine les méthodes d'attaque/défense et identifie les défis ouverts pour l'intégrité des évaluations et la protection de la vie privée.

Sécurité IAAlignementÉvaluations
SIG
75
HYP
15
arXiv cs.CL·

Self-Verified Distillation: Your Language Model Is Secretly Its Own Synthetic Data Pipeline

Qwen3 améliore ses capacités de raisonnement via Self-Verified Distillation, un algorithme post-training sans données externes. Le modèle génère des solutions, les filtre par auto-vérification (cycle-consistency, factualité, correction), puis s'entraîne sur les données auto-curées. Gains : +16.7 points en math (AIME26/HMMT), +11.1 en science (GPQA), +8.3 en coding pour Qwen3-4B.

QwenFine-tuningRaisonnement
SIG
82
HYP
25
arXiv cs.LG·

Balancing Plasticity and Stability with Fast and Slow Successor Features

Étude sur l'adaptation des agents RL en environnements non-stationnaires graduels. Les auteurs modifient des environnements 3D Miniworld et MuJoCo pour introduire une dérive continue, et montrent que la consolidation synaptique appliquée aux Successor Features (SFs) multi-échelles surpasse les approches basées sur les Q-values. La stabilité prime sur la plasticité dans l'apprentissage continu.

Reinforcement learningPapersBenchmarks
SIG
72
HYP
15
arXiv cs.CL·

Why LLMs Hallucinate on Structured Knowledge: A Mechanistic Analysis of Reasoning over Linearized Representations

Étude mécanistique des hallucinations dans les LLM sur connaissances structurées linéarisées (graphes, tables). Les hallucinations résultent de dynamiques internes systématiques : attention concentrée sur des indices structurels raccourcis, représentations feed-forward ne grounding pas la connaissance fournie, reversion à la mémoire paramétrée. Patterns généralisent à graphes multi-hop et données tabulaires.

RaisonnementPapersSécurité IA
SIG
78
HYP
15
arXiv cs.AI·

MobileExplorer: Accelerating On-Device Inference for Mobile GUI Agents via Online Exploration

MobileExplorer accélère l'inférence sur appareil pour les agents GUI mobiles via exploration en ligne. Le framework exploite le temps de raisonnement des VLM pour explorer parallèlement les éléments UI, enregistrant les traces comme mémoire structurée. Avec un mécanisme de rollback deux niveaux, il réduit les étapes de raisonnement et la latence de 23% sur AndroidWorld.

Agents IAVisionRaisonnement
SIG
78
HYP
25
arXiv cs.LG·

Modeling Dynamic Mixtures of Time-Delay Systems from Streaming Time Series

Méthode online pour modéliser des séries temporelles en streaming comme mélanges dynamiques de systèmes à délais variables. Utilise une représentation tensorielle compacte des paramètres de Markov pour capturer dynamiques et délais, avec décomposition tensorielle pour adapter rapidement le modèle aux changements de régime. DelayMix surpasse les baselines sur données réelles non-stationnaires.

BenchmarksPapers
SIG
72
HYP
15
arXiv cs.AI·

Completion vs Optimality: Policy Gradient in Long-Horizon Cumulative-Damage Problems

Étude des défaillances des méthodes de gradient de politique dans les problèmes de décision à long horizon avec dommages cumulatifs. Les auteurs identifient deux modes d'échec orthogonaux et proposent une décomposition séparant complétude (atteindre l'horizon terminal) et optimalité (correspondre à la programmation dynamique). Expériences sur carrière de maçon (49 étapes) et carrière NBA (20 saisons).

Reinforcement learningPapersRaisonnement
SIG
72
HYP
15
arXiv cs.AI·

Advancing Creative Physical Intelligence in Large Multimodal Models

MM-CreativityBench, un nouveau benchmark, évalue la capacité des modèles multimodaux à résoudre des problèmes créatifs en identifiant des usages non-évidents d'objets dans des environnements physiquement contraints. Les LMMs actuels échouent par manque d'exploration ancrée et hallucinations. L'alignement par affordances via DPO réduit ces erreurs et améliore la sélection d'entités pertinentes.

BenchmarksVisionRaisonnement
SIG
75
HYP
25
arXiv cs.AI·

Which Changes Matter? Towards Trustworthy Legal AI via Relevance-Sensitive Evaluation and Solver-Grounded Reasoning

Étude arXiv sur l'évaluation des LLM juridiques. Les modèles existants sont sensibles à des variations légalement non pertinentes. LexGuard, un framework multi-agent adversarial, formalise les statuts en contraintes exécutables et utilise des solveurs SMT pour vérifier la cohérence logique et la satisfaction légale.

RaisonnementMulti-agentsSécurité IA
SIG
72
HYP
18
arXiv cs.AI·

OmniToM: Benchmarking Theory of Mind in LLMs via Explicit Belief Modeling

OmniToM est un benchmark évaluant la théorie de l'esprit dans les LLM via la modélisation explicite des croyances. Construit sur 895 histoires (22 343 propositions de croyances annotées), il teste l'extraction et l'étiquetage des états mentaux selon 7 dimensions. Les résultats montrent que les LLM actuels peinent à transformer les faits narratifs en croyances d'acteurs.

BenchmarksRaisonnementÉvaluations
SIG
78
HYP
15
arXiv cs.AI·

What Makes Chain-of-Thought Work at Probe Time? Local Co-occurrence Rather Than Global Derivation

Étude sur le mécanisme du chain-of-thought (CoT) au moment de l'inférence. Les auteurs montrent que l'amélioration de performance provient principalement d'une activation lexicale et de co-occurrences de tokens à courte portée (2-3 tokens), plutôt que d'une dérivation logique globale. Même un texte avec mots mélangés surpasse l'absence de rationale.

RaisonnementPrompt engineeringPapers
SIG
78
HYP
15
arXiv cs.LG·

TSFMAudit: Data Contamination Auditing in Forecasting Time Series Foundation Models

TSFMAudit, première méthode d'audit de contamination de données pour modèles de fondation en séries temporelles (TSFMs). Détecte si des datasets d'évaluation ont été exposés lors du préentraînement en analysant la dynamique d'adaptation fine-tuning : les données contaminées montrent une réduction de perte anormalement rapide. Évalué sur 6 TSFMs et 187 datasets.

BenchmarksÉvaluationsPapers
SIG
78
HYP
15
arXiv cs.CL·

FAB-Bench: A Framework for Adaptive RAG Benchmarking in Semiconductor Manufacturing

FAB-Bench est un framework de benchmarking adaptatif pour évaluer les systèmes RAG en fabrication semiconducteurs. Il définit 6 métriques diagnostiques (précision factuelle, utilisation contextuelle, complétude, pertinence de retrieval, profondeur technique, cohérence du raisonnement) sur des fenêtres de contexte 4K-32K tokens. Benchmark de 200 paires query-answer testé sur 4 LLMs et 4 frameworks RAG.

RAGBenchmarksÉvaluations
SIG
78
HYP
15
arXiv cs.CL·

Hubness, Not Anisotropy, Drives Cross-Lingual Retrieval Asymmetry in Multilingual Embedding Models

Étude sur l'asymétrie de récupération cross-lingue dans 5 modèles multilingues (Gemini, Mistral, OpenAI, Qwen). Analyse de 6 518 expressions idiomatiques en anglais, bengali, hindi et arabe. Résultat : la « hubness » (concentration de vecteurs) est le principal facteur causal (49,5% de dominance), bien plus que l'anisotropie. La correction CSLS ferme 63,5% de l'écart de réciprocité.

EmbeddingsBenchmarksMulti-agents
SIG
82
HYP
15
arXiv cs.LG·

Provably Communication-Efficient and Privacy-Preserving Federated Graph Neural Networks

CE-FedGNN est un framework fédéré pour les réseaux de neurones graphiques (GNNs) qui réduit la communication en échangeant rarement des représentations agrégées plutôt que des embeddings à chaque round. Un estimateur de moyenne mobile gère les dépendances cross-client et la staleness. Le framework garantit la confidentialité via metric-DP et converge en O(1/√T) avec complexité de communication O(T^3/4).

SIG
78
HYP
15
arXiv cs.LG·

Planning Neural Dynamics with Lie Group Embedding through Supervised Projective Manifold Learning

LieEDNN propose des réseaux de neurones dynamiques intégrant les groupes de Lie pour modéliser les symétries continues. L'approche résout l'incompatibilité entre l'arithmétique additive des réseaux et la géométrie non-euclidienne via des actions adjointes sur l'algèbre de Lie. Application testée sur SE(3) pour manipulateurs télescopiques.

RaisonnementRobotiquePapers
SIG
72
HYP
15
arXiv cs.AI·

ScientistOne: Towards Human-Level Autonomous Research via Chain-of-Evidence

ScientistOne, un système autonome de recherche, introduit Chain-of-Evidence (CoE) pour tracer chaque affirmation à sa source. Évaluation sur 75 articles : les systèmes de base montrent 21% de références halluccinées, 42% de vérification de scores réussie. ScientistOne atteint 0 hallucination, vérification parfaite, et surpasse les experts humains sur 5 tâches.

Agents IARaisonnementÉvaluations
SIG
82
HYP
28
arXiv cs.CL·

AI evaluation may bias perceptions: The importance of context in interpreting academic writing

Étude montrant que les méthodes d'évaluation de l'usage de l'IA dans les publications scientifiques produisent des biais importants sans tenir compte des différences contextuelles entre pays et domaines. Les benchmarks « pooled » confondent variations stylistiques préexistantes avec texte généré par LLM, surestimant l'IA dans certains contextes et la sous-estimant dans d'autres.

ÉvaluationsPapersSécurité IA
SIG
72
HYP
15
arXiv cs.CL·

In-Context Optimization for Retrieval-Augmented Generation: A Gradient-Descent Perspective

Étude théorique montrant qu'une couche de self-attention linéaire peut implémenter une étape de gradient descent sur un objectif RAG unifié. Les auteurs proposent une méthode légère pour adapter l'interaction entre requêtes et documents récupérés sans modifier le retriever ni le modèle backbone, testée sur 7 benchmarks QA avec améliorations significatives.

RAGRaisonnementPapers
SIG
75
HYP
15
arXiv cs.AI·

Managing Uncertainty in LLM-Generated Procedural Knowledge for Virtual Laboratory Planning

Un cadre pour gérer l'incertitude dans les procédures générées par LLM pour la planification de laboratoires virtuels éducatifs. Le système utilise des représentations de domaine structurées et des échantillons de transition d'état incertains pour extraire des règles procédurales, les transformer en contraintes explicites et réparer les étapes défectueuses.

RaisonnementAgents IAPapers
SIG
72
HYP
18
arXiv cs.LG·

The Constraint Tax: Measuring Validity-Correctness Tradeoffs in Structured Outputs for Small Language Models

Étude sur le coût des contraintes de sortie structurées pour petits modèles de langage (< 3B). Tests sur Qwen2.5-0.5B/1.5B et SmolLM2-1.7B montrent que forcer la validité du schéma JSON (61.5% → 100%) réduit la précision des réponses (19.7% → 11.0%) et augmente les sorties invalides sémantiquement (49.5% → 88.9%). Recommandation : rapporter séparément validité schéma, précision réponse et taux d'erreurs sémantiques.

QwenGénération de codeÉvaluations
SIG
78
HYP
15
arXiv cs.AI·

Composition Collapse: Stable Factual Knowledge Does Not Imply Compositional Reasoning

Une étude arXiv montre que les modèles avec des connaissances factuelles stables échouent systématiquement à les assembler en chaînes de raisonnement multi-hop (écart >40 points). Les métriques agrégées masquent ce « composition collapse ». Les auteurs proposent un protocole double-gate pour décomposer les gains post-training en trois canaux : stabilité atomique, composition résiduelle et profondeur critique.

RaisonnementBenchmarksÉvaluations
SIG
78
HYP
15
arXiv cs.AI·

It's Not the Capability: Harness Sensitivity Is Non-Monotone Across LLM Agent Tiers

Étude de 432 expériences sur 6 modèles (4 tiers de capacité) testant l'hypothèse que les modèles plus puissants nécessitent moins de structure. Résultats : relation non-monotone. Gemini 2.5 Flash voit ses performances baisser de 29-38pp avec plus de verbosité. Qwen3.5-122B (reasoning) atteint 91.7% VTSR avec harness strict. Taxonomie de 6 défaillances identifiée.

Agents IAÉvaluationsRaisonnement
SIG
78
HYP
15
arXiv cs.AI·

Mind the Tool Failures: Achieving Synergistic Tool Gains for Medical Agents

Étude sur l'utilisation d'outils externes par les agents médicaux IA face à des défaillances d'outils. Propose un cadre RL basé sur GRPO avec sélection au niveau instance plutôt que tâche, récompenses de minimisation de risque probabiliste et apprentissage de synergies conscientes du désaccord. Évaluation sur 7 benchmarks médicaux montre améliorations robustes.

Agents IAReinforcement learningRaisonnement
SIG
72
HYP
18
arXiv cs.CL·

Cultural Value Alignment Via Latent Activation Steering in Large Language Models

Étude sur l'alignement culturel des LLM via activation steering. Les chercheurs contournent les refus de sécurité en utilisant 300 dilemmes situationnels pour extraire les valeurs culturelles latentes, puis appliquent du steering d'activation sans réentraînement. Découverte clé : les valeurs culturelles sont encodées comme structures couplées, limitant l'alignement précis.

AlignementRaisonnementÉvaluations
SIG
72
HYP
25
arXiv cs.CL·

Evidence Absence Is Not Evidence Insufficiency: Diagnosing NEI Construction Artifacts in Fact Verification

NEI-CAP, un protocole de diagnostic pour évaluer la construction des labels « Not Enough Information » dans les benchmarks de vérification de faits. Les chercheurs montrent que la compétence NEI ne transfère pas fiablement entre constructions : les modèles entraînés sur des indices de raccourci échouent à reconnaître l'insuffisance de preuves sémantiquement liée. Tests sur SciFact, FEVER et HoVer.

BenchmarksÉvaluationsPapers
SIG
72
HYP
15
arXiv cs.LG·

Bridging Classification and Reconstruction: Cooperative Time Series Anomaly Detection

CoAD, un nouveau framework pour la détection d'anomalies en séries temporelles, combine classification (Outlier Exposure) et reconstruction (Masked Autoencoder). Le module de classification génère des masques souples pour guider la reconstruction, résolvant les problèmes de généralisation et d'alignement des masques. Expériences sur benchmarks standards montrent des gains significatifs avec une inférence plus rapide.

BenchmarksPapers
SIG
72
HYP
28
arXiv cs.AI·

LiveK12Bench: Have Large Multimodal Models Truly Conquered High School-level Examinations?

LiveK12Bench est un benchmark dynamique multi-disciplinaire évaluant les capacités de raisonnement des modèles multimodaux sur 2K+ questions d'examens réels (Maths, Physique, Chimie, Biologie). Les tests révèlent une dégradation majeure : GPT-5 chute de 79 à 53/100 sous contraintes réalistes d'examen. Le framework inclut un pipeline automatisé anti-contamination et un schéma d'évaluation « Mock Exam » end-to-end.

BenchmarksVisionRaisonnement
SIG
78
HYP
25
arXiv cs.LG·

Semigroup Consistency as a Diagnostic for Learned Physics Simulators

Nouvelle métrique de diagnostic pour les simulateurs physiques appris : l'erreur de semi-groupe mesure la cohérence temporelle en comparant l'évolution directe sur s+t avec l'évolution composée (s puis t). Testée sur dynamiques thermiques et Burgers avec ConvNet et FNO, corrélation Spearman ρ=0.635 avec dégradation en long-horizon. Utile comme évaluation post-hoc plutôt que comme objectif d'entraînement.

BenchmarksÉvaluationsPapers
SIG
72
HYP
15
arXiv cs.CL·

Verilog-Evolve: Feedback-Driven and Skill-Evolving Verilog Generation

Verilog-Evolve est un framework de raffinement itératif du code Verilog généré par LLM. Le système évalue les candidats via simulation fonctionnelle, synthèse Yosys, timing ABC et métriques GEMM, puis évolue des compétences modulaires entre tâches. Résultats sur VerilogEval : meilleure stabilité fonctionnelle et qualité RTL downstream.

Génération de codeReinforcement learningÉvaluations
SIG
78
HYP
15
arXiv cs.LG·

When Correct Demonstrations Hurt: Rethinking the Role of Exemplars in In-Context Learning

Une étude arXiv révèle que des démonstrations correctes peuvent dégrader les performances en in-context learning (ICL). Les chercheurs introduisent des perturbations préservant la tâche pour montrer que la correction n'implique pas l'utilité : modifier l'entrée d'un exemplaire tout en conservant une sortie correcte peut réduire la précision, particulièrement sur les petits modèles et tâches difficiles.

Prompt engineeringRaisonnementÉvaluations
SIG
72
HYP
18
arXiv cs.AI·

The MiniMax-M2 Series: Mini Activations Unleashing Max Real-World Intelligence

MiniMax présente la série M2, des modèles MoE avec 229.9B paramètres totaux et 9.8B activés par token. Conçus pour le déploiement d'agents, ils intègrent des pipelines de données agent-driven, Forge (système RL agent-natif), et M2.7 capable d'auto-évolution. Performance frontier sur benchmarks de coding agent, recherche profonde et raisonnement.

Agents IARaisonnementGénération de code
SIG
75
HYP
35
arXiv cs.AI·

MedGuideX: Internalizing Decision Logic from Executable Guidelines into Large Language Models for Clinical Reasoning

MedGuideX transforme les recommandations des guides de pratique clinique (CPG) en logique décisionnelle exécutable pour générer des données d'entraînement en question-réponse. Post-entraînement d'un LLM médical sur ces données améliore la précision de 10,28% sur quatre benchmarks de raisonnement clinique et produit des justifications préférées par les médecins.

Fine-tuningRaisonnementÉvaluations
SIG
78
HYP
22
arXiv cs.AI·

Reasoning, Code, or Both? How Large Language Models Handle Variations in Math Questions

Étude comparative de trois approches LLM sur 1 000 problèmes mathématiques (GSM-Symbolic) : chain-of-thought (CoT), Program-Aided Language models (PAL) et Step-by-Step Coding (SBSC). CoT s'avère plus robuste face aux variations (drop 1,3pp vs 1,7pp pour PAL), contredisant l'hypothèse que l'exécution de code améliore la robustesse du raisonnement.

RaisonnementGénération de codeBenchmarks
SIG
72
HYP
15
arXiv cs.AI·

From Static Context to Calibrated Interactive RL: Mitigating Distribution Shift in Multi-turn Dialogue with Aligned Simulator

Article théorique et empirique sur l'entraînement d'agents dialogue LLM. Identifie la distribution shift comme limitation majeure du Static Context RL et Interactive RL. Propose Calibrated Interactive RL couplant RL interactif avec alignement du simulateur pour réduire l'écart sim-to-real et améliorer la qualité du dialogue multi-tour.

Reinforcement learningAgents IARaisonnement
SIG
72
HYP
18
arXiv cs.CL·

Probing Minimalist Phase Structure in LLMs: What Universal Dependencies Cannot Represent

Des chercheurs testent si les LLM encodent des structures syntaxiques formelles (phase boundaries du Minimalist Program) invisibles aux Universal Dependencies. Sur 13 modèles (4 familles), 12/13 montrent un gradient lié au nombre de phases, et 13/13 une asymétrie prédite par la cohésion intra-phase. L'activation patching confirme ces représentations sont causalement actives.

PapersRaisonnementÉvaluations
SIG
78
HYP
15
arXiv cs.CL·

Elias in the Lighthouse, Again? Diagnosing Low Diversity in LLM Stories

Étude sur 20 000 histoires générées par 4 LLM : 11 mots (Elias, Mara, Elara, lighthouse, clockmaker, librarian) apparaissent dans 88,3% des récits. Ces tokens proviennent de données de préférence utilisées lors de l'alignement, pas des données d'entraînement. Révèle l'impact disproportionné de petits datasets combinés à des algorithmes d'alignement puissants.

BenchmarksAlignementÉvaluations
SIG
72
HYP
25
arXiv cs.LG·

Curriculum Learning for Safety Alignment

Staged-Competence, un framework de curriculum learning, améliore la robustesse de l'alignement de sécurité basé sur DPO. Sur trois familles de modèles, il réduit les taux de réponses nuisibles hors-distribution de 16% et les taux de succès des attaques jailbreak de 20%, tout en préservant les capacités générales. Le framework atteint la sécurité de base avec 75% des données d'entraînement.

Sécurité IAAlignementReinforcement learning
SIG
78
HYP
25
arXiv cs.CL·

Towards Just-in-Time Adaptive Feedback: Enhancing Student Learning via Knowledge-Grounded LLM

Framework d'apprentissage adaptatif utilisant des LLM ancrés dans des connaissances expertes pour fournir des retours pédagogiques juste-à-temps. Déployé dans un cours universitaire (N>1000), il améliore la performance étudiante de 80% en analysant les essais de raisonnement et en corrigeant les erreurs conceptuelles via conversations itératives.

RaisonnementRAGÉvaluations
SIG
72
HYP
35
arXiv cs.AI·

BrickAnything: Geometry-Conditioned Buildable Brick Generation with Structure-Aware Tokenization

BrickAnything génère des structures de briques physiquement constructibles à partir de formes 3D via un framework autorégressif. La méthode utilise une tokenization arborescente consciente de la structure pour modéliser les dépendances entre briques, avec décodage contraint et alignement par préférence pour améliorer la stabilité et la fidélité géométrique.

PapersGénération de codeRaisonnement
SIG
72
HYP
15
arXiv cs.LG·

Quantized Keys Steal Attention: Bias Correction for KV-Cache Compression in Video Diffusion

Les modèles de diffusion vidéo autorégressifs utilisent un cache KV quantifié pour réduire la mémoire, mais la quantization crée un biais d'attention (Jensen bias) qui dégrade la qualité. Les auteurs proposent une correction per-attention-score calculée à partir des pas de quantization, récupérant la qualité perdue avec INT2 tout en utilisant 50% moins de mémoire qu'INT4.

Génération de vidéosRaisonnementBenchmarks
SIG
78
HYP
15
arXiv cs.AI·

Is Agent Memory a Database? Rethinking Data Foundations for Long-Term AI Agent Memory

Article formalisant la mémoire d'agent IA comme workload de gestion de données distinct. Propose GEM (Governed Evolving Memory) avec quatre opérateurs au niveau état (ingestion, révision, oubli, récupération) et six conditions de correction. Démontre que les systèmes record-level ne peuvent satisfaire ces conditions. Prototype MemState sur graphe de propriétés.

Agents IAPapersInfrastructure
SIG
78
HYP
15
arXiv cs.AI·

Beyond a Single Direction: Chain-of-Thought Disrupts Simple Steering of Refusal

Les modèles de raisonnement (LRM) encodent le refus conjointement dans les activations résiduelles et la chaîne de pensée (CoT). Sur DeepSeek-R1-Distill-LLaMA-8B, le steering d'activation inverse le refus dans 39% des cas avec CoT fixe, mais 70% sans CoT. Régénérer la CoT sous steering atteint 94% de succès, révélant que le refus est distribué entre activations et CoT.

RaisonnementSécurité IAAlignement
SIG
78
HYP
25
arXiv cs.AI·

Your Agents Are Aging Too: Agent Lifespan Engineering for Deployed Systems

AgingBench, un benchmark de fiabilité longitudinale, évalue comment les agents IA déployés se dégradent au fil du temps. Étude sur 14 modèles et ~400 exécutions montrant que la fiabilité dépend de quatre mécanismes : compression, interférence, révision et maintenance. Les agents perdent précision factuelle même quand les tests comportementaux restent corrects.

Agents IAÉvaluationsBenchmarks
SIG
82
HYP
15
arXiv cs.LG·

QAM-W: Joint 2D Codebook Quantization for LLM Weights via Hadamard Rotation and Activation-Aware Scaling

QAM-W est un codec de quantification 2D pour poids de LLM qui utilise rotation Hadamard et mise à l'échelle consciente de l'activation. Sur 5 modèles (1.1B–13B), la variante activation-aware à ~5.5 bpw maintient ±0.4% de perplexité BF16, égalant SmoothQuant W8A8 avec 32% moins de bits. Le codage 2D surpasse le codage polaire de 2–15 pp.

Fine-tuningBenchmarksPapers
SIG
78
HYP
15
arXiv cs.CL·

Bounded Path Context: A Controlled Study of Visible Path History in LLM-Based Knowledge Graph Question Answering

Étude contrôlée sur la longueur d'historique de chemin dans le QA sur graphes de connaissances avec LLM. Bounded Path Context (BPC) limite l'historique exposé au modèle (K derniers sauts) tout en conservant le chemin complet en mémoire symbolique. Sur WebQSP et CWQ avec Qwen3.5-9B-AWQ : K=1 atteint 0.487 F1 (vs 0.472 historique complet) avec 9.7% moins de tokens.

RaisonnementBenchmarksPapers
SIG
78
HYP
15
arXiv cs.CL·

Why Prompt Optimization Works, and Why It Sometimes Doesn't: A Causal-Inspired Edit-Level Analysis

Analyse causale des méthodes d'optimisation de prompts (DSpy, TextGrad) révélant pourquoi elles échouent à généraliser. Les édits augmentant la complexité nuisent aux tâches mathématiques et multi-sauts, tandis que les édits step-by-step améliorent le raisonnement logique. Les défaillances proviennent d'interactions systématiques entre familles d'édits et caractéristiques des tâches.

Prompt engineeringRaisonnementBenchmarks
SIG
75
HYP
15
arXiv cs.LG·

MechRL: Reinforcement Learning Agents Perform Circuit Discovery for Mechanistic Interpretability

MechRL utilise un agent RL (PPO) opérant sur 144 têtes d'attention de GPT-2 small pour découvrir automatiquement les circuits mécanistiques. Entraîné sur induction et IOI, l'agent identifie les têtes causalement pertinentes via ablation zéro et récompense contrastive, généralisant à docstring completion (96% de l'oracle en best-of-five).

Reinforcement learningÉvaluationsPapers
SIG
78
HYP
15
arXiv cs.LG·

ARBITER: Reasoning Trajectory Basins and Majority Vote Failures in Test-Time Sampling

ARBITER corrige les défaillances du vote majoritaire en test-time sampling. Les trajectoires de raisonnement se concentrent en clusters (bassins) stables mais pas nécessairement corrects. ARBITER utilise les états cachés et preuves du modèle pour ajouter des preuves conservatives au consensus, récupérant ~22% de l'écart oracle sur Llama-3.1-8B MMLU-HS-Math (78%→82%).

RaisonnementÉvaluationsBenchmarks
SIG
78
HYP
25
arXiv cs.CL·

The Need for an External Observer Formalizing the Sufficiency Gap: A Mathematical Extension of Mixture Identifiability and Contextual Grounding in Sequence Models

Article théorique sur l'insuffisance des modèles de séquence face aux états latents non observés. Les auteurs formalisent un processus mixte où un prédicteur parfait peut devenir surconfiant si le contexte observé correspond au mauvais régime latent. Ils montrent que le « sufficiency gap » (écart de suffisance) ne peut être fermé que par révélation parfaite de l'état latent ou un mécanisme de vérification équivalent.

RaisonnementAlignementSécurité IA
SIG
72
HYP
15
Reddit r/LocalLLaMA·

Stop traumatizing AI into loops and turn hallucinations into an honest "I don't know!" by being NICE to them (Proof of Concept, Research, I don't want to sell anything)

Un chercheur teste l'hypothèse que les prompts « autoritaires » (« expert IQ 200 ») déclenchent des boucles de pensée similaires au stress chronique chez les modèles IA, tandis que des prompts « bienveillants » (« c'est ok d'échouer ») réduisent la latence et augmentent les réponses honnêtes « je ne sais pas ». Résultats sur Gemini, Mistral, Claude Haiku 4.5 : moins de confabulation, réponses plus rapides.

Prompt engineeringRaisonnementSécurité IA
SIG
45
HYP
65