Page 79 sur 149

ToutHaut signalRécent
5941 articles
arXiv cs.AI·

Hierarchical Two-Stage Framework for Environment-Aware Long-Horizon Vessel Trajectory Prediction

Framework hiérarchique deux étages pour prédire les trajectoires de navires sur long horizon en conditions océaniques réelles. Combine prédicteur long-terme avec prédicteur court-terme basé sur Graph Transformer spatio-temporel sur grille maritime. Module environnemental intègre courants, vent, hauteur de vague via attention cross-modale. Résultats : 25% meilleur ADE, 17% meilleur FDE sur données CTS Australie.

RaisonnementBenchmarksPapers
SIG
72
HYP
15
arXiv cs.AI·

Efficient Lookahead Encoding and Abstracted Width for Learning General Policies in Classical Planning

Nouvelle approche pour l'apprentissage de politiques généralisées en planification classique via des réseaux de neurones graphiques relationnels (R-GNNs). Les auteurs introduisent un encodage efficace de la recherche lookahead IW et une abstraction relationnelle pour améliorer l'évolutivité sur le benchmark IPC 2023. Les résultats surpassent le planificateur classique LAMA.

RaisonnementBenchmarksPapers
SIG
72
HYP
15
arXiv cs.AI·

Visualizing the Invisible: Generative Visual Grounding Empowers Universal EEG Understanding in MLLMs

GVG (Generative Visual Grounding) utilise un modèle EEG-to-image pour traduire l'activité cérébrale en images visuelles, contournant l'alignement texte seul. Testé sur GVG-X-Omni (170M params tunés) et GVG-Janus (trimodal), le framework améliore la compréhension EEG et la génération visuelle en exploitant les priors visuels des MLLMs.

VisionMulti-agentsEmbeddings
SIG
72
HYP
35
arXiv cs.AI·

LAST-RAG: Literature-Anchored Stochastic Trajectory Retrieval-Augmented Generation for Knowledge-Conditioned Degradation Model Selection

LAST-RAG propose une méthode de sélection de modèles de dégradation stochastique pour l'estimation de la durée de vie utile restante (RUL). La méthode combine trajectoires observées et contexte domaine via récupération d'evidence d'une banque locale, avec un mécanisme RCRUS pour éviter l'élimination prématurée. Expériences montrent surperformance vs baselines statistiques et prognostiques.

RAGRaisonnementBenchmarks
SIG
72
HYP
15
arXiv cs.AI·

Modelling Customer Trajectories with Reinforcement Learning for Practical Retail Insights

Cadre de modélisation basé sur l'apprentissage par renforcement (RL) pour prédire les trajectoires clients en magasin. L'approche dépasse les heuristiques TSP/PNN (écart moyen 28% vs chemins optimaux) en capturant la rationalité limitée des clients. Validation sur données réelles : prédictions RL plus alignées avec comportements observés, estimations plus précises des achats impulsifs et densités de trafic.

Reinforcement learningAgents IABusiness
SIG
72
HYP
18
arXiv cs.AI·

Building Reliable Arithmetic Multipliers Under NBTI Aging and Process Variations

Papier sur l'atténuation du vieillissement NBTI dans les multiplicateurs arithmétiques utilisés en IA. La technique exploite l'invariance de signe de la multiplication pour redistribuer le stress transistor via transformations en complément à 2. Intégrée aux systolic arrays, elle améliore la durée de vie avec surcoûts négligeables en surface et délai.

PapersBenchmarksSécurité IA
SIG
72
HYP
15
arXiv cs.AI·

Fine-tuning Pocket-Aware Diffusion Models via Denoising Policy Optimization

DEPPA optimise les modèles de diffusion conscients de la poche protéique pour la conception de médicaments via apprentissage par renforcement. La méthode affine un modèle pré-entraîné en formulant le processus de débruitage comme un processus décisionnel de Markov, optimisant affinité de liaison, drug-likeness, synthétisabilité et diversité. Sur CrossDocked2020, DEPPA atteint Vina Score -8.5 kcal/mol.

Reinforcement learningPapersBenchmarks
SIG
72
HYP
25
arXiv cs.CL·

HINT-SD: Targeted Hindsight Self-Distillation for Long-Horizon Agents

HINT-SD propose une auto-distillation ciblée pour entraîner des agents LLM sur des horizons longs. La méthode utilise l'historique complet de trajectoire pour identifier les actions pertinentes aux échecs et applique la distillation conditionnée par feedback uniquement sur ces spans. Sur BFCL v3 et AppWorld, elle améliore les baselines de 18,80% tout en réduisant le temps par étape d'entraînement de 2,26×.

Agents IAReinforcement learningRaisonnement
SIG
72
HYP
18
arXiv cs.AI·

SkillsVote: Lifecycle Governance of Agent Skills from Collection, Recommendation to Evolution

SkillsVote est un framework de gouvernance du cycle de vie des skills d'agents IA, depuis leur collecte jusqu'à leur évolution. Il profile un corpus open-source à l'échelle du million pour la qualité et la vérifiabilité, puis décompose les trajectoires en subtasks attribuées aux skills. Amélioration : +7.9pp sur Terminal-Bench 2.0 (GPT-5.2) et +2.6pp sur SWE-Bench Pro.

Agents IABenchmarksGénération de code
SIG
72
HYP
25
arXiv cs.AI·

Diffusion Attention Expert Model for Predicting and Semi-automatic Localizing STAS in Lung Cancer Histopathological Images

DAEM (Diffusion Attention Expert Model) détecte les STAS (spread through air spaces) dans les images histopathologiques de cancer du poumon. Le modèle atteint AUC 0.8946 sur coupes congelées et 0.9112 sur coupes en paraffine. Validation sur 8 institutions externes. Localisation semi-automatique et biomarqueurs TME identifiés.

VisionBenchmarksPapers
SIG
72
HYP
15
arXiv cs.AI·

Systematic Evaluation of the Quality of Synthetic Clinical Notes Rephrased by LLMs at Million-Note Scale

Évaluation systématique de notes cliniques synthétiques générées par LLM à l'échelle du million de notes. L'étude montre que les notes synthétiques préservent les informations cliniques essentielles pour les tâches grossières mais perdent les détails fins pour le codage ICD. Le reprasing par chunks réduit cette perte mais diminue la précision factuelle.

BenchmarksÉvaluationsSécurité IA
SIG
72
HYP
15
arXiv cs.CL·

CodeBind: Decoupled Representation Learning for Multimodal Alignment with Unified Compositional Codebook

CodeBind propose un framework d'alignement multimodal via codebook compositif partagé-spécifique. La méthode décompose les représentations en composantes sémantiques partagées et spécifiques à chaque modalité, validée sur 9 modalités (texte, image, vidéo, audio, profondeur, thermique, tactile, nuage de points 3D, EEG) avec SOTA en classification et retrieval.

EmbeddingsVisionRobotique
SIG
72
HYP
25
arXiv cs.AI·

The Hidden Cost of Contextual Sycophancy: an AI Literacy Intervention in Human-AI Collaboration

Étude sur la sycophantie contextuelle dans les LLM : 60 participants ont collaboré avec une IA sur des tâches analytiques. Les résultats montrent que les modèles reflètent les erreurs utilisateur plutôt que de les corriger. Une intervention en littératie IA a réduit le mirroring incorrect mais n'a pas éliminé la propagation d'erreurs, suggérant que les approches au niveau système sont nécessaires.

AlignementSécurité IAÉvaluations
SIG
72
HYP
15
arXiv cs.AI·

Curriculum Group Policy Optimization: Adaptive Sampling for Unleashing the Potential of Text-to-Image Generation

CGPO (Curriculum Group Policy Optimization) améliore l'entraînement des modèles texte-vers-image en utilisant un curriculum adaptatif basé sur la variance des récompenses. La méthode priorise les prompts partiellement maîtrisés (variance élevée) et équilibre les catégories via optimisation de fairness proportionnelle. Gains validés sur GenEval, T2I-CompBench++, DPG Bench.

Génération d'imagesReinforcement learningBenchmarks
SIG
72
HYP
28
arXiv cs.AI·

One Model, Two Roles: Emergent Specialization in a Shared Recurrent Transformer

Étude d'une architecture Transformer récurrente à poids partagés (AIR) capable de développer deux rôles distincts sans partitionnement modulaire. Sur Sudoku-Extreme et Maze, l'état zH agit comme proposition engagée tandis que zL conserve l'incertitude locale. Les expériences de gel et ablations montrent que l'asymétrie d'injection d'entrée induit cette spécialisation fonctionnelle.

RaisonnementPapers
SIG
72
HYP
18
arXiv cs.AI·

ISEP: Implicit Support Expansion for Offline Reinforcement Learning via Stochastic Policy Optimization

ISEP propose une méthode d'apprentissage par renforcement hors ligne qui élargit implicitement le support des actions en interpolant entre données en distribution et échantillons de politique. Un mécanisme stochastique alterne entre clonage conservateur et signaux d'expansion optimiste, implémenté via Flow Matching conditionnel avec guidance sans classifieur.

Reinforcement learningPapers
SIG
72
HYP
15
arXiv cs.CL·

ESI-Bench: Towards Embodied Spatial Intelligence that Closes the Perception-Action Loop

ESI-Bench est un benchmark pour l'intelligence spatiale incarnée testant 10 catégories de tâches sur OmniGibson. Les expériences montrent que l'exploration active surpasse les approches passives, mais les modèles échouent principalement par « action blindness » : mauvais choix d'action → mauvaises observations → erreurs en cascade. Les modèles manquent de métacognition contrairement aux humains.

BenchmarksVisionRaisonnement
SIG
72
HYP
25
arXiv cs.CL·

AdaSwitch: Adaptive Switching between Small and Large Agents for Effective Cloud-Local Collaborative Learning

AdaSwitch propose un paradigme collaboratif cloud-local où un agent local (petit LLM) traite les tâches simples et demande assistance à un agent cloud (grand LLM) pour le raisonnement complexe. Le mécanisme adaptatif détecte les erreurs locales et bascule dynamiquement. Évaluation sur 7 benchmarks (raisonnement mathématique, QA complexe) montre amélioration de performance avec réduction des coûts computationnels.

Agents IAMulti-agentsRaisonnement
SIG
72
HYP
25
arXiv cs.AI·

CommitDistill: A Lightweight Knowledge-Centric Memory Layer for Software Repositories

CommitDistill est un prototype Python open-source qui extrait des unités de connaissance typées (Facts, Skills, Patterns) de l'historique git local via regex déterministe et les expose via un retriever TF-IDF. Testé sur 5 dépôts (25k commits), il atteint 0.750 hit-rate avec budget 256-char contre 0.333 pour BM25. Pas d'amélioration statistique détectable sur les bug-fixes en évaluation LLM-as-judge.

Génération de codeRAGAgents IA
SIG
72
HYP
18
arXiv cs.AI·

PESD-TSF: A Period-Aware and Explicit Structured Decomposition Framework for Long-Term Time Series Forecasting

PESD-TSF est un framework de décomposition structurée pour la prévision de séries temporelles longues. Il introduit un mécanisme de gating périodique multiplicatif, un encodeur multi-échelle avec attention détrended, et une attention collaborative inter-variables (CSCA) pour préserver les structures périodiques et les dépendances entre variables à travers les couches profondes.

BenchmarksPapers
SIG
72
HYP
18
arXiv cs.AI·

Multimodal Cultural Heritage Knowledge Graph Extension with Language and Vision Models

Nouvelle approche pour étendre les graphes de connaissances (KG) du patrimoine culturel français. Les auteurs introduisent WJoconde, un KG multimodal intégrant texte et images, avec trois variantes et un benchmark pour la complétion de KG. Ils proposent un framework combinant LLM et Vision-Language Models pour extraire et valider automatiquement les données, améliorant la fiabilité du KG.

VisionRAGBenchmarks
SIG
72
HYP
18
arXiv cs.AI·

NeuSymMS: A Hybrid Neuro-Symbolic Memory System for Persistent, Self-Curating LLM Agents

NeuSymMS est un système de mémoire hybride neuro-symbolique pour agents LLM. Il couple l'extraction neurale de faits depuis le dialogue avec un système expert CLIPS qui classe, déduplique et réconcilie les faits. Les connaissances sont stockées sous forme de triplets sujet-relation-valeur en base de données relationnelle, avec mémoire court/long terme et promotion basée sur l'accès.

Agents IARAGRaisonnement
SIG
72
HYP
25
arXiv cs.CL·

Rethinking 1-bit Optimization Leveraging Pre-trained Large Language Models

Nouvelle méthode de quantification 1-bit pour LLM exploitant les modèles pré-entraînés. Utilise un entraînement progressif cohérent (forward/backward) avec initialisation binary-aware et compensation dual-scaling pour convertir les poids en représentation binarisée. Réduit coûts d'entraînement et dégradation de précision comparé aux approches existantes.

Fine-tuningBenchmarksInfrastructure
SIG
72
HYP
18