Page 106 sur 192

ToutHaut signalRécent

7679 articles

EmoMind: Decoding Affective Captions from Human Brain fMRI

EmoMind décode des légendes affectives directement à partir de signaux fMRI en deux étapes : extraction de descriptions sémantiques neutres, puis réécriture via un vecteur émotionnel continu 34-dimensionnel. Utilise guidance sans classificateur pour équilibrer fidélité sémantique et expressivité affective. Surpasse GPT-4 sur deux datasets fMRI indépendants.

Vision Raisonnement Benchmarks

SIG

HYP

arXiv cs.AI·19 mai

Context Memorization for Efficient Long Context Generation

Nouvelle méthode d'optimisation pour les LLM avec longs contextes : attention-state memory externalise le préfixe en mémoire légère de lookup sans entraînement. Sur LLaMA-3.1-8B, réduit latence attention de 1.36x à 8K tokens et surpasse RAG full-attention avec 20% moins de mémoire.

Llama Raisonnement RAG

SIG

HYP

arXiv cs.AI·19 mai

A Simplex Witness Certificate for Constant Collapse in Variational Autoencoders

Article théorique sur l'effondrement constant dans les VAE (variational autoencoders), où l'encodeur devient indépendant de l'entrée. Les auteurs proposent un certificat témoin simplex pour détecter et prévenir ce mode de défaillance durant l'entraînement, avec baseline exacte et inverse en forme fermée.

Papers Évaluations

SIG

HYP

arXiv cs.AI·19 mai

SPATIOROUTE: Dynamic Prompt Routing for Zero-Shot Spatial Reasoning

SpatioRoute est une approche de routage dynamique de prompts pour le question-answering spatial sur vidéo égocentrique. Sans fine-tuning, elle route chaque question vers un template de prompt spécialisé (mode rule-based ou LLM-driven) et atteint +5% de précision sur SQA3D comparé aux baselines, établissant un SOTA en zéro-shot sans données 3D.

Prompt engineering Vision Raisonnement

SIG

HYP

arXiv cs.CL·19 mai

Scaling Accessible Mathematics on arXiv: HTML Conversion and MathML 4

arXiv améliore son offre HTML pour les articles TeX/LaTeX depuis 2023. Les progrès 2025-2026 incluent : résolution de 3000 rapports utilisateurs, conversion vers 90% sans erreur (actuellement 75%), annotations MathML 4 pour l'accessibilité vocale, et portage en Rust de LaTeXML pour réduire les coûts de calcul.

Infrastructure Open source

SIG

HYP

arXiv cs.AI·19 mai

Concise and Logically Consistent Conformal Sets for Neuro-Symbolic Concept-Based Models

COCOCO, un framework post-hoc, intègre la Conformal Prediction aux modèles neuro-symboliques basés sur concepts (NeSy-CBMs) pour améliorer la fiabilité. Il conformalise concepts et labels conjointement via une étape de révision déduction-abduction, garantissant cohérence, couverture et concision sans hypothèse distributionnelle. Testé sur 8 datasets.

Raisonnement Sécurité IA Alignement

SIG

HYP

arXiv cs.AI·19 mai

PIPER: Content-Based Table Search via profiling and LLM-Generated Pseudoqueries

PIPER est une méthode de recherche de tables basée sur le contenu utilisant des profils de tables et des pseudo-requêtes générées par LLM pour la récupération dense. Elle surpasse les approches basées sur les métadonnées et les méthodes TableQA existantes dans les contextes de métadonnées pauvres.

RAG Embeddings Benchmarks

SIG

HYP

arXiv cs.AI·19 mai

Hypergraph Pattern Machine: Compositional Tokenization for Higher-Order Interactions

HGPM (Hypergraph Pattern Machine) modélise les interactions d'ordre supérieur en tokenisant les sous-ensembles compositionnels et en utilisant un Transformer conscient de l'inclusion. Sur 10 benchmarks hypergraphes, la méthode égale ou surpasse l'état de l'art, notamment en prédiction d'événements indésirables en polypharmacologie où elle identifie correctement les combinaisons de médicaments inhibitrices.

Papers Benchmarks Raisonnement

SIG

HYP

arXiv cs.CL·19 mai

HyperPersona: A Multi-Level Hypergraph Framework for Text-Based Automatic Personality Prediction

HyperPersona propose un framework hypergraphe multi-niveaux pour prédire la personnalité à partir de texte. Le modèle représente documents, phrases et mots comme hyperedges et nœuds, capturant dépendances globales, locales et lexicales. Évalué sur les Big Five, il surpasse les baselines existantes en intégrant la hiérarchie textuelle.

Papers Benchmarks

SIG

HYP

arXiv cs.AI·19 mai

Fixed External Cameras as Common Prior Maps for Active 3D Scene Graph Generation

Framework RGB pour la génération active de graphes de scènes 3D (3DSG) utilisant des caméras externes fixes comme cartes de contexte préalable. Le système fusionne observations de caméras embarquées et externes dans un pipeline unique, guidant le robot vers les régions d'incertitude sémantique élevée. Une seule caméra externe augmente le rappel d'objets initial de +79%.

Vision Robotique Agents IA

SIG

HYP

arXiv cs.AI·19 mai

Isotonic Survival Regression: Calibrated Survival Distributions from Deep Cox Models

Méthode de calibration post hoc pour modèles Deep Cox utilisant la régression isotonique. Améliore la calibration des probabilités de survie prédites sans affecter le pouvoir discriminant. Garanties théoriques incluant double-robustesse et calibration asymptotique, validées sur données synthétiques et cliniques réelles.

Papers Évaluations Sécurité IA

SIG

HYP

arXiv cs.AI·19 mai

Vision Inference Former: Sustaining Visual Consistency in Multimodal Large Language Models

Vision Inference Former (VIF) est un module architectural léger qui améliore la cohérence visuelle dans les modèles multimodaux. Il injecte continuellement les sémantiques visuelles pendant la génération pour contrer l'affaiblissement de l'alignement vision-langage sur de longues séquences. Testé sur 14 benchmarks (raisonnement, OCR, tableaux), VIF améliore les performances avec surcharge minimale.

Vision Multi-agents Alignement

SIG

HYP

arXiv cs.AI·19 mai

An Empirical Study of Privacy Leakage Chains via Prompt Injection in Black-Box Chatbot Environments

Étude empirique des chaînes de fuite de données via injection de prompts dans des environnements de chatbot boîte noire. Les chercheurs analysent comment un attaquant peut détourner les tâches d'un agent LLM en injectant du contenu malveillant dans des sources externes (pages web). Ils introduisent la technique « exemplification » et démontrent une chaîne d'exfiltration de données fonctionnelle.

Agents IA Prompt engineering Sécurité IA

SIG

HYP

arXiv cs.AI·19 mai

Efficient Bilevel Optimization for Meta Label Correction in Noisy Label Learning

Méthode EBOMLC pour corriger les labels bruyants via optimisation bilevel efficace. Utilise un modèle meta entraîné sur données propres pour corriger un grand dataset bruyant. Réduit coût computationnel des hypergradients et améliore stabilité sur CIFAR-10/100 avec taux de bruit élevé.

Papers Benchmarks Fine-tuning

SIG

HYP

arXiv cs.AI·19 mai

TTE-Flash: Accelerating Reasoning-based Multimodal Representations via Think-Then-Embed Tokens

TTE-Flash remplace les traces explicites de Chain-of-Thought par des tokens latents pour accélérer les représentations multimodales. Le modèle TTE-Flash-2B surpasse ses équivalents CoT explicites sur MMEB-v2 tout en réduisant le coût d'inférence. Les tokens latents restent interprétables textuellement et visuellement.

Raisonnement Vision Embeddings

SIG

HYP

arXiv cs.AI·19 mai

Temporal Aware Pruning for Efficient Diffusion-based Video Generation

TAPE, une méthode de pruning sans entraînement pour la génération vidéo par diffusion, réduit la complexité computationnelle en supprimant intelligemment les tokens tout en préservant la cohérence temporelle. Elle applique un lissage temporel entre frames, réalectionne les tokens par couche et ajuste le budget selon les étapes de diffusion.

Génération de vidéos

SIG

HYP

arXiv cs.AI·19 mai

Prediction of Challenging Behaviors Associated with Profound Autism in a Classroom Setting Using Wearable Sensors

Étude arXiv utilisant capteurs portables (accéléromètres, EDA, température) et modèles fondamentaux multimodaux pour prédire les comportements difficiles chez 9 enfants autistes profonds en classe. Prédiction jusqu'à 10 minutes d'avance avec AUC-ROC 0.78 sur 110.7 heures de données réelles.

Benchmarks Papers Sécurité IA

SIG

HYP

arXiv cs.AI·19 mai

Improving Spatio-Temporal Residual Error Propagation by Mitigating Over-Squashing

Teger, un module d'incertitude structuré, améliore la prédiction de séries temporelles spatio-temporelles en atténuant le sur-compression d'information (over-squashing) via un mécanisme de réécriture de graphe basé sur la courbure de Forman. Intégré à une tête de covariance low-rank-plus-diagonal, Teger est agnostique au backbone et montre des gains CRPS constants sur LSTM, Transformer et xLSTM.

Raisonnement Benchmarks Papers

SIG

HYP

arXiv cs.CL·19 mai

UCSF-PDGM-VQA: Visual Question Answering dataset for brain tumor MRI interpretation

Nouveau benchmark VQA clinique UCSF-PDGM-VQA : 2 387 paires question-réponse sur 473 études IRM de gliomes. Évaluation de 6 VLMs et 1 LLM révèle que les modèles actuels échouent sur les IRM multi-séquences 3D, souffrant d'effondrement de modalité et de surcharge de priors linguistiques.

Vision Benchmarks Papers

SIG

HYP

arXiv cs.AI·19 mai

Confidence-Gated Robot Autonomy: When Does Uncertainty Actually Help?

Étude sur l'utilisation de l'incertitude prédictive pour la décision autonome/déférence en robotique. Sur trois benchmarks de reconnaissance d'activité temporelle, l'incertitude ne fournit un classement d'erreurs fiable que si le modèle de base est suffisamment compétent. Softmax, MC Dropout et ensembles produisent des comportements similaires ; le choix du seuil a plus d'impact que la méthode d'incertitude.

Robotique Évaluations

SIG

HYP

arXiv cs.AI·19 mai

Exploring Trust Calibration in XAI - The Impact of Exposing Model Limitations to Lay Users

Étude préenregistrée (N=418) sur la calibration de la confiance en IA explicable : exposer les limitations du modèle améliore légèrement l'alignement entre confiance utilisateur et performance réelle en classification de lésions cutanées, mais l'expérience directe prime sur les manipulations d'onboarding.

Évaluations Sécurité IA Alignement

SIG

HYP

arXiv cs.CL·19 mai

RAGA: Reading-And-Graph-building-Agent for Autonomous Knowledge Graph Construction and Retrieval-Augmented Generation

RAGA est un agent autonome basé LLM pour la construction de graphes de connaissances et la génération augmentée par récupération. Il remplace les pipelines batch stateless par une boucle ReAct avec opérations CRUD complètes, synchronisation KG-vecteur hybride et vérification ancrée aux sources. Tests sur QASPER montrent des gains mesurables en qualité de réponses et preuves.

Agents IA RAG Raisonnement

SIG

HYP

arXiv cs.AI·19 mai

PromptDecipher: Supporting AI Tutor Authoring Through Editable Simulated Interactions

PromptDecipher est un système d'authoring pour chatbots tutoriels IA qui restructure le workflow autour de corrections directes plutôt que de prompts système abstraits. Les enseignants interagissent avec un aperçu de chat en direct, éditent les réponses indésirables du bot, et un pipeline automatisé propose des rewrites de prompts validés sur des scénarios de test prédéfinis.

Prompt engineering Agents IA Outils

SIG

HYP

arXiv cs.AI·19 mai

FedSDR: Federated Self-Distillation with Rectification

FedSDR propose une approche fédérée pour l'affinage des LLM face à l'hétérogénéité statistique. La méthode combine l'auto-distillation (FedSD) avec un mécanisme dual-stream : une branche LoRA-S locale pour absorber l'hétérogénéité et une branche LoRA-R globale ancrée aux données brutes pour garantir la fidélité factuelle.

Fine-tuning Reinforcement learning Alignement

SIG

HYP

arXiv cs.AI·19 mai

Unveiling Memorization-Generalization Coexistence: A Case Study on Arithmetic Tasks with Label Noise

Étude sur la coexistence mémorisation-généralisation dans les réseaux de neurones sur-paramétrés. Avec 80% de bruit d'étiquettes sur des tâches arithmétiques, les modèles mémorisent les labels bruyants mais conservent une structure interne de généralisation. Extraction par méthodes fréquentielles : précision quasi-parfaite. Partitionnement en composantes généralisation/mémorisation proposé.

Papers Évaluations Alignement

SIG

HYP

arXiv cs.AI·19 mai

Balancing Knowledge Distillation for Imbalance Learning with Bilevel Optimization

BiKD propose un framework bilevel pour équilibrer dynamiquement les pertes hard et soft en distillation de connaissance sur données déséquilibrées. Un réseau de génération de poids produit des pondérations adaptatives par échantillon, guidé par un ensemble de validation équilibré. Expériences sur CIFAR-10/100 long-tailed montrent des gains sur les méthodes récentes.

Fine-tuning Benchmarks Papers

SIG

HYP

arXiv cs.AI·19 mai

Multi-Object Tracking Consistently Improves Wildlife Inference

Des chercheurs appliquent le Multi-Object Tracking (MOT) aux données de pièges photographiques pour améliorer la classification d'espèces sauvages. En fusionnant les probabilités softmax sur des trajectoires temporelles, la méthode gagne 5,1% de F1-Score pondéré sur les meilleurs modèles MOT, éliminant les prédictions incohérentes entre images consécutives.

Vision Benchmarks Évaluations

SIG

HYP

arXiv cs.AI·19 mai

Improving BM25 Code Retrieval Under Fixed Generic Tokenization: Adaptive q-Log Odds as a Drop-In BM25 Fix

Amélioration de BM25 pour la récupération de code via une transformation q-logarithmique de l'IDF (Indice de Fréquence Inverse). Sur CoIR CodeSearchNet Go, NDCG@10 passe de 0.2575 à 0.4874 (+89.3%). La méthode est un drop-in fix sans coût de latence, paramétrée par la densité hapax du corpus.

Génération de code RAG Benchmarks

SIG

HYP

arXiv cs.AI·19 mai

STRIDE: A Self-Reflective Agent Framework for Reliable Automatic Equation Discovery

STRIDE est un framework d'agent auto-réflexif pour la découverte d'équations symboliques par LLM. Il améliore la fiabilité en coordonnant génération consciente des données, évaluation par ajustement mixte, réparation critique-exécuteur et mémoire sémantique préservant la diversité. Les expériences sur benchmarks de régression symbolique montrent gains en précision, robustesse OOD et récupération structurelle.

Agents IA Raisonnement Benchmarks

SIG

HYP

arXiv cs.AI·19 mai

Interaction-Breaking Adversarial Learning Framework for Robust Multi-Agent Reinforcement Learning

Nouvelle méthode IBAL pour renforcer la robustesse du MARL face aux perturbations d'interactions inter-agents. Le framework utilise une approche théorique de l'information pour construire des attaques qui dégradent la coordination en perturbant observations et actions, puis entraîne les agents à rester fiables. Amélioration démontrée sur baselines existants et scénarios d'agents manquants.

Multi-agents Reinforcement learning

SIG

HYP

arXiv cs.AI·19 mai

Domain Incremental Learning for Pandemic-Resilient Chest X-Ray Analysis

Méthode de continual learning basée sur replay pour adapter les modèles de détection de pneumonie aux variations de domaines cliniques sans oubli catastrophique. Incorpore un replay équilibré par classe et une perte pondérée dynamique. Atteint 88,66% de précision sur PneumoniaMNIST avec 5 domaines simulés, surpassant Experience Replay et Fine-Tuning.

Reinforcement learning Vision Benchmarks

SIG

HYP

arXiv cs.AI·19 mai

MARR: Module-Adaptive Residual Reconstruction for Low-Bit Post-Training Quantization

MARR propose une méthode de quantification post-entraînement basse précision (≤4-bit) pour LLMs et Vision Transformers. Elle utilise des coefficients d'échelle adaptatifs par module pour équilibrer la correction d'erreur accumulée et le biais introduit par les résidus, via une stratégie de mise à jour basée PID. Gains jusqu'à 20,2% sur LLMs et 4,6% sur ViTs.

Vision Papers Benchmarks

SIG

HYP

arXiv cs.AI·19 mai

PAREDA: A Multi-Accent Speech Dataset of Natural Language Processing Research Discussions

PAREDA est un dataset de speech multi-accent (australien, indien, chinois) contenant des discussions spontanées sur des papers NLP. Les modèles ASR SOTA montrent une dégradation en zero-shot, mais le fine-tuning réduit significativement le WER, validant la richesse du corpus pour les systèmes ASR robustes.

Benchmarks Voix Papers

SIG

HYP

arXiv cs.AI·19 mai

Graph Hierarchical Recurrence for Long-Range Generalization

Graph Hierarchical Recurrence (GHR) est un nouveau framework pour les GNNs et Graph Transformers qui capture les dépendances longue portée via une abstraction hiérarchique par pooling. GHR surpasse les modèles existants sur les benchmarks longue portée avec 1% des paramètres des SOTA, et améliore la généralisation hors-distribution.

Benchmarks Papers

SIG

HYP

arXiv cs.AI·19 mai

Whispers in the Noise: Surrogate-Guided Concept Awakening via a Multi-Agent Framework

ConceptAgent, un framework multi-agent sans entraînement, contourne l'effacement de concepts dans les modèles de diffusion en exploitant la dynamique du débruitage. L'approche black-box réveille des concepts supprimés en initialisant la trajectoire de débruitage via des états bruyants guidés par substitut, sans accès aux paramètres du modèle.

Multi-agents Sécurité IA Génération d'images

SIG

HYP

arXiv cs.AI·19 mai

Vision Transformer-Conditioned UNet for Domain-Adaptive Semantic Segmentation

ViTC-UNet combine un Vision Transformer pré-entraîné gelé avec un UNet conditionné par tokens apprenables et un décodeur d'attention bidirectionnel. L'approche améliore la segmentation sémantique biomédicale sur IRM et CT sans fine-tuning end-to-end, en ajoutant le biais inductif local des UNets aux priors visuels globaux des ViTs.

Vision Papers Benchmarks

SIG

HYP

arXiv cs.AI·19 mai

VolTA-3D: Self-Supervised Learning for Brain MRI using 3D Volumetric Token Alignment

VolTA-3D est un framework Vision Transformer 3D auto-supervisé pour l'IRM cérébrale. Il aligne des tokens globaux et locaux en paradigme étudiant-enseignant et reconstruit les structures anatomiques. Évalué sur segmentation hippocampique et classification (sexe, Alzheimer), il surpasse les baselines et démontre une meilleure transférabilité inter-domaines.

Vision Papers

SIG

HYP

arXiv cs.AI·19 mai

Training data attribution in diffusion models via mirrored unlearning and noise-consistent skew

Nouvelle méthode TDA pour diffusion models via unlearning mirrorisé et skew cohérent au bruit. MUCS fine-tune un second modèle avec gradient ascent borné et mesure le skew normalisé avec échantillons de bruit constants. Surpasse les approches existantes sur trois datasets.

Papers Évaluations Alignement

SIG

HYP

arXiv cs.AI·19 mai

Prompt Compression in Diffusion Large Language Models: Evaluating LLMLingua-2 on LLaDA

Étude de la compression de prompts sur LLaDA, un DLLM de 8B paramètres, utilisant LLMLingua-2. Évaluation sur GSM8K, DUC2004, ShareGPT avec ratio 2× montre que la préservation sémantique ne garantit pas la stabilité en modèles diffusion : le raisonnement mathématique se dégrade fortement tandis que la résumé reste robuste. Les méthodes de compression autorégressives ne transfèrent pas uniformément aux DLLMs.

Prompt engineering Benchmarks Raisonnement

SIG

HYP

arXiv cs.AI·19 mai

Distinguishable Deletion: Unifying Knowledge Erasure and Refusal for Large Language Model Unlearning

Distinguishable Deletion (D²) unifie suppression de connaissance et refus pour l'oubli des LLM. La méthode utilise un index énergétique pour effacer les connaissances indésirables dans les représentations latentes plutôt que des tokens spécifiques, évitant la suppression biaisée et la réémergence de contenu nuisible. Energy-based Unlearning Alignment (EUA) applique ce mécanisme à l'entraînement et l'inférence.

Sécurité IA Alignement Papers

SIG

HYP