Page 47 sur 144

ToutHaut signalRécent
5734 articles
arXiv cs.LG·

Learning Coherent Representations: A Topological Approach to Interpretability

Nouvelle approche topologique pour l'interprétabilité des réseaux de neurones profonds. Les auteurs introduisent la « cohérence », une propriété géométrique où chaque neurone répond à des régions contiguës de l'espace d'état. Ils proposent Coh, une fonction objectif différentiable basée sur la variance de Fréchet, validée sur MNIST et les embeddings BERT.

PapersEmbeddings
SIG
72
HYP
18
arXiv cs.AI·

From Long News to Accurate Forecast: Importance-Aware Fusion and PRM-Guided Reflection for Time Series Forecasting

Nouvelle méthode pour intégrer les actualités dans la prévision de séries temporelles via compression intelligente et supervision de retrieval. Un modèle de récompense estime l'utilité prédictive de chaque article, tandis qu'un PRM guide la sélection d'articles supplémentaires. Tests sur finance, énergie, trafic et bitcoin montrent amélioration de précision et réduction des itérations.

LlamaRaisonnementRAG
SIG
72
HYP
28
arXiv cs.CL·

Conditional Hypothesis Generation for LLM-Based Text Analysis with Researcher-Specified Covariates

Méthode de génération d'hypothèses conditionnelles pour l'analyse textuelle par LLM, intégrant des covariables spécifiées par les chercheurs. Résout les problèmes de déséquilibre de strates et d'inversion de signe via interactions features-covariables et rééquilibrage inverse-fréquence. Validation sur données synthétiques et réelles en sciences sociales computationnelles.

Prompt engineeringÉvaluationsPapers
SIG
72
HYP
15
arXiv cs.CL·

The Ghost Annotator: a Framework to Explore Human Label Variation in Content Moderation through Conformal Prediction

Framework combinant prédiction conforme et représentation collaborative pour analyser le comportement des LLM face aux annotateurs humains en modération de contenu. Introduit la métrique Ghost Prediction pour quantifier les divergences modèle-humains. Évaluation sur 4 LLM et 4 datasets révèle que les grands modèles sont plus confiants sur textes sans alignement humain, avec biais démographique structurel.

ÉvaluationsSécurité IAAlignement
SIG
72
HYP
18
arXiv cs.LG·

Binary Road Surface Classification Using Machine Learning on Production Vehicle Signals During Cruising

Méthode ML pour classifier en temps réel l'état de la route (grip sec/humide vs glissance neige/glace) à partir de signaux véhicule en croisière. Framework feature-based et end-to-end utilisant vitesses roues, couples, accélération longitudinale, angle braquage, vitesse de lacet. Validation sur données route publique.

Reinforcement learningBenchmarksVision
SIG
72
HYP
15
arXiv cs.CL·

Hint-Guided Diversified Policy Optimization for LLM Reasoning

HDPO (Hint-Guided Diversified Policy Optimization) améliore le raisonnement des LLM via renforcement avec récompenses vérifiables. La méthode incite le modèle à générer d'abord plusieurs approches candidates (hints), puis sélectionner la plus fiable. Deux étapes : Cold Start pour structurer le raisonnement, puis RL guidé par hints pour diversifier et fiabiliser les solutions.

RaisonnementReinforcement learningPapers
SIG
72
HYP
28
arXiv cs.LG·

Representational Capacity: Geometric Limits on Feature Representation in Transformer Language Models

Étude théorique sur les limites géométriques de la représentation de features dans les transformers. Les auteurs établissent un cadre basé sur les hypothèses de représentation linéaire et superposition, montrant que la capacité représentationnelle dépend du ratio vecteurs/dimensions (k/d) plutôt que du nombre brut. Analyse de dizaines de modèles open-source révèle deux classes selon la contrainte d'orthogonalité ε.

PapersRaisonnementBenchmarks
SIG
72
HYP
15
arXiv cs.AI·

ChatHealthAI: Aligning Electronic Health Record Representations with Large Language Models for Grounded Clinical Reasoning

ChatHealthAI aligne les représentations structurées des dossiers médicaux électroniques (EHR) avec l'espace sémantique d'un LLM gelé via un resampler task-aware. Le framework multimodal intègre les représentations longitudinales des patients avec des descriptions d'événements cliniques raffinées, améliorant le raisonnement clinique interprétable tout en maintenant la performance prédictive sur le benchmark EHRSHOT.

RAGRaisonnementÉvaluations
SIG
72
HYP
18
arXiv cs.CL·

Topics as Proxies for Sociodemographics: How Conversational Context Affects LLM Answers

Étude arXiv montrant que les LLM ne déduisent pas bien les caractéristiques socio-démographiques des utilisateurs à partir d'un historique conversationnel unique. Les disparités observées dans les conseils (juridique, médical, financier) sont faibles mais présentes. Les sujets de conversation s'avèrent plus prédictifs que les données socio-démographiques et affectent les réponses de manière imprévisible.

PapersSécurité IAAlignement
SIG
72
HYP
15
arXiv cs.CL·

Fully Automated Identification of Lexical Alignment and Preference-Stage Shifts in Large Language Models

Deux métriques automatisées évaluent le désalignement lexical des LLM : Lexical Alignment Score détecte la surutilisation de termes ('suggest', 'additionally', 'strategy'), Triangulated Preference Shift quantifie l'impact du RLHF. Testées sur 6 familles (Falcon, Gemma, Llama, Mistral, OLMo, Yi) via abstracts PubMed, sans annotation manuelle.

AlignementÉvaluationsReinforcement learning
SIG
72
HYP
18
arXiv cs.CL·

Economy of Minds: Emerging Multi-Agent Intelligence with Economic Interactions

Des chercheurs proposent une économie d'agents où les IA se coordonnent via des enchères et des échanges de paiements, sans contrôle centralisé. Inspirée par la théorie économique de Hayek, cette approche génère des stratégies de raisonnement multi-étapes émergentes et surpasse les baselines sur cinq tâches (raisonnement mathématique, recherche financière, optimisation de systèmes distribués).

Multi-agentsAgents IARaisonnement
SIG
72
HYP
35
arXiv cs.CL·

G^2C-MT: Graph-Guided Context Selection for Document-Level Machine Translation

G²C-MT propose une sélection de contexte guidée par graphe pour la traduction automatique au niveau du document. Le système modélise les dépendances discursives entre paragraphes via un graphe léger et utilise une marche aléatoire biaisée en profondeur pour extraire des chemins de contexte. Testé sur DeepSeek-V3, Gemini-2.5-Flash-lite et Qwen-2.5/3, l'approche surpasse les baselines sur plusieurs domaines.

PapersBenchmarksDeepSeek
SIG
72
HYP
18
arXiv cs.LG·

A Nonmonotone Gradient-Based Algorithm for Symmetric Nonnegative Matrix Factorization and Graph Clustering

SNMPBB, première adaptation des méthodes de Barzilai-Borwein non-monotones au problème de factorisation matricielle symétrique non-négative (Symmetric NMF). Démontre 6× d'accélération vs SymANLS sur données synthétiques. Extensions pour clustering de graphes (Graph-SNMPBB) et problèmes large-scale (LAI-SNMPBB) avec convergence globale prouvée.

BenchmarksPapers
SIG
72
HYP
15
arXiv cs.LG·

Improvise, Adapt, Overcome: An On-The-Fly Multifidelity Algorithm for Efficient Machine Learning

Algorithme multifidélité adaptatif pour l'apprentissage machine en chimie quantique. Détermine dynamiquement la composition du dataset en interrogeant les échantillons à chaque niveau de fidélité. Réduit les coûts de génération de données jusqu'à 30× vs méthode monofidélité et 5× vs MFML standard sur énergies de cluster couplé et énergies d'excitation.

BenchmarksPapersFine-tuning
SIG
72
HYP
18
arXiv cs.CL·

Can Factual Opinions Be Edited (Manipulated) in Large Language Models?

Nouvelle étude arXiv sur l'édition de faits opinionnés dans les LLM. Benchmark FOE avec 261 personnalités publiques, 19 catégories de sujets, 2,178 enregistrements d'opinions. Les méthodes actuelles échouent à préserver la cohérence entre opinion éditée et preuves générées. Proposition d'une méthode Self-Generated Evidence-Aligned pour l'alignement opinion-preuves.

PapersÉvaluationsSécurité IA
SIG
72
HYP
28
arXiv cs.CL·

Coherence Maximization Improves Pluralistic Alignment

Une méthode appelée Internal Coherence Maximization (ICM) génère automatiquement des exemples pour aligner les modèles IA sur des valeurs humaines diverses, sans supervision humaine extensive. Testée sur quatre benchmarks, ICM égale la performance des labels manuels. La cohérence des exemples améliore la généralisation même à précision égale, particulièrement pour les personas sous-représentées.

AlignementPrompt engineeringPapers
SIG
72
HYP
25
arXiv cs.CL·

DMT-CBT: Longitudinal Therapeutic State Modeling for CBT Counseling

DMT-CBT modélise l'évolution longitudinale des états thérapeutiques en TCC sur plusieurs sessions. Le framework maintient des états structurés, intègre des données multimodales et des interventions augmentées par outils. DMTCorpus, un dataset synthétique multimodal, démontre une meilleure fidélité thérapeutique et alliance thérapeutique comparé aux approches post-hoc.

RaisonnementVisionAgents IA
SIG
72
HYP
28
arXiv cs.LG·

Auditable Climate Risk Intelligence from Fragmented ESG Data: Deterministic Orchestration and Imbalance-Aware Learning for Scope 1-3 Validation

Framework d'orchestration déterministe pour valider les données ESG fragmentées (Scope 1-3) avec détection d'anomalies temporelles, apprentissage d'ensemble imbalancé et traçabilité d'audit. Benchmark synthétique calibré sur GHG Protocol, PCAF, ISSB. Évaluation sur métriques de classification, calibration et complétude de chaîne de provenance.

BenchmarksÉvaluationsReinforcement learning
SIG
72
HYP
15