Page 110 sur 151

ToutHaut signalRécent
6030 articles
arXiv cs.AI·

Severity-Aware Curriculum Learning with Multi-Model Response Selection for Medical Text Generation

Framework multi-modèle avec curriculum learning par sévérité pour la génération de texte médical. Trois étapes de formation progressive (cas bénins → modérés → critiques) sur 5 LLM, sélection de réponse par pertinence à l'inférence. Évaluation sur MAQA : 86,71% baseline, 90,30% après fine-tuning (BERTScore).

Fine-tuningReinforcement learningBenchmarks
SIG
62
HYP
28
Reddit r/MachineLearning·

Faithful uncertainty in LLM agents: calibration vs utility tradeoff in practice[D]

Un chercheur teste la calibration d'incertitude dans les agents LLM via un pipeline de planification + vérification. La vérification détecte 60% des appels d'outils hallucincés avant exécution, mais réduit les réponses correctes faciles de moitié. Solution : flaguer les tâches basse confiance pour révision humaine, exécuter automatiquement les hautes confiance.

Agents IARaisonnementSécurité IA
SIG
62
HYP
28
arXiv cs.LG·

Multi-Modal Machine Learning for Breast Cancer Recurrence Prediction

Étude arXiv sur la prédiction de récidive du cancer du sein via apprentissage multi-modal. Intègre dossiers de traitement, rapports de pathologie et notes cliniques. Utilise extraction par regex et réconciliation des conflits pour extraire caractéristiques tumorales du texte libre. Démontre que l'intégration multi-modale améliore la précision prédictive vs approches mono-modales.

BenchmarksVision
SIG
62
HYP
18
arXiv cs.AI·

Operational AI Deployment Assurance: Governance-State Orchestration Under Threshold-Sensitive Deployment Conditions -- A Governance Framework for High-Stakes AI Systems

OADA est un cadre de gouvernance IA pour les systèmes critiques qui traduit l'instabilité des métriques d'équité, la sensibilité aux seuils et l'incertitude opérationnelle en décisions de déploiement. Testé sur la reconnaissance faciale et la santé, il introduit des scores d'assurance, des états d'escalade et des zones de stabilité pour contrôler le déploiement plutôt que de simplement auditer post-hoc.

Sécurité IAAlignementÉvaluations
SIG
62
HYP
28
arXiv cs.LG·

Energy-Gated Attention and Wavelet Positional Encoding: Complementary Inductive Biases for Transformer Attention

Deux mécanismes complémentaires pour améliorer l'attention transformer : Energy-Gated Attention (EGA) sélectionne les tokens informatifs via projection linéaire ; Morlet Positional Encoding (MoPE) remplace les encodages sinusoïdaux par des ondelettes gaussiennes apprises. Sur TinyShakespeare, leur combinaison atteint +0.119 amélioration de loss validation, surpassant la somme des parties individuelles.

PapersRaisonnement
SIG
62
HYP
25
arXiv cs.LG·

TBP-mHC: full expressivity for manifold-constrained hyper connections through transportation polytopes

TBP-mHC propose une paramétrisation des polytopes de Birkhoff pour les Hyper-Connexions contraintes par variété. La méthode construit des matrices de mélange doublement stochastiques exactes avec (n-1)² degrés de liberté, évitant la normalisation itérative et l'explosion combinatoire. Résultats compétitifs sur le pré-entraînement de modèles de langage avec stabilité améliorée.

PapersRaisonnement
SIG
62
HYP
15
Reddit r/MachineLearning·

I created an LLM post-training method called RPS. Preliminary results show that it improved Qwen3-8b's program synthesis reliability. [R]

RPS est une méthode de post-entraînement en deux étapes inspirée de la neuroplasticité : données faciles avec taux d'apprentissage élevé, puis données difficiles avec taux réduit de 90%. Sur Qwen3-8b, RPS atteint 4% sur ARC-AGI 1 et 1145/1200 exécutions sans erreur en synthèse de programmes, contre 2.4% et 870/1200 pour EPS (taux égal).

QwenFine-tuningGénération de code
SIG
62
HYP
35
arXiv cs.AI·

A Machine Learning Framework for EEG-Based Prediction of Treatment Efficacy in Chronic Neck Pain

Framework ML utilisant l'EEG pour prédire l'efficacité thérapeutique chez patients souffrant de douleurs cervicales chroniques. Pipeline de prétraitement rigoureux (suppression baseline, ICA, analyse spectrale) appliqué à EEG au repos et moteur. Revue systématique de 763 études (16 patients, 47 contrôles sains) pour informer la stratégie post-traitement.

ÉvaluationsPapers
SIG
62
HYP
15
arXiv cs.AI·

SAS: Semantic-aware Sampling for Generative Dataset Distillation

SAS propose une approche de distillation de dataset utilisant CLIP comme prior sémantique pour améliorer la qualité des données compressées. Trois fonctions de scoring évaluent la pertinence de classe, la séparabilité inter-classe et la diversité intra-ensemble. Une stratégie deux-étapes filtre les échantillons discriminatifs puis sélectionne dynamiquement pour réduire la redondance.

EmbeddingsVisionBenchmarks
SIG
62
HYP
18
arXiv cs.AI·

UNR-Explainer: Counterfactual Explanations for Unsupervised Node Representation Learning Models

UNR-Explainer génère des explications contrefactuelles pour les modèles d'apprentissage de représentation de nœuds non supervisés (GNNs). La méthode identifie les sous-graphes critiques qui modifient les k-plus proches voisins d'un nœud dans l'espace d'embedding via une recherche Monte Carlo Tree Search (MCTS). Évaluée sur GraphSAGE et DGI.

PapersRaisonnementÉvaluations
SIG
62
HYP
18
arXiv cs.AI·

Towards Robust Argumentative Essay Understanding via TIDE: An Interactive Framework with Trial and Debate

TIDE est un framework de prompt optimization basé sur un mécanisme de Trial and Debate pour améliorer la compréhension d'essais argumentatifs. Évalué sur trois tâches (Automated Essay Scoring, Argument Component Detection, Argument Relation Identification), il réduit l'impact des données bruitées et améliore la stabilité de l'optimisation.

Prompt engineeringRaisonnementÉvaluations
SIG
62
HYP
28