Page 45 sur 144

ToutHaut signalRécent
5722 articles
Reddit r/LocalLLaMA·

I accidentally crippled my 4x RTX 3090 LLM rig with a hidden PCIe 2.0 x4 slot and fixing it doubled Mistral 128B performance

Un utilisateur a découvert qu'une RTX 3090 était connectée à un slot PCIe 2.0 x4 caché sur sa carte mère Gigabyte X399, limitant les performances à 11 tok/s sur Mistral 128B. Après réorganisation des GPUs et configuration correcte du tensor-split, les performances ont doublé à 24,7 tok/s. Avertissement pour les builds multi-GPU sur cartes HEDT anciennes.

MistralLlamaInfrastructure
SIG
72
HYP
15
GitHub Trending·

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> yvgude /</span> lean-ctx

LeanCTX est un système d'exploitation de contexte local pour le développement IA. Un binaire unique compresse, mémorise, route et vérifie les tokens entre le code et le modèle. 63 outils MCP, 10 modes de lecture, jusqu'à 99% d'économies de tokens. Compatible Cursor, Claude Code, Copilot, Windsurf, Gemini.

MCPGénération de codeOutils
SIG
72
HYP
45
arXiv cs.CL·

Supportive Token Revealing for Fast Diffusion Language Model Decoding

AXON est un module sans entraînement pour améliorer le décodage parallèle des modèles de diffusion discrets. Il sélectionne les tokens « ancres » (tokens confiants) que les positions incertaines utilisent via attention, réduisant les étapes de débruitage tout en maintenant la qualité sur des benchmarks de raisonnement et génération de code.

Génération de codeRaisonnementBenchmarks
SIG
72
HYP
18
arXiv cs.LG·

ADAPTOOD: Uncertainty-Aware Fine-Tuning for Out-of-Distribution ECG Time Series Models

ADAPTOOD est un framework pour l'adaptation de modèles de séries temporelles ECG face à des décalages de distribution. Il utilise l'incertitude des données pour quantifier la sévérité du décalage et guide le fine-tuning avec des mises à jour low-rank et optimisation adaptative des hyperparamètres. Résultats : +7% de précision et +12,9% de précision sur les tâches OOD.

Fine-tuningRaisonnementÉvaluations
SIG
72
HYP
18
arXiv cs.LG·

A Geometric View of Counterfactual Behavior: Interaction of Boundary Proximity and Local Support

Étude géométrique des explications contrefactuelles dans les systèmes de ML modernes. Les chercheurs montrent que des modèles avec performances prédictives similaires peuvent différer substantiellement dans la faisabilité et la distance des changements contrefactuels, déterminées par la proximité de la frontière de décision et le support local des données.

ÉvaluationsSécurité IA
SIG
72
HYP
15
arXiv cs.LG·

Early Detection of Alzheimer's Disease Using Explainable Machine Learning on Clinical Biomarkers: A Multi-Class Classification Study Using the Alzheimer's Disease Neuroimaging Initiative (ADNI) Dataset

Modèle XGBoost pour la détection précoce d'Alzheimer en trois classes (cognition normale, déficit cognitif léger, Alzheimer) sur 1 641 sujets ADNI. AUC-ROC macro 0.983 en validation croisée, 0.982 sur test. SHAP identifie CDR Global comme prédicteur dominant pour NC/MCI, CDR-SB et MMSE pour AD.

ÉvaluationsBenchmarksPapers
SIG
72
HYP
18
arXiv cs.CL·

Computational conceptual history of scientific concepts: From early digital methods to LLMs

Article de synthèse situant les LLM dans l'histoire des méthodes computationnelles d'analyse conceptuelle en histoire, philosophie et sociologie des sciences. Examine les apports des LLM aux approches antérieures (méthodes numériques, approches distributionnelles, détection de changement sémantique lexical) et les défis méthodologiques persistants : construction de corpus, opérationnalisation, évaluation.

PapersBenchmarks
SIG
72
HYP
15
arXiv cs.CL·

Dynamic Infilling Anchors for Format-Constrained Generation in Diffusion Large Language Models

Dynamic Infilling Anchors (DIA) est une méthode sans entraînement pour les modèles de langage diffusion (dLLMs) qui ajuste dynamiquement les positions d'ancrage pour générer du contenu structuré (JSON, templates de raisonnement). Testé sur GSM8K et MATH, DIA améliore la conformité au format et la précision des réponses en évitant les spans rigides.

RaisonnementGénération de codeBenchmarks
SIG
72
HYP
25
arXiv cs.LG·

Stationarity-Aware Retrieval-Augmented Time Series Forecasting

SARAF, un framework de prévision de séries temporelles augmenté par récupération, adapte l'équilibre entre pertinence et diversité selon la stationnarité des données. Il sélectionne des segments historiques hétérogènes et agrège leurs futures de manière consciente de la non-stationnarité. Expériences sur 8 datasets réels montrent amélioration de précision et robustesse.

RAGBenchmarksPapers
SIG
72
HYP
18
arXiv cs.AI·

Toward Pre-Deployment Assurance for Enterprise AI Agents: Ontology-Grounded Simulation and Trust Certification

Framework de vérification pré-déploiement pour agents IA en entreprise combinant enveloppe opérationnelle, génération de scénarios basée ontologie et certificat de confiance. Pilote sur 4 secteurs régulés (Fintech, Banque, Assurance, Santé) générant 1 800 scénarios : couverture réglementaire de 48,3% vs 33,1% pour baseline persona (p=0,0006). Tests sur Claude Sonnet 4, Qwen 2.5 72B, Gemma 4 26B.

Agents IASécurité IAÉvaluations
SIG
72
HYP
18
arXiv cs.AI·

The Digital Apprentice: A Framework for Human-Directed Agentic AI Development

Le Digital Apprentice est un framework pour l'IA agentive qui calibre l'autonomie progressivement selon des preuves empiriques. L'agent internalise la méthodologie tacite d'un humain superviseur, escalade les niveaux d'autonomie par compétence, et corrige la dérive d'alignement en temps réel. Trois piliers : capture de méthodologie, autorisation avec escalade explicite, alignement continu.

Agents IAAlignementSécurité IA
SIG
72
HYP
28
arXiv cs.AI·

Simulate, Reason, Decide: Scientific Reasoning with LLMs for Simulation-Driven Decision Making

MechSim est un framework neuro-symbolique pour raisonner sur les mécanismes internes des simulateurs scientifiques intégrés aux systèmes LLM. Il représente les simulateurs via un schéma structuré capturant hypothèses, variables et dépendances, permettant aux agents LLM de générer des explications fondées sur les mécanismes plutôt que de traiter les simulateurs comme des boîtes noires.

RaisonnementAgents IAPapers
SIG
72
HYP
25
arXiv cs.AI·

Plan First, Judge Later, Run Better: A DMAIC-Inspired Agentic System for Industrial Anomaly Detection

DMAIC-IAD est un système multi-agent inspiré du framework DMAIC de gestion qualité pour la détection d'anomalies industrielles. Il planifie d'abord les stratégies via des procédures opérationnelles standardisées, puis utilise un modèle juge pré-entraîné pour évaluer les candidats sans exécution coûteuse. Amélioration de 37,76% sur les baselines agentic existants.

Agents IAMulti-agentsRaisonnement
SIG
72
HYP
25
arXiv cs.CL·

Self-Evolving Deep Research via Joint Generation and Evaluation

SCORE, un framework co-évolutif, couple un évaluateur et un générateur dans un processus d'apprentissage partagé pour améliorer la génération de rapports de recherche profonde. Un meta-harness contrôle dynamiquement l'environnement d'évaluation selon la performance du solveur, évitant la saturation d'optimisation observée avec les évaluateurs statiques.

RaisonnementReinforcement learningAgents IA
SIG
72
HYP
28
arXiv cs.CL·

SaliMory: Orchestrating Cognitive Memory for Conversational Agents

SaliMory est un framework d'entraînement pour agents conversationnels avec mémoire persistante. Il utilise une structure cognitive hiérarchique (faits utilisateur, préférences, mémoire de travail) et des récompenses décomposées par étape pour superviser les opérations mémoire (filtrage, consolidation, rappel). Résultats : -33% erreurs mémoire, +10% précision end-to-end, +100% taux de personnalisation.

Agents IAReinforcement learningRaisonnement
SIG
72
HYP
28
arXiv cs.LG·

When Offline Selectors Cannot Beat the Best Single Model: A Diagnostic Study on edX Dropout Prediction

Étude diagnostique sur les sélecteurs de modèles hors ligne pour la prédiction d'abandon sur edX. Les auteurs identifient trois causes d'échec (learner mal adapté, état non prédictif, label shift) via trois étapes : plafond oracle par k-NN, évaluation de BC/DQN/CQL, ablation de l'état. Sur 5 modèles, l'oracle gagne 9,7 points, mais les learners restent bloqués par ambiguïté représentationnelle locale.

ÉvaluationsReinforcement learningBenchmarks
SIG
72
HYP
15
arXiv cs.AI·

Consensus is Strategically Insufficient: Reasoning-Trace Disagreement as a Knowledge-Representation Signal

Les auteurs proposent un cadre pour les systèmes multi-agents où le désaccord entre agents est traité comme un signal informatif plutôt que comme une erreur à éliminer. Ils définissent quatre états de désaccord basés sur la similarité des traces de raisonnement et l'accord sur les conclusions, appliqués à la modération de contenu avec routage stratégique défaisable.

Multi-agentsRaisonnement
SIG
72
HYP
15