Page 55 sur 146

ToutHaut signalRécent
5830 articles
Reddit r/LocalLLaMA·

I built an enforcement layer for AI coding agents using a local knowledge graph and hybrid RAG

Writ est une couche d'application pour agents de codage IA utilisant un graphe de connaissances Neo4j local et RAG hybride. Un pipeline de récupération en 5 étapes (BM25, similarité vectorielle HNSW, traversée de graphe, fusion de rangs réciproques) filtre les règles pertinentes. 30 scripts bash appliquent l'exécution : pas de code sans plan approuvé, tests obligatoires, analyse statique requise.

Agents IAGénération de codeRAG
SIG
72
HYP
25
Reddit r/MachineLearning·

Kept context-switching between arxiv, OpenReview, GitHub, and HuggingFace for every paper, so I built this. Chrome extension + website with everything inline, plus citation graph + SPECTER2 neighbors. 3M papers, free, feedback welcome [P]

Tomesphere : extension Chrome + site web indexant 3M papiers arxiv avec résumés LLM, avis OpenReview, repos GitHub, modèles HuggingFace, graphe de citations et voisins SPECTER2. Gratuit, sans inscription.

PapersOutilsOpen source
SIG
72
HYP
35
arXiv cs.LG·

Balancing Fidelity and Diversity in Diffusion Models via Symmetric Attention Decomposition: Hopfield Perspective

Article théorique décomposant la matrice d'attention pré-softmax en composantes symétrique et antisymétrique. La partie symétrique gouverne le paysage énergétique, la partie antisymétrique pilote la circulation. Les auteurs proposent des mesures de stabilité Hopfield pour quantifier la fidélité-diversité en génération et un contrôle pour moduler ce compromis.

RaisonnementPapersVision
SIG
72
HYP
15
arXiv cs.LG·

Resource-Constrained Affect Modelling via Variance Regularisation Pruning

Variance-Regularised Pruning (VR) est une méthode de compression de modèles pour l'affective computing qui priorise la stabilité inter-utilisateurs plutôt que la seule parcimonie. Testée sur le dataset AGAIN (9 environnements de jeu), VR maintient des performances CCC compétitives à 80% de sparsité sans fine-tuning supplémentaire, adaptée aux systèmes embarqués.

ÉvaluationsFine-tuningPapers
SIG
72
HYP
15
arXiv cs.LG·

Detect by Yourself: Self-Designing Agentic Workflows for Few-Shot Graph Anomaly Detection

SignGAD propose un framework d'agents auto-configurables pour la détection d'anomalies en graphes avec peu d'exemples. Au lieu d'utiliser un détecteur fixe, le système conçoit des workflows adaptés à chaque tâche en sélectionnant encodages et designs de détecteurs appropriés. Une stratégie de refit gardée affine les workflows sélectionnés sous supervision limitée.

Agents IABenchmarksPapers
SIG
72
HYP
28
arXiv cs.LG·

Comparative Analysis of Liquid Neural Networks and LSTM for Sequential Pattern Recognition: Robustness, Efficiency, and Clinical Utility

Étude comparative entre réseaux de neurones liquides (LNN/CfC) et LSTM sur quatre modalités séquentielles (N-MNIST, QuickDraw, IAM, PhysioNet Sepsis-3). Les LNN modélisent l'évolution de l'état caché comme équation différentielle continue. Résultats : LNN surpassent LSTM en efficacité paramétrique et robustesse face aux données manquantes, particulièrement en domaines cliniques.

BenchmarksRaisonnement
SIG
72
HYP
18
arXiv cs.LG·

$E^3$-Agent: An Executable and Evolving Agent for Resource Management of Edge Generative Inference

E³-Agent est un agent IA exécutable et adaptatif pour la gestion des ressources d'inférence générative sur edge. Il combine un routeur rapide (décisions en millisecondes) et un contrôleur LLM lent piloté par événements, apprenant en ligne des retours d'exécution. Évalué en simulation, il réduit la latence de 65-73% vs baselines statiques sur scénarios dynamiques (sémantique, churn, drift).

Agents IARaisonnementInfrastructure
SIG
72
HYP
28
arXiv cs.LG·

Metric-Aware PCA as a Linear Instance of Geometric Deep Learning

Article théorique positionnant l'Analyse en Composantes Principales Métrique-Consciente (MAPCA) dans le cadre du deep learning géométrique. MAPCA paramétre l'ACP par une matrice métrique définie positive, avec solutions équivariantes sous le groupe orthogonal préservant la métrique. Un théorème d'unicité caractérise l'ACP Invariante comme unique métrique linéaire équivariante sous rescaling diagonal.

PapersRaisonnement
SIG
72
HYP
15
arXiv cs.LG·

Architecture-driven Shift: towards a lightweight selector for capturing the trends of logit shift

Nouvelle métrique Architecture-driven Shift (ADS) pour sélectionner efficacement les modèles pré-entraînés en apprentissage continu. ADS décompose le logit shift en dépendances architecturales et données, révélant que la combinaison capture bien la tendance du logit shift avec peu d'échantillons. Validation sur 175+ architectures avec corrélation Spearman ≥0.731.

Reinforcement learningBenchmarksPapers
SIG
72
HYP
18
arXiv cs.AI·

Hierarchical Prompt-Domain Control and Learning for Resource-Constrained Agentic Language Models

Framework hiérarchique pour LLMs compacts en systèmes agentiques sous contraintes (mémoire, latence, coût). Distillation du modèle + boucle oracle-contrôleur qui valide les protocoles, projette l'historique dans un domaine de prompt viable, et déclenche du fine-tuning léger. Séparation entre apprentissage du schéma et adaptation sémantique. Évaluation sur Multi-Fidelity Bayesian Optimization.

Agents IAFine-tuningPrompt engineering
SIG
72
HYP
18
arXiv cs.AI·

Soro: A Lightweight Foundation Model and Chatbot for Tajik

Soro est une famille de modèles de langage spécialisés en tadjik, basée sur Gemma 3, entraînée sur 1,9 milliard de tokens tadjiks (web, PDF, matériel éducatif). Après fine-tuning supervisé sur 40K exemples, Soro surpasse Gemma 3 sur des benchmarks tadjiks créés par les auteurs et conserve les performances en anglais. Quantification FP8/INT4 validée pour déploiement edge en milieu scolaire.

GeminiFine-tuningBenchmarks
SIG
72
HYP
18
arXiv cs.LG·

Supervised Distributional Reduction via Optimal Transport and Dependence Maximization

SDR (Supervised Distributional Reduction) combine le transport optimal et la maximisation de dépendance pour apprendre des représentations cibles. L'algorithme étend l'objectif Fused Gromov-Wasserstein avec un terme de dépendance explicite, produisant des embeddings compacts qui capturent structure géométrique et signal prédictif. Application aux processus gaussiens avec noyaux adaptatifs.

Papers
SIG
72
HYP
15
arXiv cs.LG·

Can Entry-Wise Clipping Give Spectral Control of Stochastic Gradients?

Article théorique sur le contrôle spectral du bruit de gradient stochastique via clipping entrée-par-entrée. Montre qu'une méthode simple d'écrêtage entrée-par-entrée peut équilibrer structure matricielle et coût computationnel, avec garanties de convergence O(ε⁻⁴) sous bruit Cauchy-contaminé. Gains empiriques : ~7% de tokens économisés sur NanoGPT avec shrinkage lisse, ~2% supplémentaires combiné avec Muon.

PapersReinforcement learningBenchmarks
SIG
72
HYP
15
arXiv cs.LG·

SparseOpt: Addressing Normalization-induced Gradient Skew in Sparse Training

SparseOpt, un optimiseur conscient de la parcimonie, résout le problème de gradient asymétrique induit par la normalisation par batch en entraînement sparse dynamique. Tests sur ResNet (CIFAR-100, ImageNet) montrent convergence plus rapide et meilleure généralisation. Première étude systématique de l'interaction entre Batch Normalization, couches sparse et DST.

PapersBenchmarksFine-tuning
SIG
72
HYP
18
arXiv cs.LG·

Faster Thermal Profiling of a Lunar Rover with Machine Learning Adapted Finite Difference Model

Un framework de machine learning informé par la physique (PIML) pour modéliser thermiquement un rover lunaire. Un réseau de neurones adaptatif détermine le maillage 3D en différences finies selon les charges thermiques, améliorant la précision de 50% vs modèles coarse-mesh et 39% vs ANN pur, tout en étant 3x plus rapide que les simulations haute-fidélité.

RaisonnementBenchmarksRobotique
SIG
72
HYP
15
arXiv cs.LG·

Transferable Reinforcement Learning via Probabilistic Latent Embeddings and Dynamic Policy Adaptation for Sim-to-Real Deployment

Framework RL pour transfert de politique sim-to-real via embeddings latents probabilistes et adaptation dynamique. Utilise meta-RL et CMDPs pour inférer la représentation latente de l'environnement, avec formulation distributional RL ajustant dynamiquement les niveaux de risque selon la précision d'estimation du contexte latent.

Reinforcement learningRobotiqueSécurité IA
SIG
72
HYP
18