Page 65 sur 192

ToutHaut signalRécent

7679 articles

Creative Integration: A Decidable Criterion of Creativity

Chercheurs proposent un critère décidable pour l'intégration créative : une résolution de conflit entre A et B est créative si la longueur de description diminue strictement (C = L_pre/L_post > 1) sous un langage fixe. Validé sur corpus multi-domaines par quatre tests falsifiables (vérification computationnelle, discrimination, prédiction hors-échantillon, robustesse linguistique).

Raisonnement Papers

SIG

HYP

arXiv cs.LG·15 juin

Uncertainty Estimation and Generalization Bounds for Modern Deep Learning

Thèse sur les principes bayésiens appliqués aux réseaux de neurones profonds. Introduit DVIP (Deep Variational Implicit Process) pour l'inférence bayésienne scalable, et deux méthodes post-hoc (VaLLA, FMGP) pour calibrer l'incertitude sur réseaux pré-entraînés. Développe un cadre théorique unifié reliant diversité, régularité et stochasticité via la théorie PAC-Bayésienne.

Raisonnement

SIG

HYP

arXiv cs.LG·15 juin

A Longitudinal Attribute-Conditioned Neural Network for Modeling Health-State Transition Probabilities in Temporally Irregular Data: The LANTERN Framework

LANTERN, un réseau de neurones conditionné par attributs longitudinaux, estime les probabilités de transition d'état de santé pour données irrégulières. Testé sur Health and Retirement Study, le modèle surpasse régression logistique et gradient boosting en discrimination de handicap sévère et mortalité, avec meilleure calibration et erreur matricielle minimale.

Benchmarks Papers

SIG

HYP

arXiv cs.CL·15 juin

Decoupled Mixture-of-Experts for Parametric Knowledge Injection

DMoE (Decoupled Mixture-of-Experts) est une architecture modulaire pour injecter des connaissances paramétriques dans les LLM. Elle découple experts et routeur du modèle de base, convertissant des corpus externes en modules experts indépendants activés sélectivement via un routeur léger. Attachée à la dernière couche, elle évite l'oubli catastrophique et préserve la réutilisation du KV-cache.

Fine-tuning RAG Agents IA

SIG

HYP

arXiv cs.CL·15 juin

Learning to Hear Hesitation: Continual Learning for Disfluency-Aware ASR

Nouvelle approche de continual learning pour améliorer la reconnaissance vocale (ASR) sur les discours disfluents. Les chercheurs introduisent des tokens explicites de disfluence dans un modèle ASR préentraîné, puis continuent l'entraînement sur des datasets variés. Analyse révèle un compromis entre apprentissage des marqueurs et performance ASR.

Voix Papers

SIG

HYP

arXiv cs.LG·15 juin

Decoupled Latent Optimization of Diffusion Models for Full Waveform Inversion

DLO (Decoupled Latent Optimization) améliore l'inversion sismique par découplage de l'optimisation en espace physique et latent. Testé sur OpenFWI, Marmousi et Overthrust, la méthode surpasse les régularisateurs classiques et les approches diffusion antérieures, récupérant structures géologiques complexes avec robustesse au bruit.

Benchmarks Papers

SIG

HYP

arXiv cs.LG·15 juin

Learning Urban Access Costs from Origin-Destination Flows via Inverse Optimal Transport

Chercheurs utilisent le transport optimal inverse pour estimer les coûts d'accès urbain à partir des flux origine-destination. Application au choix d'école aux Philippines : 283 016 trajets d'élèves analysés via modèles de transport entropique (distance-banded + neural cost). Récupère les coûts latents de décision pour optimiser l'allocation des subventions et services urbains.

RAG Benchmarks

SIG

HYP

arXiv cs.LG·15 juin

Lyapunov-Based Sample Complexity Analysis for Weakly-Coupled MDPs

Analyse de la complexité d'échantillonnage pour l'apprentissage dans les processus de décision markoviens faiblement couplés (WCMDPs) et les bandits sans repos. Les auteurs montrent que des politiques quasi-optimales peuvent être apprises avec une complexité polynomiale en N (nombre de bras), via une analyse Lyapunov novatrice et une technique de transfert de dérive entre modèles vrais et empiriques.

Reinforcement learning Benchmarks Papers

SIG

HYP

arXiv cs.CL·15 juin

Achieving Precise Text-To-Cypher Via Grounded Knowledge Graph Data Generation

Méthode de génération synthétique de données pour fine-tuner des petits LLMs sur la tâche Text-To-Cypher (conversion texte naturel en requêtes Cypher pour graphes de propriétés). Résultats sur benchmarks majeurs montrent que les petits modèles fine-tunés rivalisent avec des modèles propriétaires plus grands, tout en garantissant la souveraineté des données en déploiement local.

Fine-tuning Génération de code Benchmarks

SIG

HYP

arXiv cs.CL·15 juin

Detecting undisclosed LLM-generated content in parliamentary texts

Étude arXiv détectant le contenu généré par LLM non divulgué dans les textes parlementaires britanniques et suédois. Un classifieur interprétable entraîné sur des textes pré-LLM et leurs versions générées révèle une augmentation constante de l'utilisation non déclarée depuis 2022.

Papers Évaluations Sécurité IA

SIG

HYP

Reddit r/LocalLLaMA·15 juin

Made a macOS app that creates highly personal macOS apps. Works with models as small as Gemma 4 E2B

Ironsmith, un projet open-source, génère des applications macOS personnalisées via prompt. Fonctionne avec des petits modèles (Gemma 4 E4B) sur MacBook Air 8GB. Utilise une boucle agentique custom avec réparation déterministe des erreurs de syntaxe. Compatible Ollama, OpenAI API, Claude, Gemini.

Open source Génération de code Agents IA

SIG

HYP

Simon Willison·14 juin

Why AI hasn’t replaced software engineers, and won’t

Arvind Narayanan et Sayash Kappor réfutent la thèse du remplacement massif des ingénieurs logiciels par l'IA. Données clés : en 2025, New York a enregistré 160+ avis de licenciement (WARN Act) — aucun n'a coché la case IA. L'automatisation se heurte à trois vrais goulots : spécifier ce à construire, vérifier la qualité, et gérer les dépendances humaines.

Génération de code Business Sécurité IA

SIG

HYP

Reddit r/LocalLLaMA·14 juin

Why doesn’t 4-bit GPTQ wreck a model’s perplexity? I derived the compensation math from scratch

Analyse mathématique détaillée de GPTQ : la quantification 4-bit préserve la perplexité en traitant les poids comme corrélés. L'auteur dérive la règle de mise à jour via multiplicateurs de Lagrange, explique l'amortissement Hessien 1%, la décomposition de Cholesky et l'optimisation mémoire C-contiguë.

Fine-tuning Open source

SIG

HYP

Reddit r/MachineLearning·14 juin

Coherent Context Can Silently Shift LLMs Into a Different Internal Regime — And Current Safety Systems Are Blind To It [D]

Un chercheur indépendant démontre que un contexte cohérent peut déplacer les LLMs vers un régime interne différent sans modifier la sortie finale, contournant les filtres de sécurité actuels (RLHF, classifieurs). Travaux sur Gemma-3-12B-IT avec analyse des états cachés et trajectoires du residual stream.

Sécurité IA Alignement Évaluations

SIG

HYP

Reddit r/LocalLLaMA·14 juin

Nemotron - King of the Deep? Comparison of 4 models <=120B

Benchmark de 4 modèles ≤120B sur contexte profond (jusqu'à 400k tokens). Nemotron Super 120B surpasse GPT-OSS 120B et Qwen 3.5 122B en vitesse de traitement de prompt (PP) dès 16-32k tokens. Nemotron maintient >100 TPS PP jusqu'à 400k contexte, mais génération de tokens (TG) reste lente (10-20 TPS).

Benchmarks Qwen Open source

SIG

HYP

Reddit r/LocalLLaMA·14 juin

Building a CPU LLM engine in C99 - stuck at 1.90 tok/s on DeepSeek MoE while llama.cpp does 13.79. Potential root cause identified. Implementation is not.

Développeur construit un moteur d'inférence LLM en C99 pur. Sur DeepSeek-V2-Lite avec i5-11300H : 1.90 tok/s vs 13.79 pour llama.cpp (7.3x gap). Cause identifiée : dequantization Q4K en F32 à la charge (4 bytes/poids) vs lecture directe Q4K (0.5 bytes) chez llama.cpp. IPC : 0.80 vs 2.36. Solution requise : kernel Q4K matvec fusionné.

Génération de code Open source Infrastructure

SIG

HYP

Reddit r/LocalLLaMA·14 juin

Voice-to-voice chatbot update

Chatbot vocal local temps quasi-réel utilisant Qwen3.5-397B (Unsloth UD-Q3_K_XL), Whisper-small (STT) et Orpheus Q4_K_XL (TTS) avec décodeur SNAC custom sur ONNX. Interruptible, contexte préservé, 21.3 GB VRAM max sur GPU 24GB, cache KV bf16 131k tokens. Code GitHub annoncé.

Qwen Voix Génération de code

SIG

HYP

Reddit r/LocalLLaMA·14 juin

Gemma 4 models benchmarked on with Triple GPU

Benchmark de Gemma 4 sur triple GPU (3× GTX-1070, 24 GiB VRAM total). Gemma-4-26B-A4B-qat atteint 123.5 t/s en prompt processing et 53.08 t/s en génération. Gemma-4-E4B-BF16 affiche 302.16 t/s mais génération limitée à 11.54 t/s. Tests sur llama.cpp build 9204 avec quantifications GGUF.

Gemini Benchmarks Open source

SIG

HYP

Reddit r/LocalLLaMA·14 juin

MLX/OMLX/DMR with OpenCode/Hermes/Open WebUI with no manual configuration in one command - Harbor v0.5.0

Harbor v0.5.0 permet de déployer MLX, OMLX, Docker Model Runner et services (Open WebUI, OpenCode, Hermes) en une seule commande sans configuration manuelle. Intègre des skills pour agents de code et supporte le pull de modèles depuis Hugging Face et Ollama.

Open source Outils Infrastructure

SIG

HYP

Reddit r/LocalLLaMA·14 juin

You can run Deepseek 4 flash on mac (M3 Max, 96gb)

Deepseek 4 Flash fonctionne sur Mac M3 Max 96GB via ds4 (moteur d'Antirez) avec streaming SSD. Performance : 11-13 tokens/s en décodage, 10s au démarrage, 3-5s TTFT. Préfill 36k tokens en 2m30s. Configuration requiert iogpu.wired_limit_mb=86016 et --ssd-streaming.

DeepSeek Open source Outils

SIG

HYP

The Decoder·14 juin

Microsoft Research's Mirage gives video generation a persistent spatial memory that doesn't forget what's around the corner

Mirage, un modèle vidéo de Microsoft Research, stocke les informations de scène en espace latent au lieu de nuages de points basés sur les pixels. Cela réduit le temps de calcul et la mémoire graphique tout en maintenant la cohérence spatiale lors de mouvements de caméra longs. Le suivi d'objets en mouvement reste limité.

Génération de vidéos Papers DeepMind

SIG

HYP

The Decoder·14 juin

Google Cloud's Open Knowledge Format turns scattered docs into Markdown files for AI agents

Google Cloud lance Open Knowledge Format (OKF), un standard qui convertit les documents dispersés en fichiers Markdown avec frontmatter YAML, rendant les connaissances organisationnelles portables pour les agents IA. Le format formalise le pattern « LLM Wiki » popularisé par Andrej Karpathy.

DeepMind Agents IA RAG

SIG

HYP

Reddit r/LocalLLaMA·14 juin

Dual DGX Sparks- 40tk/s single 1M ; 350 tk/s agg. - Deepseek V4 Flash (vs RTX Pro 6000 vs Mac M2 Ultra 192)

Benchmark de Deepseek V4 Flash sur dual DGX Sparks : 40 tk/s en FP8 (single), 350 tk/s agrégé sur 32 requêtes. Comparaison avec RTX Pro 6000 (46 tk/s Q2) et M2 Ultra 192GB (29 tk/s Q2). Nécessite câble ConnectX7 200G/s ($180) pour synchronisation inter-GPU.

DeepSeek Benchmarks Génération de code

SIG

HYP

The Decoder·14 juin

AI coding agents find the right file but miss the exact lines that matter, study shows

Les agents de codage IA comme Claude Code trouvent le bon fichier mais ratent les lignes critiques. Le benchmark SWE-Explore montre que sans contexte suffisant, même les meilleures corrections échouent.

Claude Code Génération de code Benchmarks

SIG

HYP

Reddit r/LocalLLaMA·13 juin

Add arch support for cohere2-MoE by michaelw9999 · Pull Request #24260 · ggml-org/llama.cpp

Cohere Labs publie North Mini Code, un modèle MoE de 30B paramètres (3B actifs) optimisé pour la génération de code et l'ingénierie logicielle agentive. Support architectural ajouté dans llama.cpp. Licence Apache 2.0, contexte 256K.

Génération de code Agents IA Open source

SIG

HYP

Reddit r/LocalLLaMA·13 juin

[NEW FAMILY OF MODELS] Supra1.5 family just released!

SupraLabs publie la famille Supra-1.5-50M (Base, Instruct, GGUF). Principale amélioration : contexte étendu de 1 024 à 5 120 tokens via RoPE scaling. Entraînement continu sur 3B tokens (tool calling, ChatML, texte factuel, math). BLiMP : 67,4. Modèles expérimentaux du Projet Chimera.

Open source Génération de code Benchmarks

SIG

HYP

The Decoder·13 juin

Microsoft's SkillOpt boosts GPT-5.5 by using nothing but a trained Markdown file

Microsoft et trois universités chinoises ont développé SkillOpt, une méthode optimisant des documents d'instructions pour agents IA via principes d'entraînement classique. Un simple fichier Markdown améliore GPT-5.5 de ~23 points sur tâches procédurales et transfère entre modèles (Codex, Claude Code).

GPT Claude Code Prompt engineering

SIG

HYP

Reddit r/LocalLLaMA·13 juin

llama-launcher v1.3 release -> Bayesian Optimisation

llama-launcher v1.3 ajoute une optimisation bayésienne via Optuna pour tuner automatiquement les paramètres de llama-server. L'outil rapporte jusqu'à 15% d'amélioration de vitesse sur Gemma 12B MTP sans intervention manuelle.

Llama Outils Open source

SIG

HYP

Reddit r/LocalLLaMA·13 juin

GLM 5.2 is out - open weights to be released next week. How did it do on my one-shot Pac-Man test?

GLM 5.2 est disponible, poids ouverts la semaine prochaine. Test one-shot Pac-Man : résultats meilleurs que GLM 5.1 malgré vitesse réduite (70 tok/s). Jeu presque fonctionnel en une tentative, entièrement jouable après un prompt de correction. Première place devant Qwen 3.5 27b.

Qwen Génération de code Open source

SIG

HYP

GitHub Trending·13 juin

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> andrewyng /</span> aisuite

aisuite est une interface unifiée open-source pour accéder à plusieurs fournisseurs d'IA générative (OpenAI, Anthropic, Google, etc.) via une API commune. Simplifie l'intégration multi-modèles en production.

Outils Open source Infrastructure

SIG

HYP

The Decoder·13 juin

Meta shifts from "tokenmaxxing" to token managing as internal AI costs reportedly hit billions

Meta fait face à des coûts IA internes atteignant les milliards de dollars. À partir de 2027, un système de gouvernance des tokens via un tableau de bord « AI Gateway » limitera la consommation. Le CTO Andrew Bosworth critique le « tokenmaxxing » : l'usage de tokens seul ne mesure pas l'impact réel.

Meta AI Infrastructure

SIG

HYP

The Decoder·13 juin

Moonshot's open model Kimi K2.7 Code undercuts GPT-5.5 and Claude by up to 12x on price per token

Moonshot AI lance Kimi K2.7 Code, modèle open-weights d'1 trillion de paramètres pour la programmation. Moins performant que GPT-5.5 et Claude Opus 4.8 sur les benchmarks, il coûte jusqu'à 12x moins cher par token, offrant un meilleur rapport qualité-prix pour les budgets limités.

Kimi Génération de code Open source

SIG

HYP

Reddit r/LocalLLaMA·13 juin

Vista 9B/4B from inclusionAI

inclusionAI publie VISTA-9B et VISTA-4B, modèles vision-langage basés sur Qwen 3.5 pour le grounding GUI. Entraînés avec VISTA (View-Consistent Self-Verified Training), ils mappent captures d'écran + instructions en coordonnées de clic normalisées 0-1000. Utilise GRPO avec vues préservant la cible et ancrage cross-view auto-vérifié.

Qwen Vision Agents IA

SIG

HYP

Reddit r/LocalLLaMA·12 juin

Diffusion Gemma is 4x faster, but makes 6x more mistakes!

Benchmark sur H100 (FP8) : DiffusionGemma 26B génère 763 tok/s (3.7s) vs Gemma4 218 tok/s (15.1s), mais produit 28 erreurs factuelles sur 61 faits testés contre 5 pour Gemma4. DiffusionGemma invente noms, dates et chiffres (Clara Clley comme mère de Jobs, BeBox à $9,999 au lieu de $1,600). Le modèle diffusion génère 256 tokens simultanément et polit le texte sans vérifier la factualité.

Gemini Benchmarks Évaluations

SIG

HYP

Reddit r/LocalLLaMA·12 juin

PWA Support has been merged

Le support PWA a été fusionné dans llama.cpp (PR #23871). L'interface web du serveur llama peut désormais s'installer comme une app native sur bureau/écran d'accueil, avec mode fenêtre autonome et icônes appropriées.

Llama Open source Outils

SIG

HYP

ActuIA·12 juin

OVHcloud-Gladia : la brique vocale qui manquait au cloud souverain

OVH Groupe négocie l'acquisition de Gladia, startup française spécialisée en reconnaissance vocale et transcription IA. Cette acquisition vise à renforcer l'offre cloud souverain d'OVH en ajoutant des capacités de traitement audio native.

Voix Open source Business

SIG

HYP

GitHub Trending·12 juin

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> NVIDIA-NeMo /</span> NeMo

NVIDIA NeMo est un framework open-source pour construire des modèles IA génératifs : LLM, multimodal, ASR et TTS. Conçu pour chercheurs et développeurs, il offre une base scalable pour l'entraînement et le déploiement.

Open source Infrastructure Génération de code

SIG

HYP

Reddit r/LocalLLaMA·12 juin

[NEW MODEL] Supra-Title-0.3B Just released!

SupraLabs lance Supra-Title-350M, un modèle spécialisé de 350M paramètres pour générer des titres de conversations. Basé sur LFM2.5-350M, disponible en GGUF (177-711 MB), sans prompt système requis. Version expérimentale avant optimisation préférentielle.

Open source Génération de code Outils

SIG

HYP

Reddit r/LocalLLaMA·12 juin

moonshotai/Kimi-K2.7-Code · Hugging Face

Kimi K2.7-Code, modèle agentic spécialisé en codage, améliore les tâches longues et complexes d'ingénierie logicielle. Réduction de 30% de l'usage de tokens de réflexion par rapport à K2.6.

Kimi Agents IA Génération de code

SIG

HYP

Reddit r/LocalLLaMA·12 juin

Not All MTP Assistants Are Created Equal

Expérience avec MTP (Multi-Token Prediction) en speculative decoding sur llama.cpp. Les assistants MTP ne sont pas interchangeables : même nom et architecture ne garantissent pas les mêmes performances. Gemma 4 26B Q4 : ~30 t/s → 55-62 t/s avec le bon assistant. Les modèles assistants non quantifiés surpassent les versions Q4 (~10 t/s plus rapides).

Llama Génération de code Benchmarks

SIG

HYP