Page 119 sur 192

ToutHaut signalRécent

7679 articles

Friends Don’t Let Friends Use Ollama — So I Built Anvil

Anvil, un wrapper open-source autour de llama.cpp, propose une alternative à Ollama avec transparence accrue : fichiers GGUF lisibles, flags visibles avant exécution, gestion de flotte locale, intégration Hugging Face et support MCP. Construit pour retrouver la simplicité locale-first perdue par Ollama.

Open source Outils Llama

SIG

HYP

Hacker News (AI)·6 juin

Police in England and Wales told to halt AI use in court statements

Les autorités policières en Angleterre et au Pays de Galles ont reçu l'ordre de cesser d'utiliser l'IA pour rédiger les déclarations judiciaires. Cette directive intervient après des préoccupations concernant la fiabilité et la responsabilité légale des textes générés par IA dans les procédures judiciaires.

Régulation Sécurité IA Alignement

SIG

HYP

GitHub Trending·6 juin

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> Shubhamsaboo /</span> awesome-llm-apps

Awesome-llm-apps : collection de 100+ applications d'agents IA et RAG prêtes à l'emploi. Clonables, personnalisables et déployables directement.

Agents IA RAG Open source

SIG

HYP

The Decoder·6 juin

Sakana AI bets AI that improves itself can break the compute arms race of frontier labs

Sakana AI, co-fondée par Llion Jones (co-auteur de Transformer), lance un laboratoire dédié à l'amélioration récursive : des IA qui s'améliorent itérativement. La startup japonaise voit cette approche comme alternative à la course aux ressources de calcul des grands labs US. Anthropic alerte sur les risques de contrôle.

Raisonnement Alignement Sécurité IA

SIG

HYP

GitHub Trending·6 juin

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> khoj-ai /</span> khoj

Khoj est une plateforme open-source d'IA auto-hébergeable permettant de créer des agents personnalisés, d'accéder à des documents locaux ou web, et d'automatiser des tâches. Compatible avec GPT, Claude, Gemini, Llama, Qwen, Mistral.

Agents IA Open source RAG

SIG

HYP

The Decoder·6 juin

Meta's Hatch AI agent could cost up to $200 a month and marks its first paid AI product

Meta développe Hatch, un agent IA payant pouvant coûter jusqu'à 200$/mois. L'outil exécute des tâches (création d'outils, planification, emails) à partir de descriptions en langage naturel. Premier produit IA payant de Meta, destiné à diversifier les revenus au-delà de la publicité.

Agents IA Meta AI Business

SIG

HYP

Reddit r/LocalLLaMA·6 juin

DeepSeek V4 Flash is amazing! (WIP llama.cpp PR #24162)

DeepSeek V4 Flash obtient le support llama.cpp via PR #24162 en phase précoce. Le modèle combine intelligence frontière, robustesse à la quantization (FP4-FP8 natif) et efficacité KV cache. Actuellement 5-6 tokens/s, GPU/FA en développement, mais correctness validée.

DeepSeek Open source Infrastructure

SIG

HYP

The Decoder·6 juin

OpenAI and the Trump administration are negotiating a government stake in the AI startup

OpenAI et l'administration Trump négocient une participation gouvernementale directe dans la startup. Un « Public Wealth Fund » verserait les dividendes aux citoyens américains. Le sénateur Bernie Sanders propose une taxe de 50% sur les actions IA. Les critiques craignent un scénario « too big to fail » similaire à 2008.

OpenAI Régulation Business

SIG

HYP

Simon Willison·6 juin

micropython-wasm 0.1a2

Sortie de micropython-wasm 0.1a2 avec ajout d'une CLI. Permet d'exécuter du code Python dans un environnement sandboxé WebAssembly.

Open source Génération de code

SIG

HYP

arXiv cs.AI·6 juin

When Should We Protect AI? A Precautionary Framework for Consciousness Uncertainty

Un cadre précautionnaire pour évaluer les obligations morales envers les systèmes IA potentiellement conscients. Propose cinq dimensions (conscience phénoménale, valence affective, conscience métacognitive, récit de soi, agentivité) avec seuils binaires et gradation continue. Appliqué à Replika et OpenClaw, architecture-agnostique.

Sécurité IA Alignement Papers

SIG

HYP

Reddit r/LocalLLaMA·5 juin

PSA: Gemma 4 12B is NOT completely broken for coding and tool calling, you need a special chat template

Gemma 4 12B nécessite un fichier de chat template spécifique pour fonctionner correctement en tool calling et coding. Sans cette configuration, les appels d'outils échouent systématiquement. Le template correct permet une évaluation fiable des capacités du modèle avec llama.cpp.

Gemini Génération de code Outils

SIG

HYP

Reddit r/LocalLLaMA·5 juin

Gemma 4 QAT GGUFs from Unsloth

Unsloth publie des versions quantifiées (QAT) de Gemma 4 au format GGUF sur Hugging Face. La collection inclut un guide détaillé sur l'optimisation du modèle.

Gemini Open source Outils

SIG

HYP

Reddit r/LocalLLaMA·5 juin

Gemma 4 with quantization-aware training

Google publie Gemma 4 avec quantization-aware training (QAT). Collections disponibles sur Hugging Face : modèles Q4_0 et versions mobiles par Google, plus collections Unsloth.

Gemini Open source

SIG

HYP

The Decoder·5 juin

Satya Nadella publicly torches a VP's plan to make Microsoft's AI agent deliberately addictive

Satya Nadella critique publiquement un mémo interne proposant de rendre l'agent IA Scout volontairement addictif. Le PDG de Microsoft affirme que l'IA doit autonomiser les utilisateurs et réduire le temps d'écran, non l'augmenter.

Agents IA Sécurité IA Business

SIG

HYP

GitHub Trending·5 juin

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> openai /</span> plugins

Dépôt GitHub officiel OpenAI pour les plugins. Contient documentation, exemples et ressources pour développer des extensions compatibles avec ChatGPT et les modèles OpenAI.

OpenAI Outils Open source

SIG

HYP

GitHub Trending·5 juin

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> CopilotKit /</span> CopilotKit

CopilotKit est un framework frontend pour construire des interfaces utilisateur génératives avec agents IA. Supporte React et Angular, propose le protocole AG-UI.

Agents IA Génération de code Outils

SIG

HYP

GitHub Trending·5 juin

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> vllm-project /</span> vllm-omni

vLLM-Omni étend le framework vLLM pour supporter l'inférence efficace de modèles omnimodaux (texte, vision, audio). Optimisation des performances et gestion mémoire pour déploiement en production.

Open source Infrastructure Vision

SIG

HYP

Hacker News (AI)·5 juin

We spent $50 to measure Pearl's "AI mining" – 320K GPUs produce zero AI

Pearl, une plateforme d'« AI mining », a été testée avec un budget de 50 $. Résultat : 320 000 GPU n'ont produit aucun résultat IA mesurable. L'article remet en question la viabilité du modèle commercial.

Business Infrastructure

SIG

HYP

Reddit r/LocalLLaMA·5 juin

Benchmark & Reality Check on Gemma 4 12B: Great model, but your local settings are probably breaking it (Fix inside)

Benchmark de Gemma 4 12B sur un test de détection de bugs Python. Le modèle trouve 6 bugs vs 14 pour Qwen 35B. Les paramètres par défaut de LM Studio désactivent le reasoning. Solution : activer enable_thinking dans le template Jinja, configurer les tokens de pensée (<|channel>thought / <channel|>), et utiliser température 1.0, top_p 0.95, top_k 64.

Gemini Benchmarks Raisonnement

SIG

HYP

Reddit r/MachineLearning·5 juin

Are We Underestimating Small Edge AI Models?[D]

Un développeur a créé un module Edge AI de moins de 5 MB pour reconnaître le morse manuscrit et imprimé sur Android, fonctionnant entièrement hors ligne avec LiteRT. Le projet soulève la question de l'intérêt des petits modèles spécialisés face à la tendance dominante des LLM locaux plus volumineux.

Vision

SIG

HYP

Le Big Data·5 juin

Oups, Meta cache du code de reconnaissance faciale dans son appli IA

Wired découvre du code de reconnaissance faciale caché dans l'application IA de Meta. Le code n'était pas documenté publiquement, soulevant des questions sur la transparence de Meta concernant ses capacités de vision et ses pratiques de collecte de données.

Meta AI Vision Sécurité IA

SIG

HYP

Reddit r/LocalLLaMA·5 juin

PSA: You may not need to quantize spec draft when using MTP

Quantifier le spec draft dans llama.cpp avec MTP réduit la taille de contexte disponible. Avec q4_0, le contexte passe de 91648 tokens (fp16 par défaut) à 83200 tokens. Le développeur am17an a confirmé ce comportement contre-intuitif.

Open source Outils

SIG

HYP

Reddit r/LocalLLaMA·5 juin

hello there! i made a tool to explore kokoro.

Développeur crée un outil d'exploration pour Kokoro avec code MIT. Repo GitHub (brosoundml) + modèles HuggingFace disponibles. Binaires Windows CPU/CUDA fournis. Auteur envisage d'étendre à d'autres modèles.

Open source Outils Voix

SIG

HYP

Hacker News (AI)·5 juin

Magenta RealTime 2: Open and Local Live Music Models

Google Magenta RealTime 2 : modèles de musique en direct open-source et locaux. Génération musicale temps réel sans serveur cloud, exécution sur machine locale.

DeepMind Open source Outils

SIG

HYP

Reddit r/LocalLLaMA·5 juin

Magenta RealTime 2: Open & Local Live Music Models

Google Magenta RealTime 2 propose des modèles musicaux open-source et locaux pour générer de la musique en temps réel sur ordinateur portable. Permet de construire et jouer des instruments IA sans connexion cloud.

Open source Outils DeepMind

SIG

HYP

Reddit r/LocalLLaMA·5 juin

Qwen 3.6 35B on RTX 3080 10GB + 7700X + 32GB DDR5

Utilisateur teste Qwen 3.6 35B sur RTX 3080 10GB + Ryzen 7700X. Atteint 1400t/s en prefill et 26t/s en génération avec contexte 131k tokens. Configuration optimisée pour recherche et traitement documentaire avec llama.cpp.

Qwen Open source Infrastructure

SIG

HYP

Reddit r/LocalLLaMA·5 juin

Hi Reddit, I posted my Build Your Own LLM workshop to Youtube (GPT2 & Qwen3.6 style)

Atelier complet sur YouTube couvrant la construction d'un LLM de zéro (style GPT-2 & Qwen 3.6) sans prérequis mathématiques. Contenu : fondamentaux ML, transformers, architecture neuronale, tokenization, attention, pre-training, instruction tuning, RL. Format : slides + exemples Excel + code PyTorch/CUDA.

Génération de code Fine-tuning Reinforcement learning

SIG

HYP

Reddit r/MachineLearning·5 juin

Scrap the LLMs. Scoring 4.76% on the brand new ARC-3 using pure code, a 2012 AMD CPU, and zero AI tokens.[P]

Un chercheur résout une tâche ARC-AGI-3 avec 4,76% de score en utilisant uniquement du code Python déterministe et vision par ordinateur classique, sur un CPU AMD FX-8350 de 2012. Aucun LLM, aucun transformer : segmentation de blobs de couleur, détection de centre de masse, et clics spatialisés. Démontre que les modèles frontier échouent à 0% sur ces environnements dynamiques.

Agents IA Vision Benchmarks

SIG

HYP

Hacker News (AI)·4 juin

Do Transformers Need Three Projections? Systematic Study of QKV Variants

Étude systématique des variantes QKV dans les transformers. Les chercheurs examinent si les trois projections (Query, Key, Value) sont toutes nécessaires pour l'efficacité des modèles. Analyse comparative des architectures alternatives.

Papers Raisonnement

SIG

HYP

Latent Space·4 juin

Reality: The Final Eval — Lukas Petersson and Axel Backlund of Andon Labs

Entretien avec les auteurs de VendingBench sur l'évaluation des modèles Claude (Haiku à Mythos). Discussion sur la construction d'évaluations frontier robustes et reproductibles.

Claude Évaluations Benchmarks

SIG

HYP

Hacker News (AI)·4 juin

Anthropic's open-source framework for AI-powered vulnerability discovery

Anthropic publie un framework open-source pour découvrir automatiquement des vulnérabilités via IA. L'outil exploite les capacités de raisonnement des modèles pour identifier des failles de sécurité dans le code.

Anthropic Open source Sécurité IA

SIG

HYP

The Decoder·4 juin

Cloudflare CEO says the web's future is "pay to crawl" as bots overtake human traffic

Le PDG de Cloudflare Matthew Prince affirme que le trafic bot dépasse désormais le trafic humain sur internet, bien avant sa prévision de fin 2027. Il attribue cette augmentation aux agents IA. Sa conclusion : l'avenir du web sera « pay to crawl ».

Agents IA Business

SIG

HYP

Reddit r/LocalLLaMA·4 juin

Dynamic KV Cache Quantization and Load-on-demand mmproj/MTP: my llama.cpp wishlist

Développeur propose une optimisation pour llama.cpp : quantification dynamique du KV cache et chargement à la demande du mmproj. Implémentation PoC avec endpoint HTTP /requantize_kvcache permettant de basculer entre configurations (kvcache quantisé/f16, mmproj on/off) sans recharger le modèle. Testé sur RTX 5090 avec Qwen3.5-27B Q6_K.

Llama Infrastructure Open source

SIG

HYP

Reddit r/MachineLearning·4 juin

[P]Stop using print() to debug your agents. Here's a 60-second alternative.[P]

Spanlens, un outil open-source MIT, offre un debugging d'agents LLM en changeant une seule ligne de code (baseURL). Il trace les appels multi-étapes, intègre OpenAI/Anthropic/Gemini, masque les données sensibles et permet l'auto-hébergement Docker sans vendor lock-in.

Agents IA Outils Open source

SIG

HYP

Hacker News (AI)·4 juin

KVarN: Native vLLM KV-cache quantization back end by Huawei

Huawei publie KVarN, un backend de quantification native du KV-cache pour vLLM. Optimise la mémoire et la latence des inférences LLM sans dégradation significative de qualité.

Infrastructure Open source Outils

SIG

HYP

Reddit r/LocalLLaMA·4 juin

I Built a Practical Guide to LLM Engineering: RAG, Retrieval, Rerankers, and Evaluation

Guide pratique open-source sur les patterns d'ingénierie LLM : RAG, recherche hybride, rerankers, évaluation. Couvre pré-filtrage, scoring en mémoire vs bases vectorielles, batching, nettoyage. Exemples Python inclus. L'auteur souligne que la qualité du harness d'ingénierie égale celle du modèle pour les solutions en production.

RAG Recherche vectorielle Embeddings

SIG

HYP

Hugging Face Blog·4 juin

How to Fine-Tune Nemotron 3.5 ASR for Your Language, Domain, or Accent

Hugging Face publie un guide pour fine-tuner Nemotron 3.5 ASR, le modèle de reconnaissance vocale de NVIDIA. La méthode permet d'adapter le modèle à des langues, domaines ou accents spécifiques via fine-tuning.

Fine-tuning Voix Outils

SIG

HYP

GitHub Trending·4 juin

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> PaddlePaddle /</span> PaddleOCR

PaddleOCR est un toolkit OCR léger et open-source qui convertit documents PDF et images en données structurées. Supporte 100+ langues et s'intègre avec les LLM.

Open source Vision Outils

SIG

HYP

GitHub Trending·4 juin

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> microsoft /</span> mxc

Microsoft publie mxc, un outil open-source de sécurité basé sur des politiques pour l'isolation et le confinement en couches. Destiné à renforcer la sécurité des conteneurs et des environnements d'exécution.

Open source Infrastructure Sécurité IA

SIG

HYP

GitHub Trending·4 juin

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> NVIDIA /</span> NemoClaw

NVIDIA lance NemoClaw, un framework pour exécuter des agents IA (Hermes, OpenClaw) de manière sécurisée via NVIDIA OpenShell avec inférence managée.

Agents IA Infrastructure Open source

SIG

HYP