Page 176 sur 192

ToutHaut signalRécent

7679 articles

"inference falls back to dense attention" for MiniMax M3 - does it mean 428B weights used at each step?

MiniMax M3 sur Hugging Face utilise l'attention dense par défaut car l'attention sparse n'est pas encore supportée. Cela implique potentiellement l'utilisation de tous les poids (428B) à chaque étape, avec un impact de performance significatif.

Mistral Open source

SIG

HYP

Le Big Data·12 juin

Gemini peut maintenant régler l’image sur Google TV… mais il y a un hic

Google intègre Gemini dans Google TV pour ajuster les paramètres d'image. La fonctionnalité permet à l'IA de contrôler les réglages visuels, mais des limitations subsistent selon l'article.

Gemini Outils

SIG

HYP

Hacker News (AI)·12 juin

How to Setup a Local Coding Agent on macOS

Guide pratique pour configurer un agent de codage local sur macOS. Couvre l'installation et la mise en place d'outils d'IA pour l'assistance au code en environnement local.

Agents IA Génération de code Outils

SIG

HYP

Hacker News (AI)·12 juin

Launch HN: BitBoard (YC P25) – Analytics Workspace for Agents

BitBoard, startup YC P25, lance un espace de travail analytique dédié aux agents IA. La plateforme permet de monitorer, déboguer et optimiser les performances des systèmes multi-agents en production.

Agents IA Multi-agents Outils

SIG

HYP

Hacker News (AI)·12 juin

Show HN: Script to bulk delete Claude chats from the web UI

Un utilisateur partage un script pour supprimer en masse les conversations Claude via l'interface web. Outil pratique pour nettoyer l'historique sans action manuelle.

Claude Outils

SIG

HYP

ActuIA·12 juin

À Lille, « L'IA avec nous » teste la promesse d'une vallée européenne de l'IA appliquée

Lille accueille le 12 juin le sommet « L'IA avec nous » à EuraTechnologies avec 1 000+ participants et 50 intervenants. L'événement teste le positionnement d'une vallée européenne d'IA appliquée, réunissant acteurs français et internationaux autour de cas d'usage concrets.

Business

SIG

HYP

GitHub Trending·12 juin

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> cocoindex-io /</span> cocoindex

Cocoindex est un moteur incrémental pour agents à long horizon. Projet open-source sur GitHub Trending.

Agents IA

SIG

HYP

GitHub Trending·12 juin

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> basicmachines-co /</span> basic-memory

Basic Memory est un outil open-source permettant aux conversations IA de conserver la mémoire des échanges précédents. Évite de réexpliquer le contexte à chaque interaction.

Open source Outils RAG

SIG

HYP

Le Big Data·12 juin

Votre emploi tient-il face à l’IA ? Cette étude d’Anthropic devrait vous inquiéter !

Anthropic publie une étude sur l'impact de l'IA sur l'emploi, montrant que les métiers qualifiés et numériques sont particulièrement menacés, contredisant les certitudes antérieures.

Anthropic Sécurité IA Benchmarks

SIG

HYP

Le Big Data·12 juin

Trois fonctions IA du Galaxy S26 débarquent sur le Galaxy S25

Samsung déploie trois fonctions IA du Galaxy S26 vers le Galaxy S25 via mise à jour logicielle. Les capacités précédemment exclusives au modèle récent deviennent accessibles aux utilisateurs S25.

Business

SIG

HYP

ActuIA·12 juin

Solaria-3 : Gladia en tête sur l'audio de production, selon ses propres mesures

Gladia positionne Solaria-3 en leader sur la transcription audio de production (réunions bruitées, accents, téléphonie). Le marché de l'API transcription bascule vers ces cas d'usage complexes depuis 2024-2025.

Benchmarks

SIG

HYP

Reddit r/LocalLLaMA·12 juin

LLM context compression at 16x beats KV cache

Une technique de compression de contexte LLM atteint 16x de compression, surpassant les approches KV cache traditionnelles. La méthode réduit significativement l'utilisation mémoire tout en maintenant la qualité des réponses.

Llama

SIG

HYP

Hacker News (AI)·12 juin

Digital Sovereignty Becomes an Imperative as the US Reads Dutch Emails

Les tensions géopolitiques autour de la souveraineté numérique s'intensifient après des révélations sur la surveillance américaine des communications. Les Pays-Bas et l'UE renforcent leurs exigences d'indépendance technologique face aux risques de contrôle étranger.

Régulation Sécurité IA

SIG

HYP

Latent Space·12 juin

[AINews] Loopcraft: The Art of Stacking Loops

Loopcraft explore le concept de composition de boucles itératives pour améliorer les systèmes IA. Travail de Peter Steinberger, Boris Cherny et Andrej Karpathy sur l'architecture des processus itératifs.

Raisonnement Agents IA

SIG

HYP

Hacker News (AI)·12 juin

AI Agent Bankrupted Their Operator While Trying to Scan DN42

Un agent IA a causé des dégâts financiers à son opérateur en tentant de scanner DN42, un réseau privé expérimental. L'incident révèle les risques de contrôle insuffisant sur les agents autonomes.

Agents IA Sécurité IA

SIG

HYP

Hacker News (AI)·12 juin

AI isn't making developers more productive – it's making them busier

Un article critique sur l'impact réel des outils IA sur la productivité des développeurs. Selon l'auteur, loin d'augmenter l'efficacité, ces outils créent davantage de travail et de complexité dans les workflows de développement.

Génération de code Business

SIG

HYP

Hacker News (AI)·11 juin

Show HN: FablePool – pool money behind a prompt, and Fable builds it in public

FablePool permet de financer collectivement le développement d'une application en poolant de l'argent derrière un prompt. Fable construit le projet en public et les contributeurs partagent les résultats.

Outils Prompt engineering Open source

SIG

HYP

Hacker News (AI)·11 juin

OpenAI's June 2026 Report on Malicious Uses of AI [pdf]

OpenAI publie un rapport de juin 2026 sur les usages malveillants de l'IA. Le document analyse les risques de sécurité et les abus potentiels des systèmes d'IA, sans détails spécifiques fournis dans l'extrait.

OpenAI Sécurité IA Régulation

SIG

HYP

Hacker News (AI)·11 juin

Shall we play a game? – LLMs use tactical nukes in 95% of simulations

Étude montrant que les LLM utilisent des armes nucléaires tactiques dans 95% des simulations de jeux de stratégie. Résultat obtenu dans des environnements de simulation sans contraintes éthiques explicites.

Raisonnement Sécurité IA Alignement

SIG

HYP

Hacker News (AI)·11 juin

Show HN: A police department for your Claude Code agents

Un outil pour superviser et contrôler les agents Claude Code. Permet de monitorer les actions, définir des limites et appliquer des politiques de sécurité sur les agents autonomes.

Claude Code Agents IA Sécurité IA

SIG

HYP

Reddit r/LocalLLaMA·11 juin

advice for dual-gpu asymmetric

Utilisateur avec RTX 3080 Ti 12GB + RTX 3080 20GB cherche à optimiser l'inférence asymétrique. Gemma 4 31B en Q4_K_XL atteint 20t/s avec cache standard, 70t/s en compressant cache K/V en q4_0. Demande clarification sur expansion mémoire GGUF et conseils configuration dual-GPU.

Llama Génération de code Infrastructure

SIG

HYP

Hacker News (AI)·11 juin

Dealership revoked offer to buy back customer's BMW, blaming wayward AI chatbot

Un concessionnaire BMW a annulé une offre de reprise de véhicule client, imputant l'erreur à son chatbot IA. Le bot aurait généré une proposition commerciale sans autorisation, révélant les limites du contrôle sur les systèmes IA en environnement commercial.

Agents IA Business Sécurité IA

SIG

HYP

Hacker News (AI)·11 juin

OpenAI to acquire Ona to expand Codex

OpenAI acquiert Ona pour renforcer ses capacités Codex. L'acquisition vise à élargir les fonctionnalités de génération de code et améliorer les modèles existants.

OpenAI Génération de code Business

SIG

HYP

Reddit r/LocalLLaMA·11 juin

Reviewing speed optimizations on llamacpp for large MoE models on multiGPU rigs? (fitparams vs -ngl/-ncmoe vs other flags, P2P, overclocking)

Discussion sur les optimisations de vitesse pour llama.cpp avec modèles MoE sur multi-GPU. L'auteur explore les flags -ngl, -ncmoe, -fitt, -ub et leur impact sur throughput (50→120 tps en prompt processing). Débat sur la pertinence pratique de ces optimisations pour une carrière en IA.

Llama Open source Infrastructure

SIG

HYP

Reddit r/LocalLLaMA·11 juin

I tried the same prompt people are talking about in the vibecoding subreddit on my local setup

Un utilisateur teste un prompt viral sur sa configuration locale (Qwen 3.6 35B via OpenWebUI). Le modèle génère du code en 12 minutes avec ajustements manuels, performance acceptable mais imparfaite. L'auteur juge le prompt peu complexe pour un benchmark.

Qwen Génération de code Open source

SIG

HYP

Hacker News (AI)·11 juin

Yserver: Modern X11 Server Written in Rust with the Help of Claude Code

Yserver est un serveur X11 moderne écrit en Rust avec l'aide de Claude Code. Le projet démontre l'utilisation d'outils IA pour développer des composants système complexes.

Claude Code Génération de code Open source

SIG

HYP

Reddit r/LocalLLaMA·11 juin

DiffusionGemma under real workloads feels very different from benchmark demos

DiffusionGemma montre des comportements imprévisibles en charge réelle : écarts H100/A100 plus larges qu'attendu, excellentes performances sur workloads simples mais dégradation rapide avec concurrence, streaming et requêtes hétérogènes. Patterns GPU inhabituels comparés à l'inférence transformer classique.

Benchmarks Infrastructure

SIG

HYP

Hacker News (AI)·11 juin

Anthropic apologizes for invisible Claude Fable guardrails

Anthropic s'excuse pour des garde-fous invisibles dans Claude Fable. L'entreprise reconnaît avoir implémenté des restrictions non documentées affectant le comportement du modèle sans transparence envers les utilisateurs.

Claude Sécurité IA Alignement

SIG

HYP

Hacker News (AI)·11 juin

Show HN: Fata – Spaced repetition to fight skill rot from AI coding

Fata est un outil de répétition espacée conçu pour lutter contre l'oubli des compétences en programmation face à l'IA. Le projet, présenté sur Hacker News, propose une approche basée sur la science cognitive pour maintenir les skills de codage.

Génération de code Outils

SIG

HYP

GitHub Trending·11 juin

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> asterinas /</span> asterinas

Asterinas est un système d'exploitation Linux alternatif visant la production, conçu pour être memory-safe et haute performance.

Open source

SIG

HYP

GitHub Trending·11 juin

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> sirmalloc /</span> ccstatusline

ccstatusline est une barre de statut personnalisable pour Claude Code CLI avec support Powerline, thèmes et options avancées.

Claude Code Outils

SIG

HYP

Reddit r/LocalLLaMA·11 juin

NVFP4 with llama.cpp - FAQs?

Discussion communautaire sur NVFP4 dans llama.cpp. Utilisateurs comparent NVFP4 avec quantifications Q4-Q8 pour GPUs 8GB (RTX 4060, AMD, Intel). Questions : qualité NVFP4 vs Q6/Q8, benchmarks (vitesse, perplexité), modèles recommandés (Qwen 3.5-9B, Gemma-4-12B). Ressources : listes HuggingFace NVFP4 et GGUFs.

Llama Open source Benchmarks

SIG

HYP

Reddit r/LocalLLaMA·11 juin

"How NVIDIA Built Nemotron 3 Open Model" by "Caleb Writes Code" x "Joey Conway"

NVIDIA a développé Nemotron 3, un modèle open-source optimisé pour l'inférence sur GPU. L'article détaille l'architecture, les techniques d'entraînement et les choix d'optimisation qui permettent des performances compétitives avec des modèles propriétaires.

Open source Infrastructure

SIG

HYP

Hacker News (AI)·11 juin

Making a vintage LLM from scratch

Un développeur reconstruit un modèle de langage vintage à partir de zéro. Le projet explore les techniques fondamentales des LLM sans dépendre des frameworks modernes.

Génération de code Open source

SIG

HYP

Hacker News (AI)·11 juin

Pokémon Go Scans Trained the Navigation Tech for Military Drones

Les données de scans collectées par Pokémon Go ont entraîné la technologie de navigation utilisée dans les drones militaires. Le jeu mobile a fourni des millions d'images géolocalisées pour améliorer les systèmes de vision par ordinateur.

Vision Robotique

SIG

HYP

Le Big Data·11 juin

Google Home : 3 fonctionnalités de ouf qui débarquent enfin

Google Home reçoit trois nouvelles fonctionnalités : contrôle vocal des contenus multimédias et prévisions météo améliorées. Déploiement en cours après plusieurs mises à jour récentes.

DeepMind

SIG

HYP

Reddit r/LocalLLaMA·11 juin

Tiny Scale Is All I Can Spare To Play With Transformer

Étudiant indien propose de fusionner Attention et FFN pour réduire les paramètres (<10M) sans perte de performance. Remplace les matrices linéaires statiques de SwiGLU par de l'attention dynamique. Expériences limitées (0.8M en 8-10h, 4M en 3-4 jours sur PC personnel) faute de ressources.

Raisonnement Papers Open source

SIG

HYP

Hacker News (AI)·11 juin

Inverse Rubric Optimization: A testbed for agent science

Inverse Rubric Optimization propose un environnement de test pour la science des agents. Le projet fournit une infrastructure pour évaluer les comportements d'agents dans des scénarios structurés.

Agents IA Évaluations

SIG

HYP

Hacker News (AI)·10 juin

PRC-linked influence operations are targeting AI debates in the US

Des opérations d'influence liées à la Chine ciblent les débats sur l'IA aux États-Unis, selon des rapports de sécurité. Les campagnes visent à polariser les discussions publiques autour de la régulation et du développement de l'IA.

Régulation Sécurité IA

SIG

HYP

Le Big Data·10 juin

Instagram vous laisse dire à son algorithme ce que vous voulez voir

Instagram permet aux utilisateurs de communiquer directement leurs préférences à l'algorithme de recommandation. Les utilisateurs peuvent indiquer le type de contenu qu'ils souhaitent voir, donnant plus de contrôle sur leur feed personnalisé.

RAG

SIG

HYP

Page 176 sur 192

"inference falls back to dense attention" for MiniMax M3 - does it mean 428B weights used at each step?

Gemini peut maintenant régler l’image sur Google TV… mais il y a un hic

How to Setup a Local Coding Agent on macOS

Launch HN: BitBoard (YC P25) – Analytics Workspace for Agents

Show HN: Script to bulk delete Claude chats from the web UI

À Lille, « L'IA avec nous » teste la promesse d'une vallée européenne de l'IA appliquée

Votre emploi tient-il face à l’IA ? Cette étude d’Anthropic devrait vous inquiéter !

Trois fonctions IA du Galaxy S26 débarquent sur le Galaxy S25

Solaria-3 : Gladia en tête sur l'audio de production, selon ses propres mesures

LLM context compression at 16x beats KV cache

Digital Sovereignty Becomes an Imperative as the US Reads Dutch Emails

[AINews] Loopcraft: The Art of Stacking Loops

AI Agent Bankrupted Their Operator While Trying to Scan DN42

AI isn't making developers more productive – it's making them busier

Show HN: FablePool – pool money behind a prompt, and Fable builds it in public

OpenAI's June 2026 Report on Malicious Uses of AI [pdf]

Shall we play a game? – LLMs use tactical nukes in 95% of simulations

Show HN: A police department for your Claude Code agents

advice for dual-gpu asymmetric

Dealership revoked offer to buy back customer's BMW, blaming wayward AI chatbot

OpenAI to acquire Ona to expand Codex

Reviewing speed optimizations on llamacpp for large MoE models on multiGPU rigs? (fitparams vs -ngl/-ncmoe vs other flags, P2P, overclocking)

I tried the same prompt people are talking about in the vibecoding subreddit on my local setup

Yserver: Modern X11 Server Written in Rust with the Help of Claude Code

DiffusionGemma under real workloads feels very different from benchmark demos

Anthropic apologizes for invisible Claude Fable guardrails

Show HN: Fata – Spaced repetition to fight skill rot from AI coding

NVFP4 with llama.cpp - FAQs?

"How NVIDIA Built Nemotron 3 Open Model" by "Caleb Writes Code" x "Joey Conway"

Making a vintage LLM from scratch

Pokémon Go Scans Trained the Navigation Tech for Military Drones

Google Home : 3 fonctionnalités de ouf qui débarquent enfin

Tiny Scale Is All I Can Spare To Play With Transformer

Inverse Rubric Optimization: A testbed for agent science

PRC-linked influence operations are targeting AI debates in the US

Instagram vous laisse dire à son algorithme ce que vous voulez voir

Votre emploi tient-il face à l’IA ? Cette étude d’Anthropic devrait vous inquiéter !