Page 178 sur 192

ToutHaut signalRécent

7679 articles

Xiaomi just claimed 1,000+ tps on a 1T model using a standard 8-GPU server

Xiaomi annonce MiMo-V2.5-Pro UltraSpeed avec 1 000+ tokens/sec sur un modèle MoE de 1T paramètres sur serveur 8-GPU standard, sans hardware spécialisé.

Open source Benchmarks Infrastructure

SIG

HYP

Reddit r/LocalLLaMA·8 juin

Nex N2 has a funny "few words do trick" reasoning

Nex N2 Pro (fine-tune Qwen 3.5 397B) affiche un pattern de raisonnement distinctif utilisant des mots simples répétés (« need », « maybe ») pour économiser les tokens. L'utilisateur observe que cette approche rend le parsing du raisonnement plus difficile malgré une réduction de complexité linguistique.

Qwen Raisonnement Open source

SIG

HYP

Hacker News (AI)·8 juin

Terry Tao Became an Evangelist for AI in Math

Terence Tao, mathématicien de renommée mondiale, promeut l'utilisation de l'IA dans la recherche mathématique. Il explore comment les outils d'IA peuvent augmenter les capacités de découverte et de preuve en mathématiques.

Raisonnement Papers

SIG

HYP

Reddit r/LocalLLaMA·8 juin

Gemma 4 QAT + MTP: max 33% speed increase in token generation, any ideas?

Utilisateur avec 2x RTX 3060 Ti teste Gemma 4 QAT avec modèle assistant MTP sur llama.cpp. Atteint 100 t/s (33% gain) avec 80%+ taux d'acceptation du draft, cherche optimisations pour dépasser ce seuil.

Llama Génération de code Open source

SIG

HYP

Reddit r/LocalLLaMA·8 juin

Looking for a local "NotebookLM for lawyers" setup – what am I doing wrong?

Un avocat cherche à construire un système local de RAG pour analyser des dossiers judiciaires (correspondances, contrats, décisions) avec citations. Après tests sur Qwen 3.5 9B et gpt-oss-20b via LM Studio + Big RAG, il rencontre deux problèmes : vitesse insuffisante (~2.2 tok/s) et refus du modèle de citer ses propres documents, générant des explications génériques au lieu d'analyses basées sur le contexte fourni.

RAG Qwen Open source

SIG

HYP

Le Big Data·8 juin

Il abandonne ses abonnements IA pour un Mac Mini et économise 2 500 $ par an

Un développeur abandonne ses abonnements IA mensuels (210 $/mois) pour un Mac Mini, économisant 2 500 $ annuels. Comparaison coût-bénéfice entre services cloud et infrastructure locale.

Business Outils Infrastructure

SIG

HYP

Le Big Data·8 juin

Faux drames et pièges à clics : le fil d’actu de Meta AI part complètement en vrille

Le fil d'actualité de Meta AI génère du contenu problématique : faux drames, clickbait et contenus trompeurs. Les utilisateurs sont confus sur la nature réelle de l'assistant et sa fiabilité.

Meta AI

SIG

HYP

Reddit r/MachineLearning·8 juin

LLM Relational Intelligence: A 4-Month Research Experiment on Multi-Model Behavioral Alignment with Human Communication [R]

Expérience de 4 mois testant si les fenêtres de contexte peuvent être engineered pour que les modèles frontière (GPT, Claude, Gemini, Grok) interagissent de manière indistinguishable d'une interaction humaine. Gemini montre la meilleure « relational intelligence ». L'auteur traite la fenêtre de contexte comme environnement comportemental plutôt que simple interface.

Prompt engineering GPT Claude

SIG

HYP

Le Big Data·8 juin

Anthropic veut geler la course à l’IA, vraie peur ou stratégie ?

Anthropic demande une pause mondiale dans la course à l'IA, alertant sur le risque d'une IA capable de s'améliorer seule. La demande reste spectaculaire mais son caractère stratégique interroge.

Anthropic Sécurité IA Alignement

SIG

HYP

Hacker News (AI)·8 juin

Blaise v0.10.0: Native Back End, Threads and Incremental Compilation

Blaise v0.10.0 introduit un backend natif, le support des threads et la compilation incrémentale. Mise à jour technique d'un langage de programmation avec améliorations de performance et de concurrence.

Open source Infrastructure

SIG

HYP

Le Big Data·8 juin

Comment booster l’engagement grâce à l’agent IA d’assistance client du Marketing Hub de HubSpot ?

HubSpot intègre un agent IA d'assistance client dans son Marketing Hub pour améliorer l'engagement. L'outil vise à fournir des réponses rapides et précises aux clients sur le Web.

Agents IA Business

SIG

HYP

GitHub Trending·8 juin

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> phuryn /</span> pm-skills

PM Skills Marketplace propose 100+ compétences, commandes et plugins pour agents IA, couvrant découverte, stratégie, exécution, lancement et croissance.

Agents IA Outils Open source

SIG

HYP

GitHub Trending·8 juin

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> idootop /</span> open-xiaoai

Projet open-source pour donner à la Xiaoai Speaker la capacité d'écoute vocale avancée. Déverrouille des fonctionnalités vocales illimitées sur l'enceinte connectée Xiaomi.

Open source Voix

SIG

HYP

Le Big Data·8 juin

ZoomMate connecte les conversations aux workflows

Zoom lance ZoomMate et AI Productivity Suite pour intégrer les conversations aux workflows. L'éditeur poursuit son expansion dans les outils collaboratifs.

Outils Business

SIG

HYP

Hacker News (AI)·8 juin

Painting the Internet: A Different Kind of Warhol Worm [pdf]

Article académique sur une nouvelle classe de vers informatiques capables de modifier visuellement le contenu web en temps réel, inspirée par les techniques d'art numérique. Approche théorique de sécurité explorant les vulnérabilités de rendu côté client.

Sécurité IA

SIG

HYP

OpenAI Blog·8 juin

Built to benefit everyone: our plan

OpenAI présente sa vision pour l'avenir de l'IA, axée sur l'accès, la sécurité et la prospérité partagée. L'entreprise affirme travailler à garantir que l'AGI bénéficie à tous.

OpenAI Alignement Sécurité IA

SIG

HYP

Reddit r/LocalLLaMA·7 juin

Hear Me Out, Pi Fans Lurking Here

Un utilisateur de r/LocalLLaMA critique Pi, le framework d'agents de Mario Zechner, pour ne pas être optimisé pour les LLMs locaux. Pi utilise un prompt système court et peu d'outils, conçu pour les utilisateurs d'API (Claude). L'auteur teste Pi sur Nemotron et Qwen : les modèles locaux échouent à exécuter des tool calls fiables sans activer le reasoning, révélant une inadéquation fondamentale.

Agents IA Open source Outils

SIG

HYP

Hacker News (AI)·7 juin

Show HN: Nightwatch, The open-source, read-only AI SRE

Nightwatch est un outil open-source pour SRE (Site Reliability Engineering) basé sur l'IA, fonctionnant en mode lecture seule. Présenté sur Hacker News avec un score modeste (4 points, 2 commentaires), il propose une approche d'automatisation sans modification directe des systèmes.

Agents IA Open source Outils

SIG

HYP

Reddit r/LocalLLaMA·7 juin

QAT variant of Gemma4 26B A4B is not working well for me

Utilisateur signale que la variante QAT de Gemma-4 26B A4B (google/gemma-4-26B-A4B-it-qat-q4_0-gguf et unsloth/gemma-4-26B-A4B-it-qat-GGUF:Q4_K_XL) produit des résultats dégradés sur un test SVG d'échiquier avec llama.cpp b9549, comparé à l'ancienne version non-QAT qui fonctionne correctement.

Gemini Open source Outils

SIG

HYP

Reddit r/LocalLLaMA·7 juin

GMKtec Crams OCuLink, Wi-Fi 7 and Dual PCIe 4.0 Into the EVO-X3, With a 192GB Ryzen AI MAX+ 495 Monster Following Later This Year

GMKtec annonce l'EVO-X3 avec OCuLink, Wi-Fi 7 et dual PCIe 4.0. Un modèle avec Ryzen AI MAX+ 495 et 192GB de RAM est prévu pour fin 2024. Première annonce matérielle connue pour ce processeur.

Infrastructure

SIG

HYP

Hacker News (AI)·7 juin

The ROI of AI coding looks different when you are a bootstrapped founder

Un fondateur bootstrappé analyse le retour sur investissement des outils de codage IA. Le calcul diffère pour les startups sans financement externe : coûts d'API, productivité réelle et impact sur la vélocité de développement ne suivent pas la même logique que pour les entreprises financées.

Génération de code Business

SIG

HYP

Reddit r/LocalLLaMA·7 juin

A handy llama-server launcher with easy model and configuration customisation

Utilitaire open-source pour lancer llama-server avec gestion centralisée des configurations et modèles. Supporte plusieurs binaires llama-server, surcharges par modèle et ligne de commande. Disponible sur GitHub.

Llama Outils Open source

SIG

HYP

Hacker News (AI)·7 juin

Anthropic/OpenAI may be spending more than $1000 for every $100 you pay them

Analyse des coûts d'inférence : Anthropic et OpenAI dépenseraient 10x plus que leurs revenus par requête utilisateur. Les marges opérationnelles seraient négatives à grande échelle, soulevant des questions sur la viabilité économique des modèles actuels.

Anthropic OpenAI Business

SIG

HYP

GitHub Trending·7 juin

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> ashishpatel26 /</span> 500-AI-Agents-Projects

Recueil de 500 projets d'agents IA couvrant santé, finance, éducation, retail. Collection de cas d'usage pratiques avec liens vers repos open-source pour implémentation.

Agents IA Open source

SIG

HYP

GitHub Trending·7 juin

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> AstrBotDevs /</span> AstrBot

AstrBot est un framework d'agent IA intégrant plusieurs plateformes de messagerie, LLMs et plugins. Alternative open-source à OpenClaw pour développer des assistants IA.

Agents IA Open source Outils

SIG

HYP

Reddit r/LocalLLaMA·7 juin

DeskDash - a free Windows tool to easily manage your GGUF files

DeskDash est un outil Windows gratuit pour gérer facilement les fichiers GGUF. Développé par la communauté, il simplifie l'organisation et l'utilisation des modèles quantifiés localement.

Open source Outils Infrastructure

SIG

HYP

Hugging Face Blog·7 juin

Sponsors especially OPENAI CODEX voucher usage for codex - openAI challange

OpenAI propose des vouchers Codex aux sponsors de Hugging Face pour tester le modèle de génération de code. Initiative de partenariat entre OpenAI et la plateforme communautaire.

OpenAI Génération de code Business

SIG

HYP

Hacker News (AI)·7 juin

Show HN: Lathe – Use LLMs to learn a new domain, not skip past it

Lathe est un outil qui utilise les LLM pour approfondir l'apprentissage d'un domaine plutôt que de le contourner. Le projet, partagé sur Hacker News, propose une approche pédagogique où les modèles de langage facilitent la compréhension progressive.

Outils Prompt engineering

SIG

HYP

Hacker News (AI)·7 juin

Efficient and Training-Free Single-Image Diffusion Models

Nouvelle approche de modèles de diffusion pour générer des images à partir d'une seule image source, sans entraînement supplémentaire. La méthode est efficace en termes de calcul et de mémoire.

Génération d'images Papers

SIG

HYP

Reddit r/MachineLearning·7 juin

Research collection of Arxiv whitepapers [R]

Chercheur partage une collection de 1700 papiers arXiv organisés en 90 catégories depuis le lancement de ChatGPT. Migré d'Obsidian vers un site web avec 6000 « Inquiring Lines » (synthèses cross-cutting) et liens wiki entre papiers. Inclut des prompts pour découvrir recherches connexes récentes.

Papers RAG

SIG

HYP

Reddit r/LocalLLaMA·7 juin

How to compare Original vs QAT Gemma 4 31B Q4 quants

Discussion sur la méthodologie de comparaison entre Gemma 4 31B original et sa version QAT quantifiée en Q4. L'auteur propose de benchmarker d'abord les versions non quantifiées (SuperGPQA, HLE, MMLU) puis de mesurer la divergence de chaque Q4 par rapport à sa référence respective, plutôt que de comparer directement les deux variantes.

Gemini Benchmarks Évaluations

SIG

HYP

Reddit r/LocalLLaMA·7 juin

You don't need a GPU to run gemma-4-26B-A4B

Un utilisateur exécute Gemma-4-26B-A4B sur un vieux CPU i5-8500 avec 32 GB RAM sans GPU, atteignant ~7 T/s via Koboldcpp. Les modèles compressés récents rendent les GPUs moins nécessaires pour l'inférence locale.

Gemini Open source

SIG

HYP

Reddit r/MachineLearning·6 juin

Looking for critical review of an NN architecture (possible evaluation bias?) [D]

Étudiant amateur cherche relecture critique d'une architecture de réseau de neurones personnalisée (Directional Neural Network) qu'il a développée. L'architecture montre de meilleures performances que les MLPs sur des tâches simples, mais l'auteur craint un biais d'évaluation dans ses comparaisons (initialisation, optimiseur, datasets). Partage un repo avec code reproductible.

Papers Évaluations

SIG

HYP

Hacker News (AI)·6 juin

Universal Memory Protocol – a shared format for agent memory

Protocole de mémoire universel proposé pour standardiser le format de stockage et d'accès aux données de mémoire entre agents IA. Vise à faciliter l'interopérabilité et la réutilisabilité des systèmes multi-agents.

Agents IA Multi-agents Infrastructure

SIG

HYP

Hacker News (AI)·6 juin

Computex 2026: Are We Heading for the Agentic PC Era Yet? – EE Times

Computex 2026 explore l'émergence des PC agentiques. L'industrie débat si les ordinateurs personnels intègrent enfin des agents IA autonomes capables d'exécuter des tâches sans intervention humaine constante.

Agents IA Business

SIG

HYP

Reddit r/LocalLLaMA·6 juin

Fuck, sucessfully ran minecraft server on GLM AI's Agent lol.

Un utilisateur a demandé à GLM AI (agent Alibaba) de créer un serveur Minecraft jouable. L'agent a généré le serveur, créé un tableau de bord et l'a hébergé à Hong Kong. Démonstration de capacités d'exécution de tâches complexes.

Agents IA Génération de code

SIG

HYP

Reddit r/LocalLLaMA·6 juin

Gemma 4 QAT Unquantized Heretic is here

Un utilisateur partage une version 4-bit quantifiée non officielle de Gemma 4 26B MoE. Le modèle modifie intentionnellement les mécanismes de refus et de divergence par rapport à la version originale.

Gemini Open source

SIG

HYP

Reddit r/LocalLLaMA·6 juin

Gemma 4 QAT accuracy inconsistencies

Analyse des incohérences de précision dans la quantification aware training (QAT) de Gemma 4. Le modèle 12B montre des écarts plus importants par rapport à FP16 que les variantes MoE (E2B/E4B), contredisant les attentes théoriques. Demande de clarification sur la méthodologie et comparaisons avec variants non-QAT.

Gemini Benchmarks

SIG

HYP

GitHub Trending·6 juin

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> danielmiessler /</span> Personal_AI_Infrastructure

Dépôt GitHub proposant une infrastructure d'IA agentique conçue pour amplifier les capacités humaines. Approche centrée sur l'intégration d'agents IA dans des workflows personnels.

Agents IA Infrastructure

SIG

HYP

GitHub Trending·6 juin

<svg aria-hidden="true" data-component="Octicon" height="16" viewBox="0 0 16 16" version="1.1" width="16" data-view-component="true" class="octicon octicon-repo mr-1 tmp-mr-1 color-fg-muted"> <path d="M2 2.5A2.5 2.5 0 0 1 4.5 0h8.75a.75.75 0 0 1 .75.75v12.5a.75.75 0 0 1-.75.75h-2.5a.75.75 0 0 1 0-1.5h1.75v-2h-8a1 1 0 0 0-.714 1.7.75.75 0 1 1-1.072 1.05A2.495 2.495 0 0 1 2 11.5Zm10.5-1h-8a1 1 0 0 0-1 1v6.708A2.486 2.486 0 0 1 4.5 9h8ZM5 12.25a.25.25 0 0 1 .25-.25h3.5a.25.25 0 0 1 .25.25v3.25a.25.25 0 0 1-.4.2l-1.45-1.087a.249.249 0 0 0-.3 0L5.4 15.7a.25.25 0 0 1-.4-.2Z"></path> </svg> <span data-view-component="true" class="text-normal"> supabase /</span> supabase

Supabase est une plateforme de développement Postgres offrant une base de données dédiée pour construire des applications web, mobile et IA.

Infrastructure Outils

SIG

HYP