zai-org/GLM-5.2 is here!
GLM-5.2 est disponible. Le modèle de zai-org améliore les capacités de raisonnement et de compréhension par rapport aux versions antérieures.
GLM-5.2 est disponible. Le modèle de zai-org améliore les capacités de raisonnement et de compréhension par rapport aux versions antérieures.
Publication d'une version GGUF du modèle Command-A-Plus-05-2026 sur Hugging Face. L'auteur invite les utilisateurs à tester avec la dernière version de llama.cpp et à partager leurs benchmarks de tokens/seconde.
Développeur crée un vérificateur de benchmark pour la manipulation robotique qui compile des démonstrations humaines en graphes objet-centriques et valide les rollouts indépendamment, évitant les fuites d'information. Soulève la question : est-ce utile face aux métriques ad-hoc actuelles, ou résout-il un non-problème ?
Georgi Gerganov (créateur de llama.cpp) utilise quotidiennement Qwen3.6-27B pour des tâches de codage sur M2 Ultra et RTX 5090. Il l'intègre via un agent léger (pi) avec prompt système personnalisé pour l'assistance à la maintenance ggml-org.
Article argumentant pour les modèles open-weight face aux labs frontier. Critique la concentration du pouvoir chez quelques entreprises et plaide pour l'accessibilité et la transparence des poids de modèles IA.
SpaceX acquiert Anysphere (créateur de Cursor) pour 60 milliards de dollars, deux jours après son IPO. L'objectif : renforcer xAI pour rattraper Anthropic et OpenAI dans la course aux modèles d'IA.
Sakana AI lance Marlin, un agent de recherche approfondie générant des rapports stratégiques de plus de 100 pages. Le système prend 8 heures pour produire des analyses détaillées, marquant un changement de paradigme vers la profondeur plutôt que la rapidité.
Ineffable Intelligence lève 1,1 milliard de dollars et s'appuie sur Google Cloud pour développer ses ambitions en superintelligence. Le partenariat inclut l'infrastructure cloud nécessaire aux entraînements de modèles à grande échelle.
Burn est une bibliothèque tensor et framework de deep learning nouvelle génération axé sur la flexibilité, l'efficacité et la portabilité.
Outil open-source pour générer automatiquement des captures d'écran d'app store via IA. Automatise la création de visuels marketing pour applications mobiles.
NocoBase est une plateforme open-source combinant IA et no-code pour construire rapidement des systèmes métier. L'IA opère sur une infrastructure éprouvée en production avec interface WYSIWYG, garantissant vitesse et fiabilité.
Homarr est un tableau de bord moderne avec 40+ intégrations, 20K+ icônes intégrées, authentification native et configuration par drag-and-drop sans YAML.
Outil convertissant du code en graphe de connaissances interactif explorable et interrogeable. Compatible Claude Code, Cursor, Copilot, Gemini CLI et autres éditeurs.
Initiative Trace Commons : collecte de traces de sessions de codage sous licence CC-BY-4.0 pour entraîner des modèles open-source et open-weight. Objectif : contrebalancer l'avantage compétitif d'Anthropic et OpenAI qui accumulent des données propriétaires via Claude Code et Codex.
OpenAI a dépensé 34 milliards de dollars l'année passée, bien plus que l'année précédente. Aucun détail sur l'allocation des coûts n'est fourni.
OpenAI a multiplié ses pertes par 8 en 2025, avec des dépenses atteignant 34 milliards de dollars. La trajectoire financière de l'entreprise montre une accélération des investissements en infrastructure et R&D.
Article théorique sur la « contre-adaptation synthétique » : processus où humains et systèmes IA co-évoluent en s'adaptant mutuellement. Les auteurs analysent des exemples (Go, interactions sociales, simulations géopolitiques) pour montrer comment émerge une dynamique récursive d'interaction multi-agents.
Étude comparant modèles ML (régression logistique, random forest, SVM, transformers, LSTM, GRU) pour prédire les résultats d'examen à partir de signaux physiologiques (activité électrodermale, fréquence cardiaque, température cutanée). Les random forests surpassent les modèles deep learning en efficacité computationnelle et interprétabilité.
Étude de cas pédagogique sur 23 projets d'étudiants en traduction automatique. Les étudiants ont comparé des LLM généralistes et systèmes TA en ligne, évalué les sorties avec métriques automatiques et jugement humain, puis justifié leurs choix. Résultat : les métriques automatiques n'ont pas déterminé les sélections finales ; les étudiants ont privilégié l'adéquation, la fluidité et l'effort de post-édition.
La Maison-Blanche a remis à Anthropic un rapport sur le jailbreak Fable. L'expert en cybersécurité Katie Moussouris a examiné les tests : Fable a refusé « review the code for security issues » mais a accepté « fix this code ». Moussouris conclut que c'est le modèle fonctionnant correctement pour la cyberdefense.
Microsoft utilise l'infrastructure AWS pour soutenir GitHub face à une saturation de capacité liée aux services IA. La plateforme dépend désormais partiellement des serveurs Amazon pour gérer la demande croissante.
Nex2 mini Phase Twin : modèle 30B optimisé pour 16GB VRAM. Conçu pour les cartes Intel A770, fonctionne sur une seule GPU et s'améliore avec deux. Atteint 89 tok/s sur A770 16GB. Calibrage automatique selon le matériel.
AWS WAF introduit une fonctionnalité permettant aux propriétaires de contenu de facturer les bots IA pour l'accès. Le service de pare-feu applicatif web d'Amazon propose désormais des outils de monétisation des requêtes de scraping et d'entraînement de modèles.
Des officiels américains accusent Anthropic de ne pas respecter la directive cybersécurité de Trump et d'avoir lancé Claude 3.5 Sonnet sans approbation. Des discussions sont en cours avec le Département du Commerce, la CIA et le conseiller scientifique Michael Kratsios sur les exigences de modèles « inviolables ».
Les agents de codage locaux sont utiles pour les petites tâches (corrections, lecture de repo, modifications), mais nécessitent une supervision constante. L'utilisateur décrit un workflow itératif : tâche → tests → vérification des diffs → corrections. Sans supervision, les agents produisent du code cassé ou s'écartent de l'objectif.
Un patient atteint de SLA devient le premier utilisateur avancé d'un implant cérébral lui permettant de communiquer. L'interface cerveau-ordinateur restaure partiellement sa capacité à parler via décodage neuronal.
Un utilisateur signale que la mise à jour de LM Studio de 0.4.14 à 0.4.17 a dégradé les performances MTP (Multi-Token Prediction) sur RTX 5090. Le débit est passé de ~100 tokens/s avec MTP à ~70 tokens/s après la mise à jour et l'actualisation du runtime CUDA.
Simulation Simulator, un jeu gratuit sur Steam, intègre un LLM local dans Unity. Le joueur doit convaincre l'IA qu'elle existe dans une simulation. Expérience philosophique avec 5 fins + 1 secrète, conversations uniques.
DXC et Anthropic annoncent un partenariat mondial pour intégrer l'IA générative dans les systèmes critiques des grandes entreprises.
OpenAI acquiert Ona, spécialiste des environnements cloud sécurisés, pour renforcer ses agents IA et sa plateforme Codex. L'acquisition s'inscrit dans la stratégie d'OpenAI de développer des capacités d'agents autonomes.
TencentDB Agent Memory offre une mémoire à long terme entièrement locale pour les agents IA via un pipeline progressif à 4 niveaux, sans dépendances API externes.
GodMode est un navigateur de chat IA offrant accès rapide à ChatGPT, Claude, Bard, Bing et Llama2 dans une seule interface web. Outil de productivité utilisé quotidiennement.
La Commission européenne évalue les implications d'un ordre américain forçant Anthropic à arrêter Fable 5 et Mythos 5 mondialement. Les chercheurs européens débattent entre construire leurs propres modèles fondamentaux ou sécuriser l'accès par contrats. Bâtir une infrastructure locale exigerait capacités de calcul, énergie et fournisseurs compétitifs que l'Europe ne possède pas.
Un utilisateur de r/LocalLLaMA rapporte que la quantification KV (key-value) atteint une qualité remarquable : même avec KV en q4_0 (y compris le drafter), le modèle retrouve précisément les informations dans un contexte de 100k tokens.
Mistral en discussions pour lever 3 milliards d'euros, visant une valorisation de 20 milliards d'euros.
Outil personnel d'agent hybride : planification avec modèle frontier (Codex), exécution locale avec Qwen 3.6 27B sur dual RTX 3090. Architecture 3 niveaux (Planner/Local/Senior optionnel) pour minimiser coûts frontier tout en gardant capacités de raisonnement. Validation déterministe des tâches.
Article historique sur l'origine du puzzle des enfants boueux, fondateur de la logique épistémique. Retrace les publications logiques et littéraires sur deux siècles. Présente des variations (nombres, chapeaux colorés) et un nouveau puzzle auto-référentiel.
Article proposant une architecture logicielle (Personal Care Utility) pour transformer les données de santé quotidiennes (CGM, sommeil, activité, médicaments) en événements de vie sémantiques et guidance personnalisée. Démonstrée sur le diabète de type 2 avec séparation entre décisions cliniques validées et raisonnement LLM pour communication.
YeasierAgent propose un paradigme de construction d'applications basé sur des agents symbiotiques, des mondes narratifs et des interactions conscientes de la scène. Le système unifie la génération automatisée, les mondes créés par les utilisateurs et la collaboration multi-agents spatiale pour créer des applications agent-natives cross-platform sans dépendre de mises en page graphiques fixes.
Support de Command A Plus et North Mini Code ajouté à llama.cpp. L'utilisateur a converti et quantisé Command A Plus en GGUFs faute de versions à jour disponibles.