Sharing my 'Local-LLM-Toolkit' repo
Partage d'un repo GitHub 'Local-LLM-Toolkit' documentant techniques d'optimisation pour LLM locaux sur Mac Studio M4 Max 128GB. Inclut code C et Swift pour améliorer les performances.
Partage d'un repo GitHub 'Local-LLM-Toolkit' documentant techniques d'optimisation pour LLM locaux sur Mac Studio M4 Max 128GB. Inclut code C et Swift pour améliorer les performances.
Appel à contributions pour l'atelier U&ME (Unlearning & Model Editing) à ECCV 2026. Les organisateurs recherchent des soumissions sur le désapprentissage, l'édition de modèles, la fusion de modèles, la compression et l'apprentissage continu. Bienvenue aux travaux en cours et aux idées exploratoires.
Gstack : suite de 23 outils Claude Code configurés selon le setup de Garry Tan, couvrant les rôles de CEO, designer, manager d'ingénierie, release manager, ingénieur doc et QA.
Gstack : configuration Claude Code de Garry Tan avec 23 outils spécialisés pour automatiser les rôles de CEO, designer, manager d'ingénierie, release manager, ingénieur doc et QA.
OpenBB est une plateforme de données financières destinée aux analystes, quants et agents IA. Disponible en open-source sur GitHub, elle offre un accès unifié aux données de marché.
TrendRadar est un agrégateur de tendances IA qui agrège les actualités multi-plateformes via RSS avec alertes intelligentes. Filtre par mots-clés, traduit et analyse les articles via IA, supporte MCP pour dialogues en langage naturel, déploiement Docker avec données locales/cloud, intégrations WeChat/Feishu/DingTalk/Telegram/Slack.
George Hotz avertit que les agents de codage IA seront « l'une des erreurs les plus coûteuses » du développement logiciel. Après six mois de tests, il conclut que les LLM produisent des prototypes rapides mais génèrent des bugs difficiles à détecter. Son positionnement reflète les divergences profondes dans la communauté IA sur le rôle des LLM.
Utilisateur rapporte 1000 tokens/s en génération sur Qwen 3.6 27B avec V100s en batch 128, et 80 t/s en single-user (batch 1) sans MTP. Throughput de traitement atteint 3000 t/s.
RAG4Outcome est un framework RAG multimodal pour prédire l'évolution de l'ostéomyélite chronique. Il intègre rapports PET-CT, dossiers chirurgicaux et notes de suivi dans un pipeline unifié avec corpus spécialisé et prompting guidé par experts. Résultats préliminaires sur cas réels montrent efficacité et alignement clinique.
World Machine est une architecture de modélisation générative basée sur transformers avec états latents pour les séries temporelles. Elle réduit la complexité quadratique des transformers classiques et s'adapte à différentes quantités de données observées. Validation sur dataset synthétique Toy1D.
Article théorique proposant une échelle cognitive de Kardashev pour quantifier la capacité de calcul IA qu'une civilisation pourrait soutenir. Basé sur quatre paramètres (puissance totale, part dédiée à la cognition, efficacité énergétique, référence cerveau), l'étude estime l'humanité actuelle à K≈0.73 (Type I). À Type I avec 1% de puissance dédiée, chaque humain disposerait d'une IA personnelle équivalente.
Article théorique sur l'adaptation du rare switching aux bandits linéaires avec bruit gaussien pour la confidentialité. Le déterminant seul ne suffit plus car la monotonie de la matrice de design échoue. Solution : règle basée sur le quotient de Rayleigh généralisé, validée par Codex.
Foundation Protocol propose une couche de coordination pour les agents autonomes en interaction. Le système unifie agents, outils, ressources, humains et institutions via un graphe, supporte la collaboration multi-agents et les primitives économiques (métering, règlements). Conçu pour s'intégrer aux protocoles existants tout en garantissant traçabilité et responsabilité.
Hugging Face clarifie la terminologie des agents IA : distinction entre harness (infrastructure d'exécution), scaffold (structure de coordination) et agent (système autonome). Définitions essentielles pour éviter la confusion dans l'écosystème.
MergeNB est une extension VS Code pour résoudre les conflits de fusion dans les notebooks Jupyter. Développée comme alternative à nbdime, elle offre une interface web intuitive et sera étendue en outil git mergetool cet été.
Simon Willison a utilisé Claude pour recréer Mad House, un jeu des années 1980 du livre Usborne « Creepy Computer Games » (1983), en version interactive JavaScript/HTML avec interface rétro. L'éditeur britannique Usborne a publié gratuitement les PDFs de ses livres informatiques des années 1980.
La mémoire représente désormais près de deux tiers des coûts des composants des puces IA. Cette tendance reflète l'augmentation des besoins en bande passante et capacité de stockage pour les modèles de plus en plus volumineux.
JetBrains et Microsoft lancent le support officiel de Kotlin pour Visual Studio Code en version alpha. L'extension offre l'autocomplétion, la navigation de code et le débogage pour le langage Kotlin.
DeepSeek lance Reasonix, un agent de codage natif optimisé pour le cache et les coûts réduits. Le modèle exploite les capacités de raisonnement de DeepSeek avec une architecture spécialisée pour les tâches de génération de code.
Étude sur la fragilité des agents LLM en génération de code backend. Les contraintes imposées aux modèles se dégradent progressivement, réduisant leur capacité à respecter les spécifications techniques. Problème critique pour les systèmes de production.
Développeur crée une liaison CUDA pour Go sans cgo, chargeant libcuda.so à l'exécution via purego. Résout les problèmes de thread affinity avec runtime.LockOSThread. Projet précoce, développé les weekends, avec support GPU multi-GPU et Graphs en cours. Repo: github.com/eitamring/gocudrv.
Qwen 3.6-35B en version non-MTP joue correctement à DCSS (roguelike open-source). Test pratique sur LM Studio avec RTX 5090 : personnage Minotaure niveau 5, 47 HP, plusieurs ennemis vaincus. Version MTP produit des appels d'outils mal formés. Benchmark alternatif aux scores officiels.
Pi est un toolkit d'agents IA offrant une CLI d'agent de codage, une API LLM unifiée, des bibliothèques TUI/web UI, un bot Slack et support vLLM pods.
Sail est un remplaçant Apache Spark écrit en Rust, unifiant le traitement batch, le streaming et les workloads IA intensifs en calcul.
Modrinth publie son monorepo complet sur GitHub. Le dépôt contient l'intégralité du code source de la plateforme de distribution de mods.
Plano est un proxy et data plane natif IA pour applications multi-agents, intégrant orchestration, sécurité, observabilité et routage LLM intelligent.
Vibe-Kanban est un outil open-source qui amplifie la productivité des agents de code comme Claude Code et Codex via une interface Kanban. Permet de gérer les tâches de développement avec des agents IA.
Trigger.dev est une plateforme pour construire et déployer des agents IA et workflows entièrement gérés. Le projet GitHub trending propose une infrastructure complète pour orchestrer des agents autonomes en production.
Presenton est un générateur de présentations IA open-source avec API, positionnée comme alternative à Gamma, Beautiful AI et Decktopus. Le projet GitHub propose une solution automatisée pour créer des diaporamas.
Twenty est une alternative open-source à Salesforce conçue pour l'IA. Le projet gagne en popularité sur GitHub Trending, positionnant les CRM open-source comme concurrent viable aux solutions propriétaires.
Pi est une boîte à outils pour agents IA incluant un CLI d'agent de codage, une API LLM unifiée, des bibliothèques TUI et web UI, un bot Slack et support vLLM pods.
Onyx est une plateforme IA open-source pour le chat avec support multi-LLM et fonctionnalités avancées. Disponible sur GitHub, elle permet l'intégration de différents modèles de langage.
Qwen 3.6-35B quantisé en GGUF et Safetensors, testé sur Beelink GTR9 Pro avec contexte 200k tokens. Aucun glitch, boucles ou appels répétés d'outils observés. Supporte MTP, non censuré. Quantifications APEX recommandées.
Un utilisateur exécute des tâches comptables (clôtures mensuelles, rapprochements bancaires) avec Qwen 3.6 27B en local, intégré à Claude et au repo financial-services d'Anthropic. Malgré une GPU limitée, le modèle produit des résultats fiables, illustrant la maturité croissante des LLM locaux pour des cas d'usage professionnels.
Polsia a levé 30M$ mais une source révèle des pratiques douteuses : ARR fictif, utilisateurs inactifs comptabilisés, accès administrateur non autorisé aux comptes clients.
Trois nouvelles vulnérabilités Linux (Dirty Frag, Copy Fail, Fragnesia) révèlent une tendance inquiétante de failles de sécurité dans le noyau. Ces bugs affectent la gestion mémoire et la fragmentation, exposant les systèmes à des exploits critiques.
Classement des 10 dépôts IA à croissance la plus rapide : codegraph (+14.1K stars) pour graphes de code locaux, openhuman (+17.1K) pour IA personnelle, academic-research-skills (+11.6K) pour Claude Code, et outils d'agents, mémoire persistante, TTS multilingue, génération vidéo agentic.
Le Texas poursuit Meta et WhatsApp pour avoir fait des déclarations trompeuses sur le chiffrement et la confidentialité. L'action en justice conteste les affirmations marketing concernant la protection des données utilisateurs.
Multica est une plateforme open-source de gestion d'agents IA. Elle transforme les agents de codage en coéquipiers : assignation de tâches, suivi de progression, composition de compétences.
grpc-rust : implémentation native gRPC client/serveur avec support async/await. Projet open-source pour Rust.