RSS is back. AI agents are reading it
Les agents IA redécouvrent RSS pour l'agrégation de contenu. Les flux RSS, déclarés morts il y a une décennie, redeviennent pertinents comme source structurée pour les systèmes autonomes.
En IA, les outils (tools) sont des fonctions externes qu'un modèle peut appeler pour agir sur le monde réel : recherche web, exécution de code, lecture de fichiers. GPT-4o, par exemple, peut invoquer une API météo pour répondre avec des données en temps réel.
Les agents IA redécouvrent RSS pour l'agrégation de contenu. Les flux RSS, déclarés morts il y a une décennie, redeviennent pertinents comme source structurée pour les systèmes autonomes.
Sortie de micropython-wasm 0.1a1 avec corrections de limitations identifiées lors du développement de datasette-agent-micropython. Permet d'exécuter du Python en WebAssembly avec sandboxing.
Gemma 4 E4B en format LiteRT avec moteur Google atteint 157.2 tok/s en génération de texte, 2.4× plus rapide que Q4 GGUF (66.3 tok/s) grâce à la prédiction multi-tokens (MTP). Captionnage d'images : gain marginal de 1.1× car le goulot est l'encodeur vision. Testé sur RTX 4060 Ti 16GB.
RePlaya est un outil open-source de replay de sessions navigateur auto-hébergé avec suivi en direct. Permet d'enregistrer et rejouer les interactions utilisateur sans dépendre de services externes.
Outil CLI qui empaquète les projets de data science pour les fenêtres de contexte des LLM. Permet de préparer et compresser les données de projet pour optimiser l'utilisation du contexte disponible dans les modèles de langage.
Benchmark de 20 petits LLMs sur GPU RTX 4050 6GB. L'auteur teste des quantifications Q4/Q6 GGUF avec 6 probes qualitatives (tool-call, JSON strict, décomposition de plan, pas d'hallucination de chemin) plutôt que des suites complètes, mesurant vitesse de préfill et génération à 1k/8k/32k tokens pour identifier les modèles viables en local sur hardware limité.
Comparaison des frameworks d'agents IA en 2026 : LangGraph pour workflows stateful, CrewAI pour prototypes multi-agents, LlamaIndex pour RAG, Pydantic AI pour services type-safe. L'auteur recommande d'éviter les frameworks pour cas simples et de bien spécifier le job avant de choisir.
Bonsai Image 4B propose des modèles de génération d'images quantifiés (1-bit et ternaire) pesant respectivement 0,93 GB et 1,21 GB. Ces versions compressées de Diffusion Transformer s'exécutent sur appareils locaux avec empreinte mémoire minimale.
Hugging Face présente Holo3.1, un agent informatique local et rapide capable d'automatiser des tâches sur ordinateur. Le modèle fonctionne sans cloud, offrant vitesse et confidentialité pour l'exécution d'actions système.
Pull request pour llama.cpp ajoutant un toggle de mode « thinking » avec niveaux d'effort de raisonnement et améliorations de l'UI du formulaire de chat. Fonctionnalité visible en vidéo.
Headroom compresse les sorties d'outils, logs, fichiers et chunks RAG avant envoi au LLM. Réduit de 60-95% les tokens consommés sans dégrader la qualité. Disponible en bibliothèque, proxy et serveur MCP.
Open-LLM-VTuber permet d'interagir avec n'importe quel LLM via voix sans mains libres, interruption vocale et avatar Live2D animé en local sur plusieurs plateformes.
Google Workspace CLI : outil en ligne de commande unifié pour Drive, Gmail, Calendar, Sheets, Docs, Chat, Admin. Généré dynamiquement via Google Discovery Service. Inclut des capacités d'agent IA.
Outil permettant de cloner n'importe quel site web en une seule commande via des agents IA de codage. Projet open-source sur GitHub Trending.
Context-mode optimise la fenêtre de contexte pour les agents IA de codage en isolant les sorties d'outils. Réduit la consommation de tokens de 98%. Compatible avec 15 plateformes.
Nanoclaw est une alternative légère à OpenClaw exécutée en conteneurs. Intègre WhatsApp, Telegram, Slack, Discord, Gmail et autres apps de messagerie. Inclut mémoire, tâches planifiées, fonctionne sur l'Agents SDK d'Anthropic.
Open-LLM-VTuber permet d'interagir avec n'importe quel LLM via voix sans mains libres, interruption vocale et animation Live2D faciale en local sur plusieurs plateformes.
Headroom compresse les sorties d'outils, logs, fichiers et chunks RAG avant envoi au LLM. Réduit de 60-95% les tokens consommés sans dégrader les réponses. Disponible en library, proxy et serveur MCP.
Un développeur cherche à construire un tuteur IA hors ligne gratuit basé sur un manuel universitaire. Architecture envisagée : RAG comme composant principal (chunking, embedding, retrieval avec citations page/section) + LoRA optionnelle pour le style pédagogique. Questions sur le choix du modèle (Qwen, Gemma), la gestion des structures complexes (figures, équations), et le packaging pour utilisateurs non-techniques.
OpenAI intègre un moteur de recherche d'emploi dans ChatGPT, affichant des offres personnalisées d'Indeed, Upwork et Appcast (US uniquement). Les utilisateurs peuvent créer et adapter des CV directement dans ChatGPT.
OpenAI annonce de nouveaux plugins Codex, sites et annotations pour étendre l'accès à la génération de code au-delà des développeurs : analystes, marketeurs, designers, investisseurs et autres rôles.
Niels de Hugging Face annonce paperswithcode.co, une plateforme de suivi SOTA relancée. Nouvelle fonctionnalité : indexation des conférences majeures (NeurIPS, CVPR, ICML). Les 2026 papiers CVPR sont catalogués par tâche, avec liens arXiv, GitHub, pages projet, artefacts HF et évaluations.
Un utilisateur a construit un pipeline de scraping à grande échelle agrégéant 2M+ offres d'emploi actives de 100,000+ sites carrière d'entreprises. Dataset en Parquet, mis à jour quotidiennement, accessible gratuitement avec champs standards (titre, entreprise, description, localisation, URL).
Vercel permet désormais de configurer les paramètres Git de tous les projets d'un monorepo en un seul endroit, au lieu de passer par chaque projet individuellement. Les paramètres incluent le statut de commit et les événements repository_dispatch.
Simon Willison a créé un outil web qui reproduit la fonctionnalité de Claude.ai : détecter les gros volumes de texte collés et les convertir automatiquement en pièces jointes. L'outil supporte aussi l'ouverture directe de fichiers et d'images (affichées en miniatures) et le drag-and-drop.
FETCH, un classifier pour le triage juridique automatisé, génère des questions de suivi via un ensemble économique de LLMs. L'étude montre que les modèles bon marché performent bien en classification, mais la génération de questions en langage clair de qualité requiert GPT-4 ou supérieur. Le prompt engineering seul ne suffit pas ; les évaluations LLM-as-judge divergent des évaluations humaines.
Workflow IA itératif pour optimiser les anodes en graphite via apprentissage séquentiel et retours expérimentaux. Plateforme Citrine utilisée pour générer modèles de substitution et affiner contraintes de faisabilité. Résultats : fiabilité de fabrication passée de défaillances fréquentes à 100%, capacité ≥350 mAh/g augmentée de 28,4% à 84,8%, rétention de capacité de 42,1% à 97,3%.
Étude de l'efficacité et l'efficience du tool-calling dans les agents LLM. Les auteurs montrent que les pipelines d'évaluation sont sensibles à des choix mineurs (seed, prompt système, templates multi-tours) affectant la fiabilité des classements. Ils identifient deux sources de gaspillage computationnel en RL et proposent deux techniques d'accélération sans dégradation de performance.
Sortie de micropython-wasm 0.1a0 : un paquet expérimental qui combine une build WASM de MicroPython avec un wrapper wasmtime pour exécuter du code Python en sandbox.
Google publie Gemma Skills, une bibliothèque officielle pour améliorer les capacités de Gemma et les interactions modèle/agent. Version initiale disponible sur GitHub.
Vercel Blob propose désormais des URLs signées limitées dans le temps pour télécharger, envoyer, inspecter ou supprimer des objets sans accès complet au stockage. Chaque URL est restreinte à une opération unique, un chemin spécifique et une expiration jusqu'à 7 jours. Les uploads multipart permettent au navigateur de streamer directement vers Blob sans passer par le serveur.
Utilisateur compare Qwen 3.6 27B (8-bit, exécuté localement) à Gemini Pro pour des tâches de recherche et conseil. Qwen surpasse Gemini sur les analyses approfondies (carrière, immigration, documentation officielle), tandis que Gemini hallucine et se fixe sur des messages antérieurs. Performance améliorée après support MTP dans llama.cpp.
Un outil gratuit d'évaluation des risques EU AI Act : formulaire 10 questions, classification automatique du tier de risque, rapport PDF avec articles applicables. L'auteur envisage un SDK de monitoring Python pour documenter la conformité technique à l'inférence.
Vercel déploie la surveillance automatique de la mémoire sur ses machines de build élastiques. Le système ajuste dynamiquement les ressources pour éviter les défaillances OOM : upgrade automatique si la mémoire approche du seuil, dégradation évitée pour les builds rapides mais gourmands.
Guide pratique pour construire un agent IA basique en partant de zéro, en mettant l'accent sur l'intégration d'outils. Approche pédagogique sans dépendances externes lourdes.
Visa investit dans Replit pour développer des paiements autonomes destinés aux développeurs. L'initiative vise à intégrer des capacités de paiement directement dans l'environnement de codage cloud de Replit.
Système de routage ASR multilingue léger pour matériel local, utilisant Zipformer, Silero VAD et SpeechBrain. Dirige l'audio entre modèles monolingues spécialisés (~100M paramètres) plutôt qu'un seul modèle massif. Atteint 13% WER sur code-switching inter-énoncés, surpassant les APIs cloud. Limitation connue : 41% WER en intra-énoncés. Repo open-source disponible.
Un développeur a créé Chronos Engine, un outil qui analyse les incohérences narratives en construisant des graphes causals et en détectant les paradoxes temporels. Le système identifie les événements critiques, les boucles d'information sans origine et génère des timelines alternatives stables.
Research Proof est un outil open-source pour valider les améliorations de modèles IA. Il force à documenter la baseline, l'évaluation, les coûts et les régressions potentielles. Utile pour les releases de modèles, fine-tunes, données synthétiques et benchmarks.
fff est un toolkit de recherche de fichiers haute performance pour agents IA, Neovim, Rust, C et NodeJS. Optimisé pour la vitesse et la précision.