RSS

Reddit r/LocalLLaMA

GLM-5.2 démontre une excellente cohérence sur très long contexte et un raisonnement adaptatif sans verbosité excessive. L'utilisateur rapporte des performances proches de GPT-4.5 sur analyse lourde et recherche approfondie, avec une vitesse d'inférence supérieure à GLM-5.1. Le modèle possède sa propre signature conversationnelle distincte.

Qwen Raisonnement Open source

SIG

HYP

Reddit r/LocalLLaMA·18 juin

CEOs of Anthropic and Google DeepMind call for U.S.-led AI coalition in meeting at G7

Dario Amodei (Anthropic) et Demis Hassabis (Google DeepMind) ont appelé à la formation d'une coalition IA dirigée par les États-Unis lors d'une réunion du G7. Les deux dirigeants ont plaidé pour une coordination internationale face aux enjeux géopolitiques de l'IA.

Anthropic DeepMind Régulation

SIG

HYP

Reddit r/LocalLLaMA·17 juin

llama.cpp now supports model management (downloading etc) via API

llama.cpp intègre la gestion de modèles via API (PR #23976). Téléchargement et chargement/déchargement à la demande depuis un répertoire. Interface utilisateur prévue. Déploiement et gestion du cycle de vie complets via API seule.

Llama Open source Infrastructure

SIG

HYP

Reddit r/LocalLLaMA·17 juin

I released Inflect-Nano, an ultra-extreme tiny 4.63m parameter TTS model.

Inflect-Nano-v1, modèle TTS de 4.63M paramètres, est le 2e plus petit modèle de synthèse vocale public. Composé d'un modèle acoustique (3.46M) et d'un vocoder (1.17M), il génère de l'audio 24 kHz en anglais. ~17x plus petit que Kokoro, ~108x plus petit que Chatterbox. Exécutable localement en PyTorch, adapté aux appareils embarqués et assistants vocaux hors ligne.

Voix Open source Outils

SIG

HYP

Reddit r/LocalLLaMA·17 juin

Lin Junyang AI Lab Closes Round at $2B Valuation

Le laboratoire IA de Lin Junyang lève des fonds à une valorisation de 2 milliards de dollars. Lin Junyang, responsable de la ligne Qwen, lance un nouveau projet. La communauté open source anticipe des contributions significatives.

Qwen Open source Financements

SIG

HYP

Reddit r/LocalLLaMA·17 juin

GLM 5.2 Release Video [Made with GLM 5.2]

GLM 5.2 génère des vidéos via Remotion, comparable à Fable mais inférieur à Gemini 3.1 Pro. Surcharge serveurs observée sur OpenRouter avec timeouts sur sorties longues.

Génération de vidéos Gemini Qwen

SIG

HYP

Reddit r/LocalLLaMA·17 juin

US holds off blacklisting China's DeepSeek, more than 100 firms deemed security risks, sources say

Les États-Unis ne placent pas DeepSeek sur liste noire mais identifient plus de 100 entreprises chinoises comme risques de sécurité. Décision politique face aux tensions commerciales et technologiques sino-américaines.

DeepSeek Régulation Business

SIG

HYP

Reddit r/LocalLLaMA·17 juin

PSA: unsloth/GLM-5.2-GGUF is uploading

Unsloth a créé un dépôt HuggingFace pour GLM-5.2 GGUF il y a 30 minutes. Seul le README est présent pour l'instant ; les fichiers GGUF seraient en cours de téléchargement.

Open source Outils

SIG

HYP

Reddit r/LocalLLaMA·17 juin

i post-trained a model to reliably roll a die

Un utilisateur a post-entraîné un modèle pour simuler correctement un lancer de dé (chaque face ~1/6), révélant que les LLM frontière (Claude, GPT, Kimi) répondent systématiquement « 4 ». Il utilise ce problème jouet pour explorer l'exploration en RL versus l'exploitation de stratégies connues.

Reinforcement learning Claude GPT

SIG

HYP

Reddit r/LocalLLaMA·17 juin

llama.cpp - how to free up even more space on your GPU

llama.cpp optimise la gestion mémoire GPU. Les paramètres clés : --no-mmproj-offload libère 1GB pour modèles vision, --cache-type-k/v réduit KV cache de 50-75%, --spec-draft-n-max=2 optimise speculative decoding. Flash attention activé par défaut. Testé sur Qwen 3.6-27B avec contexte 150k sur RTX 3090.

Llama Open source Infrastructure

SIG

HYP

Reddit r/LocalLLaMA·17 juin

We built an open source UI kit for document RAG/agents

Extend publie un kit UI open source (MIT) pour RAG et agents documentaires : 15 composants pour visualiser PDF, DOCX, XLSX avec citations par bounding box, upload de fichiers, e-signature. Construit en interne, éprouvé sur millions de pages/jour, maintenu activement.

RAG Agents IA Open source

SIG

HYP

Reddit r/LocalLLaMA·17 juin

My GLM-5.2-FP8 HGX-H200 SGLang docker deploy config

Configuration Docker pour déployer GLM-5.2-FP8 sur HGX-H200 avec SGLang. Atteint 70 tokens/s et 262k contexte en désactivant DP et moe-a2a-backend deepep, avec mem-fraction-static à 0.83. Les recettes vLLM officielles incompatibles avec H200.

Qwen Génération de code Infrastructure

SIG

HYP

Reddit r/LocalLLaMA·17 juin

Multilingual-Multimodal-NLP/LoopCoder-V2 · Hugging Face

LoopCoder-V2 est un modèle de code 7B basé sur Parallel Loop Transformer (PLT) qui améliore les performances par calcul au test-time via deux passes de blocs Transformer partagés. Entraîné sur 18T tokens de données mixtes texte/code, il atteint 64.4 sur SWE-bench Verified (vs 43.0 baseline), avec deux boucles comme optimum gain-coût.

Génération de code Raisonnement Benchmarks

SIG

HYP

Reddit r/LocalLLaMA·17 juin

Gemma 4 E2B running in-browser at 255 tok/s using WebGPU kernels written by Fable 5

Gemma 4 E2B tourne en navigateur à 255 tokens/sec via kernels WebGPU optimisés par Fable 5. Demo et kernels disponibles sur Hugging Face.

Gemini Génération de code Open source

SIG

HYP

Reddit r/LocalLLaMA·17 juin

GameCraft-Bench: Can Agents Build Playable Games End-to-End in a Real Game Engine?

GameCraft-Bench évalue la capacité d'agents IA à construire des jeux jouables end-to-end dans un moteur de jeu réel. Benchmark teste Opus-4.7, GPT-5.5, Kimi-K2.6, DeepSeek-V4-Pro et autres. Absence de résultats pour modèles médium (27B-31B).

Agents IA Benchmarks Génération de code

SIG

HYP

Reddit r/LocalLLaMA·17 juin

TRELLIS.2 now runs natively on MLX (Image to 3d object model)

Port natif MLX de TRELLIS.2 (Microsoft) pour Apple Silicon. Génération d'objets 3D à partir d'images en 512×512 (~70s) et 1024×1024 (~300-700s) sur M4 Max. Repo GitHub disponible.

Open source Outils Infrastructure

SIG

HYP

Reddit r/LocalLLaMA·17 juin

Making budget models punch above their weight with a smart Rust harness

Un développeur Rust optimise les petits modèles de langage via une architecture système efficace. La harness Rust améliore les performances d'inférence sans modifier les poids du modèle, permettant aux modèles budget de rivaliser avec des versions plus grandes.

Open source Infrastructure Outils

SIG

HYP

Reddit r/LocalLLaMA·17 juin

GLM-5.2 is a win for local AI

GLM-5.2 (744B) sous licence MIT représente une avancée pour l'IA locale malgré son empreinte massive. La communauté pourra distiller ses capacités de raisonnement dans des modèles 8B/70B, améliorant significativement les setups locaux.

Open source Fine-tuning Raisonnement

SIG

HYP

Reddit r/LocalLLaMA·17 juin

Headless screenshot loops let a local 30B agent finish a raytraced FPS demo in pure C

Un agent local Qwen 27B a complété une démo FPS raytraced en C pur en utilisant des boucles de screenshots headless pour déboguer visuellement. L'ajout d'un mode headless permettant à l'agent de capturer des frames et d'inspecter les résultats a transformé l'approche : le modèle a appris à automatiser le débogage visuel récursif.

Qwen Agents IA Génération de code

SIG

HYP

Reddit r/LocalLLaMA·17 juin

I released a local LLM-powered RPG where generated NPCs, locations, items, and quests persist as in-game objects

Développeur lance un RPG local où les PNJ, lieux, objets et quêtes générés par LLM persistent comme objets de jeu. Le système gère l'inventaire et le combat tandis que le LLM génère dialogues, narration et progression. Les éléments générés sont stockés et réutilisables.

Open source Outils Agents IA

SIG

HYP

Reddit r/LocalLLaMA·17 juin

SIQ-1 Qwen3.6 for autoresearch and autonomous agency

SIQ-1 Qwen3.6 : fine-tuning PPO du Qwen-35B-A3 surpassant GLM-5.2 et Qwen-350B sur autoresearch (karpathy benchmark) et bullshit-bench. Modèle + GGUF disponibles sur HuggingFace avec agent démo.

Qwen Reinforcement learning Agents IA

SIG

HYP

Reddit r/LocalLLaMA·17 juin

Local models went from mostly useless to actually useful really fast. What changed?

Les modèles locaux sont passés d'outils marginaux à des solutions viables en un an. Gemma, Qwen, GLM, Kimi remplacent désormais certains appels API pour le code, les documents privés et les workflows locaux, bien que le gap persiste sur les tâches complexes nécessitant planification et correction d'erreurs.

Llama Open source Qwen

SIG

HYP

Reddit r/LocalLLaMA·17 juin

A Year Building a Fully Local Home Voice Assistant · Fulloch

Un développeur a documenté 12 mois de travail pour construire un assistant vocal domestique local avec des modèles open-source, en remplacement d'Alexa. Retour d'expérience sur les approches qui ont fonctionné et les obstacles rencontrés.

Open source Voix Agents IA

SIG

HYP

Reddit r/LocalLLaMA·17 juin

It looks like Rio 3.5 397B could've simply been a semi-failed embezzling of funding

Rio 3.5 397B, financé à hauteur de 100K USD, s'avère être un simple merge de modèles (Nex N2 Pro) sans entraînement supplémentaire, contrairement aux affirmations initiales basées sur Qwen 3.5 397B. Après découverte, l'équipe a modifié la documentation et prétend avoir perdu le modèle entraîné, soulevant des soupçons de détournement de fonds.

Open source Qwen

SIG

HYP

Reddit r/LocalLLaMA·17 juin

Elias in the Lighthouse, Again? Diagnosing Low Diversity in LLM Stories

Analyse de la faible diversité narrative dans les histoires générées par LLM. L'auteur examine pourquoi les modèles produisent des récits répétitifs avec des personnages et structures similaires, malgré des prompts variés.

Llama Prompt engineering Évaluations

SIG

HYP

Reddit r/LocalLLaMA·17 juin

Benchmarks from the latest eBay special: W6800 (modded V620)

Benchmarks d'une carte AMD Radeon Pro W6800 (V620 modifiée avec firmware W6800) testée avec Qwen 3.6 27B Q6_K via llama.cpp. Performance Vulkan : 297.94 t/s (pp1024), 20.35 t/s (tg256). Carte flashed pour mini-displayport mais avec cores compute réduits.

Benchmarks Open source Infrastructure

SIG

HYP

Reddit r/LocalLLaMA·16 juin

VibeThinker-3B: what is this witchcraft? Killing it at MathQA like it has ~30B parameters

VibeThinker-3B, modèle 3B, obtient des résultats exceptionnels sur MathQA comparables à des modèles ~30B. Utilisateurs Reddit rapportent des performances anormalement élevées pour sa taille.

Benchmarks Open source

SIG

HYP

Reddit r/LocalLLaMA·16 juin

I didn't know it was possible to compile llamacpp to run cuda + vulkan at the same time..

Utilisateur compile llama.cpp avec CUDA et Vulkan simultanément sur W7800. Obtient +10% tokens/sec en décodage avec MiniMax-M3-UD-IQ2_M. Teste la combinaison de deux accélérateurs GPU pour optimiser les performances.

Open source Infrastructure

SIG

HYP

Reddit r/LocalLLaMA·16 juin

GLM-5.2 is now 1st on Design Arena — ahead of the now unavailable Claude Fable 5.

GLM-5.2 atteint la 1ère place du classement Design Arena, devançant Claude Fable 5 qui n'est plus disponible. Le modèle de Zhipu AI domine le benchmark de conception.

Benchmarks Qwen

SIG

HYP

Reddit r/LocalLLaMA·16 juin

Minimax M3 (4 bit MLX) Initial Benchmark on Mac Studio M3u 512gb

Benchmark du modèle Minimax M3 en 4-bit MLX sur Mac Studio M3 512GB. Résultats : TTFT 3.1s (pp1024/tg128), throughput 147.7 tok/s, pic mémoire 226.6GB. Batching continu : speedup 1.83x à 4 requêtes parallèles (49.9 tok/s).

Benchmarks Open source Infrastructure

SIG

HYP

Reddit r/LocalLLaMA·16 juin

GLM-5.2 just dropped open weights and it already looks weirdly strong for coding

GLM-5.2 sort en poids ouverts avec licence MIT. Fenêtre de contexte 1M, deux modes de raisonnement, performances fortes en coding sur les arenas. Modèle open-source contrairement aux versions API-only.

Qwen Open source Génération de code

SIG

HYP

Reddit r/LocalLLaMA·16 juin

GLM 5.2 API is live, weights are on HF, and ollama has it already

GLM-5.2 est disponible en API ($1.4/M tokens input, $4.4/M output) et en poids open-source MIT sur HuggingFace. Ollama l'intègre déjà. Benchmarks : 81.0 Terminal-Bench 2.1, 62.1 SWE-bench Pro, 74.4 FrontierSWE. Contexte 1M, deux modes thinking (High/Max).

Open source Génération de code Benchmarks

SIG

HYP

Reddit r/LocalLLaMA·16 juin

Get in here: Community model build thread

Un thread Reddit propose de créer un modèle communautaire via calcul distribué en utilisant une approche Mixture-of-Experts (MoE). La stratégie « Branch-Train-Stitch » distribue un modèle prototype dense à des participants qui l'entraînent indépendamment sur leur matériel, puis fusionnent les sous-modèles en MoE. Les décisions clés incluent la taille du prototype (2B ou 7B) selon la VRAM disponible.

Open source Fine-tuning

SIG

HYP

Reddit r/LocalLLaMA·16 juin

GLM-5.2 is the first open-weights model to cross 80% on Terminal-Bench and beats every other open model available

GLM-5.2 devient le premier modèle open-weights à dépasser 80% sur Terminal-Bench, surpassant tous les autres modèles ouverts et Gemini. Classé frontier-level à coût réduit.

Qwen Benchmarks Open source

SIG

HYP

Reddit r/LocalLLaMA·16 juin

GLM-5.2 Takes #2 Spot on WebDew Arena

GLM-5.2 atteint la 2e place du classement WebDev Arena. Le modèle Qwen positionne bien face aux concurrents majeurs.

Qwen Benchmarks

SIG

HYP

Reddit r/LocalLLaMA·16 juin

GLM-5.2 is available on HuggingChat

GLM-5.2, le modèle de Zhipu AI, est désormais accessible via HuggingChat. Pas de détails techniques fournis dans l'annonce.

Qwen

SIG

HYP

Reddit r/LocalLLaMA·16 juin

A benchmark for tiny LLMs based on a real world problem: natural language file search (using monkeSearch)

Benchmark pour petits LLM (<3B paramètres) évaluant la capacité à parser du langage naturel en JSON structuré pour la recherche de fichiers. 9 modèles testés (Gemma-3 270M à DeepSeek R1 Distill 1.5B) sur 80 requêtes couvrant types de fichiers, contexte temporel et spécificité. Résultats : modèles 0.8B–1.5B surpassent les sub-0.5B.

Benchmarks Open source Génération de code

SIG

HYP

Reddit r/LocalLLaMA·16 juin

Mistral - New family of open-weight models @ July

Mistral annonce une nouvelle famille de modèles open-weight en juillet. Le tweet d'Arthur Mensch (CEO) confirme le lancement sans détails techniques supplémentaires dans l'extrait.

Mistral Open source

SIG

HYP

Reddit r/LocalLLaMA·16 juin

Glimmer 1 - Glint Research. A foundational 10,000 parameter language model

Glint Research présente Glimmer 1, un modèle de langage fondationnel de 10k paramètres entraîné sur 500K tokens de FineWeb-Edu. Architecture standard Llama avec 16 dimensions cachées, 2 couches, 4 têtes d'attention et fenêtre de contexte de 512 tokens. Benchmarks : arc_easy 25.46%, wikitext-2 perplexité 14.73 (byte).

Llama Open source Benchmarks

SIG

HYP

Reddit r/LocalLLaMA·16 juin

zai-org/GLM-5.2 is here!

GLM-5.2 est disponible. Le modèle de zai-org améliore les capacités de raisonnement et de compréhension par rapport aux versions antérieures.

Open source

SIG

HYP

Reddit r/LocalLLaMA·16 juin

bartowski/command-a-plus-05-2026-GGUF · Hugging Face

Publication d'une version GGUF du modèle Command-A-Plus-05-2026 sur Hugging Face. L'auteur invite les utilisateurs à tester avec la dernière version de llama.cpp et à partager leurs benchmarks de tokens/seconde.

Open source Outils Benchmarks

SIG

HYP

Reddit r/LocalLLaMA·16 juin

[Article] The Case For Open-Weight Models And Why We Can't Trust Frontier Labs | provos.org

Article argumentant pour les modèles open-weight face aux labs frontier. Critique la concentration du pouvoir chez quelques entreprises et plaide pour l'accessibilité et la transparence des poids de modèles IA.

Open source Llama Alignement

SIG

HYP

Reddit r/LocalLLaMA·16 juin

Anthropic going back on `claude -p` 3rd party usage

Anthropic revient sur sa décision de bloquer l'accès à Claude via des wrappers tiers pour claude-p. La communauté soupçonne un revirement de communication plutôt qu'un changement stratégique durable, contrairement aux bannissements antérieurs d'OpenClaw et Hermes.

Claude Open source

SIG

HYP

Reddit r/LocalLLaMA·16 juin

Scaling former VibeThinker-1.5B to 3B — now it reaches frontier math & coding performance

VibeThinker-3B atteint 94.3 sur AIME'26, 80.2 sur LiveCodeBench v6 et 96.1% de réussite sur des concours LeetCode inédits. Le modèle démontre que les petits modèles peuvent atteindre des performances de frontier en raisonnement mathématique et codage grâce à des signaux de vérification clairs.

Raisonnement Benchmarks Génération de code

SIG

HYP

Reddit r/LocalLLaMA·16 juin

Qwen Robot Suite

Alibaba annonce Qwen Robot Suite, une suite logicielle pour robotique basée sur ses modèles Qwen. Détails techniques et capacités non précisés dans l'extrait.

Qwen Robotique

SIG

HYP

Reddit r/LocalLLaMA·16 juin

Why might DiffusionGemma be better at tool calls than its benchmark quality suggests

DiffusionGemma génère 256 tokens en parallèle avec attention bidirectionnelle, permettant l'auto-correction avant finalisation. Contrairement aux modèles autorégressifs figés après chaque token, cette architecture pourrait améliorer les appels d'outils structurés malgré une qualité de base inférieure à Gemma 4. Reste à tester si la correction bidirectionnelle compense la qualité plus faible.

Gemini Génération de code Raisonnement

SIG

HYP

Reddit r/LocalLLaMA·16 juin

Qwen3.6 27B quants

Utilisateur teste Qwen3.6 27B en quantization extrême (IQ3 XXS turbo4) vs Q8 sur tâche de review de code. IQ3 XXS (5min, 1230pp/50tg) produit recommandations comparables à Q8 (1h56m, 306pp/3tg). Conclusion : quantization agressive suffisante pour coding si prompt/jugement solides.

Qwen Génération de code Fine-tuning

SIG

HYP

Reddit r/LocalLLaMA·16 juin

Gemma 12b - Reasoning hardening instructions

Un utilisateur partage une instruction système pour améliorer le raisonnement de Gemma 12b QAT. La technique vise à réduire les biais cognitifs et à adapter la profondeur de réflexion selon le contexte. Elle fonctionne bien sur les questions pièges mais échoue partiellement sur certains problèmes selon leur formulation.

Gemini Prompt engineering Raisonnement

SIG

HYP

Reddit r/LocalLLaMA·16 juin

Be wary of Qwen/Claude distillations - they're often worse than the base model

Les distillations Qwen/Claude circulant sur r/LocalLLaMA (Qwopus, Fable 5 sur Qwen 3.6) utilisent 4k-10k samples d'entraînement, insuffisant pour améliorer les performances. Comparé aux 700k samples des distillations DeepSeek-R1 officielles, ces modèles ne dépassent pas le Qwen de base et dégradent légèrement la qualité malgré un style de raisonnement différent.

Qwen Claude Fine-tuning

SIG

HYP

Reddit r/LocalLLaMA·16 juin

Donate your coding sessions to an open CC-BY-4.0 dataset to help train open-weight and open source models

Initiative Trace Commons : collecte de traces de sessions de codage sous licence CC-BY-4.0 pour entraîner des modèles open-source et open-weight. Objectif : contrebalancer l'avantage compétitif d'Anthropic et OpenAI qui accumulent des données propriétaires via Claude Code et Codex.

Open source Génération de code Agents IA

SIG

HYP

Reddit r/LocalLLaMA

Quick thoughts on GLM-5.2 (Bonus: Censorship question answers)

CEOs of Anthropic and Google DeepMind call for U.S.-led AI coalition in meeting at G7

llama.cpp now supports model management (downloading etc) via API

I released Inflect-Nano, an ultra-extreme tiny 4.63m parameter TTS model.

Lin Junyang AI Lab Closes Round at $2B Valuation

GLM 5.2 Release Video [Made with GLM 5.2]

US holds off blacklisting China's DeepSeek, more than 100 firms deemed security risks, sources say

PSA: unsloth/GLM-5.2-GGUF is uploading

i post-trained a model to reliably roll a die

llama.cpp - how to free up even more space on your GPU

We built an open source UI kit for document RAG/agents

My GLM-5.2-FP8 HGX-H200 SGLang docker deploy config

Multilingual-Multimodal-NLP/LoopCoder-V2 · Hugging Face

Gemma 4 E2B running in-browser at 255 tok/s using WebGPU kernels written by Fable 5

GameCraft-Bench: Can Agents Build Playable Games End-to-End in a Real Game Engine?

TRELLIS.2 now runs natively on MLX (Image to 3d object model)

Making budget models punch above their weight with a smart Rust harness

GLM-5.2 is a win for local AI

Headless screenshot loops let a local 30B agent finish a raytraced FPS demo in pure C

I released a local LLM-powered RPG where generated NPCs, locations, items, and quests persist as in-game objects

SIQ-1 Qwen3.6 for autoresearch and autonomous agency

Local models went from mostly useless to actually useful really fast. What changed?

A Year Building a Fully Local Home Voice Assistant · Fulloch

It looks like Rio 3.5 397B could've simply been a semi-failed embezzling of funding

Elias in the Lighthouse, Again? Diagnosing Low Diversity in LLM Stories

Benchmarks from the latest eBay special: W6800 (modded V620)

VibeThinker-3B: what is this witchcraft? Killing it at MathQA like it has ~30B parameters

I didn't know it was possible to compile llamacpp to run cuda + vulkan at the same time..

GLM-5.2 is now 1st on Design Arena — ahead of the now unavailable Claude Fable 5.

Minimax M3 (4 bit MLX) Initial Benchmark on Mac Studio M3u 512gb

GLM-5.2 just dropped open weights and it already looks weirdly strong for coding

GLM 5.2 API is live, weights are on HF, and ollama has it already

Get in here: Community model build thread

GLM-5.2 is the first open-weights model to cross 80% on Terminal-Bench and beats every other open model available

GLM-5.2 Takes #2 Spot on WebDew Arena

GLM-5.2 is available on HuggingChat

A benchmark for tiny LLMs based on a real world problem: natural language file search (using monkeSearch)

Mistral - New family of open-weight models @ July

Glimmer 1 - Glint Research. A foundational 10,000 parameter language model

zai-org/GLM-5.2 is here!

bartowski/command-a-plus-05-2026-GGUF · Hugging Face

[Article] The Case For Open-Weight Models And Why We Can't Trust Frontier Labs | provos.org

Anthropic going back on `claude -p` 3rd party usage

Scaling former VibeThinker-1.5B to 3B — now it reaches frontier math & coding performance

Qwen Robot Suite

Why might DiffusionGemma be better at tool calls than its benchmark quality suggests

Qwen3.6 27B quants

Gemma 12b - Reasoning hardening instructions

Be wary of Qwen/Claude distillations - they're often worse than the base model

Donate your coding sessions to an open CC-BY-4.0 dataset to help train open-weight and open source models