Minimax M3 seems to be rolling out on the API
Minimax M3 commence à être déployé sur l'API. Le modèle a été repéré il y a environ 15 minutes sur une capture d'écran.
Kimi est un assistant IA conversationnel développé par Moonshot AI, capable de traiter de très longs contextes de texte. Par exemple, Kimi 1.5 peut analyser des documents de plus de 128 000 tokens en une seule requête.
Minimax M3 commence à être déployé sur l'API. Le modèle a été repéré il y a environ 15 minutes sur une capture d'écran.
Les agents de recherche IA comme GPT-5.4 et Kimi K2.6 confirment surtout leurs connaissances d'entraînement au lieu de vraiment explorer le web. Des chercheurs de l'Institut de technologie de Harbin ont démontré cela avec LiveBrowseComp, un benchmark basé sur des événements des 90 derniers jours. Sans accès à la mémoire d'entraînement, les performances s'effondrent.
Développeur cherche la meilleure infrastructure (~100-150k$) pour servir localement Kimi K2.6 et DeepSeek V4 en équipe de 5 (coding agentic). Compare dual GH200 NVL2 (1.2TB mémoire unifiée, 95k$) vs 8x RTX 6000 Blackwell (768GB VRAM, 140k$). Test GH200 seul : 23 tok/s en décodage 2-bit, mais préfill lent et modèles débordent en mémoire lente.
Hy-MT2 est une famille de modèles de traduction multilingue (1.8B, 7B, 30B-MoE) supportant 33 langues. Le modèle 1.8B quantifié à 1.25-bit pèse 440 MB et accélère l'inférence de 1.5x. Les modèles 7B et 30B surpassent DeepSeek-V4-Pro et Kimi K2.6 en mode fast-thinking; le 1.8B dépasse les APIs commerciales Microsoft et Doubao.
Tencent lance Hy-MT2, famille de modèles de traduction multilingue en trois tailles (1.8B, 7B, 30B-MoE) supportant 33 langues. Le modèle 1.8B compressé à 440 MB via quantization 1.25-bit surpasse les APIs commerciales Microsoft/Doubao. Les 7B et 30B dépassent DeepSeek-V4-Pro et Kimi K2.6. Benchmark IFMTBench et intégration WMT26 inclus.
Cursor lance Composer 2.5, un modèle de code basé sur Kimi K2.5 et entraîné sur 25x plus de tâches synthétiques. Il égale les performances d'Opus 4.7 et GPT-5.5 sur les benchmarks à un coût nettement inférieur.
Mois chargé avec plusieurs sorties majeures : Gemma 4, DeepSeek V4, Kimi K2.6, MiMo 2.5, GLM-5.1. Nathan Lambert couvre aussi l'évaluation V4 de CAISI sur ces modèles open-source.
Kimi K2.6 de Moonshot AI est disponible sur Vercel AI Gateway. Le modèle excelle sur les tâches de codage long-horizon (Rust, Go, Python, front-end, DevOps) et peut générer des interfaces complètes à partir de prompts simples. Optimisé pour les agents autonomes avec meilleure stabilité et sécurité.
Hugging Face analyse l'expansion mondiale des modèles IA chinois (Deepseek, Qwen, Kimi). Ces modèles gagnent des parts de marché en Europe et Asie du Sud-Est grâce à des performances compétitives et des coûts réduits. Les entreprises chinoises investissent massivement dans l'infrastructure et les partenariats régionaux.