Open source video is back
Replicate annonce Wan 2.2, son modèle vidéo open source le plus rapide et économique à ce jour.
49 articles
Replicate annonce Wan 2.2, son modèle vidéo open source le plus rapide et économique à ce jour.
Hugging Face publie un tutoriel sur l'implémentation de serveurs MCP (Model Context Protocol) en Python. L'exemple construit un assistant shopping IA avec Gradio, montrant comment intégrer MCP pour étendre les capacités des modèles de langage.
OpenAI lance Stargate Norway, son premier data center IA en Europe via le programme OpenAI for Countries. Stargate est la plateforme d'infrastructure globale d'OpenAI pour déployer l'IA à grande échelle.
Intercom partage trois leçons pour construire un avantage IA durable : évaluations robustes, architecture scalable, et stratégie produit alignée. L'article détaille comment ces principes permettent de maintenir une longueur d'avance dans le support client assisté par IA.
OpenAI lance le « study mode » dans ChatGPT, une fonctionnalité pédagogique qui guide les utilisateurs pas à pas avec des questions, du scaffolding et des retours pour approfondir l'apprentissage.
Hugging Face lance Trackio, une bibliothèque légère de suivi d'expériences pour l'entraînement de modèles. L'outil simplifie le logging des métriques, hyperparamètres et artefacts sans dépendances lourdes.
Hugging Face lance `hf`, une nouvelle interface en ligne de commande plus rapide et conviviale pour interagir avec ses services. Cet outil remplace les commandes précédentes et améliore l'expérience utilisateur pour gérer les modèles, datasets et repositories.
Hugging Face introduit le chunking défini par contenu pour les fichiers Parquet, permettant une segmentation adaptative basée sur la structure des données plutôt que sur des tailles fixes. Cette approche améliore l'efficacité du traitement et du stockage distribué.
Outtake utilise GPT-4.1 et OpenAI o3 pour des agents IA détectant et résolvant les menaces numériques 100 fois plus vite. Aucun détail technique ou benchmark spécifique fourni au-delà du claim de vitesse.
TimeScope évalue la capacité des modèles vidéo multimodaux à traiter des séquences longues. L'étude mesure les performances sur différentes durées vidéo et identifie les limites actuelles des LMM vidéo face aux contenus étendus.
Hugging Face optimise l'inférence LoRA pour Flux via Diffusers et PEFT. La technique réduit la latence et la mémoire en chargeant dynamiquement les adaptateurs LoRA sans dupliquer les poids du modèle de base.
Model ML, startup spécialisée en IA pour la finance, promeut une infrastructure "AI-native" et des agents autonomes pour transformer les workflows des services financiers. Chaz Englander (CEO) détaille cette approche dans la série Executive Function d'OpenAI. Aucun chiffre, benchmark ou déploiement concret mentionné dans l'extrait.
OpenAI annonce sa troisième édition annuelle de DevDay le 6 octobre 2025 à Fort Mason, San Francisco. L'événement rassemble développeurs et partenaires autour des dernières avancées de la plateforme. Pas de détails supplémentaires sur le programme ou les annonces prévues.
OpenAI et Penda Health lancent un copilote clinique IA réduisant les erreurs diagnostiques de 16% en conditions réelles. Déploiement en healthcare avec validation de sécurité et efficacité.
OpenAI publie une analyse économique sur l'impact de ChatGPT. Lancement d'une collaboration de recherche pour étudier les effets de l'IA sur le marché du travail et la productivité.
OpenAI et Oracle s'associent pour développer 4,5 GW de capacité de data center Stargate aux États-Unis. Ce partenariat vise à créer des emplois, accélérer la réindustrialisation américaine et renforcer la leadership IA du pays. Stargate est la plateforme d'infrastructure IA long terme d'OpenAI.
Hugging Face et NVIDIA lancent une intégration pour accélérer le déploiement de LLMs via NVIDIA NIM (Inference Microservices). Les modèles Hugging Face bénéficient d'optimisations matérielles NVIDIA pour réduire latence et coûts d'inférence en production.
OpenAI et le gouvernement britannique annoncent un partenariat stratégique pour accélérer l'adoption de l'IA, stimuler la croissance économique et améliorer les services publics au Royaume-Uni.
Comparaison des meilleurs modèles d'IA pour générer des personnages cohérents à partir d'une seule image de référence.
OpenAI lance un fonds de 50 millions de dollars pour soutenir les organisations à but non lucratif et communautaires, basé sur les recommandations de la Commission Nonprofit indépendante d'OpenAI.
Hugging Face lance l'Arc Virtual Cell Challenge, une compétition centrée sur la modélisation de cellules virtuelles. Le défi vise à avancer la recherche en biologie computationnelle et en apprentissage automatique appliqué aux systèmes biologiques.
Bria intègre Replicate avec une suite de modèles de génération et édition d'images commerciaux, construits sur données licenciées. Destinés aux entreprises et développeurs, ces outils offrent une alternative sécurisée pour l'IA visuelle.
OpenAI lance ChatGPT agent, capable de penser et d'agir en utilisant des outils pour accomplir des tâches (recherche, réservations, présentations) sous supervision utilisateur. Pas de détails techniques ni de date de disponibilité fournis dans l'annonce.
OpenAI publie une System Card pour son modèle agentic ChatGPT, documentant l'intégration de la recherche, l'automatisation de navigateur et les outils de code avec des garde-fous sous le Preparedness Framework.
OpenAI organise le Nonprofit Jam, un événement d'une journée dans 10 villes réunissant plus de 1 000 responsables d'ONG. Partenariat avec la Walton Family Foundation et Emerson Collective pour former les organisations à utiliser les outils OpenAI. Initiative de l'OpenAI Academy destinée aux structures à but non lucratif.
Hugging Face annonce cinq améliorations majeures pour les serveurs Gradio MCP : meilleure intégration avec les outils d'IA, performance accrue, et facilités de déploiement. Les mises à jour permettent une utilisation plus fluide dans les workflows d'agents et applications IA.
Consilium est un framework permettant à plusieurs LLMs de collaborer pour résoudre des problèmes complexes. Le système coordonne les interactions entre modèles via un protocole d'échange structuré, améliorant la qualité des réponses par rapport à un seul modèle.
Hugging Face évalue les capacités des agents IA à prédire des événements futurs. L'étude teste différents modèles sur leur aptitude à anticiper des résultats réels, établissant des benchmarks pour mesurer la performance prédictive des systèmes d'agents.
Invideo AI intègre GPT-4.1, gpt-image-1 et les modèles text-to-speech d'OpenAI pour générer des vidéos professionnelles 10x plus vite. La plateforme transforme des idées créatives en vidéos en quelques minutes.
Article questionnant si l'IA pourrait ralentir la science en créant un paradoxe production-progrès : augmentation du volume de publications sans amélioration proportionnelle de la qualité ou de la compréhension scientifique réelle.
Hugging Face présente Ettin Suite, une collection d'encodeurs et décodeurs appairés atteignant l'état de l'art. Les modèles optimisent les tâches de traduction et de génération de texte avec architectures symétriques.
Replicate détaille l'optimisation de FLUX.1 Kontext [dev] via la technique Taylor Seer. Article technique sur les améliorations de performance du modèle de génération d'images.
Hugging Face migre son Hub de Git LFS vers Xet pour améliorer les performances de téléchargement et réduire les coûts d'infrastructure. Xet offre une meilleure gestion des fichiers volumineux avec compression et déduplication, bénéficiant à des millions d'utilisateurs.
OpenAI adhère au Code de Pratique de l'UE pour l'IA responsable. L'entreprise s'engage à collaborer avec les gouvernements européens sur l'innovation, l'infrastructure et la croissance économique.
Kimina-Prover applique la recherche par renforcement au moment de l'inférence sur des modèles de raisonnement formel. La méthode améliore les performances sur les preuves mathématiques en explorant dynamiquement l'espace de recherche sans réentraînement.
Hugging Face lance un serveur MCP (Model Context Protocol) permettant aux applications d'accéder directement à ses modèles et datasets via une interface standardisée. Le serveur intègre recherche de modèles, téléchargement et exécution d'inférence sans configuration supplémentaire.
Hugging Face lance ScreenEnv, un environnement pour déployer des agents desktop full-stack. L'outil permet aux modèles IA d'interagir avec des interfaces graphiques complètes, ouvrant des cas d'usage d'automatisation avancée.
Hugging Face présente une approche découplant la prédiction d'actions et leur exécution en robotique. Le système utilise l'inférence asynchrone pour améliorer la latence et la réactivité des robots, permettant une exécution d'actions en parallèle avec la prédiction suivante.
Hugging Face présente Reachy Mini, un robot open-source conçu pour les développeurs IA. Le robot intègre des capacités de vision, de manipulation et de mobilité, avec support natif pour les modèles d'IA modernes et les workflows d'apprentissage par renforcement.
Hugging Face présente l'intégration de serveurs MCP (Model Context Protocol) avec Gradio pour améliorer les capacités des LLM. Cette approche permet aux modèles d'accéder à des outils et interfaces personnalisés via le protocole MCP standardisé.
Hugging Face publie un guide pour créer des kernels personnalisés optimisés pour les GPU AMD MI300. Le tutoriel couvre l'implémentation de kernels CUDA/HIP et leur intégration dans les pipelines d'inférence pour améliorer les performances.
OpenAI et l'American Federation of Teachers lancent un programme de 5 ans pour former 400 000 enseignants du K-12 à l'IA en classe. Initiative visant à donner aux éducateurs les outils et compétences pour intégrer l'IA dans l'enseignement.
Hugging Face présente un pipeline de données multimodal optimisé pour réduire la latence et les coûts de traitement. La solution intègre cache distribué, compression et parallélisation pour accélérer l'entraînement de modèles vision-langage.
Hugging Face présente SmolLM3, un modèle de langage compact multilingue capable de traiter des contextes longs et de raisonner. Le modèle combine efficacité computationnelle et capacités avancées de raisonnement.
Hugging Face annonce trois systèmes d'alerte pour soutenir son infrastructure de production. Ces outils renforcent la fiabilité et la surveillance des services hébergés sur la plateforme.
Hugging Face annonce une compétition NeurIPS 2025 sur l'évaluation précoce de modèles de langage (E2LM). Les participants doivent prédire les performances finales de modèles en cours d'entraînement, testant la capacité à évaluer l'efficacité sans attendre la convergence complète.
Genspark a construit un produit IA générant 36M$ ARR en 45 jours en utilisant des agents sans-code alimentés par GPT-4.1 et l'API Realtime d'OpenAI. Démonstration de la viabilité commerciale des agents IA légers et du time-to-market accéléré via les APIs OpenAI.
Hugging Face publie un guide pour entraîner et affiner des modèles d'embeddings creux avec Sentence Transformers. La méthode réduit la dimensionnalité tout en maintenant la performance pour la recherche sémantique et la récupération d'information.
Replicate a organisé un hackathon avec Black Forest Labs autour de FLUX.1 Kontext. L'article présente les projets gagnants de la compétition.