Policy Gradient with PyTorch
Hugging Face publie un guide sur les policy gradients avec PyTorch. L'article couvre les fondamentaux de l'apprentissage par renforcement et implémente des algorithmes classiques. Code et exemples reproductibles inclus.
16 articles
Hugging Face publie un guide sur les policy gradients avec PyTorch. L'article couvre les fondamentaux de l'apprentissage par renforcement et implémente des algorithmes classiques. Code et exemples reproductibles inclus.
Guide pratique de Hugging Face pour débuter un premier projet ML. Couvre les étapes fondamentales : définition du problème, collecte de données, entraînement et déploiement. Ressources et outils recommandés inclus.
OpenAI décrit les mesures de sécurité mises en place pour DALL·E 2 afin de prévenir la génération d'images violant sa politique de contenu. L'objectif est de rendre le modèle accessible tout en réduisant les risques liés aux modèles puissants de génération d'images.
Hugging Face lance une plateforme d'évaluation intégrée au Hub permettant de benchmarker les modèles directement. Les utilisateurs peuvent créer des évaluations personnalisées, comparer les performances et partager les résultats sans infrastructure externe.
Hugging Face intègre DeepSpeed pour accélérer l'entraînement de grands modèles. La solution optimise la mémoire et la vitesse via le partitionnement de modèle, l'optimisation de gradient et la précision mixte.
OpenAI entraîne un réseau de neurones à jouer à Minecraft via Video PreTraining (VPT) sur des vidéos non-annotées de joueurs humains. Le modèle apprend à fabriquer des outils en diamant (tâche de 24 000 actions) avec peu de données étiquetées. Il utilise l'interface native (clavier/souris) et représente un pas vers des agents informatiques généraux.
Guide d'introduction aux embeddings : représentations vectorielles de texte, images ou données. Explique les cas d'usage (RAG, recherche sémantique, clustering) et comment utiliser les modèles d'embedding via Hugging Face.
Hugging Face Optimum permet de convertir les modèles Transformers en format ONNX pour optimiser les performances d'inférence. L'outil automatise la conversion et offre des options de quantification et d'optimisation pour déployer efficacement sur CPU et GPU.
OpenAI explore comment les grands modèles de langage évoluent et s'améliorent. L'article examine les mécanismes d'apprentissage et les capacités émergentes des LLM à travers différentes échelles de modèles.
Intel et Hugging Face s'associent pour démocratiser l'accélération matérielle du machine learning. Le partenariat vise à rendre les outils d'optimisation et d'inférence plus accessibles aux développeurs, en intégrant les technologies Intel dans l'écosystème Hugging Face.
Hugging Face publie le troisième volet d'une série sur les insights ML appliqués au secteur financier. L'article explore comment les modèles de langage et techniques ML transforment l'analyse financière, la détection de fraude et la gestion de risques.
OpenAI entraîne des modèles à générer des critiques détaillées sur les défauts de résumés. Les évaluateurs humains détectent significativement plus de flaws quand ils voient ces critiques IA. Les modèles plus grands excellent à l'auto-critique, avec une amélioration d'échelle supérieure pour la critique que pour la génération de résumés.
OpenAI publie des techniques pour l'entraînement de grands réseaux de neurones, soulignant les défis d'orchestration de clusters GPU pour des calculs synchronisés à grande échelle.
Hugging Face publie un guide annoté sur les modèles de diffusion, expliquant les mécanismes mathématiques et implémentation pratique du processus de génération d'images par ajout progressif de bruit.
Implémentation de Deep Q-Learning sur Space Invaders. Utilise un réseau de neurones pour approximer les valeurs Q et optimiser la politique d'un agent. Démontre l'apprentissage par renforcement appliqué aux jeux vidéo classiques.
Cohere, OpenAI et AI21 Labs publient des bonnes pratiques préliminaires pour le déploiement de modèles de langage, applicables à toute organisation développant ou déployant des LLM.