Hugging Face Blog·29 septembre 2023

Finetune Stable Diffusion Models with DDPO via TRL

Signal

Hype

En 3 lignesHugging Face publie un guide pour affiner les modèles Stable Diffusion via DDPO (Diffusion DDPOTrainer) intégré à TRL. La méthode permet d'optimiser les modèles de génération d'images selon des récompenses personnalisées sans données d'entraînement supplémentaires.

Lire la source

Ton avis ?

Fine-tuning Génération d'images Reinforcement learning Open source Outils

Résumé généré par Claude — vérifié par l'humain

Finetune Stable Diffusion Models with DDPO via TRL

Autres angles sur ce sujet