Finetune Stable Diffusion Models with DDPO via TRL
Hugging Face publie un guide pour affiner les modèles Stable Diffusion via DDPO (Diffusion DDPOTrainer) intégré à TRL. La méthode permet d'optimiser les modèles de génération d'images selon des récompenses personnalisées sans données d'entraînement supplémentaires.