OpenAI Blog·7 août 2025

From hard refusals to safe-completions: toward output-centric safety training

Signal

Hype

En 3 lignesOpenAI présente une approche de sécurité centrée sur les outputs pour GPT-5, remplaçant les refus catégoriques par des réponses nuancées. La méthode "safe-completions" améliore à la fois la sécurité et l'utilité face aux prompts à double usage, sans détails techniques ou résultats chiffrés fournis.

Lire la source

Ton avis ?

OpenAI GPT Sécurité IA Alignement

Résumé généré par Claude — vérifié par l'humain

From hard refusals to safe-completions: toward output-centric safety training

Autres angles sur ce sujet