From hard refusals to safe-completions: toward output-centric safety training
Signal
45
Hype
65
En 3 lignesOpenAI présente une approche de sécurité centrée sur les outputs pour GPT-5, remplaçant les refus catégoriques par des réponses nuancées. La méthode "safe-completions" améliore à la fois la sécurité et l'utilité face aux prompts à double usage, sans détails techniques ou résultats chiffrés fournis.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain