Improving instruction hierarchy in frontier LLMs
Signal
72
Hype
28
En 3 lignesOpenAI présente IH-Challenge, une méthode d'entraînement qui améliore la hiérarchie des instructions dans les LLM frontier. Elle renforce la priorité des instructions de confiance, la sécurité et la résistance aux attaques par injection de prompts.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain