The Instruction Hierarchy: Training LLMs to Prioritize Privileged Instructions
Signal
72
Hype
28
En 3 lignesOpenAI présente une hiérarchie d'instructions pour entraîner les LLM à prioriser les instructions privilégiées et résister aux injections de prompts et jailbreaks. La méthode permet aux modèles de distinguer les directives système des entrées utilisateur malveillantes.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain