Retour au feed
OpenAI Blog·

The Instruction Hierarchy: Training LLMs to Prioritize Privileged Instructions

Signal
72
Hype
28
En 3 lignesOpenAI présente une hiérarchie d'instructions pour entraîner les LLM à prioriser les instructions privilégiées et résister aux injections de prompts et jailbreaks. La méthode permet aux modèles de distinguer les directives système des entrées utilisateur malveillantes.
Lire la source
Ton avis ?
OpenAISécurité IAAlignementPrompt engineering

Résumé généré par Claude — vérifié par l'humain