OpenAI Blog·19 avril 2024

The Instruction Hierarchy: Training LLMs to Prioritize Privileged Instructions

Signal

Hype

En 3 lignesOpenAI présente une hiérarchie d'instructions pour entraîner les LLM à prioriser les instructions privilégiées et résister aux injections de prompts et jailbreaks. La méthode permet aux modèles de distinguer les directives système des entrées utilisateur malveillantes.

Lire la source

Ton avis ?

OpenAI Sécurité IA Alignement Prompt engineering

Résumé généré par Claude — vérifié par l'humain

The Instruction Hierarchy: Training LLMs to Prioritize Privileged Instructions

Autres angles sur ce sujet