LPG: Balancing Efficiency and Policy Reasoning in Latent Policy Guardrails
Signal
75
Hype
25
En 3 lignesLPG (Latent Policy Guardrail) est un framework de sécurité pour LLM qui adapte les politiques de sécurité à l'inférence sans réentraînement. Il compresse le raisonnement en 10 tokens latents, atteint 84,5% de précision et 77,9% F1 sur les benchmarks, tout en étant 11× plus rapide que Qwen3-4B-Thinking.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain