Retour au feed
arXiv cs.AI·

LPG: Balancing Efficiency and Policy Reasoning in Latent Policy Guardrails

Signal
75
Hype
25
En 3 lignesLPG (Latent Policy Guardrail) est un framework de sécurité pour LLM qui adapte les politiques de sécurité à l'inférence sans réentraînement. Il compresse le raisonnement en 10 tokens latents, atteint 84,5% de précision et 77,9% F1 sur les benchmarks, tout en étant 11× plus rapide que Qwen3-4B-Thinking.
Lire la source
Ton avis ?
Sécurité IAAlignementRaisonnementBenchmarks

Résumé généré par Claude — vérifié par l'humain