Retour au feed
arXiv cs.CL·

Responsible Federated LLMs via Safety Filtering and Constitutional AI

Signal
72
Hype
18
En 3 lignesÉtude sur l'intégration de techniques de sécurité (filtrage et Constitutional AI) dans l'apprentissage fédéré de LLM. Les auteurs montrent que ces méthodes réduisent les réponses dangereuses de plus de 20% sur AdvBench, adressant le risque de déploiement massif de modèles non sécurisés.
Lire la source
Ton avis ?
Sécurité IAAlignementReinforcement learningPapers

Résumé généré par Claude — vérifié par l'humain