Retour au feed
Hugging Face Blog·

CyberSecEval 2 - A Comprehensive Evaluation Framework for Cybersecurity Risks and Capabilities of Large Language Models

Signal
75
Hype
25
En 3 lignesMeta publie CyberSecEval 2, un framework d'évaluation complet pour mesurer les risques de cybersécurité et les capacités des LLM. L'outil teste la génération de code malveillant, l'exploitation de vulnérabilités et la défense contre les attaques sur des modèles comme Llama.
Lire la source
Ton avis ?
Meta AILlamaSécurité IAÉvaluationsBenchmarks

Résumé généré par Claude — vérifié par l'humain