Hugging Face Blog·24 mai 2024

CyberSecEval 2 - A Comprehensive Evaluation Framework for Cybersecurity Risks and Capabilities of Large Language Models

Signal

Hype

En 3 lignesMeta publie CyberSecEval 2, un framework d'évaluation complet pour mesurer les risques de cybersécurité et les capacités des LLM. L'outil teste la génération de code malveillant, l'exploitation de vulnérabilités et la défense contre les attaques sur des modèles comme Llama.

Lire la source

Ton avis ?

Meta AI Llama Sécurité IA Évaluations Benchmarks

Résumé généré par Claude — vérifié par l'humain

CyberSecEval 2 - A Comprehensive Evaluation Framework for Cybersecurity Risks and Capabilities of Large Language Models

Autres angles sur ce sujet