Retour au feed
Hacker News (AI)·

CVE-Bench: testing LLM agents on real-world vulnerability patches

Signal
65
Hype
15
En 3 lignesCVE-Bench est un benchmark pour évaluer les agents LLM sur des patches de vulnérabilités réelles. L'étude teste la capacité des modèles à identifier et corriger des failles de sécurité dans du code existant.
Lire la source
Ton avis ?
Agents IABenchmarksGénération de codeSécurité IA

Résumé généré par Claude — vérifié par l'humain