Retour au feed
arXiv cs.AI·

DPrivBench: Benchmarking LLMs' Reasoning for Differential Privacy

Signal
72
Hype
18
En 3 lignesDPrivBench est un benchmark évaluant la capacité des LLM à raisonner sur la confidentialité différentielle (DP). Le benchmark teste si des fonctions satisfont des garanties DP spécifiées. Les modèles les plus forts maîtrisent les mécanismes classiques mais échouent sur les algorithmes avancés, révélant des lacunes significatives en DP reasoning.
Lire la source
Ton avis ?
BenchmarksRaisonnementSécurité IA

Résumé généré par Claude — vérifié par l'humain