arXiv cs.AI·19 mai 2026

DPrivBench: Benchmarking LLMs' Reasoning for Differential Privacy

Signal

Hype

En 3 lignesDPrivBench est un benchmark évaluant la capacité des LLM à raisonner sur la confidentialité différentielle (DP). Le benchmark teste si des fonctions satisfont des garanties DP spécifiées. Les modèles les plus forts maîtrisent les mécanismes classiques mais échouent sur les algorithmes avancés, révélant des lacunes significatives en DP reasoning.

Lire la source

Ton avis ?

Benchmarks Raisonnement Sécurité IA

Résumé généré par Claude — vérifié par l'humain

DPrivBench: Benchmarking LLMs' Reasoning for Differential Privacy

Autres angles sur ce sujet