idSCD: Identifying Training Datasets through Semantic Correlation Descriptors
Signal
72
Hype
15
En 3 lignesNouvelle méthode pour identifier si un dataset a servi à l'entraînement d'un modèle via ses corrélations sémantiques internes (SCDs). Approche white-box qui surpasse les baselines black-box (RMIA, LiRA) avec gains jusqu'à 60% en ROC-AUC sur classification NLI, émotions et textes médicaux.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain