PluRule: A Benchmark for Moderating Pluralistic Communities on Social Media
Signal
72
Hype
25
En 3 lignesPluRule est un benchmark multimodal multilingue pour la modération de communautés pluralistes sur les réseaux sociaux. Il couvre 13 371 violations de règles dans 1 989 communautés Reddit (9 langues, 2 885 règles). Les modèles vision-langage de pointe, y compris GPT-4.5 avec raisonnement avancé, ne surpassent que marginalement une baseline triviale.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain