PluRule: A Benchmark for Moderating Pluralistic Communities on Social Media
Signal
72
Hype
25
En 3 lignesPluRule est un benchmark multimodal et multilingue pour la modération de communautés pluralistes sur les réseaux sociaux. Il couvre 13 371 violations de règles dans 1 989 communautés Reddit et 2 885 règles en 9 langues. Les modèles vision-langage de pointe, y compris GPT-4.5 avec raisonnement avancé, ne surpassent que légèrement une baseline triviale, révélant que la modération pluraliste reste un défi fondamental.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain