Retour au feed
arXiv cs.CL·

Probing Multimodal Large Language Models on Cognitive Biases in Chinese Short-Video Misinformation

Signal
72
Hype
25
En 3 lignesÉtude évaluant 8 modèles multimodaux (Gemini-2.5-Pro, o3, etc.) sur leur robustesse face aux biais cognitifs dans des vidéos courtes chinoises contenant de la désinformation. Dataset de 200 vidéos annotées manuellement couvrant 4 domaines sanitaires. Gemini-2.5-Pro obtient 71.5/100, o3 35.2. Les modèles sont vulnérables aux indices sociaux comme les IDs de chaînes autoritaires.
Lire la source
Ton avis ?
VisionBenchmarksSécurité IAÉvaluations

Résumé généré par Claude — vérifié par l'humain