arXiv cs.CL·19 mai 2026

Probing Multimodal Large Language Models on Cognitive Biases in Chinese Short-Video Misinformation

Signal

Hype

En 3 lignesÉtude évaluant 8 modèles multimodaux (Gemini-2.5-Pro, o3, etc.) sur leur robustesse face aux biais cognitifs dans des vidéos courtes chinoises contenant de la désinformation. Dataset de 200 vidéos annotées manuellement couvrant 4 domaines sanitaires. Gemini-2.5-Pro obtient 71.5/100, o3 35.2. Les modèles sont vulnérables aux indices sociaux comme les IDs de chaînes autoritaires.

Lire la source

Ton avis ?

Vision Benchmarks Sécurité IA Évaluations

Résumé généré par Claude — vérifié par l'humain

Probing Multimodal Large Language Models on Cognitive Biases in Chinese Short-Video Misinformation

Autres angles sur ce sujet