MULTITEXTEDIT: Benchmarking Cross-Lingual Degradation in Text-in-Image Editing
Signal
78
Hype
15
En 3 lignesMULTITEXTEDIT est un benchmark de 3 600 instances couvrant 12 langues typologiquement diverses pour évaluer l'édition de texte dans les images. Les auteurs introduisent une métrique de fidélité linguistique (LSF) détectant les erreurs au niveau des scripts (diacritiques manquants, ordre RTL inversé). L'évaluation de 12 systèmes révèle une dégradation cross-linguale prononcée, particulièrement sur l'hébreu et l'arabe.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain