Model-Based Quality Assessment for Massively Multilingual Parallel Data
Signal
78
Hype
15
En 3 lignesÉtude de l'évaluation automatique de données bilingues massives : décomposition en deux tâches (évaluation du parallélisme via embeddings multilingues, estimation de qualité sans référence). Benchmark de 4 modèles d'embeddings et 9 évaluateurs sur FLORES-200 couvrant 6 654 paires de langues. Résultat clé : aucun modèle n'est fiable universellement ; une approche direction-aware est nécessaire.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain