arXiv cs.CL·2 juin 2026

Model-Based Quality Assessment for Massively Multilingual Parallel Data

Signal

Hype

En 3 lignesÉtude de l'évaluation automatique de données bilingues massives : décomposition en deux tâches (évaluation du parallélisme via embeddings multilingues, estimation de qualité sans référence). Benchmark de 4 modèles d'embeddings et 9 évaluateurs sur FLORES-200 couvrant 6 654 paires de langues. Résultat clé : aucun modèle n'est fiable universellement ; une approche direction-aware est nécessaire.

Lire la source

Ton avis ?

Benchmarks Embeddings Évaluations

Résumé généré par Claude — vérifié par l'humain

Model-Based Quality Assessment for Massively Multilingual Parallel Data

Autres angles sur ce sujet