Retour au feed
arXiv cs.CL·

PaliBench: A Multi-Reference Blueprint for Classical Language Translation Benchmarks

Signal
72
Hype
15
En 3 lignesPaliBench est un benchmark pour la traduction du pali vers l'anglais contenant 1 700 passages (345 000 tokens) alignés avec trois traductions de référence indépendantes. La méthode combine l'assistance LLM, la vérification automatisée et l'évaluation multi-métrique. Évaluation de dix LLM contemporains montrant une concordance inter-métrique forte mais variation substantielle en fiabilité.
Lire la source
Ton avis ?
BenchmarksÉvaluationsPapers

Résumé généré par Claude — vérifié par l'humain