arXiv cs.CL·19 mai 2026

PEGRL: Improving Machine Translation by Post-Editing Guided Reinforcement Learning

Signal

Hype

En 3 lignesPEGRL est un framework RL deux étapes pour la traduction automatique par LLM. Il utilise la post-édition comme tâche auxiliaire pour stabiliser l'entraînement et guider l'optimisation. Tests sur EN→FI, EN→TR, EN↔ZH montrent des gains constants; EN→TR atteint des performances comparables à DeepSeek-V3.2 sur COMET-KIWI.

Lire la source

Ton avis ?

Reinforcement learning Génération de code Benchmarks

Résumé généré par Claude — vérifié par l'humain

PEGRL: Improving Machine Translation by Post-Editing Guided Reinforcement Learning

Autres angles sur ce sujet