PEGRL: Improving Machine Translation by Post-Editing Guided Reinforcement Learning
Signal
78
Hype
18
En 3 lignesPEGRL est un framework RL deux étapes pour la traduction automatique par LLM. Il utilise la post-édition comme tâche auxiliaire pour stabiliser l'entraînement et guider l'optimisation. Tests sur EN→FI, EN→TR, EN↔ZH montrent des gains constants; EN→TR atteint des performances comparables à DeepSeek-V3.2 sur COMET-KIWI.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain