DocReward: A Document Reward Model for Structuring and Stylizing
Signal
78
Hype
25
En 3 lignesDocReward est un modèle de récompense évaluant la structure et le style des documents professionnels, indépendamment de la qualité textuelle. Entraîné sur DocPair (117K paires de documents, 32 domaines), il surpasse GPT-4 de 14,6 points et guide efficacement les agents via RL vers une meilleure professionnalité structurelle et stylistique.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain