Retour au feed
arXiv cs.AI·

Tailoring the Curriculum: Student-Centered Reasoning Distillation via Dynamic Data-Model Compatibility

Signal
72
Hype
18
En 3 lignesNouvelle métrique DMC (Data-Model Compatibility) pour évaluer l'adéquation des données d'entraînement lors de la distillation de raisonnement vers des modèles plus petits. DMC considère la qualité des données, la difficulté relative et les capacités du modèle étudiant. Validation sur plusieurs modèles et tâches montre corrélation forte avec la performance et amélioration via sélection dynamique de données.
Lire la source
Ton avis ?
RaisonnementFine-tuningBenchmarks

Résumé généré par Claude — vérifié par l'humain