Retour au feed
arXiv cs.CL·

DEL: Digit Entropy Loss for Numerical Learning of Large Language Models

Signal
72
Hype
18
En 3 lignesDEL (Digit Entropy Loss) est une nouvelle fonction de perte pour améliorer la prédiction numérique dans les LLM. Testée sur CodeLlama, Mistral, DeepSeek et Qwen-2.5 sur 7 benchmarks mathématiques, elle surpasse les méthodes existantes (MLE, Number Token Loss) en optimisant l'entropie des chiffres de manière supervisée et en généralisant aux nombres décimaux.
Lire la source
Ton avis ?
PapersBenchmarksFine-tuningGénération de codeRaisonnement

Résumé généré par Claude — vérifié par l'humain