Retour au feed
arXiv cs.LG·

A Theory of Training Profit-Optimal LLMs

Signal
75
Hype
15
En 3 lignesModèle économique combinant lois de scaling et théorie microéconomique pour caractériser l'optimisation des profits dans l'entraînement des LLM. Analyse comment la taille du modèle, le budget en tokens et les coûts computationnels interagissent. En régime compute-bound, la dépense optimale suit l'efficacité matérielle (FLOPs/$) quasi-linéairement. En régime data-bound, elle évolue en D²/E.
Lire la source
Ton avis ?
BenchmarksPapersBusiness

Résumé généré par Claude — vérifié par l'humain