Retour au feed
arXiv cs.AI·

A Theory of Training Profit-Optimal LLMs

Signal
75
Hype
15
En 3 lignesModèle économique combinant lois de scaling et théorie microéconomique pour caractériser le comportement rationnel des entreprises d'entraînement LLM. Analyse la maximisation du profit en régimes compute-bound et data-bound : en compute-bound, la taille optimale suit l'efficacité matérielle (FLOPs/$) à taux quasi-linéaire ; en data-bound, les dépenses d'entraînement optimales évoluent en D²/E.
Lire la source
Ton avis ?
BenchmarksPapersBusiness

Résumé généré par Claude — vérifié par l'humain