arXiv cs.LG·19 mai 2026

A Theory of Training Profit-Optimal LLMs

Signal

Hype

En 3 lignesModèle économique combinant lois de scaling et théorie microéconomique pour caractériser l'optimisation des profits dans l'entraînement des LLM. Analyse comment la taille du modèle, le budget en tokens et les coûts computationnels interagissent. En régime compute-bound, la dépense optimale suit l'efficacité matérielle (FLOPs/$) quasi-linéairement. En régime data-bound, elle évolue en D²/E.

Lire la source

Ton avis ?

Benchmarks Papers Business

Résumé généré par Claude — vérifié par l'humain

A Theory of Training Profit-Optimal LLMs

Autres angles sur ce sujet