Retour au feed
arXiv cs.AI·

BoLT: A Benchmark to Democratize Black-box Optimization Research for Expensive LLM Tasks

Signal
78
Hype
22
En 3 lignesBoLT est un benchmark open-source pour l'optimisation black-box appliquée aux LLM. Il couvre hyperparamètres, mélanges de données et prompts via des modèles de substitution légers basés sur des milliers d'expériences réelles. Benchmark de méthodes Bayesian Optimization et BBO révèle des lacunes dans les approches existantes.
Lire la source
Ton avis ?
BenchmarksOpen sourcePapers

Résumé généré par Claude — vérifié par l'humain