arXiv cs.AI·19 mai 2026

BoLT: A Benchmark to Democratize Black-box Optimization Research for Expensive LLM Tasks

Signal

Hype

En 3 lignesBoLT est un benchmark open-source pour l'optimisation black-box appliquée aux LLM. Il couvre hyperparamètres, mélanges de données et prompts via des modèles de substitution légers basés sur des milliers d'expériences réelles. Benchmark de méthodes Bayesian Optimization et BBO révèle des lacunes dans les approches existantes.

Lire la source

Ton avis ?

Benchmarks Open source Papers

Résumé généré par Claude — vérifié par l'humain

BoLT: A Benchmark to Democratize Black-box Optimization Research for Expensive LLM Tasks

Autres angles sur ce sujet