UCCI: Calibrated Uncertainty for Cost-Optimal LLM Cascade Routing
Signal
82
Hype
15
En 3 lignesUCCI est un routeur de cascade LLM qui utilise la calibration d'incertitude pour réduire les coûts d'inférence. Via régression isotonique, il mappe l'incertitude au niveau des tokens à une probabilité d'erreur par requête, puis sélectionne le seuil d'escalade par minimisation de coût. Sur 75 000 requêtes NER avec modèles 4B/12B, UCCI réduit les coûts de 31% tout en diminuant l'erreur de calibration de 0.12 à 0.03.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain