Retour au feed
arXiv cs.CL·

Internalizing Tool Knowledge in Small Language Models via QLoRA Fine-Tuning

Signal
78
Hype
15
En 3 lignesDes chercheurs montrent que des petits modèles (Gemma 4 E4B, Qwen3-4B) fine-tunés avec QLoRA 8-bit internalisent la connaissance des outils sans nécessiter leurs schémas en prompt. Sur AssetOpsBench, les modèles fine-tunés surpassent les baselines non fine-tunés : réduction de 82,6% de la longueur d'entrée, AT-F1 de 0,65 vs 0,47, et 2,5× plus rapide pour Qwen3.
Lire la source
Ton avis ?
Fine-tuningAgents IAQwenGeminiBenchmarks

Résumé généré par Claude — vérifié par l'humain