arXiv cs.CL·19 mai 2026

Internalizing Tool Knowledge in Small Language Models via QLoRA Fine-Tuning

Signal

Hype

En 3 lignesDes chercheurs montrent que des petits modèles (Gemma 4 E4B, Qwen3-4B) fine-tunés avec QLoRA 8-bit internalisent la connaissance des outils sans nécessiter leurs schémas en prompt. Sur AssetOpsBench, les modèles fine-tunés surpassent les baselines non fine-tunés : réduction de 82,6% de la longueur d'entrée, AT-F1 de 0,65 vs 0,47, et 2,5× plus rapide pour Qwen3.

Lire la source

Ton avis ?

Fine-tuning Agents IA Qwen Gemini Benchmarks

Résumé généré par Claude — vérifié par l'humain

Internalizing Tool Knowledge in Small Language Models via QLoRA Fine-Tuning

Autres angles sur ce sujet