arXiv cs.LG·1 juin 2026

The Long-Term Effects of Data Selection in LLM Fine-Tuning

Signal

Hype

En 3 lignesÉtude sur les effets long terme de la sélection de données lors du fine-tuning d'LLM sur plusieurs étapes. Les auteurs montrent que les stratégies optimales à court terme (loss-based, gradient-based, diversity-based) peuvent ralentir l'apprentissage futur et augmenter l'oubli catastrophique. Ils proposent LHAS (Long-Horizon Aware Selection) pour évaluer la sélection comme intervention d'entraînement globale.

Lire la source

Ton avis ?

Fine-tuning Benchmarks Papers

Résumé généré par Claude — vérifié par l'humain

The Long-Term Effects of Data Selection in LLM Fine-Tuning

Autres angles sur ce sujet