Self-Improving In-Context Learning
Signal
72
Hype
18
En 3 lignesMéthode pour améliorer l'apprentissage en contexte en optimisant les embeddings continus d'un prompt few-shot au moment du test. Utilise les log-probabilités du modèle sur ses démonstrations comme signal d'auto-supervision, sans génération de tokens ni fine-tuning. Améliore les performances sur classification et génération libre.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain