Retour au feed
arXiv cs.CL·

Self-Improving In-Context Learning

Signal
72
Hype
18
En 3 lignesMéthode pour améliorer l'apprentissage en contexte en optimisant les embeddings continus d'un prompt few-shot au moment du test. Utilise les log-probabilités du modèle sur ses démonstrations comme signal d'auto-supervision, sans génération de tokens ni fine-tuning. Améliore les performances sur classification et génération libre.
Lire la source
Ton avis ?
Prompt engineeringRaisonnement

Résumé généré par Claude — vérifié par l'humain