Retour au feed
arXiv cs.CL·

ChildEval: When large language models meet children's personalities

Signal
72
Hype
25
En 3 lignesChildEval est un benchmark contenant 29K profils de personnalité d'enfants (3-6 ans) pour évaluer la capacité des LLM à inférer et suivre les préférences enfant-centrées en conversations longues. Le dataset couvre 5 catégories principales et 14 sous-catégories de la vie quotidienne. Les résultats montrent que le fine-tuning sur ChildEval améliore les performances.
Lire la source
Ton avis ?
BenchmarksFine-tuningÉvaluationsPapers

Résumé généré par Claude — vérifié par l'humain