arXiv cs.CL·28 mai 2026

ChildEval: When large language models meet children's personalities

Signal

Hype

En 3 lignesChildEval est un benchmark contenant 29K profils de personnalité d'enfants (3-6 ans) pour évaluer la capacité des LLM à inférer et suivre les préférences enfant-centrées en conversations longues. Le dataset couvre 5 catégories principales et 14 sous-catégories de la vie quotidienne. Les résultats montrent que le fine-tuning sur ChildEval améliore les performances.

Lire la source

Ton avis ?

Benchmarks Fine-tuning Évaluations Papers

Résumé généré par Claude — vérifié par l'humain

ChildEval: When large language models meet children's personalities

Autres angles sur ce sujet