Retour au feed
arXiv cs.CL·

Can LLM Teams Play What? Where? When?

Signal
75
Hype
25
En 3 lignesÉtude sur les équipes d'LLM jouant à ChGK (quiz de raisonnement collectif). Trois stratégies testées : Vote, Silent Team (capitaine observe réponses), Talkative Team (capitaine observe réponses + justifications). Sur 572 questions 2025, les équipes surpassent les modèles seuls (+20 points). Meilleure équipe : 44,23% accuracy, approchant la performance humaine. La communication des justifications réduit les erreurs.
Lire la source
Ton avis ?
Multi-agentsRaisonnementBenchmarks

Résumé généré par Claude — vérifié par l'humain