OpenDeepThink: Parallel Reasoning via Bradley-Terry Aggregation
Signal
78
Hype
25
En 3 lignesOpenDeepThink utilise l'agrégation Bradley-Terry pour sélectionner les meilleures solutions parmi plusieurs candidats générés en parallèle. Le système compare aléatoirement des paires de réponses, agrège les votes et préserve les meilleures pour mutation. Sur Codeforces, Gemini 3.1 Pro gagne +405 points Elo en 8 appels LLM (~27 min). Les auteurs publient CF-73, 73 problèmes annotés par des experts.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain