Retour au feed
arXiv cs.AI·

OpenDeepThink: Parallel Reasoning via Bradley-Terry Aggregation

Signal
78
Hype
25
En 3 lignesOpenDeepThink utilise l'agrégation Bradley-Terry pour sélectionner les meilleures solutions parmi plusieurs candidats générés en parallèle. Le système compare aléatoirement des paires de réponses, agrège les votes et préserve les meilleures pour mutation. Sur Codeforces, Gemini 3.1 Pro gagne +405 points Elo en 8 appels LLM (~27 min). Les auteurs publient CF-73, 73 problèmes annotés par des experts.
Lire la source
Ton avis ?
RaisonnementBenchmarksGeminiGénération de code

Résumé généré par Claude — vérifié par l'humain