arXiv cs.AI·19 mai 2026

OpenDeepThink: Parallel Reasoning via Bradley-Terry Aggregation

Signal

Hype

En 3 lignesOpenDeepThink utilise l'agrégation Bradley-Terry pour sélectionner les meilleures solutions parmi plusieurs candidats générés en parallèle. Le système compare aléatoirement des paires de réponses, agrège les votes et préserve les meilleures pour mutation. Sur Codeforces, Gemini 3.1 Pro gagne +405 points Elo en 8 appels LLM (~27 min). Les auteurs publient CF-73, 73 problèmes annotés par des experts.

Lire la source

Ton avis ?

Raisonnement Benchmarks Gemini Génération de code

Résumé généré par Claude — vérifié par l'humain

OpenDeepThink: Parallel Reasoning via Bradley-Terry Aggregation

Autres angles sur ce sujet