Hugging Face Blog·10 juillet 2025

Kimina-Prover: Applying Test-time RL Search on Large Formal Reasoning Models

Signal

Hype

En 3 lignesKimina-Prover applique la recherche par renforcement au moment de l'inférence sur des modèles de raisonnement formel. La méthode améliore les performances sur les preuves mathématiques en explorant dynamiquement l'espace de recherche sans réentraînement.

Lire la source

Ton avis ?

Raisonnement Reinforcement learning Benchmarks Papers

Résumé généré par Claude — vérifié par l'humain

Kimina-Prover: Applying Test-time RL Search on Large Formal Reasoning Models

Autres angles sur ce sujet