Retour au feed
arXiv cs.CL·

OProver: A Unified Framework for Agentic Formal Theorem Proving

Signal
82
Hype
18
En 3 lignesOProver est un framework unifié pour la preuve formelle agentique en Lean 4. Le modèle 32B atteint 93,3% Pass@32 sur MiniF2F et 58,2% sur ProverBench. L'entraînement combine pretraining, SFT sur trajectoires de réparation, et RL sur cas difficiles. OProofs contient 1,77M énoncés Lean et 6,86M preuves vérifiées.
Lire la source
Ton avis ?
Agents IARaisonnementReinforcement learningBenchmarksPapers

Résumé généré par Claude — vérifié par l'humain