Retour au feed
arXiv cs.AI·

Lean Meets Theoretical Computer Science: Scalable Synthesis of Theorem Proving Challenges in Formal-Informal Pairs

Signal
78
Hype
15
En 3 lignesNouvelle approche pour générer des défis de preuve formelle en exploitant l'informatique théorique (TCS). Le framework synthétise automatiquement des paires problème-preuve en Lean4 et Markdown sur deux domaines : Busy Beaver et Mixed Boolean Arithmetic. DeepSeekProver-V2-671B atteint 57,5% sur Busy Beaver mais seulement 12% sur Mixed Boolean Arithmetic, révélant des lacunes majeures en génération de preuves longues.
Lire la source
Ton avis ?
RaisonnementBenchmarksPapersGénération de code

Résumé généré par Claude — vérifié par l'humain