1a:["$","section",null,{"className":"related-section","children":[["$","h2",null,{"className":"related-section__h","children":"Other angles on this story"}],["$","ul",null,{"className":"related-list","children":[["$","li","7164670d-aa08-4900-83a1-a67afd96fde7",{"className":"related-item","children":[["$","span",null,{"className":"related-item__num","children":"01"}],["$","$L13",null,{"href":"/en/article/scaling-ai-for-everyone-716467","className":"related-item__title","children":"Scaling AI for everyone"}],["$","span",null,{"className":"related-item__score","children":["SIG ",95]}]]}],["$","li","4aaf744f-b0ab-463e-8a02-b7b19be1fe8d",{"className":"related-item","children":[["$","span",null,{"className":"related-item__num","children":"02"}],["$","$L13",null,{"href":"/en/article/plus-petitsvg-aria-hiddentrue-data-componentocticon-height16-viewbox0-0-16-16-ve-4aaf74","className":"related-item__title","children":" anthropics / claude-agent-sdk-python"}],["$","span",null,{"className":"related-item__score","children":["SIG ",85]}]]}],["$","li","a9a3f0bf-6da4-415a-bc9f-a86f87ae01e3",{"className":"related-item","children":[["$","span",null,{"className":"related-item__num","children":"03"}],["$","$L13",null,{"href":"/en/article/plus-petitsvg-aria-hiddentrue-data-componentocticon-height16-viewbox0-0-16-16-ve-a9a3f0","className":"related-item__title","children":" openai / whisper"}],["$","span",null,{"className":"related-item__score","children":["SIG ",85]}]]}],["$","li","5fffe51f-c7d9-401c-ac01-fa6df31b3679",{"className":"related-item","children":[["$","span",null,{"className":"related-item__num","children":"04"}],["$","$L13",null,{"href":"/en/article/leap-supercharging-llms-for-formal-mathematics-with-agentic-frameworks-5fffe5","className":"related-item__title","children":"LEAP: Supercharging LLMs for Formal Mathematics with Agentic Frameworks"}],["$","span",null,{"className":"related-item__score","children":["SIG ",85]}]]}],["$","li","879ff093-906a-4a9f-8bcd-08ddc46fdb2a",{"className":"related-item","children":[["$","span",null,{"className":"related-item__num","children":"05"}],["$","$L13",null,{"href":"/en/article/ainews-anthropic-raises-dollar965b-series-h-releases-opus-48-and-dynamic-workflo-879ff0","className":"related-item__title","children":"[AINews] Anthropic raises $965B Series H, releases Opus 4.8 and Dynamic Workflows/ultracode"}],["$","span",null,{"className":"related-item__score","children":["SIG ",85]}]]}]]}]]}]

PaperBench: Evaluating AI’s Ability to Replicate AI Research

Other angles on this story