ScientistOne: Towards Human-Level Autonomous Research via Chain-of-Evidence
Signal
82
Hype
28
En 3 lignesScientistOne, un système autonome de recherche, introduit Chain-of-Evidence (CoE) pour tracer chaque affirmation à sa source. Évaluation sur 75 articles : les systèmes de base montrent 21% de références halluccinées, 42% de vérification de scores réussie. ScientistOne atteint 0 hallucination, vérification parfaite, et surpasse les experts humains sur 5 tâches.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain