Retour au feed
arXiv cs.AI·

LEAF: A Living Benchmark for Event-Augmented Forecasting

Signal
72
Hype
28
En 3 lignesLEAF est un benchmark vivant pour évaluer les capacités de prévision des LLM en utilisant des événements multidimensionnels. Le système utilise des agents de récupération récursive et une validation croisée multi-agents pour fournir du contexte textuel aux modèles. Les tests montrent que les LLM exploitent les signaux d'événements complexes pour améliorer les prévisions boursières.
Lire la source
Ton avis ?
BenchmarksAgents IAMulti-agentsRAGRaisonnement

Résumé généré par Claude — vérifié par l'humain