LEAF: A Living Benchmark for Event-Augmented Forecasting
Signal
72
Hype
28
En 3 lignesLEAF est un benchmark vivant pour évaluer les capacités de prévision des LLM en utilisant des événements multidimensionnels. Le système utilise des agents de récupération récursive et une validation croisée dual-agent pour fournir du texte auxiliaire pertinent. Les tests montrent que les LLM exploitent les signaux d'événements complexes pour améliorer les prévisions, notamment sur les actions boursières.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain