Weasel: Out-of-Domain Generalization for Web Agents via Importance-Diversity Data Selection
Signal
78
Hype
18
En 3 lignesWeasel est une méthode de sélection de trajectoires pour l'entraînement hors ligne d'agents web. Elle optimise un équilibre entre importance et diversité sur les états, sites et patterns d'interaction, avec élagage d'AXTree centré sur la cible. Sur WebArena, WorkArena et MiniWob, elle améliore la généralisation hors-domaine avec des accélérations d'entraînement de 9.7-12.5× sur Qwen2.5-7B, Gemma3-4B et Qwen3-8B.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain