Retour au feed
arXiv cs.AI·

AQuaUI: Visual Token Reduction for GUI Agents with Adaptive Quadtrees

Signal
78
Hype
15
En 3 lignesAQuaUI réduit les tokens visuels pour les agents GUI sans entraînement supplémentaire. La méthode utilise des quadtrees adaptatifs pour exploiter la densité d'information non-uniforme des captures d'écran. Sur GUI-Owl-1.5-32B, elle atteint 13.22% d'accélération et 29.52% moins de tokens visuels tout en conservant 99.06% des performances.
Lire la source
Ton avis ?
Agents IAVisionÉvaluationsPapers

Résumé généré par Claude — vérifié par l'humain