Retour au feed
arXiv cs.AI·

ALIGN: A Vision-Language Framework for High-Accuracy Accident Location Inference through Geo-Spatial Neural Reasoning

Signal
78
Hype
25
En 3 lignesALIGN est un framework vision-langage pour inférer les coordonnées précises d'accidents routiers à partir de rapports d'actualité en bengali et d'indices cartographiques. Utilisant une architecture agentique combinant OCR, LLM et vision-langage, le système réduit l'erreur de localisation de 10,9 km à 0,593 km en validation et 0,465 km sur données officielles de Dhaka.
Lire la source
Ton avis ?
VisionAgents IAMulti-agentsRaisonnementPapers

Résumé généré par Claude — vérifié par l'humain