arXiv cs.AI·19 mai 2026

Multimodal Cultural Heritage Knowledge Graph Extension with Language and Vision Models

Signal

Hype

En 3 lignesNouvelle approche pour étendre les graphes de connaissances (KG) du patrimoine culturel français. Les auteurs introduisent WJoconde, un KG multimodal intégrant texte et images, avec trois variantes et un benchmark pour la complétion de KG. Ils proposent un framework combinant LLM et Vision-Language Models pour extraire et valider automatiquement les données, améliorant la fiabilité du KG.

Lire la source

Ton avis ?

Vision RAG Benchmarks Open source

Résumé généré par Claude — vérifié par l'humain

Multimodal Cultural Heritage Knowledge Graph Extension with Language and Vision Models

Autres angles sur ce sujet