Retour au feed
Reddit r/LocalLLaMA·

numind/NuExtract3 · Hugging Face

Signal
75
Hype
25
En 3 lignesNuExtract3 est un modèle vision-langage 4B pour la compréhension documentaire. Il combine extraction structurée (texte/images + template JSON → JSON) et conversion image-to-Markdown, avec support multilingue et modes reasoning/non-reasoning. Disponible en GGUF, NVFP4, MLX, VLLM.
Lire la source
Ton avis ?
VisionRAGGénération de codeOpen sourceOutils

Résumé généré par Claude — vérifié par l'humain