Reddit r/LocalLLaMA·19 mai 2026

Number-aware embeddings

Signal

Hype

En 3 lignesUn chercheur a développé des embeddings sensibles aux nombres en modifiant l'architecture d'un modèle MLM (ModernBERT). Après 6 heures d'entraînement sur H100, le modèle atteint 59% de précision sur le tri de triplets numériques vs 38% pour ModernBERT et 34% pour BGE-base-v1.5. La technique utilise une représentation log-magnitude avec 128 bins et une tête de classification-régression.

Lire la source

Ton avis ?

Embeddings Fine-tuning Open source

Résumé généré par Claude — vérifié par l'humain

Number-aware embeddings

Autres angles sur ce sujet