Retour au feed
Reddit r/LocalLLaMA·

VibeThinker-3B: what is this witchcraft? Killing it at MathQA like it has ~30B parameters

Signal
35
Hype
65
En 3 lignesVibeThinker-3B, modèle 3B, obtient des résultats exceptionnels sur MathQA comparables à des modèles ~30B. Utilisateurs Reddit rapportent des performances anormalement élevées pour sa taille.
Lire la source
Ton avis ?
BenchmarksOpen source

Résumé généré par Claude — vérifié par l'humain