Retour au feed
Reddit r/LocalLLaMA·

[NEW] Supra-50M Released!

Signal
75
Hype
25
En 3 lignesSupraLabs publie Supra-50M, un modèle de 50M paramètres entraîné sur 20B tokens de texte éducatif haute qualité. Architecture Llama-style avec vocab 32k. Surpasse GPT-2 (124M) et SmolLM-135M sur plusieurs benchmarks (BLiMP 76.3%, SciQ 77.2%, ARC-Easy 52.2%). Roadmap : Supra-124M et Supra-350M prévus.
Lire la source
Ton avis ?
Open sourceBenchmarksGénération de code

Résumé généré par Claude — vérifié par l'humain