Retour au feed
Reddit r/LocalLLaMA·

260K-param LLM running on an emulated 90s CPU inside an 18-year-old RTOS

Signal
75
Hype
45
En 3 lignesUn développeur a fait tourner un LLM de 260K paramètres (llama2.c/stories260K) sur un émulateur JavaScript d'un CPU Motorola 68K des années 90, lui-même exécuté dans un RTOS de 2008. Quantification INT8 + lookup tables pour RoPE et inverse square root (Quake) pour contourner l'absence de FPU. Génération : 2-4 secondes/token.
Lire la source
Ton avis ?
LlamaGénération de codeFine-tuningOpen source

Résumé généré par Claude — vérifié par l'humain