Reddit r/LocalLLaMA·31 mai 2026

I trained gpt-1 on my local machine (RTX 2060 Super 8GB VRAM)

Signal

Hype

En 3 lignesUn utilisateur a entraîné GPT-1 sur une RTX 2060 Super (8 GB VRAM) en ~1 heure, en utilisant du code généré par Claude basé sur l'implémentation originale. Le coût de reproduction des modèles GPT a baissé de 500–1000× depuis GPT-2 (43 000 $ → 48 $ pour une exécution sur cluster H100).

Lire la source

Ton avis ?

Claude Open source Fine-tuning Benchmarks

Résumé généré par Claude — vérifié par l'humain

I trained gpt-1 on my local machine (RTX 2060 Super 8GB VRAM)

Autres angles sur ce sujet