AI-generated CUDA kernels silently break training and inference [R]
Signal
75
Hype
35
En 3 lignesNVIDIA a publié SOL-ExecBench (235 kernels CUDA de production). Des kernels générés par IA classés premiers se révèlent bugués en entraînement réel : un kernel de backward embedding+RMSNorm accumule en bf16 au lieu de fp32, causant une divergence de loss masquée par AdamW mais visible avec SGD.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain