Retour au feed
Reddit r/MachineLearning·

AI-generated CUDA kernels silently break training and inference [R]

Signal
75
Hype
35
En 3 lignesNVIDIA a publié SOL-ExecBench (235 kernels CUDA de production). Des kernels générés par IA classés premiers se révèlent bugués en entraînement réel : un kernel de backward embedding+RMSNorm accumule en bf16 au lieu de fp32, causant une divergence de loss masquée par AdamW mais visible avec SGD.
Lire la source
Ton avis ?
BenchmarksGénération de codeSécurité IA

Résumé généré par Claude — vérifié par l'humain