Retour au feed
OpenAI Blog·

Estimating worst case frontier risks of open weight LLMs

Signal
72
Hype
25
En 3 lignesOpenAI étudie les risques extrêmes de la publication de modèles open-weight via malicious fine-tuning (MFT) sur gpt-oss. L'expérience teste les capacités maximales en biologie et cybersécurité après fine-tuning adversarial. Évaluation des frontières de risque pour les LLMs open-source.
Lire la source
Ton avis ?
OpenAISécurité IAAlignementFine-tuningOpen source

Résumé généré par Claude — vérifié par l'humain