OpenAI Blog·5 août 2025

Estimating worst case frontier risks of open weight LLMs

Signal

Hype

En 3 lignesOpenAI étudie les risques extrêmes de la publication de modèles open-weight via malicious fine-tuning (MFT) sur gpt-oss. L'expérience teste les capacités maximales en biologie et cybersécurité après fine-tuning adversarial. Évaluation des frontières de risque pour les LLMs open-source.

Lire la source

Ton avis ?

OpenAI Sécurité IA Alignement Fine-tuning Open source

Résumé généré par Claude — vérifié par l'humain

Estimating worst case frontier risks of open weight LLMs

Autres angles sur ce sujet