OpenAI Blog·27 août 2025

OpenAI and Anthropic share findings from a joint safety evaluation

Signal

Hype

En 3 lignesOpenAI et Anthropic publient les résultats d'une première évaluation conjointe de sécurité, testant mutuellement leurs modèles sur le désalignement, le suivi d'instructions, les hallucinations et les jailbreaks. Initiative rare de collaboration inter-labs sur la sécurité IA.

Lire la source

Ton avis ?

OpenAI Anthropic Sécurité IA Alignement Évaluations

Résumé généré par Claude — vérifié par l'humain

OpenAI and Anthropic share findings from a joint safety evaluation

Autres angles sur ce sujet