Retour au feed
OpenAI Blog·

OpenAI and Anthropic share findings from a joint safety evaluation

Signal
72
Hype
25
En 3 lignesOpenAI et Anthropic publient les résultats d'une première évaluation conjointe de sécurité, testant mutuellement leurs modèles sur le désalignement, le suivi d'instructions, les hallucinations et les jailbreaks. Initiative rare de collaboration inter-labs sur la sécurité IA.
Lire la source
Ton avis ?
OpenAIAnthropicSécurité IAAlignementÉvaluations

Résumé généré par Claude — vérifié par l'humain