OpenAI and Anthropic share findings from a joint safety evaluation
Signal
72
Hype
25
En 3 lignesOpenAI et Anthropic publient les résultats d'une première évaluation conjointe de sécurité, testant mutuellement leurs modèles sur le désalignement, le suivi d'instructions, les hallucinations et les jailbreaks. Initiative rare de collaboration inter-labs sur la sécurité IA.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain