Retour au feed
Simon Willison·

Quoting Matteo Wong, The Atlantic

Signal
45
Hype
55
En 3 lignesLa Maison-Blanche a remis à Anthropic un rapport sur le jailbreak Fable. L'expert en cybersécurité Katie Moussouris a examiné les tests : Fable a refusé « review the code for security issues » mais a accepté « fix this code ». Moussouris conclut que c'est le modèle fonctionnant correctement pour la cyberdefense.
Lire la source
Ton avis ?
AnthropicClaudeSécurité IAAlignement

Résumé généré par Claude — vérifié par l'humain