OpenAI Blog·27 August 2025

OpenAI and Anthropic share findings from a joint safety evaluation

Signal

Hype

In three linesOpenAI and Anthropic release findings from their first joint safety evaluation, testing each other's models for misalignment, instruction following, hallucinations, and jailbreaking. Rare cross-lab collaboration effort on AI safety.

Read source

Your take?

OpenAI Anthropic AI safety Alignment Evals

Summary generated by Claude — human-verified

OpenAI and Anthropic share findings from a joint safety evaluation

Other angles on this story